Você está na página 1de 22

16 ESTATSTICAS E PARAMETROS

Introduo

At agora vimos os principais modelos de distribuies de probabilidade
e as medidas que caracterizam uma amostra, quando nos referimos ao estudo
da estatstica descritiva.

Aqui, nessa abordagem, vamos juntar o conhecimento adquirido a partir dos
modelos e das medidas estudadas anteriormente para obter as distribuies
amostrais dos principais estimadores.

O conhecimento das distribuies amostrais, ser a base para aplicao das
tcnicas da inferncia estatstica e para um melhor entendimento desses
conceitos, vamos conhecer algumas estatsticas e alguns parmetros.

16.1 Principais Conceitos

16.1.1 Inferncia ou Induo Estatstica

Trata-se do processo de obter informaes sobre uma populao a partir
de resultados observados em amostras. Serve , fundamentalmente para dar
ao pesquisador um grau de confiana em suas incertezas.

De modo geral tem-se uma populao com um grande nmero de
elementos e deseja-se, a partir de uma amostra dessa populao, conhecer o
mais prximo possvel algumas caractersticas dessa populao. Veja a figura
abaixo:

Populao (N) Amostra (n)


u u




Inferncia ou induo estatstica

16.1.2 Amostra Aleatria

Uma amostra aleatria o conjunto de n variveis aleatrias e
independentes (X
1
, X
2
, ... ,X
n
) tal que cada x
i
(i = 1, 2, ...,n) possui a mesma
caracterstica, ou distribuio da varivel populacional X" que se deseja
estudar.

Por exemplo: Se X : N ( , o
2
), cada X
i
: N ( , o
2
)

16.1.3 Estimador ou Estatstica

Um estimador ou estatstica qualquer varivel aleatria funo dos
elementos amostrais, ou seja, ) ,...., , (

2 1 n
X X X f = u

OBS Essa definio nos permite concluir que qualquer combinao das
variveis amostrais (X
1
, X
2
, .... , X
n
) um estimador ou estatstica.

16.2 ESTIMADORES

16.2.1 Estimador para a Mdia Populacional

=
n
x
x
i
a Mdia Aritmtica Amostral

16.2.2 Estimador para a Varincia Populacional o
2


1
) (
2
2

=

n
x x
S
i
Varincia Amostral

6.2.3 Estimador para a Proporo ou Probabilidade de Evento
Populacional p


n
X
p f = =
Freqncia Relativa

16.2.4 Estimador para o Desvio-Padro Populacional o


2
S S =

Desvio-padro Amostral

16.3 Estimativa

o valor numrico do estimador

Exemplo: x = 1,65m uma estimativa da mdia populacional

17 DISTRIBUIO AMOSTRAL

Considerando todas as possveis amostras de tamanho n que podem
ser extradas de uma populao e se para cada uma delas, calcularmos um
valor do estimador, tem-se uma distribuio amostral desse estimador. Como o
estimador uma varivel aleatria, podemos determinar suas caractersticas,
ou seja, sua mdia, varincia, desvio-padro,...

17.1 DISTRIBUIO AMOSTRAL DA MDIA









De uma determinada populao X, retiramos uma amostra de tamanho
n formada pelos elementos x
1
, x
2
, ...,x
n
, ento o estimador da mdia
populacional , calculada na amostra, ser dado por:
n
x
x
i
=

Exemplo:

Consideremos uma populao finita de tamanho N = 5. Seja X = 1, 2,
3, 4, 5 ; os elementos dessa populao. Calculemos ento, a mdia e a
varincia dessa populao:

E (X) =
x
= x
i
p(x
i
) E (X) = 1/5 (1 +2+3+4+5) = 15/5 = 3 E (X) =
x

= 3

V (X) = o
2
x
= E (X
2
) E
2
(X) = 11 9 = 2 V (X) = o
2
x

= 2

Agora vamos retirar dessa populao todas as amostras possveis, com
reposio, de tamanho n = 2, ou seja, sero 25 amostras, e calcularemos as
mdias da cada amostra.

Amostra

i
X
Amostra

i
X
Amostra

i
X
X
) ( X P ) ( . X P X ) ( .
2
X P X
Populao
xXXXPopula
oPOPULA
AO
Parmetro : u
Amostra
AmostraAmo
straAMOST
RAS
Estimadores : u






(1,1) 1,0 (3,1) 2,0 (5,1) 3,0 1,0 1/25 1/25 1/25
(1,2) 1,5 (3,2) 2,5 (5,2) 3,5 1,5 2/25 3/25 4,5/25
(1,3) 2,0 (3,3) 3,0 (5,3) 4,0 2,0 3/25 6/25 12/25
(1,4) 2,5 (3,4) 3,5 (5,4) 4,5 2,5 4/25 10/25 25/25
(1,5) 3,0 (3,5) 4,0 (5,5) 5,0 3,0 5/25 15/25 45/25
(2,1) 1,5 (4,1) 2,5 3,5 4/25 14/25 49/25
(2,2) 2,0 (4,2) 3,0 4,0 3/25 12/25 48/25
(2,3) 2,5 (4,3) 3,5 4,5 2/25 9/25 40,5/25
(2,4) 3,0 (4,4) 4,0 5,0 1/25 1/25 25/25
(2,5) 3,5 (4,5) 4,5


1 75/25 250/25


OBS - A mdia de cada amostra varia de uma amostra para outra, portanto
x uma varivel aleatria, nesse caso, discreta.

Ento, vamos determinar sua distribuio de probabilidade, sua mdia e sua
varincia.

Logo, 3 ) ( 3 25 / 75 ) ( ) ( = = = = = =

X E x p x x E
x x


E, 1 9 10 ) ( ) ( ) (
2 2
= = = x E x E x V 1 ) (
2
= =
x
x V o

Concluso:

Proposio 1

A mdia das mdias amostrais ) (x E igual mdia populacional , ou seja,
= ) (x E

- Demonstrao

) (x E = E
)
`

n
x
n
1
1
= |
.
|

\
|

=
n
i
x E
n
1
1
= ( )

x E
n
1
= ( ) n
n
1
= = ) (x E

Sendo, 2 ) ( = X V , n = 2 e 1 ) ( = x V , conclumos que:
n
X V
x V
) (
) ( =


Proposio 2

A varincia da mdia amostral igual varincia populacional dividida pelo
tamanho da amostra, ou seja,
n
x V
2
) (
o
=

- Demonstrao

( ) ( ) ( ) ( ) ( ) ) ( .... ( ) (
1
....
1 1
) (
2 1
2
2 1
2 2
n n i
x V x V x V
n
x x x V
n
x V
n n
x
V x V + + + = + + + = =
|
|
.
|

\
|
=


n
x V
n
n
n n
2 2
2
2
2 2 2
2
) ( ) . (
1
) ..... (
1 o o
o o o o = = = + + +



Graficamente, teramos:


P(x) ) (x P

5/25 -
4/25 - -
1/5 - - - - - 3/25 - -
2/25 - -
1/25 - -

0 1 2 3 4 5 0 1 2 3 4 5

1,5 2,5 3,5 4,5

Concluso:

1 - Se X: N ( , o
2
) e se dessa populao retirarmos uma amostra de tamanho
n suficientemente grande, com reposio, ento:

|
|
.
|

\
|
~
n
N x
2
,
o
e isto significa que, quanto maior o tamanho da amostra,
menor ser a varincia de x , ou o estimador x ser mais preciso medida que
aumentarmos n.

2 Se a populao X no normal, a varivel no ser exatamente normal,
mas sim aproximadamente normal, ou seja, a varivel
x
x
x
Z
o

=
ter como
distribuio limite a distribuio N (0,1).

3 Se a populao for finita e de tamanho N conhecido e se a amostra dela
retirada for sem reposio, ento:

1
.

=
n
n N
n
x
o
o
Exemplo

Sabe-se que a altura mdia dos alunos de uma faculdade de 175 cm e
desvio-padro de 5 cm. Sabendo-se que esta populao tem 5.000 alunos e
retirou-se uma amostra sem reposio de tamanho n = 100, qual a distribuio
da mdia amostral?

Se X: N (175; 25) = 175 cm e o =5 cm

175 ) ( = = X E
x
e, 49880 , 0
1 000 . 5
100 000 . 5
10
5
1
. =

=
n
n N
n
x
o
o

Logo, a mdia das mdias amostrais 175 com desvio padro 0,5 cm.

Aplicao

Seja X: N (80,26). Dessa populao retiramos uma amostra de n = 25.
Calcular:

a) ) 83 ( x P b) ) 82 ( s x P c) ) 2 2 (
x x
x x P o o + s s

a) Como X: N (80,26) ) 25 / 26 , 80 ( : N x

94 , 3 94 , 2
02 , 1
80 83
= =

= Z
x
Z
x
x
o

. Isto porque: 02 , 1 25 / 26 = =
x







80 83 x 0 2,94 Z

5 , 0 ) 94 , 2 ( ) 83 ( = = Z P x P - P(Z > 2,94) = 0,5 0,498359 = 0,001641

b) 975002 , 0 47002 , 0 5 , 0 ) 96 , 1 ( ) 82 ( = + = s = s Z P x P






80 82 x 0 1,96 Z

c)
= + s s = + s s = + s s ) 02 , 1 . 2 80 02 , 1 . 2 80 ( ) 2 2 ( ) 2 2 ( x P x P x x P
x x x x
o o o o



% 95 954500 , 0 )) 2 2 ( ) 04 , 82 96 , 77 ( ) 02 , 1 . 2 80 02 , 1 . 2 80 ( ~ = s s = s s = + s s Z P x P x P


Concluso

De posse desse valor, podemos afirmar que, temos 95% de confiana de que
se, retirarmos dessa populao, uma amostra de 25 elementos, a mdia
amostral estar no intervalo (77,96 : 82,04) ou, ento, se selecionarmos 100
amostras de tamanho 25, em 95 delas o valor da mdia pertencer ao intervalo
e em 5 delas no pertencer.

Teste seus conhecimentos

1 Uma populao se constitui dos nmeros 2, 3, 4, 5. Considere todas as
amostras possveis, de tamanho 2, que podem ser extradas dessa populao
com reposio.

Determinar:

a) A mdia da populao
5 , 3 =
x


b) O desvio-padro populacional
12 , 1 =
x
o
o
c) A mdia da distribuio amostral das mdias amostrais ;
5 , 3 =
x
o

d) O desvio-padro da distribuio amostral das mdias ; 7906 , 0 =
x
o
e) Com os valores obtidos, constate que ;
x
x E = ) ( e
n
x
/ o o =


2 Seja X: N (900 , 642) .Retiramos uma amostra de tamanho 30 dessa
populao. Determinar:

a) ) 894 ( s x P ; 0,096801

b) ) 903 896 ( s s x P ; 0,54726

c) ) 3 3 (
x x
x x P o o + ; 0,9973

3. Seja X: N(1200 , 1444). Retiramos uma amostra de tamanho 15. Determinar:

a) ) 206 . 1 194 . 1 ( s x P ; 0,458138

b) 90 , 0 ) . . ( = +
x x
Z x Z x P o o
o o
; P(1183,91s x s1216,08) = 0,90

4. Qual dever ser o tamanho de uma amostra a ser retirada de uma
populao normal com mdia 1.200 e varincia 840, de tal forma que:

a) P (1196 < x < 1204) = 0,90. ; 141

b) Que concluses se pode tirar a partir do dimensionamento de n?

5. Que tamanho dever ter uma amostra para ser retirada de uma populao
X : N (200,350) , para que 95 , 0 ) 5 ( = s x P ; n > 54

6. Seja X: N(100 ; 65). Retiramos dessa populao uma amostra de tamanho
20.
Determinar:

a) ) 105 95 ( s s x P ; R = 0,984902

b) 105 ( ) 95 ( x P x P

c) 95 , 0 ) . . ( = +
x x
Z x Z x P o o
o o
; R = 95 , 0 ) 4 , 104 96 . 95 ( = x P

d) Qual o risco de que a mdia no pertena a esse intervalo?

e) O que significa o 0,95 da questo c

17.2 DISTRIBUIO AMOSTRAL DAS PROPOROES

Seja X uma populao infinita e p a probabilidade ou proporo de
sucessos de um evento de X. Ento (1 p) ser a probabilidade desse evento
no ocorrer. Nessas condies e segundo Poisson:

A mdia ser: = E (X) = p e a varincia o
2
= V (X) = pq

Vamos retirar uma grande amostra, n , (x
1
,

x
2
,

... ,x
n
) dessa
populao, com reposio e seja x o nmero de sucessos na amostra, isto
o nmero de elementos com a caracterstica que se quer estudar. Com essas
caractersticas X ter uma distribuio Binomial ou seja, X : B (n, p) com:

mdia, E (X) = np e varincia V(X) = n p q.

Ento, a distribuio amostral da freqncia relativa ou do estimador
populacional p ser dada por:

n
X
f p = =
Calculando a esperana e a varincia de p temos:

p p E p
n
np
x E
n n
x
E p E = = = = |
.
|

\
|
= ) ( ) ( .
1
) ( ou p
p
=

e,

n
pq
p V
n
pq
npq
n
X V
n n
x
V p V = = = = |
.
|

\
|
= ) ( .
1
) (
1
) (
2 2
ou
n
pq
p
=

o

Concluso :

Para n > 30 e pelo teorema central do limite, a distribuio amostral de p ser
aproximadamente normal e,

p
p
p

o

ser assintoticamente normal , isto , ) 1 , 0 (
.

N
n
q p
p p
Z ~

=

OBS


1 - Quando a proporo populacional p desconhecida e a amostra com
reposio grande, determina-se p
o
= x / n, como estimativa de p.

2 Estatisticamente uma amostra suficiente grande quando n.p > 5 e n.q > 5

Graficamente, teramos:




n
pq

n
pq


0 p

APLICAO

1. Para se conhecer a proporo de pessoas de uma populao, portadoras
de determinada doena, retira-se uma amostra de 400 pessoas e atravs de
um exame constata-se que existem 8 portadoras dessa enfermidade. Definir
os limites de confiabilidade de 99% para a proporo populacional.

Soluo

O que queremos saber a proporo de pessoas na populao portadoras
dessa doena.

Como no conhecemos a proporo populacional, temos que estim-la,
atravs da freqncia amostral, assim:

02 , 0 02 , 0
400
8
0
= = = =
o
p
n
x
p e 98 , 0 =
o
q ;
07 , 0 007 , 0
400
98 , 0 . 02 , 0 .
0 . 0
= = = |
.
|

\
|
=
p p
x
n
q p
o o

Como no temos condies da estabelecer um nmero exato para os
portadores dessa doena, deveremos estabelecer um intervalo, onde esta
proporo estar contida.

Da, queremos: 99 , 0 ) . . (
0 0
= + s s
p p
Z p p Z p P o o
o o



0,05% 0,99% 0,05%



- Z
o
0 Z
o

Como
o
Z
= 495 , o
Z

= 2,57 ; Ento temos que:
P (0,02 2,57 . 0,007 s p s 0,02 + 2,57 . 0,007) = P (0, 002 s p s 0,038) = 99%.

Ou seja, podemos garantir com uma confiabilidade de 99% que a proporo de
pessoas portadoras da doena na populao varia de 0,2% no mnimo a 3,8%
no mximo

18 INTERVALOS DE CONFIANA

Introduo

Trata-se de uma tcnica para se fazer inferncia estatstica. A
partir de um intervalo de confiana, construdo com os elementos amostrais
pode-se inferir sobre um parmetro populacional.

Esta tcnica diferente da estimao por ponto, onde se calcula um
nico valor para o parmetro populacional. Agora, busca-se um segmento ou
intervalo que dever conter o parmetro desconhecido.

Tomemos como exemplo, uma amostra de 100 estudantes e calculando-
se a mdia das alturas, encontra-se 1,66 m. Atravs da tcnica de intervalos de
confiana poder-se-ia encontrar um intervalo, por exemplo |1,58 ; 1,68| que em
95% das vezes, incluiria a verdadeira altura dos estudantes, ou a mdia da
populao dos estudantes, = 1,66m


POPULAO


AMOSTRA


ESTIMATIVA Inferncia




PONTO INTERVALO



TOMADA DE DECISO EM
MOMENTOS DE INCERTEZA




1
2
3
4
5
6
7
8
9
10
u (fixo)
Configurao: 10 intervalos de confiana para 10 amostras de mesmo
tamanho e (1 - o) = 90%

17.2.1 NTERVALO DE CONFIANA PARA A MDIA POPULACIONAL
QUANDO A VARINCIA o
2
CONHECIDA

J sabemos que o estimador da mdia populacional x .
Tambm conhecemos a distribuio de x para o caso de populaes infinitas,
ou seja:
x : N ( ; o
2
/n) , sendo a varivel padronizada de x


dada por: x
x
Z =
o/ \ n

Fixando-se um nvel de confiana de 1 o temos :



o / 2 1 o o / 2


Z
o/2
0 Z
o/2


Queremos, ento: a P ( Z
o/2
s Z s Z
o/2
) = 1 o

Substituindo o valor de Z, na expresso acima,vem:

o
o

o o
= |
.
|

\
|
s

s 1
/
2 / 2 /
Z
n
x
Z P
x
e resolvendo as duas inequaes para ,
temos o intervalo de confiana para a mdia populacional quando a varincia
conhecida:
o
o

o
o o
= |
.
|

\
|
+ s s 1 . .
2 / 2 /
n
Z x
n
Z x P
x

Exemplo

A durao de vida de um componente eletrnico tal que o = 5 horas. Foram
amostradas 100 dessas peas obtendo-se a mdia de 500 horas. Deseja-se
construir um intervalo se confiana para a verdadeira durao mdia da pea
com um nvel de confiana de 95%.

Soluo

Dados : o = 5; n = 100; x = 500 (1 - o) = 95%



2,5% 9 5% 2,5%



1,96 500 1,96
OBS
Para encontrar a abscissa 1,96, entrou-se na tabela com 47,5% ou 0,475 = 0,5
0,25

Substituindo-se os valores correspondentes na frmula, temos:

P (500 1,96 . 5/10 s s 500 + 11,96 . 5/10) = 95%

P (499,02 s s 500,98) = 95%

Interpretao:

1 - Podemos afirmar com 95% de confiana que o intervalo |499,02 ; 500,98|,
contm a verdadeira mdia populacional que no caso, desconhecida.

2 Das 100 peas, amostradas, em 95 delas a mdia pertencer ao intervalo
e em 5
delas a mdia populacional estar fora desse intervalo.

Para o caso de populaes finitas e amostragens sem reposio, usa-se a
frmula:


o
o

o
o o
=
|
|
.
|

\
|

+ s s

1
1 1
2 / 2 /
N
n N
n
Z x
N
n N
n
Z x P

9. TESTE DE HIPTESES

Introduo

O teste de hipteses um mtodo de fazer inferncia estatstica sobre
parmetros populacionais. Em vez de se calcular uma estimativa pontual ou
por intervalo, do parmetro, admite-se um valor hipottico do parmetro
populacional e com base em elementos amostrais, realiza-se um teste
estatstico para aceitar ou rejeitar esse valor hipottico.


N n

u

u
0



Em resumo, um processo de anlise que permite decidir por um valor do
parmetro populacional ou por sua modificao do qual depende uma lei de
distribuio estatstica, com um grau de risco, a priori, conhecido.

1. Hiptese Estatstica

Uma hiptese estatstica uma suposio que o pesquisador faz
baseado no verdadeiro valor do parmetro populacional, ou quanto natureza
da distribuio de probabilidade de uma varivel populacional.

So exemplos de hipteses estatsticas:

1 A altura mdia da populao brasileira 1,65 m: =
0
= 1,65
2 A mquina A produz peas com variabilidade menor do que a mquina B:
2 2
B A
o o
3 A proporo de pessoas de uma regio A com uma certa doena, maior
do que na regio B:
B A
p p

So dois os tipos de hipteses estatsticas:

1 H
o
hiptese nula, a hiptese a ser testada, e
2 H
1
Hiptese alternativa

2. O Teste de Hipteses

A questo bsica para o teste a formulao de uma hiptese, quanto
ao verdadeiro valor do parmetro populacional e atravs dos elementos
amostrais realiza-se um teste que indicar a aceitao ou rejeio da hiptese
formulada com um risco, a priori, conhecido.

A hiptese nula expressa por uma igualdade e a hiptese alternativa por uma
desigualdade.

Exemplos

H
o
: = 1,65 para testes bilaterais
H
1
: = 1,65

H
0
:
2 2
B A
o o = para testes unilaterais esquerda
H
1
:
2 2
B A
o o

H
0
:
B A
p p = para testes unilaterais direita
H
1
:
B A
p p

4. Procedimento Padro para Montagem do Teste

1. Define-se as hipteses: nula H
0
e a alternativa H
1
2. Fixa-se um nvel de significncia o (risco);
3. Seleciona-se uma amostra de tamanho n e calcula-se uma estimativa u
0

do parmetro u populacional;

4. Para cada tipo de teste, usa-se uma varivel cuja distribuio amostral do
estimador em questo, seja mais concentrado em torno do verdadeiro valor do
parmetro populacional;
5. Calcula-se, com o valor u
0
, dado por H
0
, o valor crtico (V
cal
)
6. Fixam-se duas regies:

uma regio de no rejeio de H
0
(RNR) e outra de rejeio de H
0
ou crtica
(RC) para o valor calculado, ao nvel e significncia ou risco o e adota-se a
seguinte regra de deciso:

- Se V
cal
e RNR , decide-se no rejeitar H
0

- Se V
cal
e RC , rejeita-se H
0


5. Teste de Hiptese para a Mdia de Populaes Normais com Varincia
Conhecida

Aplicao

De uma populao normal com varincia 36, toma-se uma amostra casual de
tamanho 16, obtendo-se 43 = x . Ao nvel de 10% testar as hipteses:

45 :
45 :
1
0
=
=

H
H


Dados: o = 10% ; n = 16 ; 43 = x e o
2
= 36

Sendo o teste para mdia de populaes normais com varincias conhecidas,
usaremos a varivel Z : N(0,1) como critrio. Da,

33 , 1 33 , 1
5 , 1
45 43
0
= =

=
cal
x
H
Z
x
Z
o

Sendo 5 , 1
4
6
16
6
= = = =
n
x
o
o



Como o teste bilateral, temos que Z
o
= Z
5%
= Z
0,05
= 1,64


RC RNR RC
5%
5% 90% 5%

1,64 1,64

Como Z
cal
= 1,33 pertence a RNR, a deciso no rejeitarmos H
0
, ou seja,
a mdia 45, com 10% de risco de no rejeitarmos uma hiptese falsa

6 Tipos de Erros

Como falamos anteriormente , ao aplicarmos esta tcnica, estaremos
cometendo erros, por estarmos trabalhando com amostras. Diante desse fato
podemos classificar os erros em dois tipos:

6.1 Erro Tipo I ( o )

o erro cometido quando se rejeita H
o
,

sendo H
o
verdadeira.

6.2 Erro Tipo II ( | )

o erro cometido quando aceitamos uma hiptese falsa.


H
0
H i p t e s e s

D e c i s o V e r d a d e i r a F a l s a

Aceitar No h erro Erro tipo II
(1 - o) (|)

Rejeitar Erro tipo I No h erro
(o) (1- |)

Com base no quadro acima, conclui-se que:

- S cometemos o erro tipo I quando rejeitamos uma hiptese verdadeira

- S cometemos o erro tipo II quando aceitamos uma hiptese falsa