Você está na página 1de 12

INTRODUO ESTATSTICA

FORMULRIO



AMILTON BRAIO ARA
ANA VILLARES MUSETTI




SO CAETANO DO SUL
2005




1

Estatstica descritiva


1. Dados no agrupados

n
x
x
n
i
i
=
=
1

( )
( )
1 1
2
2
2
1 2

=
n
n
x
x
n
x x
s
i
i
n
i
i


2. Dados agrupados


n
f x
x
k
i
i i
=
=
1

( )
(
(

n
f x
f x
n
s
i i
i i
2
2 2
1
1


3. Coeficiente de variao

x
s
CV =

4. Coeficiente de assimetria de Pearson

( )
s
Md x
s
Mo x
A

=
3


Probabilidade


1. Frmulas bsicas

( )
n
n
A P
A
=

( ) ( ) ( ) ( ) B A P B P A P B A P + =

( )
( )
( ) A P
B A P
A B P

=

Se A e B so independentes, ento: ( ) ( ) ( ) B P A P B A P =
2

Se
n
A A A K , ,
2 1
uma partio de S, com 0 ) ( >
i
A P , para todo i e B um evento de S com
0 ) ( > B P , ento:
n 1,2 i ,
) ( ) (
) ( ) (
) (
1
K =

n
i
i i
i i
i
A P A B P
A P A B P
B A P


2. Distribuies de Probabilidades



2.1 Mdia de uma varivel aleatria X:

a) X discreta:

= =
i
i i
x P x X E ) ( ) (
b) X contnua:


= = dx x xf X E ) ( ) (


2.2 Varincia de uma varivel aleatria X: ( ) ( )
2 2 2
) ( = = X E X E X Var

a) X discreta:

=
i
i i
x P x X Var
2 2
) ( ) (
b) X contnua:
2 2
) ( ) ( =


dx x f x X Var .


2.3 Distribuio Binomial

( ) n k p p k X P
k n k n
k
K 2 , 1 , 0 , ) 1 ( ) ( = = =

, onde ( )
( ) ! !
!
,
k k n
n
C
k n
n
k

= =

) 1 ( ) ( ) ( p np X Var np X E = = ,


2.4 Distribuio de Poisson

t
k
e
k X P
k

= = =

,
!
) ( = = ) ( ) ( X Var X E



3

2.5 Distribuio Exponencial

<

0 , 0
0 ,
) (
t
t e
t f
t

,
2
1
) ( ,
1
) (

= = T Var T E
0 , ) ( > = >

k e k T P
k



2.6 Distribuio Normal

Se X uma v.a. com distribuio normal com mdia e desvio padro , ento


=
X
Z tem distribuio normal padro.

Intervalos de confiana


1. Para a mdia

n
z x
n
z x

+ , ou

n
s
t x
n
s
t x + ( t com 1 = n graus de liberdade)


2. Para a proporo

n
p p
z p p
n
p p
z p
) 1 ( ) 1 (
+




3. Para a varincia

2
2
1
2
2
2
2
2
) 1 ( ) 1 (


s n s n
(
2
com 1 = n graus de liberdade)





4
Testes de hipteses


1. Para uma mdia
0 0
: = H

n
s
x
n
x
z
0 0
t ou

=


2. Para uma proporo
0 0
: p p H =

n
p p
p p
z
) 1 (
'
0 0
0

=


3. Para uma varincia
2
0
2
0
: = H

2
0
2
2
) 1 (

s n
=


4. Para comparao de duas mdias

=
2 1 0
: H ( 0 teremos , de teste o Para : .
2 1
= = Obs )


4.1 dados emparelhados:

n
s
x
t

=


4.2 Amostras independentes com desvios padres conhecidos


2
2
2
1
2
1
2 1
n n
) x x (
z

+

=


5

4.3 Amostras independentes com desvios padres desconhecidos, mas supostos iguais:


2 n n
s ) 1 n ( s ) 1 n (
s
2 1
2
2 2
2
1 1 2
p
+
+
=

2 1
p
2 1
n
1
n
1
s
) x x (
t
+

=


4.4 Amostras independentes com desvios padres desconhecidos e diferentes


2
2
2
1
2
1
2 1
n
s
n
s
) x x (
t
+

=



5. Para comparao de duas propores:

=
2 1 0
: p p H ( 0 teremos , de teste o Para : .
2 1
= = p p Obs )


2
2 2
1
1 1
2 1
n
) p (1 p
n
) p (1 p
) p p (

+


= z

ou, no caso de
2 1 0
: p p H = :
2 1
2 2 1 1
n n
p n p n
'
+
+
= p e
)
n
1
n
1
)( p (1 p
p p
2 1
2 1
+

= z

6. Para comparao de duas varincias:

) s , mn(s
) s , mx(s
2
2
2
1
2
2
2
1
= F


7. Para comparao de k varincias, k>2:


=
|
|

\
|


+ =
(
(

=
i
i
2
i i
2
i i
2
n n e
k n
1
1 n
1
1) 3(k
1
1 C
onde 1)lns (n
k n
1)s (n
k)ln (n
C
1



6
8. Para comparao de k mdias, k>2:


n
x
x SQT
k
i
n
j
ij
k
i
n
j
ij
i
i
2
1 1
1 1
2
|
|

\
|
=

= =
= =

n
x
n
x
SQE
k
i
n
j
ij
k
i i
n
j
ij
i i
2
1 1
1
2
1
|
|

\
|

|
|

\
|
=


= =
=
=
,

onde n = n
i




Tabela de Anlise de Varincia (ANOVA)

Fonte de
variao
FV
Graus de
liberdade
GL
Soma de
quadrados
SQ
Quadrados
mdios
QM
Valor de F
F
cal
Probabilidade
P
Entre
amostras
k 1 SQE
QME=
1 k
SQE


Residual

n k SQR
QMR=
k n
SQR



F
cal
=
QMR
QME


P=P(F>F
cal
)
Total

n 1 SQT




9. Testes no paramtricos


9.1 Teste de aderncia:


=
i
i i
E
E O
2
2
) (


com (k-1-m) graus de liberdade, onde

k = nmero de valores considerados no clculo da estatstica
2

m = nmero de parmetros do modelo de H
o
que precisam ser estimados a partir da amostra
i i
np E =





7
9.2 Teste de independncia:


=
ij
ij ij
E
E O
2
2
) (



com (r-1)(s-1) graus de liberdade, onde
r = nmero de linhas da tabela
s = nmero de colunas da tabela

n
j coluna da total i linha da total
np E
ij ij
) ( ) (
= =



10. Correlao e regresso linear

10.1 Coeficiente de correlao linear de Pearson

yy xx
xy
S S
S
r = ,onde:
( ) ( )
n
y x
y x y y x x S
n
i
i
n
i
i
n
i
i i
n
i
i i xy
|

\
|
|

\
|
= =


=
= =
1 1
1 1


( )
n
x
x x x S
n
i
i
n
i
i
n
i
i xx
2
1
1
2
1
2
|

\
|
= =


=
= =


( )
n
y
y y y S
n
i
i
n
i
i
n
i
i yy
2
1
1
2
1
2
|

\
|
= =


=
= =



10.2 Teste para o coeficiente de correlao linear de Pearson

H
0
: 0 =
2
1
2
2

n
r
r
t
n


8
10.3 Regresso linear simples: Estimao do modelo.

e X Y + + =

bx a y + =
)
,

x b y a =
e


xx
xy
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i i
S
S
n
x
x
n
y x
y x
b =
|

\
|

\
|
|

\
|

=
=
= =
=
2
1
1
2
1 1
1


onde
n
y
y
n
x
x
n
i
i
n
i
i
= =
= =
1 1
e

yy
xy
S
bS
SQT
SQE
r = =
2



10.4 Teste para o parmetro
0 0
: : = H

xx
R
S
s
b
t
2
0

=


10.5 Teste para o parmetro
0 0
: : = H

xx
R
nS
x s
a
t

=
2 2
0





9
10.6 Intervalos de confiana

a) para o valor esperado:

xx
R
n
S
x x
n
s t x y
2
0
; 2
0
) ( 1
) (
2



onde:


0 0
) ( bx a x y + =
2
R
s a estimativa da varincia residual dada por
2
2

=
n
bS S
s
xy yy
R
,
R
s o respectivo
desvio padro.

b) para o valor individual:

xx
R
n
S
x x
n
s t x y
2
0
; 2
0
) ( 1
1 ) (
2

+ +





10.7 Anlise de varincia

Fonte de
variao
Graus de
liberdade
Somas de
quadrados
Quadrados
mdios
Estatstica F
Regresso 1
xy
bS SQE =
xy
bS
2
R
xy
s
bS
F =
Resduo 2 n
xy yy
bS S SQR =
2
2

=
n
bS S
s
xy yy
R


Total 1 n
yy
S SQT =




10.8 Regresso linear mltipla: Estimao do modelo.

e X X X Y
k k
+ + + + = K
2 2 1 1



k k
x b x b x b a y L + + + =
2 2 1 1


k k
x b x b x b y a L =
2 2 1 1


10

+ + =
+ + =
+ + =
kk k k k ky
k k y
k k y
S b S b S b S
S b S b S b S
S b S b S b S
L
M
L
L
2 2 1 1
2 22 2 21 1 2
1 12 2 11 1 1


onde
( )
( )
( )( )
( )( )
( )( )
( )( )
k i
n
y x
y x y y x x S S
j i k j i
n
x x
x x x x x x S S
k i
n
x
x x x S S
i
i i i y x iy
j i
j i j j i i x x ij
i
i i i x x ii
i
j i
i i
L
L
L
2 , 1
, 2 , 1 ,
2 , 1
2
2 2
= = = =
= = = =
= = = =



onde os somatrios indicam os totais dos n valores de cada uma das variveis.


10.9 Anlise de varincia

Fonte de
variao
Graus de
liberdade
Somas dos quadrados Quadrados mdios Estatstica F
Regresso k

=
iy i
S b SQE k SQE s
E
=
2

2
2
R
E
s
s
F =
Resduo 1 k n

=
iy i yy
S b S SQR ) 1 (
2
= k n SQR s
R


Total n-1
yy
S SQT =




10.10 Anlise de melhoria

'
1
'
1
'
1
'
) 1 (
e X X Y
k k k
+ + + =

K

e X X X Y
k k k k k
+ + + + =


1 1 1 1 ) (
K





11
Fonte de variao Graus de
liberdade
Soma de
quadrados
Quadrados
mdios
Estatstica F
Devida melhoria
de ajuste
1 SQM SQM
2
k
s
SQM
F =
Residual para o
modelo com k
variveis
1 k n SQR(k)
1
) (
2

=
k n
k SQR
s
k


Residual para o
modelo com (k-1)
variveis
k n ) 1 ( k SQR


Observemos que:


) 1 ( ) 1 (
) ( ) (
) 1 (
'
1 2
'
2 1
'
1
2 2 1 1
= =
= =

k SQE S S b S b S b S k SQR
k SQE S S b S b S b S k SQR
yy y k k y y yy
yy ky k y y yy
K
K

logo:

) 1 ( ) ( ) ( ) 1 ( = = k SQE k SQE k SQR k SQR SQM .