Escolar Documentos
Profissional Documentos
Cultura Documentos
Escola de Engenharia
ESTATÍSTICA II
Mestrado Integrado em Engenharia e Gestão Industrial
FORMULÁRIO
Ano Lectivo 2007-2008
Índice
µ=
a+b
σ2 =
(b − a ) 2
2 12
Distribuição Binomial [B(n,p)] Distribuição Exponencial [EN(1/θ)]
n 1 −x
f ( x ) = p x (1 − p )
n−x
x = 0,1,2,..., n e θ x>0
x f ( x ) = θ
µ = np σ 2 = np (1 − p ) 0 outros
µ =θ σ 2 =θ 2
Distribuição Poisson [P(λ)] Distribuição Normal [N(µ,σ2)]
λx e −λ ( x − µ )2
f (x ) = 1 −
x = 0,1,2,..., n f (x ) = e 2σ 2
x! σ 2π
µ =λ σ2 =λ
µ = µ σ 2 =σ 2
X −µ
Z=
σ
Aproximação da Binomial à Poisson Aproximação da Binomial à Normal
N grande e p muito pequeno np > 5
λ = np Condições
nq > 5
µ = np
σ 2 = npq
Distribuição Uniforme (discreta) Correcção de Yates
f (x ) =
1
x = x1 , x 2 ,..., x k P ( X ≤ x ) ≈ P ( X < x + 0.5)
k P (Y ≥ y ) ≈ P (Y > y − 0.5)
µ =∑
xi
σ2 =∑
(xi − µ )2
i k i k
INTERVALOS DE CONFIANÇA E TESTES DE HIPÓTESES PARA UMA AMOSTRA
Conhece
Parâmetro a estimar Tipo de População Dimensão da amostra E.T ~ Distribuição Intervalo de Confiança Notas
σ?
x −µ σ σ z(1−α
Normal Qualquer Sim Z = σ ~ N (0, 1) x − z(1−α 2) < µ < x + z(1−α 2)
2) : quantil da tabela acumulada
n n n da Normal padrão à esquerda
x −µ s s
Média Qualquer n ≥ 30 Não Z = s ~ N (0, 1) x − z(1−α 2) < µ < x + z(1−α 2) Estimador do desvio padrão: σ ≈s (1)
µ n n n
x −µ s s
Normal n < 30 Não T = s ~ t n −1 x − t(α 2), n −1 < µ < x + t(α 2), n −1
n n n
pˆ − p Estimador da proporção binomial
Z = ~ N (0, 1)
Proporção binomial
Bernoulli n > 30 (2) -
p (1− p )
pˆ (1 − pˆ ) pˆ (1 − pˆ ) p ≈ pˆ =
x
p n pˆ − z(1−α < p < pˆ + z(1−α 2)
2)
n n n
Z=
( x1 − x2 ) − ( µ1 − µ2 ) ~ N (0,1)
σ1 e σ 2 s12 s22
( x1 − x2 ) ± z(1−α 2)
Estimadores dos desvios padrão:
Quaisquer n1 ≥ 30 e n2 ≥ 30 s12 s22 + σ 1 ≈ s1 , σ 2 ≈ s2
Diferença entre as Não + n1 n2
médias n1 n2
µ1 − µ 2
T=
( x1 − x2 ) − ( µ1 − µ2 ) ~ t GL = n1 + n2 − 2
σ 1 e σ 2 Não 1 1
Normais n1 < 30 e n2 < 30
σ 12 = σ 22 sp
1 1
+
GL
( x1 − x2 ) ± t(α 2),GL s p + s 2p =
( n1 − 1) s12 + ( n2 − 1) s22
e n1 n2 n1 + n2 − 2
n1 n2
Normais Di − ( µ1 − µ2 ) sDi = sn −1 para
Amostras n1 < 30 e n2 < 30
σ1 e σ 2 T=
sDi
~ t( n −1)
Di − t( n−1),α 2 .
sDi
< µ1 − µ2 < Di + t( n −1),α 2 .
sDi
dependentes Não n n Di = X 1i − X 2i
n
Estimadores das proporções
Diferença de ( pˆ1 − pˆ 2 ) − ( p1 − p2 ) binomiais (4)
Z= ~ N (0,1) (3) pˆ1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 )
proporções Bernoulli n1 ≥ 30 e n2 ≥ 30 -
pˆ1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 ) ( pˆ1 − pˆ 2 ) ± z(1−α 2) + pˆ1 =
x1 x
e pˆ 2 = 2
p1 − p2 + n1 n2 n1 n2
n1 n2
s12 ν 1 = n1 − 1 e ν 2 = n2 − 1
Razão de variâncias
σ 12 s12 1 σ 2 s2 1 1
σ 12 Normais Quaisquer - F= ~ Fν1 ,ν 2 = F(α
s22 < 12 < 12 F(1−α
2),ν 2 ,ν 1
σ 22 σ 2 s2 F(α 2),ν1 ,ν 2 σ 2 s2 F(1−α 2),ν1 ,ν 2
2 2),ν 1 ,ν 2
2
1
Teste do ”bom ajuste” do Qui-Quadrado para grandes amostras
H0 : as probabilidades corresp ondentes das classes provêm de uma distribuição da família ...
o o
graus de lib erdade = n de celas -1- n de parâmetros estimados
Pk (fi −ei )2
Q= i=1 ei com a frequência esp erada dada p or ei =n.pi
Tabelas de Contingência
Característica B
B1 B2 B3 Bb ni.
A1 f11 f12 f13 ··· f1b
Característica A2 f21 f22 f23 ··· f2b
A A3 f31 f32 f33 ··· f3b
.. .. .. .. ..
. . . . ··· .
Aa fa1 fa2 fa3 ··· fab
n.j n
1. . Teste de independência
Hipótese nula:
H0 : pij = pi. p.j (as variáveis são indep endentes), i = 1, ..., a e j = 1, ..., b
R.R: Q > c com c = χ2(a−1)(b−1),α
2 . Teste de homogeneidade
Hipótese nula:
H0 : w1j = w2j = ... = waj (as subp opulações A são equivalentes) para j = 1, ..., b.
R.R: Q > c com c = χ2(a−1)(b−1),α
Xb X a
(fij − eij )2 ni. n.j
Q= com a frequência esp eradada dada por eij = i = 1, ..., a e j = 1, ..., b
j=1 i=1
eij n
2
Planeamento completamente aleatório
Pk Pk 2
T.j 1 2
SQT = nj (y .j − Y )2 SQT = j=1 nj − N T..
Pj=1
k Pnj Pk Pnj 2 1 2
ST Q = (yij − Y )2 ST Q = i=1 yij − N T..
Pj=1
k Pi=1
nj 2
j=1
Pk
SQR = j=1 i=1 (yij − y .j ) SQR = ST Q − SQT com N= j=1 nj
T.j é o total dos valores obtidos para o tratamento j ; T.. é o grande total
H0 : α1 = α2 = ... = αk = 0
(não existem diferenças entre as m édias das k p opulações).
Fonte de variação Soma dos quadrados graus de liberdade M édia dos quadrados v.a. F
Tratamentos SQT k-1 M QT=SQT/(k-1)
MQT
Resíduos SQR Σnj − k M QR=SQR/ (Σnj − k) F= MQR
Total STQ Σnj − 1
• Intervalos de confiança para diferenças entre pares de médias de tratamentos iej com
i 6= j = 1, 2, ..., k
(y .i − y .j ) − (µi − µj )
T = q ∼ tN −k
SQR 1 1
N−k ni ( + nj )
Pk Pk
SQT = b j=1 (y .j − Y )2 SQT = 1b j=1 T.j2 − kb
1 2
T..
Pb 1
Pb 1 2
SQB = k i=1 (y i. − Y )2 2
SQB = k i=1 Ti. − kb T..
Pb Pk Pb Pk 1 2
ST Q = i=1 j=1 (yij − Y )2 ST Q = i=1 j=1 yij 2
− kb T..
P P
SQR = bi=1 kj=1 (yij − y i. − y .j + Y )2 SQR = ST Q − SQT − SQB
Ti. é o total dos valores obtidos para o bloco i ; T.j é o total dos valores obtidos para
o tratamento j
3
M odelo p opulacional: yij = µ + αj + β i + eij
para i = 1, ..., b e j = 1, ..., k eij ∼ N (0, σ 2 )
H01 : α1 = α2 = ... = αk = 0
(não existem diferenças significativas entre os tratamentos).
H02 : β 1 = β 2 = ... = β b = 0
(não existem diferenças significativas entre os efeitos dos blocos)
F. de variação S. dos quadrados graus de lib erdade M édia dos quadrados v.a. F
Tratamentos SQT k-1 M QT=SQT/(k-1)
MQT
Blocos SQB b-1 M QB=SQB/(b-1) F 1 = MQR
MQB
Resíduos SQR (k − 1).(b − 1) M QR=SQR/ (k − 1).(b − 1) F 2 = MQR
Total STQ k.b − 1
(y j1 − y j2 ) − (µj1 − µj2 )
T = q ∼ t(b−1)(k−1)
M QR( 2b )
M odelo p opulacional
yijk = µ + αi + β j + γ ij + eijk
4
para i = 1, ..., p , j = 1, ..., q . e k = 1, ..., r e eijk ∼ N (0, σ 2 )
• Factor A
H01 : α1 = α2 = ... = αp = 0
H11 : existem diferenças significativas entre os níveis de A
R.R : F1 > c com c (Fisher) determinado de
MQFA
α = P r[F1(p−1),pq(r−1) > c; H01 ] e F1 = MQR
• Factor B
H02 : β 1 = β 2 = ... = β q = 0
H12 : existem diferenças significativas entre os níveis de B
R.R : F2 > c com c (Fisher) determinado de
M QFB
α = P r[F2(q−1),pq(r−1) > c; H02 ] e F2 = MQR
• Interacção AB
Fonte de variação Soma dos Quadrados graus de lib. M édia dos Quadrados v.a F
Factor A SQF A p-1 M QF A
Factor B SQF B q-1 M QF B F1 = MQF
MQR
A
MQF
Interacção AxB SQI AB (p-1).(q-1) M QI AB F 2 = MQRB
MQIAB
Resíduos SQR p.q.(r-1) M QR F 3 = MQR
Total STQ p qr-1
Planeamento 22
5
ee − µ
T =q ∼ t4(r−1)
2
( sr )
Planeamento 23
1
Efeitos estimados: ee = 23−1 [±y 1 ± y 2 ± y 3 ± y 4 ± ... ± y 8 ]
A som a dos quadrados dos efeitos de cada factor (ou interacção) p ode ser calculada a partir de
2
SQfactor ou interac. = 2n−2 r(eefactor ou interac. )
H 0 : Não existem diferenças significativas entre os efeitos dos tratamentos ou as médias das distribuições das k p opulações são
idênticas
Xni
12 W2 W2 W2
H= [ 1 + 2 +...+ k ] − 3(n + 1)com W i = Rij i = 1, 2, ..., k
n(n + 1) n1 n2 nk j=1
Para k > 3 ou n1 , n2 , ... e/ou ni > 5, a distribuição assintótica de H é a χ2 com k−1 graus de liberdade.
A ’estatística’ a justada é
0 H
H= Pl
j=1qj (qj2 −1)
1− n(n2 −1)
em que l é o número de conjuntos com observações rep etidas existente e qj é o número de elementos nesse conjunto j (j =
0
1, ..., l). A ’estatística’ H tem ainda uma distribuição assintótica χ2k−1 .
6
Planeamento com blocos. Teste de Quade
H 1 : Pelo menos um dos tratamentos tende a conseguir valores observados maiores do que um outro tratamento.
R.R : T > c onde c é um p onto crítico da distribuição F que corresp onde ao nível de significância α,
com (k − 1) e (b − 1)(k − 1) graus de lib erdade
(b − 1)SQT
T =
ST Q − SQT
sendo co p onto crítico da distribuição t-Student, com (b − 1)(k − 1) graus de lib erdade que corresp onde a uma região de
rejeição de tamanho α (nível de significância)
0
S(x) é a função de distribuição empírica que é definida como fracção dos Xi s (elementos da amostra) que são menores
ou iguais a X , para cada X (−∞ < X < +∞)
7
Os p ontos críticos da distribuição de T (T + ou T − ) correspondem a p=1−α
DADOS: Os dados consistem numa amostra aleatória X1 , X2 , ..., Xn de tamanho n associada com alguma função distribuição
desconhecida F (x).
H 0 : A amostra aleatória foi retirada de uma distribuição normal, com média e/ou variância não esp ecificadas.
0
H 1 : A função distribuição dos Xi s não é normal.
R.R: T1 > c sendo c o p onto crítico da distribuição de T1 que corresp onde a p=1−α
v
Pn u n
i=1 Xi
u 1 X
X= e s =t (Xi − X)2
n n − 1 i=1
Xi − X
Zi = , i = 1, 2, ..., n T 1 = supz | F ∗ (z) − S(z) |
s
Teste de Lilliefors para a exponencial
DADOS: Os dados consistem numa amostra aleatória X1 , X2 , ..., Xn de tamanho n associada com alguma função distribuição
desconhecida F (x).
H0 : A amostra aleatória segue a distribuição exp onencial:
½
∗ 1 − e−x/β , para x > 0
F (x) = F (x) =
0 para x < 0
Pn
i=1 Xi Xi
X= Zi= , i = 1, 2, ..., n
n X
½
1 − e−z , para z > 0
F ∗ (z) =
0 para z < 0
DADOS: Os dados consistem em duas amostras aleatórias indep endentes, uma de tamanho n, X1 , X2 , ..., Xn e outra de
tamanho m, Y1 , Y2 , ..., Ym retiradas de duas p opulações com distribuições F (x) e G(y) (ou G(x)) resp ectivamente.
8
com S1 (x) a função empírica baseada na amostra X1 , X2 , ..., Xn e S2 (x) a função empírica baseada em Y1 , Y2 , ..., Ym
+
R.R: T1 (T1 ou T1− ) > c sendo c o p onto crítico da distribuição da estatística que corresp onde a um nível de significância
α.
forem, resp ectivamente, S1 (x), S2 (x), ..., Sk (x), e as funções distribuição F1 (x),
F2 (x), ..., Fk (x) representam as k p opulações, desconhecidas,
Yi ∼ N (α + βxi , σ 2 )
Yi = α + βxi + ei com xi = Xi − X , i = 1, .., n
2
Os estimadores de máxima verosimilhança, para os parâmetros α, β e σ são
Pn Pn Pn
Yi (Xi −X)(Yi −Y ) (Xi −X)Yi
α̃ = i=1 n = Y ; β̃ = i=1 Pn 2
= Pi=1n 2
;
i=1 (Xi −X) i=1 (Xi −X)
Pn
σ̃ 2 = 1
(n−2) i=1 [Yi − α̃ − β̃(Xi − X)]2
Testes de hipóteses
α̃ − α β̃ − β
T1 = q ∼ tn−2 ; T2 = q 2
∼ tn−2
σ̃ 2 P n σ̃ 2
n 1 (Xi −X)
H0 : β = 0
H1 : β > 0 (ou β 6= 0)
R.R: T2 ≥ c com c = tn−2,α (ou α/2)
Do mesmo modo, a ’estatística’ T1 p ode ser usada para calcular intervalos de confiança e testes de hip óteses relacionados com
o parâmetro α
1 (X0 − X)2
var[Y 0 ] = σ 2 ( + Pn )
n i=1 (Xi − X)
2
9
Regressão linear e múltipla
Pn Pn
Yi
α̃ = i=1
n =Y ; σ̃ 2 = 1
(n−3) i=1 (Yi − α̃ − β̃xi − γ̃zi )2
½ Pn P P
xi Yi = β̃ ni=1 x2i + γ̃ ni=1 xi zi
Pi=1
n Pn Pn 2
i=1 zi Yi = β̃ i=1 xi zi + γ̃ i=1 zi
Regressão não-linear
i) E[Yi ] = α + βXi2
2
O modelo matemático geral, é: Yi = α + βwi + γwi + ei com wi = Wi −W e o ei ∼ N (0, σ2 ) (i = 1, ..., n).
2
Define-se X = W e Z = W , o que reduz este caso à regressão múltipla e linear.
Lineariza-se o modelo passando-se a ter: lnYi = lnα + βXi + lnui e aplica-se a análise de regressão linear e simples.
Pn Pn P
Xi ni=1 Yi
i=1 Xi Yi −
i=1
n
R =q P P Pn P
n ( ni=1 Xi )
2 ( ni=1 Yi )
2
( i=1 Xi2 − n )( i=1 Yi2 − n )
10
√
R
√ n−2
A variável T = 1−R2
∼ tn−2 e o teste resume-se a, rejeitar H0 se |T | ≥ c com c determ inado de α = Pr [|T | ≥
c; H0 ] .
• Correlação de Spearman
Pn n+1 n+1
i=1 [R(Xi ) − 2 ][R(Yi ) − 2 ]
RS = n(n2 −1)
12
ou
n
X
6T
RS = 1− com T = [R(X i ) − R(Y i )]2
n(n2 − 1) i=1
caso não existam observações rep etidas. Existindo rep etições deve usar-se a expressão:
Pn
R(Xi )R(Yi ) − n( n+1
i=1 2 )
2
RS = qP qP
n 2 n+1 2 n 2 n+1 2
i=1 R(Xi ) − n( 2 ) . i=1 R(Yi ) − n( 2 )
A. Teste bilateral
H 1 : (a) Existe uma tendência para os maiores valores de X form arem pares com
os m aiores valores de Y , ou
(b) Existe uma tendência para os menores valores de X formarem pares com
os m aiores valores de Y.
α
R.R: RS > c1 ou RS < c2 , sendo c1 o p onto crítico que corresp onde a 1− 2 e
α
c2 o p onto crítico que corresp onde a 2
11