Escolar Documentos
Profissional Documentos
Cultura Documentos
Capitulo9 PDF
Capitulo9 PDF
Correlao Amostral
b) O coeficiente de correlao
um valor numrico, uma medida, para o grau de associao entre duas
variveis.
Se for observada uma associao entre as variveis quantitativas (a partir de um
diagrama de disperso, por exemplo), muito til quantificar essa associabilidade.
1
INF 162 Prof. Luiz Alexandre Peternelli
i =1 n
2 2
n n
X i Yi
SQDY = Yi i =1
n n
SQD X = X i
2 i =1
e 2
i =1 n i =1 n
Para o exemplo:
Amostra A 4 8 3 9 7 5
Amostra B 1 5 2 14 3 11
n n
Ai Bi
i =1 = 252 (36)(36 ) = 36
= Ai Bi i
n
=1
SPD AB
i =1 n 6
2
n
Ai
SQD A = Ai2 i =1 = 244
n
(36)2 = 28
i =1 n 6
2
n
Bi
SQDB = Bi2 i =1 = 356
n
(36)2 = 140
i =1 n 6
2
INF 162 Prof. Luiz Alexandre Peternelli
SPAB 36
rAB = = = 0,5750
SQD A . SQD B (28) (140)
Regresso linear
3
INF 162 Prof. Luiz Alexandre Peternelli
aplicando o somatrio,
n n
e = [Y
i =1
2
i
i =1
i 0 1 X i ]
2
(1)
x y
x y
i i
i i
n SPD xy
1 = = e 0 = Y 1 X
( xi )2 SQDx
x 2
i
n
Uma vez obtidas estas estimativas, podemos escrever a equao estimada:
Yi = 0 + 1 X i
Exemplos:
4
INF 162 Prof. Luiz Alexandre Peternelli
1) Para verificar se existe relao linear de primeiro grau entre umidade relativa
(UR) do ar de secagem de sementes e a germinao das mesmas, um pesquisador
realizou um experimento com 4 valores diferentes para a %UR do ar, obtendo-se
os seguintes dados (dados hipotticos)
% UR 20 30 40 50
% germinao 94 96 95 97
a) Verificar se existe efeito da UR do ar de secagem na % de germinao. Usar =
5%.
b) Qual seria a % de germinao esperada quando UR = 45 %?
c) Como poderia ser apresentada, num relatrio tcnico, a equao de regresso
ajustada para esse exemplo?
R.: a) 0 = 92,7; 1 = 0,08. F = 3,55; t = 1,88. b) 95,5 %
2) Foi realizado uma anlise de regresso para investigar a existncia de ralao
linear simples entre a temperatura superficial de uma estrada (X) medida em graus
F e a deformao da pavimentao (Y) medida segundo uma tcnica especial.
Baseado nas seguintes informaes pede-se:
n = 20; y i = 12,75; y 2
i = 8,86; x i = 1478; x 2
i =143215,8; e x y
i i =
1083,67
a) Calcule as estimativas dos parmetros da regresso. Apresente a equao ajustada
num grfico;
b) Use a equao para estimar qual deformao haveria na pavimentao quando a
temperatura superficial fosse de 85 graus F.
c) Qual seria a mudana esperada na deformao da pavimentao para uma
mudana de 1o F na temperatura superficial?
d) Suponha que a temperatura seja medida em graus C ao invs de graus F. Qual
seria a nova equao ajustada resultante? Lembre-se: C = 5(F 32)/9.
e) Qual seria a mudana esperada na deformao da pavimentao para uma
mudana de 1o C na temperatura superficial?
Exerccio Proposto
Os dados a seguir provm de um experimento para testar o desempenho de
uma mquina industrial. O experimento utilizou uma mistura de leo diesel e gs,
derivados de materiais destilados orgnicos. O valor da capacidade da mquina em
cavalo vapor (HP) foi coletado a diversas velocidades medidas em rotaes por
minuto (rpm 100).
X Y X Y X Y X Y
22,0 64,03 15,0 46,85 18,0 52,90 15,0 45,79
20,0 62,47 17,0 51,17 16,0 48,84 17,0 51,17
18,0 54,94 19,0 58,00 14,0 42,74 19,0 56,65
16,0 48,84 21,0 63,21 12,0 36,63 21,0 62,61
14,0 43,73 22,0 64,03 10,5 32,05 23,0 65,31
12,0 37,48 20,0 62,63 13,0 39,68 24,0 63,89
X = velocidade Y = capacidade
5
INF 162 Prof. Luiz Alexandre Peternelli
COEFICIENTE DE DETERMINAO
6
INF 162 Prof. Luiz Alexandre Peternelli
1 1* 2
a) tcalc = , onde V ( 1 ) =
V ( 1 ) SQDx
SQ Re s SQD y 1 SPD xy
OBS.: 2 = estimativa da varincia dos erros = =
n2 n2
Um caso especial muito importante seria: H0: 1 = 0 versus Ha: 1 0. Essas
hipteses esto relacionadas com a significncia da regresso. No rejeitar H0
equivalente a concluir que no h relao linear entre X e Y. Por outro lado, se H0: 1
= 0 for rejeitado indicaria que X importante para explicar a variabilidade em Y. Veja
ilustraes apresentadas em aula.
De maneira alternativa poderamos testar a significncia da regresso pelo
mtodo da Anlise de Varincia (ANOVA).
O mtodo da ANOVA consiste em fazer uma partio da variabilidade total da
varivel resposta Y em outros componentes de acordo com o modelo e o teste a ser
feito. Assim a seguinte identidade pode ser verificada:
(Y i Y ) 2 = (Yi Y ) 2 + (Yi Y ) 2 ,
ou, em outra palavras,
SQTotal = SQRegresso + SQResduo.
Onde
SQTotal = variao total em Y = SQDY
SQRegresso = variao em Y explicada pela regresso ajustada = 1 SPDXY
de modo que
SQResduo = SQRes = variao no explicada pela regresso = SQDY - 1 SPDXY
Baseado nessa identidade o seguinte quadro pode ser montado:
FV GL SQ QM F
Regresso 1 SQReg QMReg = SQReg QM Re g
QM Re s
Resduo, ou n2 SQRes SQ Re s -
Independente da QMRes =
Regresso n2
Total n2 SQTotal
7
INF 162 Prof. Luiz Alexandre Peternelli
em que:
- p = no de coeficientes de regresso (no inclui o 0 )
- n = no de observaes.
i =1 n
SQIndependente da Regresso = SQTotal - SQRegresso
8
INF 162 Prof. Luiz Alexandre Peternelli
2
n
n n n
Y
i =1 i
SQ Re gresso = 0 Yi + 1 Yi X i + 2 Yi X i
" " " 2
i =1 i =1 i =1 n
Exerccios Propostos:
1) (questo de prova do II/2000) Para estudar a relao entre Y (nmero total de horas
necessrias montagem da parte de uma estrutura) e X (nmero total de operaes
de furar e rebitar), registraram-se os dados da tabela abaixo.
estudo A B C D E F G H I
X 236 80 127 445 180 343 305 488 170
Y 5,1 1,7 3,3 6,0 2,9 5,9 7,0 9,4 4,8
Para facilitar seus clculos considere as seguintes informaes:
xi = 2374; yi = 46,1; xi2 = 786368; yi2 = 279,41; xi yi = 14512,6
i i i i i
tambm, SPDxy = 2352,4444; SQDx = 160159,5556
Pede-se:
a) Obter a equao de regresso ajustada para o modelo Yi = 0 + 1xi + i
R.: Y = 1,271 + 0,0146X
b) Interpretar as estimativas obtidas dos parmetros da regresso.
c) Calcular o coeficiente de determinao para o modelo ajustado. Faa a
interpretao apropriada para esse resultado. R.: 79,9%
d) A anlise de varincia (ANOVA) da regresso pode ser resumida no seguinte
quadro
9
INF 162 Prof. Luiz Alexandre Peternelli
F.V. g.l. SQ QM F
Regresso 1 34,59 34,59
Resduo 7 8,68 1,24
Total 8 43,27
Uma maneira de verificar a significncia da regresso ajustada por meio da
ANOVA apresentada acima. Apresente a hiptese a ser testada pela ANOVA e
realize o teste apropriado (use = 5%) para testar essa hiptese.
e) Se fosse concludo que podemos considerar 1 = 0, como deveria ser reescrito o
modelo ajustado? Justifique.
10
INF 162 Prof. Luiz Alexandre Peternelli
n n n
Yi = n + X + X 2
0 1 i 2 i
i =1 i =1 i =1
n n n n
i i =
0 +
1 +
2 Xi
2 3
Y X X i X i
i =1 i =1 i =1 i =1
n n n n
i i =
0 +
1 +
2 Xi
2 2 3 4
Y X X i X i
i =1 i =1 i =1 i =1
11