Escolar Documentos
Profissional Documentos
Cultura Documentos
ei = yi - ! y !i
i
! Sujeita as restries
onde
= 6.8,
= 2.32,
! Para y = a+b log(x), tome o log de x antes dos parmetros de fitting, seja b = b1, a = b0
Alocando a Variao
! Sem regresso, a melhor estimativa de y ! Valores observados de y diferem de aumentando os erros (variao) ! Regresso prov uma melhor estimativa, mas ainda existem erros ! Ns podemos avaliar a qualidade da regresso pela alocao das fontes de erros.
Notao
! SSE Sum of Squared Errors ! SST Total Sum of Squares
! SSY Sum of Squares of ! SS0 Sum of Squares of ! SSR Sum of Squares explained by Regression
! Assim a regresso explica SSR = SST - SSE ! Qualidade da regresso medida pelo coeficiente de determinao:
!y = 11.60, !y2 = 29.79, !xy = 88.54, ! SSE = 29.79-(0.35)(11.60)-(0.29)(88.54) = 0.05 ! SST = 29.79-26.9 = 2.89 ! SSR = 2.89-.05 = 2.84 ! R2 = (2.89-0.05)/2.89 = 0.98
Apresentacao derivada dos slides originais de Virgilio Almeida
! Intervalos de confiana so bi
sbi
! b 1
0.29 2.353(0.004) = (0.28,0.30)
ymp
m"#
Testando a Linearidade
! Grficos de pontos x vs. y para ver o tipo bsico da curva
Linear
Outlier/Exceco
"i
yi
Apresentacao derivada dos slides originais de Virgilio Almeida
Testando a Independncia
Testando a Independncia
! Pode ser til plotar os resduos de erro versus o nmero do experimento ! No exemplo anterior d o mesmo grfico, exceto para a escala de x
Testando a Independncia
III
IV
Exemplo
! The number of disk I/O's and processor times of seven programs were measured as: (14, 2), (16, 5), (27, 7), (42, 9), (39, 10), (50, 13), (83, 20) ! For this data: n=7, ! xy=3375, ! x=271, ! x2=13,855, ! ! y=66, ! y2=828, = 38.71, = 9.43. Therefore,
...
Apresentacao derivada dos slides originais de Virgilio Almeida
...
Dados amostrais
Esquema
A B C D E F G H
#Ataques Durao
5 13 20 28 41 49 61 62 118 132 119 153 91 118 132 105
ndice
8.1 6.8 7.0 7.4 7.7 7.5 7.6 8.0
Aritmtica Matricial
! Precisa-se calcular X, XT, XTX, (XTX)-1 e Xty ! Por qu? ! Para obter b = (8.373, .005, -.009 ) ! Indicando que a regresso prediz: indice = 8.373 + 0.005*#ataques 0.009*durao
Apresentacao derivada dos slides originais de Virgilio Almeida
Matriz X do Exemplo
Matriz Transposta XT
ou
Graus de liberdade: n -3 (3 parametros) ! Vamos calcular o desvio padro dos parmetros da regresso
Apresentacao derivada dos slides originais de Virgilio Almeida
b0 = 8.37 (2.015)(1.29) = (5.77, 10.97) b1 = .005 (2.015)(.01) = (-.02, .02) b2 = -.009 (2.015)(.008) = (-.03, .01)
! Somente b0 significativo, neste nvel
Anlise da Varincia
! Podemos ento dizer que realmente nenhuma das variveis previsoras significativa? ! O teste F pode ser usado para essa finalidade ! Por exemplo, para determinar se o SSR significativamente maior que o SSE ! Equivalente a testar se y no depende de qualquer das variveis previsoras
Executando o F-Teste
! Calcule SSR e SSE e seus graus de liberdade: ! SSR tem k graus de liberdade ! SST tem n-1 graus de liberdade ! Logo: SSE tem n-(k+1) graus de liberdade (k+1 parametros) ! Calcule o quadrado das mdias da regresso (MSR) e dos erros (MSE) ! MSR = SSR/DOF(SSR) ! MSE = SSE/DOF(SSE) ! MSR/MSE tem uma distribuio F ! Se MSR/MSE > F-tabela, os previsores explicam uma frao significativa da variao da resposta ! Em outras palavras: SSR e significativamente maior que SSE ! OU: y depende de pelo menos uma variavel previsora ! Vide Tabela 15.3 do Jain: Tabela ANOVA
Apresentacao derivada dos slides originais de Virgilio Almeida
O F-Teste do Exemplo
! ! ! ! ! ! ! SSR = .33 SSE = 1.08 MSR = SSR/k = .33/2 = .16 MSE = SSE/(n-k-1) = 1.08/(8 - 2 - 1) = .22 F-calculado = MSR/MSE = .76 F[90; 2,5] = 3.78 (em 90%) Assim o teste F falha em 90%
Multipla colinearidade
! Se dois previsores so linearmente dependentes, eles so co-lineares ! Significa que so relacionados ! E assim uma segunda varivel no melhora a regresso ! Pode inclusive piorar a regresso. ! Sintoma tpico so resultados inconsistentes em vrios testes de significncia. ! F-teste da que SSR e significativamente maior que SSE ! Mas ICs para coeficientes incluem 0
Apresentacao derivada dos slides originais de Virgilio Almeida
Calculo da Correlacao
Olhe os grficos!
8.5
Indice
7.5
6.5
140
160
Olhe os grficos!
9 8.5 8
ndice
7.5 7 6.5 6
20
40
60
80
#Ataques
Apresentacao derivada dos slides originais de Virgilio Almeida
Exemplo
Sete programas foram monitorados quanto as suas demandas por recursos, particularmente, o numero de operacoes de I/Os (disco), o consumo de memoria (em KB) e o tempo de CPU (em ms). Os dados sao mostrados a seguir
Tempo de CPU yi 2 Disk I/Os x1i 14 Tamanho da Memoria x2i 70 5 16 75 7 9 27 42 144 190 10 13 39 50 210 235 20 83 400
Encontre um modelo linear para estimar o tempo de CPU em funcao dos outros dois recursos
Apresentacao derivada dos slides originais de Virgilio Almeida
Exemplo
CPU time = b0 + b1 (# disk I/Os) + b2 (tamanho da mem)
Exemplo
CPU time = b0 + b1 (# disk I/Os) + b2 (tamanho da mem)
Exemplo
CPU time = b0 + b1 (# disk I/Os) + b2 (tamanho da mem)
A equacao de regressao: Cpu time = -0.1614 + 0.1182(# disk I/Os) + 0.0276(tam. Mem)
Apresentacao derivada dos slides originais de Virgilio Almeida
Exemplo
Vamos fazer a analise de variancia (ANOVA) da regressao: Calculo das previsoes, erros e erros quadrados
yi x1i x2i 2 14 70 3.3490 ei 5 16 75 3.7180 7 27 144 9 42 190 10 39 210 13 50 235 20 83 400 20.2529 -0.2529 0.0639
6.8472 9.8400 10.0151 11.9783 0.1528 -0.8400 -0.0151 0.0233 0.7053 0.0002 1.0217 1.0439
(ei)2 1.8198
Exemplo
Calculo dos SS*
Exemplo
Calculo do desvio padrao dos erros e dos coeficientes
Exemplo
Calculo dos CI de 90%: 95% da variavel t com 4 graus de liberdade t0.95,4 = 2.132
Exemplo
Realizando o teste F: SSE = 5.3 Graus de liberdade do SSE = n-(k+1) = n-3 = 4 MSE = SSE/n-(k+1) = 5.3/4 = 1.33 SSR = 200.41 Graus de liberdade do SSR = k = 2 MSR = 200.41/2 = 100.205 MSR / MSE = 75.40 Tabela F: 4.32 Ja que MSR/MSE > F -> regressao passou o teste F Isto significa que a hipotese de que todos parametros sao 0 nao pode ser aceita. Inconsistencia???
Apresentacao derivada dos slides originais de Virgilio Almeida
Exemplo
Vamos calcular a correlacao entre as variaveis previsoras (numeros de I/Os e tamanho de memoria)
Exemplo
! Alta correlacao: multicolineariedade prejudica a regressao. ! Precisa refazer regressao somente com # de I/Os e, separadamente, com tamanho de memoria, e escolher melhor previsor (isto e, aquele que resulta no maior R2) ! Neste caso e regressao linear simples
Argus:
Data bytes 92 92 92 92 348 604 860 1074 1074 1088 1088 1088 1088 Tempo 32.8 34.2 32.4 34.4 41.4 51.2 76.0 80.8 79.8 58.6 57.6 59.8 57.4
Qual o custo de processamento por byte para os dois sistemas? E o custo de setup?
Apresentacao derivada dos slides originais de Virgilio Almeida
y = b0 + b1x1 + b2x2 ! y = tempo de processamento da RPC ! x1= numero de bytes ! x2= 1 se sistema e Unix, e 0 se sistema e Argus
! Resultado da Regressao: Parametro Media Desvio Padrao b0 36.739 3.251 b1 0.025 0.004 b2 -14.927 3.165 R2 = 0.765 IC (31.1676,42.3104) (0.0192, 0.0313) (-20.3509,-9.5024)
Custo por byte em ambos sistemas e 0.025 milisegundos Custo de setup e 36.73 ms no ARGUS e (36.739 14.927) no UNIX Premissa da solucao: custo per byte independe do sistema operacional. E se isto nao for verdade? Apresentacao derivada dos slides originais de Virgilio Almeida
Regresso Curvilinear
! Regresso linear assume relaes lineares entre variveis previsoras e a resposta. ! O que acontece quando essas relaes no so lineares? ! Coeficientes de determinao R2 pobres ! necessrio encontrar outro tipo de funo para a relao entre previsores e resposta.
x' = 1 x y' = 1 y
" ln y = ln a + x ln b " y = a + b( x )
Apresentacao derivada dos slides originais de Virgilio Almeida
Transformaes
! O termo transformao usado quando uma funo da varivel de resposta medida usada no lugar da prpria varivel. ! Usar alguma funo da varivel resposta y (w = h(y)) em lugar do prprio y. ! Regresso curvilinear um exemplo dessa transformao.
Quando transformar?
1.! Quando as propriedades fsicas conhecidas do sistema medido sugerem que a funo da resposta, ao invs da prpria resposta, uma varivel melhor para o modelo. Exemplo: mediu-se tempos entre chegadas mas sabe-se que relacao linear e valida para taxa de chegadas.
2.
Quando o intervalo dos dados medidos cobre vrias ordens de grandeza e a amostra e pequena. Deve-se buscar uma transformacao que reduza a variabilidade. Exemplo:
3.
Quando a hiptese de uma varincia homognea dos resduos violada (i.e. Homoscedasticity).
Apresentacao derivada dos slides originais de Virgilio Almeida
Outliers
! Medidas observadas em experimentos tipicamente contem outliers (i.e., valores muito fora do corpo da curva) ! Medidas que no so uma caracterstica verdadeira do sistema. ! Erros podem ter ocorrido no processo experimental de medio. ! Comportamentos atpicos de usurios do sistema podem existir (ex: um nerd que joga um game 15 horas consecutivas, quando se est analisando tempos de conexo a um provedor de servios) ! Isso resulta no seguinte problema: ! Devemos ou no incluir os outliers nas anlises que estamos fazendo?
No verificao da linearidade
! Desenhe o grfico de pontos ! Se no for linear, verifique as possibilidades curvilineares e suas transformaes. ! O uso de uma regresso linear quando as relaes entre resposta e previsores no so lineares um ERRO!
! Sempre verifique o grfico de pontos, como parte das anlises usando regresses. ! Examine a linha de regresso prevista versus os pontos reais obtidos pelo experimento. ! Isso particularmente importante no caso de uso de pacotes que fazem regresses automaticamente.
Exemplo
! Tempo de CPU em segundos = 0.01*(# oper. E/S) + 0.001*(tamanho da memria em Mbytes) ! Tempo de CPU em milisegundos = 10*(# oper. E/S) + 1*(tamanho da memria em Mbytes) ! Valores absolutos dos parmetros podem ser enganadores!
! A forma correta de comparar a significncia de um parmetro da regresso atravs de seu intervalo de confiana.
! Sem o clculo de R2, difcil determinar quanto da variao explicada pela regresso.
! O acrscimo de mais variveis previsoras no necessariamente melhora a qualidade do modelo. ! Pode-se criar problemas como o de multi-colinearidade ! Quais variveis devem ento ser usadas? ! o que estamos tentando aprender neste curso
Exemplo 2
! A Lei de Amdahl para operacoes de I/Os em sistemas de computacao diz que a taxa de I/O e proporcional a velocidade do processador. Para cada instrucao executada, ha um bit de I/O em media. Para validar a lei, os numeros de I/Os e as utilizacoes de CPU de um numero de computadores foram medidos. Usando a taxa MIPS nominal para o sistema e a sua utilizacao, a taxa de processamento de instrucoes (em MIPS) e a taxa de I/O (em KB/s) foram computados para um periodo. Os dados foram mostrados abaixo. Voce consegue validar/refutar a Lei de Amdahl com os dados abaixo?
Sistema MIPS Usado Taxa de I/O 1 2 3 4 5 6 7 19.63 5.45 2.63 8.24 14 9.87 11.27 288.6 117.3 64.6 356.4 373.2 281.1 149.6 8 10.13 120.6 9 1.01 31.1 10 1.26 23.7
Exemplo 2
! Vamos assumir, por hora, o seguinte modelo curvilinear: I/O rate = % (MIPS rate)b log(I/O rate) = log % + b log(MIPS rate) Os parametros b0 = log % e b1 = b podem ser estimados via regressao linear simples Parametro b0 b1 Media 1.423 0.888 Desvio Padrao 0.119 0.135 CI 90% (1.20, 1.64) (0.64,1.14)
R2 = 0.84 -> boa regressao Os dois coeficientes sao significativos com a confianca de 90%. Alem disto, como o CI para b1 contem 1, podemos aceitar a hipotese de que o relacionamento entre I/O rate e MIPS rate e linear.
Apresentacao derivada dos slides originais de Virgilio Almeida
Exemplo 3
Os resultados de uma regressao linear multipla baseada em nove observacoes estao mostrados na tabela abaixo. Baseado nestes resultados responda as perguntas a seguir. j 1 2 3 4 bj 1.3 2.7 0.5 5.0 sbj 3.6 1.8 0.6 0.3 Ponto de Intersecao = 75.3 Coeficiente de correlacao multipla = 0.95 Desvio padrao dos erros = 12.0
Exemplo 3
Qual porcentagem da variacao e explicada pela regressao?
Desvio padrao dos erros se = sqrt (SSE/n-k-1) SSE = (n-k-1)* (se)2 = (9 5)*12*12 = 576 R2 = SSR / SST = SSR / (SSR + SSE) SSR/(SSR + 576) = 0.9025 & SSR = 519.84/0.0975 = 5331.69 MSR = SSR/k = 5331.69/4 = 1332.92 MSE = SSE/(n-k-1) = 576/4 = 144 MSR/MSE = 9.256 F-value (0.9,4,4) = 4.11 & sim, a regressao e significativa
Apresentacao derivada dos slides originais de Virgilio Almeida
Exemplo 3
Quais parametros sao significativos com uma confianca de 90%? Calcular IC : bj t*sbj 0.95 quantil da variavel t com n-k-1 (= 4) graus de liberdade = 2.132 CI para b1 = 1.3 2.132*3.6 = (-6.38, 8.98) : nao e significativo pois inclui zero. CI para b2 = 2.7 2.132*1.8 = (-1.14, 6.54) : nao e significativo CI para b3 = 0.5 2.132*0.6 = (-0.78, 1.7792) : nao e significativo CI para b4 = 5.0 2.132*8.3 = (-12.70,22.70): nao e significativo Nenhum parametro e significativo com confianca de 90%
Exemplo 3
Qual o problema com a regressao e qual seria o seu proximo passo? Pode ser um problema de multicolinearidade. Testar correlacao entre varios pares de previsores. Dentre os pares que tiverem alta correlacao, testar a regressao com cada previsor separadamente e escolher aquele que resulta no melhor R2