Você está na página 1de 16

UNIVERSIDADE ESTADUAL DE SANTA CRUZ DEPARTAMENTO DE CINCIAS EXATAS E TECNOLGICAS ENGENHARIA DE PRODUO

3 CRDITO: ANLISE DE CORRELAO E REGRESSO LINEAR SIMPLES

Relatrio solicitado pelo professor Srgio de Oliveira, apresentado por Milena Santos e Railane Oliveira (Eng-12), referente ao 3 crdito da disciplina de Probabilidade e Estatstica.

ILHUS-BA NOVEMBRO 2013


1

SUMRIO
Introduo .......................................................................................................................................... 3 Metodologia ....................................................................................................................................... 4 Resultados e discusses ..................................................................................................................... 4 Concluso ........................................................................................................................................ 14 Referncias ..................................................................................................................................... 15 Anexo I ............................................................................................................................................ 16

INTRODUO

O presente relatrio utiliza de tcnicas de Correlao e Regresso Linear simples, mtodos comumente utilizados na estatstica, com o intuito de estudar o comportamento de variveis quantitativas distintas, ou seja, medir o grau de associao entre variveis aleatrias e criar a modelagem de testes. Ser possvel verificar atravs da representao grfica o comportamento dos valores de X em relao a Y criando um modelo matemtico que melhor represente suas variaes, uma vez que estas sofrem diversas influncias. Tambm ser estabelecido o coeficiente de correlao de Pearson que um valor numrico para o grau de associao entre duas variveis. O caso analisado se refere a um conjunto de testes, com o objetivo de verificar a correlao na modelagem existente entre prottipos experimentais de veculos (X) (em milhares de Kg) em funo do rendimento do combustvel em rodovia (Y), onde foram testados 14 prottipos de veculos experimentais. Para fazer o estudo estatstico das variaes envolvidas nestes testes, ser feito um modelo de regresso que venha criar relaes entre variveis, mostrando o efeito que alteraes em uma venham causar nas outras. Neste caso ela mostra a relao que um aumento no peso dos prottipos experimentais de veculos vai influenciar no rendimento do combustvel dele quando em rodovia. Essa relao ser expressa em um diagrama de disperso, podendo analisar ento os pares de valores envolvidos, determinando o padro do relacionamento, sendo ele linear se a nuvem plotada estabelecer um comportamento linear, quando houver um aumento dos valores de Y (rendimento) essa relao ser direta e ser inversa quando esses valores variarem inversamente em funo de X (prottipos). Esses modelos, contudo apresentam erros ou desvios, que podem ocorrer pelo fato dessas variveis sofrerem influncias no s entre elas, da necessrio modelar essa regresso e determinar uma reta que corresponda a menor distncia possvel entre cada ponto do diagrama. A reta que se obtm de regresso apenas uma aproximao da relao real, existindo uma medida que indica o quanto til aquela aproximao quanto a realidade, essa medida o coeficiente de determinao que indica a proporo de variao total da varivel dependente Y que explicada pela variao em X. Existe ainda o coeficiente de correlao, que a raiz quadrada do coeficiente de determinao, porm ele analisa a fora da relao entre as variveis padronizando dentro dos horizontes acima as variaes de covarincia.

METODOLOGIA

Foram realizadas medidas do teste feito com prottipos de veculos experimentais (em milhares de Kg) e do rendimento de combustvel em rodovia, dado em 10 km por litro, sendo14 medidas para cada varivel. A varivel independe X referente aos prottipos experimentais de veculos e a varivel Y ao rendimento de combustvel em rodovia. A partir dos dados coletados, ser possvel quantificar a relao entre as duas variveis.

RESULTADOS E DISCUSSES:

De acordo com as metodologias utilizadas para obteno das medidas, construmos uma tabela de operaes, necessrio para o desenvolvimento dos clculos seguintes.

Tabela 1: Operaes n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 X 0,40 0,72 0,54 0,98 0,74 0,48 0,77 1,53 0,80 1,58 0,95 0,73 0,44 1,29 11,95 0,85357143 Y 0,9191 0,7425 0,5785 1,0493 0,7925 0,5047 0,8092 1,6072 0,8731 1,7233 1,0221 0,7518 0,9678 1,2118 13,5529 0,96806428 X2 0,16 0,5184 0,2916 0,9604 0,5476 0,2304 0,5929 2,3409 0,64 2,4964 0,9025 0,5329 0,1936 1,6641 12,0717 Y2 0,84474481 0,55130625 0,33466225 1,10103049 0,62805625 0,25472209 0,65480464 2,58309184 0,76230361 2,96976289 1,04468841 0,56520324 0,93663684 1,46845924 14,69947285 X.Y 0,36764 0,5346 0,31239 1,028314 0,58645 0,242256 0,623084 2,459016 0,69848 2,722814 0,970995 0,548814 0,425832 1,563222 13,083907 -

CORRELAO LINEAR SIMPLES

Para avaliar a relao existente entre duas variveis quantitativas, usa-se a correlao linear simples. A partir dos dados obtidos, calculamos a covarincia que refere-se variabilidade mdia
4

das variveis X e Y. Tambm chamada como medida de dependncia linear entre as duas variveis aleatrias, onde X a varivel independente e Y a varivel dependente. Deste modo,

CORRELAO LINEAR DE PEARSON

O clculo da covarincia pode assumir diversos valores entre - e + , o que torna difcil a sua interpretao. Por isso mais conveniente usar para medida de correlao, o coeficiente de correlao linear de Pearson, como estimador do parmetro. Pois ele mede o grau da correlao (e a direo dessa correlao - se positiva ou negativa) entre duas variveis, ou seja, a intensidade da associao linear existente entre as variveis. Geometricamente, ele corresponde a uma linha reta que representando a relao linear descreve o grupo de pontos no grfico de disperso. Para medir o grau de correlao, iremos calcular o valor de r e t para comparao com os dados tabulados: ( ) [ ( ) ][ ( ) ] ( )

][

Teste de Hiptese para r: {

Sendo assim, segundo a classificao proposta por Santos-2007, apresentada na tabela 2 do ANEXO I, a correlao considerada forte positiva, pois 0,8 r < 1. Isso significa que os prottipos experimentais de veculos tem uma intensa associao linear com o rendimento do combustvel em rodovia. Neste caso, para testar a correlao aplicamos o teste t:

Sendo que para essa quantidade de dados os valores tabulados dado por:
5% 1%

r12=0,53 r12=0,66

5% 1%

t12=2,1788 t12=3,0545

Portanto, observamos que o valor de t calculado maior do que o tabelado, rejeitando a hiptese de nulidade. Ento, para se obter a medida de variao de Y em funo de X, calculamos o coeficiente de determinao (r2). Neste caso, r2 = (0,8815)2 = 0,777 = 77,7%. Sendo assim, o rendimento do combustvel em rodovia (Y) varia 77,7% em relao aos prottipos de veculos experimentais (X). Portanto para visualizar a correlao entre as duas variveis utilizou o diagrama de disperso. Sendo estas plotadas de acordo com as coordenadas X e Y. Os pontos do uma ideia da existncia de correlao entre as variveis. Segue abaixo, o diagrama 1, que mostra a disperso dos dados:

Diagrama 1: Disperso
2 Redimento do Combustvel (Y) 1.8 1.6 1.4 1.2 1 0.8 0.6 0.4 0.2 0 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 Prottipos de veculos experimentais (X)

CORRELAO LINEAR FORMA MATRICIAL

Os clculos referente a anlise de correlao linear podem ser realizados a partir da forma matricial.

](

](

) (

,(

) (

)-

Coeficiente de correlao:
7

*,(

) (

)- +

REGRESSO LINEAR SIMPLES

Utiliza-se a regresso linear simples, para descrever de oura forma o relacionamento entre as duas variveis. Atravs da equao matemtica linear, que possvel externar valores de uma varivel com base nos valores da outra. Para isso foi necessrio calcular os coeficientes linear (0) e coeficiente angular (1), utilizando o mtodo dos mnimos quadrados que determina a linha de regresso que se ajusta a uma srie de pontos. Estimativas dos parmetros da equao de regresso: | | | | ( ) ( ) ( ( ) )

| |

| | ( ( ) )

Sendo assim, a equao para estimar os valores de y dado por:

A partir desta equao calculamos as estimativas (), tambm chamados de erros:

Tabela 3: Determinao das estimativas

X 0,40 0,72 0,54 0,98 0,74 0,48 0,77 1,53 0,80 1,58 0,95 0,73 0,44 1,29

Equao = 0,2768+0,8098*0,40 = 0,2768+0,8098*0,72 = 0,2768+0,8098*0,54 = 0,2768+0,8098*0,98 = 0,2768+0,8098*0,74 = 0,2768+0,8098*0,48 = 0,2768+0,8098*0,77 = 0,2768+0,8098*1,53 = 0,2768+0,8098*0.80 = 0,2768+0,8098*1,58 = 0,2768+0,8098*0,95 = 0,2768+0,8098*0,73 = 0,2768+0,8098*0,44 = 0,2768+0,8098*1,29

0,60072 0,859856 0,714092 1,070404 0,876052 0,665504 0,900346 1,515794 0,92464 1,556284 1,04611 0,867954 0,633112 1,321442

Portanto com base nestes dados, construmos o grfico 1 que representa o modelo de regresso:

Grfico 1: Regresso Linear


2 1.8 Redimento do Combustvel (Y) 1.6 1.4 1.2 1 0.8 0.6 0.4 0.2 0 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 Prottipos de veculos experimentais (X)

y = 0.8098x + 0.2769 R = 0.777

O erro padro da estimativa dado por:

ANLISE DE VARIANCIA (ANOVA)

SOMA DE QUADRADOS TOTAIS (S.Q.T.): ( ) ( )

SOMA DE QUADRADOS DA REGRESSO (S.Q.Reg.): ( ( ) ) . ( ) /

SOMA DE QUADRADOS DOS RESDUOS (S.Q.R.): ( )

QUADRADO MDIO DA REGRESSO:

QUADRADO MDIO DO RESDUO (Q.M.R.):

CLCULO DE F OBSERVADO:

Tabela da ANOVA GL SQ 1 1,2273 Regresso 12 0,3521 Resduo 13 1,5794 Total 5% F(1,12)=4,75 1%F(1,12)=9,33

QM 1,2273 0,0293

F 41,82

F de Significao 0,000031

10

Sendo o valor de F calculado de 41,82, significa que o quadrado mdio devido regresso (Q.M.Reg.) 41,82 vezes maior que a varincia devido a fatores alheios regresso, conhecido como resduo ou desvios da regresso (Q.M.R.). Clculo de R2 e R2ajustado:

TESTE DE HIPTESES

Este teste necessrio para verificao da nulidade do intercepto e do coeficiente de regresso do ajuste do modelo (betas). Dados necessrios para serem aplicados nos clculos estatsticos: n=14; S = (Q.M.R.)0,5 = 0,1712; SX2 = 12,0717; SQX = 1,8715; 0 = 0,2768; 1 = 0.8098; t5%;12 = 2,1788. {

INTERVALOS DE CONFIANA

Os intervalos de confiana indicam a confiabilidade da estimativa descrevendo o quanto so confiveis os resultados de uma pesquisa.
11

| |

REGRESSO LINEAR-FORMA MATRICIAL

](

](

12

]
( )

]
( )

]
( )

Matrizes das varincias e covarincias: ( ) [ ( ( ) ) ( ( ) ) ]

Teste do coeficiente linear intercepto (forma alternativa) ( )

13

CONCLUSO

14

REFERNCIAS

MONTGOMERY, Douglas C; RUNGER, George C. Estatstica aplicada e probabilidade para engenheiros. 2ed.Rio de Janeiro: LTC, 2003 Correlao Linear Simples. Disponvel em: http://w3.ufsm.br/adriano/aulas/coreg/Aula%2001%20Correla%E7ao%20Linear.pd f Acessado em 07/11/2013 Correlao e Regresso Linear. Disponvel em: http://www.eecis.udel.edu/~portnoi/classroom/prob_estatistica/2006_2/lecture_slides/ aula20.pdf Acessado em 07/11/2013 Anlise de Regresso Linear Simples. Disponvel em: < http://www.inf.ufsc.br/~ogliari/cursoderegressao.html> Acessado em 07/11/2013

15

ANEXO I

Tabela 2: Classificao de Correlao linear segundo SANTOS, 2007.

Coeficiente de Correlao r=1 0,8 r < 1 0,5 r < 0,8 0,1 r < 0,5 0 r < 0,1 r=0 -0,1 r < 0 -0,5 r < -0,1 -0,8 r < -0,5 -1 r < -0,8 r=-1

Correlao Perfeita Positiva Forte Positiva Moderada Positiva Fraca Positiva Interna Positiva Nula Interna Negativa Fraca Negativa Moderada Negativa Forte Negativa Perfeita Negativa

RESUMO DE RESULTADOS

Estatstica de regresso R-Quadrado R-Quadrado Ajustado Erro Padro Observaes 0,7770 0,7585 0,1713 14

ANOVA GL Regresso Resduo Total 1 12 13 SQ 1,2273 0,3521 1,5794 QM 1,2273 0,0293 F 41,8236 F de Significao 0,000031

Coeficientes Interseo X 0,2769 0,8098

Erro Padro 0,1163 0,1252

Stat t 2,3810 6,4671

Valor-P 0,0347 0,000031

95% Inferiores 0,0235 0,5370

95% Superiores 0,5302 1,0826

Inferior 95,0% 0,0235 0,5370

Superior 95% 0,5302 1,0826

16

Você também pode gostar