Escolar Documentos
Profissional Documentos
Cultura Documentos
CORRELAO E REGRESSO
CUIAB MT JULHO/2011
1. INTRODUO A regresso e a correlao so duas tcnicas estreitamente relacionadas que envolvem uma forma de estimao. A anlise de correlao e regresso compreende a anlise de dados amostrais para saber se e como duas ou mais variveis esto relacionadas uma com a outra em um determinado universo de dados. A regresso linear simples constitui uma tentativa de estabelecer uma equao matemtica linear que descreva o relacionamento entre duas variveis. A anlise de correlao fornece um nmero que resume o grau de relacionamento entre duas variveis. J a anlise de regresso resulta numa equao matemtica que descreve esse relacionamento, apontando suas caractersticas preliminares de correlao positiva (relao direta) ou negativa (relao inversa). Essa mesma equao pode ser usada para se predizer valores futuros de uma varivel quando se tem valores de outra varivel. H diversas maneiras em que as equaes de regresso so utilizadas, como em situaes em que as variveis medem aproximadamente a mesma coisa. Por exemplo, a resistncia e a dureza de um metal podem ser relacionadas de modo que, conhecendo-lhe a dureza, podemos estimar-lhe a resistncia. Mas se o teste de resistncia destri o metal, enquanto que o teste de dureza no o destri, um pesquisador interessado em estimar a resistncia preferir confiar nos resultados do teste de dureza. A finalidade da equao de regresso, portanto, estimar valores de uma varivel com base em valores conhecidos de outra. Aps diversos clculos verifica-se o grau de dependncia das variveis. Nesse trabalho ser usado um exemplo para uma breve amostra desses clculos.
2. EXEMPLO CALCULADO Deseja-se verificar se possvel prever a altura de uma determinada espcie de rvore conhecendo o dimetro do tronco medido a 2 metros do solo. Os dados esto apresentados na tabela a seguir:
14 12 10 8 6 4 2 0 0 2 4 6 Dimetro
Figura 1 - Grfico de disperso
Altura
Linear (Series1)
10
12
Visualmente o grfico apresenta correlao positiva (Relao direta), ou seja apresenta r > 0.
Observao 1 2 3 4 5 6 7 Total ( (
)( ) (
) ) ( )( )
Aps o calculo verifica-se que o valor da correlao igual a r = 0,962. Precisa-se testar a hiptese se este valor diferente de zero.
H0 : = 0 H1 : 0
Como |tc| > t/2 rejeita-se H0 ao nvel de 5% de significncia. Logo a correlao diferente de zero e igual 0,962. Com o diagrama de disperso e pelo coeficiente de correlao, verifica-se que existe uma relao entre as variveis X e Y. Pode-se determinar essa relao por uma funo que a seguinte: Y = a + bX + a o coeficiente linear, interpretado como o valor da varivel de dependente quando a varivel independente igual a 0. b o coeficiente de regresso, interpretado como acrscimo na varivel dependente para a variao de uma unidade na varivel. so os erros aleatrios de uma populao normal, com mdia 0 e varincia constante . Para determinao dos coeficientes fez-se os seguintes clculos: ( ( )( ) )
Y = 3,878 + 0,7665X
GL 1 n-2 n-1 ( ) ( ( (
Fc QM Regresso/QM Erro
)( )
))
QM Regresso = SQ Regresso
GL 1 5 6
QM 35,636 0,574
Fc 62,084
F 6,608
H0 : a = 0 ou b = 0 H1 : a 0 e b 0 O teste de hiptese tem a funo de verificar se o modelo de regresso significativo. Primeiro adota-se um nvel de significncia , depois se obtm o valor tabelado f, que tem a notao F(1;5;5%). Rejeita-se a hiptese H0 se Fc > F. Como Fc > F, rejeita-se H0, logo o modelo regresso linear significativo. Obtendo r2
Verifica-se que conhecendo o dimetro de uma determinada espcie de rvore medindo a 2 m do solo explica-se 92,54% a variao de altura dessa espcie.
3. CONCLUSO A anlise de regresso e correlao tem como objetivo estudar a relao entre duas variveis quantitativas. A correlao mede o grau de relacionamento, j a regresso ajusta uma equao a esse conjunto de dados de forma que essa relao possa ser expressa matematicamente. Aps isso se faz um teste de hiptese para avaliar se o modelo de regresso significativo.