Você está na página 1de 4

1

Universidade Estadual da Paraba


DE- Departamento de Estatstica
Professora: Nyedja Fialho M. Barbosa

Anlise De Regresso E Correlao


A anlise de regresso uma tcnica estatstica utilizada para explicar o comportamento de uma
varivel em funo de outras variveis, desde que as variveis sejam dependentes.
Para saber que tipo de associao existe entre X e Y, necessrio encontrar um modelo matemtico
que explique, se existir, a dependncia de Y em relao a X.
Y e X podem estar relacionadas de forma linear, polinomial, exponencial, logartmica, etc. Uma
forma simples de se avaliar o tipo de relao (ou associao) entre as duas variveis atravs do grfico de
disperso bivariado entre Y e X.
Estando as variveis relacionadas de forma linear, para se obter os valores estimados dos parmetros,
basta resolver o sistema de equaes lineares, que possui soluo nica pois os coeficientes so combinaes
lineares das observaes. J no modelo no linear, os parmetros entram na equao de forma no linear,
no podendo ser resolvido da mesma forma.

Modelo matemtico:

O objetivo da anlise de regresso linear encontrar a reta que melhor explique a dependncia dos
dados, para poder assim, estimar previses para o comportamento da varivel Y em decorrer dos
acontecimentos da varivel X. Para isto necessrio estimar os parmetros do modelo.
Matematicamente, o modelo linear ser apresentado da seguinte forma:



onde

representa cada observao da varivel explicativa X;

representa o coeficiente linear da reta , ou


seja, o ponto inicial para a varivel Y, quando X=0;

representa o coeficiente angular da reta, ou seja, o


grau de inclinao da reta, que define o quanto aumenta ou diminui o valor de Y em relao a X;

o erro
associado a cada observao em relao reta de regresso linear.

Para que este modelo possa ser admitido, preciso que algumas hipteses sejam verificadas:
i. Existe relao linear entre X e Y;
ii. X no uma varivel aleatria;
iii.




Diagrama de disperso:
2

Ao se plotar num grfico cartesiano os pares de informao referentes a cada observao obtemos
uma nuvem de pontos definidos pelas coordenadas x e y de cada ponto. Essa nuvem, por sua vez, definir
um eixo ou direo que caracterizar o padro de relacionamento entre X e Y.
A regresso ser linear se for observada uma tendncia ou eixo linear na nuvem de pontos
cartesianos. A relao entre as variveis ser direta (ou positiva) quando os valores de Y aumentarem em
decorrncia da elevao dos valores de X. Ser inversa (ou negativa) quando os valores de Y variarem
inversamente em relao aos de X. A figura 1 mostra o diagrama de disperso referente s variveis X e Y.
O diagrama mostra uma relao direta entre as variveis, ou seja: o crescimento de Y est
diretamente ligado ao crescimento de X.


Exemplo:

1. Para verificar se o peso das mulheres depende da altura foi selecionada uma amostra de 10 pessoas.
Construa um grfico de disperso para verificar se h indcios de regresso linear entre as variveis,
com base nos dados da Tabela 1.

Tabela 1: Peso e altura das mulheres.
Amostra 1 2 3 4 5 6 7 8 9 10
Peso (kg) 54 45 58 60 62 70 65 43 56 59
Altura (m) 1,58 1,59 1,60 1,60 1,65 1,70 1,70 1,58 1,63 1,64



Pelo grfico vemos que X e Y esto diretamente correlacionadas. Mas no basta o grfico de
disperso, precisamos continuar a anlise.

Estimao de parmetros:
Para encontrar a reta que melhor represente a relao entre X e Y, deve-se estimar os valores

.
No sero apresentadas as demonstraes de obteno destes estimadores, apenas sero mostrados os
resultados.

1,56
1,58
1,6
1,62
1,64
1,66
1,68
1,7
1,72
0 10 20 30 40 50 60 70 80
A
l
t
u
r
a

Peso
Grfico de disperso
3

A reta de regresso estimada de acordo com a expresso abaixo:



onde





Exemplo:

2. Ainda com base na Tabela 1, estime a reta de regresso.

Calculando os parmetros, temos:




E assim, temos a reta de regresso que explica a relao entre as variveis e ainda nos permite fazer
previses para o possvel valor de Y atravs de um certo X.

Decomposio das somas dos quadrados:

A partir dos valores observados na amostra, possvel definir as seguintes somas de quadrados:

Somas dos quadrados totais (SQtot):

4



Soma dos quadrados de regresso (SQreg):



Soma dos quadrados do resduo (SQres):




Coeficiente de determinao e coeficiente de correlao:

O coeficiente de determinao, ou explicao,

uma medida que explica o grau de associao


entre as variveis, sendo seu valor calculado a partir da equao abaixo:



onde

.

Quanto mais prximo de zero for o valor do coeficiente de determinao, menor ser a evidncia de
dependncia linear entre X e Y, e quanto mais prximo for de um, mais forte ser a evidncia de
dependncia entre as variveis.

O coeficiente de correlao, por sua vez, dado por:



onde .

Esta medida nos diz se a relao entre as variveis direta ou inversa, e nada mais do que a raiz
quadrada do coeficiente de determinao.

Exemplo:

3. Com base nos dados da Tabela 1, calcular o coeficiente de determinao:



Ou seja, 88,88% da variao total de Y explicado pelo modelo de regresso.

Você também pode gostar