Você está na página 1de 2

Aula 7: Estatística

Correlação e Regressão: Parte 2


A análise de regressão tem por objetivo descrever, através de um modelo
matemático, a relação entre duas variáveis, partindo de n observações das
mesmas.
Variável dependente (Y): variavel sobre a qual desejamos fazer uma
estimativa. Obs: A outra variável é chamada de variável independente (X).
Na regressão linear o modelo matemático seria do tipo:

Y = aX + b

onde, dizemos que a é o coeficiente de regressão o qual representa a variação


de Y em função de uma unidade da variável X e b é a constante de regressão
a qual representa o intercepto da reta com o eixo dos Y .
Vamos denotar por e o erro que está associado à distância entre o valor
observado Y e o correspondente ponto na reta para o mesmo nível de X. Ou
seja,

e = Y − ax − b

elevando ambos os membros da equação ao quadrado, obtemos:

e2 = (Y − ax − b)2

aplicando o somatório:
P P
e2 = (Y − ax − b)2

Por meio da obtenção de valores de a e b, que minimizem o valor obtido na


expressão acima, é possível obter a minimização da soma de quadrados dos
erros. Para encontrar o mínimo para essa expressão temos que derivar em
relação a a e b e igualar a zero, obtendo assim um sistema com duas equações
que nos fornecerá a solução desejada:
P P P
n xi yi − xi yi
a= P P e b = y − ax.
n x2i − ( xi )2

Uma vez obtidas estas estimativas, podemos escrever a equação estimada:

aX + bb
Yb = b
Se uma estimativa X for tal que X1 ≤ X ≤ Xn dizemos que a estimativa
é uma interpolação, caso contrário, chamamos de extrapolação.

Você também pode gostar