Você está na página 1de 2

UNIUBE – UNIVERSIDADE DE UBERABA Professora Me Fabíola Eugênio Arrabaça Moraes

Conceito de Reta de Regressão Linear Simples A ideia de construir um modelo de regressão linear é
escrever uma equação linear, uma reta, que represente a associação entre duas variáveis. O objetivo
principal é predizer o valor de uma variável conhecendo-se a outra, utilizando a equação de reta que foi
construída. A equação de regressão linear é:
y =  0 + 1 x .

Os parâmetros do modelo são 0 e  1 . Se tivéssemos toda a população estes valores seriam conhecidos.
Mas em inferência, sempre temos que estimá-los a partir de uma amostra. Assim o modelo de regressão
ajustado é dado por:
yˆ = b0 + b1 x

Sendo que b0 e b1 são os estimadores dos parâmetros  0 e  1 respectivamente. Em estudos mais


avançados você aprenderá como estimar esses parâmetros.

Em uma equação de regressão temos dois tipos de variáveis:

• Explicativa (também conhecida por preditora, ou independente ou regressor): é a variável x do modelo


— é aquela que se conhece e é facilmente medida.

• Resposta (chamada variável dependente, ou explicada ou regressanda): é a variável y do modelo — é a


que se deseja predizer.

Importante! Quando fazemos um modelo de regressão linear precisamos avaliar ou supor que algumas
hipóteses são verdadeiras, e sempre que possível verificar tais suposições, que são:
• estamos trabalhando apenas com relações lineares, ou seja, as variáveis explicativa e resposta, estão
associadas linearmente;
• o modelo de regressão suposto é: y =  0 + 1 .x + , sendo  os erros aleatórios do modelo.

• os erros () em um modelo de regressão são normalmente distribuídos com a média zero e a variância
constante, denotada por  , sendo a mesma variância da variável resposta. Também são independentes,
2

não correlacionados entre si.


• a variável resposta y é uma variável aleatória;
• para cada valor de x , a variável resposta y segue uma distribuição normal, sendo que todas as
distribuições de y possuem a mesma variância ( ). Além disso, dado um valor de
2
x , a média dos
valores de y está sobre a reta de regressão.

Estimação dos parâmetros 0 e 1


Vimos que os estimadores a serem utilizados são b0 e b1 . Mas qual é a melhor escolha destes valores?
Existem vários critérios de estimação destes parâmetros. O mais conhecido e utilizado em todas as áreas de
pesquisa é o método dos mínimos quadrados. Possui este nome porque é o método que minimiza a soma
dos quadrados dos desvios entre os valores observados e estimados da variável resposta para os dados
amostrais.

Os estimadores de mínimos quadrados são dados por:

b1 =
 x y − nx y
i i

 x − n ( x)
2
2
i

b0 = y − b1 x

Estatística Inferencial 1
UNIUBE – UNIVERSIDADE DE UBERABA Professora Me Fabíola Eugênio Arrabaça Moraes

Exemplo (Aplicação do Conceito de Reta de Regressão Linear Simples) Uma montadora de


automóveis está interessada em verificar se existe associação entre as variáveis peso (Kg) de uma
determinada peça e o preço (R$) da peça. Denotaremos por x o peso da peça e por y o seu preço. Os
dados coletados foram os seguintes:

x 30 21 35 42 37 20 8 17 35 25 15 12
y 430 335 500 490 470 210 195 270 420 480 285 243

Referencial (desenvolvimento detalhado dos cálculos)

Vamos ajustar uma equação linear para os dados do Exemplo, relativo ao preço como função do peso da
peça.

Com o auxílio da tabela, obtemos os somatórios x y i i = 119646 ; x i = 297 ; y i = 4328 ; n = 12 ;

x 2
i = 8671 . Substituindo-os na fórmula de b1 , temos:

119646 − 12 ( 24, 75 )( 360, 66 ) 12528


b1 = = = 9, 49
8671 − 12 ( 297 )
2
1320, 25

Para determinar o valor de b0 precisamos dos valores médios de y e x .

Sabendo-se que y=
y e y=
 y , a tabela nos fornece  y = 4328 ; x = 297 e n = 12 . Logo
i i
n n
4328 297
y= = 360, 66 e x = = 24, 75 .
12 12

297
Substituindo os valores y = 360, 66 e x= = 24, 75 na fórmula de b0 , encontramos
12
b0 = 360,66 − 9,49.24,75 = 125,81  126 .

Logo, a reta de regressão ajustada é:

yˆ = 126 + 9,49.x

Para uma observação de x i , assumindo o valor 23 Kg teríamos uma estimativa para ŷ i estimado de

yˆi = 126 + 9, 49.(23) = R$ 344, 27 .

Estatística Inferencial 2

Você também pode gostar