Regressão Linear - 2023

REGRESSÃO LINEAR SIMPLES
Prof. Dr. Orlando Yesid Esparza Albarracín

Modelo estatístico de regressão linear simples:
𝑦𝑖 = b0 + b1𝑥𝑖 + e𝑖, 𝑖 = 1, … , 𝑛
em que, 𝛽! e 𝛽" são coeficientes (usualmente chamados de

parâmetros) desconhecidos (e que se pretende estimar com base
nos dados) e e𝑖 são erros aleatórios que representam desvios entre
as observações da variável aleatória e os valores esperados pelo
modelo.
Um dos objetivos da análise de regressão é prever os valores de uma variável

resposta (ou dependente) em função de variáveis independentes (ou explicativas),
denominadas regressoras.
Antes de utilizar um modelo de
regressão linear, é importante
avaliar a relação linear entre as
variáveis de interesse. Para isso, é
possível empregar gráficos de
dispersão.
Podemos mensurar a relação linear entre duas variáveis por meio do coeficiente de correlação 𝜌. Ele varia entre -1 e 1.
Coeficiente de correlação linear
É uma medida que avalia o quanto a “nuvem de pontos”
no diagrama de dispersão aproxima-se de uma reta.
• 𝜌 = 1 → correlação linear positiva e perfeita.

• 𝜌 = −1 → correlação linear negativa e perfeita.
• 𝜌 = 0 → inexistência de correlação linear.
Observação: A inexistência de correlação linear entre

duas variáveis não significa que não há relação entre
elas. Somente significa que não há relação linear entre
elas.
𝑦𝑖 = b0 + b1𝑥𝑖 + e𝑖, 𝑖 = 1, … , 𝑛
Os parâmetros b0 e b1 podem ser estimados o método de mínimos quadrados, (ou OLS

do inglês Ordinary Least Squares)
% %
𝑄 𝛽! , 𝛽" = * e&# = *(𝑦𝑖 − b0 − b1𝑥𝑖)

#$" #$"
Derivando 𝑄 𝛽0 , 𝛽1 em relação a 𝛽! e 𝛽" utilizando a regra da cadeia e então igualando a zero

podemos encontrar os valores de 𝛽! e 𝛽" que minimizam 𝑄 𝛽! , 𝛽" , isto é, a soma do quadrados
dos resíduos.
𝑦𝑖 = b0 + b1𝑥𝑖 + e𝑖, 𝑖 = 1, … , 𝑛
𝑆"#
Os estimadores de b0 e b1 são: 𝛽!! = ; 𝛽!0 = 𝑦̄ − 𝛽!1 𝑥,̄ em que
𝑆""
∑%#$" 𝑥# ∑%#$" 𝑦# % % %
∑%#$" 𝑥# 𝑦#− % %
∑#$" 𝑥# ∑#$" 𝑦# 1 1
𝑆)) = 𝑛 ; 𝑆 = - 𝑥 𝑦 − ; 𝑥̅ = - 𝑥# ; 𝑦
0 = - 𝑦#
% & )* # #
𝑛 𝑛 𝑛
∑ 𝑥 #$" #$" #$"
∑%#$" 𝑥#& − #$" #
𝑛
Exemplo (MONTGOMERY; RUGER, 6. ed., p. 334):
A seguir apresenta-se a pureza do oxigênio produzido em um processo químico de destilação, em função
da percentagem de hidrocarbonetos presentes no condensador principal da unidade de destilação
Observação Hidrocarboneto Pureza
1 0,99 90,01 Gráfico de dispersão
2 1,02 89,05
3 1,15 91,43
4 1,29 93,74
5 1,46 96,73
6 1,36 94,45
7 0,87 87,59
8 1,23 91,77
9 1,55 99,42
10 1,40 93,65
11 1,19 93,54
12 1,15 92,52
13 0,98 90,56
14 1,01 89,54
15 1,11 89,85
16 1,20 90,39
17 1,26 93,25
18 1,32 93,41
19 1,43 94,98 Note que podemos assumir que há uma relação linear entre a
20 0,95 87,33 pureza e os hidrocarbonetos
Ajustar uma reta para explicar a pureza do oxigênio em função da percentagem de hidrocarbonetos
𝑌𝑖 = 𝛽! 0 + 𝛽! 1𝑋𝑖 , Obs. Xi Yi Xi2 Yi2 Xi Yi
1 0,99 90,01 0,9801 8101,8001 89,1099
2 1,02 89,05 1,0404 7929,9025 90,8310
3 1,15 91,43 1,3225 8359,4449 105,1445
Estimando 𝛽" 4 1,29 93,74 1,6641 8787,1876 120,9246
5 1,46 96,73 2,1316 9356,6929 141,2258
6 1,36 94,45 1,8496 8920,8025 128,4520
𝑆)* 10,1774 7 0,87 87,59 0,7569 7672,0081 76,2033
𝛽1 1 = = = 14,9475, em que 8 1,23 91,77 1,5129 8421,7329 112,8771
𝑆)) 0,6809 9 1,55 99,42 2,4025 9884,3364 154,1010
10 1,40 93,65 1,96 8770,3225 131,1100
( 11 1,19 93,54 1,4161 8749,7316 111,3126
∑(%&' 𝑥% ∑(%&' 𝑦% (23,92)(1843,21) 12 1,15 92,52 1,3225 8559,9504 106,3980
𝑺𝒙𝒚 = - 𝑥% 𝑦% − = 2214,6566 − 13 0,98 90,56 0,9604 8201,1136 88,7488
𝑛 20 14 1,01 89,54 1,0201 8017,4116 90,4354
%&' 15 1,11 89,85 1,2321 8073,0225 99,7335
= 10,1774 16 1,20 90,39 1,44 8170,3521 108,4680
17 1,26 93,25 1,5876 8695,5625 117,4950
18 1,32 93,41 1,7424 8725,4281 123,3012
19 1,43 94,98 2,0449 9021,2004 135,8214
( ( )
∑ %&' 𝑥% 23,92) 20 0,95 87,33 0,9025 7626,5289 82,9635
𝑺𝒙𝒙 = - 𝑥%) − = 29,2892 − = 0,6809 Total 23,92 1843,21 29,2892 170044,5321 2214,6566
𝑛 20
%&'
𝑌𝑖 = 𝛽! 0 + 𝛽! 1𝑋𝑖 , Obs. Xi Yi Xi2 Yi2 Xi Yi
1 0,99 90,01 0,9801 8101,8001 89,1099
2 1,02 89,05 1,0404 7929,9025 90,8310
3 1,15 91,43 1,3225 8359,4449 105,1445
Estimando 𝛽! 4 1,29 93,74 1,6641 8787,1876 120,9246
5 1,46 96,73 2,1316 9356,6929 141,2258
6 1,36 94,45 1,8496 8920,8025 128,4520
𝛽1 0 = 𝑦̄ − 𝛽1 1𝑥̄ = 74,2833, em que

7 0,87 87,59 0,7569 7672,0081 76,2033
8 1,23 91,77 1,5129 8421,7329 112,8771
9 1,55 99,42 2,4025 9884,3364 154,1010
10 1,40 93,65 1,96 8770,3225 131,1100
11 1,19 93,54 1,4161 8749,7316 111,3126
12 1,15 92,52 1,3225 8559,9504 106,3980
1843,21
𝑦( = = 92,1605; 𝛽3 1 = 14,9475; 13 0,98 90,56 0,9604 8201,1136 88,7488
20 14 1,01 89,54 1,0201 8017,4116 90,4354
15 1,11 89,85 1,2321 8073,0225 99,7335
23,92 16 1,20 90,39 1,44 8170,3521 108,4680
𝑥̅ = = 1,196 17 1,26 93,25 1,5876 8695,5625 117,4950
20 18 1,32 93,41 1,7424 8725,4281 123,3012
19 1,43 94,98 2,0449 9021,2004 135,8214
20 0,95 87,33 0,9025 7626,5289 82,9635
Total 23,92 1843,21 29,2892 170044,5321 2214,6566
A equação de regressão é:
𝑦 = 74,2833 + 14,9475 𝑥
O coeficiente angular em uma regressão linear pode

ser interpretado como a mudança média na variável
dependente para uma unidade de mudança na
variável independente. No exemplo, significa que
para cada aumento de 1% nos hidrocarbonetos, a
pureza do oxigênio produzido no processo químico
de destilação aumenta, em média, 14,9475
unidades.
O coeficiente de correlação é dado por:
𝑦𝑖 = b0 + b1𝑥𝑖 + e𝑖,
Suposições
1) 𝑋𝑖 não é variável aleatória

2) Os erros (𝜀𝑖 ) são não correlacionados e seguem uma distribuição Normal com
média zero e variância s2 (constante), isto é, e𝑖 ~𝑁(0, 𝜎 2 ) independentes
Na prática, os resíduos, para um certo valor de 𝑋𝑖 são calculados como:

e𝑖 = 𝑦𝑖 − (𝛽6 0 + 𝛽6 1𝑋𝑖 )
Continuação. Usando a reta estimada para explicar a pureza do oxigênio em função da percentagem
de hidrocarbonetos, calcular os resíduos para as primeiras duas observações
Observação Hidrocarboneto Pureza A equação de regressão é:

1 0,99 90,01
2
3
1,02
1,15
89,05
91,43
𝑦 = 74,2833 + 14,9475 𝑥
4 1,29 93,74
5 1,46 96,73
6 1,36 94,45
Vamos calcular os valores esperados de Pureza quando o
7 0,87 87,59 hidrocarboneto for de 0,99 e 1,02 (valores registrados para as duas
8 1,23 91,77 primeiras observações)
9 1,55 99,42
10 1,40 93,65 𝑦"" = 74,2833 + 14,9475 0,99 = 89,0813
11 1,19 93,54
12 1,15 92,52
13 0,98 90,56 𝑦"# = 74,2833 + 14,9475 1,02 = 89,5299
14 1,01 89,54
15 1,11 89,85
16 1,20 90,39 Assim, os resíduos são dados por:
17 1,26 93,25
18 1,32 93,41 e" = 90,01 − 89,0813 = 0,9287
19 1,43 94,98
20 0,95 87,33
e# = 89,05 − 89,5299 = −0,4799
Análise de resíduos
i. Normalidade dos resíduos: pela regra do “lápis
grosso”, é possível cobrir todos os pontos no gráfico
de Probabilidade, logo é razoável supor que os
resíduos seguem aproximadamente uma
distribuição normal.
ii. Variância constante (mesma variância)
Justificado pelo gráfico dos resíduos em função dos
valores ajustados. Verifica-se uma dispersão
aproximadamente constante varia entre -2 e 2.
Observa-se uma simetria aproximada dos resíduos
em relação à média zero.
iii. Independência
Pelo gráfico dos resíduos em função da ordem das
observações nota-se que os resíduos parecem se
distribuir de forma aleatória, não se observa um
padrão.
Continuação. Usando a reta para explicar a pureza do oxigênio em função da percentagem de
hidrocarbonetos, estimar a pureza esperado quando o nível de hidrocarboreto for igual a 1%.
A equação de regressão é:
𝑦 = 74,2833 + 14,9475 𝑥
Assim, a pureza esperada quando 𝑥 = 1, é
= 74,2833 + 14,9575 × 1
= 89,2308
Tal estimativa pode ser feita pelo fato do valor de 𝑥 estar dentro do intervalo usado para construir a
reta de regressão. CUIDADO COM EXTRAPOLAÇÕES! O modelo pode não mais ser válido
Testes de hipóteses
Objetivo: verificar se há variável 𝑋 contribui para explicar 𝑌 de uma forma linear.
𝐻0: 𝛽1 = 0 (Não existe reta de regressão)
𝐻1: 𝛽1 ≠ 0 (Existe reta de regressão)
Anova:
Fonte de Graus de
Soma de Quadrados (SQ) Quadrado médio (QM) F
variação liberdade
𝑆𝑄$ 𝑄𝑀$
Regressão 1 𝑆𝑄$ = 𝛽% 𝑆&' 𝑄𝑀$ = 𝐹=
1 𝑄𝑀(
𝑆𝑄( = 𝑆𝑄) − 𝑆𝑄$ 𝑆𝑄(

Erro 𝑛– 2 𝑄𝑀( =
𝑛−2
'
∑'%&" 𝑦% #
Total 𝑛– 1 𝑆𝑄$ = 3 𝑦%# −

𝑛
%&"
Quanto maior for o valor de 𝐹𝑜𝑏𝑠 , maiores as evidências contra 𝐻0 . Rejeita-se H0 Se 𝐹𝑜𝑏𝑠 > 𝐹𝑐 ,
em que 𝐹𝑐 é calculado da distribuição F-Snedecor tal que 𝑃 𝐹 > 𝐹𝑐 = 𝛼
Voltando ao exemplo de pureza do oxigênio em função de hidrocarbonetos. Vamos testar
𝐻0: 𝛽1 = 0 (Não existe reta de regressão)
𝐻1: 𝛽1 ≠ 0 (Existe reta de regressão)
Fonte de Graus de Soma de Quadrado

F F_crítico Valor-p
variação liberdade Quadrados (SQ) médio (QM)
Regressão 1 152,1271 152,1271
Erro 18 21,2498 1,1805 128,8617 4,4139 1,23E-09
Total 19 173,3769
Como 𝐹-./ = 128,8617 > 4,4139 ao nível de significância de 5%, rejeita-se H0 e conclui-se
que a regressão é significante, isto é o hidrocarboneto está influenciando linearmente a pureza.
Coeficiente de determinação
𝑆𝑄$ 152,1271
*
𝑅 = = = 0,8774 (o modelo explica 87,74% da variabilidade total)
𝑆𝑄) 173,3769
Contas do ANOVA
Fonte de Graus de Soma de Quadrado
F_crítico Valor-p
variação liberdade Quadrados (SQ) médio (QM) F
Regressão 1 152,1271 152,1271
Erro 18 21,2498 1,1805 128,8617 4,4139 1,23E-09
Total 19 173,3769
Obs. Xi Yi Xi2 Yi2 Xi Yi
1 0,99 90,01 0,9801 8101,8001 89,1099
Dados: 𝛽1 1 = 14,9475; 𝑺𝒙𝒚 = 10,1774 2
3
1,02
1,15
89,05
91,43
1,0404 7929,9025
1,3225 8359,4449
90,8310
105,1445
4 1,29 93,74 1,6641 8787,1876 120,9246
5 1,46 96,73 2,1316 9356,6929 141,2258
𝑆𝑄0 = 𝛽" 𝑆)* = 14,9475 10,1774 = 152,1271 6

7
1,36
0,87
94,45
87,59
1,8496 8920,8025
0,7569 7672,0081
128,4520
76,2033
8 1,23 91,77 1,5129 8421,7329 112,8771
( ( )
9 1,55 99,42 2,4025 9884,3364 154,1010
)
∑ %&' 𝑦% 1843,21* 10 1,40 93,65 1,96 8770,3225 131,1100
𝑆𝑄/ = - 𝑦% − = 170044,5321 − 11 1,19 93,54 1,4161 8749,7316 111,3126
𝑛 20 12 1,15 92,52 1,3225 8559,9504 106,3980
%&' 13 0,98 90,56 0,9604 8201,1136 88,7488
= 173,37695 14 1,01 89,54 1,0201 8017,4116 90,4354
15 1,11 89,85 1,2321 8073,0225 99,7335
16 1,20 90,39 1,44 8170,3521 108,4680
F_crítico: Procurar na Tabela F (5%) considerando 1 grau de liberdade 17 1,26 93,25 1,5876 8695,5625 117,4950
no numerador e 18 no denominador. Ou no Excel =INV.F.CD(0,05;1;18) 18 1,32 93,41 1,7424 8725,4281 123,3012
19 1,43 94,98 2,0449 9021,2004 135,8214
Valor-p: Excel = DIST.F.CD(F;1;18) 20 0,95 87,33 0,9025 7626,5289 82,9635
Total 23,92 1843,21 29,2892 170044,5321 2214,6566
Teste de hipótese para o intercepto
(1) Hipóteses estatísticas:

𝐻0 ∶ 𝛽! = 𝛽!,! 𝐻0 ∶ 𝛽! = 𝛽!,! 𝐻0 ∶ 𝛽! = 𝛽!,!
𝐻1 ∶ 𝛽! ≠ 𝛽!,! 𝐻1 ∶ 𝛽! > 𝛽!,! 𝐻1 ∶ 𝛽! < 𝛽!,!
(2) Determinar o nível de significância (a ).
(3) Calcular a Região crítica:

𝑅𝐶 = 𝑇 𝑇 < −𝑡+,*;./* 𝑜𝑢 T > t +,*;./* } 𝑅𝐶 = 𝑇 𝑇 > 𝑡+,*;. } 𝑅𝐶 = 𝑇 𝑇 < −𝑡+,*;. }
= - INV.T(alpha;n-2)
(4) Calcula-se o 𝑇-./ 𝛽7) − 𝛽),)
𝑇=
1 𝑥̄ #
𝑄𝑀( 𝑛 + 𝑆
++
(5) Decisão
𝑠𝑒 𝑇𝑜𝑏𝑠 ∈ 𝑅𝐶 → Rejeita-se 𝐻0, caso contrário dizemos que não há evidencias suficientes para Rejeitar 𝐻𝑜
Teste de hipótese para o coeficiente angular (inclinação)
(1) Hipóteses estatísticas:

𝐻0 ∶ 𝛽" = 𝛽",! 𝐻0 ∶ 𝛽" = 𝛽",! 𝐻0 ∶ 𝛽" = 𝛽",!
𝐻1 ∶ 𝛽" ≠ 𝛽",! 𝐻1 ∶ 𝛽" > 𝛽",! 𝐻1 ∶ 𝛽" < 𝛽",!
(3) Calcular a Região crítica:

𝑅𝐶 = 𝑇 𝑇 < −𝑡+,*;./* 𝑜𝑢 T > t +,*;./* } 𝑅𝐶 = 𝑇 𝑇 > 𝑡+,*;. } 𝑅𝐶 = 𝑇 𝑇 < −𝑡+,*;. }
(4) Calcula-se o 𝑇-./ 𝛽3% − 𝛽%,1

𝑇=
𝑄𝑀(
𝑆&&
(5) Decisão
Voltando ao exemplo de pureza do oxigênio em função de hidrocarbonetos testar, ao nível de
significância de 5%, se o coeficiente angular é igual a zero.
(1) Hipóteses estatísticas: 𝐻0: 𝛽1 = 0

𝐻1: 𝛽1 ≠ 0
(2) Nível de significância 𝛼 = 5% Dados: 𝑛 = 20
(3) Região crítica: 𝑅. 𝐶 = {𝑇 < −𝑡+,*;./* 𝑜𝑢 T > t +,*;./* } → 𝑅𝐶 = 𝑇 𝑇 ≤ – 𝑡%5;*,6% 𝑜𝑢 𝑇 ≥ 𝑡%5;*,6% }
= 𝑇 𝑇 ≤ – 2,101 𝑜𝑢 𝑇 ≥ 2,101}
4. Estatística de Teste Note que 2,1012 = 4,4139 = Fcr da ANOVA
Dados: 𝑄𝑀𝐸 = 1,1805; n=20; 𝑆𝑥𝑥 = 0,6809; 𝛽3% = 14,9475
𝛽3% − 𝛽%,1 14,9475 − 0

𝑇= = = 11,3517
𝑄𝑀𝐸 1,1805 (Note que 11,35172 = 128,8617 = Fobs da ANOVA)
𝑆𝑥𝑥 0,6809
Como 𝑇𝑜𝑏𝑠 = 11,3517 ∈ 𝑅𝐶., logo ao nível se significância de 5%, rejeita-se H0 e conclui-se que a
regressão é significante.
Teste de hipótese para o coeficiente de correlação (𝜌)
(1) Hipóteses estatísticas: 𝐻0: 𝜌 = 𝜌!

𝐻1: 𝜌 ≠ 𝜌!
(3) Calcular a Região crítica: 𝑅𝐶 = 𝑇 𝑇 < −𝑡%4&;6/& 𝑜𝑢 T > t %4&;6/& }
(4) Calcula-se o 𝑇-./ 𝑟− 𝑛−2

𝑇=
1 − 𝑟&
(5) Decisão
Voltando ao exemplo de pureza do oxigênio em função de hidrocarbonetos Testar, ao nível de
significância de 5%, se a correlação entre pureza do oxigênio e a porcentagem de
hidrocarboneto é igual a zero ou não.
(1) Hipóteses estatísticas: 𝐻0: 𝜌 = 𝜌!

𝐻1: 𝜌 ≠ 𝜌!
(2) Nível de significância 𝛼 = 5%
(3) Região crítica: 𝑅𝐶 = 𝑇 𝑇 ≤ – 𝑡%5;*,6% 𝑜𝑢 𝑇 ≥ 𝑡%5;*,6% } = 𝑇 𝑇 ≤ – 2,101 𝑜𝑢 𝑇 ≥ 2,101}
(4) Calcula-se o 𝑇-./

0,9367 − 20 − 2
Dados: 𝑟 = 0,9367 e 𝑛 = 20 𝑇= = 11,3517
1− 0,9367&
como 𝑇𝑜𝑏𝑠 ∈ 𝑅𝐶, então rejeita-se 𝐻0 , a correlação entre pureza do oxigênio e a porcentagem de
hidrocarboneto é diferente de zero
Intervalos de confiança
Para a construção dos testes de hipóteses precisamos conhecer as distribuições de 𝛽10 e 𝛽11
Pode-se verificar que, ambos estimadores seguem uma distribuição normal
𝜎 2 ∑𝑛𝑖=1 𝑋𝑖 2 𝜎2
𝛽10 ~𝑁 𝛽0 , 𝛽1" ~𝑁 𝛽1 ,
𝑛 ∑𝑛𝑖=1(𝑋𝑖 − 𝑋)2 ∑𝑛𝑖=1(𝑋𝑖 − 𝑋)2
Variância Variância
Note que 𝜎 2 é desconhecido, porém pode ser estimado por meio de QME. Assim, usaremos a
distribuição t-student nos testes de hipóteses e intervalos de confiança.
Intercepto 𝛽) Efeito da variável 𝑋
1 𝑥̄ * 𝜎S *
𝐼𝐶 𝛽31 = 𝛽31 ± 𝑡+,* 𝜎S * + 𝐼𝐶 𝛽3% = 𝛽3% ± 𝑡+,*
𝑛 𝑆&& 𝑆&&
em que 𝜎S 2 = 𝑄𝑀𝐸
Voltando ao exemplo de pureza do oxigênio em função de hidrocarbonetos. Construir um intervalo

com 95% de confiança para o intercepto β0:
Dados:
𝛽10 = 74,2833; 𝜎\ 2 = 𝑄𝑀𝐸 = 1,1805; n=20; 𝑥̅ = 1,196; 𝑆𝑥𝑥 = 0,6809; 𝑡"= = 2,101 (Tabela t-student)
1 𝑥̄ # 1 1,196#
𝐼𝐶 𝛽) = 𝛽7) ± 𝑡'-# 𝜎" # + = 74,2833 ± 2,101 1,1805 + = 74,2833 ± 3,3478
𝑛 𝑆++ 20 0,6809
= 70,9356; 77,6311
Média de 𝑦 dado um valor de 𝑋 = 𝑥1 Novo valor de 𝑌 = 𝑦1 |𝑥1
̄ #
1 (𝑥) − 𝑥) ̄ #
1 (𝑥) − 𝑥)
𝐼𝐶 𝜇.|+! = 𝑦40 ± 𝑡'-# 𝜎4 # + 𝐼𝐶 𝑦) 𝑥) = 𝑦40 ± 𝑡'-# 𝜎4 # 1+ +
𝑛 𝑆++ 𝑛 𝑆++
em que 𝜎S 2 = 𝑄𝑀𝐸 ; 𝑦S; = 𝛽31 + 𝛽3% 𝑥1
Voltando ao exemplo de pureza do oxigênio em função de hidrocarbonetos. Construir um intervalo

com 95% de confiança para estimar a pureza com um nível de hidrocarboreto igual a 1% (valor que
não foi usado como variável x):
Dados:
𝑦\0 = 89,2308; 𝜎\ 2 = 𝑄𝑀𝐸 = 1,1805; n=20; 𝑥̅ = 1,196; 𝑥! = 1; 𝑆𝑥𝑥 = 0,6809; 𝑡"= = 2,101 (t-student)
=INV.T.BC((1-0,95);n-2)
̄ #
1 (𝑥) − 𝑥) 1 (1−1,196)#
𝑦4) ± 𝑡'-# 𝜎4 # 1+ + = 89,2308 ± 2,101 1,1805 1 + + = 89,2308 ± 2,4011
𝑛 𝑆++ 20 0,6809
= [86,830; 91,632]
Note que os intervalos de confiança para a média (IC de 95%) são mais estreitos quando comparados
com os intervalos para as previsões de valores individuais (IP de 95%).
Análise de regressão para o caso de dados com repetição

Regressão Linear - 2023

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Regressão Linear - 2023

Enviado por

Direitos autorais:

Formatos disponíveis

REGRESSÃO LINEAR SIMPLES

Prof. Dr. Orlando Yesid Esparza Albarracín

em que, 𝛽! e 𝛽" são coeficientes (usualmente chamados de

Um dos objetivos da análise de regressão é prever os valores de uma variável

• 𝜌 = 1 → correlação linear positiva e perfeita.

Observação: A inexistência de correlação linear entre

Os parâmetros b0 e b1 podem ser estimados o método de mínimos quadrados, (ou OLS

𝑄 𝛽! , 𝛽" = * e&# = *(𝑦𝑖 − b0 − b1𝑥𝑖)

Derivando 𝑄 𝛽0 , 𝛽1 em relação a 𝛽! e 𝛽" utilizando a regra da cadeia e então igualando a zero

𝛽1 0 = 𝑦̄ − 𝛽1 1𝑥̄ = 74,2833, em que

O coeficiente angular em uma regressão linear pode

1) 𝑋𝑖 não é variável aleatória

Na prática, os resíduos, para um certo valor de 𝑋𝑖 são calculados como:

Observação Hidrocarboneto Pureza A equação de regressão é:

Assim, a pureza esperada quando 𝑥 = 1, é

𝐻0: 𝛽1 = 0 (Não existe reta de regressão)

𝐻1: 𝛽1 ≠ 0 (Existe reta de regressão)

𝑆𝑄( = 𝑆𝑄) − 𝑆𝑄$ 𝑆𝑄(

Total 𝑛– 1 𝑆𝑄$ = 3 𝑦%# −

Fonte de Graus de Soma de Quadrado

𝑆𝑄0 = 𝛽" 𝑆)* = 14,9475 10,1774 = 152,1271 6

(1) Hipóteses estatísticas:

(2) Determinar o nível de significância (a ).

(3) Calcular a Região crítica:

(1) Hipóteses estatísticas:

(2) Determinar o nível de significância (a ).

(3) Calcular a Região crítica:

(4) Calcula-se o 𝑇-./ 𝛽3% − 𝛽%,1

(1) Hipóteses estatísticas: 𝐻0: 𝛽1 = 0

Dados: 𝑄𝑀𝐸 = 1,1805; n=20; 𝑆𝑥𝑥 = 0,6809; 𝛽3% = 14,9475

𝛽3% − 𝛽%,1 14,9475 − 0

(1) Hipóteses estatísticas: 𝐻0: 𝜌 = 𝜌!

(2) Determinar o nível de significância (a ).

(3) Calcular a Região crítica: 𝑅𝐶 = 𝑇 𝑇 < −𝑡%4&;6/& 𝑜𝑢 T > t %4&;6/& }

(4) Calcula-se o 𝑇-./ 𝑟− 𝑛−2

(1) Hipóteses estatísticas: 𝐻0: 𝜌 = 𝜌!

(2) Nível de significância 𝛼 = 5%

(3) Região crítica: 𝑅𝐶 = 𝑇 𝑇 ≤ – 𝑡%5;*,6% 𝑜𝑢 𝑇 ≥ 𝑡%5;*,6% } = 𝑇 𝑇 ≤ – 2,101 𝑜𝑢 𝑇 ≥ 2,101}

(4) Calcula-se o 𝑇-./

Pode-se verificar que, ambos estimadores seguem uma distribuição normal

Voltando ao exemplo de pureza do oxigênio em função de hidrocarbonetos. Construir um intervalo

em que 𝜎S 2 = 𝑄𝑀𝐸 ; 𝑦S; = 𝛽31 + 𝛽3% 𝑥1

Voltando ao exemplo de pureza do oxigênio em função de hidrocarbonetos. Construir um intervalo

Você também pode gostar

(3) Região crítica: 𝑅𝐶 = 𝑇 𝑇 ≤ – 𝑡%5;,6% 𝑜𝑢 𝑇 ≥ 𝑡%5;,6% } = 𝑇 𝑇 ≤ – 2,101 𝑜𝑢 𝑇 ≥ 2,101}