Você está na página 1de 13

MÉTODOS DE PREVISÃO

2022/2023

Regressão Linear Simples:


Qualidade e Inferência
REGRESSÃO LINEAR SIMPLES
Validar para a
Diagrama de Dispersão Correlação Linear Coeficiente de Correlação linear (𝑟) Teste ao ρ
população
𝑋 – var. independente
𝑌 – var. dependente

Qualidade do Modelo Regressão Linear Simples


Coeficiente de Equação do modelo
Determinação 𝑌෠ = 𝛼ො + 𝛽෠ ∙ 𝑥
Erro Padrão da
𝑅2 Estimativa
𝑆𝑒 Inferência Estatística

Teste ao 𝛽 Teste ANOVA

Pontual PREVISÃO Intervalar Intervalo de confiança para 𝛽


Substituir o valor de 𝑥 na
equação do modelo Intervalo de confiança para 𝑦ො dado 𝑥

Diagnóstico do Modelo Estimado


Teste ao parâmetro β
Para haver relação entre 2 variáveis, o
coeficiente que as relaciona, 𝛽 , deve ser
diferente de zero (ou maior ou menor que zero).

Assim, é necessário testar a nulidade de  para


aferir da relação entre as variáveis dependente e
independente.

𝛽<0
Formulação das 𝐻0 : 𝛽 = 0 𝑣𝑠 𝐻1 : 𝛽 ≠ 0
Hipóteses
𝛽>0

A relação entre as duas variáveis pode ser considerada


estatisticamente significativa se for rejeitada a hipótese nula.
Teste ao β
Estatística do Teste
𝑛 < 30 𝑛 ≥ 30
𝛽መ − 𝛽0 𝛽መ − 𝛽0
𝑇= → 𝑡𝑛−2 𝑍= → 𝑁(0, 1)
𝑆𝛽 𝑆𝛽

𝑆𝑒
𝑆𝛽 =
2
σ 𝑥
σ 𝑥2 − 𝑛

Exercício: Teste para um nível de significância de 5%, se a


relação observada entre a % de cacau e o preço do
chocolate é estatisticamente significativa.
Exemplo
𝑌෠ = 0,333 + 0,016 ∙ 𝑥

Teste de hipóteses a β, com =0,05: Valor observado da estatística do teste:


෡ 0
𝛽−𝛽 0,016−0
𝑡𝑜𝑏𝑠 = = = 5.333
𝑆𝛽 0.003

Hipóteses: 𝐻0 : β=0 vs 𝐻1 : β>0


𝑆𝑒 0.212
Estatística do teste: como 𝑛 = 12, em que 𝑆𝛽 = 2
= = 0.003
σ𝑥 4752
σ 𝑥2− 23015− 12
𝛽መ − 𝛽0 𝑛

𝑇= → 𝑡𝑛−2 Decisão: 𝑡𝑜𝑏𝑠 = 5.333 pertence à RC, rejeita-se


𝑆𝛽
a 𝐻0 , pois há evidência a favor da 𝐻1
Região crítica:
RA RC Interpretação: Ao nível de significância de
5%, há evidencia estatística de β ser positivo,
isto é, da variação no preço de 100gr de
0,95 0,05 chocolate decorrente do aumento de 1% de
cacau ser positiva.
𝒕𝒄𝒓𝒊𝒕𝒊𝒄𝒐 =1,812
Equação do Modelo: Relembrando…
𝑌𝑖 = 𝛼 + 𝛽 ∙ 𝑋𝑖 + 𝜀𝑖
A relação entre Y e X pode ser dividida em duas partes:
- uma parte representada pela reta, 𝑌𝑖 = 𝛼 + 𝛽 ∙ 𝑋𝑖
- outra parte representada pela variável residual, εi,
(representa a diferença entre o valor realmente observado de 𝑌 e o valor que seria
observado se a relação entre 𝑌 e 𝑋 fosse rigorosamente exacta).

Cada um dos valores observados para a variável dependente (𝑌𝑖) é:


• Função de um efeito constante (),
• Função do efeito da variável independente ( ∙ 𝑋𝑖) e
• Função do efeito de uma variável residual (𝜀𝑖 ), que impede a existência de uma
relação linear perfeita entre as variáveis 𝑋 e 𝑌.
Análise de Variância (ANOVA ou Teste F)
O teste F valida em termos globais o modelo e não cada um dos parâmetros
isoladamente.

Formulação das Hipóteses H0: O modelo global não é significativo


H1: O modelo global é significativo

Estatística do Teste

A distribuição do teste a utilizar, e uma vez que o modelo integra um única variável
explicativa, é a F-Snedcor com 1 grau de liberdade no numerador e 𝑛 − 2 graus de
liberdade no denominador.

Região crítica: é sempre unilateral direita


Região Crítica
(RC)
Decisão: Rejeita-se H0 se 𝐹𝑜𝑏𝑠 > 𝐹(1;𝑛−2; 𝛼)
1-𝜶
𝜶
𝐹(1;𝑛−2;1−𝛼)
Análise de Variância (ANOVA ou Teste F)
O teste F pode ser calculado através da Tabela ANOVA:

Fonte de SQ g.l. QM F
Variação (soma dos quadrados) (graus de liberdade) (quadrados médios)

Regressão 2 1 𝑆𝑄𝑅 𝑄𝑀𝑅


𝑆𝑄𝑅 = ෍ 𝑦ො − 𝑦ത 𝑄𝑀𝑅 = F=
1 𝑄𝑀𝐸

Erros 𝑆𝑄𝐸
𝑆𝑄𝐸 = ෍ y − 𝑦ො 2 𝑛−2 𝑄𝑀𝐸 = −
𝑛−2
𝑺𝑸𝑻 = 𝑺𝑸𝑹 + 𝑺𝑸𝑬
Total 𝑆𝑄𝑇 = ෍ 𝑦 − 𝑦ത 2 𝑛−1 − −

σ𝑦 2 Exercício: Teste (𝛼 =5%) se a relação observada


2
𝑆𝑄𝑇 = ෍ 𝑦 − 𝑦ത = ෍ 𝑦2 − entre a % de cacau e o preço do chocolate é
𝑛
uma relação significativa em termos globais.
Exemplo
𝑌෠ = 0,333 + 0,016 ∙ 𝑥
Teste de hipóteses à significância global do modelo, com =0,05

Hipóteses: H0: O modelo global não é significativo vs H1: O modelo global é significativo

𝑄𝑀𝑅
Estatística do teste: F= → 𝐹(1;𝑛−2; 𝛼)
𝑄𝑀𝐸
Região crítica:

Região Crítica
(RC)

1-𝜶
𝜶
𝐹𝑐𝑟í𝑡𝑖𝑐𝑜=4,96
Tabela F-Snedcor

Região Crítica
(RC)

1-𝜶
𝜶
𝐹(1;𝑛−2;1−𝛼)
Exemplo
Valor observado da estatística do teste – Tabela Anova 𝑌෠ = 0,333 + 0,016 ∙ 𝑥

σ𝑦 2 11,652
1º calcular 𝑺𝑸𝑻 = σ 𝑦2 − = 12,794 − =1,484
𝑛 12

2º Por exemplo, determinar 𝑆𝑄𝐸 = σ y − 𝑦ො 2 = 0,392


3º Como 𝑺𝑸𝑻 = 𝑺𝑸𝑹 + 𝑺𝑸𝑬, então 𝑺𝑸𝑹 = 1,484 − 0,392 = 1,092
4º Calcular os QM e o valor observado de F

SQ g.l. QM
Fonte de
(soma dos (graus de (quadrados F
Variação
quadrados) liberdade) médios)
1,092
Regressão 𝑆𝑄𝑅 = 1,092 1 𝑄𝑀𝑅 = 1,092 𝐹𝑜𝑏𝑠 = = 28
0,039

Erros 𝑆𝑄𝐸 = 0,392 10 𝑄𝑀𝐸 = 0,039 −

Total 𝑆𝑄𝑇 = 1,484 11 − −


Exemplo
𝑌෠ = 0,333 + 0,016 ∙ 𝑥
Teste de hipóteses à significância global do modelo, com =0,05

Hipóteses: H0: O modelo global não é significativo vs H1: O modelo global é significativo

𝑄𝑀𝑅
Estatística do teste: F= → 𝐹(1;𝑛−2; 𝛼)
𝑄𝑀𝐸
Região crítica:
Decisão: 𝐹𝑜𝑏𝑠 = 28 pertence à RC, rejeita-se
a 𝐻0
Região Crítica
(RC) Interpretação: Ao nível de significância de
5%, há evidencia estatística de que o
1-𝜶
𝜶 modelo que prevê o preço de 100gr de
𝐹𝑐𝑟í𝑡𝑖𝑐𝑜=4,96 chocolate em função da % de cacau é
globalmente significativo.
Análise de Variância (ANOVA ou Teste F)

Quando o modelo integra uma única variável


explicativa e a hipótese alternativa é do tipo ≠0, os
testes t e F são equivalentes e conduzem à mesma
decisão.

Na análise de regressão múltipla, só o teste F permite testar a


significância global do modelo, para inferir se a relação entre
a variável dependente e um conjunto de variáveis
explicativas é estatisticamente significativa.

O teste t pode continuar a ser utilizado para testar a


significância da relação ente a variável dependente e cada
uma das variáveis explicativas, quando consideradas
individualmente.

Você também pode gostar