Você está na página 1de 79

Estatística para Gestores

usando o Microsoft Excel 6ª


Edição

Capítulo 13

Regressão Linear Simples

DCOVA: Definir, Coletar, Organizar, Visualizar, Analisar

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-1


Objetivos de Aprendizado
Neste capítulo, você aprenderá:
 A utilizar a análise da regressão para prever o valor de
uma variável dependente com base em uma variável
independente.
 O significado dos coeficientes de regressão b0 e b1
 Avaliar o pressuposto da análise da regressão e saber
o que fazer caso os pressupostos sejam violados
 A fazer interferênciais sobre a inclinação e o
coeficiente de correlação
 A estimar a média aritmética dos valores e prever
valores individuais
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-2
Correlação vs. Regressão
DCOVA
 Um gráfico de dispersão pode ser usado para
mostrar a relação entre as duas variáveis
 A análise de correlação é usada para medir a força
de associação (relação linear) entre duas variáveis
 Correlação refere-se apenas à força do
relacionamento
 Nenhum efeito causal está implícito com a
correlação
 Gráficos de dispersão foram apresentados a primeira
vez no Cap. 2
 A correlação foi aresentada pela primeira vez no
Cap. 3
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-3
Introducão a Análise
da Regressão
DCOVA
 Análise da Regressão é usada para:
 Prever o valor de uma variável dependente com base
no valor de, pelo menos, uma variável independente
 Explicar o impacto que mudanças em uma variável
independente causa sobre a variável dependente
Variável Dependente: a variavél que desejamos
prever ou explicar
Variável Independente: a variável usada para
prever ou explicar a variável dependente

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-4


Modelo de Regressão Linear
Simples
DCOVA
 Apenas uma variável independente, X
 Relacionamento entre X e Y é descrito
por uma função linear
 Mudanças em Y costumam estar
relacionadas a mudanças ocorridas em X

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-5


Tipos de Relações
DCOVA

Relacões Lineares Relações Curvilíneas

Y Y

X X

Y Y

X X
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-6
Tipos de Relações
DCOVA
(continuação)
Relações fortes Relações fracas

Y Y

X X

Y Y

X X
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-7
Tipos de Relações
DCOVA
(continuação)
Nenhuma relação

X
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-8
Modelo de Regressão
Simples Linear
DCOVA

Coeficiente
Intercepto de inclinação Variável Erro
(população (polulação) Independente aleatório
Variável )

Yi  β0  β1Xi  ε i
Dependente

Componente Linear Componente Aleatória

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-9


Modelo de Regressão
Simples Linear DCOVA
(continuação)

Y Yi  β0  β1Xi  ε i
Valor
Observado de Y
para Xi
εi Inclinação = β1

Valor previsto
Erro aleatório
de Y para Xi
para valor Xi

Intercepto =
β0
Xi X
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-10
Equação da Regressão Simples
Linear (Linha de Previsão) DCOVA
A equação de regressão linear simples fornece
uma estimativa da linha de regressão populacional

Estimativa
(ou previsto) Estimativa da
valor Y para Estimativa do Inclinaçao
observação i Intercepto
Valor de X para

Ŷi  b 0  b1X i
observação i

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-11


Método dos Mínimos Quadrados
DCOVA

b0 e b1 são obtidos encontrando os valores


que minimizam a soma dos quadrados das
ˆ
diferenças entre Y e Y

min  (Yi Ŷi )  min  (Yi  (b 0  b1Xi )) 2 2

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-12


Equação para Encontrar os
Mínimos Quadrados
DCOVA

 Os coeficientes de b0 e b1 e outros
resultados da regressão neste capítulo,
serão encontrados usando o Excel

As fórmulas são mostrados no texto para


aqueles que estão interessados

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-13


Interpretação da
Inclinação e do Intercepto
DCOVA

 b0 é o valor médio estimado de Y


quando o valor de X é zero
 b1 é a variação estimada no valor
médio de Y como um resultado de um
aumento de uma unidade na X

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-14


Exemplo de Regressão Linear
Simples DCOVA

 Um agente imobiliário pretende analisar a relação


entre o preço de venda de uma casa e seu
tamanho (medida em pés quadrados)
 Uma amostra aleatória de 10 casas é selecionada
 Variável dependente (Y) = Preço da casa em

US $ 1,000
 Variável independente (X) = pés quadrados

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-15


Regressão Linear Simples
Exemplo: Dados DCOVA
Preço das casas em
Pés Quadrados
$1000s
(X)
(Y)
245 1400
312 1600
279 1700
308 1875
199 1100
219 1550
405 2350
324 2450
319 1425
255 1700

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-16


Regressão Linear Simples
Exemplo: Dispersão
DCOVA
Modelo de preço de casa: gráfico de
dispersão
450
400
House Price ($1000s)

350
300
250
200
150
100
50
0
0 500 1000 1500 2000 2500 3000
Square Feet

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-17


Regressão Linear Simples Exemplo:
Usando Análise de Dados Excel
DCOVA
1. Escolha Dados 2. Escolha Análise de Dados
3. Escolha Regressão

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-18


Regressão Linear Simples-Exemplo:
Usando Análise de Dados Excel
(continuação)
Digite os Ys e os Xs nas posições desejadas DCOVA

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-19


Regressão Linear Simples
-Exemplo: Saída Excel
DCOVA
Regression Statistics
Multiple R 0.76211 A equação da Regressão é:
R Square 0.58082
Adjusted R Square 0.52842 preço da casa  98.2483 $  0.10977 ($/PQ) X (PQ)
Standard Error 41.33032
Observations 10

ANOVA
  df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000      

  Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-20


Regressão Linear Simples -
Exemplo: Representação Gráfica
DCOVA
Modelo de preço de casa: gráfico de dispersão e linha de
tendência
450
400
House Price ($1000s)

350
Inclinação
300
250
= 0.10977
200
150
100
50
Intercepto 0
= 98.248 0 500 1000 1500 2000 2500 3000
Square Feet

preço da casa  98.24833  0.10977 X

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-21


Regressão Linear Simples –
Exemplo: Interpretação do bo
DCOVA

preço da casa  98.24833  0.10977 X

 b0 é o valor médio estimado de Y quando o


valor de X é zero (se X = 0 estiver na gama de
valores observados X)
 Como uma casa não pode ter uma área igual a
0, b0 não tem aplicação prática neste caso.

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-22


Regressão Linear Simples –
Exemplo: Interpretação do b1
DCOVA

preço da casa  98.24833  0.10977 X

 b1 estima a alteração no valor médio de Y


como um resultado de um aumento de
uma unidade em X
 Aqui, b1 = 0.10977 diz-nos que o valor médio de
uma casa aumenta em 0.10977 ($ 1000) = $ 109,77,
em média, para cada um pé quadrado adicional de
tamanho
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-23
Regressão Linear Simples
-Exemplo: fazer previsões
DCOVA
Prever o preço para uma casa
com 2000 pés quadrados:

preço da casa  98.25  0.1098 X


 98.25  0.1098 (2000)
 317.85

O preço previsto para uma casa com 2000


pés quadrados é 317,85 ($ 1,000 s) = $
317.850
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-24
Regressão Linear Simples
-Exemplo: fazer previsões
DCOVA
 Usando o modelo de regressão para previsões, apenas
para previsões dentro da região relevante de dados
Fração relevante
para a interpolação

450
400
House Price ($1000s)

350
300
250
200
150
100
50 Não tente
0
extrapolar para
0 500 1000 1500 2000 2500 3000
Square Feet
além do alcance
de X observadas
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-25
Medidas de Variação
DCOVA
 Variação total é composta de duas partes:

SST  SSR  SSE


Soma Total Soma dos Erro Quadrático
dos quadrados da
Quadrados regressão

SST   ( Yi  Y )2 SSR   ( Ŷi  Y )2 SSE   ( Yi  Ŷi )2


where:
=Y
Valor médio da variável dependente
Yi = Valor observado da variável dependente

i
= Valor previsto de Y para o valor de Xi
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-26
Medidas de Variação
(continuação)

DCOVA
 SST = soma total dos quadrados (Variação Total)
 Mede a variação dos valores de Yi em torno da sua
média Y
 SSR = soma dos quadrados da regressão (Variação Explicada)
 Variação atribuida à relação entre X e Y
 SSE = soma dos erros ao quadrados (Variação Não Explicada)
 Variação em Y atribuida a outros fatores que não X

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-27


Medidas de Variação
(continuação)

DCOVA
Y
Yi

_
SST = (Yi - Y)2

Y
_ _
Y Y

Xi X
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-28
Medidas de Variação
(continuação)

DCOVA
Y
Yi 
Y


Y  _
_ SSR = (Yi - Y)2 _
Y Y

Xi X
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-29
Medidas de Variação
(continuação)

DCOVA
Y
Yi  
SSE = (Yi - Yi )2 Y


Y  _
_ SSR = (Yi - Y)2 _
Y Y

Xi X
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-30
Medidas de Variação
(continuação)

DCOVA
Y
Yi  
SSE = (Yi - Yi )2 Y
_
SST = (Yi - Y)2

Y  _
_ SSR = (Yi - Y)2 _
Y Y

Xi X
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-31
Coeficiente de determinação, r2
DCOVA
 O coeficiente de determinação é a porção da
variação total na variável dependente que é
explicada pela variação na variável
independente
 O coeficiente de determinação também é
chamado de R-quadrado e é denotado como
SSR soma dos quadrados da regressão
r 2

SST soma total dos quadrados

nota: 0 r 1 2

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-32


Examplos de Valores
Aproximados de r2
DCOVA
Y
r2 = 1

Relação linear perfeita entre


X e Y:
X
r2 = 1
Y 100% da variação em Y é
explicada pela variação em X

X
r =1
2

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-33


Examplos de Valores
Aproximados de r2
DCOVA
Y
0 < r2 < 1

Relações lineares mais


fracas entre X e Y:
X
Alguma, mas não toda a
Y
variação em Y é explicada
pela variação em X

X
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-34
Examplos de Valores
Aproximados de r2
DCOVA

r2 = 0
Y
Sem relação linear entre X
e Y:

O valor de Y não depende


X de X. (nenhuma variação
r2 = 0
em Y é explicada pela
variação em X)

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-35


Regressão Linear Simples -Exemplo: coeficiente de

determinação, r2 no Excel

DCOVA
SSR 18934.9348
Regression Statistics
r2    0.58082
Multiple R 0.76211 SST 32600.5000
R Square 0.58082
Adjusted R Square 0.52842
58,08% da variação dos preços
Standard Error 41.33032
das casas é explicada pela
Observations 10
variação do tamanho das casas

ANOVA
  df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000      

  Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-36


Erro padrão de estimativa
DCOVA
 O desvio padrão da variação de observações
em torno da linha de regressão é estimada por:

SSE
 ˆ
(Yi  Yi ) 2

i 1
S YX  
n2 n2
Onde,
SSE = soma dos quadrados dos erros
n = tamanho da amostra

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-37


Exemplo de Regressão Linear Simples:
Erro padrão da estimativa em Excel
DCOVA
Regression Statistics
Multiple R 0.76211 S YX  41.33032
R Square 0.58082
Adjusted R Square 0.52842
Standard Error 41.33032
Observations 10

ANOVA
  df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000      

  Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-38


Comparando os Erros Padrão
DCOVA
SYX é uma medida da variação dos valores
de Y observado a partir da linha de regressão
Y Y

baixo SYX X X
alto SYX

A magnitude de SYX deve ser sempre considerada em relação


ao tamanho dos valores de Y na amostra de dados
isto é, SYX = $ 41.33K é moderadamente pequeno em relação
aos preços da habitação em $ 200K - faixa de US $ 400K
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-39
Suposições de Regressão
DCOVA

 Linearidade
 A relação entre X e Y é linear

 Independência dos Erros


 Valores de erros são estatisticamente independentes

 Normalidade do Erro
 Valores de erro são normalmente distribuídos para qualquer

valor dado de X
 Igualdade de Variância (também chamada de homocedasticidade )
 A distribuição de probabilidade dos erros tem variância

constante

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-40


Análise Residual
DCOVA
ei  Yi  Ŷi
 O resíduo para observação i, ei, é a diferença entre os seus
valores observados e preditos
 Verifique os pressupostos da regressão através da análise
dos resíduos
 Examine para supor linearidade
 Avaliar suposição de independência
 Avaliar suposição de distribuição normal
 Examine a variância constante para todos os níveis de X
(homocedasticidade)
 Análise gráfica Residual
 Fazer um gráfico resíduos vs. X
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-41
Análise Residual para
Linearidade
DCOVA
Y Y

x x
resíduos

x resíduos x

Não Linear
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall
 Linear
13-42
Análise residual para
Independência
DCOVA

Não Independente
 Independente
resíduos

resíduos
X
resíduos

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-43


Verificação de Normalidade
DCOVA
 Examinar o boxplot dos resíduos
 Examinar o histograma dos resíduos
 Construir um gráfico da probabilidade normal a
partir dos resíduos

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-44


Análise Residual para
Normalidade
DCOVA
Ao utilizar um gráfico de probabilidade normal, os erros
normais, serão exibidos em uma linha reta

Percentual
100

0
-3 -2 -1 0 1 2 3
Resíduo
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-45
Análise Residual para Igualdade
de Variâncias
DCOVA

Y Y

x x

resíduos
resíduos

x x

Variância não constante


 Variância Constante

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-46


Regressão Linear Simples -
Exemplo: Excel saída Residual
DCOVA
Saída Residual House Price Model Residual Plot
Preço
Previsto da 80
Casa Resíduo
1 251.92316 -6.923162 60

2 273.87671 38.12329 40
Residuals
3 284.85348 -5.853484 20
4 304.06284 3.937162
0
5 218.99284 -19.99284 0 1000 2000 3000
-20
6 268.38832 -49.38832
7 356.20251 48.79749 -40

8 367.17929 -43.17929 -60


9 254.6674 64.33264 Square Feet
10 284.85348 -29.85348

Não parece violar
todos os pressupostos de regressão
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-47
Medição de Autocorrelação:
Estatístca de Durbin-Watson
DCOVA

 Usado quando os dados são recolhidos ao


longo do tempo para detectar se a
autocorrelação está presente
 Existe autocorrelação se os resíduos em
um período de tempo estão relacionados
com resíduos em outro período

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-48


Autocorrelação
DCOVA
 Autocorrelação é a correlação dos erros
(resíduos) ao longo do tempo
Time (t) Residual Plot

15
 Aqui, os resíduos 10

Residuals
5
mostram um padrão
0
cíclico, e não aleatória.
-5 0 2 4 6 8
Padrões cíclicos são -10
um sinal de auto- -15
correlação positiva Time (t)

 Viola a suposição de regressão de que os


resíduos são aleatórios e independente
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-49
Estatística de Durbin-Watson
DCOVA
 Estatística de Durbin-Watson é usada para testar a
autocorrelação
H0: resíduos não são correlacionados
H1: apresenta autocorrelação positiva

n  O intervalo possível é 0 ≤ D ≤ 4
 (e  e i i 1 ) 2
   D deve ser próximo a 2 se H0 é
D i 2
n verdadeiro
 i
e 2

i 1
 D menor que 2 pode ser sinal de
autocorrelação positiva, D acima de
2 pode sinalizar autocorrelação
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall
negativa
13-50
Testes para autocorrelação
positiva
DCOVA
H0: autocorrelação positiva não existe
H1: existe autocorrelação
 Calcular a Estatística de Durbin-Watson = D
(Estatítica de Durbin-Watson Statistic pode ser encontado usando Excel ou Minitab)

 Encontrar os valores de dL e dU na tabela estatística Durbin-Watson


(Para o tamanho de amostra n e número de variáveis independentes k)

Regra de decisão: rejeitar t H0 se D < dL

Rejeita H0 Inconclusivo Não rejeita H0

0 dL dU 2
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-51
Testando para autocorrelação
positiva (continuação)

DCOVA
 Suponha que temos os seguintes dados de
séries temporais:
160

140

120

100
Sales

80 y = 30.65 + 4.7038x
2
60 R = 0.8976
40

20

0
0 5 10 15 20 25 30
Tim e

 Existe autocorrelação?
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-52
Testando para autocorrelação
(continuação)
positiva
DCOVA
160
 Examplo com n = 25: 140

120
Saída Excel/PHStat:
100

Durbin-Watson Calculations

Sales
80 y = 30.65 + 4.7038x
2
60 R = 0.8976
Soma de diferença de
quadrados dos resíduos 3296.18 40

Soma dos quadrados 20

residuais 3279.98 0
0 5 10 15 20 25 30
Estatística Durbin- Tim e
Watson 1.00494

 i i1
(e  e ) 2
3296.18
D i 2
n
  1.00494
3279.98
 ei
2

i1
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-53
Testando para autocorrelação
positiva (continuação)
DCOVA
 Aqui, n = 25, e há k = 1 uma variável independente

 Utilizando a tabela de Durbin-Watson, dL = 1.29 e dU =


1.45

 D = 1.00494 < dL = 1.29, então rejeita H0 e concluiu que


existe correlação positiva significativa
Decisão: rejeita H0 desde que
D = 1.00494 < dL

Rejeita H0 Inconclusivo Não rejeita H0


0 dL=1.29 dU=1.45 2
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-54
Inferências sobre a Inclinação
DCOVA
 O erro padrão do coeficiente angular de
regressão (b1) é estimada pela:

S YX S YX
Sb1  
SSX  i
(X  X ) 2

onde:
S=bEstimativa
1
do erro padrão da inclinação

SSE
S YX  = Erro padrão da estimativa
n2
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-55
Inferências sobre a Inclinação:
Teste t
DCOVA
 teste t para a inclinação da população
 Há uma relação linear entre X e Y?
 Hipóteses nula e alternativa
 H0: β1 = 0 (não há relação linear)
 H1: β1 ≠ 0 (existe relação linear)
 Estatística Teste ONDE:
b1  β1
t STAT  b1 = inclinação

Sb β1 = hipótese para
1 inclinação

d.f.  n  2 Sb1 = erro padrão da


inclinação
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-56
Inferências sobre a inclinação:
Exemplo de Teste t
DCOVA

Preço da acsa Pés Estimativa da equação de regressão :


em $1000s Quadrados
(y) (x) preço da casa  98.25  0.1098 X
245 1400
312 1600
279 1700
308 1875 A inclinação deste modelo é 0,1098
199 1100
219 1550
Existe uma relação entre a metragem
405 2350 quadrada da casa e seu preço de
324 2450 venda?
319 1425
255 1700

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-57


Inferências sobre a inclinação:
Exemplo de Teste t
H0: β1 = 0 DCOVA

Saída do Excel: H1: β1 ≠ 0


  Coefficients Standard Error t Stat P-value
Intercept 98.24833 58.03348 1.69296 0.12892
Square Feet 0.10977 0.03297 3.32938 0.01039

b1 Sb1

b1  β 1 0.10977  0
t STAT    3.32938
Sb 0.03297
1

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-58


Inferências sobre a inclinação:
Exemplo de Teste t
DCOVA
H0: β1 = 0
Estatística Teste: tSTAT = 3.329
H1: β1 ≠ 0

d.f. = 10- 2 = 8

a/2=.025 a/2=.025
Decisão: Rejeita H0

Há evidências suficientes de
Rejeita H0
-tα/2
Não rejeita H0
tα/2
Rejeita H0 que a metragem quadrada
0
-2.3060 2.3060 3.329 afeta preço de casa.

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-59


Inferências sobre a inclinação:
Exemplo de Teste t
DCOVA
H0: β1 = 0
H1: β1 ≠ 0
Saída do Excel:
  Coefficients Standard Error t Stat P-value

Intercepto 98.24833 58.03348 1.69296 0.12892

Square Feet 0.10977 0.03297 3.32938 0.01039

Decisão: Rejeita H0, desde que valor-p < α Valor-p


Há provas suficientes de que a metragem
quadrada afeta o preço casa.
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-60
Teste F para significância
DCOVA
 Teste F: MSR
FSTAT 
MSE

onde SSR
MSR 
k
SSE
MSE 
n  k 1
onde FSTAT segue uma distribuição F com numerador k e (n - k - 1)
graus de liberdade do denominador

(K = número de variáveis independentes no modelo de regressão)

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-61


Saída do Excel para Teste F de
Significância
DCOVA

Estatística de regressão
Multiple R 0.76211
MSR 18934.9348
R Square 0.58082
FSTAT    11.0848
Adjusted R
Square 0.52842
MSE 1708.1957
Standard Error 41.33032
With 1 and 8 degrees p-value for
Observations 10
of freedom the F-Test

ANOVA
  df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000      

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-62


Teste F de Significância
(continuação)

DCOVA
H0: β1 = 0 Estatística Teste:
H1: β1 ≠ 0 MSR
FSTAT   11.08
 = .05 MSE
df1= 1 df2 = 8 Decisão:
Valor Rejeita H0 com  =
Crítico:
F = 5.32
0.05
Conclusão:
 = .05
Há provas suficientes de que o
0 F tamanho da casa afeta preço
Não Rejeita H0
rejeita H0
F.05 = 5.32
de venda
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-63
Intervalo de Confiança Estimado
para Inclinação
DCOVA
Estimativa de Intervalo de Confiança para Inclinação:

b1  t α / 2 S b d.f. = n - 2
1

Saída do Excel para preço das casas:


  Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580

A nível de 95% de confiança, o intervalo de confiança


para a inclinação é (0.0337, 0.1858)

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-64


Intervalo de Confiança Estimado
para Inclinação (continuação)

DCOVA
  Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580

Uma vez que as unidades da variável preço da casa é


de R $ 1000s, somos 95% confiante de que o impacto
médio no preço de venda é entre US $ 33,74 e US $
185,80 por pé quadrado do tamanho da casa

Este intervalo de confiança de 95% não inclui 0.


Conclusão: Existe uma relação significativa entre o preço
de casa e os pés quadrados no 0,05 nível de significância

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-65


Teste t para o Coeficiente de
Correlação
DCOVA
 Hipóteses
H0: ρ = 0 (não há correlação entre X e Y)
H1: ρ ≠ 0 (existe correlação)

 Estatística Teste
r -ρ
t STAT 
(com
2 n – 2 grau de liberdade)
1 r onde
n2 r   r 2 if b1  0
r   r 2 if b1  0

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-66


Teste t para o Coeficiente de
Correlação
(continuação)

DCOVA
Existe evidência de uma relação linear
entre os pés quadrados e preço de casa no
0,05 nível de significância?

H 0: ρ = 0 (Não há correlação)
H 1: ρ ≠ 0 (Há correlação)
 =.05 , df = 10 - 2 = 8

rρ .762  0
t STAT    3.329
1 r2 1  .7622
n2 10  2

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-67


Teste t para o Coeficiente de
Correlação (continuação)

DCOVA

rρ .762  0 Decisão:


t STAT    3.329
Rejeita H0
1 r2 1  .7622
n2 10  2 Conclusão:
Há evidências de
d.f. = 10-2 = 8
uma associação
linear ao nível de
a/2=.025 a/2=.025
5% de
significância
Rejeita H0 Não Rejeita H0 Rejeita H0
-tα/2 0
tα/2
-2.3060 2.3060
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall
3.329
13-68
Estimar os valores médios e
predição de valores individuais
DCOVA
Meta: formar intervalos em torno de Y para expressar
incerteza sobre o valor de Y para um determinado Xi
Intervalo de
confiança Y 
para a média Y
de Y, dadoXi


Y = b0+b1Xi

Intervalo de
previsão para um Y
indivíduoal, dado Xi
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall
Xi X 13-69
Intervalo de Confiança para
média Y, dado X
DCOVA
Estimativa de intervalo de Confiança para o
valor de Y, dado um determinado Xi
Intervalo de Confiança para μ Y|X  X i :
Yˆ  t / 2SYX hi
Tamanho do intervalo varia de
acordo com a distância da media, X

1 (X i  X)2 1 (X i  X)2
hi    
n SSX n  (X i  X)2
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-70
Intervalo de previsão para um Y,
dado X
DCOVA
Estimativa de Intervalo de Confiança para um
valor individual de Y, dado um determinado
Xi
Intervalo de Confiança para YX  X i :
Yˆ  t / 2SYX 1  hi

Este termo extra aumenta a largura do intervalo


para refletir a incerteza adicionada para um caso
individual

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-71


Estimativa dos valores médios:
Exemplo DCOVA
Intervalo de Confiança Estimado para μY|X=X
i

Encontre o intervalo de confiança de 95% para o


preço médio de casas com 2.000 pés quadrados

Preço Previsto Yi = 317.85 ($1,000s)

1 (X i  X) 2
Ŷ  t 0.025S YX   317.85 37.12
n
 (X i  X) 2

Os pontos finais do intervalo de confiança


são 280,66 e 354,90, ou de US $ 280.660 a US $ 354.900
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-72
Estimativa de valores individuais:
Exemplo DCOVA
Previão Estimada do Intervalo para YX=X
i

Encontre o intervalo de previsão de 95% para uma


casa com 2.000 pés quadrados

Preço Previsto Yi = 317.85 ($1,000s)

1 (X i  X) 2
Ŷ  t 0.025S YX 1    317.85 102.28
n
 (X i  X) 2

Os pontos finais do intervalo de previsão são 215,50 e


420,07, ou de US $ 215.500 a US $ 420.070
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-73
Armadilhas da Análise de
Regressão
 Falta de uma consciência dos pressupostos em que
está baseada a regressão por mínimos quadrados
 Não saber como avaliar os pressupostos
 Não conhecer as alternativas à regressão de
mínimos quadrados se um pressuposto especial é
violado
 Usar um modelo de regressão sem o conhecimento
do assunto
 Extrapolação fora do intervalo relevante

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-74


Estratégias para evitar as
Armadilhas de Regressão
 Comece com um gráfico de
dispersão da X vs. Y para observar possíveis
relações
 Realizar análise de resíduos para verificar os
pressupostos
 Traçar os resíduos versus X para verificar se há
violações dos pressupostos tais como violação de
homocedasticidade.
 Use um histograma, boxplot, ou gráfico de
probabilidade normal dos resíduos para descobrir
eventual não-normalidade
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-75
Estratégias para evitar as
Armadilhas de Regressão
(continuação)

 Se houver violação de qualquer hipótese,


utilizar métodos ou modelos alternativos.
 Se não há nenhuma evidência de violação
pressuposto, então teste a significância dos
coeficientes de regressão e construa intervalos
de confiança e intervalos de predição.
 Evite fazer previsões fora da faixa relevante

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-76


Resumo do Capítulo

 Introdução de tipos de modelos de regressão


 Avaliação de pressupostos de regressão e correlação
 Determinação da equação de regressão linear simples
 Descrição de medidas de variação
 Descrição da análise de resíduos
 Medida de autocorrelação

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-77


Resumo do Capítulo
(continuação)

 Descrição de inferências sobre a inclinação

 Correlação – medida da força de associação

 Estimativa de valores médios e previsão de


valores individuais

 Possíveis armadilhas discutidas em regressão


e estratégias recomendadas para evitá-las
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-78
All rights reserved. No part of this publication may be reproduced, stored in a retrieval
system, or transmitted, in any form or by any means, electronic, mechanical, photocopying,
recording, or otherwise, without the prior written permission of the publisher.
Printed in the United States of America.

Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 13-79

Você também pode gostar