Você está na página 1de 25

Estatstica para Cursos de Engenharia e

Informtica
Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia
So Paulo: Atlas, 2004

Cap. 11 Complemento:
Regresso Mltipla
APOIO:
Fundao de Cincia e Tecnologia de Santa Catarina (FUNCITEC)
Departamento de Informtica e Estatstica (INE/CTC/UFSC)

Regresso Mltipla
Predizer valores de uma varivel dependente
(Y) em funo de variveis independentes (X1,
X2, ..., Xk).
Conhecer o quanto as variaes de Xj
(j = 1,...,k) podem afetar Y.

Regresso Mltipla
(X1, X2, ..., Xk)

Aplicao na educao fsica:


X1 = exerccio aerbico
X2 = calorias ingeridas
X3 = circunferncia da cintura

Y = perda de peso

Regresso Mltipla
(X1, X2, ..., Xk)

Aplicao no ndice de Massa Corporal (IMC) :

X1 = velocidade
X2 = potncia
X3 = agilidade

Y = IMC

Modelo de Regresso Mltipla

E(y) = f(X1, X2, ..., Xk)

Linear:

E(y) = 0 + 1X1 + 2X2 + ... + kXk

onde Y, X1, ..., Xk podem representar as variveis


originais ou transformadas.
Admite-se que Y, X1, ..., Xk so variveis contnuas.

Modelo de Regresso Mltipla


E(y) = 0 + 1X1 + 2X2 + ... + kXk
O coeficiente k representa a variao esperada de Y para
cada unidade de variao em Xk (k = 1, 2, ..., k),
considerando as outras variveis independentes fixas.

Modelo de Regresso Mltipla


AMOSTRA:
obs.

variveis
X1
X2

1
2
...
n

y1
y2
...
yk

x11
x21
...
xn1

x12
x22
...
xn2

E(y) = 0 + 1X1 + 2X2 + ... + kXk


yi = 0 + 1xi1 + 2xi2 + ... + kxik + ei

...

Xk

...
...
...
...

x1k
x2k
...
xnk

termo
aleatrio
(erro)

Modelo de Regresso Mltipla


Suposies
yi = 0 + 1xi1 + 2xi2 + ... + kxik + ei

termo
aleatrio
(erro)

Os erros (ei) so independentes e variam


aleatoriamente

segundo

uma

distribuio

(normal) com mdia zero e varincia constante.

Regresso Mltipla
Equao de
regresso
ajustada aos dados:

y b0 b1 X 1 b2 X 2 ... bk X k

Valores preditos:

y i b0 b1 xi1 b2 xi 2 ... bk xik

Resduos:

ei yi y i

Medida do Ajuste
Coeficiente de determinao (R2)

R2 =

Variao
explicada
Variao
total

0 R2 1

Regresso Mltipla: teste sobre o modelo


ANOVA: atravs da Anlise de varincia,
testa-se a hiptese H0 dada a seguir
E(y) = 0 + 1X1 + 2X2 + ... + kXk
H0: 1 = 2 = ... = k = 0

Regresso Mltipla:
teste sobre um particular coeficiente
E(y) = 0 + 1X1 + 2X2 + ... + kXk
H0: j = 0

bj
se

sendo se o erro padro


da estimativa bj

Sob H0 e considerando as suposies do modelo,


t tem distrib. t de student

Ex. de regresso mltipla


A academia de ginstica Boa Forma decidiu
ilustrar uma abordagem terica de como os
exerccios aerbicos e a ingesto de calorias podem
afetar o peso. Doze dos membros estabelecidos na
academia registraram cuidadosamente o nmero de
minutos de exerccios aerbicos que praticaram no
decorrer de uma semana, juntamente com sua
ingesto calrica semanal.

Academia BOA FORMA

Ex. aerbico
(X1)
1
112
2
190
3
171
4
148
5
193
6
235
7
237
8
176
9
185
10
186
11
228
12
100

Cal. Ingerida(x1000)
(X2)
11,216
7,552
10,101
9,560
8,338
7,252
7,631
8,097
8,300
8,121
7,212
10,202

Perda de peso
(Y)
0,27
1,26
0,63
0,63
1,17
1,71
1,49
1,13
1,17
0,90
1,49
0,50

Regresso mltipla:
com variveis independentes qualitativas
Ex. (Qualitativa.sav)
Varivel dependente: IMC;
Variveis independentes:
TR (dobra cutnea triciptal);
SOMA_DC
(soma da dobra cutnea);
SEXO (0 = feminino, 1= masculino)
As variveis qualitativas devem entrar no modelo na forma de
variveis indicadoras (0 - 1)

Regresso mltipla:
com variveis independentes qualitativas
E(y) = 0 + 1Sexo + 2TR + 3Soma_dc
O coeficiente de uma varivel indicadora indica a variao
esperada em Y quando a varivel indicadora muda de 0
para 1, mantendo-se as demais variveis constantes.
Ex: 1 o incremento esperado no IMC pelo indivduo ser do sexo
masculino.

Seleo de variveis:
-Ex. (seleo.sav)
Varivel dependente: IMC

-Backward
-Forward
-Stepwise

MTODO FORWARD (passo a frente)


Considera-se inicialmente um modelo de
regresso linear simples, usando como varivel
auxiliar (X), aquela de maior valor da
estatstica t (ou menor valor de p) quando
ajustada a varivel dependente Y.
As etapas se sucedem quando uma varivel por
vez pode vir a ser incorporada;
Se em uma outra etapa no houver incluso, o
processo interrompido e as variveis selecionadas
at esta etapa definem o modelo final.

PROCEDIMENTO
Passo 1) ajustar todos os modelos com m variveis
(no modelo inicial m=1) e escolher a varivel
candidata com maior valor da estatstica t para
entrar no modelo, considerando que o valor de p
(caso p> o modelo interrompido);
Passo 2) para cada varivel no pertencente ao
modelo do passo 1, ajustar um modelo de regresso
considerando no modelo as variveis que entraram
no passo 1 e escolher a varivel candidata que tiver
o maior valor da estatstica t, desde que p (caso
p> o modelo interrompido);

Passo 3) Fazer o processo sucessivamente, at


que todas as variveis que no esto no modelo
apresentem um valor de t, tal que o valor p>.

MTODO BACKWARD (passo atrs)


Neste mtodo incorporam-se inicialmente
todas as variveis em um modelo de regresso
linear mltipla;
Percorrem-se etapas, nas quais uma varivel
por vez pode vir a ser eliminada;
Se em cada etapa no houver eliminao de
alguma varivel, o processo interrompido e as
variveis restante definem o modelo final.

PROCEDIMENTO
Passo 1) ajustar o modelo completo de k
variveis;
Passo 2) retirar do modelo completo a varivel
com menor valor da estatstica t (ou maior
valor de p). Caso todas as variveis apresentem
p o processo interrompido e o modelo
final selecionado;
Passo 3) ajustar o modelo com k-1 variveis e
voltar ao passo 2.

MTODO STEPWISE (passo a passo)


Consiste em uma generalizao do
procedimento Forward;
Aps cada etapa de incorporao de uma
varivel, temos uma etapa em que uma das
variveis j selecionadas pode ser descartada;
O procedimento chega ao final quando
nenhuma varivel includa ou descartada.

PROCEDIMENTO
Passo 1) ajustar todos os modelos com m variveis
(no modelo inicial m=1) e escolher a varivel
candidata com maior valor da estatstica t para
entrar no modelo, considerando que o valor de p
(caso p> o modelo interrompido);
Passo 2) para cada varivel no pertencente ao
modelo do passo 1, ajustar um modelo de regresso
considerando no modelo as variveis que entraram
no passo 1 e escolher a varivel candidata que tiver
o maior valor da estatstica t, desde que p (caso
p> o modelo interrompido);

Passo 3) verificar se o valor da estatstica t das


variveis que esto no modelo apresentam p.
Caso uma ou mais variveis que j esto no
modelo apresente p> , retira-se a varivel do
modelo que possua o maior valor de p.
Passo 4) ajustar o modelo no passo 3, tal que
p para todas as variveis. Voltar o passo 2 e
repetir todo o processo at que todas as
variveis que esto fora do modelo tenham
p>.

Você também pode gostar