Você está na página 1de 5

Estatstica - Anlise diagnstico

Professor Jos Alberto - (11) 9.7525-3343


jose.alberto1965@terra.com.br

Estatstica - Anlise diagnstico

Anlise dos desvios

Tanto na Regresso Linear Simples quanto na Regresso Mltipla, as suposies do


modelo ajustado precisam ser validadas para que os resultados sejam confiveis. Chamamos de Anlise dos Resduos um conjunto de tcnicas utilizadas para investigar a
adequabilidade de um modelo de regresso com base nos resduos.
O resduo (ei ) dado pela diferena entre a varivel resposta observada (Yi ) e a
varivel resposta estimada (Ybi ), isto
ei = Yi Ybi = Yi b0 b1 x1i . . . bp x pi

i = 1, . . . , n.

A ideia bsica da anlise dos resduos que, se o modelo for apropriado, os resduos
devem refletir as propriedades impostas pelo termo de erro do modelo. Tais suposies
so
Y = X + ,
em que = (1 , 2 , , n )0 , com
1. i e j so independentes (i 6= j);
2. Var(i ) = 2 (constante);
3. i N(0, 2 ) (normalidade);
4. Modelo linear;
5. No existir outliers (pontos atpicos) influentes.
Na Regresso Mltipla, alm das suposies listadas acima, precisamos diagnosticar colinearidade e multicolinearidade entre as variveis de entrada para que a relao
existente entre elas no interfira nos resultados, causando inferncias errneas ou pouco
confiveis.
As tcnicas utilizadas para verificar as suposies descritas acima podem ser informais (como grficos) ou formais (como testes). As tcnicas grficas, por serem visuais,
podem ser subjetivas e por isso tcnicas formais so mais indicadas para a tomada de
deciso. O ideal combinar as tcnicas disponveis, tanto formais quanto informais,
para o diagnstico de problemas nas suposies do modelo.
Algumas tcnicas grficas para anlise dos resduos so:
1. Grfico dos resduos versus a ordem de coleta dos dados: avaliar a hiptese de
independncia dos dados.
2. Grfico dos resduos versus valores ajustados: verifica a homoscedasticidade do
modelo, isto , 2 constante.
3. Papel de probabilidade normal: verificar a normalidade dos dados.
Professor Jos Alberto

jose.alberto1965@terra.com.br

(11)9.7525-3343

1.1

Diagnstico de Normalidade

Estatstica - Anlise diagnstico

4. Grfico dos Resduos Studentizados versus valores ajustados: verifica se existem


outliers em Y.
5. Grfico dos Resduos Padronizados versus valores ajustados: verifica se existem
outliers em Y.
6. Grfico do Leverage (Diagonal da Matriz H): verifica se existem outliers em X.
Para a anlise formal dos resduos, podemos realizar os seguintes testes:
1. Testes de Normalidade em que detalhes esto contidos no contedo de Inferncia.
2. Grfico dos resduos versus valores ajustados: verifica a homoscedasticidade do
modelo, isto , 2 constante.
3. Teste de Durbin-Watson para testar independncia dos resduos.
4. Teste de Breusch-Pagan e Goldfeld-Quandt para testar se os resduos so homoscedsticos.
5. Teste de falta de ajuste para verificar se o modelo ajustado realmente linear.
Para cada suposio do modelo, vamos mostrar detalhadamente as tcnicas para
diagnstico.

1.1

Diagnstico de Normalidade

A normalidade dos resduos uma suposio essencial para que os resultados do ajuste
do modelo de regresso linear sejam confiveis. Podemos verificar essa suposio por
meio do grfico de Papel de Probabilidade e por meio de testes tais como Shapiro-Wilk,
Anderson-Darling e Kolmogorov-Smirnov.

1.2

Diagnstico de Homoscedasticidade

Homoscedasticidade o termo para designar varincia constante dos erros i para observaes diferentes. Caso a suposio de homoscedasticidade no seja vlida, podemos listar alguns efeitos no ajuste do modelo:
1. Os erros padres dos estimadores, obtidos pelo Mtodo dos Mnimos Quadrados,
so incorretos e portanto a inferncia estatstica no vlida.
2. No podemos mais dizer que os Estimadores de Mnimos Quadrados so os melhores estimadores de mnima varincia para , embora ainda possam ser no
viciados.
Vale ressaltar que a ausncia de homoscedasticidade chamada de heteroscedasticidade. Com isso, testamos a seguinte hiptese:

H0 : 12 = 22 = ... = k2
H1 : pelo menos um dos i2 s diferente, i = 1, . . . , k.
Professor Jos Alberto

jose.alberto1965@terra.com.br

(11)9.7525-3343

1.3

Grfico dos Resduos versus Valores Ajustados Estatstica - Anlise diagnstico

1.3

Grfico dos Resduos versus Valores Ajustados

O grfico dos resduos versus valores ajustados (valores preditos) uma das principais
tcnicas utilizadas para verificar as suposies dos resduos. Alm da deteco de heteroscedasticidade, esse grfico pode indicar que no existe uma relao linear entra
as variveis explicativas com a varivel resposta por meio de alguma tendncia nos
pontos. Por exemplo, se os pontos do grfico formam uma parbola, indicativo que
termos de segundo grau sejam necessrios.
Para o diagnstico de heteroscedasticidade, tentamos encontrar alguma tendncia
no grfico. Por isso, se os pontos esto aleatoriamente distribudos em torno do 0, sem
nenhum comportamento ou tendncia, temos indcios de que a varincia dos resduos
homoscedstica. J a presena de "funil" um indicativo da presena de heteroscedasticidade.

1.4

Diagnstico de Independncia

Para verificar se os resduos so independentes, podemos utilizar tcnicas grficas e


testes. A seguir, temos o diagnstico de independncia por essas duas formas.

1.5

Grfico dos Resduos versus a Ordem de Coleta

Uma anlise grfica para verificar a hiptese de independncia dos resduos pode ser
feita por meio do grfico dos resduos versus a ordem da coleta dos dados. Se ao
avaliar o grfico, percebemos uma tendncia dos pontos, ou seja, se os pontos tiverem
um comportamento que se repete em determinado ponto do grfico, temos indcios de
dependncia dos resduos.

1.6

Diagnstico de Outliers

Outlier uma observao extrema, ou seja, um ponto com comportamento diferente


dos demais. Alm de diagnosticar heteroscedasticidade, o grfico de resduos versus
valores ajustados tambm auxilia na deteco de pontos atpicos.
Se um outlier for influente, ele interfere sobre a funo de regresso ajustada (a
incluso ou no do ponto modifica substancialmente os valores ajustados).
Mas uma observao ser considerada um outlier no quer dizer que consequentemente um ponto influente. Por isso, um ponto pode ser um outlier em relao a Y ou
aos X, e pode ou no ser um ponto influente.
A deteco de pontos atpicos tem por finalidade identificar:
1. outliers com relao a X;
2. outliers com relao a Y;
3. observaes influentes.
Professor Jos Alberto

jose.alberto1965@terra.com.br

(11)9.7525-3343

1.7

1.7

Resduos Padronizados

Estatstica - Anlise diagnstico

Resduos Padronizados

O resduo padronizado,di , corresponde ao resduo bruto dividido pelo erro padro


estimado dos resduos, QME.
ei
di =
.
QME
Se os erros tm distribuio normal, ento aproximadamente 95% dos resduos
padronizados (di ) devem estar no intervalo de (-2,2). Resduos fora desse intervalo
podem indicar a presena de outliers.

1.8

Teste da Falta de Ajuste (Lack of Fit)

Aps o ajuste, importante verificar se o modelo linear adequado. Uma maneira


formal de verificar o ajuste de um modelo linear por meio do teste de falta de ajuste.

1.9

Anlise de Colinearidade e Multicolinearidade

Quando trabalhamos com mais de uma varivel regressora, muito importante verificar se essas variveis explicativas so correlacionadas. Desta forma, se no houver
nenhum relacionamento entre elas, dizemos que so ortogonais.
Na prtica, muito difcil que as variveis de entrada sejam ortogonais e, felizmente, a falta de ortogonalidade no sria. Mas se as variveis forem muito correlacionadas, as inferncias baseadas no modelo de regresso podem ser errneas ou pouco
confiveis.
Por isso, necessrio verificar se as variveis so altamente correlacionadas. Na
literatura, os termos Colinearidade (Multicolinearidade) so utilizados para indicar a
existncia forte de correlao entre duas (ou mais) variveis independentes. Entretanto, alguns autores designam de Colinearidade a existncia de relao linear entre
duas varivel explicativa (matriz de correlao) e de Multicolinearidade a existncia de
relao linear entre uma varivel explicativa e as demais.
Se a matriz XX singular, isto , algumas variveis explicativas so combinaes
lineares de outras, temos Multicolinearidade e no h Estimadores de Mnimos Quadrados nico para os parmetros. Se XX aproximadamente singular, temos Multicolinearidade aproximada.

Professor Jos Alberto

jose.alberto1965@terra.com.br

(11)9.7525-3343

Você também pode gostar