Escolar Documentos
Profissional Documentos
Cultura Documentos
i = 1, . . . , n.
A ideia bsica da anlise dos resduos que, se o modelo for apropriado, os resduos
devem refletir as propriedades impostas pelo termo de erro do modelo. Tais suposies
so
Y = X + ,
em que = (1 , 2 , , n )0 , com
1. i e j so independentes (i 6= j);
2. Var(i ) = 2 (constante);
3. i N(0, 2 ) (normalidade);
4. Modelo linear;
5. No existir outliers (pontos atpicos) influentes.
Na Regresso Mltipla, alm das suposies listadas acima, precisamos diagnosticar colinearidade e multicolinearidade entre as variveis de entrada para que a relao
existente entre elas no interfira nos resultados, causando inferncias errneas ou pouco
confiveis.
As tcnicas utilizadas para verificar as suposies descritas acima podem ser informais (como grficos) ou formais (como testes). As tcnicas grficas, por serem visuais,
podem ser subjetivas e por isso tcnicas formais so mais indicadas para a tomada de
deciso. O ideal combinar as tcnicas disponveis, tanto formais quanto informais,
para o diagnstico de problemas nas suposies do modelo.
Algumas tcnicas grficas para anlise dos resduos so:
1. Grfico dos resduos versus a ordem de coleta dos dados: avaliar a hiptese de
independncia dos dados.
2. Grfico dos resduos versus valores ajustados: verifica a homoscedasticidade do
modelo, isto , 2 constante.
3. Papel de probabilidade normal: verificar a normalidade dos dados.
Professor Jos Alberto
jose.alberto1965@terra.com.br
(11)9.7525-3343
1.1
Diagnstico de Normalidade
1.1
Diagnstico de Normalidade
A normalidade dos resduos uma suposio essencial para que os resultados do ajuste
do modelo de regresso linear sejam confiveis. Podemos verificar essa suposio por
meio do grfico de Papel de Probabilidade e por meio de testes tais como Shapiro-Wilk,
Anderson-Darling e Kolmogorov-Smirnov.
1.2
Diagnstico de Homoscedasticidade
Homoscedasticidade o termo para designar varincia constante dos erros i para observaes diferentes. Caso a suposio de homoscedasticidade no seja vlida, podemos listar alguns efeitos no ajuste do modelo:
1. Os erros padres dos estimadores, obtidos pelo Mtodo dos Mnimos Quadrados,
so incorretos e portanto a inferncia estatstica no vlida.
2. No podemos mais dizer que os Estimadores de Mnimos Quadrados so os melhores estimadores de mnima varincia para , embora ainda possam ser no
viciados.
Vale ressaltar que a ausncia de homoscedasticidade chamada de heteroscedasticidade. Com isso, testamos a seguinte hiptese:
H0 : 12 = 22 = ... = k2
H1 : pelo menos um dos i2 s diferente, i = 1, . . . , k.
Professor Jos Alberto
jose.alberto1965@terra.com.br
(11)9.7525-3343
1.3
1.3
O grfico dos resduos versus valores ajustados (valores preditos) uma das principais
tcnicas utilizadas para verificar as suposies dos resduos. Alm da deteco de heteroscedasticidade, esse grfico pode indicar que no existe uma relao linear entra
as variveis explicativas com a varivel resposta por meio de alguma tendncia nos
pontos. Por exemplo, se os pontos do grfico formam uma parbola, indicativo que
termos de segundo grau sejam necessrios.
Para o diagnstico de heteroscedasticidade, tentamos encontrar alguma tendncia
no grfico. Por isso, se os pontos esto aleatoriamente distribudos em torno do 0, sem
nenhum comportamento ou tendncia, temos indcios de que a varincia dos resduos
homoscedstica. J a presena de "funil" um indicativo da presena de heteroscedasticidade.
1.4
Diagnstico de Independncia
1.5
Uma anlise grfica para verificar a hiptese de independncia dos resduos pode ser
feita por meio do grfico dos resduos versus a ordem da coleta dos dados. Se ao
avaliar o grfico, percebemos uma tendncia dos pontos, ou seja, se os pontos tiverem
um comportamento que se repete em determinado ponto do grfico, temos indcios de
dependncia dos resduos.
1.6
Diagnstico de Outliers
jose.alberto1965@terra.com.br
(11)9.7525-3343
1.7
1.7
Resduos Padronizados
Resduos Padronizados
1.8
1.9
Quando trabalhamos com mais de uma varivel regressora, muito importante verificar se essas variveis explicativas so correlacionadas. Desta forma, se no houver
nenhum relacionamento entre elas, dizemos que so ortogonais.
Na prtica, muito difcil que as variveis de entrada sejam ortogonais e, felizmente, a falta de ortogonalidade no sria. Mas se as variveis forem muito correlacionadas, as inferncias baseadas no modelo de regresso podem ser errneas ou pouco
confiveis.
Por isso, necessrio verificar se as variveis so altamente correlacionadas. Na
literatura, os termos Colinearidade (Multicolinearidade) so utilizados para indicar a
existncia forte de correlao entre duas (ou mais) variveis independentes. Entretanto, alguns autores designam de Colinearidade a existncia de relao linear entre
duas varivel explicativa (matriz de correlao) e de Multicolinearidade a existncia de
relao linear entre uma varivel explicativa e as demais.
Se a matriz XX singular, isto , algumas variveis explicativas so combinaes
lineares de outras, temos Multicolinearidade e no h Estimadores de Mnimos Quadrados nico para os parmetros. Se XX aproximadamente singular, temos Multicolinearidade aproximada.
jose.alberto1965@terra.com.br
(11)9.7525-3343