Escolar Documentos
Profissional Documentos
Cultura Documentos
Atípico en Y:
En regresión múltiple es difícil observarlo entre los datos, pero en los residuos se ve
claramente.
En regresión múltiple x1p , x2 p ,..., xkp leverage point si está lejos de las demás
observaciones x1i ,..., xki con i = 1….T; dependiendo de cómo sea su correspondiente
1
h pp Valor mínimo del leverage
N
' h pp 1 . Yˆp
Si x p muy alejada de X , el leverage toma su valor máximo se estima con
muy poca precisión, pues su varianza es muy grande. Además var(Uˆ p ) 0 y E (Uˆ p ) 0 Uˆ p 0
sea cual sea el verdadero valor de Yp ; Es decir, si x ' p está muy alejado de las otras X sea cual
sea el Yp , al estimar el residuo es 0 i.e. la recta o hiperplano de regresión PASAN por x ' p .
Esa observación hace que el hiperplano se desvíe hasta pasar por ella. Es un punto de
influencia máxima.
Para otras observaciones:
2K
x' p Potencialmente Influyente si: h pp h 3S h O bien: h pp 2h
T
Uˆ t Uˆ t
b) residuos studentizados rt
^
ˆ 1 htt
var (Uˆ t )
Si la observación ya es atípica a priori (leverage grande) hay que mirar el residuo
studentizado, pues el otro puede estar deformado.
El efecto que produce en las estimaciones el caso atípico. Una vez que hemos
determinado que una observación es potencialmente influyente hay que ver si ˆ , Yˆi
cambian mucho si se hace la regresión con o sin ella.
ˆ , Yˆi Con todas las observaciones
ˆ( i ) , Yˆ( i ) Sin la observación i-ésima
X (i ) Matriz de datos sin la fila i-ésima
Se trata de ver si ˆ es muy distinto de ˆ( i ) o bien Ŷi distinto de Yˆ( i ) . Para ello
medimos la distancia entre estimaciones.
Esas distancias se miden estandarizadas (corregidas por la varianza, desviación
típica o alguna función de ellas).
( ˆ j ˆ j ( i ) )' X ' X ( ˆ j ˆ j ( i ) )
ˆ( i ) ( X '( i ) X ( i ) ) 1 ( X '( i ) Y( i ) ) D( j )
Kˆ 2
se denomina Df-beta tipificado y mide la distancia (tipificada) entre el ˆ j que se
obtendrían utilizando todas las observaciones y el que se obtienen sin utilizar el
dato i-ésimo. Puede considerarse influyente una observación cuyo df-beta
2
tipificado sea (en valor absoluto) mayor que N
(Yˆi Yˆ( i ) ) 2
D( i ) se denomina Df-fit tipificado y mide la distancia (tipificada)
Kˆ 2hii