Você está na página 1de 84

02/05/2009 J.S.

Pierre 1
Le mod
Le mod

le
le
Lin
Lin

aire
aire
G
G

n
n

ralis
ralis

J.S. Pierre
UMR 6552
2 mai 2009
02/05/2009 J.S. Pierre 2
1. Introduction et rappels
02/05/2009 J.S. Pierre 3
Rgression
linaire
Analyse de
variance
Analyse de
covariance
Erreurs normales
Modle linaire gnral
(GLM)
Rgression
logistique
Modle
log-linaire
Et dautres...
Erreurs dfinies
Modle linaire gnralis
1.1. Aperu gnral
02/05/2009 J.S. Pierre 4
1.2. Rappel : glm
Le modle Linaire Gnral traite :
L'analyse de variance
La rgression linaire simple et multiple
Les combinaisons des deux (modles de variance
- covariance)
Son inconvnient rside dans ses
hypothses restrictives :
Normalit et indpendance des erreurs
Homoscdasticit (stabilit de la variance)
02/05/2009 J.S. Pierre 5
1.3. Relativisation des
carts aux hypothses
Le test F est robuste aux carts la normalit
Supporte bien lasymtrie
Supporte moins bien laplatissement
Mis en dfaut par toute bimodalit
Le test F est robuste aux carts entre les
variances
Dans une fourchette de 1 16 environ
Le test F est sensible aux carts
lindpendance
Se mfier de lordre dobservation des donnes
02/05/2009 J.S. Pierre 6
Citation
Effects of violations. Overall, the F test (see also F Distribution) is
remarkably robust to deviations from normality (see Lindman, 1974, for a
summary). If the kurtosis (see Basic Statistics and Tables) is greater than
0, then the F tends to be too small and we cannot reject the null hypothesis
even though it is incorrect. The opposite is the case when the kurtosis is
less than 0. The skewness of the distribution usually does not have a sizable
effect on the F statistic. If the n per cell is fairly large, then deviations
from normality do not matter much at all because of the central limit
theorem, according to which the sampling distribution of the mean
approximates the normal distribution, regardless of the distribution of the
variable in the population. A detailed discussion of the robustness of the F
statistic can be found in Box and Anderson (1955), or Lindman (1974).
Box, G. E. P., & Anderson, S. L. (1955). Permutation theory in the derivation
of robust criteria and the study of departures from assumptions. Journal of
the Royal Statistical Society, 17, 1-34.
Lindman, H. R. (1974). Analysis of variance in complex experimental designs.
San Francisco: W. H. Freeman & Co.
02/05/2009 J.S. Pierre 7
1.4. Inanit des tests de
validit
Les tests
De normalit des rsidus (p.ex.
Kolmogorov, de Shapiro-Wilks)
De conformit des variances (p.ex.
Bartlett)
Ne disent pas grand chose sur la
validit du test F
Ils ne sont pas faits pour cela !
02/05/2009 J.S. Pierre 8
Exprience : 1
Gnrer deux sries de donnes, lune
tiquete y1, lautre y2, contenant
respectivement 25 et 250 valeurs
distribues normalement avec une moyenne
de 10 et un cart type de 2
> y1<-rnorm(25,mean=10,sd=2)
> y2<-rnorm(250,mean=10,sd=2)
Faire un test de normalit (Shapiro-Wilks)
sur ces deux sries
> shapiro.test(y1)
> shapiro.test(y2)
02/05/2009 J.S. Pierre 9
Exprience 2.
Distordre la normalit des deux
sries en les levant la puissance 1.2
> y1<-y1^1.2
> y2<-y2^1.2
Refaire les tests de normalit
Commenter les rsultats
02/05/2009 J.S. Pierre 10
Commentaire
Le test que nous venons dutiliser na de
puissance que lorsque le nombre de donnes
est grand.
Avec peu de donnes on sautoriserait
utiliser le test F
Avec beaucoup de donnes on ne sy
autoriserait pas
Alors que le test F serait plus valable dans
le second cas que dans le premier
(meilleure convergence des sommes de
carrs dcarts vers des variables
2
)
02/05/2009 J.S. Pierre 11
Conclusion
On prfre utiliser des rgles empiriques
(rules of thumb)
Examen visuel de lhistogramme des rsidus
qqplot des rsidus avec reprsentation de la
droite de Henry (chelle probit)
Examen du graphique des rsidus en fonction
des estimes
Examen du graphique des rsidus en fonction de
lordre
Rapport de la plus grande la plus petite des
variances intra (<=16)
02/05/2009 J.S. Pierre 12
Conclusion
ou encore raisonner sur la nature mme des
variables
Un dnombrement nest pas une variable normale
Elle est discrte
Varie de 0 + infini
On peut, en premire approche lui supposer une loi de
Poisson
Nanmoins, si n grand et petit on pourra admettre
lapproximation normale (pas de dogmatisme)
Une proportion nest pas une variable normale
Elle varie entre zro et un
Elle est tablie sur un rapport de dnombrements
(favorable/possible)
On peut dduire sa distribution de la loi binomiale
02/05/2009 J.S. Pierre 13
1.5 Que faire si les
hypothses sont violes ?
Transformation des variables
Logarithme (pour les comptages)
Arc Sinus Racine Carre (pour les pourcentages)
Racine carre (pour la loi de Poisson)
Logit (Pour les fractions de survie)
Tests non paramtriques
Mann - Whitney
Wilcoxon
Kruskall Wallis
Etc.
02/05/2009 J.S. Pierre 14
Inconvnients de ces
expdients
Transformations :
On leur demande trois choses :
Stabiliser la variance
Symtriser la distribution
La normaliser
Et chacune ne peut en faire qu'une
Par exemple, le logarithme stabilise la variance mais
ne normalise pas.
La racine carre stabilise la variance sur une loi de
Poisson mais ne symtrise pas
02/05/2009 J.S. Pierre 15
Tests non paramtriques
Les tests non paramtriques
Font perdre de la puissance (assez peu)
Donnent accs un nombre trs limit
de modles
Ce sont nanmoins de trs bons tests
lorsquon peut les appliquer
(modle simple)
02/05/2009 J.S. Pierre 16
Remde actuel :
Le Modle Linaire Gnralis
(Generalised Linear Model - GLIM)
C'est une extension du modle linaire
gnral
On garde certaines ides de la pratique des
transformations. Exemple : le logarithme rend
additif les modles multiplicatifs
On dissocie la prdiction de la variable
expliquer en deux composantes :
Un prdicteur linaire
Une fonction de lien
02/05/2009 J.S. Pierre 17
2. Un premier exemple
La rgression poissonnienne
02/05/2009 J.S. Pierre 18
2.1 Croissance dune
population de pucerons
Ci contre les
donnes : la
croissance dune
population de
Myzus persicae en
serre de salades
Della Giustina
1973, in Dajoz
1976
02/05/2009 J.S. Pierre 19
Modle propos : croissance
exponentielle
On veut prdire l'effectif n d'une
population au temps t, connaissant son
effectif x au temps zro
Le modle est du type :
0
rt
y y e =
0
ln ln . y y r t =
On peut le transformer en :
Qui est un modle linaire en t
02/05/2009 J.S. Pierre 20
MAISquel type derreur ?
Si l'on mesure des couples de variables
y
i
,t
i
, quel modle statistique obtient-on
par transformation ?
; ln
i i i i
X t Y y = =
.
i i i
Y a X b =
( )
2
~ 0,
i
N
0
avec et ln a r b y = =
( )
2
~ 0,
i
N
02/05/2009 J.S. Pierre 21
Cela nous donne le modle
de lerreur :
Lerreur est donc multiplicative
ln
i i
e =
0
i
rt
i i
y e y e =
Le logarithme de lerreur est normal
02/05/2009 J.S. Pierre 22
Et...
Le modle linaire gnral (ici la rgression
simple) ne conduit des tests exacts que si
l'erreur sur la variable d'origine est
multiplicative et distribue de manire log
normale, avec une variance constante
Comme la variable est un dnombrement, on
a toutes les raisons de penser que ce n'est
pas le cas (Loi de Poisson, loi binomiale, loi
binomiale-ngative)
02/05/2009 J.S. Pierre 23
Le prdicteur linaire
Nous allons poser :
.
i
i
a X b =
C'est le prdicteur linaire, fonction
linaire de la variable explicative X
On prdit ici le logarithme de lesprance
de Y :

ln (
ln( ) .
i
i i
i
E Y
a X b
=
= =
02/05/2009 J.S. Pierre 24
La fonction de lien
Mais comment prdire la variable d'origine y ?
Le logarithme est la fonction de lien
L'exponentielle (ou antilogarithme) la fonction de lien
inverse
( )
l n
i
i i
i
i
E Y e

= =
=
02/05/2009 J.S. Pierre 25
Rcapitulons

02/05/2009 J.S. Pierre 26


Pour fabriquer un
modle linaire gnralis
1. On sinterroge sur la nature de la
variable expliquer (choix dune famille
derreur)
2. On cherche une transformation qui
linarise le modle (fonction de lien)
3. On prdit la transforme de la moyenne
thorique de la variable expliquer grce
au prdicteur linaire choisi
4. On estime la moyenne thorique de la
variable expliquer en appliquant la
transformation inverse (fonction de lien
inverse)
02/05/2009 J.S. Pierre 27
Application au problme
pucerons
On admet que les comptages sont distribus selon une
loi de Poisson dont la moyenne dpend du temps
La famille derreurs sera donc Poisson
On admet que le logarithme de croit linairement
avec le temps
On prdit le logarithme de pour le temps t
i.
La
fonction de lien est donc le logarithme
On calcule leffectif estim de la population au temps
ti par la fonction de lien inverse (lexponentielle)
02/05/2009 J.S. Pierre 28
L'Erreur
La valeur prdite n'est pas la valeur
observe (ralisation d'une alatoire)
Il y a donc une erreur.
Cette erreur sera estime par l'cart
entre l'observe et la valeur prdite
(rsidu)
Mais l'ajustement du modle,
contrairement au modle linaire gnral
ne repose pas sur la minimisation de cette
erreur
02/05/2009 J.S. Pierre 29
Exercice
On utilise R
On charge le fichier myzus.prn
sous forme dun cadre de donnes
(data.frame)
On en fait un objet nomm myzus
> myzus<-
read.table(myzus.txt,header=T)
02/05/2009 J.S. Pierre 30
3. Ajustement du modle
Et tests dhypothse
02/05/2009 J.S. Pierre 31
3.1 Ajustement du modle
Nous allons procder en deux temps :
1. On prdit la moyenne thorique de y
i
par:
pose :
2. On donne une loi y
i
et on cherche le
maximum de vraisemblance de l'chantillon
pour cette loi et les paramtres du modle
Cette loi s'appelle "famille d'erreur". Dans
le cas des comptages on utilise souvent la
loi de Poisson

i i
a t b
i i
y e e


= = =

02/05/2009 J.S. Pierre 32


Un exemple
On utilise le prdicteur linaire pour
obtenir lesprance
( )
i i i
at b b at
i i
E y e e e e

= = = =
( )
( )
! !
i
i
i
b at
i
i
y
y
b at
i e e
i
i i
e e
P Y y e e
y y


= = =
Loi de Poisson sur y :
02/05/2009 J.S. Pierre 33
La fonction de
vraisemblance
( )
( )
1
V a,b
!
i
i
b at
i
y
b at n
e e
i i
e e
e
y

=
=

( )
( )
( )
( )
1
Logarithme de la vraisemblance :
LnV a,b ln !
i
n
at b
i i i
i
y at b e y

=
l
=
l
l

02/05/2009 J.S. Pierre 34


Maximisation
Ces quations, quivalent des "quations
normales" du modle linaire gnral,
pourraient tre rsolues par itration
Mais il existe une approche plus efficace
( )
( )
1
1
ln
0 0
ln
0 0
i
i
n
aX b
i i i
i
n
aX b
i
i
V
y X Xe
a
V
y e
b

=
'
1
1
l
1
= =
1
l
l
1
1
11
!
1
1
1
1
l
= = 1
l
1
l
1
1+

02/05/2009 J.S. Pierre 35


Un critre quivalent
La mthode des moindres carrs pondrs
est strictement quivalente et converge
plus facilement
En quoi elle consiste
Comment choisit on les poids ? Nous verrons un
peu plus tard (annexe 1)
On l'applique au prdicteur linaire aprs
transformation par la fonction de lien
02/05/2009 J.S. Pierre 36
Cela parait difficile mais...
Il existe des logiciels qui font a trs bien !
GLIM (Le plus ancien)
Splus et r (directive glm)
SAS (programme GENMOD)
Statistica
Il faut seulement savoir :
Ce que l'on veut
Comment interprter les sorties
Avant d'aller plus loins, rsumons :
02/05/2009 J.S. Pierre 37
3.2 En rsum
02/05/2009 J.S. Pierre 38
Les ingrdients d'un modle
linaire gnralis
1. Une variable expliquer
2. Des variables explicatives (covariables et
facteurs)
3. Un modle dfini par :
Une famille d'erreur
Une fonction de lien
Eventuellement un systme de pondrations (weighting)
et un facteur d'chelle (scale)
Le travail est facilit par le fait que :
Il existe une liste de cas qui marchent bien
Des fonctions de lien par dfaut sont associes la
plupart des familles d'erreur
02/05/2009 J.S. Pierre 39
Les grands classiques
Les types de variables, familles d'erreur et
fonctions de lien associes
Type de variable Famille d'erreur Fonction de lien
Mesures Normale Identit
Comptages Poisson Logarithme
Proportion Binomiale logit
Dilutions Exponentielle Logit
Dures de survie Weibull Log-Log
" quelconque Cox
Donnes binaires Binomiale Logit
CV constant Gamma log
02/05/2009 J.S. Pierre 40
Les vertus de la dviance
Pour mesurer la qualit de l'ajustement, on
utilise une statistique appele "Dviance",
dfinie comme suit :
C'est le logarithme du rapport de
vraisemblance entre le modle tudi et le
modle satur ("full model"), multipli par -2
La dviance est distribue comme un
2
Il faut donc dfinir ce que l'on appelle le
modle satur
02/05/2009 J.S. Pierre 41
Modle minimal, modle
satur
On appelle modle satur le modle qui
comporte N paramtres pour N
observations (0 degrs de libert)
On appelle modle nul le modle qui rsume
les donnes en un seul paramtre ()
Tout modle utile est situ entre les deux.
Il contient entre 1 et n paramtres.
Un exemple suit
02/05/2009 J.S. Pierre 42
Exemple
Le modle dfini plus haut comporte deux paramtres a
et b. Dans le modle satur, chaque observation y
i
est
tire d'une loi de Poisson de moyenne
i
= y
i
La vraisemblance de l'chantillon conditionnellement
ce modle est :
Sa vraisemblance, conditionnellement au Modle
Linaire Gnralis est :
( )
n
1 2
1
V , ,..., ,
!
i
i
y
n
y
i
i
i
y
e
y


=
=

( )
1
V
!
i
i
y
n
i
i
i
i
e
y


=
=

02/05/2009 J.S. Pierre 43
suite
On en dduit le rapport de
vraisemblance :
( )
1
i
i i
y
n
y
i
i
i
y
R e


=
1



( )

Dont le logarithme permet de trouver la


dviance
( )
1 1
2ln 2 ln ln
n n
i i i i i
i i
D R y y y
= =
l
= =
l

02/05/2009 J.S. Pierre 44
4. Un nouveau paramtre :
La dviance
02/05/2009 J.S. Pierre 45
4.1 Dfinition
Comme la variance cest un indicateur
dcart
Entre le modle et les observations
Fonction des rsidus dans les deux
chelles
Celle du prdicteur linaire
Celle des donnes brutes
( )
1 1
2 2 ln ln
n n
i i i i i
i i
D y y y
= =
l
=
l

02/05/2009 J.S. Pierre 46
La dviance est gale -2 fois le log du
rapport de vraisemblance :
Elle est asymptotiquement distribue
comme un
2
La dviance est au Modle Linaire
Gnralis ce que la variance est au Modle
linaire Gnral
La dviance
02/05/2009 J.S. Pierre 47
4.2 Dviances de diverses
lois d'erreur
( )
( )
( )
( )
( ) ( ) ( )

( )
( )
( )
2
2
Normale :
Poisson : 2 . ln
Binomiale : 2 . ln ln
Gamma : 2 ln
Normale Inverse : /
y SCE
y y y
y y n y n y y
y y
y





=
l

l
l
l
l

l
l
l
l
l

l
l

( )
2
y

02/05/2009 J.S. Pierre 48


4.3 Tests d'hypothse ;
analyse de la dviance
L'analyse de la dviance est le
pendant exact de l'analyse de
variance. Elle soulve cependant
quelques problmes :
En gnral les termes ne sont pas
orthogonaux
Les sommes de carr ne sont pas de bonnes
mesures des carts pour des variables non
normales
02/05/2009 J.S. Pierre 49
Tests dhypothse
Ces problmes sont
partiellement rsolus
Comme dans l'analyse de variance non
orthogonale on ajuste
squentiellement (et on permute les
facteurs)
On manque d'une thorie gnrale sur
la distribution des dviances
partielles. On se fie l'approximation
par le
2
02/05/2009 J.S. Pierre 50
Exemple
Nombre de cris d'offrande (poules).
M.A. Richard
17:52 Friday, March 20, 1998
LR Statistics For Type 3 Analysis
Source DF ChiSquare Pr>Chi
BLOC 18 3967.3692 0.0001
NOUR 3 37061.9331 0.0001
SITU 4 2001.1237 0.0001
NOUR*SITU 12 1416.7562 0.0001
19 poules servent de bloc. On les
confronte de manire randomise
quatre types de nourriture dans cinq
type de situations vis vis
de leurs poussins. La variable
tudie est le nombre de cris
d'offrande alimentaire pendant une
preuve de 5 minutes. Erreur de type
Poisson
Fonction de lien : log
On a ici un exemple d'un tableau
d'analyse de d-
viance (ANODEV)
02/05/2009 J.S. Pierre 51
4.4 Traitement de
l'htroscdasticit
Dans le Modle Linaire Gnralis,
l'htroscdasticit prend gnralement la
forme d'une surdispersion
L'erreur est multiplicative
Sa variance est plus que proportionnelle
l'esprance
Exemple : Loi binomiale ngative
Dans la pondration des moindres carrs,
on va prdire la variance locale par une loi
puissance de Taylor
02/05/2009 J.S. Pierre 52
5. Le problme des rsidus
Et les diffrents types de
rsidus
02/05/2009 J.S. Pierre 53
5.1 Problmes de lexamen
des rsidus
Contrairement au cas normal, on na
pas d image gnrale de la
distribution des rsidus
Ils sont centrs sur zro, certes,
mais de distribution diverse
On peut nanmoins dceler certains
biais
02/05/2009 J.S. Pierre 54
Exemples de rsidus
poissonniens (bruts)
Valeurs nulles
La variance est
proportionnelle
la moyenne
Les cars
croissent en
valeur absolue,
comme la racine
carre de
la moyenne
02/05/2009 J.S. Pierre 55
5.2 Diffrents types de
rsidus
Utiliss dans la pratique du
modle linaire gnralis
02/05/2009 J.S. Pierre 56
Rsidus bruts et de
Pearson
Rsidus bruts ou ordinaires
( )

p
y
r
V

=
Rsidus de Pearson
Il s'agit simplement des rsidus norms
Inconvnients : ils sont asymtriques (en gnral)
donc d'une interprtation difficile

B
r y =
02/05/2009 J.S. Pierre 57
Rsidus de Pearson
(poisson)
2 4 6 8 10
-
2
-
1
0
1
2
3
y
r
s
Valeurs nulles
02/05/2009 J.S. Pierre 58
Rsidus dAnscombe
Rsidus d'Anscombe
La fonction A(.) de Wedderburn normalise les
rsidus obtenus par maximum de vraisemblance
Elle permet d'obtenir des rsidus de
distribution approximativement normale,
interprtables graphiquement. Mais ne
stabilise pas la variance
( )
( )
3
d
A
V

02/05/2009 J.S. Pierre 59


Rsidus de dviance
Rsidus de dviance
( )

sgn
i D
r y d =
O d
i
est la contribution de l'observation i
la dviance totale
Pratiquement trs voisins des rsidus
dAnscombe
Option par dfaut de glm dans R et Splus
02/05/2009 J.S. Pierre 60
Rsidus de dviance
2 4 6 8 10
-
1
.
0
-
0
.
5
0
.
0
0
.
5
1
.
0
1
.
5
2
.
0
y
r
e
s
i
d
u
a
l
s
Valeurs nulles
Noter la
striation due
la nature
discrte de la
variable
02/05/2009 J.S. Pierre 61
5.3 Que peut-on dtecter
Grace lexamen des rsidus ?
02/05/2009 J.S. Pierre 62
Biais
5 10 15 20 25 30
-
1
.
0
-
0
.
5
0
.
0
0
.
5
1
.
0
fitted.values
r
e
s
i
d
u
a
l
s
Ici on a gnr
un e variable
distribue comme
une variable de
Poisson au carr
Le modle est non
linaire
Suggestion : gam
La courbe est une
spline cubique de
lissage
02/05/2009 J.S. Pierre 63
6. Les familles derreur
Et les fonctions de lien
02/05/2009 J.S. Pierre 64
6.1. Erreur poissonnienne
Associe au lien log.
Vaste famille des modles log-
linaires
permettent danalyser les tables de
contingences multiples
Riche ensemble, mriterait une
session complte
02/05/2009 J.S. Pierre 65
6.2 Erreur binomiale et lien
logit
-Rponse binaire : 0,1
-Dnombrement de cas
favorables
02/05/2009 J.S. Pierre 66
Une proportion dpend
dune covariable
La fonction
logistique
est trs
voisine de
la fonction
de
rpartition
de la loi
binomiale
0 20 40 60 80 100
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
x
1
/
(
1

+

e
x
p
(
-
0
.
3
1
4
1
6

*

(
x

-

5
0
)
)
)
02/05/2009 J.S. Pierre 67
Do la transformation :
La fonction ln(p/(1-p)) porte le nom
de lien logit
( )
( )
1
1
x
x p
P X x
e


= =

( )
1
x p
x x
e



=
( )
1
x x p
x
e



=
ln
1
x
x
x p

02/05/2009 J.S. Pierre 68


Le lien logit :
Le prdicteur linaire scrit :
ln
1
x
x
x
x
x p

=
Equation de rgression linaire qui prdit
une proportion
Elle dfinit la rgression logistique
02/05/2009 J.S. Pierre 69
Un exemple :
fichier : luzernes.txt
6 varits de luzernes attaques par un
nmatode phytophage : Ditylenchus dipsaci
Au total on a 66 plantules par terrine de
sol infest.
On note les symptmes : nombre de
plantes saines, gonfles, en arrt de
croissance, manquantes.
Intressons nous au nombre de plantes
gonfles
02/05/2009 J.S. Pierre 70
Gonflements
1 2 3 4 5 6
3
5
4
0
4
5
5
0
5
5
02/05/2009 J.S. Pierre 71
Gonflements - rsidus
0.60 0.65 0.70 0.75
-
0
.
4
-
0
.
2
0
.
0
0
.
2
0
.
4
fi tted.values
r
e
s
i
d
u
a
l
s
02/05/2009 J.S. Pierre 72
Note
La dviance correspond la variance
binomiale. On peut utiliser le test F
dans la rgression logistique (analyse
de variance logistique)
Les rsidus de dviance sont
approximativement normaux
02/05/2009 J.S. Pierre 73
Plantes manquantes
1 2 3 4 5 6
0
2
4
6
8
02/05/2009 J.S. Pierre 74
Plantes manquantes
0 . 0 3 0 0 . 0 3 5 0 . 0 4 0 0 . 0 4 5 0 . 0 5 0
-
1
.
0
-
0
.
5
0
.
0
0
.
5
1
.
0
1
.
5
f i t t e d . v a l u e s
r
e
s
i
d
u
a
l
s
02/05/2009 J.S. Pierre 75
6.3. Erreur gamma-
distribues
liens inverse et log
02/05/2009 J.S. Pierre 76
6.4 Donnes de survie
Modle risque proportionnel de
Cox
02/05/2009 J.S. Pierre 77
7. Rduction du modle
02/05/2009 J.S. Pierre 78
Le critre dAkaike
AIC = - 2*log R + k * edf,
k=2 (AIC)
Ou k = log(n) (BIC = Bayes IC)
Edf = degrs de liberts quivalents (equiv.
Deg. Of freedom)
En gnral, le nombre de paramtres estims
Doit tre le plus petit possible
Est donc pnalis par la taille du modle
(edf)
02/05/2009 J.S. Pierre 79
Akaike et Cp de Mallows
Un mme usage dans deux contextes
destimation
Cp : moindres carrs
AIC : rapport de vraisemblance / maximum de
vraisemblance
Deux critres sensibles la redondance
dinformation et lintroduction de
prdicteurs non pertinents (spurious)
02/05/2009 J.S. Pierre 80
Cp et AIC sont lis
La relation est :
02/05/2009 J.S. Pierre 81
8. Conclusion
De gros avantages
Toute la puissance des mthodes paramtriques
Toute la richesse des modles linaires (nombre de
facteurs et d'interactions illimit, covariables)
Incorpore un grand nombre de cas particuliers autrefois
considrs comme spcifiques :
Analyse de dosages
Analyse de donnes de survies
Rponses binaires
Quelques inconvnients
Validit des tests seulement asymptotique
Disponibilit encore limite
Mais l'essayer c'est l'adopter !
02/05/2009 J.S. Pierre 82
Ouvrages de rfrence
McCullagh P., Nelder J.A., 1983,
Generalized Linear Models, Chapman
& Hall, London
Crawley M.J., 1993, GLIM for
Ecologists, Methods in Ecology,
Blackwell Science, London
02/05/2009 J.S. Pierre 83
Modle capitule seul
50 100 150
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
capit
m
o
r
t
02/05/2009 J.S. Pierre 84
Modle racines seules
0.0 0.5 1.0 1.5 2.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
racines
m
o
r
t