Você está na página 1de 128

Captulo 2: A Regresso no linear

Trata-se duma generalizao do Modelo Linear :


Y - varivel resposta.
X1 , X2 , ..., Xp - variveis preditoras no aleatrias.
Admite-se que a relao de fundo entre a varivel resposta e as
variveis preditoras da forma:
Y = f (x1 , x2 , ..., xp ; ) + ,
onde
Rk um vector de k parmetros.
f uma funo real no linear

um erro aleatrio aditivo de valor esperado nulo..

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

76 / 416

A Regresso no linear (cont.)

Uma maneira alternativa de formular o modelo:


E [ Y | X1 = x1 , X2 = x2 , ..., Xp = xp ] = f (x1 , x2 , ..., xp ; ) ,
com os valores de Y a oscilar em torno deste valor esperado atravs
dum erro aleatrio aditivo, , de mdia nula.
Com esta formulao, os preditores Xi podem ser aleatrios, mas
apenas se modela o valor esperado condicional aos valores
observados dos preditores.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

77 / 416

As funes no lineares
partida, f uma funo no linear genrica, mas , em geral,
necessrio admitir algumas condies de regularidade (e.g.,
derivabilidade, etc.) para se poder fazer uma parte do estudo do
modelo.
No que se segue, admite-se que f verifica as propriedades que sejam
necessrias.
Tal como na Regresso Linear, admite-se que a forma genrica da
funo f conhecida, ficando em aberto a estimao e inferncia
associada ao vector de parmetros, .
Exemplos: f exponencial, f potncia, etc.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

78 / 416

A estimao de parmetros
Como na Regresso linear, os parmetros podem ser estimados
sem hipteses ulteriores pelo mtodo dos mnimos quadrados.
Com base em n observaes {(x1(i) , x2(i) , ..., xp(i) , yi )}ni=1 , toma-se
como estimador de , o vector que minimiza a soma de quadrados
dos resduos ei = yi yi = yi f (x1(i) , x2(i) , ..., xp(i) ; ):
n

min

i=1

2
yi f (x1(i) , x2(i) , ..., xp(i) ; ) .

A obteno dos estimadores exige algoritmos numricos adequados


e no computacionalmente trivial.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

79 / 416

A estimao de parmetros (cont.)


Tal como na Regresso linear, caso se pretenda obter tambm
resultados inferenciais sobre os parmetros ser necessrio exigir
pressupostos adicionais no modelo.
Os pressupostos adicionais na Regresso no linear so anlogos
aos que se exigem na regresso linear: erros aleatrios aditivos
independentes;
de mdia zero;
de distribuio normal; e
de varincias homogneas.
Por outras palavras:

i N (0, 2 ) i = 1, ..., n
Nn (0, 2 In )

J. Cadima (DM/ISA)

Modelao Estatstica II

independentes,

2010-11

80 / 416

Regresses linearizadas e regresses no lineares


Por vezes uma relao no linear entre Y e X1 , X2 , ..., Xp , pode ser
transformada numa relao linear entre Y e X1 , X2 , ..., Xp (onde os
asteriscos indicam uma varivel transformada).
Tais transformaes chamam-se transformaes linearizantes.
Mas a regresso no linear til porque:
H relaes no lineares que no so linearizveis
(fundamentalmente no lineares);
mesmo que a relao de base Y = f (X1 , ..., XP ; ) seja
linearizvel, estimar os parmetros na relao linearizada no
produz os mesmos resultados que estimar os parmetros na
relao no linear original.
alm disso, diferente admitir que h erros aleatrios aditivos
com as propriedades usuais na relao no linear ou na relao
linearizada, como se exemplificar adiante.
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

81 / 416

Algumas relaes no lineares importantes

Em aplicaes biolgicas, h muitos tipos de relaes no lineares de


interesse:
Modelos de crescimento;
Modelos de rendimento;
Relaes alomtricas;
etc., etc.
Vamos considerar alguns exemplos de relaes no lineares
frequentes em aplicaes biolgicas, com uma nica varivel
preditora.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

82 / 416

Modelo de crescimento exponencial


y = f ( |{z}
x
; , ) = e x
|{z}
p=1
k =2
var .
param.

x R

0.3
0.2

0.5 * exp(1.25 * x)

<0

0.0

0.1

100

150

200

>0

50

0.5 * exp(1.25 * x)

250

0.4

300

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

83 / 416

Modelo exponencial (cont.)


Recordar que
f (x) a taxa de variao instantnea de f (x).
f (x)
f (x)

a taxa de variao instantnea relativa de f (x).

Motivao: A relao exponencial a soluo da equao diferencial

y (x)
= ,
y(x)
y (x) = y(x)

Ou seja, a relao exponencial vem de admitir que


A taxa instantnea relativa de crescimento de y constante;
Ou, equivalentemente, a taxa instantnea de crescimento de y
proporcional a y.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

84 / 416

Parametrizaes alternativas do modelo exponencial

y(x) = e x
y(x) =

ek (x )

dois parmetros: e .
dois parmetros: e k

(k = e = e ).

y(x) = c ek (x )
trs parmetros: c, e k
Mas h sobreparametrizao:
k = e = c e .
y(x) = x

dois parmetros: e

( = e ).

Parametrizaes alternativas podem ter vantagens ou desvantagens


no plano da interpretao dos parmetros;
no plano do ajustamento e estudo do modelo.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

85 / 416

Parametrizaes alternativas da exponencial (cont.)


y(x) = e x

- ordenada na origem: y (0) = .


- taxa de variao relativa instantnea: =

y (x )
y (x ) .

y(x) = ek (x )

- valor de x onde y toma o valor 1: y ( ) = 1.

k - taxa de variao relativa instantnea: k = yy ((xx)) .

y(x) = x

- ordenada na origem: y (0) = .


- aumento de uma unidade em x provoca uma variao
multiplicativa de y em vezes: y (x + 1) = y (x ).

As vantagens/desvantagens no plano do ajustamento e estudo sero


consideradas adiante.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

86 / 416

A linearizao da exponencial

Se > 0, a relao exponencial uma relao linearizvel:


y = e x

ln y = ln + x
y = 0 + 1 x

que uma relao linear entre y = ln Y e x


(com 0 = ln e 1 = ).
Mas a estimativa de mnimos quadrados para no em geral igual,
no modelo linear e no modelo no linear (nem a de e so
directamente relacionveis).

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

87 / 416

Preveno
O modelo


yi = 0 + 1 xi + i
Nn (0, 2 In )

i = 1, ..., n

no equivalente ao modelo

yi = e xi + i
Nn (0, 2 In )

(y = ln y)

i = 1, ..., n

equivalente a um modelo

i = 1, ..., n
yi = e xi i
Lognormal

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

88 / 416

Relao potncia (alomtrica)

0.8
0.6

0.5 * x^(1/2)

8
6

0.4

0.5 * x^2

10

>1

x R+

y = x

1.0

12

y = f ( |{z}
x
; , ) = x
|{z}
p=1
k =2
var .
param.

<1

2
0

0.2

y = x

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

89 / 416

Modelo potncia (cont.)


Motivao: A relao potncia surge quando se admite que X e Y so
ambas funes duma terceira varivel (e.g., o tempo t), e que as taxas
relativas de crescimento de y(t) e x(t) so proporcionais:
y (t)
x (t)
=
,
y(t)
x(t)
A constante de proporcionalidade o expoente na relao
potncia.
Este modelo tem grande aplicao em problemas de alometria, onde
se estuda a relao entre comprimentos/pesos duma parte e dum todo
de um organismo, ou entre duas diferentes partes dum organismo.
Se = 1 fala-se em isometria: iguais taxas relativas de
crescimento.
Se > 1 fala-se em alometria positiva: a taxa relativa de
crescimento de y maior que a de x.
Se < 1 fala-se em alometria negativa: a taxa relativa de
crescimento menor que a de x.
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

90 / 416

A linearizao da relao potncia

Se > 0, a relao potncia uma relao linearizvel:


y = x

ln y = ln + ln x
y = 0 + 1 x

que uma relao linear entre y = ln Y e x = ln x


(com 0 = ln e 1 = ).
De novo, a estimativa de mnimos quadrados para no em geral
igual, no modelo linear e no modelo no linear (nem as de e so
relacionveis).

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

91 / 416

Preveno
O modelo

yi = 0 + 1 xi + i
Nn (0, 2 In )

i = 1, ..., n

(y = ln y

e x = ln x)

no equivalente ao modelo
(

yi = xi + i
i = 1, ..., n
Nn (0, 2 In )
equivalente a um modelo
(

yi = xi i
i = 1, ..., n
Lognormal

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

92 / 416

Modelo Logstico

O modelo exponencial irrealista a longo termo.


O modelo de crescimento logstico (Verhulst, 1838) uma alternativa
ao modelo de crescimento exponencial.
O modelo logstico admite a existncia de uma capacidade de
sustentao do meio que limita um crescimento que, de outra forma,
seria exponencial.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

93 / 416

Modelo logstico (cont.)

y = f ( |{z}
x
; , k, ) =
k
| {z }
1 + e (x )
p=1
k =3
var .
param.

x R

0.8
0.6
0.4
0.2
0.0

1/(1 + exp((4 + 1.5 * x)))

1.0

(com , k > 0). A curva logstica um exemplo duma curva sigmide.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

94 / 416

Relao logstica (cont.)


Motivao: A relao logstica y(x) =
diferencial:
y (x)
y(x)

1+ek (x )

soluo da equao

k
y(x),

A equao diferencial correponde a dizer que a taxa relativa de


crescimento de y, em ordem a x, decresce linearmente com y.
Para y(x) 0, a taxa relativa de crescimento de y aproximadamente
constante (k) e a logstica tem um crescimento aproximadamente
exponencial. medida que y cresce, a sua taxa relativa de
crescimento vai-se tornando mais lenta. Para y(x) , a taxa relativa
de crescimento de y aproximadamente nula e a logstica tende a
estabilizar (deixar de crescer).

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

95 / 416

Propriedades da logstica
y = uma assintota horizontal direita, e
y = 0 uma assintota horizontal esquerda.
y(x) uma funo estritamente crescente.
y(x) s toma valores em ]0, [.
diz-se a capacidade de sustentao do meio.
y atinge metade da capacidade de sustentao em x = :
y( ) = 2 .
y(x) tem:

concavidade para cima se x < ;


concavidade para baixo se x > ;
ponto de inflexo em x = .

tem mximo e x = , com valor y ( ) = k4 .


y(x) tem simetria em torno do seu ponto de inflexo:
y (x)

y( )

y( + ) 0 .

NOTA: A logstica tem uma certa rigidez.


J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

96 / 416

Os parmetros da logstica
Na forma utilizada,
y(x) =

1 + ek (x )

ek (x )
,
1 + ek (x )

capacidade de sustentao do meio;


vrios significados:

abcissa do ponto de simetria;


abcissa do ponto de inflexo
ponto onde y alcana metade do seu valor mximo;
ponto onde a taxa de crescimento y (x ) mxima.

k taxa relativa de crescimento mxima, correpondente fase de


arranque do crescimento.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

97 / 416

Outra parametrizao da logstica

y(x)

.
1 + ek x

Corresponde a tomar = ek .

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

98 / 416

Modelo Gompertz

O modelo de Gompertz outra alternativa ao modelo de crescimento


exponencial.
No modelo de Gompertz tambm se admite a existncia de uma
capacidade de sustentao do meio que limita um crescimento. A
curva de Gompertz tambm uma sigmide.
No modelo de Gompertz, a taxa relativa de crescimento de y no
constante (como na exponencial), nem decresce linearmente em y
(como na logstica), mas decresce exponencialmente em x.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

99 / 416

Modelo Gompertz (cont.)


k (x )

y = f ( |{z}
x
; , k, ) = ee
| {z }
p=1
k =3
var .
param.

x R

1.5
0.5

1.0

=2
k=1
=3

0.0

gompertz(x, alfa, k, gama)

2.0

(com , k > 0).

10

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

100 / 416

Relao de Gompertz (cont.)

k (x )

Motivao: A Gompertz y(x) = ee


diferencial:
y (x)
y(x)

soluo da equao

k ek (x ) ,

A equao diferencial correponde a dizer que a taxa relativa de


crescimento de y, em ordem a x, decresce exponencialmente com o
aumento de x (que frequentemente representa tempo).

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

101 / 416

Propriedades da Gompertz
y = uma assintota horizontal direita, e
y = 0 uma assintota horizontal esquerda.
y(x) uma funo estritamente crescente.
y(x) s toma valores em ]0, [.
diz-se a capacidade de sustentao do meio.
y(x) tem:

concavidade para cima se x < ;


concavidade para baixo se x > ;
ponto de inflexo em x = .

No ponto de inflexo x = , y atinge menos de metade da


capacidade de sustentao: y( ) = e < 2 .
y (x) tem mximo em x = , com valor y ( ) =

k
e .

y(x) no tem simetria em torno do seu ponto de inflexo.


NOTA: A Gompertz tem mais flexibilidade que a logstica.
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

102 / 416

Os parmetros da Gompertz

Na forma utilizada,

k (x )

y(x) = ee

capacidade de sustentao do meio;


vrios significados:

abcissa do ponto de inflexo;


ponto onde y alcana proporo 1e do seu valor mximo;
ponto onde a taxa de crescimento y (x ) mxima.

k taxa relativa de crescimento em x = (parmetro de controlo


da velocidade de queda da taxa de crescimento relativa).

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

103 / 416

O efeito dos parmetros nos grficos

Eis o efeito de variar cada um dos parmetros da Gompertz:


=4

k=2

=5

k = 0.5
3

k=1
3

Gompertz varios gama


4

Gompertz varios k
4

Gompertz varios alfa

6
x

J. Cadima (DM/ISA)

10

=1

2
1
0

=1

=3
=2

10

Modelao Estatstica II

10

2010-11

104 / 416

Uma propriedade da Gompertz


A Gompertz possui uma propriedade curiosa: qualquer potncia
positiva duma Gompertz ainda uma Gompertz.
De facto,
k (x )

y(x) = ee

y(x)

k (x )

= ee

com

= ;
= + lnk .

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

105 / 416

Parametrizaes alternativas da Gompertz

k (x )

y(x) = ee

- capacidade de sustentao do meio.


- abcissa do ponto de inflexo.
k - parmetro de controlo da taxa de crescimento.

y(x) = e e

kx

. (Corresponde a = ek )

, k mantm a interpretao anterior;


de interpretao mais difcil que ...

y(x) = . (Corresponde a = e = ee e = ek ).
x

- capacidade de sustentao do meio.


, - interpretao pouco clara.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

106 / 416

F.d.c.s como curvas de crescimento


A funo distribuio cumulativa de qualquer varivel aleatria
contnua, F (x) = P[X x], uma sigmide, com valores entre 0 e 1.
Se F (x; ) uma f.d.c., ento
f (x; , k, , ) = F [k(x ); ]
pode ser usada como curva de crescimento sigmide, sendo

a capacidade de sustentao do meio;


, k, parmetros de controlo do crescimento.
Exemplo. Seja (x) a f.d.c. duma Normal reduzida. A funo
f (x) = [k(x )]

( f.d.c. duma N , k1 ) uma curva de crescimento sigmide.
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

107 / 416

Modelo de Richards
A tentativa de flexibilizar ao mximo curvas de crescimento sigmides
levou proposta da curva de Richards, com 4 parmetros:
i 1
h
k (x ) 1
y = f ( |{z}
x
; , k, , ) = 1 + ( 1) e
| {z }
p=1
k =4
var .
param.

x R

1.5
1.0
0.5
0.0

richards(x, 2, 1, 3, 2)

2.0

(com , k > 0 e > 1).

10

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

108 / 416

Relao de Richards (cont.)


Motivao: Generaliza as curvas logstica e de Gompertz:
Quando = 2 tem-se a logstica.
Em limite, quando 1+ surge a Gompertz.
Para ver este ltimo limite, recorde-se que lim

z+

1 + zc

z

= ec e repare-se que, ao

tomar o limite em , podemos escrever a curva de Richards como:


h
i 1

1
1 + ( 1) ek (x )
= 
 ,
 1 = 
c z
1
+

1
z
ek (x )
1+ 1
1

1 (que tende para + quando tende para 1+ ) e c = ek (x ) (que


com z = 1
constante em relao ao limite em ). Logo, o limite vem

lim

z+

1 + zc

z =

k (x )

= ec = ee
,
ec

que a expresso da Gompertz.

NOTA: A maior flexibilidade da Richards tem um custo: o nmero


elevado de parmetros.
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

109 / 416

Propriedades da Richards
y = uma assintota horizontal direita, e
y = 0 uma assintota horizontal esquerda.
y(x) uma funo estritamente crescente.
y(x) s toma valores em ]0, [.
diz-se a capacidade de sustentao do meio.
y(x) tem:

concavidade para cima se x < ;


concavidade para baixo se x > ;
ponto de inflexo em x = .

No ponto de inflexo x = , y atinge um valor que controlado


pelo parmetro : y( ) = k 1/(1 ) .
y (x) tem mximo e x = , com valor y ( ) = k /(1 ) .
y(x) no tem simetria em torno do seu ponto de inflexo.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

110 / 416

Os parmetros da Richards
Na forma utilizada,
i 1
h
1
y(x) = 1 + ( 1) ek (x )
,

capacidade de sustentao do meio;


vrios significados:

abcissa do ponto de inflexo;


ponto onde a taxa de crescimento y (x ) mxima.

k parmetro de controlo da taxa de crescimento.

parmetro de controlo da ordenada no ponto de inflexo.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

111 / 416

O efeito do parmetro
A maior flexibilidade da curva de Richards, que permite controlar a
ordenada do ponto de inflexo, bem como a forma da curva,
ilustrada neste grfico, para trs valores de :

1.5
1.0
0.5

richards(x, 2, 1, 3, 2)

2.0

Richards, com alfa=2, k=1, gama=3

=5
=2

0.0

= 1.5
10

10

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

112 / 416

Modelo de von Bertalanffy


Nem todos os modelos de crescimento so sigmides.

1.5
0.5

1.0

=2
k=1
=3

0.0

vonBertalanffy(x, alfa, k, gama)

2.0

No modelo de von Bertalanffy, y cresce para uma assntota horizontal


superior, sendo a distncia que falta percorrer dada por uma
exponencial decrescente:
h
i
y = f ( |{z}
x
; , k, ) = 1 ek (x ) , x (k, > 0)
| {z }
p=1
k =3
var .
param.

10

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

113 / 416

Modelo von Bertalanffy (cont.)


Tambm um caso particular do modelo Richards, com = 0
(como < 1, a Richards j no tem que ter a forma sigmide).
Motivao: A relao de von Bertalanffy a soluo da equao
diferencial
y (x) = k [ y(x)] ,
Ou seja, a relao de von Bertalanffy admite que a taxa instantnea
de crescimento de y decresce linearmente com y.
Com muita frequncia, x representa o tempo.
Recordar: A logstica resulta de admitir uma relao semelhante, mas
para a taxa relativa de crescimento.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

114 / 416

Propriedades da von Bertalanffy

y = uma assintota horizontal direita


(No h assntota esquerda - recordar o domnio x ).
y(x) uma funo estritamente crescente.

y(x) s toma valores em [0, [.


diz-se a capacidade de sustentao do meio.
y(x) tem concavidade sempre voltada para baixo.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

115 / 416

Os parmetros da von Bertalanffy

Na forma utilizada,

y(x) = [1 ek (x ) ],

capacidade de sustentao do meio;


ponto inicial do domnio de x (tempo inicial x0 ).
k parmetro de controlo da taxa de crescimento de y
(A taxa de crescimento inicial lim y (x) = k ).
+
x

Com frequncia conhecido, uma vez que o valor inicial de x,


que muitas vezes o tempo. Neste caso, o modelo fica reduzido a
dois parmetros: e k.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

116 / 416

Utilizao do modelo von Bertalanffy

Utilizado em vrios contextos, como por exemplo:


Nas pescas, o modelo mais frequente para relacionar o
comprimento dum peixe (y) com a sua idade (x).
Os parmetros e k so especficos de cada espcie.
No estudo de fogos florestais usado para descrever a
recuperao da biomassa (y) como funo do tempo (x) aps um
fogo. Neste contexto conhecido por Modelo de Olson ou
monomolecular.
No estudo do crescimento de tumores.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

117 / 416

Modelo Michaelis-Menten
Um modelo cujas propriedades qualitativas so semelhantes ao do
modelo von Bertalanffy o modelo de Michaelis-Menten:
x 0 (1 , 2 > 0)

0.20
0.15
0.10
0.00

0.05

x/(2 + 3 * x)

0.25

0.30

1 x
y = f ( |{z}
x
; 1 , 2 ) =
,
| {z }
2 + x
p=1
k =2
var .
param.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

118 / 416

O modelo Michaelis-Menten linearizvel

Tomando recprocos, pode linearizar-se a relao


y =

1 x
2 + x

Obtm-se uma relao linear entre Y =


com = 21 e = 11 :
1
1
1
= 2 +
Y
1 x
1

J. Cadima (DM/ISA)

1
Y

e x = x1 ,

Y = + x ,

Modelao Estatstica II

2010-11

119 / 416

Propriedades do modelo Michaelis-Menten

y = 1 uma assintota horizontal direita


(No h assntota esquerda - recordar o domnio x 0).
y(x) uma funo estritamente crescente.

y(x) s toma valores em [0, 1 [.


1 diz-se a capacidade de sustentao do meio.
y(x) tem concavidade sempre voltada para baixo.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

120 / 416

Parmetros da Michaelis-Menten

Na forma utilizada,
y(x) =

1 x
,
2 + x

1 capacidade de sustentao do meio;


2 parmetro de controlo da taxa de crescimento de y
(A taxa de crescimento inicial y (0) = 12 ).

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

121 / 416

Parametrizaes alternativas do Michaelis-Menten

y(x) =

1 capacidade de sustentao do meio.


2 parmetro de controlo da taxa de crescimento.

y(x) =

x
1+ kx

. (Corresponde a k = 2 , =

1
2 )

k capacidade de sustentao do meio;


k parmetro de controlo da taxa de crescimento.

y(x) =

1 x
2 +x

x
+ x .

(Corresponde a =

2
1

e=

1
1 ).

1/ - capacidade de sustentao do meio.


- parmetro de controlo da taxa de crescimento.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

122 / 416

Utilizao do modelo Michaelis-Menten

Utilizado em vrios contextos, como por exemplo:


No estudo de reaces enzimticas;
Nas pescas, o modelo Beverton e Holt para o recrutamento y
(nmero de peixes numa nova gerao), como funo dos
mananciais (stocks) x de progenitores.
No estudo de rendimentos agrcolas usado para descrever o
rendimento total y (produo por unidade de rea) como funo
da densidade x da cultura (nmero de plantas por unidade de
rea). Neste contexto conhecido por Modelo Shinozaki & Kira.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

123 / 416

Modelos de rendimento
Uma classe de modelos utilizada em produes agrcolas (mas no
s) a dos chamados modelos de rendimento, onde se relaciona:
y - rendimento total duma cultura (produo por unidade de rea).
x - densidade da cultura (nmero de plantas por unidade de rea).
Em geral, a produo/planta (y/x) tende a diminuir com o aumento de
densidade, devido concorrncia por recursos.
O rendimento global (y) pode:
aumentar sempre (os chamados modelos assintticos), de que o
modelo Michaelis-Menten exemplo; ou
diminuir a partir de certa altura (os chamados modelos
parablicos).

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

124 / 416

Modelos de rendimento parablicos

0.8
0.6
0.4
0.0

0.2

1.5 * x * exp(x/2)

1.0

Nos modelos de rendimento parablicos, o rendimento total decresce


para valores mais elevados de x (densidade):

10

15

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

125 / 416

Exemplos de modelos de rendimento parablico


So exemplos de modelos de rendimento parablicos:
O modelo de Holliday (1960, agricultura, 3 parmetros):
x
y =
+ x + x2
O modelo de Bleasdale & Nelder (1960, agricultura, 4
parmetros):
1/
y = x + x

[Nas pescas, Deriso (1980), s com 3 parmetros: = 1].


O modelo de Ricker (1954, pescas, 2 parmetros):
y = xex/k
O modelo de Shepherd (1982, pescas, 3 parmetros):
x
y =
c
1 + kx
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

126 / 416

Modelo hiperblico
Relaes em que y decresce medida que x aumenta podem ser
descritas por uma relao de (quase) proporcionalidade inversa:
x R ( > 0)

3
2
0

1/(0.2 + 3 * x)

1
y = f ( |{z}
x
; , ) =
,
|{z}
+x
p=1
k =2
var .
param.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

127 / 416

Linearizao do modelo hiperblico


Tomando recprocos, obtm-se uma relao linear entre Y = 1/Y e x:
1
= + x
Y

Y = + x .

Usado na modelao de rendimento por planta (y) vs. densidade da


cultura ou povoamento (x).
Se a relao entre rendimento per capita e densidade segue o modelo
hiperblico, a relao entre rendimento total e densidade segue o
modelo Shinozaki & Kira (Michaelis-Menten).

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

128 / 416

Estimao de parmetros na regresso no linear

Para estimar os parmetros numa regresso no linear parte-se de



Y = f (x, ) +
E [ ] = 0
e de n observaes nas variveis do modelo, {(xi , yi )}ni=1 .
Critrio: minimizar a soma de quadrados dos resduos:
min S( ) = min

ei2

i=1

= min

[yi f (xi , )]2

i=1

= min ky f k2 ,

onde
= (1 , 2 , ..., k ) o vector dos k parmetros (incgnitas de S);
y vector com as n observaes de Y ;
f vector com os n valores da funo f (x, ), dadas as n
observaes dos preditores xi e valores para os parmetros .
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

129 / 416

Visualizao geomtrica do critrio


Vista como funo das p variveis preditoras Xi , e dados os valores
dos parmetros , o grfico de f uma superfcie no linear em Rp+1 :
y

Rp+1

(x1 , y1 )
(x2 , y2 )
e1

Y = f (x, )

en

(x3 , y3 )

(xn , yn )

xp

x1

x3

x2

Procura-se o cuja superfcie associada minimiza S( ) = ei2 .


i=1

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

130 / 416

Visualizao geomtrica alternativa


Em vez do grfico de f , pode-se considerar o grfico da funo
objectivo S( ) = ky f k2 . funo dos k parmetros :
z

Rk +1
z = S( )

p
2

min
3

Procura-se o mnimo global da funo S( ).


J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

131 / 416

Estimao dos parmetros


O mnimo global de S( ) :
um mnimo local no interior do domnio de S; ou
um ponto na fronteira do domnio de S (valores admissveis de ).
Vamos admitir que:
Rk , sem restries;

f regular (diferencivel em ordem a qualquer j ).

Condio necessria para que S tenha mnimo local em = que:


(grad S) = = 0

J. Cadima (DM/ISA)

S
( ) = 0 ,
j

Modelao Estatstica II

j = 1, ..., k .

2010-11

132 / 416

Estimao dos parmetros (cont.)


S( ) =

[yi f (xi , )]2

i=1

Anular as derivadas parciais significa:

S
j = 1, ..., k
j ( ) = 0 ,
n
[yi f (xi , )] f j (xi , ) =
i=1

0,

j = 1, ..., k

Designando
e [y
h i f (xi , i)] vector dos n resduos;

fj( ) f (xi , ) vector dos n valores da derivada parcial de f


j
em ordem a j .
Condio para a existncia de ponto crtico de f em :

et fj( ) ,
J. Cadima (DM/ISA)

j = 1, ..., k .

Modelao Estatstica II

2010-11

133 / 416

Estimao dos parmetros (cont.)


Podem escrever-se estas k condies numa nica equao matricial.
Seja D a matriz cujo elemento (i, j) dij = f j (xi , ). Ou seja,
A linha i de D o gradiente de f no ponto (xi , ) (com i = 1, ..., n).

A coluna j de D o vector fj( ) (com j = 1, ..., k).


Condio necessria para que haja mnimo local de S( ) em que:
Dt e = 0 .
Esta condio significa que o vector dos resduos tem de ser

ortogonal aos k vectores fj( ) (das derivadas parciais de f ).


Mas cada possvel vector determina quer o vector dos residuos, quer
os vectores das derivadas parciais. Como determinar o vector que
garante a ortogonalidade desejada? Necessrios mtodos numricos!
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

134 / 416

Exemplo 1 - Regresso linear mltipla


f (x, ) = 0 + 1 x1 + 2 x2 + ... + p xp .
Neste caso, as derivadas parciais no dependem de :
(
f
0 (xi , ) = 1
f
( j = 1, ..., p)
j (xi , ) = xj
Logo, a matriz D = D no depende de :

1 x1(1) x2(1) xp(1)


1 x1(2) x2(2) xp(2)

D = D = 1 x1(3) x2(3) xp(3)


..
..
..
..
..
.
.
.
.
.
1 x1(n) x2(n) xp(n)

= X,

onde D = X a matriz do modelo do estudo do Modelo Linear.


J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

135 / 416

Exemplo 1 (cont.)

A condio necessria para a existncia de mnimo vem:


Dt e = 0 Xt [Y X ] = 0
Xt Y = Xt X

(Xt X)1 Xt Y = ,

como j sabamos do estudo do modelo linear.


Aqui h uma soluo explcita (admitindo que as colunas de X so
linearmente independentes). Para modelos no lineares no assim.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

136 / 416

Exemplo 2 Relao potncia


f (x; , ) = x .
Neste caso, as derivadas parciais dependem de = ( , ):
(
f

(x; , ) = x
f

(x; , ) = x ln x
Logo, a matriz D de dimenso n 2 e depende de , tal como o
vector dos residuos e :

J. Cadima (DM/ISA)

x1

x2

x3
..
.

xn

x1 ln x1

x2 ln x2

x3 ln x3
,

..

xn ln xn

Modelao Estatstica II

y1 x1

y2 x2

y3 x3
..
.

yn xn

2010-11

137 / 416

Exemplo 2 (cont.)
Logo, a condio necessria vem:

Dt e = 0

xi (yi xi )

= 0

i=1

xi ln xi (yi xi ) = 0
i=1

n
n

=
xi2

yi xi
i=1

yi xi ln xi
i=1

i=1
2
xi
i=1
n

ln xi

Este sistema no tem soluo explcita!

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

138 / 416

O Mtodo de Gauss-Newton na estimao dos


parmetros
Um algoritmo frequentemente usado para estimar os parmetros
numa regresso no linear o de Gauss-Newton:
[0]

[0]

[0]

Passo 1: Escolher uma soluo inicial [0] = (1 , 2 , ..., k ).


Possibilidades:
utilizar eventuais interpretaes biolgicas dos parmetros
(capacidade de sustentao do meio, ponto de inflexo duma
sigmide, etc.) para encontrar bons valores dos parmetros.
caso a relao no linear seja linearizvel, podem utilizar-se os
valores obtidos a partir da relao linearizada
(destransformados).
fazer uma inspeco numrica ad hoc.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

139 / 416

Gauss-Newton (cont.)

Passo 2: Linearizar f em torno de [0] , utilizando a frmula de Taylor:

( [0] )
f ( ) f ( [0] ) + (grad f )t
= [0]
f
f
[0]
[0]
( [0] )(1 1 ) +
( [0] )(2 2 ) +
f ( ) f ( [0] ) +
1
2
f
[0]
+ ... +
( [0] )(k k )
k

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

140 / 416

Gauss-Newton (cont.)
Passo 3: Aproximar S( ), usando a aproximao linear de f .

[0]
S( ) S [0] ( ) = k Y f(x, [0] ) D ( [0] )k2
{z
}
|
[0]

=e

= k

[0]

[0]

e + D [0]
|
{z
}
[0]
sem , apenas

[0]
D k2

Procuramos o vector = que minimiza a aproximao S [0] ( ).


Repare-se na analogia com o caso linear, em que se procura
[0]
[0]
[0]
minimizar kY X k2 . Aqui Y = e + D [0] , X = D e = .
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

141 / 416

Gauss-Newton (cont.)
Passo 4: Minimizar a funo objectivo aproximada, S [0] ( ):

[0] t [0]
D D

1

[0] t

[0]
[0]
e + D [0]

aproveitando a analogia referida no fim do acetato anterior.


Este ltimo vector agora considerado a nova soluo aproximada:

[1]

[0]


1
[0] t [0]
[0] t [0]
+ D D
D e .

Desencadeia-se agora um processo iterativo que segue os passos


indicados, partindo da nova soluo [1] .

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

142 / 416

Gauss-Newton (cont.)
Passo 5: Processo iterativo:
Dada uma soluo provisria [j] , linearizar f em torno de [j] :
f ( ) f ( [j] ) + (grad f )t = [j] ( [j] )
Usando as observaes {(xi , yi )}ni=1 e esta linearizao, construir
uma nova aproximao da funo objectivo:
S( ) S [j]( )

[j]
k Y f(x, [j] ) D ( [j] )k2
{z
}
|
[j]

=e

Obter uma nova estimativa [j+1] :



1
t
[j] t [j]
[j+1] = [j] + D[j] D[j]
D e .

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

143 / 416

Gauss-Newton Critrios de paragem


[j] t [j]

NOTA: Se, para algum j se verificar D e = 0, ter-se-


necessariamente [j+1] = [j] da em diante, pelo que a soluo exacta
= ser a soluo produzida pelo algoritmo.
Em geral, os critrios de paragem podem ser diferentes:
Efectuar um nmero pr-determinado de iteraes.
Quando a modificao [j] [j+1] fr pequena:
k [j] [j+1] k abaixo de algum limiar.
[j]

[j+1]

Quando a modificao dos resduos e e


[j]
[j+1]
ke e k

fr pequena:

abaixo de algum limiar.

Quando se verificar uma quase ortogonalidade entre o vector


[j]
dos resduos e as colunas da matriz D :
[j] t [j]

kD e k abaixo de algum limiar.


J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

144 / 416

Advertncias sobre o mtodo Gauss-Newton


A convergncia no est garantida.

A soluo inicial [0] pode estar demasiado distante do ptimo.


Pode haver no linearidade acentuada em torno de [j ] , tornando a
aproximao linear de f pobre. At possvel que
S( [j +1] ) > S( [j ] ).
[j ]
A matriz D pode ter problemas de (quase) multicolinearidade,
[j ] t

[j ]

comprometendo o clculo de (D D )1 .

Mesmo havendo convergncia, pode ser para um vector


sub-optimal (e.g., um mnimo local que no seja mnimo global).
Distinguir entre (o mnimo exacto de S( )) e (a soluo final
do algoritmo).

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

145 / 416

A estimao de parmetros no
A funo nls (de Nonlinear Least Squares) utiliza uma variante do
mtodo Gauss-Newton para estimar os parmetros duma regresso
no linear pelo mtodo dos mnimos quadrados.
Na sua forma mnima, o comando nls exige dois argumentos:
a formula que indica a relao no linear entre a varivel
resposta Y e os preditores X1 , ..., Xp .
o vector start com os valores iniciais dos parmetros da frmula.
Exemplo: Caso se pretenda ajustar um modelo potncia y = x a
partir de valores iniciais 0 = 3 e 0 = 2, o comando tomaria a forma:
> nls(y ~ alfa*x^beta, start=c(alfa=3, beta=2))

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

146 / 416

A estimao de parmetros no

(cont.)

A modificao do algoritmo Gauss-Newton usada na funo nls o


chamado mtodo de Box-Hartley.
Nesta modificao, a transio do vector [j] de parmetros para o
vector seguinte, [j+1] feita a partir da frmula:

[j+1]

[j]


1
[j] t [j]
[j] t [j]
+ D D
D e .

Inicialmente considera-se = 1, o que gera a passagem do mtodo


Gauss-Newton. Mas caso se verifique que S [j+1]( ) > S [j] ( ) (ou seja,
que o critrio que se deseja minimizar piorou), so experimentados
valores de correspondentes a metade do anterior, at que a soma
de quadrados residual desa (ou at que atinja um valor mnimo,
que por omisso 1/1024, mas pode ser controlado pelo utilizador).

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

147 / 416

A estimao de parmetros no

(cont.)

O critrio de paragem da funo nls do ltimo tipo no acetato 144:


baseia-se no ngulo entre o vector dos resduos no passo em causa
[j]
[j]
(e ) e o hiperplano tangente gerado pelas colunas da matriz D .
Mais concretamente, utiliza o relative offset convergence criterion, dado por
[j]
kPD e k/ k
r =
,
[j]
k(In PD )e k/ n k
onde PD indica a matriz de projeco ortogonal sobre o espao gerado pelas colunas
[j]

[j]

da matriz D . Trata-se duma funo da co-tangente do ngulo entre e e o


hiperplano tangente a f . Valores prximos de zero indicam quase ortogonalidade.
Por omisso, a funo nls considera r < 0.00001 como critrio de paragem.

Caso este critrio de paragem no seja atingido, o algoritmo para ao


fim dum nmero fixo de iteraes (por omisso 50).

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

148 / 416

A estimao de parmetros no

(cont.)

Caso se deseje controlar parmetros associados ao critrio de


paragem, pode utilizar-se o argumento control, que aceita como
argumento um vector de novos argumentos.
Entre estes novos argumentos esto:
tol controla o limiar para o critrio de convergncia (acetato
148). Se r < tol, o algoritmo pra.
maxiter controla o nmero mximo de iteraes, aps as quais
o algoritmo pra, mesmo que r ainda exceda o valor tol.
Exemplo: Para repetir o ajustamento do Exemplo anterior, mas
permitindo que se v at 100 iteraes se antes no se tiver verificado
r < 1 106, invoca-se:
> nls(y ~ alfa*x^beta, start=c(alfa=3, beta=2),
+
control=c(tol=1e-6,maxiter=100))
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

149 / 416

Inferncia na Regresso No Linear


No foram precisas hipteses distribucionais para obter estimadores
de Mnimos Quadrados - tal como no Modelo Linear.
Mas para fazer inferncia estatstica so sempre necessrias
hipteses adicionais.
Vamos introduzir pressupostos adicionais semelhantes aos do Modelo
Linear, admitindo a existncia de erros aleatrios:
aditivos e de mdia zero
Normais
de varincia constante
independentes.
Estas hipteses sobre os erros podem ser sintetizadas usando a
distribuio Multinormal.
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

150 / 416

A distribuio Multinormal

Seja Y um vector aleatrio n-dimensional. Diz-se que Y tem


distribuio Multinormal, com parmetros dados pelo vector e
a matriz (definida positiva) se a sua funo densidade conjunta fr
dada por:
fY (y) =

(2 )n/2

1
p

e 2 (y )
1

)
det(

(y )

y Rn

).
Nesse caso, escreve-se: Y Nn ( ,

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

151 / 416

A funo densidade Binormal

z
y

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

152 / 416

Propriedades da distribuio Multinormal


Teorema 3.2 de Modelao Estatstica I
), ento:
Seja Y Nn ( ,
1
E [Y] = e V [Y] = .
2

Distribuies marginais de Y so tambm multinormais.


.
.
.
). Os subvectores Yi e Yj
Seja Y = [ Yt1 .. Yt2 .. ..Ytr ]t Nn ( ,
so independentes se e s se a submatriz de V [Y] =
correspondente fr constituda apenas por zeros.
Combinaes lineares das componentes dum vector multinormal
so Normais: at Y N (at , at a).

Se Cpn matriz de caracterstica p n, e ap+1 um vector


Ct ).
(no-aleatrio), ento CY + a Np (C + a, C
Q = (Y )t 1 (Y ) n2 .

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

153 / 416

Observaes sobre a Multinormal


1

Se Y composto por trs subvectores Y1 , Y2 e Y3 , a alnea 3 do


Teorema implica que Y1 e Y2 so independentes se e s se a
matriz V [Y] = fr da forma:

..
..
0
. 13
11 .

..
..
= 0

.
.
22
23

.
.
31 .. 32 .. 33

Na alnea 5 exige-se que car (C) = p n para garantir que


Ct seja no singular, isto , que exista [C
Ct ]1 .
V [Cy + a] = C
Existe uma definio mais geral de distribuio Multinormal,
que aqui no necessria.
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

154 / 416

O Modelo de Regresso No Linear


Modelo de Regresso No Linear
H n conjuntos de observaes {(xi , Yi )}, onde:

(i = 1, ..., n)
Yi = f (xi , ) + i 
Nn 0, 2 In ,
onde o vector dos n erros aleatrios i .

Tendo em conta as propriedades da Multinormal, o que acima se diz


equivale a:
Yi = f (xi , ) + i , i = 1, ..., n.

i Normais.
E [i ] = 0.
V [i ] = 2 .
{i }ni=1 variveis independentes (porque Cov(i , j ) = 0 se i 6= j).
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

155 / 416

Primeiras consequncias
Consequncia:
As observaes da varivel resposta, Yi so independentes e:


i = 1, ...., n
Yi N f (xi , ), 2

Este resultado decorre das propriedades da Multinormal e traduz-se


na seguintes afirmao relativa ao vector Y das n observaes Yi :


Y Nn f(X, ), 2 In ,
onde f(X, ) representa o vector das n mdias f (xi , ) (i = 1, ..., n).

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

156 / 416

A inferncia com estimadores MQ


A inferncia baseada nos estimadores de Mnimos Quadrados na
regresso no linear apenas aproximada.
A idea fundamental consiste em:
aproximar a superfcie y = f (x, ) pelo seu hiperplano tangente;
utilizar a teoria do Modelo Linear para obter resultados
distribucionais aproximados que permitam a inferncia.
H mais do que uma fonte de aproximao nos resultados
inferenciais, e a qualidade dos mesmos pode ser pobre.
Problemas grandes surgem sobretudo com:
superfcies fortemente no lineares (aproximao linear fraca).
amostras pequenas.
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

157 / 416

Os estimadores de Mxima Verosimilhana


A introduo dos pressupostos distribucionais adicionais permite
encarar um mtodo alternativo de estimao dos parmetros do
modelo: o mtodo da Mxima Verosimilhana.
Este mtodo vai ter duas vantagens:
produz os mesmos estimadores que o mtodo dos Mnimos
Quadrados.
permite utilizar as propriedades assintticas gerais dos
estimadores de Mxima Verosimilhana, estudados na disciplina
de Complementos de Probabilidades e Estatstica deste
Mestrado.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

158 / 416

O Mtodo da Mxima Verosimilhana


Admita-se que temos uma amostra aleatria de n observaes
independentes Yi , com distribuio g(yi , ). Ento a distribuio
conjunta das n observaes :
n

g(yi , ) .

i=1

Olhando para esta ltima funo como funo dos parmetros , e


considerando as observaes como fixas, temos a chamada funo
verosimilhana da amostra:
L( ; y) =

g(yi , ) .

i=1

Os estimadores de mxima verosimilhana dos parmetros so


dados pelo vector = que maximiza a funo verosimilhana.
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

159 / 416

A funo verosimilhana no Modelo No Linear


No nosso contexto,
recordar que g(yi , ) a densidade duma N
H parmetros , mas tambm 2 .
a funo verosimilhana da amostra :



f (xi , ), 2 .

[y f (xi ; )]2
1
12 i
2

i=1 2
n
n

1 2 [yi f (xi , )]2
1
2 i=1

e
=
2 2

L( , 2 , y, X) =

O logaritmo da funo verosimilhana :


n
1 n
L ( , ; y, X) = ln (2 2 )
[yi f (xi , )]2
2
2 2 i=1
1
n
S( )
= ln (2 2 )
2
2 2
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

160 / 416

Estimadores de mxima verosimilhana (cont.)

Maximizar a verosimilhana equivalente a maximizar a


log-verosimilhana (o logaritmo uma funo crescente).
Mas maximizar a log-verosimilhana (como funo de )
1
n
S( )
L ( ; , y, X) = ln (2 2 )
2
2 2
equivale a minimizar S( ).
Logo, na regresso no linear, os estimadores de Mxima
Verosimilhana so os estimadores de Mnimos Quadrados de .

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

161 / 416

Propriedades dos estimadores MV


Sabemos (da disciplina CPE), que estimadores de mxima
verosimilhana so:
assintoticamente multinormais
assintoticamente centrados (E [ ] ).

assintoticamente de matriz de varincias-covarincias I 1 , onde

I = E [H ]
a matriz de Informao de Fisher, sendo H a matriz Hessiana
da log-verosimilhana L , no ponto , cujo elemento (j, m) :
H

J. Cadima (DM/ISA)

(j,m)

2 L
j m

Modelao Estatstica II

2010-11

162 / 416

Estimadores de mxima verosimilhana (cont.)


No nosso contexto,

1 t
D D
2
= 2 (Dt D )1

E [H ] =
I 1

Logo, assintoticamente tem-se



Nk , 2 (Dt D )1

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

163 / 416

Combinaes lineares dos parmetros


Se (aproximadamente) Nk ( , 2 (Dt D )1 ) , tem-se, para
qualquer combinao linear dos k parmetros, at = a1 1 + ... + ak k :
(Teorema 3.2, disciplina de Modelao Estatstica I)
at N ( at , 2 at (Dt D )1 a ) .
Reduzindo a Normal,
q

J. Cadima (DM/ISA)

at at

2 at (Dt D )1 a

N (0, 1) .

Modelao Estatstica II

2010-11

164 / 416

Inferncia Multivariada

(Teorema 8.1, disciplina de Estatstica Multivariada, que garante


) Q = (W )t 1 (W ) n2 ):
que W Nn ( ,
Q =

( )t (Dt D )( )

k2 .

Subsiste o problema usual: a varincia dos erros 2 desconhecida.


Procuremos um estimador de 2 .

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

165 / 416

Estimador MV para 2

O estimador de Mxima Verosimilhana para 2 resulta de anular a


derivada parcial de L em ordem a 2 (vista como uma quantidade
nica, e no como um quadrado, e admitindo os fixos). Tendo em
conta a expresso da log-verosimilhana (acetato 161), vem:

L 2
( ; x, y, ) = 0
2
1
n
S( ) = 0
2+
2
2( 2 )2
S( )
.
2 =
n

Mas hbito usar um outro estimador (mltiplo deste), que resulta da


teoria de Mnimos Quadrados e permite associar um resultado
distribucional:
S( )
.
2 =
nk
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

166 / 416

Estimador MQ para 2
Linearize-se f em torno do verdadeiro vector dos parmetros, que
neste ponto indicado por = v (para diferenciar do que
representa a varivel livre)):
( v )
f ( ) f ( v ) + (grad f )t
=v
f ( v ) + D v ( v )
sendo D v a matriz das derivadas parciais, calculada em = v .
Esta linearizao uma primeira fonte de aproximao.
Por analogia com o que se fez no acetato 141, obtm-se, com base
nesta aproximao, uma aproximao funo da soma de
quadrados de resduos, S( ).

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

167 / 416

A inferncia (cont.)
Considere esta aproximao soma de quadrados dos resduos:
S( ) k Y f(x, v ) D v ( v )k2
|
{z
}
=
= k( + D v v ) D v k2 ,

sendo o vector dos erros aleatrios.


Por analogia com o Modelo Linear, esta funo mnima em:
=

= v + (Dt v D v )1 Dt v ,
D v ( v ) = D v (Dt v D v )1 Dt v = PD v ,

sendo PD v a matriz de projeco ortogonal sobre o subespao


gerado pelas colunas da matriz D v .
Logo, a aproximao de S( ) tem mnimo (aproximado):
min S( ) k(In PD v ) k2 = t (In PD v ) .
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

168 / 416

A inferncia (cont.)

Em Modelao Estatstica I viu-se (Teorema 3.7) que,


)
X Nn (0,

2
Xt AX tr(A)

A
= A
.
se e s se A
Tomando X = e A =

In PD v

, verifica-se a condio, pelo que:


S( )
2
nk
2

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

169 / 416

A inferncia (cont.)

2 , ter-se-ia:
Admitindo a distribuio nk
#
"
S( )
= nk

E
2

"

S( )
E
nk

= 2 ,

pelo que, tal como na regresso linear, se toma como estimador da


varincia 2 dos erros aleatrios:

2 =

J. Cadima (DM/ISA)

S( )
.
nk

Modelao Estatstica II

2010-11

170 / 416

A inferncia (cont.)
Os resultados distribucionais (aproximados) do acetato 164 significam,
por analogia com o Modelo Linear, que para qualquer combinao
linear dos k parmetros, at = a1 1 + a2 2 + ... + ak k (agora volta a
designar o verdadeiro valor dos parmetros), se tem:

at at

2 at (Dt D )1 a

N (0, 1)

at at

2 at (Dt D )1 a

tnk .

Mas subsiste um obstculo utilizao prtica deste resultado: a


matriz D (a matriz das derivadas parciais de f em ordem aos k
parmetros, no ponto ptimo ) desconhecida.
A soluo mais pragmtica do que teoricamente correcta:
substitui-se a matriz desconhecida D pela matriz conhecida D .
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

171 / 416

A inferncia (cont.)

O resultado do acetato anterior permite ( semelhana do que se faz


no Modelo Linear) construir intervalos de confiana e efectuar testes
de hipteses para qualquer combinao linear dos parmetros .
Em particular

at = a1 1 + a2 2 + ... + ak k

inclui dois importantes casos particulares:


1
2

Se a = ei (i-simo vector da base cannica de Rk ), ento at = i .


Se a = ei ej , ento at = i j .

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

172 / 416

ICs para combinaes lineares de parmetros

Um intervalo a (1 ) 100% de confiana para a combinao linear


at :
i
h
at t 2 ;nk at , at + t 2 ;nk at
q
sendo at = 2 at (Dt D )1 a.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

173 / 416

Casos particulares de ICs para at


Parmetros individuais (a = ej )
Um intervalo a (1 ) 100% de confiana para j :
i
h
j t ;nk , j + t ;nk
,
2

sendo

q
2 (Dt D )1
(j,j ) .

Soma/diferena de parmetros (a = ei ej )
um intervalo a (1 ) 100% de confiana para i j :
i
h
(i j ) t 2 ;nk i j , (i j ) + t 2 ;nk i j
,
com =
i

J. Cadima (DM/ISA)

q
i , j ].
[i ] + V
[j ] 2 Cov[
V

Modelao Estatstica II

2010-11

174 / 416

Teste bilateral a uma comb. linear dos parmetros


Hipteses:

H0 : at = c

Estatstica do Teste:

T=

vs.
at at |H0
at

H1 : at 6= c

tnk

q
(com at = 2 at (Dt D )1 a).

Nvel de significncia: Escolher = P[Rejeitar H0 | H0 verdade].


Regio Crtica: (Bilateral) Rejeitar H0 se |Tcalc | > t 2 ;nk

Concluso: Calcular o valor da estatstica,


Tcalc =

at c
,
at

Decidir sobre a rejeio, ou no, de H0 .

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

175 / 416

Teste unilateral direito a

Hipteses:

H0 : at c

at

H1 : at > c

vs.
at

Estatstica do Teste: T = t

 a
q
com at = 2 at (Dt D )1 a .

tnk

Nvel de significncia: Escolher o nvel de significncia .


Regio Crtica: (Unilateral direita) Rejeitar H0 se Tcalc > t ;nk

Concluso: Determinar Tcalc para a amostra observada e decidir.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

176 / 416

at .

Teste unilateral esquerdo a

Hipteses:

H0 : at c

H1 : at < c

vs.
at

Estatstica do Teste: T = t

 a
q
com at = 2 at (Dt D )1 a .

tnk

Nvel de significncia: Escolher o nvel de significncia .


Regio Crtica: (Unilateral esquerda) Rej. H0 se Tcalc < t ;nk

Concluso: Determinar Tcalc para a amostra observada e decidir.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

177 / 416

p-values

p-value ou valor de prova da estatstica calculada:


probabilidade da estatstica de teste tomar um valor to, ou
mais, extremo que Tcalc , onde a definio de extremo est
associada ao tipo de regio crtica relevante.
Se Regio Crtica unilateral direita, p = P[ T > Tcalc ].
Se Regio Crtica unilateral esquerda, p = P[ T < Tcalc ].
Se Regio Crtica bilateral, p = 2 P[ T > |Tcalc | ].

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

178 / 416

A inferncia no
Existem mtodos para os objectos produzidos pela funo nls,
semelhana do que sucedia com o comando lm na Regresso Linear.
Eis alguns exemplos.
O comando summary aplicado aos dados do Exerccio 6:
> videiras.nls <- nls(Area ~ alfa * NP^beta, start = c(alfa=1,beta=1),
+
data = videiras)
> summary(videiras.nls)
Formula: Area ~ alfa * NP^beta
Parameters:
Estimate Std. Error t value Pr(>|t|)
alfa 1.59338
0.16208
9.831
<2e-16 ***
beta 1.92777
0.04031 47.821
<2e-16 ***
--Residual standard error: 28.84 on 598 degrees of freedom
Number of iterations to convergence: 7
Achieved convergence tolerance: 2.135e-07
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

179 / 416

A inferncia no

(cont.)

Mais alguns comandos, com os dados do Exerccio 3:


O comando coef devolve os parmetros estimados:
> coef(tamboril.nls)
alfa
k
105.5746760
0.0744533

gama
-0.2621344

O comando fitted devolve os valores ajustados yi :


> tamboril.nls <- nls(L ~ alfa*(1-exp(-k*(t-gama))),
+
start=c(alfa=90, k=0.1, gama=0), data=tamboril)
> fitted(tamboril.nls)
[1] 9.468993 16.364497 22.765254 28.706763 34.221973 39.341471 44.093649
[8] 48.504863 52.599575 56.400495 59.928703 63.203764
attr(,"label")
[1] "Fitted values"

O comando residuals devolve os resduos:


> residuals(tamboril.nls)
[1] -0.26899251 0.13550320 0.13474570 0.09323733
[7] 0.30635077 0.49513731 -0.29957518 -1.40049540
attr(,"label")
[1] "Residuals"

J. Cadima (DM/ISA)

0.47802733 -0.74147086
0.87129731 0.19623601

Modelao Estatstica II

2010-11

180 / 416

A inferncia no

(cont.)

Mais comandos, com os dados do Exerccio 6:


O comando vcov devolve a matriz estimada de
varincias-covarincias dos parmetros estimados, ou seja a
matriz

1
[ ] = 2 Dt D
V

> vcov(videiras.nls)
alfa
beta
alfa 0.026270117 -0.006520814
beta -0.006520814 0.001625071

)
Nota: O valor do erro padro estimado, 2 = S(
nk dado na listagem
produzida pelo comando summary, com a designao Residual
standard error.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

181 / 416

A inferncia no

(cont.)

Para obter a matriz D , cuja coluna j o vector com os n valores da


j-sima derivada parcial de f , f j , pode executar-se a funo
gradient, que se encontra na componente m dum objecto produzido
pelo comando nls (aqui exemplificada com os dados do Exerccio 3):
> tamboril.nls$m$gradient()
[,1]
[,2]
[,3]
[1,] 0.0896900 121.2983 -7.155386
[2,] 0.1550040 201.8054 -6.641992
[3,] 0.2156318 270.1355 -6.165436
[4,] 0.2719095 327.6214 -5.723069
[5,] 0.3241494 375.4675 -5.312445
[6,] 0.3726412 414.7612 -4.931283
[7,] 0.4176537 446.4835 -4.577464
[8,] 0.4594365 471.5185 -4.249039
[9,] 0.4982215 490.6625 -3.944171
[10,] 0.5342237 504.6321 -3.661178
[11,] 0.5676428 514.0711 -3.398494
[12,] 0.5986641 519.5578 -3.154653
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

182 / 416

Inferncia multivariada
J vimos que, assintoticamente,
Q =
e

( )t (Dt D )( )

k2 .

S( )
2
nk
2

Tem-se independncia entre os resduos (que definem S( )) e os


parmetros ajustados, pelo que:
( )t (Dt D )( )
k 2

J. Cadima (DM/ISA)

Modelao Estatstica II

F(k ,nk ) .

2010-11

183 / 416

Regio de confiana multivariada


O resultado do acetato anterior serve de base para a definio de
regies de confiana multivariadas (aproximadas) para os parmetros
.
Como em situaes anteriores, a matriz (desconhecida) D
substituda pela matriz (conhecida) D , definindo a regio
(aproximada) a (1 ) 100% de confiana para o vector dos
parmetros :
( )t Dt D ( ) k 2 f (k ,nk ) .

A validade destas regies depende da validade da aproximao linear


de f que esteve na base dos resultados distribucionais anteriores.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

184 / 416

Exemplo - os dados do Exerccio 6

1.80 1.85 1.90 1.95 2.00 2.05

Regioes confianca parametros videiras

0.9

9
0.9

0.9

1.0

1.2

1.4

1.6

1.8

2.0

2.2

Figura: Regies multivariadas a 90, 95 e 99% de confiana (a amarelo) e


intervalos a 95% de confiana (a azul) para e
Modelo potncia relacionando a rea e o comprimento da nervura principal
em n = 600 folhas de videira.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

185 / 416

Testes multivariados a
Hipteses:

H0 : =

vs.

Estatstica do Teste:
F =

H1 : 6=

( )t (Dt D )( )
k 2

F(k ,nk ) ,

sob H0 .

Nvel de significncia: Escolher = P[Rejeitar H0 | H0 verdade].

Regio Crtica: (Unilateral direita) Rejeitar H0 se Fcalc > f ;(k ,nk )

Concluso: Calcular o valor da estatstica,


Fcalc =

( )t (Dt D )( )
.
k 2

Decidir sobre a rejeio, ou no, de H0 .


J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

186 / 416

Comentrios
As regies de confiana multivariadas agora referidas tornam-se
impraticveis para mais do que dois parmetros, embora testes de
hipteses para hipteses nulas simples continuem a ser viveis.
Uma forma alternativa de pensar no problema dam inferncia passa
pelas chamadas funes de perfis. Estas funes so tambm teis
no estudo da qualidade da aproximao linear.
Comecemos por recordar um resultado geral de inferncia, j
estudado na disciplina de Complementos de Probabilidades e
Estatstica (e que voltar a ser de grande utilidade no captulo 3 desta
disciplina): o Teorema de Wilks.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

187 / 416

A razo de verosimilhanas
Seja (Y1 , Y2 , ..., Yn ) uma amostra aleatria. Seja L( |x) a sua funo
verosimilhana, onde designa um vector de parmetros. Designa-se
razo de verosimilhanas a:
max L( |x)
0
Rn (x) =
L( |x)
max
(0 1 )
onde 0 e 1 designam dois conjuntos alternativos de condies
sobre os valores dos parmetros .
A transformao = 2 ln(Rn ) utilizada como estatstica de um
teste s hipteses:
H 0 : 0

J. Cadima (DM/ISA)

vs.

H 1 : 1 .

Modelao Estatstica II

2010-11

188 / 416

Teorema de Wilks

O Teorema de Wilks garante que, sob H0 (e com certas condies de


regularidade da funo de verosimilhana) tem distribuio q2 , onde
q indica o nmero de restries impostas aos parmetros em H0 :


= 2 max L ( ; x) max L ( ; x)
q2 .
0

J. Cadima (DM/ISA)

(0 1 )

Modelao Estatstica II

2010-11

189 / 416

No contexto da regresso no linear

No contexto do Modelo de Regresso No Linear, vamos considerar


que todos os parmetros menos j so livres de variar. E vamos
considerar:
H0 : j = c
vs.
H1 : j 6= c .
Assim,
h apenas q = 1 restrio imposta em H0 ;
0 1 corresponde a todos os k parmetros serem livres.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

190 / 416

No contexto no linear (cont.)


Tendo em conta a expresso da log-verosimilhana dos dados
(acetato 161), o mximo de L sob 0 1 atingido em = :
n
1
max
L ( ; , y, X) = L ( ; , y, X) = ln (2 2 )
S( )
2
2 2
0 1
Designando por H0 o vector que, tendo j = c, minimiza a soma de
quadrados dos resduos S (ateno que, em geral, i 6= i ), tem-se:
1
n
S( H0 )
max L ( ; , y, X) = L ( H0 ; , y, X) = ln (2 2 )
2
2 2
0
Logo, sob H0 :
=

J. Cadima (DM/ISA)

S( H0 ) S( )
12 .
2
Modelao Estatstica II

2010-11

191 / 416

Estatstica F
J vimos que, sob H0 :
=

S( H0 ) S( )
12 .
2

e, sempre:
S( )
2
.
nk
2
Logo (admitindo a independncia destas duas quantidades), sob H0 :
F =

J. Cadima (DM/ISA)

S( H0 ) S( )
F(1,nk ) .
2

Modelao Estatstica II

2010-11

192 / 416

As funes perfil
Define-se a funo perfil associada ao parmetro j como:

j ( ) = sgn( j )

S( ) S( )
,
2

sendo o vector que minimiza a funo S, admitindo que a j-sima


componente de tem valor j = .
Nota: O quadrado de j ( ) a funo F do acetato anterior, associada
hiptese nula de que a j-sima componente de tem valor j = :

2 (H0 ) = F
Nota: No ponto j = j a funo j toma valor nulo.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

193 / 416

As funes perfil no

As funes perfil podem ser calculadas no R atravs da funo


profile. Para os dados das folhas de videira:

> profile(videiras.nls)
$alfa
tau par.vals.alfa par.vals.beta
1 -2.7089270
1.206595
2.037579
2 -2.1636834
1.276421
2.015390
3 -1.6185192
1.350077
1.993249
4 -1.0734452
1.427761
1.971156
5 -0.5288724
1.509617
1.949127
6
0.0000000
1.593382
1.927774
7
0.5030119
1.677148
1.907504
8
0.9954650
1.763212
1.887693
9
1.4882202
1.853534
1.867906
10 1.9810207
1.948267
1.848151
11 2.4738720
2.047615
1.828428
12 2.9667738
2.151794
1.808737
$beta
tau par.vals.alfa par.vals.beta
1 -2.5869917
2.069996
1.823696
2 -2.0692432
1.964877
1.844450
3 -1.5514894
1.864858
1.865242
4 -1.0337303
1.769702
1.886072
5 -0.5159727
1.679186
1.906940
6
0.0000000
1.593382
1.927774
7
0.5150150
1.511914
1.948608
8
1.0308813
1.434300
1.969515
9
1.5467362
1.360494
1.990460
10 2.0625856
1.290317
2.011444
11 2.5784294
1.223597
2.032468
12 3.0942678
1.160174
2.053531
J. Cadima (DM/ISA)

Valores de alfa fixados.


Os valores de beta so os que
minimizam a soma de quadrados dos
residuos, dado o valor de alfa.

Valores de beta fixados.


Os valores de alfa minimizam
a funo S, para os beta dados.

Modelao Estatstica II

2010-11

194 / 416

Testes de hipteses a parmetros individuais


As funes de perfil esto associadas a distribuies tnk .
Hipteses:

H0 : j =

vs.

Estatstica do Teste: Sob H0 ,

H1 : j 6=

j ( ) = sgn( j )

S( ) S( )
tnk ,
2

Nvel de significncia: Escolher = P[Rejeitar H0 | H0 verdade].


Regio Crtica: (Bilateral) Rejeitar H0 se |calc | > t 2 ;nk

Concluso: Calcular o valor da estatstica, calc , e decidir sobre a


rejeio, ou no, de H0 .

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

195 / 416

Intervalos de confiana baseados nos perfis

As funes perfil tambm podem ser usadas para construir intervalos


a (1 ) 100% de confiana para cada parmetro j .
Esto nesses intervalos os valores j = tais que
t 2 (nk ) < j ( ) < t 2 (nk ) .
Nota: Estes intervalos de confiana no tm de ser simtricos em
torno do ponto j = j .

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

196 / 416

Intervalos de confiana baseados em perfis no


No
, a funo confint (do mdulo MASS), quando aplicada a
objectos criados pela funo nls, constri intervalos de confiana
baseados nas funes perfil:
> confint(videiras.nls)
Waiting for profiling to be done...
2.5%
97.5%
alfa 1.303000 1.944933
beta 1.848676 2.007429
> confint(videiras.nls, level=0.90)
Waiting for profiling to be done...
5%
95%
alfa 1.346081 1.883653
beta 1.861388 1.994552

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

197 / 416

Grficos das funes perfil, no


Com o mdulo MASS possvel traar grficos dos mdulos das
funes perfil e intervalos de confiana para os parmetros do modelo:

0.0

1.0

2.0

> par(mfrow=c(2,1))
> plot(profile(videiras.nls))

1.2

1.4

1.6

1.8

2.0

0.0

1.0

2.0

alfa

1.85

1.90

1.95

2.00

beta

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

198 / 416

Advertncias sobre os grficos de perfis


Por omisso, os nveis de confiana indicados a tracejado nos grficos
das funes perfil so (de dentro para fora) 0.5, 0.8, 0.9, 0.95 e 0.99.
Os mnimos dos mdulos das funes de perfil so atingidos quando
o parmetro tem valor igual sua estimativa de mnimos quadrados,
tomando nesse caso o valor zero.
Bates & Watts (1988) chamam a ateno que o grau de curvatura nos
grficos das funes de perfil so indicativos do grau de no
linearidade no modelo (as funes perfil num modelo linear so
segmentos de recta).
Curvaturas nos grficos de perfil geram intervalos de confiana que
no so centrados nas estimativas de mnimos quadrados, podendo
ter semi-amplitudes diferentes para cada lado dessas estimativas.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

199 / 416

O estudo de resduos

A validao dos pressupostos do modelo tem muitas semelhanas


com o que feito nos modelos lineares.
Tambm nas regresses lineares se podem definir:
resduos usuais: ei = yi yi ;

i
resduos padronizados (standardizados): ri = e1h
, onde hii o
ii
i-simo elemento diagonal da matriz de projeco ortogonal
sobre o subespao gerado pelas colunas da matriz D .

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

200 / 416

O estudo de resduos (cont.)


Em particular, so teis grficos de diagnstico do tipo:
resduos ei vs. valores ajustados yi , para procurar:

inadequaes da relao esperada;


indicao de varincias no constantes;
observaes atpicas.

qq plots dos resduos padronizados que, a ser vlido o


pressuposto de erros aleatrios normais dever ser
aproximadamente linear.
grficos de resduos vs. ordem de observao, para ver se existe
alguma indicao de dependncia entre erros aleatrios.
grficos de resduos padronizados vs. cada uma das variveis
preditoras individuais, para detectar eventuais relaes no
previstas no modelo.

J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

201 / 416

Grficos de resduos no
Ao contrrio do que sucede nos modelos lineares, os grficos de
resduos tm de ser explicitamente construdos pelos utilizadores,
atravs de comandos como:
> plot(fitted(videiras.nls),residuals(videiras.nls))
> qqnorm(residuals(videiras.nls))

100
50
0
100

50

Sample Quantiles

50
0
50
100

residuals(videiras.nls)

100

Normal QQ Plot

100

200

300

400

J. Cadima (DM/ISA)

Theoretical Quantiles

fitted(videiras.nls)

Modelao Estatstica II

2010-11

202 / 416

Correlaes entre parmetros


til tambm a anlise das correlaes entre os estimadores dos
parmetros. Bates & Watts (1988) salientam que correlaes muito
prximas de 1 podem indicar uma sobreparametrizao do modelo.
Sugerem que se analise correlaes acima de 0.99.
Mas ateno: na regresso no linear frequente que estas
correlaes sejam bastante elevadas, uma vez que as colunas da
matriz D esto muitas vezes fortemente correlacionadas dada a
natureza das derivadas parciais associadas ao modelo.
Tais correlaes podem ser obtidas com o comando summary dum
objecto nls:
> summary(tamboril.nls, correlation=TRUE)$corr
alfa
k
gama
alfa 1.0000000 -0.9932596 -0.7740815
k
-0.9932596 1.0000000 0.8309578
gama -0.7740815 0.8309578 1.0000000
J. Cadima (DM/ISA)

Modelao Estatstica II

2010-11

203 / 416

Você também pode gostar