Escolar Documentos
Profissional Documentos
Cultura Documentos
ao Beta
Fernando Lucambio P
erez
Departamento de Estatstica
Universidade Federal do Paran
a
Agosto de 2004
var{Y } =
2
( + ) ( + + 1)
2
var{Y } =
V ()
,
1+
15
12
(0.95,5)
(0.05,50)
(0.95,50)
densidade
(0.25,5)
(0.75,50)
(0.50,50)
densidade
6
10
10
(0.05,5)
(0.75,5)
(0.25,5)
(0.50,5)
0.0
0.2
0.4
0.6
y
0.8
1.0
0.0
0.2
0.4
0.6
0.8
1.0
Modelo de regress
ao Beta
Este modelo de regress
ao foi proposto pelos professores Silvia
L.P. Ferrari, IME, USP e Francisco Cribari-Neto, UFPE no artigo Beta regression for modelling rates and proportions, Journal
of Applied Statistics (2004) e posteriormente programado por
Alexandre Simas no pacote betareg do R, vers
ao 1.9.0.
Apresentaremos a seguir a defini
c
ao deste modelo de regress
ao,
propriedades dos estimadores dos par
ametros da regress
ao, algumas medidas de diagn
ostico e o aplicaremos em uma situa
c
ao
pr
atica.
Defini
c
ao
Sejam Y1, . . . , Yn vari
aveis aleat
orias independentes onde cada Yt
segue a distribui
c
ao beta com m
edia t e preciss
ao . O modelo
de regress
ao beta
e obtido assumindo que a m
edia de Yt pode
ser escrita como
g(t) =
k
X
xtii = t,
i=1
onde 1, . . . , k s
ao os par
ametros da regress
ao e xt1, . . . , xtk s
ao
constantes conhecidas. Consideraremos tamb
em que g()
e uma
fun
c
ao mon
otona e duas vezes diferenci
avel, chamada de fun
c
ao
de liga
c
ao.
Observemos que a variancia de Yt
e fun
c
ao de t e, por conseq
u
encia, das vari
aveis explicativas, portanto, estes modelos
s
ao por natureza de variancia n
ao constante.
6
t
1+e
onde t
e o chamado preditor linear.
7
Estima
c
ao dos par
ametros
A estima
c
ao dos par
ametros de regress
ao e do par
ametro de
preciss
ao
e por m
axima verossimilhan
ca obt
endo-se que, em
amostras grandes,
!
b
, K 1 ,
onde K
e a matriz de informa
c
ao de Fisher.
O intervalo de confian
ca para , para um vetor de covari
aveis x
e, aproximadamente
h
b
b
g 1(b 1(1 /2)se()),
g 1(b + 1(1 /2)se())
r
b =
onde b = xb e se()
\
b >.
xcov(
)x
8
Medidas de diagn
ostico
Os resduos padronizados s
ao definidos como
bt
yt
rt = q
d t)
var(y
b
d t) = {
b t = g 1(bt) e var(y
b t(1
b t)}/(1 + ).
onde
A matriz
chapeu
e da forma
2
k(1 htt)
9
Exemplo
Informa
c
oes sobre a venda de 142 autom
oveis seminovos, incluindo modelo (modelo), pre
co de revenda em R$ (revenda), o
pre
co do modelo novo em R$ (novo), o tempo de uso do autom
ovel em anos completos (uso) e quilometragem em milhares
de Km (Km) foram coletados pelo Prof. Manoel R. Lino (UFSC)
em 2002.
Foi proposto estudar a rela
c
ao entre a propor
c
ao do valor do
carro na revenda com rela
c
ao ao valor quando novo segundo
uso, Km e modelo. Assim, a vari
avel resposta
e
revenda
resp =
novo
10
Coefficients:
(Intercept)
uso
Km
modeloEscort
modeloFiesta
modeloFiorino
modeloGol
modeloMille
modeloParati
modeloVectra
phi
estimates
1.514349451
-0.161221109
-0.007117227
-0.343957131
0.252944303
-0.252418089
0.009408672
0.129727161
-0.518922929
-0.314786295
108.522648930
std. errors
0.065092397
0.026242247
0.001741486
0.069380189
0.064708966
0.066893425
0.060320926
0.070182954
0.062176392
0.068011499
12.825609954
z-stats
23.2646135
-6.1435711
-4.0868698
-4.9575698
3.9089529
-3.7734365
0.1559769
1.8484141
-8.3459800
-4.6284276
p-value
0.000000e+00
8.068650e-10
4.372322e-05
7.138039e-07
9.269703e-05
1.610142e-04
8.760512e-01
6.454246e-02
0.000000e+00
3.684527e-06
Pseudo R^2:
0.8059293
11
40
80
1
1
3
Standardized residuals
3
1
1
3
Deviance residuals
120
40
80
120
0.5
0.6
0.7
Fitted values
0.8
0.00
Cooks distance
0.08
0.04
0.4
0.10
Obs. number
Generalized leverage
Indices of obs.
40
80
120
Obs. number
12
Conslus
oes
Definimos o modelo de regress
ao beta, no qual a resposta
assume valores no intervalo (0,1). Desta forma podemos
modelar propor
c
oes contnuas.
13