Escolar Documentos
Profissional Documentos
Cultura Documentos
Julio M. Singer
Juv
encio S. Nobre
Francisco Marcelo M. Rocha
Departamento de Estatstica
Universidade de Sao Paulo
Caixa Postal 66281
Sao Paulo, SP 05314-970
Brasil
Conte
udo
1 Introduc
ao
1.1
Conceitos basicos . . . . . . . . . . . . . . . . . . . . . .
1.2
Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . .
13
1.3
25
1.3.1
31
1.3.2
Analise de desfecho . . . . . . . . . . . . . . . . .
33
1.3.3
35
1.3.4
37
39
2.1
Introducao . . . . . . . . . . . . . . . . . . . . . . . . . .
39
2.2
41
2.3
45
2.4
56
2.5
Estrategias de analise . . . . . . . . . . . . . . . . . . . .
65
2.6
Diagnostico . . . . . . . . . . . . . . . . . . . . . . . . .
67
2.7
Notas de captulo . . . . . . . . . . . . . . . . . . . . . .
67
2.8
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . .
67
69
3.1
69
3.2
69
3.3
69
CONTEUDO
CONTEUDO
4 T
opicos especiais
71
4.1
Dados omissos . . . . . . . . . . . . . . . . . . . . . . . .
71
4.2
71
4.3
Modelos nao-lineares . . . . . . . . . . . . . . . . . . . .
71
5 An
alise de dados
73
5.1
Estudos pre-teste/pos-teste . . . . . . . . . . . . . . . . .
73
5.2
Analise de perfis . . . . . . . . . . . . . . . . . . . . . . .
89
105
A.1 Matrizes . . . . . . . . . . . . . . . . . . . . . . . . . . .
105
106
108
110
111
112
113
115
116
118
125
127
128
A.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . .
138
B Regress
ao
119
143
B.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . .
143
155
161
162
CONTEUDO
CONTEUDO
B.5 Diagnostico . . . . . . . . . . . . . . . . . . . . . . . . .
163
165
169
173
181
192
197
B.8 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . .
197
Bibliografia
209
Captulo 1
Introdu
c
ao
Neste captulo caracterizamos estudos com estrutura longitudinal contrastando-os com outros tipos, identificamos os conceitos que permeiam
essa modalidade de investigacao, introduzimos uma notacao apropriada
para a descricao dos dados coletados sob esse molde, descrevemos diversos
exemplos, identificando suas peculiaridades dentro desse contexto e finalmente consideramos alguns metodos basicos para sua analise. Mais especificamente, na Secao 1.1 ocupamo-nos da mencionada caracterizacao,
salientando a dependencia entre as observacoes que distingue esse tipo
de estudo e damos os primeiros passos no estabelecimento da notacao
empregada no texto. Na Secao 1.2 descrevemos um conjunto de exemplos com complexidade crehbtpscente, apontando suas particularidades e
relacionando-as com os conceitos descritos na secao anterior. Finalmente
na Secao 1.3, apresentamos algumas tecnicas simples para a descricao e
analise de dados longitudinais.
1.1
Conceitos b
asicos
constitui um segundo exemplo. Com objetivo simplificador, referir-nosemos a essa escala ordenada ao longo da qual se fazem as medidas repetidas como tempo. Embora o caso geral possa envolver m
ultiplas variaveis
respostas, concentraremos nossa atencao no caso univariado.
Neste contexto, podemos identificar duas grandes estrategias para coleta de dados. A primeira envolve uma u
nica observacao (realizada num
instante especificado) da variavel resposta para cada elemento (pacientes, por exemplo) de uma amostra de cada populacao de interesse (de
indivduos normais ou hipertensos, por exemplo). A segunda estrategia
envolve duas ou mais observacoes (realizadas em instantes diferentes) da
variavel resposta em cada unidade amostral sob investigacao. No primeiro caso, dizemos que o estudo tem um planejamento transversal e
no segundo, referimo-nos ao planejamento como longitudinal. Em Bioestatstica, esta u
ltima forma de coleta de dados tambem e conhecida
como coorte ao passo que em outros campos do conhecimento, como
Sociologia, Economia ou Administracao, ela e cognominada painel.
Convem esclarecer que os problemas nos quais temos interesse diferem daqueles usualmente conhecidos sob a denominacao de s
eries de
tempo ou s
eries cronol
ogicas na medida em que nestes, em geral, uma
u
nica unidade amostral e avaliada em muitos (200 ou mais, por exemplo)
instantes enquanto que naqueles, varias (5 ou mais, por exemplo) unidades amostrais sao observadas em poucas (2 a 20, por exemplo) ocasioes.
Para contrastar os dois tipos de estudo podemos considerar de um lado,
a investigacao sobre o regime diario de chuvas numa determinada regiao
nos u
ltimos 50 anos e de outro, a pesquisa sobre os padroes mensais de
crescimento de recem-nascidos no primeiro ano de vida. Leitores interessados em analise de series cronologicas podem consultar Morettin &
Toloi (2006), entre outros.
Estudos longitudinais constituem um caso especial daqueles conhecidos sob a denominacao de medidas repetidas, que englobam os planejamentos do tipo split-plot e com interc
ambio (crossover ). Planejamento do tipo split-plot envolvem dois fatores; as unidades experimentais (whole-plots) sao aleatoriamente alocadas aos diferentes nveis do
primeiro fator e os nveis do segundo fator sao aplicados `a unidades observacionais (split-plots). Num estudo para avaliar o efeito da temperatura e do tipo de materia prima na consistencia de um tipo de bolo, as
unidades experimentais (whole-plots) sao bandejas e as unidades observacionais (split-plots) sao bolos com tamanho padronizado. As bandejas sao
Singer & Nobre & Rocha - marco/2012
1. INTRODUC
AO
1. INTRODUC
AO
(1.1.1)
1. INTRODUC
AO
Resposta
y11
y12
.
y1p1
y21
y22
.
y2p2
.
yn1
yn2
.
ynpn
Tempo
t11
t12
.
t1p1
t21
t22
.
t2p2
.
tn1
tn2
.
tnpn
X
x1
x1
.
x1
x2
x2
.
x2
.
xn
xn
.
xn
Covariaveis
W V
Z
w1 v1 z11
w1 v1 z12
.
.
.
w1 v1 z1p1
w2 v2 z21
w2 v2 z22
.
.
.
w2 v2 z2p2
.
.
.
wn vn zn1
wn vn zn2
.
.
.
wn vn znpn
ti1 xi wi vi zi1
ti2 xi wi vi zi2
Xi = ..
.. .. ..
.. .
.
. . .
.
tipi xi wi vi zipi
Quando os fatores X e W tem mais do que dois nveis podemos representa-los por meio do acrescimo de colunas a` matriz Xi . Com objetivos
computacionais, e comum concatenar os perfis de resposta e as matrizes
de variaveis explicativas
P individuais, respectivamente, na forma de um
vetor com dimensao ( ni=1 pi 1)
y = (y1> , . . . , yn> )>
P
e de uma matriz com dimensao ( ni=1 pi t), com t = 5 no exemplo
acima,
> >
X = (X>
1 , . . . , Xn ) .
Quando os dados sao balanceados em relacao ao tempo e nao ha
covariaveis contnuas nem covariaveis dependentes do tempo, tambem
Singer & Nobre & Rocha - marco/2012
P3
h=1
P2
i=1
nhi
1. INTRODUC
AO
Tabela 1.1.2: Uma estrutura para disposicao de dados longitudinais balanceados em relacao ao tempo
Fatores Unidade
X W amostral
1
1
1
1
1
2
.
.
.
1
1
n11
1
2
1
1
2
2
.
.
.
1
2
n12
.
.
.
2
1
1
2
1
2
.
.
.
2
1
n21
2
2
1
2
2
2
.
.
.
2
2
n22
3
1
1
3
1
2
.
.
.
3
1
n31
3
2
1
3
2
2
.
.
.
3
2
n32
Instantes de
1
2
y1111
y1112
y1121
y1122
.
.
y11n11 1 y11n11 2
y1211
y1212
y1221
y1222
.
.
y12n12 1 y12n12 2
.
.
y2111
y2112
y2121
y2122
.
.
y21n21 1 y21n21 2
y2211
y2212
y2221
y2222
.
.
y22n22 1 y22n22 2
y3111
y3112
y3121
y3122
.
.
y31n31 1 y31n31 2
y3211
y3212
y3221
y3222
.
.
y32n32 1 y32n32 2
avaliacao
...
p
...
y111p
...
y112p
.
.
. . . y11n11 p
...
y121p
...
y122p
.
.
. . . y12n12 p
.
.
...
y211p
...
y212p
.
.
. . . y21n21 p
...
y221p
...
y222p
.
.
. . . y22n22 p
...
y311p
...
y312p
.
.
. . . y31n31 p
...
y321p
...
y322p
.
.
. . . y32n32 p
Alternativamente, modelos lineares ou nao lineares podem ser empregados para avaliar a relacao entre a variavel resposta e as variaveis
explicativas. Esses modelos podem ser classificados como populacionais
m
edios (population-averaged ) ou individuais (subject-specific). Modelos populacionais medios sao aqueles em que a atencao esta focada no
valor esperado da resposta (entre todos os indivduos da populacao) e
modelos individuais sao aqueles em que o interesse recai nas respostas de
Singer & Nobre & Rocha - marco/2012
10
cada indivduo. O leitor podera consultar Zeger, Liang & Albert (1988)
para detalhes sobre o assunto, embora as diferencas entre as duas classes
possa ser esclarecida com os exemplos apresentados na proxima secao.
Sob outra perspectiva, modelos para dados longitudinais podem ser
classificados como condicionais ou incondicionais. Os primeiros sao
aqueles em que o valor esperado da variavel resposta, (yik ), e expresso
exclusivamente em termos das variaveis explicativas xi1k , . . . , ximk . Se,
entre elas, o tempo e tomado como uma variavel discreta que indica a
ordem em que a resposta e observada em cada unidade amostral sob um
planejamento balanceado (possivelmente com dados omissos), os modelos
correspondentes sao conhecidos como modelos de perfis e sao equivalentes `aqueles costumeiramente considerados em ANOVA ou ANCOVA.
Nos casos em que o tempo e encarado como uma variavel contnua, i.e.,
em que o interesse recai na sua relacao funcional com a variavel resposta,
os modelos correspondentes sao designados modelos de crescimento
ou curvas de crescimento. Modelos condicionais, por outro lado, sao
aqueles em que a relacao entre a variavel resposta e as variaveis explicativas num certo instante e condicionada a valores previos da resposta.
11
1. INTRODUC
AO
processo de Ornstein-Uhlenbeck
que envolve solucoes de equacoes do
tipo
dYi (t)/dt = Yi (t) + dBi (t)/dt
(1.1.3)
12
trabalho.
13
1. INTRODUC
AO
1.2
Exemplos
Alto teor
Baixo teor
de sodio Paciente de sodio
143
11
156
154
12
117
147
13
157
147
14
143
157
15
127
158
16
134
164
17
112
156
18
144
151
19
117
182
20
128
Alto teor
de sodio
151
116
154
149
126
138
115
159
124
125
14
1.2 EXEMPLOS
teor de sodio poderia ter sido avaliada antes daquela com baixo teor de
sodio. Essa permutabilidade das condicoes de avaliacao obviamente nao
e possvel em estudos longitudinais. Embora isso nao tenha implicacoes
nos casos em que existem apenas duas condicoes de avaliacao, em casos
mais gerais, essa permutabilidade pode tornar certos modelos (uniforme,
por exemplo) para a estrutura de covariancia mais aceitaveis que outros
(autorregressivo, por exemplo).
Exemplo 1.2.2: Os dados apresentados na Tabela 1.2.2 sao oriundos de um estudo realizado na Escola de Educacao Fsica e Esporte da
Universidade de Sao Paulo cujo objetivo era avaliar o efeito de um programa de treinamento no desempenho de idosos relativamente a certas
atividades fsicas controlando o genero (m=masculino, f=feminino). Em
particular, focamos nossa atencao no menor tempo (s) gasto para calcar
meia no pe de preferencia em duas tentativas. Detalhes podem ser obtidos em Elian & Okaze (1998).
Este e um estudo longitudinal (pois as medidas sao realizadas de
forma nao permutavel) com planejamento similar a`quele do Exemplo
1.2.1. As diferencas residem na existencia de dois nveis (masculino e
feminino) para o u
nico fator interunidades de investigacao (genero) e de
dados omissos, o que permite dizer que os dados sao desbalanceados em
relacao ao tempo.
Exemplo 1.2.3: Na Tabela 1.2.3 apresentamos dados de um estudo
realizado no Laboratorio Experimental de Poluicao Atmosferica da Faculdade de Medicina da Universidade de Sao Paulo para avaliar os efeitos
de agentes oxidantes no sistema respiratorio e analisado em Singer &
Andrade (2000). Espera-se que a exposicao a maiores concentracoes de
agentes oxidantes possa causar danos crescentes a`s celulas ciliares e excretoras de muco, que constituem a principal defesa do sistema respiratorio
contra agentes externos. Cinquenta e seis palatos de sapos foram equitativamente e aleatoriamente alocados a um de seis grupos; cada grupo
de 8 palatos foi imerso por 35 minutos numa solucao de peroxido de hidrogenio numa concentracao especificada, nomeadamente 0, 1, 8, 16, 32
ou 64 M. A velocidade de transporte mucociliar (mm/s), foi observada
a cada cinco minutos apos a imersao. A variavel resposta de interesse e a
velocidade de transporte mucociliar relativa, definida como o quociente
entre a velocidade de transporte mucociliar num determinado instante e
aquela obtida antes da intervencao experimental.
Este estudo generaliza aquele apresentado no Exemplo 1.2.2 em duas
Singer & Nobre & Rocha - marco/2012
15
1. INTRODUC
AO
direcoes: o n
umero de nveis do u
nico fator (concentracao peroxido de
hidrogenio) interunidades de investigacao e 6 em vez de 2 e o n
umero de
nveis do u
nico fator (tempo apos imersao na solucao oxidante) intraunidades de investigacao e 7 em vez de 2. Ele e um estudo longitudinal com
planejamento balanceado em relacao ao tempo e com omissao de dados.
Genero
m
m
m
m
m
m
m
m
m
m
m
m
f
f
f
f
f
f
f
f
Treinamento
Antes Depois
6.02
4.99
5.30
5.37
8.56
5.85
5.15
5.64
4.96
6.29
11.03
10.39
9.20
6.77
10.00
5.53
9.99
8.74
5.63
8.47
6.96
6.66
4.54
8.33
5.86
5.41
5.28
4.40
6.47
5.74
5.89
7.45
4.93
4.96
5.51
5.76
4.81
Genero
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
f
Treinamento
Antes Depois
6.77
4.97
4.80
3.89
4.44
6.87
8.59
9.86
7.99
3.93
7.54
3.77
6.34
5.04
4.72
3.88
6.04
5.11
8.12
6.64
10.38
7.26
8.01
7.79
6.39
4.95
8.87
8.08
6.48
4.08
6.98
7.51
8.41
15.84
9.68
16
1.2 EXEMPLOS
5
1.24
1.47
1.14
0.84
0.96
0.84
1.12
1.07
0.84
1.77
0.92
1.27
1.05
0.88
1.13
0.89
0.81
1.69
0.89
1.10
1.84
1.25
0.90
1.12
1.43
1.26
0.88
0.87
1.43
1.30
0.92
1.21
0.68
0.75
0.97
1.08
10
1.21
0.91
0.90
1.02
1.19
0.89
1.22
1.36
0.75
1.28
1.16
1.42
1.09
1.02
1.24
0.84
1.18
1.62
0.85
1.57
2.36
1.22
1.05
1.06
1.25
1.24
0.73
0.69
0.98
1.00
0.86
1.01
0.86
0.74
0.84
1.12
Tempo (min)
15
20
25
1.16 1.08 1.08
1.21 1.35 1.26
0.81 1.00 1.05
0.86 0.98 0.98
1.33 1.37 1.22
0.81 0.84 1.05
1.14 1.22 1.46
1.49 1.49 1.46
0.58 0.59 0.52
1.32 1.53 1.30
1.06 1.28 0.97
1.45 1.59 1.55
0.98 1.28 0.98
0.82 0.74 0.75
1.13 1.10 1.17
0.93 1.02 0.93
0.99 1.08 1.00
1.36 1.60 2.00
0.88 0.82 0.95
1.32 1.56 1.83
2.25 2.25 2.05
0.88 0.73 0.66
0.90 0.88 0.86
0.99 0.92 0.91
1.19 1.12 1.13
1.20 1.13 1.03
0.61 0.58 0.61
0.50 0.42 0.38
0.70 0.54 0.43
0.67 0.68 0.53
0.88 0.85 0.79
0.75 0.79 0.69
0.86 0.59 0.57
0.96 0.87 1.00
0.71 0.83 0.67
0.86 1.02 0.85
30
0.87
1.18
0.93
1.07
1.41
0.95
1.76
1.39
0.43
1.32
1.28
1.42
1.30
0.75
0.86
0.89
1.09
1.60
1.09
1.83
2.08
0.58
0.85
1.01
1.12
1.08
0.48
0.38
0.41
0.67
0.66
0.70
0.61
0.90
0.73
0.90
35
1.72
1.46
0.57
1.44
1.24
1.53
1.33
0.71
1.06
0.86
1.09
1.86
1.18
1.86
2.13
0.57
0.92
1.00
1.18
1.13
0.52
0.44
0.43
0.62
0.82
0.82
0.66
1.14
0.72
0.89
17
1. INTRODUC
AO
5
0.97
0.60
1.37
1.45
0.92
1.12
0.79
1.02
0.83
0.72
0.12
0.48
0.20
0.79
0.38
0.94
0.17
0.96
0.62
0.23
10
0.67
0.54
0.83
1.43
0.58
0.96
0.84
1.08
0.66
0.48
0.09
0.48
0.47
0.74
0.66
0.84
0.54
1.01
0.90
0.40
Tempo (min)
15
20
25
0.49 0.46 0.38
0.71 0.33 0.29
0.65 0.56 0.41
0.99 0.92 0.58
0.39 0.24 0.23
0.80 0.71 0.80
0.75 0.69 0.53
0.92 0.79 0.64
0.55 0.54 0.48
0.63 0.57 0.63
0.22 0.11 0.16
0.48 0.41 0.33
0.27 0.34 0.26
0.86 0.63 0.67
0.94 0.84 0.82
0.64 0.53 0.48
0.67 0.66 0.66
1.23 0.93 0.87
0.81 0.86 0.66
0.25 0.16 0.27
30
0.35
0.27
0.35
0.51
0.29
0.90
0.53
0.62
0.45
0.53
0.11
0.39
0.30
0.86
0.88
0.50
0.81
0.81
0.84
0.27
35
0.29
0.36
0.40
0.46
0.23
1.00
0.65
0.57
0.54
0.54
0.09
0.30
0.44
0.92
0.89
0.50
0.96
0.81
0.78
0.47
18
1.2 EXEMPLOS
Volunt
ario
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
Perodo
Antes
Antes
Antes
Antes
Antes
Antes
Antes
Antes
Antes
Antes
Antes
Antes
Antes
Antes
Antes
Antes
Antes
Antes
Antes
Antes
Antes
0
6.3
6.7
6.3
6.2
6.6
6.2
6.4
6.5
6.4
6.4
6.2
6.2
6.5
6.3
6.5
6.5
6.3
6.5
6.7
6.6
6.6
5
6.2
6.5
6.3
6.1
6.5
5.8
6.3
6.3
6.3
6.2
6.1
5.9
6.3
6.0
6.0
6.2
6.2
6.3
6.6
6.1
6.4
Tempo (min)
10 15 30
6.0 5.8 5.5
6.4 6.4 6.2
6.2 6.3 5.9
5.9 5.8 5.6
6.5 6.4 6.2
5.7 5.5 5.2
6.2 6.1 6.0
6.1 6.0 5.9
6.3 6.2 6.1
6.1 5.9 5.8
5.9 5.9 5.7
5.7 5.5 5.2
6.1 6.0 5.9
5.7 5.6 5.2
6.3 6.2 6.1
6.2 6.0 5.9
6.1 5.9 5.8
6.2 6.0 5.8
6.5 6.3 6.2
5.8 5.6 5.4
6.3 6.3 6.3
45
5.3
6.2
5.7
5.4
6.1
5.1
5.9
5.7
6.1
5.7
5.6
5.1
5.7
5.1
5.9
5.7
5.7
5.7
6.1
5.3
6.2
60
5.1
5.9
5.5
5.2
5.9
5.0
5.8
5.5
6.0
5.5
5.4
5.0
5.6
4.9
5.9
5.7
5.6
5.7
6.1
5.3
6.2
19
1. INTRODUC
AO
Volunt
ario
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
Perodo
Depois
Depois
Depois
Depois
Depois
Depois
Depois
Depois
Depois
Depois
Depois
Depois
Depois
Depois
Depois
Depois
Depois
Depois
Depois
Depois
Depois
0
6.4
6.3
6.4
6.3
6.2
6.3
6.4
6.7
6.3
6.3
6.3
6.4
6.4
6.5
6.3
6.3
6.4
6.3
5.9
6.4
6.4
5
6.3
6.1
6.1
6.0
6.1
6.0
6.2
6.3
6.1
5.9
6.2
6.0
6.2
6.4
6.0
6.0
5.9
6.0
5.8
6.0
6.2
Tempo (min)
10 15 30
6.1 5.9 5.6
6.0 5.9 5.7
5.9 5.8 5.4
5.9 5.8 5.4
6.0 5.9 5.7
5.9 5.8 5.5
6.0 5.9 5.6
6.2 6.1 5.8
6.0 5.9 5.7
5.6 5.5 5.2
6.1 6.0 5.8
5.8 5.6 5.2
6.0 5.8 5.5
6.3 6.1 6.0
5.7 5.6 5.3
5.9 5.7 5.4
5.7 5.5 5.2
5.8 5.7 5.4
5.6 5.5 5.4
5.7 5.5 5.1
6.0 5.9 5.6
45
5.4
5.5
5.1
5.2
5.4
5.3
5.3
5.6
5.5
5.0
5.6
5.0
5.3
5.7
5.1
5.2
5.5
5.2
5.2
4.8
5.5
60
5.2
5.3
5.0
5.1
5.3
5.2
5.1
5.4
5.3
4.9
5.5
4.9
5.2
5.7
5.0
5.0
4.9
5.1
5.1
4.7
5.4
20
1.2 EXEMPLOS
21
1. INTRODUC
AO
Volunt
ario
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
.
8
8
8
8
8
8
8
8
8
8
8
8
2
Dente
1
1
1
2
2
2
3
3
3
4
4
4
5
5
5
6
6
6
7
7
7
8
8
8
.
29
29
29
30
30
30
31
31
31
32
32
32
Tratamento
laser
controle
esmalte
laser
controle
esmalte
laser
controle
esmalte
laser
controle
esmalte
laser
controle
esmalte
laser
controle
esmalte
laser
controle
esmalte
laser
controle
esmalte
.
laser
controle
esmalte
laser
controle
esmalte
laser
controle
esmalte
laser
controle
esmalte
10
239
162
271
275
193
288
196
159
289
251
189
280
265
164
289
268
175
325
246
178
282
266
170
289
.
242
167
283
248
159
279
237
135
286
265
170
287
20
304
135
297
331
168
295
301
165
296
339
175
311
335
202
301
337
191
305
307
193
273
347
192
288
.
381
171
313
350
159
303
322
173
302
328
153
299
Profundidades (m)
40
60
80 120
282 300 308 330
166 207 290 289
301 302 304 313
310 268 272 316
178 196 275 317
302 308 309 310
296 286 256 318
165 255 295 308
319 318 302 316
285 299 317 297
162 218 293 273
305 311 308 296
292 308 284 294
199 241 287 333
304 311 309 317
300 290 311 311
151 234 285 317
316 309 308 322
323 270 278 319
172 264 298 310
297 305 305 309
326 298 290 300
159 216 317 301
292 290 299 298
.
.
.
.
295 306 312 339
205 261 296 294
296 309 308 322
306 322 344 351
197 246 277 302
295 311 317 310
313 281 303 326
158 250 292 289
277 300 302 313
323 335 309 325
148 243 302 285
306 307 317 317
180
318
266
314
367
330
302
318
319
324
299
287
313
311
301
322
309
307
312
310
310
318
339
311
325
.
313
296
322
328
303
319
355
300
314
353
286
310
22
1.2 EXEMPLOS
27
9.4
28
10.3
29
9.7
30
8.7
6.1
5.8
9.2
8.5
8.6
8.6
7.9
31
8.2
6.1
6.3
5.4
8.3
7.7
.
.
.
.
.
.
5.2
.
.
6.2
.
.
6.1
7.4
7.6
6.6
8.6
8.4
8.5
.
.
8.5
.
.
8.3
9.8
.
.
7.4
.
.
.
.
10.9
10.7
9.4
Semanas p
os-concepca
o
32
33
34
35
6.7
6.1
5.6
6.2
5.4
5.2
5.8
5.1
4.9
4.6
9.5
7.3
6.4
5.8
5.2
4.7
4.9
4.6
4.3
7.9
6.2
6.6
5.7
5.9
6.1
7.0
6.5
4.8
4.2
4.1
.
.
.
.
.
.
.
.
6.2
7.2
6.8
5.5
7.1
8.0
7.7
8.3
9.4
10.0
9.2
7.7
6.6
6.5
9.3
8.0
6.6
8.2
7.6
7.1
6.3
8.4
6.2
4.6
9.1
7.3
.
.
.
.
.
.
.
.
8.0
36
37
5.1
38
5.4
4.8
39
40
4.9
4.9
6.1
5.5
4.5
4.2
5.4
.
.
6.0
3.7
.
.
5.5
4.1
.
.
5.3
4.7
6.5
8.0
4.6
5.3
.
.
5.8
.
.
5.6
4.4
4.7
5.0
6.6
6.1
.
.
5.9
4.9
3.8
5.7
.
.
.
.
4.8
.
.
. ,
.
4.9
1. INTRODUC
AO
23
24
1.2 EXEMPLOS
inicial
1
2
1
2
2
2
2
1
3
2
2
1
2
2
2
2
2
1
1
2
1
3
3
2
2
Avaliac
ao
14 d
0
0
0
0
1
.
.
1
0
1
1
1
0
0
1
1
1
0
0
0
1
1
0
1
0
21 d
0
.
0
0
.
.
.
1
0
2
3
0
0
0
1
1
0
0
0
0
0
0
0
1
0
Paciente
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
inicial
2
2
3
2
2
3
0
1
1
1
1
0
0
1
2
1
1
2
2
2
2
3
3
2
3
Avaliacao
14 d
0
3
0
2
0
.
.
1
0
0
1
0
0
0
0
1
0
.
2
0
.
1
0
1
0
21 d
0
.
1
1
0
0
0
0
0
0
0
1
1
0
0
0
0
.
.
1
0
0
0
1
0
25
1. INTRODUC
AO
Sensibilidade pos-operatoria
Ausente
Presente
22
1
3
6
25
7
Material
Single
Bond
Dentina
Seca
Total
23
9
32
Single
Bond
Umida
Ausente
Presente
Subtotal
12
7
19
10
4
14
22
11
33
Prime
Bond
Seca
Ausente
Presente
Subtotal
10
12
22
6
3
9
16
15
31
Prime
Bond
Umida
Ausente
Presente
Subtotal
5
11
16
13
3
16
18
14
32
Os exemplos descritos acima ilustram o tipo de problemas que pretendemos avaliar nesta obra. Nos captulos subsequentes nao so discutiremos as tecnicas comumente empregadas para analisa-los como tambem
concretizaremos suas analises. Para discutir aspectos mais especficos
do tema abordado, outros exemplos serao apresentados e analisados ao
longo do texto.
1.3
An
alise descritiva e medidas resumo
26
1.3 ANALISE
DESCRITIVA E MEDIDAS RESUMO
1.5
0.5
1.5
0.5
1.5
0.5
1.5
1.5
1.5
1.5
min30
0.5
0.5
0.5
min25
min20
1.5
min15
1.5
0.5
0.5
min35
1.5
2.0
1.5
min10
0.5
0.5
1.0
2.0
min5
0.0
1.0
0.5
0.0
0.5
1.5
27
1. INTRODUC
AO
ni
X
(yij yi )(yij yi )> .
j=1
28
1.3 ANALISE
DESCRITIVA E MEDIDAS RESUMO
Quando um exame das matrizes de covariancias amostrais dos diferentes tratamentos (concentracoes, no Exemplo 1.2.3) nao sugere heterocedasticidade, convem combina-las para garantir maior precisao na
estimacao da matriz de covariancias (populacional) comum. Com essa
finalidade, pode-se considerar
b = (n t)1
V
t
X
b i.
(ni 1)V
i=1
em que t e o n
umero de tratamentos (concentracoes) considerados. Para o
exemplo sob investigacao, a matriz de covariancias amostrais combinada
(pooled ) obtida com a eliminacao do grupo avaliado sob a concentracao
0 M (em que ha observacoes omissas) e
min5
min10
min15
min20
min25
min30
min35
min5
1.00
min10
0.75
1.00
min15
0.59
0.86
1.00
min20
0.58
0.86
0.92
1.00
min25
0.47
0.73
0.84
0.91
1.00
min30
0.41
0.70
0.80
0.89
0.92
1.00
min35
0.37
0.66
0.78
0.87
0.94
0.97
1.00
Gr
aficos de perfis (individuais) talvez sejam as ferramentas descritivas mais importantes para a analise de dados longitudinais. Eles
sao essencialmente graficos de dispersao (com o tempo na abscissa e a
resposta na ordenada) em que os pontos associados a uma mesma unidade amostral sao unidos por segmentos de reta. Em geral, os perfis de
m
edias sao sobrepostos a eles. Esse tipo de graficos tem sido utilizado
por in
umeros autores, como Rao & Rao (1966) ou Weiss & Lazaro (1992)
nao so para representar dados longitudinais como tambem para ajudar
a identificacao de modelos apropriados para inferencia estatstica. Nas
Figuras 1.3.2 e 1.3.3 apresentamos graficos de perfis correspondentes aos
Exemplos 1.2.3 e 1.2.6, respectivamente, com a sobreposicao do perfil de
medias correspondentes.
Esse tipo de grafico permite
i) identificar possveis correlacoes intraunidades amostrais por meio
da observacao de perfis dispostos acima ou abaixo do perfil medio
(trilhamento);
Singer & Nobre & Rocha - marco/2012
29
1. INTRODUC
AO
conc 0
conc 1
conc 8
conc 16
conc 32
conc 64
2.0
Velocidade relativa
1.5
1.0
0.5
0.0
2.0
1.5
1.0
0.5
0.0
5 10 15 20 25 30 35
5 10 15 20 25 30 35
Minutos
ii) identificar uma possvel heterocedasticidade por intermedio da observacao de diferentes variabilidades da resposta ao longo do tempo;
iii) sugerir possveis formas para a curva a ser adotada para explicar a
variacao do perfil medio ao longo do tempo;
iv) comparar as variabilidades inter- e intraunidades amostrais;
v) identificar unidades amostrais e/ou observacoes discrepantes (outliers).
Na Figura 1.3.2 pode-se notar que a resposta media (velocidade de
Singer & Nobre & Rocha - marco/2012
30
1.3 ANALISE
DESCRITIVA E MEDIDAS RESUMO
12
6
10
perfil mdio
25
30
35
40
Semanas psconcepo
31
1. INTRODUC
AO
1.3.1
An
alise do comportamento de perfis
(1.3.1)
32
1.3 ANALISE
DESCRITIVA E MEDIDAS RESUMO
>
de avaliacao; quando c = (1, 0>
a `a diferenca
p2 , 1) , fij corresponder
entre as medidas realizadas no primeiro e u
ltimo instantes de avaliacao.
Denotando o vetor de medias de yij por i e a matriz de covariancias intraunidades amostrais comum por , a media e a variancia das medidas
resumo sao, respectivamente, i = c> i e 2 = c> c. Esse procedimento consiste na substituicao do perfil de repostas (yij ) por um escalar
(fij ), ou seja, reduzindo um problema originalmente multivariado a um
problema univariado, cuja analise pode ser realizada por intermedio de
tecnicas de ANOVA ou regressao, por exemplo.
Essa ideia pode ser estendida para casos em que ha observacoes omissas, em que os perfis yij tem dimensao pij , nao necessariamente iguais;
nesse caso, basta considerar fij = c>
ij yij com cij denotando um vetor
de constantes conhecidas com dimensao pij e ter em mente que as medidas resumo podem ser heterocedasticas, dado que suas variancias sao
ij2 = c>
ij ij cij .
Casos em que a medida resumo fij nao pode ser expressa na forma
(1.3.1) tambem podem ser considerados. Um exemplo frequente ocorre
quando o interesse recai na avaliacao da variacao da resposta em expressa
em porcentagem de algum valor basal, por exemplo, fij = (yijp yij1 )/yij1
em que yijp corresponde `a resposta obtida na u
ltima avaliacao e yij1 a`
resposta obtida no instante inicial (basal). Nesse caso, a variancia da
medida resumo deve ser obtida de forma aproximada.
Exemplo 1.3.1: Os dados disponveis em
www.ime.usp.br/jmsinger/Dados/Singer&Nobre&Rocha2011exemp131.xls
sao provenientes de um experimento realizado do Instituto de Ciencias
Biomedicas da Universidade de Sao Paulo com o objetivo de avaliar
a acao antitumoral de um quimioterapico (BCNU) associado a uma
emulsao lipdica (LDE), uma partcula sintetica cuja atuacao e semelhante ao LDL (low density lipotrotein). Apos o tempo necessario para o
desenvolvimento de um implante tumoral, um conjunto de ratos foi subdividido em 8 grupos (nem todos de mesmo tamanho) e cada um deles
submetido a um tratamento (solucao salina, LDE sem BCNU, BCNU
sem LDE nas doses de 3.5, 7.0 e 15 ppm, LDE com BCNU nas doses
de 3.5, 7.0 e 15 ppm). A massa tumoral (g) de cada animal foi medida
antes e apos 2, 4, 6, 8 e 10 dias da administracao do tratamento. Um
Singer & Nobre & Rocha - marco/2012
33
1. INTRODUC
AO
1.3.2
An
alise de desfecho
A analise de desfecho e importante em ensaios clnicos em que o objetivo e avaliar o valor esperado de algum sintoma ou resposta depois da
administracao de um ou mais tratamentos por um certo tempo. Embora
nao haja interesse direto nas avaliacoes intermediarias, elas geralmente
sao realizadas para deteccao de efeitos colaterais ou outros eventos que
possam estar relacionados com o acompahamento do paciente.
Com dados balanceados em relacao ao tempo, esse tipo de analise
corresponde a um caso particular daquela baseada em (1.3.1) com c =
(0, . . . , 0, 1)> . A presenca de abandonos e que justifica a atencao particularizada. Dentre os enfoques mais comuns para a abordagem desse
problema, destacamos:
i) Eliminacao das unidades com dados omissos.
ii) Utilizacao da u
ltima observacao disponvel.
iii) Ponderacao da u
ltima resposta disponvel segundo algum criterio
que incorpore o motivo do abandono.
iv) Utilizacao de Analise de Covariancia para modelar as causas do
abandono.
A estrategia i) pode gerar conclusoes enviesadas, pois nao leva em conta o
fato de que abandonos podem ter ocorrido pela ausencia ou deficiencia do
efeito terapeutico do tratamento ou por intolerancia a ele. A estrategia
so deve ser utilizada sob a hipotese de que as causas do abandono nao
sao relacionadas com o efeito do tratamento; alem disso deve-se avaliar a
perda de eficiencia da analise gerada pela diminuicao do tamanho amostral.
Uma suposicao fundamental para o emprego da estrategia ii) e que
au
ltima observacao disponvel do paciente que abandonou o estudo corresponde `aquela que se teria observado se ele tivesse completado o ciclo
de observacoes previsto.
Singer & Nobre & Rocha - marco/2012
34
1.3 ANALISE
DESCRITIVA E MEDIDAS RESUMO
O enfoque iii), sugerido por Gould (1973) e aplicavel quando as respostas podem ser ordenadas segundo alguma escala que incorpore o motivo pelo qual o paciente abandonou o estudo. Por exemplo, os pacientes
que nao completaram o estudo podem ser classificados como
i) Curado.
ii) Nao tolerou o tratamento.
iii) Foi imune ao tratamento.
iv) Abandonou o estudo por razoes nao relacionadas com o tratamento.
Gould (1973) sugere que se atribuam escores arbitrarios, P1 > max(yip ) >
min(yip ) > P2 > P3 em que min(yip ) e max(yip ) correspondem, respectivamente, ao menor e maior valor das respostas observadas no instante
p, conforme o paciente seja classificado em i), ii) ou iii). As observacoes
de pacientes classificados em iv) sao descartadas. Para os pacientes que
terminaram o estudo, os escores correspondem aos valores observados
no instante p. A analise pode ser conduzida por meio de tecnicas naoparametricas.
A estrategia iv) sugerida por Bryant & Gillings (1985) consiste em
utilizar uma Analise de Covariancia que inclua uma variavel indicadora
para identificar se a u
ltima observacao de cada paciente foi realizada no
instante p ou antes. Por exemplo, considere um estudo em que se planeja
observar pacientes submetidos a t tratamentos em p ocasioes com a finalidade de avaliar o efeito desses tratamentos numa determinada resposta
no u
ltimo instante. Seja yij a u
ltima resposta do j-esimo paciente submetido ao i-esimo tratamento. Um modelo de ANCOVA para acomodar
os abandonos e
yij = i + i xij + eij , i = 1, . . . t, j = 1, . . . ni ,
em que xij = 1 se o j-esimo paciente submetido ao i-esimo tratamento
abandonou o estudo antes do instante p ou xij = 0 em caso contrario, eij
representa um erro aleatorio com media zero e variancia 2 independente
dos demais, i representa a resposta esperada para pacientes submetidos
ao i-esimo tratamento que nao abandonaram o estudo e i representa
a variacao na resposta media do i-esimo tratamento para pacientes que
abandonaram o estudo.
Singer & Nobre & Rocha - marco/2012
35
1. INTRODUC
AO
1.3.3
An
alise da
area sob curvas
14
21
28
31
38
41
48
Tempo (dias)
36
1.3 ANALISE
DESCRITIVA E MEDIDAS RESUMO
Ai =
37
1. INTRODUC
AO
6.5
6.0
pH
5.5
5.0
4.5
0
10
15
30
45
60
Tempo (minutos)
1.3.4
An
alise da dist
ancia entre curvas
Captulo 2
Modelos lineares para dados
gaussianos
A facilidade de tratamento matematico em conjunto com a indisponibilidade de meios computacionais adequados constituem as principais
razoes para que a analise de dados com medidas repetidas, ou mais especificamente, dados longitudinais tenha-se focado na distribuicao normal
desde as primeiras incursoes realizadas por Wishart (1938). Os trabalhos
classicos de Box (1950), Geisser & Greenhouse (1958), Potthoff & Roy
(1964), Rao (1959), Rao (1965), Rao (1966), Rao (1967) e Grizzle & Allen (1969), entre outros, sao exemplos tpicos dos primeiros esforcos que
se transformaram numa profcua area de pesquisa. Como consequencia,
uma grande variedade de modelos para dados gaussianos pode ser encontrada na literatura estatstica. Como as propriedades de estimadores
e estatsticas de teste obtidas sob esse modelo probabilstico sao bem
conhecidas, os metodos dele oriundos sao excelentes ferramentas para
aplicacoes praticas.
2.1
Introduc
ao
(2.1.1)
40
2.1 INTRODUC
AO
em que, yi = (yi1 , . . . , yipi )> com dimensao (pi 1) e o perfil de respostas da i-esima unidade experimental, e um vetor com dimensao
(t 1) de parametros (efeitos fixos ou parametros de localizacao) desconhecidos, Xi = (xi1 , . . . , xim ) e uma matriz de especificacao dos efeitos
fixos com dimensao (pi t), conhecida e de posto completo, em que
xij = (xij1 , . . . , xijpi )> representa o vetor com os pi valores da j-esima
variavel independente (j = 1, . . . , m) para a i-esima unidade amostral,
bi e um vetor com dimensao (q 1) de variaveis latentes, comumente denominadas efeitos aleatorios, que refletem o comportamento individual
da i-esima unidade experimental, Zi e uma matriz de especificacao dos
efeitos aleatorios (com dimensao (pi q), conhecida e de posto completo),
g e uma funcao com derivadas contnuas ate `a segunda ordem e ei e um
vetor de erros aleatorios com dimensao (pi 1).
Em muitos casos e razoavel assumir que bi Nq (0, G) e ei
Npi (0, Ri ), em que G, com dimensao (q q) e Ri , com dimensao (pi pi )
sao matrizes simetricas definidas positivas e alem disso que bi e ei sao
variaveis aleatorias independentes. Quando g e uma funcao linear dos
efeitos fixos e dos efeitos aleatorios bi , (2.1.1) se reduz ao modelo
linear misto
yi = Xi + Zi bi + ei ,
i = 1, . . . , n.
(2.1.2)
Sob esse modelo, o vetor de respostas associado a` i-esima unidade amostral tem distribuicao normal multivariada com vetor de medias e matriz
de covariancias dados, respectivamente, por
E(yi) = Xi
(2.1.3)
(2.1.4)
(2.1.5)
41
(2.1.6)
(2.1.7)
2.2
Grande parte do esforco empregado na modelagem de dados com medidas repetidas se concentra na estrutura de covariancias. Em geral, o
modelo para a matriz de covariancias Vi deve depender da maneira pela
qual as observacoes foram obtidas e do conhecimento sobre o mecanismo
gerador das observacoes. Diggle (1988) e Diggle et al. (2002) comentam
que a matriz de covariancias deve ser suficientemente flexvel para incluir
no mnimo tres fontes diferentes de variacao aleatoria, nomeadamente:
i) a variacao devida a efeitos aleatorios, quando as unidades de investigacao formam uma amostra aleatoria da populacao de interesse; ii) a
variacao que pode ser explicada por correlacao serial, em que se esperam
observacoes proximas mais fortemente correlacionadas que observacoes
mais distantes e iii) a variacao devida a erros de medida.
No contexto dos modelos mistos, a covariancia entre as observacoes
obtidas em uma mesma unidade amostral podera ser modelada indiretamente por meio dos efeitos aleatorios, bi , que representa a variabilidade
Singer & Nobre & Rocha - marco/2012
42
Vi () =
2 +
(2.2.1)
2. Estrutura AR(1)
1 2 3
1 2
Vi () = 2
2 1
3 2 1
(2.2.2)
3. Estrutura ARMA(1,1)
1
2
1
Vi () = 2
1
2
1
(2.2.3)
43
4. Estrutura antedepend
encia de ordem 1
1 2 1 1 3 1 2 1 4 1 2 3
12
1 2 1
2 3 2
2 4 2 3
22
Vi () =
2
1 3 1 2
3 4 3
2 3 2
3
1 4 1 2 3 2 4 2 3 3 4 3
42
(2.2.4)
5. Estrutura Toeplitz
2
1
Vi () =
2
3
1
2
1
2
2
1
2
1
3
2
1
2
1 2 1 3 1 4
12
2 1
2 3 2 4
22
Vi () =
3 1 3 2
32
3 4
4 1 4 2 4 3
42
(2.2.5)
(2.2.6)
8. Estrutura ARH(1)
12
1 2 1 3 2 1 4 3
2 1
22
2 3 2 4 2
Vi () =
2
3 1 3 2
32
3 4
3
2
4 1 4 2 4 3
42
9. Estrutura Toeplitz heterog
enea
12
1 2 1 1 3 2 1 4 3
2 1 1
22
2 3 1 2 4 2
Vi () =
3 1 2 3 2 1
32
3 4 1
4 1 3 4 2 2 4 3 1
42
(2.2.7)
(2.2.8)
(2.2.9)
44
=
1 1 1 1
x1 x2 x 3 x 4
11. N
ao-estruturada (NE)
12 12 13 14
12 22 23 24
Vi () =
13 23 32 34
14 24 34 42
(2.2.11)
d
X
h Fhi
(2.2.12)
h=1
em que Fhi sao matrizes convenientes conhecidas e h sao parametros desconhecidos. Esse modelo e adequado quando os parametros da matriz de
covariancias sao aditivos, como e o caso das estruturas Uniforme e Toeplitz. Se os parametros forem multiplicativos como ocorre, por exemplo,
na estrutura AR(1), que possui apenas dois parametros, precisaremos de
quatro parametros para escreve-la na forma linear. O modelo Toeplitz
podera ser escrito nessa forma com 1 = 2 , 2 = 1 , 3 = 2 , 4 = 3 e
1 0 0 0
0 1 0 0
0 1 0 0
, F2i = 1 0 1 0 ,
F1i =
0 0 1 0
0 1 0 1
0 0 0 1
0 0 1 0
0 0 0 1
0 0 1 0
0 0 0 0
0 0 0 1
(2.2.13)
F3i =
1 0 0 0 , F4i = 0 0 0 0 .
1 0 0 0
0 1 0 0
Singer & Nobre & Rocha - marco/2012
45
1
1
2
2
1 12 13
2
2
R() = 12 2 23
2
13 23 32
2
2
2. N
ao-estruturada uniforme
12
12 13
R() = 12 22 23
13 23 32
1
3
3
3
3
3
2
1
4
4
4
4
3
2
1
5
5
5
4
3
2
1
6
6
5
1
(2.2.14)
. (2.2.15)
Mais detalhes sobre os processos estocasticos que geram essas estruturas podem ser encontrados em Rocha (2004), por exemplo.
2.3
Infer
encia por m
axima verossimilhan
ca
(2.3.1)
46
2.3 INFERENCIA
POR MAXIMA
VEROSSIMILHANC
A
1X
(2.3.3)
(2.3.4)
i=1
Singer & Nobre & Rocha - marco/2012
47
Como
>
l(, )/ =
n
X
1
X>
i Vi ()Xi
i=1
i=1
b
ii) Substituir ()
na expressao (2.3.3) obtendo a funcao log-verosb
similhanca perfilada l[(),
];
b
iii) Igualar l[(),
]/ a 0, obtendo o sistema de equacoes de estimacao
n
X
1X
b V i ()]
b 1
tr[Vi1 ()
[Qi ()/ j |=b ] = 0,
2 i=1
2 i=1
(2.3.5)
j = 1, . . . , m, em que
b = [Vi ()/ j ]> b
V i ()
=
e
> 1
b
b
Qi () = [yi Xi ()]
Vi ()[yi Xi ()].
[H]rs =
1X
ir V1 (2i > Vi )V1 V
is } +
tr{Vi1 V
i
i
i
2 i=1
1
1
+ tr{Vi1 (i >
i Vi )Vi Vi,rs }
2
ir = /r Vi () e V
i,rs =
em que Vi = Vi (), i = yi Xi , V
b de (2.3.5) corresponde
2 /r s Vi () e definida negativa, a solucao
ao ponto de maximo de l[(), ] e consequentemente e o estimador de
Singer & Nobre & Rocha - marco/2012
48
2.3 INFERENCIA
POR MAXIMA
VEROSSIMILHANC
A
b = (
b )
b em (2.3.4) obtemos o estimador de
MV de . Se substituirmos
MV de .
A metodologia de maxima verossimilhanca gera estimadores naoenviesados para os efeitos fixos mas produz estimadores enviesados para
os parametros da matriz de covariancias intraunidades amostrais por
nao levar em consideracao a perda de graus de liberdade na estimacao
dos primeiros. A fim de reduzir o vies desses estimadores, que pode
ser grande quando o n
umero de parametros de localizacao e grande em
relacao ao n
umero de observacoes, muitos autores, como Laird & Ware
(1982), recomendam o uso do metodo de m
axima verossimilhanca
restrita (MVR). Este metodo foi proposto por Patterson & Thompson (1971) para estimar componentes de variancia e consiste em maximizar a verossimilhanca de uma transformacao linear ortogonal do
tipo y = U> y em que U tem dimensao [N (N t)], e e tal que
(y ) = 0, ou seja, U> X = 0. A verossimilhanca obtida a partir desta
transformacao nao depende dos efeitos fixos e tampouco da particular matriz U escolhida. Em geral obtem-se a verossimilhanca restrita
fazendo U = I X(X> X)1 X> , ou seja utilizando a matriz de projecao
que gera os resduos do ajuste obtido por mnimos quadrados ordinarios.
Da a denominacao de verossimilhanca residual empregada por alguns
autores. Para os dados transformados, temos
E(y) = 0
V(y) = UV()U>,
(2.3.6)
(2.3.7)
(y X)> V1 ()(y X)
log(2), (2.3.8)
2
2
lR () =
49
X
1
1X
lR () = log 2
pi
log |Vi ()|
2
2 i=1
i=1
n
1X
> 1
b
b
[yi Xi ()]
Vi ()[yi Xi ()]
2 i=1
n
X
1
1
log |
X>
i Vi ()Xi |.
2
i=1
(2.3.9)
Neste caso, no processo de maximizacao, o sistema de equacoes de estimacao (2.3.5) e substitudo por
n
X
1X
b V i ()}
b 1
tr{Vi1 ()
[Qi ()/ j |=b ]
2 i=1
2 i=1
n
1X
b > V1 ()
b V i ()V
b 1 ()X
b i } = 0,
tr{Vi1 ()X
i
i
i
2 i=1
(2.3.10)
bR , em conjunto com
j = 1, . . . , m. A solucao de (2.3.10), digamos,
b = (
b
bR ) constituem os estimadores de MVR desejados. Detalhes
R
podem ser obtidos em Demidenko (2004).
Preditores dos efeitos aleatorios podem ser obtidos juntamente com
estimadores para os parametros de localizacao por meio da funcao de
distribuicao conjunta dos efeitos aleatorios b e das observacoes y, nomeadamente
f (y, b) = f (y|b)f (b),
(2.3.11)
em que f (y|b) e f (b) sao as funcoes densidade de y|b e b, respectivamente. Como y|b NN (X + Zb, R) e b Nnq (0, ) a funcao
(2.3.11) pode ser diretamente obtida, como indicam Henderson (1975),
Searle (1971), Searle et al. (1992) ou McCulloch & Searle (2001), por
exemplo.
Por meio do teorema de Gauss-Markov para efeitos aleatorios apresentado em Harville (1977a) podem ser obtidos o melhor estimador
linear n
ao-enviesado (best linear unbiased estimator - BLUE) para
e o melhor preditor n
ao-enviesado (best linear unbiased predictor - BLUP) para o vetor de efeitos aleatorios b. Diferentes formas de
Singer & Nobre & Rocha - marco/2012
50
2.3 INFERENCIA
POR MAXIMA
VEROSSIMILHANC
A
(2.3.12)
e
=
+
.
(2.3.13)
0
0 I
b
d
Cov
1/2 ( 1 ) tem-se
y = X + e ,
(2.3.14)
em que,
1/2
1/2
R
( 2 )X R1/2 ( 2 )Z
R
( 2 )y
y =
, X =
, (2.3.15)
0
0
1/2 ( 1 )
= [ > , b> ]> e e = (e> , d> )> e tal que
V(e) = 2I.
51
ou seja
#
b
=
b
b
(2.3.16)
Essas equacoes sao conhecidas na literatura como equaco
es de Henderson. Note que, se 1 ( 1 ) 0 (o que implica que b e um efeito fixo),
entao (2.3.16) coincide com a equacao de estimacao obtida por meio do
metodo de mnimos quadrados generalizados (MQG). O BLUP e o
BLUE sao obtidos resolvendo-se as equacoes (2.3.16), que independem
da distribuicoes de b e e.
X> R1/2 ( 2 )y
Z> R1/2 ( 2 )y
X> R1 ( 2 )X
X> R1 ( 2 )Z
Z> R1 ( 2 )X Z> R1 ( 2 )Z + 1 ( 1 )
"
(2.3.17)
b
b
b()
= ( 1 )Z> V1 ()[y X()]
(2.3.18)
e
ou alternativamente por
b
l()
=
n
X
1
1
1
[X>
i Vi ()Xi ] Xi Vi ()yi
(2.3.19)
i=1
e
1
b
bbi () = G( 1 )Z>
i Vi ()[yi Xi ()]
(2.3.20)
>
Alem disso, o estimador do parametro de escala comum a >
e dado
1 , 2
por
b2 =
1
>
b
b
[y X()]
[Z( 1 )Z> + R( 2 )]1 [y X()].
(2.3.21)
N t
b
b
Propriedades de ()
e b()
sao dadas em Henderson (1975), Robinson (1991), Searle et al. (1992) ou McCulloch & Searle (2001), por
exemplo. Em particular, Henderson (1975) mostrou que
"
#
1
b
X> R1 ( 2 )X
X> R1 ( 2 )Z
()
=
.
b
Z> R1 ( 2 )X Z> R1 ( 2 )Z + 1 ( 1 )
b()
b
(2.3.22)
Cov
52
2.3 INFERENCIA
POR MAXIMA
VEROSSIMILHANC
A
(2.3.23)
com
n
X
1
1 > 1
() = {Vi1 () Vi1 ()Xi [
X>
i Vi ()Xi ] Xi Vi ()}.
i=1
1X
ir ()V1 ()V
is ()}.
[Vb ()]rs =
tr{Vi1 ()V
i
2 i=1
b quanto
bR sao estimadores consistenPor outro lado, como tanto
tes de , uma aplicacao do Teorema de Sverdrup permite-nos mostrar
Singer & Nobre & Rocha - marco/2012
53
(2.3.24)
b > [C ()C
b > ]1 (C),
b
QW = (C)
(2.3.25)
(2.3.26)
b e l2 ()
b denotam, respectivamente, a funcao log-verossimilhanca
em que l1 ()
maximizada sob o modelo restrito i.e., induzido por (2.3.24) e aquela maximizada sob o modelo irrestrito. Sob as condicoes de regularidade usuais
e para amostras suficientemente grandes, as distribuicoes de (2.3.25) e de
(2.3.26) podem ser aproximadas por distribuicoes 2c quando a hipotese
nula e verdadeira. No entanto, em muitos casos, as hipoteses de interesse
sao do tipo
H0 : a2 = 0 versus H1 : a2 (0, )
(2.3.27)
em que a2 , um dos componentes de e localizado na fronteira do espaco
parametrico. Nesse contexto, tanto os testes de Wald quanto os testes da razao de verossimilhancas apresentam problemas com relacao a`s
condicoes de regularidade conforme mencionam Cox & Hinkley (1974). O
Singer & Nobre & Rocha - marco/2012
54
2.3 INFERENCIA
POR MAXIMA
VEROSSIMILHANC
A
(2.3.28)
(2.3.29)
55
fixos e N e o n
umero efetivo de observacoes. A estrutura que apresenta
os menores valores de AICR e BICR e considerada mais adequada. Este
criterio e conveniente por permitir a comparacao de quaisquer estruturas
de covariancia, exigindo apenas que o modelo para os parametros de
localizacao seja o mesmo. Mais detalhes sobre o uso deste criterio na
selecao de estruturas de covariancia e estudos com medidas repetidas sao
encontrados em Keselman, James, Rhonda & Russell (1998).
Funcoes do tipo L> + D> b em que L e D sao matrizes conhecidas
com dimensoes (l t) e (d nq) com postos l e d, respectivamente,
sao chamadas func
oes previsveis por Henderson (1975) e constituem
generalizacoes das func
oes estim
aveis discutidas em Searle (1971), por
exemplo. Elas podem ser utilizadas para definir hipoteses sobre efeitos
fixos ou sobre combinacoes de efeitos fixos e aleatorios. Nesse contexto,
basta tomar K = [L> D> ] e considerar
H:K
= 0.
(2.3.30)
b
A estatstica de Wald para testar (2.3.30) e
"
#!>
"
#
b
b
c > ]1 K
QW = K b
[KWK
b
b
b
(2.3.31)
b >, b
b > )>
c e uma estimativa da matriz de covariancias de (
em que W
(2.3.22). A distribuicao aproximada da estststica QW e 2posto(K) . Se
estivermos interessados apenas em contrastes dos efeitos fixos, basta considerar nulas as linhas associadas aos efeitos aleatorios na matriz K.
De uma forma mais conservadora, podemos utilizar uma estatstica F
dividindo (2.3.31) pelo posto de K. O n
umero de graus de liberdade do
numerador e dado pelo posto de K e o do denominador, deve ser obtido
por meio de um procedimento de Satterthwaite conforme a sugestao de
Searle (1971).
Intervalos de confianca aproximados para funcoes previsveis em que
K tem uma u
nica linha podem ser construdos como
"
#
q
b
c > ].
(2.3.32)
K b tv, 2 [KWK
b
com tv, 2 denotando o quantil de ordem 1 /2 de uma distribuicao
t-Student com v graus de liberdade.
Singer & Nobre & Rocha - marco/2012
56
DAS EQUAC
2.4 SOLUC
AO
OES
DE ESTIMAC
AO
2.4
Soluc
ao das equa
c
oes de estima
c
ao
Y = XM + E,
(2.4.1)
1
Y> [I X(X> X)1 X> ]Y.
nt
A expressao acima com a substituicao de n t por n corresponde ao estimador de MV. Neste caso, as hipoteses de interesse podem ser expressas
S=
57
na forma
H : CMU = 0
(2.4.2)
58
DAS EQUAC
2.4 SOLUC
AO
OES
DE ESTIMAC
AO
(2.4.3)
Khatri (1966) mostrou que os estimadores propostos por Potthoff & Roy
(1964), a saber,
b = (X> X)1 X> Y
b 1 Q> (Q
b 1 Q> )1
B
e
b > [Y XBQ]
b
b = 1 [Y XBQ]
n
sao estimadores de MV. O estimador de MVR de e obtido com a
substituicao de n t for n na expressao acima. Testes de hipotese sobre
os parametros de localizacao B podem ser obtidos similarmente a`queles
considerados para analise de perfis.
Muitos autores contriburam para o estudo deste modelo nas u
ltimas
decadas. Entre eles, mencionamos Grizzle & Allen (1969), que sugeriram
um procedimento interessante para implementacao da tecnica de ajuste
por covari
ancia proposta por Rao (1966).
Essencialmente, essa tecnica consiste de i) pos-multiplicacao de ambos os lados de (2.4.3) por uma matriz H = [H1 H2 ] com dimensao
(p p) tal que QH1 = Ir and QH2 = 0 de forma que o modelo de curvas
de crescimento fique reduzido a (2.4.1) com Y, M and E respectivamente
substitudas por Y1 = YH1 , B and E = EH1 e ii) utilizacao de todas ou
algumas colunas de Y2 = YH2 , cujos valores esperados sao nulos, como
covariaveis para aumentar a eficiencia dos estimadores dos parametros
de localizacao. Essa tecnica foi aperfeicoada por Baksalary, Corsten &
Kala (1978), Kenward (1985), Calinski & Caussinus (1989) e revista no
texto de Kshirsagar & Smith (1995). Soler & Singer (2000) propuseram
um procedimento otimo para a escolha das covariaveis (colunas de Y2 ).
Singer & Nobre & Rocha - marco/2012
59
1
>
tr{Y[Ip p1 1p 1>
p ]Y }
n(p 1)
1
1 > >
b2 = {
1p Y [In X(X> X)1 X> ]Y1p b2 }.
p nt
Os estimadores de MV correspondentes sao obtidos a com a substituicao
de n t por n na expressao de b2 .
Como a matriz de covariancias intraunidades amostrais com estrutura
uniforme e induzida por modelos mistos com um efeito aleatorio como
aqueles utilizados para analise de estudos com planejamento do tipo splitplot, podemos empregar tecnicas usuais de ANOVA para a analise desse
tipo de problemas.
Trabalhando independentemente, Rouanet & Lepine (1970) e Huynh
& Feldt (1970) mostraram que os testes F para hipoteses do tipo CMU =
0 em que U e uma matriz de dimensao (p u) resultantes da analise
por meio desse enfoque permanecem validos se a matriz de covariancias
intraunidades amostrais satisfizer a condicao menos restritiva de esfericidade ou circularidade em relacao a` U, i.e., se
P> P = Iu
(2.4.4)
2.0
1.2
=
2.0
1.0
1.2
2.5
1.5
1.0
2.0
1.5
3.5
1.8
1.0
1.0
1.8
3.0
Singer & Nobre & Rocha - marco/2012
60
DAS EQUAC
2.4 SOLUC
AO
OES
DE ESTIMAC
AO
1 1 1
1
1 1
1 1
U> = U>
2 =
1
1 1 1
pois a matriz nao e esferica relativamente `a matriz U2 . Nesse contexto,
Singer & Andrade (1994) sugeriram uma estrategia para a obtencao de
testes F para sub-hipoteses relativas a interacoes e interacoes parciais
como aquelas consideradas em Boik (1979). Um teste para esfecidade foi
proposto por Mauchly (1940).
Com base no trabalho de Box (1954a) e Box (1954b), Geisser & Greenhouse (1958) propuseram testes F aproximados para casos em que
nao satisfaz a condicao de esfericidade. Sua sugestao envolve a multiplicacao dos graus de liberdade das estatsticas F geradas pela ANOVA
por um fator de correcao dado por
=
[tr(P> P)]2
.
(p 1)tr(P> P)2
61
[tr(P> SP)]2
(p 1)tr(P> SP)2
b i ) = e (
b i ) = G + 2 (X> X)1 . Como consequencia, esticom (
b i ) sao dados por
madores consistentes de 2 e (
b2 = [n(p t)]1
n
X
i=1
Singer & Nobre & Rocha - marco/2012
62
e
DAS EQUAC
2.4 SOLUC
AO
OES
DE ESTIMAC
AO
b ) = (n 1)1
b (
i
n
X
b )(
b
b )
b >
(
i
i
i=1
b
b = n1 Pn
em que
i=1 i , de forma que os estimadores de G e Vi ()
podem ser obtidos a partir de
b i ) X> X1 b2
b = b (
G
e
b = XGX
b > + b2 Ip .
Vi ()
Esse enfoque e adotado por Graybill (1976), Laird, Lange & Stram (1987)
e Vonesh & Carter (1987), que tambem apresentam as propriedades assintoticas dssees estimadores. Um caso particular esta apresentado no
Apendice B.5.
Metodos mais gerais do que aqueles descritos acima para resolucao
das equacoes de estimacao sao necessarias para acomodar casos com observacoes omissas ou com dados coletados irregularmente ao longo do
tempo. Essencialmente, tres enfoques tem sido considerados com essa
finalidade. O primeiro e baseado no algoritmo de Newton-Raphson
ou em uma adaptacao estatstica denominada algoritmo scoring de
Fisher; o segundo utiliza o algoritmo EM e o terceiro utiliza uma
representac
ao do tipo espaco/estados e o filtro de Kalman.
Dado um valor inicial (0) e denotando a func
ao escore por u() =
b
b
l[(), ]/ e a matriz hessiana por H() = 2 l[(),
]/ > asb
sociadas a` funcao log-verossimilhanca l((),
) o algoritmo de NewtonRaphson para a solucao das equacoes de estimacao (2.3.5) corresponde a
iteracoes de
(l) = (l1) H1 [ (l1) ]u[ (l1) ]
(2.4.5)
para l = 1, 2, . . . ate que algum criterio de convergencia seja satisfeito,
e.g., k (l) (l1) k < para algum valor pre-especificado > 0. Da u
ltima
b
iteracao de (2.4.5) obtemos a estimativa de MV de , nomeadamente ,
b
que substituda em (2.3.4), gera a estimativa de MV de , a saber, .
Se utilizarmos (2.3.10) no lugar de (2.3.5)) nas definicoes de u() e de
H(), os dois procedimentos geram estimativas de MVR.
b nao e
Nos casos em que a matriz de informacao emprica H()
definida positiva em algum passo do processo iterativo, o algoritmo de
Newton-Raphson pode ficar muito lento ou nao convergir. Autores como
Singer & Nobre & Rocha - marco/2012
63
64
DAS EQUAC
2.4 SOLUC
AO
OES
DE ESTIMAC
AO
n
X
(l1)
= E{
e>
), (l1) }
i ei |yi , (
i=1
n
X
(l1)
=
[e>
)ei ( (l1) ) + tr {ei |yi , ( (l1) ), (l1) }]
i (
(2.4.6)
i=1
e
(l)
S2 =
n
X
E{
(l1)
bi b>
), (l1) }
i |yi , (
i=1
n
X
(l1)
=
[bi ( (l1) )b>
)+
i (
(2.4.7)
i=1
em que
ei ( (l1) ) =
e
(l1)
1
bi ( (l1) ) = G( (l1) )Z>
)[yi Xi ( (l1) )].
i Vi (
2(l)
n
X
(l1)
e>
)ei ( (l1) )/
i (
i=1
i=1
e
G
(l)
n
X
=n
n
X
pi =
(l)
s1 /
n
X
pi
(2.4.8)
(l)
(2.4.9)
i=1
(l1)
bi ( (l1) )b>
) = n1 S2 .
i (
i=1
65
2.5
Estrat
egias de an
alise
66
2.5 ESTRATEGIAS
DE ANALISE
tudos longitudinais, e mais razoavel utilizar informacoes sobre o comportamento da resposta ao longo das condicoes de avaliacao na modelagem
da estrutura de covariancia intraunidades amostrais. Para estudos naolongitudinais, sugerimos a seguinte estrategia para a selecao da estrutura
de covariancia intraunidades amostrais:
1. Analise do planejamento do estudo para identificacao de um modelo
saturado para os efeitos fixos e de possveis efeitos aleatorios.
2. Analise das matrizes de covariancias e correlacoes amostrais, quando
for possvel calcula-las, para identificar seus padroes de variacao.
3. Ajuste de modelos saturados para os parametros de localizacao
identificados no item 2 com matrizes de covariancias identificadas
no item 1.
4. Utilizacao dos criterios de informacao AICR e BICR como ferramenta auxiliar na escolha da estrutura de covariancia identificada
nos itens 1 e 2.
5. Analise de resduos.
Para estudos longitudinais, uma estrategia para a identificacao da
estrutura de covariancia intraunidades amostrais e a seguinte:
1. Analise do grafico de perfis medios para propor um modelo para os
efeitos fixos.
2. Analise dos graficos de perfis individuais e de perfis individuais
centralizados para identificar padroes que indiquem possveis efeitos aleatorios e heterocedasticidade ao longo das condicoes de avaliacao.
3. Analise das matrizes de covariancias e correlacoes intraunidades
amostrais, quando for possvel calcula-las, para identificar seus
padroes de variacao.
4. Analise da matriz de graficos de dispersao das observacoes padronizadas quando for possvel constru-los.
5. Analise de graficos de linhas das matrizes de covariancias e correlacoes amostrais versus defasagens.
Singer & Nobre & Rocha - marco/2012
67
2.6
Diagn
ostico
2.7
Notas de captulo
2.8
Exerccios
Captulo 3
Modelos para dados n
ao
gaussianos
3.1
3.2
3.3
Modelos n
ao-param
etricos para an
alise
de perfis
Captulo 4
T
opicos especiais
4.1
Dados omissos
4.2
4.3
Modelos n
ao-lineares
Captulo 5
An
alise de dados
Neste captulo apresentamos exemplos de analise de dados, aproveitandoos para discutir alguns topicos metodologicos nao abordados nos demais.
5.1
Estudos pr
e-teste/p
os-teste
74
Grupo
indometacina
indometacina
indometacina
indometacina
indometacina
indometacina
indometacina
indometacina
indometacina
indometacina
indometacina
indometacina
Antes
148
100
120
116
140
92
112
120
128
124
108
100
Depois
132
76
108
96
128
88
100
108
100
100
92
80
C
ao
13
14
15
16
17
18
19
20
21
22
23
24
Grupo
nifedipina
nifedipina
nifedipina
nifedipina
nifedipina
nifedipina
nifedipina
nifedipina
nifedipina
nifedipina
nifedipina
nifedipina
Antes
82
90
102
110
86
90
90
84
98
116
90
94
Depois
68
72
84
100
58
76
78
72
80
80
80
76
pulacao com dois estratos, que correspondem aos dois tratamentos (indometacina e nifedipina). O interesse e:
a) comparar o efeito da aplicacao de M gSO4 (PAM media pos-teste
- PAM media pre-teste) nos caes tratados com indometacina com
o efeito da aplicacao de M gSO4 nos caes tratados com nifedipina
(interacao entre tratamento e tempo),
b) avaliar o efeito principal da aplicacao de M gSO4 (se nao houver
interacao ou se ela for nao-essencial),
c) avaliar o efeito da aplicacao de M gSO4 para cada tratamento (se
houver interacao essencial),
d) avaliar o efeito principal de tratamento sobre a PAM media (se nao
houver interacao ou se ela for nao-essencial)
e) avaliar o efeito de tratamento sobre a PAM media pre-teste (se
houver interacao essencial).
Para situacoes como aquela descrita no Exemplo 5.1.1, com ni unidades amostrais no estrato i, i = 1, 2, o modelo linear basico pode ser
escrito como
yijk = ik + eijk , i = 1, 2, j = 1, . . . , ni , k = 1, 2
(5.1.1)
75
5. ANALISE
DE DADOS
150
Nifedipina
140
120
110
(mmHg)
130
100
90
80
70
60
50
Pr-Teste
Ps-Teste
Indometa ina
120
Nifedipina
110
100
(mmHg)
90
80
70
60
Pr-Teste
Ps-Teste
76
Nif.
10
30
40
60
Ind.
20
[PsTeste] [PrTeste]
120
PsTeste
100
80
100
60
80
PrTeste
120
140
140
10
Ind.
Nif.
Ind.
Nif.
12 12
12 22
77
5. ANALISE
DE DADOS
iii) C = (1, 0) (ou C = (0, 1)) e U = (1, 1)> [efeito de tempo para o
primeiro (segundo) tratamento],
iv) C = (1, 1) e U = (1, 1)> (efeito principal de tratamento),
v) C = (1, 1) e U = (1, 0)> (efeito de tratamento no pre-teste).
Explicitamente, sob o modelo (2.4.1), as hipoteses i ) -v ) correspondem
respectivamente a 11 12 = 21 22 , 11 + 21 = 12 + 22 , 11 = 12 ,
21 = 22 , 11 + 12 = 21 + 22 , 11 = 21 . As estatsticas de teste
para essas hipoteses sao baseadas nas razes caractersticas das matrizes
de soma de quadrados e produtos cruzados indicadas na Secao 2.4.
Muitos textos e pacotes computacionais (REF) utilizam o modelo
(5.1.1) sob a reparametrizac
ao de desvios m
edios
ik = + i + k + ik i = 1, 2, k = 1, 2
(5.1.2)
com as restric
oes de identificabilidade
2
X
i =
i=1
2
X
k=1
k =
2
X
i=1
ik =
2
X
ik = 0.
k=1
78
e consequentemente, e mais restritivo que o modelo MANOVA, na medida em que impoe homocedasticidade para as observacoes intraunidades
amostrais e nao permite covariancias negativas entre elas. Essencialmente, este modelo, tem a forma (2.3.1) com
> >
>
>
>
) ,
, . . . , y2n
, y21
, . . . , y1n
y = (y11
2
1
1 +n2
12 ,
X = 2i=1 (1ni I2 ), = (11 , 12 , 21 , 22 )> , Z = nl=1
Alem disso, ele pode ser considerado como um caso particular dos
modelos do tipo split-plot e a correspondente analise de dados pode ser
implementada por meio de ANOVA com duas fontes de variacao. Nesse
contexto, as hipoteses de interesse podem ser testadas por meio de estatsticas como aquelas indicadas na Tabela 5.1.2 em que as somas de
quadrados podem ser expressas em termos das somas e diferencas entre
as respostas intraunidades amostrais, nomeadamente, sij = yij1 + yij2 e
dij = yij1 yij2 , ou seja
SQET r =
2
X
ni (s1 s)2 ,
i=1
com si = ni 1
Pni
j=1
sij e s = (n1 + n2 )1
SQE1 =
ni
2 X
X
P2
i=1
Pni
j=1
sij ,
(sij si )2 ,
i=1 j=1
SQT rT p =
2
X
ni (di d)2 ,
i=1
com di = ni
Pni
1
1
j=1 dij e d = (n1 + n2 )
P2
i=1
Pni
j=1
dij ,
ni
2 X
X
SQE2 =
(dij di )2 .
i=1 j=1
Singer & Nobre & Rocha - marco/2012
79
5. ANALISE
DE DADOS
Graus de
liberdade
1
n2
1
1
n2
Soma de
quadrados
SQT r
SQE1
SQT p
SQT pT r
SQE2
Quadrado
medio
SQT r/1
SQE1/(n 2)
SQT p/1
SQT pT r/1
SQE2 /(n 2)
Estatstica
F
FT r
FT p
FT pT r
p
(n1 + n2 )/(n1 n2 )]}2 .
Entao, pode-se deduzir que para testar a hipotese (iii), basta utilizar
FT pT r1 = {d1 /[sd / n1 ]}2 ou FT pT r2 = {d2 /[sd / n2 ]}2 , consoante o interesse recaia no primeiro ou no segundo tratamento.
Finalmente, para testar a hipotese (v), pode-se utilizar a estatstica
FT rT p1 = {
ni
X
p
(n1 + n2 )/(n1 n2 )]}2
j=1
Singer & Nobre & Rocha - marco/2012
80
P P i
Pni
em que s21 = (n 2)1 2i=1 nj=1
(yij1 y i1 )2 com y i1 = n1
i
j=1 yij1 .
Sob a hipotese nula de que as respostas medias das unidades amostrais
dos dois tratamentos sao iguais no pre-teste, a estatstica FT rT p1 segue
uma distribuicao F1,n1 +n2 2 .
Convem notar que a suposicao de homocedasticidade das medidas intraunidades amostrais (i.e., igualdade das variancias no pre- e pos-teste)
nao e necessaria para que as estatsticas de teste consideradas acima
sigam distribuicoes F . Basta que as matrizes de covariancias intraunidades amostrais sejam iguais. Isso implica que os resultados sao validos
sob modelos mais gerais do que aquele definido por (5.1.1)-(5.1.3).
Os resultados da analise dos dados do Exemplo 5.1.2 estao dispostos
na Tabela 5.1.3.
Tabela 5.1.3: Tabela ANOVA para os dados do Exemplo 5.1.2
Fonte
de variac
ao
Grupo
C
aes
Tempo
Grupo Tempo
Observac
oes
Graus de
liberdade
1
22
1
1
22
Soma de
quadrados
6533.3
7829.3
3468.0
1.3
578.7
Quadrado
medio
6533.3
355.9
3468.0
1.3
26.3
Estatstica
F
18.36
Valor-P
0.0003
131.85
0.05
0.0000
0.8239
1 =
e 2 =
284.61
100.00
e a estimativa da matriz de covariancias intraunidades amostrais comum,
obtida sob a hipotese de homocedasticidade entre os dois grupos e
189.88
164.79
=
.
192.30
Apesar de as matrizes de covariancias amostrais sugerirem uma possvel
heterocedasticidade, i.e., que 1 6= 2 , as correspondentes estimativas
das variancias das diferencas entre as respostas no pre-teste e pos-teste
sao respectivamente
d21 = 46.05,
d22 = 59.16, e apontam para a homocedasticidade das correspondentes variancias populacionais, d21 e d22 .
Singer & Nobre & Rocha - marco/2012
81
5. ANALISE
DE DADOS
82
G
as
T
T
T
T
T
T
T
T
T
T
T
T
T
T
Pr
e-teste
0.0828
0.0274
0.0115
0.0112
0.0065
0.0025
0.0357
0.0232
0.0356
0.0458
0.0836
0.0638
0.0909
0.0281
P
os-teste
0.0347
0.0172
0.0022
0.0157
0.0149
0.0000
0.0147
0.0291
0.0092
0.0490
0.0208
0.0221
0.0972
0.0204
Rato G
as Pr
e-teste
15
C
0.0477
16
C
0.0313
17
C
-0.0437
18
C
0.0358
19
C
0.0477
20
C
0.0579
21
C
0.0664
22
C
0.0871
23
C
0.0517
24
C
0.1102
25
C
0.0776
26
C
0.0970
27
C
0.0157
28
C
0.1203
29
C
0.0279
Ventilac
ao com T : ar sintetico/helio-oxigenio
Ventilac
ao com C: ar sintetico/ar sintetico
P
os-teste
0.0461
0.0114
0.0417
0.0021
0.0488
0.0591
0.0986
0.0529
0.0577
0.1018
0.0329
0.0110
0.0258
0.1171
0.0176
a) comparar os efeitos (RHSR media pos-teste - RHSR media preteste) da ventilacao com T e com C (interacao entre tratamento e
tempo),
83
5. ANALISE
DE DADOS
0.13
He
O2
0.12
0.11
Resistn ia Homognea
0.10
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0.00
Pr-Teste
Ps-Teste
84
0.06
Ar sintetico
Helio+O2
0.03
0.04
0.02
RHSR
0.05
Antes
Depois
Periodo
85
5. ANALISE
DE DADOS
0.06
0.14
T
0.00
0.02
[PsTeste] [PrTeste]
0.04
0.06
0.02
0.00
C
0.02
0.04
0.12
0.10
0.08
PsTeste
0.04
0.06
0.08
0.06
0.00
0.02
0.04
PrTeste
0.10
0.12
0.14
Embora os modelos considerados acima tambem possam ser empregados nesse caso, um modelo de analise de covariancia (ANCOVA) tambem
pode ser utilizado para atacar as questoes pertinentes, nomeadamente,
(a) e (b). Para essa abordagem, a analise e condicional aos valores das
respostas no pre-teste, yij1 , i = 1, 2 j = 1, . . . , ni , que admitimos fixas.
Um modelo de ANCOVA e
yij2 = 2 + i + (yij1 y 1 ) + eij , i = 1, 2, j = 1, . . . , ni ,
em que y 1 = n1
ni
2 P
P
i=1 j=1
(5.1.4)
aleatorio tal que (eij ) = 0, (eij ) = 2 e as variaveis eij sao nao correlacionadas duas a duas, i = 1, 2 j = 1, . . . , ni , e 2 , i e correspondem,
respectivamente, ao valor esperado da resposta no pos-teste quando nao
se considera tratamento (media geral), ao efeito do tratamento i no valor
esperado da resposta e ao coeficiente de regressao linear comum (de yij2
em funcao de yij1 ).
Uma das vantagens desse tipo de modelo e que aborda diretamente a
Singer & Nobre & Rocha - marco/2012
86
ni
2 P
P
i=1 j=1
(5.1.5)
yij1 , 1 + 2 = 0, eij e um
87
5. ANALISE
DE DADOS
Pr teste x Ps teste
Regresso Linear Tratamento
Regresso Linear Controle
0.10
Controle
Tratamento
0.06
ps teste
0.08
0.04
0.02
0.00
0.05
0.00
0.05
0.10
pr teste
(5.1.6)
b2 +
i + (yij1 y 1 ), i = 1, 2, obtidas via mnimos quadrados estao
apresentados na Figura 5.1.8.
Singer & Nobre & Rocha - marco/2012
88
5.2 ANALISE
DE PERFIS
0.08
0.04
0.00
PsTeste
0.12
0.00
0.04
0.08
0.12
PrTeste
Esse grafico serve para ilustrar que a comparacao entre as medias das
respostas pos-teste ajustadas independem do valor da resposta pre-teste
tomada como referencia.
Ao teste da hipotese i = 0 no modelo (5.1.4) corresponde P = 0.11,
o que sugere uma igualdade das respostas pos-teste medias ajustadas.
A resposta media pos-teste comum ajustada pode ser obtida mediante
o reajuste do modelo sem o termo i e um intervalo de confianca com
coeficiente de confianca de 95% para esse valor e XX Y Y . Como
esperado, sob o modelo (5.1.5), ao teste da hipotese i = 0 tambem
corresponde P = 0.11, ilustrando a equivalencia de ambos os modelos
descritos com respeito a` capacidade de detectar diferencas nas respostas
pos-teste medias ajustadas. Neste caso, para o teste da hipotese = 0,
obtemos P = 0.29, o que sugere que nao ha diferenca entre a resposta
medias pos-teste e pre-teste ajustadas.
Detalhes sobre as relacoes identificadas acima alem de outras consideracoes sobre a a analise de estudos do tipo pre-teste/pos-teste podem ser encontrados em Brogan & Kutner (1980), Grieve (1981), Levin
(1981), Schafer (1981), Kutner & Brogan (1981), Laird (1983) e StaSinger & Nobre & Rocha - marco/2012
5. ANALISE
DE DADOS
89
5.2
An
alise de perfis
90
5.2 ANALISE
DE PERFIS
11 12 . . . 1p
21 22 . . . 2p
(5.2.1)
M = ..
..
..
..
.
.
.
.
t1 t2 . . . tp
e X = tj=1 1nj .
Em termos dos parametros jk , a hipotese i ) pode ser expressa como
11 12
21 22
t1 t2
12 13 22 23
t2 t3
HI :
=
= ... =
.
..
..
..
.
.
.
1(p1) 1p
2(p1) 2p
t(p1) tp
Na ausencia de interacao, ou seja, quando nao rejeitamos HI , as hipoteses
ii ) e iii ) podem ser definidas como
HT :
p
X
k=1
1k =
p
X
k=1
2k = . . . =
p
X
tk
k=1
Singer & Nobre & Rocha - marco/2012
91
5. ANALISE
DE DADOS
e
HP :
t
X
t
X
j1 =
j=1
j2 = . . . =
j=1
t
X
jp .
j=1
21
t1
11
12 22
t2
HT I : .. = .. = . . . = ..
. .
.
1p
2p
tp
e
HP I
11
21
..
.
12
22
..
.
= ... =
tp
t2
t1
1p
2p
..
.
Figura 5.2.1: Perfis medios de resposta correspondentes a situacoes hipoteticas com 2 tratamentos e 3 tempos
22
A2
23
21
12
A1
13
11
B2
B3
B1
A2
23
22
21
12
B1
22
A1
13
11
B2
B3
A1
13
21
12
A2
23
11
B1
B2
B3
92
5.2 ANALISE
DE PERFIS
(essencial); neste caso nao se pode falar em efeitos principais de tratamento e de tempo e sim em efeitos de tratamento (ou tempo) em cada
nvel de tempo (ou tratamento).
As hipoteses descritas acima podem ser expressas na forma (2.4.2).
A matriz C e utilizada para definir as comparacoes das respostas medias
entre tratamentos e a matriz U e utilizada para definir as comparacoes
das respostas medias entre tempos. Lembrando que a escolha dessas
matrizes para a definicao de cada uma das hipoteses em questao nao e
u
nica, podemos definir HI por meio de (2.4.2) com
1 1
0 ...
0
1
0 1 . . .
0
C = C1 = ..
,
..
.. . .
.
.
.
.
0
1
0
0 . . . 1
uma matriz com dimensao (t 1) t e
1
0
1
1
0 1
U = U1 = ..
..
.
.
0
0
0
0
0
0
1
..
.
...
...
...
..
.
0
0
0
..
.
0 ...
1
0 . . . 1
(5.2.2)
com L = C U> .
Singer & Nobre & Rocha - marco/2012
93
5. ANALISE
DE DADOS
1
0
1 .
C = 1 1
e U = 1
0 1
Sob a formulacao (2.3.1) temos
= vec(M) = [11 , 12 , 13 , 21 , 22 , 23 ]> .
e a matriz L associada `a hipotese HI e
1 1 0 1 1 0
L=
.
0 1 1 0 1 1
A formulacao (2.3.1) permite a especificacao de hipoteses mais gerais que
a formulacao (2.4.1), pois no primeiro caso, L pode ser qualquer matriz
de posto completo.
Apresentamos a seguir analises de perfis de conjuntos de dados reais.
Nossos objetivos sao essencialmente didaticos e nao pretendemos fazer
uma analise exaustiva do problema considerado.
Exemplo 5.2.1: Os dados apresentados na Tabela 5.2.1 sao oriundos
de experimento na area de nutricao animal realizado no Centro Nacional
de Pesquisa de Sunos e Aves da EMBRAPA. O principal objetivo e
comparar os efeitos de duas dietas experimentais (T1 e T2) e de uma
dieta controle (T3) no ganho de peso e consumo alimentar de frangos
de corte. A resposta e a conversao alimentar media, expressa em kg de
consumo de racao por kg de ganho de peso apos 7, 14, 21 e 28 dias do
incio do experimento.
Exemplo 5.2.2: Os dados considerados neste exemplo foram obtidos
de um estudo cuja finalidade era avaliar o efeito do clordiazepoxido no
mecanismo de bloqueio de ansiedade em ratos. Essa droga funciona como
agente depressor do sistema nervoso central e e empregada clinicamente
com tal fim. O estudo foi baseado numa amostra de 90 ratos de mesma
linhagem com pesos e idades comparaveis e consistiu das tres seguintes
etapas:
Singer & Nobre & Rocha - marco/2012
94
5.2 ANALISE
DE PERFIS
dia 28
1.899
1.927
1.955
1.979
1.981
2.034
2.049
2.082
1.910
1.926
1.939
1.952
95
5. ANALISE
DE DADOS
96
5.2 ANALISE
DE PERFIS
PLACEBO
CDPA2.5
CDPA5.0
CDPA10.0
CDPA15.0
CDPC5.0
ndice de extino
2.5
2.0
1.5
1.0
0.5
0.0
2.5
2.0
1.5
1.0
0.5
0.0
CDPC10.0
ANFET
ATROP
2.5
2.0
1.5
1.0
0.5
0.0
2 4 6 8 10 12
2 4 6 8 10 12
Tempo
97
5. ANALISE
DE DADOS
1.40
1.20
1.00
0.80
0.60
0.40
0.20
0.00
0
10
12
14
Tempo
PLACEBO
CDPA2.5
CDPA5.0
CDPA10.0
CDPA15.0
CDPC5.0
CDPC10.0
ANFET
ANTROP
1
0.70
0.68
0.61
0.49
0.44
0.43
0.37
0.41
0.33
0.22
0.21
0.20
1
0.79
0.69
0.53
0.44
0.39
0.35
0.42
0.39
0.34
0.28
0.29
1
0.84
0.70
0.65
0.63
0.58
0.61
0.55
0.52
0.47
0.52
1
0.81
0.77
0.74
0.72
0.74
0.67
0.62
0.60
0.61
1
0.89
0.88
0.86
0.82
0.77
0.74
0.72
0.74
1
0.91
0.86
0.82
0.78
0.77
0.76
0.76
1
0.92
0.84
0.83
0.83
0.83
0.81
1
0.91
0.87
0.86
0.83
0.81
1
0.91
0.86
0.83
0.82
1
0.92 1
0.90 0.92 1
0.88 0.89 0.91 1
(5.2.3)
98
5.2 ANALISE
DE PERFIS
Correlaes
0.80
0.60
0.40
0.20
0.00
0
10
12
14
Defasagem
c1
c7
c2
c8
c3
c9
c4
c10
c5
c11
c6
c12
Essas ferramentas permitem-nos observar que os valores dos coeficientes de correlacao em cada coluna da matriz decrescem com a defasagem,
sugerindo a presenca de correlacao serial. Alem disso, notamos um aumento do valor dos coeficientes de correlacao em cada subdiagonal. Esses
padroes observados sugerem que a estrutura de antedependencia para a
matriz de correlacoes intraunidades amostrais.
Ainda com o objetivo de identificar uma estrutura de covariancia
adequada para os dados, ajustamos o modelo
yijk = ij + eijk
em que, i = 1, . . . , 10 indexa as unidades amostrais (dentro de tratamento), j = 1, . . . , 9 indexa tratamentos (1=PLACEBO, 2=CDPA2.5,
3=CDPA5.0, 4=CDPA10.0, 5=CDPA15.0, 6=CDPC5.0, 7=CDPC10.0,
8=ANFET e 9=ATROP), k = 1, . . . , 13 indexa os tempos e eijk sao erros
aleatorios. Alternativamente, o modelo pode ser escrito como
yij = j + eij ,
(5.2.4)
em que yij denota o vetor com os ndices de extincao da i-esima unidade amostral submetida ao j-esimo tratamento ao longo dos k instantes
de observacao, j representa o vetor com as medias dos ndices de extincao para o j-esimo tratamento ao longo dos k instantes de observacao
e eij representa o vetor com dos erros de medida associados, para o qual
assumimos uma distribuicao N (0; R).
Singer & Nobre & Rocha - marco/2012
99
5. ANALISE
DE DADOS
N
umero de
parametros
2
14
25
3
91
AIC
70.8
43.0
11.2
50.2
-5.2
BIC
75.8
78.0
73.7
57.7
222.3
100
5.2 ANALISE
DE PERFIS
A composicao desses grupos tem uma explicacao biologica que nao discutiremos aqui. A inclusao dos tratamentos ANFET e ATROP no mesmo
grupo do PLACEBO pode ser justificada em funcao da pequena dosagem dos estimulantes administrada aos animais; caso uma dosagem
maior tivesse sido considerada, esses tratamentos teriam sido includos
no GRUPO 3. Uma representacao grafica dos ndices de extincao medios
correspondentes aos tratamentos de cada um desses tres grupos e indicada na Figura 5.2.5. O tratamento PLACEBO foi includo em todos os
graficos para comparacao.
1.27
1.27
1.07
1.07
0.87
0.87
0.67
0.47
0.27
0.07
0.67
0.47
0.27
0.07
10
12
14
-0.13
10
11
12
13
-0.13
Tempo
Tempo
PLACEBO
CDPA2.5
CDPA5.0
ANFET
PLACEBO
ANTROP
CDPA10.0
CDPC5.0
1.27
1.07
0.87
0.67
0.47
0.27
0.07
1
10
11
12
13
-0.13
Tempo
PLACEBO
CDPA15.0
CDPC10.0
101
5. ANALISE
DE DADOS
C=
1 1 0 0 0 0
0
0
0
1 0 1 0 0 0
0
0
0
1 0
0 0 0 0
0 1 0
1 0
0 0 0 0
0
0 1
0 0
0 1 0 1 0
0
0
0 0
0 0 1 0 1 0
0
(5.2.6)
U=
1
0
0
0
0
0
0
0
0
0
0
0
1 1
0
0
0
0
0
0
0
0
0
0
0 1 1
0
0
0
0
0
0
0
0
0
0
0 1 1
0
0
0
0
0
0
0
0
0
0
0 1 1
0
0
0
0
0
0
0
0
0
0
0 1 1
0
0
0
0
0
0
0
0
0
0
0 1 1
0
0
0
0
0
0
0
0
0
0
0 1 1
0
0
0
0
0
0
0
0
0
0
0 1 1
0
0
0
0
0
0
0
0
0
0
0 1 1
0
0
0
0
0
0
0
0
0
0
0 1 1
0
0
0
0
0
0
0
0
0
0
0 1 1
0
0
0
0
0
0
0
0
0
0
0 1
(5.2.7)
O valor-P correspondente ao teste dessa hipotese e p = 0.7223, e sugere
que nao ha razoes para a sua rejeicao. Como consequencia, podemos considerar paralelos os perfis medios de resposta dos tratamentos dentro de
cada um dos grupos descritos acima e entao faz sentido testar hipoteses
sobre a inexistencia de efeito de tratamentos nos moldes de HT I e de
inexistencia de efeito de tempo nos moldes de HP I dentro de cada um
dos tres grupos. A especificacao dessas hipoteses na forma (5.2.2) com
L = C U> , assim como os valores das estatsticas F aproximadas, os
respectivos graus de liberdade (g.l) e os valores-P dos testes correspondentes estao indicados na Tabela 5.2.3.
Esses resultados sugerem que:
i) os 9 tratamentos podem ser classificados em 3 grupos de tratamentos
equivalentes;
ii) tratamentos pertencentes a grupos diferentes tem efeitos diferentes;
iii) somente os tratamentos do segundo grupo produzem respostas medias
essencialmente constantes ao longo das condicoes de avaliacao.
Singer & Nobre & Rocha - marco/2012
102
5.2 ANALISE
DE PERFIS
Tabela 5.2.3: Testes para as hipoteses de existencia de efeito de Tratamento e de Tempo dentro de grupos
Hip
otese
gl
(5.2.6)
113
1.75
(6, 963)
0.106
Tempo Grupo 1
(1 1 1 0 0 0 0 1 1)
(5.2.7)
2.85
(12, 963)
0.001
Tempo Grupo 2
(0 0 0 1 0 1 0 0 0)
(5.2.7)
0.76
(12, 963)
0.697
Tempo Grupo 3
(0 0 0 0 1 0 1 0 0)
(5.2.7)
3.64
(12, 963)
< 0.001
Tratamento
103
5. ANALISE
DE DADOS
Tempo
Estimativa
Erro padrao
1
1
1
1
1
1
1
1
1
1
1
1
1
2
3
3
3
3
3
3
3
3
3
3
3
3
3
1
2
3
4
5
6
7
8
9
10
11
12
13
1 - 13
1
2
3
4
5
6
7
8
9
10
11
12
13
0.84
0.75
0.67
0.62
0.63
0.63
0.62
0.57
0.56
0.51
0.48
0.49
0.46
0.44
0.36
0.52
0.55
0.54
0.62
0.69
0.77
0.73
0.68
0.83
0.88
0.90
0.97
0.05
0.05
0.05
0.05
0.06
0.06
0.06
0.06
0.06
0.06
0.06
0.06
0.06
0.07
0.09
0.09
0.08
0.08
0.09
0.09
0.09
0.09
0.10
0.10
0.10
0.09
0.10
Ap
endice A
Matrizes e espa
cos vetoriais
A.1
Matrizes
A=
..
..
..
.. = ((aij ))1in,1jm .
.
.
.
.
am1 am2 . . . amn
Um exemplo de uma matriz (2 4) e
A=
1 0 4 8
3 5 2
0
.
106
A.1 MATRIZES
u
nica coluna:
u=
u11
u21
..
.
um1
Nesta obra, matrizes serao representadas por letras mai
usculas em negrito (por exemplo, A, X, G) e vetores, por letras min
usculas em negrito
(a, x, y, por exemplo). Quando necessario, a dimensao sera especificada
entre parenteses; por exemplo, A (m n). Uma matriz A (m n), pode
ser expressa como A = (a1 . . . an ), com aj denotando sua j-esima coluna,
ou seja,
a1j
a2j
aj = .. .
.
amj
A.1.1
Opera
c
oes b
asicas
Multiplicac
ao por escalar: Sejam k um n
umero real e A uma matriz
(m n). O produto A por k denotado B = kA e uma matriz (m n)
no qual o elemento bij = kaij , ou seja,
B = kA = ..
..
..
.. .
.
.
.
.
kam1 kam2 . . . kamn
Soma e subtrac
ao de matrizes: Sejam A e B duas matrizes de mesma
dimensao (mn). Sua soma, representada por A+B, e a matriz (mn)
cujos elementos sao dados por cij = aij + bij , ou seja,
A+B =
.
..
..
..
..
.
.
.
.
am1 + bm1 am2 + bm2 . . . amn + bmn
Singer & Nobre & Rocha - marco/2012
107
A. MATRIZES E ESPAC
OS VETORIAIS
n
X
k=1
para i = 1, . . . , m e j = 1, . . . , q.
Sejam A, B e C matrizes tais que os produtos AB, AC e BC estejam
bem definidos. Entao valem as seguintes propriedades:
i) A(BC) = (AB)C;
ii) A(B + C) = AB + AC .
Em geral o produto de matrizes nao e comutativo, ou seja, nao necessariamente AB = BA. Por exemplo, dadas
1 0 0
0 1 0
A = 1 2 1 e B = 1 0 1 ,
0 0 5
1 1 0
temos
0 1 0
1 0 1
AB = 1 2 0 6= BA = 1 1 1 .
2 1 1
2 0 1
Singer & Nobre & Rocha - marco/2012
108
A.1 MATRIZES
1 0 0
1
3
2 ,
A= 0 2 0 e B= 1
0 0 5
2 2
temos
1
3
2
4 ,
AB =
10 10
mas o produto BA nao esta definido.
Matriz transposta: A matriz transposta (`as vezes chamada apenas de
transposta) de uma matriz A (m n), denotada por A> , e a matriz
com dimensao (n m) cujos elementos a0ij sao dados por a0ij = aji . Por
exemplo, se
1
3
2 ,
A= 1
2 2
entao
>
A =
1 1 2
3 2 2
.
A.1.2
109
A. MATRIZES E ESPAC
OS VETORIAIS
Matriz sim
etrica: Uma matriz quadrada A e simetrica se A = A> .
Matriz diagonal: Uma matriz quadrada A e diagonal se todos os elementos nao pertencentes `a diagonal principal forem nulos, ou seja, se for
da forma
a11 0 . . . 0
0 a22 . . . 0
A = ..
..
..
.. .
.
.
.
.
0
0 . . . ann
Seja A uma matriz quadrada de ordem n e a um vetor (n 1) formado
pelos elementos de sua diagonal principal. Entao, o operador diagonal e
definido como
diag(A) = a
e
diag(a) =
a11 0 . . . 0
0 a22 . . . 0
..
..
..
..
.
.
.
.
0
0 . . . ann
A = ..
..
..
..
.. ,
.
.
.
.
.
0
0
0 . . . ann
2
110
A.1 MATRIZES
A.1.3
2 5 1 4
A = 7 4 0 10 ,
0, 3 7 20 8
podemos obter, por exemplo, as seguintes submatrizes de A
2 5 1
7 4 0
0, 3 7 20
e
2 5 1 4
7 4 0 10
,
111
A. MATRIZES E ESPAC
OS VETORIAIS
A = ..
..
..
..
.. ,
.
.
.
.
.
Ap1 Ap2 Ap3 . . . Aps
com Aij representando uma submatriz de dimensao (mi nj ), i = 1, . . . , p;
j = 1, . . . , s com m
. , ns representando n
umeros inteiros
P1 ,p. . . , mp , n1 , . .P
s
positivos, tais que i=1 mi = m e j=1 nj = n. Por exemplo, a matriz
2 5 1 4
A = 7 4 0 10 ,
3 7 20 8
pode ser representada como
A=
em que
A11 =
2 5
7 4
, A12 =
A11 A12
A21 A22
1 4
0 10
,
,
A>
21
=
3
7
e
A>
22
=
20
8
,
A.1.4
Independ
encia linear e espaco-coluna
Combinac
ao linear: Sejam x1 , . . . , xp vetores de dimensao (n 1).
O vetor u, de dimensao (n 1), e uma combinacao linear dos vetores
x1 , . . . , xp , se existem c1 , . . . , cp , n
umeros reais tais que u = c1 x1 + . . . +
cp x p .
Independ
encia linear: Os vetores x1 , . . . , xp de dimensao (n 1) sao
linearmente independentes (L.I.) se, e somente se, a combinacao linear
c1 x1 + . . . + cp xp = 0 implicar c1 = . . . = cp = 0.
Espaco-coluna: Seja X uma matriz de dimensao (n p). O espacocoluna da matriz X, denotado C(X), e o conjunto de todas as combinacoes lineares dos vetores coluna da matriz X, ou seja, C(X) = {y
IRn : y = Xa, a IRp }.
Singer & Nobre & Rocha - marco/2012
112
A.1 MATRIZES
A.1.5
n
X
k=1
113
A. MATRIZES E ESPAC
OS VETORIAIS
n
Y
aii ;
i=1
A.1.6
Invers
ao de matrizes
114
A.1 MATRIZES
(A1 a)(b> A1 )
;
1 b> A1 a
|D|
|A BD1 C|.
|A|
115
A. MATRIZES E ESPAC
OS VETORIAIS
A.1.7
Tra
co de uma matriz
Traco de
Puma matriz: O traco de uma matriz quadrada de ordem n e
tr(A) = ni=1 aii .
Por exemplo, se
6 7
4
1 ,
A= 5 9
3 8 2
(A.1.1)
Pn
i=1
Pn Pn
i=1
j=1
a2ij ;
a2i .
Singer & Nobre & Rocha - marco/2012
116
A.1 MATRIZES
A.1.8
A1 0 . . . 0
n
0 A2 . . . 0
M
Ai = A1 A2 . . . An = ..
..
..
.. .
.
.
.
.
i=1
0
0 . . . An
Produto de Kronecker: Sejam A e B matrizes de dimensoes (m n)
e (p q), respectivamente. O produto de Kronecker (produto direto
ou produto tensorial) das matrizes A e B e a matriz de dimensao
(mp nq), definida por
A B = ..
..
..
.. .
.
.
.
.
am1 B am2 B . . . amn B
Em geral A B 6= B A.
Sejam A, B, C, D matrizes reais de dimensoes (m n), (p q),
(n u), (q v), respectivamente, a, b e d vetores de dimensoes (m 1),
(n1) e (p1), respectivamente, e x e y n
umeros reais. Pode-se mostrar
que valem as seguintes propriedades:
i) x A = A x = xA;
ii) a b> = b> a = ab> ;
iii) 0pq A = A 0pq = 0mpnq ;
Singer & Nobre & Rocha - marco/2012
117
A. MATRIZES E ESPAC
OS VETORIAIS
iv) Im Ip = Imp ;
v) Se F = diag(f11 , . . . , fkk ), entao F A =
vi) Ik A =
Lk
i=1
Lk
i=1
fii A;
A;
118
A.1 MATRIZES
A.1.9
vec(A) =
a1
a2
..
.
an
Sejam A, B, C matrizes reais de dimensoes (m n), (n p), (p
q), respectivamente e vetores a e b de dimensoes (m 1) e (n 1),
respectivamente. Entao valem as seguintes propriedades:
i) vec(a> ) = vec(a);
ii) vec(ab> ) = b a;
iii) vec(AB) = (Ip A)vec(B) = (B> Im )vec(A);
iv) vec(ABC) = (C> A)vec(B);
v) vec(ABC) = (Iq AB)vec(C) = (C> B> In )vec(A). Alem disso,
vi) Se A e B sao matrizes de mesma dimensao, temos
tr(A> B) = vec(A)> vec(B)
e
vec(A> )> vec(B) = vec(B> )> vec(A) = tr(AB);
vii) Se B for uma matriz de dimensao (n m), entao
tr(AB) = vec(A> )> vec(B);
viii) Se A e B sao matrizes simetricas de ordem n, entao
vec(A)> (B B)vec(A) = [tr(BA)]2 ;
Singer & Nobre & Rocha - marco/2012
119
A. MATRIZES E ESPAC
OS VETORIAIS
vech(A) =
A.2
a11
a21
a31
a22
a32
a33
T
opicos de Algebra
Linear
120
A.2 TOPICOS
DE ALGEBRA
LINEAR
A. MATRIZES E ESPAC
OS VETORIAIS
121
..
..
..
T(x) = Ax = ..
.
.
.
. ...
.
.
xp1
an1 an2 .. anp
Teorema A.2.1. Sejam x1 , . . . , xp vetores de dimensao (n 1) pertencentes ao espaco vetorial IRn e W o conjunto definido por
W = {b IR | b =
n
p
X
i=1
y1
n
y2 X
>
x y = x y = ( x1 x2 . . . xn ) .. =
xi y i .
. i=1
yn
Singer & Nobre & Rocha - marco/2012
122
A.2 TOPICOS
DE ALGEBRA
LINEAR
Desigualdade de Cauchy-Schwarz
Desigualdade triangular
Angulo
entre vetores: O angulo [0, ] entre dois vetores a e
b IRn e
a> b
.
arccos() =
kakkbk
Produto interno de matrizes: No espaco IRmn , o produto interno
canonico das matrizes A e B e o n
umero real tr(A> B) = tr(AB> ).
Norma de uma matriz: A norma da matriz A IRmn (comumente
denominada norma de Frobenius) e o n
umero real
1
2
m X
n
X
! 12
a2ij
= kvec(A)k.
i=1 j=1
Singer & Nobre & Rocha - marco/2012
A. MATRIZES E ESPAC
OS VETORIAIS
123
124
A.2 TOPICOS
DE ALGEBRA
LINEAR
1 4
9 1
,
Singer & Nobre & Rocha - marco/2012
125
A. MATRIZES E ESPAC
OS VETORIAIS
|A I| =
=
9 1
0 1
= (1 )2 36 = 0,
ou sejam, 1 = 5 e 2 = 7.
Autovetor (Vetor caracterstico): Seja A uma matriz quadrada de
ordem n e um autovalor de A. Se v e um vetor (nao nulo) tal que
Av = v, entao v e denominado autovetor (ou vetor caracterstico) da
matriz A.
Para o exemplo acima, o autovetor associado ao autovalor 1 = 5 e
obtido do sistema
1 4
v11
v11
= 5
9 1
v12
v12
que tem infinitas solucoes; um possvel autovetor associado ao autovalor
1 = 5 e v = (2 3)> . De modo similar, obtemos um autovetor
associado ao autovalor 2 = 7, nomeadamente, v2 = (2 3)> .
Teorema A.2.8. Seja A uma matriz quadrada de ordem n e 1 , . . . , n
seus autovalores; entao
i) |A| =
Qn
ii) tr(A) =
A.3
i=1
i ;
Pn
i=1
i .
Forma linear: Uma forma linear e uma funcao f : IRn IR que associa
a cada vetor x IRn o n
umero real
f (x) = a> x =
n
X
ai x i
i=1
126
f (x, y) = x Ay =
m X
n
X
aij xi yj
i=1 j=1
f (x) = x Ax =
n X
n
X
aij xi xj
i=1 j=1
127
A. MATRIZES E ESPAC
OS VETORIAIS
V(y>Ay) = 2tr(AV)2.
A.4
Decomposi
c
ao de matrizes
128
A.5
f (x) = a x =
n
X
ai x i ;
i=1
129
A. MATRIZES E ESPAC
OS VETORIAIS
f1 (x)
f (x) = f2 (x)
f3 (x)
com f1 (x) = x1 + x2 , f2 (x) = ex1 x2 e f3 (x) = x1 x2 , por exemplo.
iii) matrizes do tipo
F(x) = ( f1 (x) f2 (x) . . .
=
..
..
.
.
fm1 (x) fm2 (x)
fn (x) )
. . . f1n (x)
. . . f2n (x)
;
..
..
.
.
. . . fmn (x)
x1 + x2
x1
= x1 x2 x1 + x2 .
x1 x2 x1 x2
Em muitas aplicacoes, e possvel ainda encontrar funcoes do tipo F(X)
com X denotando uma matriz de coeficientes com dimensao (m n).
No restante desta subsecao admitimos a existencia de todas as derivadas mencionadas.
Vetor gradiente: Seja f (x) uma funcao do vetor x de dimensao (p1).
A derivada de primeira ordem ou vetor gradiente de f (x) e o vetor de
dimensao (p 1) dado por
f (x)
=
f (x) =
x
f (x) f (x)
f (x)
,
,...,
x1
x2
xp
>
.
130
2 f (x)/x21
2 f (x)/x1 x2 . . . 2 f (x)/x1 xp
2 f (x)/x2 x1
2 f (x)/x22
. . . 2 f (x)/x2 xp
f (x)
=
.
..
..
..
..
>
xx
.
.
.
.
2
2
2
2
f (x)/xp x1 f (x)/xp x2 . . .
f (x)/xp
A matriz hessiana de f (x) tambem e comumente denotada por 2 f (x).
Por exemplo, se x = (x1 , x2 , x3 )> e f (x) = 2x21 + 4x22 + 5x23 , a matriz
hessiana de f e dada por
2 f (x)/x1 x2 2 f (x)/x1 x3
2 f (x)/x21
f (x)
2 f (x)/x2 x3
2 f (x)/x22
= 2 f (x)/x2 x1
xx>
2 f (x)/x3 x1 2 f (x)/x3 x2
2 f (x)/x23
4 0 0
0 8 0
=
0 0 10
As definicoes acima podem ser estendidas para funcoes vetoriais ou matriciais.
Matriz jacobiana: Seja f (x) = (f1 (x), . . . , fm (x))> um vetor de dimensao (m 1) de funcoes com argumento vetorial x = (x1 , . . . , xp ). A
matriz jacobiana de f (x) e a matriz de dimensao (m p) dada por
f (x)
f2 (x)/x1 f2 (x)/x2 . . . f2 (x)/xp
f (x) =
=
.
..
..
..
..
x>
.
.
.
.
fm (x)/x1 fm (x)/x2 . . . fm (x)/xp
Singer & Nobre & Rocha - marco/2012
131
A. MATRIZES E ESPAC
OS VETORIAIS
f1 (x)/x1 f1 (x)/x2
1
1
f (x)
f2 (x)/x1 f2 (x)/x2 = x2 ex1 x2 x1 ex1 x2 ;
=
>
x
f3 (x)/x1 f3 (x)/x2
x2
x1
Similarmente, se F(x) = (f1 (x) f2 (x) . . . fn (x)) for uma matriz de
dimensao (m n) de funcoes f (x), sua derivada de primeira ordem e a
matriz de dimensao (m np) dada por
F(x) =
F(x)
=
x>
1 1 1 0
= x2 x1 1 1 .
1 1 x2 x1
Seja f uma funcao real da matriz X de dimensao (m n) definida
por
X=
x11
x21
..
.
x12
x22
..
.
xm1 xm2
. . . x1n
. . . x2n
..
..
.
.
. . . xmn
=
..
..
..
..
.
.
.
.
f /xm1 f /xm2 . . . f /xmn
132
As regras do produto e da cadeia podem ser empregadas para derivacao vetorial e matricial. Se f1 (x) e f2 (x) sao duas funcoes vetoriais
diferenciaveis de dimensao (m 1) com argumento x, entao
[f1 (x)> f2 (x)]/x> = f1 (x)> (f2 (x)/x> ) + f2 (x)> (f1 (x)/x> )
Se o vetor g(z) com dimensao (p 1) e funcao de um vetor de variaveis
z de dimensao (q 1) e f (x) e uma funcao com argumento g(z), entao
f [g(z)]/z> = (f (x)/x> )|x=g(z) (g(z)/z> ).
Algumas das derivadas vetoriais e matriciais mais usadas em aplicacoes
estatsticas sao:
i) a> x/x = a;
ii) x> x/x = 2x;
iii) x> Ax/x = (A + A> )x (= 2Ax, se A for simetrica);
iv) Para A e B simetricas,
(x> Ax/x> Bx)/x = 2Ax/x> Bx [x> Ax/(x> Bx)2 ]2Bx;
v) Para A simetrica,
{y g(x)}> A{y g(x)}/x = 2D(x)> A{y g(x)}
em que D(x) = g(x)/x> ;
vi) Para matrizes A com dimensao (m n), e B com dimensao (n q),
tr(A(x)B(x))/x = tr(A(x)B(z))/x|z=x +tr(A(z)B(x))/x|z=x .
vii) |X|/xij = |Xij |, em que |Xij | e o cofator de xij ;
viii) ln |X|/xij = tr(X1 (X/xij )) ;
ix) X1 /xij = X1 (X/xij )X1 ;
x) [trX]/xij = tr[X/xij ];
xi) tr(AX1 B)/X = (X1 BAX1 )> ;
Singer & Nobre & Rocha - marco/2012
133
A. MATRIZES E ESPAC
OS VETORIAIS
134
(/)g(, )
(/)g(, )
com
g(, )
(y f ())> V1 ()(y f ())
=
>
f ()
= 2
V1 ()(y f ()).
135
A. MATRIZES E ESPAC
OS VETORIAIS
g(, )
=
>
>
2 f () V1 ()(y f ())
>
2 f > () 1
= 2
V ()(y f ())
>
>
f ()
f ()
1
V ()
.
+ 2
>
y f ())> V1 ()(y f ()
g(, )
=
i
>
i
f ()
= 2
V1 ()(y f ()).
i
g(, )
=
i j
>
1
2 f()
V
()(y
f
())
i
j
f () V1 ()
= 2
(y f ())
i
i
>
f ()
V1 () 1
= 2
V1 ()
V ()(y f ()).
i
i
>
136
>
1 V()
1
(y f ())(y f ()) + V() V()
=
tr V()
s
j
n
o
1
1
(y f ())> V()1 V()
V()
(y
f
())
j
=
s
io
n h
tr V()1 V()
j
+
s
h
i
1
1
V()1 V()
V()
j
= (y f ())>
(y f ())
s
i
h
V()1 V()
j
.
+ tr
s
Utilizando a regra do produto para derivadas de matrizes, temos que
i
h
V()1 V()
j
V1 () V()
V()
1
=
+ V ()
s
s
j
s
j
V() 1 V()
2 V()
1
1
= V ()
V ()
+ V ()
s
j
s j
e
1
1 V()
1
V()
V()
=
s
j
h
i
1 V()
V()
j
V1 () + V()
V() V1 ()
j
s
s
V() 1 V() 1
= V1 ()
V ()
V ()
s
j
2 V() 1
V ()
+ V1 ()
s j
V() 1 V() 1
V1 ()
V ()
V ().
j
s
137
A. MATRIZES E ESPAC
OS VETORIAIS
Assim
2 g(, )
V() 1 V() 1
= (y f ())> V1 ()
V ()
V ()(y f ())
s j
s
j
2 V() 1
V ()(y f ())
(y f ())> V1 ()
s j
V() 1 V() 1
+ (y f ())> V1 ()
V ()
V ()(y f ())
j
s
V() 1 V()
2 V()
1
1
+ tr V ()
.
V ()
+ V ()
s
j
s j
Alem disso, como V1 (), V()/j e V()/s sao matrizes simetricas
e
V() 1 V() 1
(y f ())> V1 ()
V ()
V ()(y f ())
s
j
e um escalar, obtemos a igualdade
V() 1 V() 1
V ()
V ()(y f ()) =
s
j
V() 1 V() 1
V ()
V ()(y f ()).
(y f ())> V1 ()
j
s
(y f ())> V1 ()
A = V1 ()
138
A.6
Exerccios
>
n X
n
X
a2ij ;
i=1 j=1
v) kxk2 =
n
X
i=1
139
A. MATRIZES E ESPAC
OS VETORIAIS
i) |A| = 0 ou |A| = 1;
ii) Os autovalores de A sao iguais a 0 ou 1;
iii) In A e idempotente e A(In A) = (In A)A = 0n ;
iv) Suponha adicionalmente que A e simetrica e prove que
a) r(A) = tr(A);
b) r(A) = n A = In .
Sugestao: Utilize a decomposicao espectral de A.
Observacao: Os resultados sao validos mesmo quando a matriz A
nao e simetrica.
v) Construa exemplos numericos (com matrizes diferentes da matriz
identidade) para ilustrar as propriedades acima.
A.6.5. Mostre que se X e uma matriz tal que X> X = X entao ela e
simetrica e idempotente. Construa um exemplo numerico (com X diferente da matriz identidade) para ilustrar a propriedade acima.
A.6.6. Seja A uma matriz quadrada cujos autovalores sao representados
por 1 , . . . , n . Prove que
|A| =
n
Y
i .
i=1
140
1
A=
.
1
Para que valores de a matriz A e positiva definida?
A.6.9. Seja f (X) uma funcao real de uma matriz X com dimensao (m
n) e elementos = xij , i = 1, . . . , m, j = 1, . . . , n. A derivada de f com
respeito a X e definida como sendo a matriz (mn) de derivadas f /xij :
f (X)
f (X)
x11 . . . x1n
f (X)
..
..
..
.
:=
.
.
.
X
f (X)
f (X)
...
xm1
xmn
Sejam x = (x1 , . . . , xn )> e a = (a1 , . . . , an )> , vetores com dimensao
(n 1) e A, uma matriz quadrada de ordem n. Mostre que
x> a
a> x
=
=a
x
x
x> Ax
= (A + A> )x.
x
A.6.10. Seja x = (x1 , . . . , xn )> um vetor de n observacoes de uma certa
variavel X. Mostre que a media e a variancia amostral das observacoes
podem ser escritas na seguinte forma matricial:
n
1X
1
xi = 1 >
x =
x
n i=1
n n
n
s2x
1 X
1
=
(xi x)2 =
(x 1n x)> (x 1n x)
n 1 i=1
n1
1
1
x> (In Jn )x,
n1
n
em que 1n representa um vetor de dimensao (n 1) com todos elementos
iguais a 1 e Jn = 1n 1>
n.
=
141
A. MATRIZES E ESPAC
OS VETORIAIS
A.6.11. Mostre que a matriz In n1 Jn e simetrica, idempotente e naonegativa definida (n.n.d.), i.e., x> (In Jn )x 0, x 6= 0
A.6.12. Considere as seguintes funcoes das variaveis aleatorias Y1 , Y2 ,
Y3 e Y4 :
W 1 = Y1 Y2
W 2 = Y1 + Y3
W 3 = Y1 Y4
i) Expresse as relacoes acima em notacao matricial.
ii) Obtenha a esperanca do vetor W = (W1 , W2 , W3 )> em termos das
esperancas de Y1 , Y2 , Y3 e Y4 .
iii) Obtenha a matriz de covariancias do vetor W em termos das variancias
e covariancias de Y1 , Y2 , Y3 e Y4 .
A.6.13. Sejam A uma matriz com dimensao m n, B uma matriz quadrada de ordem n e x um vetor com dimensao (n 1). Mostre que
i) Ax/x = A> ;
ii) x> Bx/x = (B + B> )x;
iii) x> Bx/x = 2Bx se B for simetrica.
Ap
endice B
Regress
ao
B.1
Introduc
ao
144
B.1 INTRODUC
AO
(B.1.1)
Singer & Nobre & Rocha - marco/2012
145
B. APENDICE
B
(B.1.2)
146
B.1 INTRODUC
AO
Pressao sistolica
114
134
116
139
110
150
152
138
142
145
156
159
142
156
164
185
162
176
175
180
Idade
17
18
20
23
34
38
41
42
46
47
47
47
50
52
57
60
64
66
69
70
i = 1, . . . , 20
y1
1 x1
y2
1 x2
y = .. , X = .. .. , =
ee=
.
. .
y20
1 x20
e1
e2
..
.
e20
i = 1, . . . , 20
Singer & Nobre & Rocha - marco/2012
147
B. APENDICE
B
em que x0 e uma constante conhecida, por exemplo x0 = x com x denotando a idade media dos pacientes. Nesse caso, o parametro corresponde ao valor esperado da pressao arterial sistolica para pacientes cuja
idade e x. Se escolhermos x0 = 17, o parametro seria interpretado como
valor esperado da pressao arterial sistolica para pacientes cuja idade e de
17 anos. Nesses casos, a matriz de especificacao do modelo seria dada
por
1 x1 x0
1 x2 x0
X = ..
.
..
.
.
1 x20 x0
Tendo em conta que esse modelo e equivalente a
yi = + xi + ei ,
i = 1, . . . , 20
Area
construda
4.5
5.9
4.2
5.2
8.1
9.7
10.7
11.9
12.0
12.3
0.9
2.5
1.3
1.8
3.1
4.6
6.1
6.0
5.9
6.1
7.1
10.4
7.2
8.2
8.5
11.9
12.1
12.5
12.0
11.3
i = 1, . . . , 10,
Singer & Nobre & Rocha - marco/2012
148
B.1 INTRODUC
AO
y=
y1
y2
..
.
yn
,X =
1 x11 x21
1 x12 x22
.. ..
. .
1 x1n x2n
ee=
, = 1
e1
e2
..
.
en
Aqui, o parametro 1 representa a variacao na capacidade instalada esperada por unidade de potencia instalada para empresas com a mesma
area construda. O parametro 2 tem interpretacao semelhante com
a substituicao de potencia instalada por area construda e vice-versa.
Como nao temos dados para empresas com potencia instalada menor
que 0.9 1000kW e area construda menor que 7.1 100m2 , o parametro
0 deve ser interpretado como um fator de ajuste do plano que aproxima
a verdadeira funcao que relaciona a variavel resposta e as variaveis explicativas na regiao em que ha dados disponveis. Se essa funcao for linear
em todo o campo de variacao das variaveis explicativas, um modelo linear
mais adequado nao deveria conter o termo 0 , pois potencia instalada e
area construda iguais a zero implicariam capacidade de producao nula.
149
B. APENDICE
B
N
umero de frutos Concentracao N
umero de frutos
de boa qualidade do fertilizante de boa qualidade
16
40
24
18
40
25
19
40
28
20
50
26
18
50
28
20
50
30
21
50
32
22
50
35
23
50
25
22
25
26
i = 1, . . . , k, j = 1, . . . , ni
(B.1.3)
150
B.1 INTRODUC
AO
y11
..
y1n1
y21
.
.
y=
,X =
y2n2
..
k1
..
yknk
1
..
.
1
0
..
.
0
..
.
0
..
.
0 ...
..
. ...
0 ...
1 ...
..
. ...
1 ...
..
. ...
0 ...
..
. ...
0
0
0
..
.
, = ..
0
..
.
1
..
.
0 0 ... 1
e e = [e11 , . . . , e1n1 , e21 , . . . , e2n2 , . . . , ek1 , . . . , eknk ]> . Embora esse seja um
modelo linear (nos parametros), ele nao impoe uma relacao linear entre
o valor esperado do n
umero de frutos de boa qualidade (i ) e a concentracao do fertilizante (xij ), ou seja, permita acomodar um efeito naolinear desse fator. Se considerarmos a natureza quantitativa dos nveis
do fator Concentracao de fertilizante e quisermos adotar um modelo linear (expresso na forma generica) que inclua um efeito linear desse fator,
podemos utilizar
yij = 0 + 1 xi + eij ,
i = 1, . . . , k, j = 1, . . . , ni
y11
1 x1
..
.. ..
.
. .
y1n1
1 x1
y21
1 x2
.
. .
.
. .
0
.
. .
y=
,
X
=
,
=
e
e
=
1
y2n2
1 x2
.
. .
..
.. ..
y
1 x
k
k1
..
.. ..
.
. .
yknk
1 xk
(B.1.4)
e11
..
.
e1n1
e21
..
.
.
e2n2
..
.
ek1
..
.
eknk
Exemplo B.1.4: As ondas epidemicas estacionais de gripe constituem uma carga consideravel para os servicos de sa
ude e caracterizam-se
Singer & Nobre & Rocha - marco/2012
151
B. APENDICE
B
por sua grande variabilidade de ano a ano. O uso dos dados historicos
pode servir para estabelecer um modelo preditor do n
umero de medicos
indispensaveis para atender a totalidade das consultas numa forma eficiente. Os dados da Tabela B.1.4 correspondem aos n
umeros de consultas
(acumuladas semanalmente) da temporada invernal realizadas nos anos
de 2000 a 2004 numa certa localidade.
2000
23470
26101
29178
32460
34949
37698
41216
44661
48030
55254
2001
2002
2003
46041 18284 20868
86018 23800 24574
105393 30764 28399
124280 40738 31496
138060 59248 34459
151779 93457 37703
162918 132469 42823
169642 162121 46930
174107 179232 50527
175520 185623 64897
2004
18726
21674
25771
29270
32563
40797
56698
72239
87008
84654
Supondo que para cada ano a relacao entre o tempo (em semanas) e
o n
umero esperado de consultas possa ser representado por intermedio
de regressoes lineares simples, poderamos considerar um modelo do tipo
(B.1.5)
em que 0i representa o n
umero esperado de consultas no incio do inverno
do ano i (i = 1 correspondendo ao ano 2000) e 1i denota a variacao no
n
umero esperado de consultas por semana para o ano i. Neste caso
particular, k = 5 e ni = 10. Na forma matricial (B.1.1), esse modelo
Singer & Nobre & Rocha - marco/2012
152
B.1 INTRODUC
AO
y11
1
..
..
.
.
y1n1
1
y21
0
.
.
.
.
.
.
y=
,X =
y2n2
0
.
.
..
..
y
0
k1
..
..
.
.
yknk
0
0 ...
.. . .
.
.
0 ...
1 ...
.. . .
.
.
1
..
.
0
..
.
0
0
..
.
x11
..
.
0
..
.
0
..
.
...
..
.
...
...
..
.
0 x1n1
0
0
0 0
x21
0
..
..
..
..
.
.
.
.
. . . 0 0 x2n2 . . . 0
.. ..
..
..
..
..
. .
.
.
.
.
... 1 0
0 . . . xk1
..
..
..
..
. . . ..
.
.
.
.
.
... 1 0
0 . . . xknk
01
02
0k
, =
11
12
..
1k
e
e = [e11 , . . . , e1n1 , e21 , . . . , e2n2 , . . . , ek1 , . . . , eknk ]>
em que n = n1 + n2 + . . . + nk .
Se considerarmos que existe um n
umero fixo de pacientes com gripe no
incio do inverno (semana 1), e que a variacao desse n
umero de gripados
depende das condicoes climaticas de cada ano, o modelo poderia ser
escrito como
yij = 0 + 1i xij + eij , i = 1, . . . , k, j = 1, . . . , ni
ou na forma matricial (B.1.1), com
y11
1 x11
0
..
..
..
..
.
.
.
.
y1n1
1 x1n1
0
y21
1 0
x21
.
.
..
..
.
.
.
.
.
.
y=
,
X
=
y2n2
1 0 x2n2
.
.
..
..
..
..
.
.
y
1 0
0
k1
..
..
.
..
.
.
.
.
.
yknk
1 0
0
...
...
0
..
.
...
...
..
.
0
0
..
.
...
..
.
0
..
.
. . . xk1
..
..
.
.
. . . xknk
(B.1.6)
11
12
,
..
1k
e e como acima.
Singer & Nobre & Rocha - marco/2012
153
B. APENDICE
B
y11
1 0
..
.. ..
.
. .
y1n1
1 0
y21
0 1
.
. .
.
. .
.
. .
y=
,X =
y2n2
0 1
.
. .
..
.. ..
y
0 0
k1
..
.. ..
.
. .
yknk
0 0
0
..
.
...
..
.
...
...
...
0
0
..
.
...
..
.
0
..
.
... 1
. . . ..
.
... 1
x11
..
.
x1n1
01
x21
..
02
.
.
, = ..
x2n2
0k
..
.
1
xk1
..
.
xknk
e e como acima.
Exemplo B.1.5: Em muitas situacoes, o modelo de regress
ao segmentada proporciona maior flexibilidade para a caracterizacao do comportamento da resposta. Esse modelo se caracteriza pela existencia de
um ponto x0 (conhecido) em que a taxa de variacao da resposta media
se altera. Para justificar o modelo, suponhamos que
0 + 1 xi + ei , xi x0 , i = 1, . . . , j
yi =
3 + 2 xi + ei , xi x0 , i = j + 1, . . . , n.
Admitindo que as duas retas tem em comum o ponto (x0 , y0 ), temos
0 + 1 x0 = 3 + 2 x0 , ou seja 3 = 0 + 1 x0 2 x0 . Substituindo essa
expressao de 3 no modelo original, obtem-se o seguinte modelo com tres
parametros (0 , 1 , 2 ):
0 + 1 xi + ei ,
xi x0 , i = 1, . . . , j
yi =
0 + 1 x0 + 2 (xi x0 ) + ei , xi x0 , i = j + 1, . . . , n.
Singer & Nobre & Rocha - marco/2012
154
B.1 INTRODUC
AO
y1
..
y = j ,X =
yj+1
..
yn
1 x1
0
.. ..
..
. .
.
1 xj
0
1 x0 (xj+1 x0 )
.. ..
..
. .
.
1 x0
e1
..
.
0
ej
=
e
e
=
.
1
ej+1
2
..
(xn x0 )
en
(B.1.7)
155
B. APENDICE
B
C=
1 0 . . . 0 1
0 1 . . . 0 1
.. .. .. ..
.. .
. . . .
.
0 0 . . . 1 1
1 0 . . . 1 0 . . . 0 0
0 1 . . . 1 0 . . . 0 0
C = .. ..
..
.. .. .. .. .. ,
. .
.
. . . . .
0 . . . 1 1 0 . . . 0 0
por exemplo, e m = 0, um vetor de dimensao [(k 1) 1].
No Exemplo B.1.5, a hipotese de que os coeficientes angulares correspondentes a valores da variavel explicativa menores ou maiores do que
x0 sao iguais pode ser expressa na forma (B.1.7) com C = [0 1 1].
B.2
M
etodo de mnimos quadrados
>
Q() = e e = (y X) (y X) =
n
X
e2i .
(B.2.1)
i=1
156
B.2 METODO
DE MINIMOS QUADRADOS
2 Q()
= 2X> X.
2
= X> y.
Igualando a primeira derivada parcial a zero, temos X> X
3
Como assumimos que X tem posto completo , entao X> X e uma matriz nao singular e a solucao do sistema de equaco
es de estimac
ao
4
(tambem conhecido por sistema de equac
oes normais) e
b = (X> X)1 X> y.
(B.2.2)
b = ,
E()
b = 2 (X> X)1 .
V()
Quando a matriz X n
ao tem posto completo, o sistema de equacoes de estimacao
tem infinitas soluc
oes dadas por
b = (X> X) X> y + [I (X> X) X> X]g,
157
B. APENDICE
B
e () = , entao
r> ()r,
b
r> ()r
r IRp .
Sob a suposicao adicional de que os erros ei tem distribuicao Normal,
a linearidade do estimador (B.2.2) permite-nos concluir que
b Np [, 2 (X> X)1 ].
(B.2.3)
Como, em geral a variancia 2 e desconhecida, inferencias sobre dependem de um estimador desse parametro e um candidato e o estimador
nao enviesado
b > (y X)
b
s2 = (n p)1 (y X)
= (n p)1 y> [In X(X> X)1 X> ]y.
Como a matriz In X(X> X)1 X> e idempotente pode-se recorrer ao
Teorema A.3.3 para mostrar que (n p) 2 s2 2np .
Dados uma matriz C de constantes conhecidas com dimensao (c p)
e r(C) = c e um vetor m de constantes conhecidas com dimensao (c 1)
consideremos a forma quadratica
b m)> [C(X> X)1 C> ]1 (C
b m)
QC = (C
= [C(X> X)1 X> y m]> [C(X> X)1 C> ]1 [C(X> X)1 X> y m].
Tendo (B.2.3) em conta, podemos novamente recorrer ao Teorema A.3.3
para mostrar que 2 QC 2c () com parametro de nao-centralidade
= (C m)> [C(X> X)1 C> ]1 (C m). Como C(X> X)1 X> y
m = C(X> X)1 X> [y XC(C> C)1 m], e possvel expressar QC como
uma forma quadratica na variavel y XC(C> C)1 m, ou seja
QC = [y XC(C> C)1 m]> A[y XC(C> C)1 m]
com
A = X(X> X)1 C[C(X> X)1 C> ]1 C> (X> X)1 X> .
Tambem e possvel escrever
(n p)s2 = y> [In X(X> X)1 X> ]y
= [y XC(C> C)1 m]> B[y XC(C> C)1 m]
Singer & Nobre & Rocha - marco/2012
158
B.2 METODO
DE MINIMOS QUADRADOS
159
B. APENDICE
B
b) limn X>
n Xn = V, com V finita e definida positiva.
D
b )
n(
Np (0, 2 V1 )
n
ou equivalentemente, que
D
1/2 b
( n ) Np (0, 2 Ip ).
(X>
n Xn )
Em termos praticos, esse resultado significa que para amostras com tamanhos suficientemente grandes,
b Np [, 2 (X> X)1 ]
(B.2.5)
cuja distribuicao sob a hipotese nula pode ser aproximada por uma distribuicao 2c .
Existem situacoes em que a suposicao de homocedasticidade i.e.,
variancias constantes, nao e valida. Como ilustracao, tomemos o Exemplo B.1.1, em que um aumento da variancia da pressao arterial sistolica
com a idade nao seria um fato inesperado. Por exemplo, poderamos
supor que (ei ) = xi 2 , ou seja, que (e) = diag{x1 , . . . , x20 } 2 . Nesse
caso, o modelo e dito heteroced
astico. De uma forma mais geral, podemos ter modelos em que a matriz de covariancias de e e uma matriz
simetrica definida positiva, V. Nesses casos, o ajuste do modelo pode ser
concretizado por meio do metodo dos mnimos quadrados generalizados (MQG) que consiste em minimizar
Q() = (y X)> V1 (y X)
casos de interesse pr
atico. Em particular, no caso de problemas envolvendo a comparac
ao de k medias, ela corresponde `a exigencia de que os tamanhos
Pk ni das amostras
colhidas de cada subpopulacao investigada sejam tais que ni / i=1 ni convirja para
Pk
uma constante i com n = i=1 ni .
Singer & Nobre & Rocha - marco/2012
160
B.3 METODO
DE MAXIMA
VEROSSIMILHANC
A
Quando a matriz V e uma matriz diagonal com elementos wi 2 na diagonal principal, o metodo e chamado de mnimos quadrados ponderados e a funcao a ser minimizada pode ser expressa como
>
Q() = (y X) V (y X) =
n
X
2
wi1 (yi x>
i ) .
i=1
Admitindo que V e conhecida e considerando um procedimento similar a`quele usado no caso de mnimos quadrados ordinarios, podemos
mostrar que o estimador de mnimos quadrados generalizados de e
= (X> V1 X)1 X> V1 y.
Quando ha d
uvida com relacao a` suposicao de normalidade, mas (e) =
V, com V finita e conhecida, o Teorema Limite Central permite-nos
concluir que para n suficientemente grande,
Np [, (X> V1 X)1 ]
Como, em geral, V nao e conhecida, podemos substitu-la por um estib e considerar o estimador
mador consistente V
b = (X> V
b 1 X)1 X> V
b 1 y.
(B.2.6)
(B.2.7)
Intervalos de confianca aproximados para combinacoes lineares da forma
C ou testes para hipoteses do tipo (B.1.7) podem ser concretizados
utilizando (B.2.7) ou a estatstica de Wald
b m)> [C(X> V
b m),
b 1 X)1 C> ]1 (C
QW = (C
(B.2.8)
cuja distribuicao sob a hipotese nula pode ser aproximada por uma distribuicao 2c .
Singer & Nobre & Rocha - marco/2012
161
B. APENDICE
B
B.3
M
etodo de m
axima verossimilhan
ca
e
b > (y X)
b = n1 y> [In X(X> X)1 X> ]y.
b2 = n1 (y X)
Dado que a maximizacao de (B.3.1) relativamente a corresponde a` minimizacao da forma quadratica de seu expoente, nao e de se estranhar que
os estimadores de maxima verossimilhanca e de mnimos quadrados sejam
identicos. Por outro lado, o estimador de maxima verossimilhanca de 2
corresponde ao estimador proposto anteriormente (s2 ) multiplicado por
um fator (n p)/n e e, consequentemente, enviesado. A razao para isso e
que o estimador
b2 depende de e uma alternativa para se conseguir um
estimador nao enviesado e utilizar o metodo de maxima verossimilhanca
restrita que consiste na minimizacao de uma transformacao linear dos
dados que nao dependa desse parametro. Uma transformacao com essas caractersticas e dada por y = [I X(X> X)1 X]y. A maximizacao
da verossimilhanca correspondente gera o estimador nao enviesado s2 .
Mais detalhes sobre esse metodo podem ser encontrados em Diggle et al.
(2002), por exemplo.
A metodologia de maxima verossimilhanca tambem pode ser aplicada
a modelos do tipo (B.1.1) com e N(0, V) em que os elementos nao redundantes de V sao expressos na forma de um vetor de parametros (de
covariancias), , i.e., V = V(). A funcao de verossimilhanca correspondente e
L(, |y, X) = (2)n/2 |V()|1/2 exp[(y X)> V1 ()(y X)].
(B.3.2)
Singer & Nobre & Rocha - marco/2012
162
DA SOMA DE QUADRADOS
B.4 PARTIC
AO
B.4
Partic
ao da soma de quadrados
A utilidade do modelo de regressao para explicacao da variacao da resposta esperada como funcao das variaveis explicativas pode ser avaliada
a partir da identidade
yi y) + (yi ybi )
yi y = (b
que implica
n
X
(yi y)2 =
n
X
(b
yi y)2 +
i=1
i=1
Os termos
SQT =
n
X
n
X
(yi ybi )2 .
i=1
i=1
SQR =
n
X
(b
yi y)2 = y> [X(X> X)1 X> n1 11> )]y
i=1
n
X
SQE =
(yi ybi )2 = y> [In X(X> X)1 X> ]y
i=1
b
Quando o ajuste do modelo (y) = X e perfeito, i.e., quando y = y
temos SQE = 0 e quando o modelo (y) = X nao melhora a explicacao
163
B. APENDICE
B
R2 =
SQR
SQT SQE
SQE
=
=1
.
SQT
SQT
SQT
B.5
Diagn
ostico
Modelos estatsticos sao utilizados como aproximacoes de processos complexos e sao construdos sobre um conjunto de suposicoes. Para efeitos
praticos, e importante avaliar se tais aproximacoes sao aceitaveis. Isto
pode ser concretizado por meio de t
ecnicas de diagn
ostico, que englobam a avaliac
ao do ajuste e a an
alise de sensibilidade. No primeiro
caso, o objetivo e avaliar se as suposicoes adotadas sao compatveis com
os dados; no segundo, o objetivo e estudar a variacao dos resultados da
analise quando a formulacao inicial do modelo e ligeiramente modificada.
Se esta variacao for substancial no sentido de mudar as conclusoes, dizse que o modelo nao e robusto. Nesse caso, ou as conclusoes devem ser
tomadas (se tomadas) de forma cautelosa, ou entao deve-se optar por
outro modelo.
Singer & Nobre & Rocha - marco/2012
164
B.5 DIAGNOSTICO
Para ilustrar a importancia do uso das tecnicas de diagnostico, apresentamos na Tabela B.5.1, quatro conjuntos de dados (A, B, C e D)
extrados de Anscombe (1973). Cada um desses conjuntos contem os
valores de uma variavel explicativa (x) e de uma variavel resposta (y).
Tabela B.5.1: Dados obtidos de Anscombe (1973)
A
x
10.0
8.0
13.0
9.0
11.0
14.0
6.0
4.0
12.0
7.0
5.0
y
8.04
6.95
7.58
8.81
8.33
9.96
7.24
4.26
10.84
4.82
5.68
B
x
10.0
8.0
13.0
9.0
11.0
14.0
6.0
4.0
12.0
7.0
5.0
C
y
9.14
8.14
8.74
8.77
9.26
8.10
6.13
3.10
9.13
7.26
4.74
x
10.0
8.0
13.0
9.0
11.0
14.0
6.0
4.0
12.0
7.0
5.0
y
7.46
6.77
12.74
7.11
7.81
8.84
6.08
5.39
8.15
6.42
5.73
x
8.0
8.0
8.0
8.0
8.0
8.0
8.0
19.0
8.0
8.0
8.0
y
6.58
5.76
7.71
8.84
8.47
7.04
5.25
12.50
5.56
7.91
6.89
Cov
165
B. APENDICE
B
avaliacao da qualidade do ajuste. Essa avaliacao precisa ser complementada por outros metodos que descrevemos a seguir.
Figura B.5.1: Diagramas de dispersao (dados da Tabela B.5.1)
10
y
10
15
20
10
x
20
15
20
10
y
10
8
6
4
10
15
20
10
B.5.1
15
12
12
8
6
4
10
12
12
An
alise de Resduos
(B.5.1)
166
B.5 DIAGNOSTICO
(B.5.2)
(B.5.3)
Essa denominac
ao, dada por J.W. Tukey, se deve ao fato de H ser base da transb = Hy,
formac
ao linear do vetor dos valores observados no vetor de valores ajustados, y
ou seja, H coloca o chapeu (b) no vetor y. Ela tambem e chamada de matriz de
predi
c
ao.
9
>
1
Pode-se mostrar que hii = x>
xi em que x>
e a i-esima linha de X.
i (X X)
i
Singer & Nobre & Rocha - marco/2012
167
B. APENDICE
B
2
2
4
25
30
35
40
y^i
2
0
2
4
^
e*i
y^i
20
^
e*i
^
e*i
0
4
^
e*i
10
y^i
15
20
50
40
30
20
10
10
y^i
168
B.5 DIAGNOSTICO
10
realidade (b
ei )2 /(n p) Beta[1/2, (n p 1)/2] , indicando que
ei ] = 1 e
|b
ei | n p. Alem disso, pode-se mostrar, que [b
ei ] = 0, [b
que
[b
ei , ebj ] = hij /[(1 hii )(1 hjj )]1/2 . Para detalhes e demonstracao destas propriedades, veja Cook & Weisberg (1982), por exemplo.
Cov
=s
n p (b
ei )2
np1
.
Pode-se provar que ebi e s2(i) sao independentes, de forma que definimos
os resduos studentizados externamente por
ti =
eb
i
, i = 1, ..., n.
s(i) 1 hii
ebi
np1
n p (b
ei )2
1/2
,
indicando que ti e uma transformacao monotona crescente de ebi e proporcionando uma forma de calculo que prescinde do ajuste do modelo
sem a i-esima observacao.
Alem disso, e possvel mostrar que valores grandes de |ti |, e consequentemente de |b
ei |, podem ser utilizados como identificadores de observacoes significativamente discrepantes; detalhes que incluem sugestoes
para pontos de corte podem ser obtidos em Cook & Weisberg (1982).
Outros tipos de resduos, tais como resduos preditos (predicted
residuals) e resduos recursivos (recursive residuals), tambem sao discutidos em Cook & Weisberg (1982).
10
169
B. APENDICE
B
B.5.2
An
alise da suposic
ao de normalidade
Na teoria classica, em geral, tanto intervalos de confianca quanto testes de hipoteses sobre os parametros de modelos lineares sao baseados
na suposicao de normalidade dos erros. A verificacao da plausibilidade
dessa suposicao e fundamental para a validade dos procedimentos inferenciais (exatos). Como os resduos sao essencialmente preditores dos
erros do modelo, nada mais natural do que utiliza-los com essa finalidade.
Nesse sentido, graficos do tipo Q-Q (quantis-quantis), em que dispomos os resduos studentizados ordenados (quantis observados) no eixo
das abscissas e os quantis obtidos da distribuicao normal padrao (quantis teoricos) no eixo das ordenadas, sao ferramentas utilssimas. Quando
a distribuicao dos erros e gaussiana, espera-se que esses resduos estejam
dispostos numa vizinhanca da reta com inclinacao de 45 graus. Esse tipo
de grafico tambem pode ser u
til para detectar a presenca de observacoes
discrepantes, para avaliar se a distribuicao dos erros possui caudas mais
pesadas que a distribuicao normal, se o erro e heterocedastico, etc.
Esses graficos podem ser obtidos por meio do seguinte procedimento
i) Ajustar o modelo (B.5.1), obter o vetor de resduos studentizados
b
e = (b
e1 , . . . , ebn )> e o vetor de resduos studentizados ordenados,
(b
e(1) eb(2) . . . eb(n) )> .
ii) Calcular pi = (i0.375)/n, i = 1, . . . , n e obter os quantis amostrais
Qpi = eb(i)
iii) Obter os quantis normais Zpi = P (Z Z(pi )) = pi , i = 1, . . . , n
em que Z e uma variavel com distribuicao N(0, 1)
iv) Construir o grafico de dispersao Qpi Zpi .
Como em graficos do tipo Q-Q, e difcil avaliar afastamentos da normalidade visualmente, Atkinson (1985), sugere a construcao de bandas
de confianca, denominadas envelopes simulados (simulated envelopes).
Essas bandas de confianca sao obtidas por meio de simulacao de dados
com distribuicao normal com vetor de medias iguais a zero e matriz de
covariancias (I H).
Um algoritmo para sua construcao e os seguinte
b s2 e os resduos studentizados
i) Ajustar o modelo (B.5.1), obtendo ,
b
e.
Singer & Nobre & Rocha - marco/2012
170
B.5 DIAGNOSTICO
B. APENDICE
B
171
do resduo studentizado maiores (menores) que os quantis teoricos da distribuicao normal padrao. Por fim, o grafico B.5.3(e) (B.5.3(f)) mostra
uma situacao em que a distribuicao dos erros e assimetrica `a direita (`a esquerda). Quando se tem uma distribuicao assimetrica `a direita, o grafico
apresenta a forma de um J; se a distribuicao for assimetrica a` esquerda,
o grafico apresenta a forma de um J invertido.
172
B.5 DIAGNOSTICO
2
1
0
2
Residuo Studentizado
1
0
1
3
Residuo Studentizado
Quantis da N(0,1)
1
0
3
Residuo Studentizado
0
2
Residuo Studentizado
Quantis da N(0,1)
Quantis da N(0,1)
Residuo Studentizado
4
2
0
2
4
Residuo Studentizado
Quantis da N(0,1)
Quantis da N(0,1)
Quantis da N(0,1)
173
B. APENDICE
B
B.5.3
An
alise de sensibilidade
174
B.5 DIAGNOSTICO
Cov
175
B. APENDICE
B
0.8
hii
0.4
2p/n
0.0
2p/n
0.0
0.4
hii
0.8
1.2
1.2
10
Observao
Observao
10
0.4
hii
0.8
(19,12.5)
2p/n
0.0
2p/n
0.0
0.4
hii
0.8
1.2
1.2
10
Observao
10
Observao
(B.5.4)
176
B.5 DIAGNOSTICO
b=
w> (I H)y
.
w> (I H)w
b= >
b
w (I H)(I H)w
ew b
ew
com b
e = (I H)y e b
ew = (I H)w de forma que ele pode ser interpretado como o estimador de mnimos quadrados (ordinarios) do coeficiente
angular de uma regressao (sem intercepto) tendo como variavel resposta
os resduos ordinarios (b
e) obtidos do modelo inicial (sem a covariavel w) e
como variavel explicativa os resduos (b
ew ) obtidos do modelo de regressao
w = X + ew .
O grafico de dispersao entre os resduos b
e e b
ew , conhecido como
gr
afico da vari
avel adicionada ou gr
afico de regress
ao parcial
(partial regression plot) fornece informacao sobre os ganhos com a inclusao da covariavel w no modelo. Ele tambem pode ser u
til para identificar pontos que se desviam da relacao linear entre os resduos, e que
podem ser encarados como observacoes influentes na estimacao de .
Maiores detalhes e extensoes, que fogem ao escopo deste texto, podem
ser encontrados em Cook & Weisberg (1989) e Cook (1996), por exemplo.
Em modelos de regressao linear m
ultipla, uma estrategia para identificar observacoes influentes na estimacao dos coeficientes do vetor de
parametros, consiste em construir um grafico desse tipo para cada covariavel do modelo.
Cook (1977), por outro lado, sugere que a influencia de uma particular observacao, ou de um conjunto de observacoes, seja avaliada por
intermedio dos efeitos provocados por sua eliminacao do conjunto de dados.
Consideremos o modelo de regressao linear (B.5.1) e denotemos por
b e
b , respectivamente, os estimadores de mnimos quadrados de
(I)
obtidos com todos os dados da amostra e com a eliminacao do conjunto
de observacoes I. Nesse contexto, uma das medidas mais utilizadas e a
Singer & Nobre & Rocha - marco/2012
177
B. APENDICE
B
dist
ancia de Cook definida por
DI =
h
i>
h
i
>
b
b
b
b
(I) (X X) (I)
ps2
(B.5.5)
>
by
b(I)
by
b(I)
y
y
,
=
ps2
b e y
b representando respectivamente, o vetor
b = X
b(I) = X
com y
(I)
de valores preditos pelo ajuste do modelo com todos os dados da amostra e aquele obtido com a eliminacao do conjunto de observacoes I. A
estatstica DI mede a influencia das observacoes do conjunto I na estimativa de segundo a metrica definida por (ps2 )1 X> X ou equivalentemente, a influencia dessas observacoes no vetor de valores preditos.
Valores grandes de DI indicam que as observacoes do conjunto I sao
b. Sob essa abordagem,
influentes na estimacao de ou nos valores de y
e essencial obter expressoes que relacionem o estimador do parametro
de interesse calculado com base em toda amostra com o respectivo estimador calculado apos a eliminacao de um conjunto de observacoes sem
a necessidade de reajustar o modelo. Em particular, quando apenas a
i-esima observacao e eliminada, e possvel mostrar que
b
b=
(i)
ebi
(X> X)1 xi ,
1 hii
b
b
(i)
i>
h
i
b
b
(X> X)
(i)
ps2
(B.5.6)
eb2
hii
i
.
p (1 hii )2
178
B.5 DIAGNOSTICO
1/2
|b
ei |
hii
=
s(i) (1 hii )1/2 1 hii
1/2
hii
,
= |ti |
1 hii
(B.5.7)
n p hii
p 1 hii
1/2
|ti |.
(B.5.8)
Quando todos os hii sao iguais, Ci = |ti |. Chatterjee & Hadi (1988) sugerem outros usos para esta versao da distancia de Cook. Em particular,
esses autores comentam que Ci = sinal(yi ybi )Ci (i = 1, ...n) podem ser
tilizados como resduos.
Em tese, essas tres medidas de influencia competem entre si. Todavia, como destacam Cook, Pe
na & Weisberg (1988) e Paula (2004) elas
servem para avaliar diferentes aspectos da influencia das observacoes nos
resultados do ajuste. Por exemplo, (B.5.6) e mais adequada para medir
a influencia das observacoes nos parametros de localizacao (), enquanto
que (B.5.7) tem o objetivo de medir a influencia das observacoes nos
parametros de localizacao e escala simultaneamente embora possa falhar
em algumas situacoes, como indicam Cook et al. (1988).
Segundo Paula (2004), observacoes discrepantes com baixo grau de
alavanca dificilmente influem na estimacao de e nao comprometem o
potencial uso de (B.5.5).
Graficos das medidas de influencia versus ndices das observacoes sao
ferramentes u
teis para a identificacao observacoes influentes, i.e., aquelas
com valores da medida de influencia grandes em relacao aos demais.
Medidas de influencia como a distancia de Cook sao baseadas na
mudanca do centro (parametros de localizacao) dos elips
oides de confianca para o vetor de parametros , nomeadamente
n
o
b )> (X> X)(
b ) ps2 Fp,(np) ()
IRp ; (
(B.5.9)
Singer & Nobre & Rocha - marco/2012
179
B. APENDICE
B
^)
^,
(
O volume
do elipsoide (B.5.9) e inversamente proporcional a` raiz qua
drada de X> X. Por isso, Andrews & Pregibon (1978) sugeriram avaliar
a influencia da i-esima observacao por meio de
s2(i) X>
X
(i) (i)
eb2
i
APi =
=
h
+
(1
h
)
.
(B.5.10)
ii
ii
s2 |X> X|
np
Valores de APi muito distantes de 1 indicam que a observacao em questao
b
e potencialmente influente com relacao a` matriz de covariancias de .
Propriedades desta medida podem ser encontrados em Cook & Weisberg
(1982) ou Chatterjee & Hadi (1988), por exemplo.
Singer & Nobre & Rocha - marco/2012
180
B.5 DIAGNOSTICO
V
V
Observao alavanca
Observao discrepante
4
y
1
Sem obs. A
Completo
Sem obs. A
Completo
6
Observao influente
5
4
y
2
0
3
x
Sem obs. A
Completo
Sem obs. A
Completo
A
A
3
2
1
181
B. APENDICE
B
B.5.4
An
alise da suposic
ao de correlac
ao nula
Em geral, a suposicao de que os erros do modelo linear sao nao-correlacionados deve ser questionada com base no procedimento de coleta de dados. Como ilustracao, consideramos dois exemplos nos quais essa caracterstica justifica a d
uvida. O primeiro exemplo e um caso simples dos
problemas abordados pelas tecnicas de analise de series cronologicas; o
segundo exemplo e o caso tpico daqueles que constituem o objeto do
n
ucleo deste texto. Ambos sao apresentados aqui com a finalidade de
mostrar como as tecnicas de analise de regressao podem ser empregadas para analisar modelos mais gerais do que aqueles governados pelo
paradigma de Gauss-Markov.
Exemplo B.5.1: Na Tabela B.5.2 apresentamos valores do ndice de
custo de vida (ICV) na cidade de Sao Paulo colhidos pela Fundacao
Get
ulio Vargas entre janeiro de 1970 e junho de 1979 com o objetivo
de avaliar seu crescimento nesse perodo. O grafico de dispersao correspondente esta disposto na Figura B.5.7 Com base em argumentos de
Economia, e razoavel supor que o ICV num determinado mes seja correlacionado com aqueles obtidos em meses anteriores.
182
B.5 DIAGNOSTICO
Tabela B.5.2: Indice de custo de vida para Sao Paulo (jan/70 a jul/79)
Observac
ao
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
ICV
71.6
72.5
73.5
74.5
75.2
76.3
76.9
78.1
80
80.9
81.7
82.9
84.7
86.3
88.8
90.9
91.5
93.4
94.6
95.9
96.7
97.8
99.1
100
102
104
105
106
107
108
110
112
114
116
117
118
119
120
Observacao
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
ICV
122
124
125
126
128
129
131
132
133
134
135
140
146
153
156
158
162
165
167
170
174
178
183
188
190
194
198
204
208
215
219
223
227
230
238
251
256
263
Observacao
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
ICV
270
275
280
290
298
305
310
318
329
343
359
375
383
393
400
407
415
424
436
449
456
474
486
495
510
535
558
572
586
602
617
628
653
667
707
731
746
778
183
B. APENDICE
B
5.5
4.5
5.0
log(ICV)
6.0
6.5
20
40
60
80
100
Meses
184
B.5 DIAGNOSTICO
12
54.1
91.7
64.2
70.3
68.3
43.9
87.4
74.5
50.5
91.0
83.3
76.3
55.9
76.1
56.6
24
124.2
167.2
144.2
130.9
123.0
99.9
144.8
126.7
79.0
154.5
141.5
121.4
103.2
120.2
96.1
26
131.3
176.8
154.9
137.1
132.0
106.2
151.5
132.2
77.0
167.6
157.0
134.5
108.0
134.2
103.6
t = 1, . . . , n
(B.5.12)
em que yt representa o incremento de vendas no instante t, denota o valor esperado do incremento de vendas no tempo t = 0, e representam
os componentes linear e quadratico da curva que rege a variacao temporal
do logaritmo das vendas e et denota um erro aleatorio. Utilizamos t como
ndice para salientar que as observacoes sao colhidas sequencialmente.
O coeficiente de determinacao R2 = 0.9986 indica que o ajuste (por
mnimos quadrados) do modelo com
b = 4.310 (EP = 0.007), b = 0.008
(EP< 0.001) e
b = 0.0001 (EP < 0.00001) e excelente (sob essa otica,
obviamente). Por outro lado, o grafico de resduos apresentado na Figura B.5.8 mostra sequencias de resduos positivos seguidas de sequencias
de resduos negativos, sugerindo uma possvel correlacao positiva entre
eles (autocorrelacao).
Singer & Nobre & Rocha - marco/2012
185
B. APENDICE
B
Figura B.5.8:
delo (B.5.12)
Residuos studentizados
20
40
60
80
100
Meses
t = 1, . . . , n
(B.5.13)
em que ut N(0, 2 ), t = 1, . . . , n, independentes e e0 e uma constante (geralmente igual a zero). Essas suposicoes implicam que Var(et ) =
2 /(1 2 ) e que Cov(et , ets ) = s [ 2 /(1 2 )].
Para testar a hipotese de que os erros sao nao-correlacionados pode-se
utilizar a estatstica de Durbin-Watson:
n
n
X
X
2
D=
(b
et ebt1 ) /
eb2t ,
t=2
(B.5.14)
t=1
186
B.5 DIAGNOSTICO
2 . . . n1
1
. . . n2
2
2
1
. . . n3
V=
.
1 2 ..
..
..
..
.
.
.
.
.
.
.
n1
n2
n3
...
1
Substituindo os elementos de V por seus estimadores, podemos utilizar
(B.2.6) para estimar .
O valor da estatstica de Durbin-Watson para os dados do Exemplo
B.5.1 sob o modelo (B.5.12) e D = 0.1259 (p < 0.0001) sugerindo um
alto grau de autocorrelcao dos resduos.
Singer & Nobre & Rocha - marco/2012
187
B. APENDICE
B
(B.5.16)
em que yij denota a j-esima medida do peso do i-esimo animal, xij indica
o n
umero de semanas em que foi realizada essa medida, representa o
peso esperado dos animais ao nascer (admitindo que o modelo linear
possa ser extrapolado para o perodo entre o nascimento e a decima
segunda semana), representa a variacao esperada do peso dos animais
por semana e eij corresponde a um erro aleatorio com media nula e
variancia constante e2 . Esse modelo, particularizado para o Exemplo
B.5.2, em todos os animais foram observados nos mesmos instantes, e tal
que n = 15, pi = p = 8 e xij = xj .
Sob a suposicao de que os erros eij sao nao-correlacionados, estimativas (e erros padroes) dos parametros de localizacao do modelo (B.5.16)
obtidas por mnimos quadrados sao
b = 13.5 (EP= 7.8), b = 4.7
(EP= 0.4); a estimativa do desvio padrao e
be = 20.1 e o coeficiente
de determinacao ajustado e Ra2 = 0.53. Uma analise de resduos nao
indica violacoes das suposicoes de heterocedasticidade e normalidade dos
erros.
Singer & Nobre & Rocha - marco/2012
188
B.5 DIAGNOSTICO
180
160
140
120
100
Peso (kg)
80
60
40
12
14
16
18
20
22
24
26
Semanas
Tendo em vista que varias observacoes sao realizadas em cada animal, podemos construir um grafico de perfis como aquele apresentado na
Figura B.5.10. Esse tipo de grafico serve como ferramenta adicional para
avaliacao das suposicoes adotadas.
Singer & Nobre & Rocha - marco/2012
189
B. APENDICE
B
150
Peso (kg)
100
50
15
20
25
Semanas
190
B.5 DIAGNOSTICO
Para incorporar essa informacao no modelo a ser adotado, uma alternativa e substituir o termo aleatorio do modelo (B.5.16), fazendo
eij = ai + dij
(B.5.17)
V(yij ) = a2 + 2
Cov(yij , ykl ) = a2 se i = k
Cov(yij , ykl ) = 0 se i 6= k
e j 6= l
(B.5.18)
191
B. APENDICE
B
Um estimador consistente de 2 e
(B.5.19)
(B.5.20)
b = (n 1)
n
X
(y i y)2
(B.5.21)
i=1
P
com y = n1 ni=1 y i . Consequentemente, um estimador de a2 pode ser
obtido de (B.5.19) e (B.5.21) por meio de
ba 2 = b2
b2 /p.
Na forma matricial, o modelo (B.5.16)-(B.5.17) pode ser escrito como
y = X + e
em que X = [1n 1p , 1n x], = (, )> e e e um vetor aleatorio
com media nula e matriz de covariancias (e) = In com = 2 Ip +
b
a2 1p 1>
ancias intraup . Um estimador consistente, da matriz de covari
nidades amostrais pode ser obtido com a substituicao dos parametros
a2 e 2 pelos estimadores ba 2 e
b2 . O vetor de parametros de localizacao
pode ser facilmente estimado por meio de (B.2.6) tendo em vista que,
segundo a propriedade vii ) da Secao A.1.6,
1 =
1
a2
[I
1p 1>
p
p ].
2
pa2 + 2
Xi
i
i=1
i=1
Singer & Nobre & Rocha - marco/2012
192
B.5 DIAGNOSTICO
B.6
Parametriza
c
ao de modelos lineares
Consideremos um estudo em que se deseja comparar o efeito de a tratamentos (drogas, por exemplo) na distribuicao de uma variavel resposta
Y (pressao diastolica, por exemplo). Ha muitas situacoes praticas em
que esse efeito consiste na modificacao do valor esperado da resposta
sem alteracao da forma de sua distribuicao ou de sua variancia. Nesse
contexto, supondo que p unidades amostrais escolhidas aleatoriamente
sejam submetidas a cada um dos a tratamentos, um modelo bastante
comum e
yij = i + eij , i = 1, . . . , a, j = 1, . . . , p,
(B.6.1)
193
B. APENDICE
B
implica o modelo
yij = + i + eij , i = 1, . . . , a, j = 1, . . . , p,
(B.6.2)
(B.6.4)
E(y) = (ap)
p
a X
X
i=1 j=1
E(yij ) = + a
a
X
i = 0,
i=1
e consequentemente o termo pode ser interpretado como media geral (que essencialmente e uma media dos valores esperados da resposta
13
194
B.5 DIAGNOSTICO
E(yi) = p
p
X
E(yij ) = + i
j=1
E(y1) = p
p
X
E(y1j ) = + 1 =
j=1
e consequentemente, o termo pode ser interpretado como o valor esperado das observacoes submetidas ao tratamento 1. Alem disso, para
k 6= 1,
p
X
1
(y k ) = p
E(ykj ) = + k
j=1
(B.6.5)
195
B. APENDICE
B
196
B.5 DIAGNOSTICO
i =
b
X
j =
a
X
j=1
ij =
i=1
b
X
ij = 0
(B.6.7)
j=1
e
1 = 1 = 11 = . . . = 1b = 21 = . . . = a1 = 0
(B.6.8)
= (ab)
a X
b
X
ij ,
i=1 j=1
i = b
b
X
ij
j=1
j = a
a
X
ij
i=1
e que
ij = ij b1
b
X
ij a1
j=1
a
X
ij
i=1
197
B. APENDICE
B
j = ij i1 , j = 2, . . . , b,
e que
ij = ij (11 + i + j ), i = 2, . . . , a, j = 2, . . . , b,
de forma que os parametros i , i = 2, . . . , a podem ser interpretados
como efeitos diferenciais entre as respostas esperadas das unidades amostrais submetidas ao nvel i do fator A relativamente a`quelas obtidas por
unidades amostrais submetidas ao tratamento associado ao nvel 1 do
fator A, mantido fixo o nvel correspondente ao fator B. Analogamente,
os parametros j , j = 2, . . . , b podem ser interpretados como efeitos
diferenciais entre as respostas esperadas das unidades amostrais submetidas ao nvel j do fator B relativamente a`quelas obtidas por unidades amostrais submetidas ao tratamento associado ao nvel 1 do fator B, mantido fixo o nvel correspondente do fator A. Os parametros
ij , i = 2, . . . , a, j = 2, . . . b podem ser interpretados como diferencas
entre as respostas esperadas das unidades amostrais submetidas ao tratamento correspondente a cela (i, j) e aquela esperada sob um modelo
sem interacao.
B.7
Regress
ao logstica
B.8
Exerccios
198
B.5 DIAGNOSTICO
i = 1, . . . , n
i = 1, . . . , n
1 X
i )2
(yi
x
S =
n 2 i=1
2
em que
e denotam os estimadores de mnimos quadrados de e ,
respectivamente, e nao-enviesado para a variancia 2 .
B.8.6. Para avaliar a associacao entre a pressao arterial sistolica e idade,
colheram-se os dados dispostos na tabela abaixo. Utilize esses dados
para avaliar se essa associacao pode ser representada por um modelo de
regressao linear simples. Com essa finalidade,
a) Especifique o modelo, interpretando os parametros;
b) Construa um diagrama de dispersao (rotulando os eixos convenientemente);
Singer & Nobre & Rocha - marco/2012
199
B. APENDICE
B
Paciente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Tensao sistolica
(mm Hg)
114
134
116
139
110
150
152
138
142
145
156
159
142
156
164
185
162
176
175
180
Idade
(anos)
16
20
18
34
23
38
41
39
46
45
47
47
50
52
45
60
64
60
69
68
200
B.5 DIAGNOSTICO
Escola
particular p
ublica
8.6
5.8
8.6
7.6
7.8
8.0
6.5
6.2
7.2
7.6
6.6
6.5
5.6
5.6
5.5
5.7
8.2
5.8
Seja yi a nota obtida pelo i-esimo aluno, xi = 1 se o aluno cursou escola
particular e xi = 1 se o aluno cursou escola p
ublica, i = 1, . . . , 18.
Considere o modelo yi = + xi + ei , i = 1, . . . , 18 em que os ei sao
erros aleatorios nao-correlacionados com E(ei ) = 0 e V ar(ei ) = 2 .
i) Interprete os parametros e .
ii) Estime e pelo metodo de mnimos quadrados ordinarios. Obtenha tambem uma estimativa de 2 .
iii) Construa intervalos de confianca para e .
iv) Com base nas estimativas obtidas no item ii), construa intervalos
de confianca para os valores esperados das notas dos alunos das
escolas particulares e p
ublicas.
v) Ainda utilizando o modelo proposto, especifique e teste a hipotese
de que ambos os valores esperados sao iguais.
vi) Repita os itens i)-v) definindo xi = 1 se o aluno cursou escola
particular e xi = 0 se o aluno cursou escola p
ublica, i = 1, . . . , 18.
B.8.8. Num estudo realizado na Faculdade de Medicina da Universidade
de Sao Paulo foram colhidos dados de 16 pacientes submetidos a transplante intervivos e em cada um deles obtiveram-se medidas tanto do peso
(g) real do lobo direito do fgado quanto de seu volume (cm3 ) previsto
pre-operatoriamente por metodos ultrassonograficos. O objetivo e estimar o peso real por meio do volume previsto. Os dados estao dispostos
na tabela abaixo.
Singer & Nobre & Rocha - marco/2012
201
B. APENDICE
B
Peso
real (g)
630
745
690
890
825
960
835
570
705
955
990
725
840
640
740
945
B.8.9. Os dados abaixo sao provenientes de uma pesquisa cujo objetivo e propor um modelo para a relacao entre a area construda de um
determinado tipo de imovel e o seu preco.
Singer & Nobre & Rocha - marco/2012
202
B.5 DIAGNOSTICO
Imovel
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Area
(m2) Preco (R$)
128
10.000
125
9.000
200
17.000
4.000
200.000
258
25.000
360
40.000
896
70.000
400
25.000
352
35.000
250
27.000
135
11.000
6.492
120.000
1.040
35.000
3.000
300.000
203
B. APENDICE
B
como u
nica variavel explicativa.
vi) Compare o modelo que voce julgou mais adequado por meio da
analise realizada nos itens i)-iv) com aquele obtido no item v).
B.8.11. Os dados abaixo sao provenientes de um estudo cujo objetivo
era avaliar a eficacia de um tipo de escova de dentes na remocao de placa
bacteriana. Para isso foram observados ndices de placa bacteriana (maiores valores do ndice correspondendo a maiores quantidades de placa)
antes (X) e apos (Y ) a escovacao numa amostra de 26 criancas.
Singer & Nobre & Rocha - marco/2012
204
B.5 DIAGNOSTICO
pre-escovac
ao
2.18
2.05
1.05
1.95
0.28
2.63
1.50
0.45
0.70
1.30
1.25
0.18
3.30
pos-escovacao
0.24
0.15
0.10
0.33
0.33
0.53
0.43
0.65
0.20
0.25
0.15
0.05
0.25
205
B. APENDICE
B
a) Utilizando um gerador de n
umeros aleatorios obtenha 20 valores de
ui e construa os valores correspondentes de ei , i = 1, . . . , 20.
b) Construa um grafico de ei em funcao de i.
c) Obtenha os valores de yi para xi = i, i = 1, . . . , 20 e construa o
grafico de dispersao correspondente incluindo nele a reta E(yi |xi ) =
+ xi .
d) Obtenha os estimadores de mnimos quadrados de e a partir
dos dados gerados no item c) e inclua a reta estimada no grafico
do item c).
e) Calcule a estatstica de Durbin-Watson e discuta os resultados, interpretando o efeito da autocorrelacao dos erros.
f) Repita os itens c) - e) com = 0.5 e = 0.1
g) Compare os resultados obtidos com os diferentes valores de e
comente as diferencas encontradas.
B.8.13. Os dados do arquivo Singer&Andrade (1997), disponvel em
www.ime.usp.br/jmsinger
sao provenientes de um estudo cujo objetivo era avaliar a eficacia de dois
tipo de escova de dentes (Hugger e Convencional) na remocao de placa
bacteriana. Para isso foram observados ndices de placa bacteriana (maiores valores do ndice correspondendo a maiores quantidades de placa)
antes (X) e apos (Y ) a escovacao com cada tipo de escova numa amostra
de n1 = 14 criancas do genero feminino (F) e n2 = 12 do sexo masculino
(M).
a) Construa um grafico de dispersao para cada tipo de escova, tendo o
ndice de placa bacteriana pre-escovacao (X) na abscissa e o ndice
de placa bacteriana pos-escovacao (Y ) na ordenada. Use smbolos
diferentes para identificar criancas de cada genero.
b) Utilize metodos de regressao linear simples para ajustar modelos
do tipo
Yij = i Xiji eij ,
i = 1, 2, j = 1, . . . , ni para cada tipo de escova separadamente,
indicando as suposicoes adotadas.
Singer & Nobre & Rocha - marco/2012
206
B.5 DIAGNOSTICO
Area
construda
4.5
5.9
4.2
5.2
8.1
9.7
10.7
11.9
12.0
12.3
0.9
2.5
1.3
1.8
3.1
4.6
6.1
6.0
5.9
6.1
7.1
10.4
7.2
8.2
8.5
11.9
12.1
12.5
12.0
11.3
Com o objetivo de estimar a capacidade instalada (Y ) a partir das informacoes sobre potencia instalada (X1 ) e area construda (X2 ),
Singer & Nobre & Rocha - marco/2012
207
B. APENDICE
B
208
B.5 DIAGNOSTICO
nveis de insuficiencia cardaca (medida segundo a classificacao NYHA coluna K). Com essa finalidade, voce deve:
a) Construir graficos de dispersao convenientes.
b) Interpretar os diferentes parametros do modelo.
c) Estimar os parametros do modelo e apresentar os respectivos erros
padroes.
d) Avaliar a qualidade de ajuste do modelo por meio de graficos de
resduos e graficos QQ.
e) Identificar possveis valores discrepantes (outliers) e reajustar o modelo sem esses pontos.
f) Comparar os ajustes dos modelos obtidos com e sem os outliers.
g) Definir e testar hipoteses adequadas para avaliar se a relacao entre
consumo de oxigenio no limiar anaerobio do exerccio e carga na
esteira ergometrica depende da classificacao NYHA.
h) Reajustar o modelo com base nas conclusoes do item (g) e avaliar
o seu ajuste.
i) Apresentar conclusoes que evitem jargao tecnico.
Bibliografia
Afiune, J. Y. (2000). Avaliacao ecocardiografica evolutiva de recemnascidos pre-termo, do nascimento ate o termo, PhD thesis, Sao
Paulo: Instituto da Crianca da Faculdade de Medicina, Universidade de Sao Paulo.
Afiune, J. Y., Singer, J. M. & Leone, C. R. (2005). Evolucao ecocardiografica de recem-nascidos com persistencia do canal arterial, Jornal
de Pediatria 81: 454460.
Andrade, D. F. & Helms, R. W. (1984). Maximum likelihood estimates in
the multivariate normal distribution with patterned mean and covariance via the EM algorithm, Communications in Statistics, Theory
and Methods 13: 22392251.
Andrade, D. F. & Singer, J. M. (1998). Profile analysis for randomized
complete block experiments, 25: 237244.
Andrews, D. F. & Pregibon, D. (1978). Finding outliers that matter,
Journal of the Royal Statistical Society B 40: 8593.
Anscombe, F. J. (1973). Graphs in statistical analysis, The American
Statistician 27: 1721.
Arellano-Vale, R., Bolfarine, H. & Lachos, V. H. (2005). Skew-normal
linear mixed models, Jornal of Data Science 3: 415438.
Atkinson, A. C. (1981). Two graphical display for outlying and influential
observations in regression, Biometrika 68: 1320.
Atkinson, A. C. (1985). Plots, transformations, and regression: an introduction to graphical methods of diagnostic regression analysis, Oxford: Oxford University Press.
210
BIBLIOGRAFIA
Atkinson, A. C. & Riani, M. (2000). Robust diagnostic regression analysis, New York: Springer.
Baksalary, J. K., Corsten, L. C. A. & Kala, R. (1978). Reconciliation
of two different views on estimation of growth curve parameters,
Biometrika 65: 662665.
Baltagi, B. H. (1995). Econometric analysis of panel data, Chichester:
Wiley.
Belsley, D. A., Kuh, E. & Welsch, R. E. (1980). Regression diagnostics:
identifying influential data and sources of collinearity, New York:
Wiley.
Bickel, P. J. & Doksum, K. A. (2001). Mathematical Statistics, Volume
1, 2 edn, Upper Saddle River, NJ: Prentice-Hall.
Boik, R. J. (1979). Interactions, partial interactions and interaction contrasts in the analysis of variance, Psychological Bulletin 86: 1084
1089.
Box, G. E. P. (1950). Problems in the analysis of growth and wear curves,
Biometrics 6: 362389.
Box, G. E. P. (1954a). Some theorems on quadratic forms applied in
the study of analysis of variance problems, I: effects of inequality
of variance in the one-way classification, Annals of Mathematical
Statistics 25: 290302.
Box, G. E. P. (1954b). Some theorems on quadratic forms applied in
the study of analysis of variance problems, II: effects of inequality
of variance and of correlation between errors in the two-way classification, Annals of Mathematical Statistics 25: 484498.
Brogan, D. R. & Kutner, M. H. (1980). Comparative analysis of pretestposttest research designs, The American Statistician 34: 229232.
Bruner, E., Domhof, S. & Langer, F. (2002). Nonparametric analysis of
longitudinal data in factorial experiments, New York: Wiley.
Bryant, E. & Gillings, D. (1985). Statistical analysis of longitudinal
repeated measures designs, Biostatistics, Statistics in Biomedical,
Public Health and Environmental Sciences, P.K. Sen (ed). Amsterdam: North Holland, 251-282, pp. 251282.
Singer & Nobre & Rocha - marco/2012
BIBLIOGRAFIA
211
212
BIBLIOGRAFIA
213
BIBLIOGRAFIA
214
BIBLIOGRAFIA
BIBLIOGRAFIA
215
Hodges, J. S. (1998). Some algebra and geometry for hierarchical models, applied to diagnostics (with discussion), Journal of the Royal
Statistical Society, Series B 60: 197236.
Huynh, H. & Feldt, L. S. (1970). Conditions under which mean square
ratios in repeated measurements designs have exact F-distributions,
Journal of the American Statistical Association 65: 15821589.
Huynh, H. & Feldt, L. S. (1976). Estimation for the Box correction for
degrees of freedom from sample data in the randomized block and
split-plot designs, Journal of Educational Statistics 1: 6982.
Izeman, A. J. & Williams, J. S. (1989). A class of linear spectral models
and analyses for the study of longitudinal data, Biometrics 45: 831
849.
Jennrich, R. I. & Schluchter, M. D. (1986). Unbalanced repeated measures models with structured covariance matrices, Biometrics 42: 805
820.
Jiang, J. (1996). Reml estimation: asymptotic behavior and related
topics, The Annals of Statistics 24: 255286.
Jiang, J. (1997). A derivation of BLUP - Best Linear Unbiased Predictor,
Statistics & Probabilty Letters 32: 321324.
Jiang, J. (1998). Asymptotic properties of the empirical BLUP and
BLUE in mixed linear models, Statistica Sinica 8: 861885.
Jiang, J. (1999). On unbiasedness of the empirical BLUE and BLUP,
Statistics & Probabilty Letters 41: 1924.
Jones, R. H. (1993). Longitudinal data with serial correlation: a statespace approach, London: Chapman and Hall.
Kackar, R. N. & Harville, D. A. (1984). Approximations for standard errors of estimators of fixed and random effects in mixed linear models,
Journal of the American Statistical Association 79: 853862.
Kass, R. E. & Steffey, D. (1989). Approximate Bayesian inference in
conditionally independent hierarchical models (parametric empirical Bayes models), Journal of the American Statistical Association
84: 717726.
Singer & Nobre & Rocha - marco/2012
216
BIBLIOGRAFIA
Kenward, M. G. (1985). The use of fitted higher-order polynomial coefficients as covariates in the analysis of growth curves, Biometrics
41: 1928.
Keselman, H. J., James, A., Rhonda, K. K. & Russell, D. W. (1998).
A comparison of two approaches for selecting covariance structures in the analysis of repeated measurements, Communications in
Statistics - Simulation and Computaion 27: 591604.
Khatri, C. G. (1966). A note on MANOVA model applied to problems
in growth curves, Annals of the Institute of Statistical Mathematics
18: 7586.
Korytnicki, D., Mayer, M. P. A., Daronch, M., Singer, J. M. & Grande,
R. H. M. (2006). Effects of nd:yag laser on enamel microhardness
and dental plaque composition: an in situ study, Photomedicine and
laser surgery 24: 5963.
Kshirsagar, A. M. & Smith, W. B. (1995). Growth curves, New York:
Marcel Dekker.
Kutner, M. & Brogan, D. (1981). Comparative analysis of pretestposttest designs: Letter to the editor, The American Statistician
35: 329330.
Lachos, V. H., Ghosh, P. & Arellano-Valle, R. B. (2010). Likelihood
based inference for skew-normal independent linear mixed models,
Statistica Sinica 20: 303322.
Laird, N. (1983). Further comparative analyses of pretest-posttest research designs, The American Statistician 37: 179.
Laird, N. M., Lange, N. & Stram, D. (1987). Maximum likelihood computations with repeated measures: application of the em algorithm,
Journal of the American Statistical Association 82: 97105.
Laird, N. M. & Ware, J. H. (1982). Random-effects models for longitudinal data, Biometrics 38: 963974.
Lee, J. C. (1988). Prediction and estimation of growth curves with special
covariance strutures, Journal of the American Statistical Association
83: 432440.
Singer & Nobre & Rocha - marco/2012
BIBLIOGRAFIA
217
218
BIBLIOGRAFIA
219
BIBLIOGRAFIA
Rao, M. N. & Rao, C. R. (1966). Linked cross-sectional study for determining norms and growth rates - a pilot survey on indian school-going
boys, Sankhya, B 28: 237258.
Ratkowsky, D. A., Aldredge, R. & Evans, M. A. (1992). Cross-over
experiments, New York: Marcel Dekker.
Robinson, G. K. (1991). The estimation of random effects (with discussion), Statistical Science 6: 1551.
Rouanet, H. & Lepine, D. (1970). Comparison between treatments in a
repeated measurement design: ANOVA and multivariate methods,
The British Journal of Mathematical and Statistical Psychology
23: 147163.
Rowell, J. G. & Walters, D. E. (1976). Analysing data with repeated
observations on each experimental unit, Journal of Agricultural Science 87: 423432.
Savalli, C., Paula, G. A. & Cysneiros, F. J. A. (2006). Assessment of
variance components in elliptical linear mixed models, Statistical
Modelling 6: 5976.
Schafer, W. D. (1981). Pretest-posttest designs: Letter to the editor,
The American Statistician 35: 179.
Searle, S. R. (1971). Linear models, New York: Wiley.
Searle, S. R. (1982). Matrix algebra useful for Statistics, New York:
Wiley.
Searle, S. R., Casela, G. & McCullogh, C. E. (1992). Variance components, New York: Wiley.
Seber, G. A. F. & Wild, C. J. (1989). Nonlinear regression, New York:
Wiley.
Self, S. G. & Liang, K. Y. (1987). Asymptotic properties of maximum
likelihood estimators and likelihood ratio tests under nonstandard
conditions, Journal of the American Statistical Association 82: 605
610.
Singer & Nobre & Rocha - marco/2012
220
BIBLIOGRAFIA
BIBLIOGRAFIA
221
Indice
Area
sob a curva, 8, 35
Endpoint, 8
population-averaged, 9
subject-specific, 9
Algoritmo
scoring, 62
EM, 62
Newton-Raphson, 62
Analise
de covariancia, 33
de desfecho, 33
de regressao, 5
de series cronologicas, 181
de series de tempo, 181
ANCOVA, 6, 85
ANOVA, 5, 6, 149
Area sob a curva, 31
autocorrelacao, 184
Curva
de crescimento, 10
de influencia, 173
Desfecho, 8, 31
Desigualdade
de Cauchy-Schwarz, 122
triangular, 122
DFFITS, 178
Diagnostico, 163
analise de sensibilidade, 163
avaliacao do ajuste, 163
Distancia de Cook, 177
Draftmans plot, 26
Efeito
de tratamento, 193
principal, 195
Elipsoide
de confianca, 173, 178
Coeficiente
Equacao
de determinacao, 163
de estimacao, 156
de determinacao ajustado, 163
de Henderson, 51
Combinacao linear, 111
normal, 156
Condicao de Noether, 158
Equacoes de estimacao generalizadas, 11
Controversia dos modelos mistos, 77
Espaco vetorial, 120
Covariavel
complemento ortogonal, 123
time dependent covariate, 5
dimensao, 120
dependente do tempo, 5, 6
espaco euclidiano, 122
Criterio de informacao
espaco nulo, 121
Akaike, 54
Schwarz, 54
subespaco vetorial, 120
223
BIBLIOGRAFIA
Espaco-coluna, 111
Estatstica
de Wald, 53
da razao de verossimilhacas, 53
de Durbin-Watson, 185
de Wald, 159, 160
Estimador
BLUE, 49, 156
de maxima verossimilhanca restrita, 49
de mnimos quadrados generalizados, 47
EBLUE, 52
linear nao-enviesado de variancia
mnima, 156
Estudo
de coorte, 2
longitudinal, 2
tipo painel, 2
transversal, 2
Filtro de Kalman, 62
Forma
bilinear, 126
linear, 125
quadratica, 126, 155
Funcao
escore, 62
estimavel, 55
gradiente, 129
previsvel, 55
GEE, 11
Grafico
de perfis de medias, 28
da variavel adicionada, 176
de perfis, 73, 97
de perfis individuais, 28
de regressao parcial, 176
Q-Q, 169
224
BIBLIOGRAFIA
de correlacao de trabalho, 12
de correlacoes amostrais, 27
de covariancias amostrais, 27
de informacao emprica, 63
de posto completo, 112
de predicao, 166
de projecao, 166
definida nao negativa, 126
definida positiva, 126
definida semi-positiva, 126
determinante, 112
diagonal, 109
diagonal em blocos, 116
esferica, 59
hessiana, 62, 130
idempotente, 110
identidade, 109
inversa, 113
inversa generalizada, 115, 156
jacobiana, 131
menor, 112
menor principal, 112
multiplicacao por escalar, 106
nao-singular, 112, 113
norma, 123
operador vec, 118
operador vech, 119
particionada, 111
posto, 112
produto de, 107
produto de Kronecker, 116
produto direto, 116
produto tensorial, 116
quadrada, 108
raiz caracterstica, 124
simetrica, 109
soma de, 107
soma direta, 116
submatriz, 110
traco, 115
transposta, 108
triangular, 110
triangular inferior, 110
triangular superior, 109
vetor caraterstico, 125
vetorizacao, 118
Medida resumo, 8, 31
Modelo
split-plot, 78
condicional, 10
de analise de perfis, 56
de coeficientes aleatorios, 61
de crescimento, 10
de curvas de crescimento, 58
de erros de medida, 145
de independencia condicional, 41
de parametros irrestritos, 77
de parametros restritos, 77
de perfis, 10
de regressao linear m
ultipla, 145
de regressao linear simples, 145
de regressao segmentada, 153
em dois estagios, 40
heterocedastico, 159
homocedastico, 159
incondicional, 10
individual, 9
inidentificavel, 193
linear generalizado misto, 11
linear misto, 40
linear misto assimetrico, 11
linear misto elptico, 11
mecanstico, 11
misto, 77, 190
populacional medios, 9
Movimento browniano, 11
Norma
Singer & Nobre & Rocha - marco/2012
225
BIBLIOGRAFIA
de Frobenius, 122
Observacao
discrepante, 164, 167
omissa, 6
Operador diagonal, 109
Parametro
de localizacao, 40
de nao-centralidade, 127
estimavel, 193
Parametrizacao
de cela de referencia, 193
de desvios de medias, 193
de medias de celas, 192
Perfil
response profile, 5
de resposta, 5
Pico, 31
peak, 31
Planejamento
linked, 6
balanceado no tempo, 6, 13, 15,
17
com intercambio, 2
crossover, 2
encadeado, 6
split-plot, 2
transversal misto, 6
Polinomios ortogonais, 58
Preditor
BLUP, 49
EBLUP, 52
Processo de Ornstein-Uhlenbeck,
11
Regressao
com erros nas variaveis, 145
Reparametrizacao
de desvios medios, 77
Resduo
de Hajek-Sidak,
159
de Sverdrup, 160
limite central, 158
Transformacao
linear, 121
Trilhamento, 5, 28
tracking, 5
Variavel
latente, 40
Verossimilhanca
residual, 48
restrita, 48
Vetor, 106
distancia euclidiana, 122
norma, 122
ortogonais, 123
ortonormal, 123
produto interno, 122
projecao ortogonal, 124
unitario, 122