Você está na página 1de 25

Cap.

5 – Fitzmaurice, Laird and Ware

O principal objetivo na análise de perfis de resposta é caracterizar os padrões de


mudança na resposta média ao longo do tempo nos grupos e determinar se os formatos
dos perfis médios diferem entre os grupos.

A distinção entre estudos observacionais e ensaios aleatorizados é importante e tem


ramificações para a análise dos perfis de respostas.

Uma característica comum de estudos longitudinais é a presença de medida baseline


(inicial, de referência). O objetivo pode ser comparar padrões de mudança (entre dois
grupos de tratamentos) em relação à medida de referência e ao longo do tempo. A
medida baseline é uma resposta como as outras, com a diferença que, sendo tomada
antes da aleatorização, ela não tem efeito de tratamento. Isso é uma característica
comum de estudos que envolvem aleatorização depois da baseline.

A baseline também pode ter outro papel. Ela pode ser restrita a um intervalo e apenas
sujeitos com valor menor ou maior que determinado limiar são incluídos no estudo. Em
estudos observacionais de crescimento ou declínio, grupos podem ser conhecidos por
diferirem na baseline ou a comparação de grupos pode ser selecionada de forma que as
médias na baseline sejam comparáveis.

Então, como lidar com medidas de referência na avaliação de uma mudança (ex:
redução da PA)? Isso é importante, pois afeta a construção de TH e como eles devem
ser interpretados.

Hipóteses sobre os perfis médios

1) os perfis de resposta médios são similares nos grupos, i.e., os perfis são paralelos?

Essa questão diz respeito à interação grupo x tempo.

2) Assumindo que os perfis são paralelos, as médias são constantes ao longo do tempo?

Essa questão diz respeito ao efeito de tempo.

3) assumindo que os perfis de respostas são paralelos, eles são os mesmos para os dois
grupos?

Essa questão diz respeito ao efeito de grupos.

Em estudos longitudinais, a primeira questão é de interesse principal. Note que a


segunda e terceira questões fazem uma pressuposição sobre a primeira, o que é
consistente com o princípio geral de que efeitos principais não são de interesse quando
há interação entre eles.

Em estudos aleatorizados, quando participantes são aleatorizados aos grupos e as


medidas baseline são feitas antes da intervenção, a resposta média na primeira ocasião
(baseline) são independentes do tratamento, isso é, as médias são iguais na baseline. Em
contraste, em estudos observacionais, não há razão para assumir que as médias são as
mesmas na baseline a menos que os grupos foram selecionados para terem mesmas
baselines médias.

Em estudos aleatorizados, a única questão de interesse é a primeira, pois ela investiga se


os padrões de mudança nas respostas médias dos dois grupos são os mesmos. Em
ensaios aleatrizados, a segunda pergunta é, geralmente, a menos importante porque não
envolve comparação entre grupos, só avaliação do efeito geral de tempo. Finalmente,
nesses estudos não há interesse na terceira questão . A ausência de interação grupo x
tempo implica que não há efeito de tempo. Isso é, se os grupos têm o mesmo padrão de
mudança ao longo do tempo e, pelo delineamento, não diferem na baseline, seus perfis
médios necessariamente coincidem. Como resultado, o teste de efeito de grupo está
implícito na interação. Em estudos observacionais, a primeira questão é a mais
importante, mas as outras duas também são relevantes.

Ver exemplo na tabela 5.1. Ela mostra a hipótese de perfis paralelos, que está sendo
testada. Mas, a menos que esse teste tenha 1 grau de liberdade, ele não ajuda a
identificar de que maneira os padrões de mudança ao longo do tempo diferem entre os
grupos. Para isso, precisamos considerar estimativas (e erros padrão) de contrastes
relevantes de médias.

5.3 Formulação do modelo linear geral – bom!

Fazer o mesmo para os dados de PA.

Parametrização por grupo de referência – bom!

5.6 Ajuste para resposta baseline

Para os dois testes (com 1 g.l.) descritos na seção anterior, a estatística resumo
corresponde a subtrair o valor da baseline (ocasião 1) de um resumo de respostas nas
ocasiões 2 a n. Por exemplo, para o teste de igualdade de resposta média menos a
baseline, a estatística resumo para o i-ésimo participante é (5.1):

𝑌𝑖2 + 𝑌𝑖3 + … + 𝑌𝑖𝑛


− 𝑌𝑖1
𝑛−1
Com essa representação em mente, algumas pessoas sugerem uma abordagem
alternativa, similar à análise de covariância (ancova), em que um resumo da resposta
nos tempos de 2 a n é tratada como variável dependente e o valor do baseline entra
como uma covariável (preditora) no modelo.

Quando a variável resposta é a média nas ocasiões 2 a n e queremos testar a igualdade


de média entre dois tratamentos, podemos escrever o modelo univariado correspondente
como (5.2):

𝑌 ∗𝑖 = 𝛽0 + 𝛽2 𝑌𝑖1 + 𝛽3 𝑇 + 𝑒 ∗𝑖
em que

𝑌𝑖2 + 𝑌𝑖3 + … + 𝑌𝑖𝑛


𝑌 ∗𝑖 =
𝑛−1

Testes baseados nos dois procedimento acima correspondem à comparação entre dois
grupos de respostas médias nas ocasiões de 2 a n, ajustados para a baseline, e tem G-1
g.l. independente do número de ocasiões (sessões) medidas.

Surge, então, a questão sobre incorporar a baseline através de contraste ou como uma
covariável no modelo. A resposta depende se o estudo é observacional ou aleatorizado.

Se o estudo é observacional, não é aconselhável usar baseline como covariável porque


seu valor pode estar associado com outras variáveis que estão sendo estudadas,
causando problemas de confundimento em um análise cujo objetivo é descrever como o
padrão de resposta ao longo do tempo é influenciado pelas características de estudo dos
participantes.

Quando os participantes são aleatorizados aos tratamentos e o valor da baseline é


medido antes de qualquer intervenção, o ajuste da baseline usando-a como covariável é
de interesse. Nesse caso, a resposta no tempo 1 é independente do tratamento. Os dois
testes são baseados na mesma hipótese nula, mas o teste baseado na análise de
covariância será sempre mais eficiente. Isso significa que ele produzirá estimativas com
menor erro padrão do que aquelas por contrastes.

A maior eficiência da ancova é analisada examinando a eficiência relativa de (5.1) em


relação a (5.2). VER DETALHES NA PÁG. 124 – INTERESSANTE!

Em geral, a análise de dados longitudinais de um estudo aleatorizado é a única ocasião


onde se recomenda ajuste para baseline usando ela como covariável. Nessa situação,
esse ajuste leva a testes de hipóteses com mais sentido e serão mais poderosos.

A análise de mudança longitudinal é um tópico que gera debate entre analistas. Em


estudos observacionais, os dois métodos descritos para a baseline podem gerar
resultados diferentes e conflitantes. Essa contradição é chamada paradoxo de Lord. O
paradoxo consiste na interpretação dos dois tipos de análise e é resolvido notando que
esses dois métodos alternativos para ajuste da baseline respondem questões científicas
diferentes quando os dados vêm de um estudo observacional. VER EXEMPLOS NO
TEXTO!

Em resumo, a escolha entre os dois métodos de ajuste para a baseline deve levar em
conta o delineamento do estudo longitudinal e a questão de pesquisa de interesse. A
análise que subtrai a resposta baseline é apropriada quando o principal objetivo do
estudo é comparar populações distintas em termos de mudança média ao longo do
tempo. Ex: “As populações diferem em termos de mudança média?” e é apropriado para
estudos observacionais ou aleatorizados. Por outro lado, a ANCOVA, em geral, é
apropriada apenas em estudos aleatorizados ou quando as distribuições das populações
das respostas baseline podem ser assumidas iguais. Se as populações na baseline são
iguais, faz sentido a pergunta: “A mudança esperada é a mesma nos grupos, quando
comparamos indivíduos com a mesma resposta baseline?”. Concluindo, o delineamento
do estudo e a questão científica que devem determinar qual método será usado para
ajustar a baseline, e não questões de precisão e poder estatístico.

5.7 métodos alternativos de ajuste para resposta baseline

Uma característica de estudos longitudinais que os separa de medidas repetidas e outros


delineamentos relacionados é a presença de medida baseline. Ex: ensaio TLC (ensaio
aleatorizado). Então uma questão natural é sobre como lidar com essa medida ao estudar
se o padrão de mudança na resposta média ao longo do tempo é a mesma nos grupos.

Na seção anterior consideramos dois métodos de ajuste para a baseline em uma situação
relativamente simples. Essa noção pode ser estendida para casos mais gerais. Nessa
seção comparamos várias estratégias para lidar com a baseline e fazemos
recomendações sobre as mais adequadas em diferentes situações.

Consideremos 4 maneiras de lidar com medidas baseline:

1) Mantê-las como parte do vetor de resposta e não fazer pressuposições sobre a


diferença entre grupos na baseline
2) Mantê-las como parte do vetor de resposta e assumir que as médias dos grupos
são as mesmas na baseline, o que pode ser apropriado em ensaios aleatorizados.
3) Podemos subtrair a resposta baseline de todas as respostas nos outros tempos, e
analisar as diferenças em relação à baseline
4) Usar os valores da baseline como covariáveis na análise das respostas nos outros
tempos.

Agora cada uma dessas abordagens serão discutidas e ilustradas com os dados do ensaio
TLC.

A primeira estratégia é uma análise padrão de perfis de resposta sem incorporar


qualquer restrição nas médias de grupos na baseline. Esse foi o método usado nas
primeiras seções desse capítulo.

A segunda estratégia corresponde a uma análise de perfis onde as médias dos grupos nas
baselines são assumidas iguais. Em um ensaio aleatorizado, em que a alocação dos
tratamentos é aleatória, ambas as estratégias produzem válidas estimativas, mas a
segunda é em geral mais poderosa. Então, em ensaios aleatórios ou estudos
observacionais em que há uma boa razão para assumir que os grupos têm a mesma
resposta média na baseline, a segunda estratégia é a preferida e deve ser usada. Por
outro lado, em estudos observacionais em que não há uma razão a priori para asusmir
que os grupos têm a mesma resposta média na baseline, a segunda estratégia não é
apropriada e apenas a primeira deve ser usada.
Na análise dos dados do ensaio TLC, a primeira estratégia foi apresentada nas tabelas
5.4 e 5.5. A segunda estratégia pode ser implementada excluindo o efeito principal de
tratamento do modelo. Esse modelo não é usual, pois contem uma interação grupo x
tempo, mas não tem efeito principal de grupo. Esse modelo parece contradizer a
“convenção” de que interações não devem ser incluídas em um modelo de regressão
sem os efeitos principais. No entanto essa é uma importante exceção à regra. Já que a
baseline foi escolhida como o nível de referência para tempo, a exclusão do efeito
principal de grupo força os dois grupos a terem a mesma resposta média na baseline. Os
resultados são apresentados na tabela 5.7 e são qualitativamente similares aos da tabela
5.5. VER COMENTÁRIOS SOBRE O TESTE DE WALD NAS DUAS
ABORDAGENS.

A terceira e quarta estratégias não retêm a resposta baseline como parte do vetor de
respostas. Em vez disso, elas focam nas mudanças brutas e ajustadas em relação à
baseline. A terceira estratégia é subtrair a resposta baseline das outras respostas e
analisar as diferenças em relação à baseline. Essa diferenças são escores de mudanças
brutos. Com respostas nas n ocasiões, o vetor (n - 1) x 1 de escores de mudanças brutos
é:

𝐷𝑖 = (𝑌𝑖2 − 𝑌𝑖1 , 𝑌𝑖3 − 𝑌𝑖1 , … , 𝑌𝑖𝑛 − 𝑌𝑖1 )′

e uma análise de perfis é conduzida com 𝐷𝑖 como sendo o vetor de respostas. Já que a
resposta é “mudança em relação à baseline”, essa abordagem altera a interpretação dos
testes para todos os três efeitos. O teste para a interação grupo x tempo é um teste para
perfis paralelos para as mudanças em relação à baseline na resposta média a partir da
ocasião 2; o teste para efeito de grupo testa se as mudanças a partir da baseline na
ocasião 2 são as mesmas entre os grupos (assumindo que a ocasião 2 é o nível de
referência para tempo). Então, para responder a questão sobre se os padrões de mudança
ao longo do tempo são os mesmos para os grupos, o teste na terceira estratégia precisa
ser modificado. Seria um teste conjunto que combina o efeito principal de grupo e o
efeito de interação. Esse teste é equivalente ao teste de interação na primeira estratégia.
Ambas as estratégias produzem testes idênticos e mesmas estimativas dos efeitos.
Então, a terceira estratégia não oferece nenhum ganho em eficiência. Apesar de ambas
produzirem os mesmos resultados, a primeira é recomendada por facilidade de
realização dos testes e por ter uma estratégia melhor para lidar com dados ausentes.

A quarta estratégia é analisar as respostas a partir do tempo 2, ajustando para a resposta


na baseline. Nesse caso, ela é considerada uma covariável. O vetor de respostas é

𝑌𝑖 = (𝑌𝑖2 , 𝑌𝑖3 , … , 𝑌𝑖𝑛 )′

e a resposta baseline, 𝑌𝑖1 , é tratada como uma covariável. A análise corresponde a uma
ANCOVA. Essa estratégia é apropriada para lidar com baseline em ensaios
aleatorizados. Por causa da aleatorização, as hipóteses de igualdade das médias
condicionais da resposta nas ocasiões 2 a n, dada a repsosta na baseline, implicam
hipóteses de igualdade de médias não condicionais da resposta nas ocasiões 2 a n. Essa
estratégia (4) também é apropriada para estudos observacionais quando há uma boa
razão para assumir que os grupos têm a mesma resposta média na baseline. Mas não
deve ser usada, no entanto, em estudos observacionais em que não há uma razão a priori
para assumir que os grupos têm as mesmas médias na baseline.

Fato interessante é que essa estratégia pode ser implementada conduzindo a análise nos
perfis de respostas (𝑌𝑖1 , como covariável) tanto nas respostas pós-baseline quanto nos
escores de mudança pós-baseline. As estimativas são idênticas. As análises diferem
apenas em relação ao slope estimado para 𝑌𝑖1 . Graças a essa equivalência, a quarta
análise é chamada “escores de mudanças ajustados” (i.e., diferenças ajustadas para 𝑌𝑖1 ).

Já que a resposta é um escore ajustado, a interpretação também altera a interpretação


dos testes. O teste para a interação grupo x tempo é um teste de perfis paralelos para as
mudanças ajustadas em relação à baseline na resposta média nas ocasiões de 2 a n; o
teste para efeito de grupo testa se as mudanças ajustadas em relação à baseline na
resposta média, na ocasião 2 são as mesmas entre os grupos (se ocasião 2 é o nível de
referência). Então, similar à terceira estratégia, o teste de interesse é um teste conjunto
do efeito principal de grupo e efeito de interação.

A estatística de Wald da estratégia 4 é similar à 2. Então, qual é melhor? A 2 é melhor


pelas mesmas razões que a 1 supera a 3. Além disso, há uma pressuposição implícita na
ANCOVA de que o slope relacionando 𝑌𝑖𝑗 a 𝑌𝑖1 (para j = 2, 3, ..., n) é o mesmo em
todas as n-1 ocasiões pós-baseline. Isso implica uma forte pressuposição sobre as
covariâncias entre 𝑌𝑖1 , 𝑌𝑖2 , … , 𝑌𝑖𝑛 . Especificamente, isso implica:

𝐶𝑂𝑉(𝑌𝑖1 , 𝑌𝑖2 ) = 𝐶𝑂𝑉(𝑌𝑖1 , 𝑌𝑖3 ) = ⋯ = 𝐶𝑂𝑉(𝑌𝑖1 , 𝑌𝑖𝑛 )

Como um resultado, há uma potencial má especificação do modelo em relação à


covariância e inferências erradas em relação à mudança ao longo do tempo. Ao
contrário, a segunda estratégia não impõe nenhuma estrutura na matriz de covariâncias.
Se a pressuposição de slopes de regressão homogêneos é relaxada, as estratégias 2 e 4
produzem os mesmos resultados. A estratégia 2 tem todos os ganhos de eficiência e
deve ser preferida em relação à 4.

Vimos que há diferentes maneiras de lidar com medidas baseline. Dois métodos que
retêm a baseline como parte da resposta são equivalentes às estratégias correspondentes
que restringem o vetor de respostas a medidas pós-baseline. As duas primeiras
estratégias são as melhores e diferem em termos de eficiência e a escolha por uma delas
deve ser guiada pelo delineamento experimental.

Ensaios clínicos e estudos observacionais são tipos de delineamentos bastante utilizados


na área da saúde. Quando um experimento é realizado em laboratório são analisando
pacientes como objeto de investigação, esse procedimento caracteriza um ensaio
clínico, onde a escolha dos pacientes é realizada de maneira minuciosa, utilizando o
processo de randomização, o intuito é evitar variações que possam afetar as
comparações entre os grupos analisados.

Por outro lado, estudos observacionais não provem de um experimento, pois não há
intervenção do pesquisador, sendo assim, as informações são colhidas de forma
sistemática, acarretando em conclusão causal, esses estudos são caracterizados como
longitudinal ou transversal.

Neste capítulo apresentamos um método para analisar dados longitudinais


que impõem estrutura ou restrições mínimas sobre a resposta média ao
longo do tempo e sobre a covariância entre as medidas repetidas. O método
se concentra na análise de perfis de resposta e pode ser aplicado a dados
longitudinais quando o design é equilibrado, com o tempo das medidas
repetidas comuns a todos os indivíduos no estudo. Embora nos
concentremos nos projetos de estudo em que todos os indivíduos são
medidos no mesmo conjunto de n ocasiões (ou seja, projetos longitudinais
equilibrados), como mostraremos, a análise dos perfis de resposta também
pode lidar com a incompletude devido a dados ausentes (isto é, estudos
longitudinais incompletos). com desenhos equilibrados). Os métodos para
analisar perfis de resposta são atraentes quando existe uma única
covariável categórica (talvez denotando diferentes grupos de tratamento ou
exposição) e quando nenhum padrão a priori específico para as diferenças
nos perfis de resposta entre os grupos pode ser especificado. Quando
medidas repetidas são obtidas na mesma sequência de ocasiões, os dados
podem ser resumidos pela resposta média estimada em cada ocasião,
estratificada por níveis do fator de grupo. Em qualquer nível dado do fator
de grupo, a seqüência de médias ao longo do tempo é referida como o perfil
médio de resposta. Por exemplo, considere os dados do nível de chumbo
no sangue do estudo de TLC. Os perfis de resposta médios para os dois
grupos randomizados para succimer e placebo são apresentados na Figura
5.1. Este gráfico é produzido simplesmente calculando a média aritmética
das respostas em cada ocasião, dentro de cada grupo de tratamento, e
juntando meios adjacentes com uma série de segmentos de linha. Em locais
onde faltam dados sobre alguns assuntos, tal gráfico ainda pode ser feito,
mas é obtido a partir da estimativa

Os níveis médios de chumbo no sangue no início (semana 0), semana 1, semana 4 e


semana 6 nos grupos succimer e placebo.
para cada ocasião, estratificada por grupo. Mostraremos como estimar
essas curvas médias de perfil de resposta na Seção 5.3. O principal objetivo
na análise dos perfis de resposta é caracterizar os padrões de mudança na
resposta média ao longo do tempo nos grupos e determinar se as formas
dos perfis médios de resposta diferem entre os grupos. Por exemplo, no
estudo de TLC, a principal questão de interesse científico diz respeito a se
as mudanças nos níveis médios de chumbo no sangue são as mesmas para
os grupos succimer e placebo. Nas Seções 5.2 e 5.3, enfatizamos como as
questões sobre se os padrões de mudança são os mesmos em todos os
grupos se traduzem em hipóteses sobre a interação entre o fator do grupo e
o tempo.Os métodos para analisar os perfis de resposta podem ser
estendidos de maneira simples para lidar com o caso em que há mais de
um fator de grupo único e quando há covariáveis de linha de base que
precisam ser ajustados. No entanto, para facilitar a exposição, nos
concentramos no caso em que há apenas um único fator de grupo.Por
exemplo, em um estudo observacional, os grupos podem ser definidos
pelas características dos sujeitos do estudo, como idade, sexo ou nível de
exposição.Alternativamente, os grupos podem ser definidos por designação
aleatória para diferentes tratamentos ou intervenções. A distinção

HIPÓTESES RELATIVAS AOS PERFIS DE RESPOSTA

Em nossa discussão sobre a análise dos perfis de resposta, nos


concentramos inicialmente no design de dois grupos, mas as
generalizações para mais de dois grupos são diretas. Dada uma sequência
de n medidas repetidas em um número de grupos distintos de indivíduos,
três questões principais sobre os perfis de resposta podem ser colocadas:

1. Os perfis médios de resposta são semelhantes nos grupos, no sentido de


que os perfis médios de resposta são paralelos? Esta é uma questão que
diz respeito ao efeito de interação grupo x tempo. Uma representação
gráfica da hipótese nula de perfis de respostas médias paralelas é exibida
na Figura 5.2 (a).

2. Assumindo que os perfis de respostas médias populacionais são


paralelos, as médias são constantes ao longo do tempo, no sentido de que
os perfis médios de resposta são planos? Esta é uma questão que diz
respeito ao efeito do tempo. Uma representação gráfica da hipótese nula de
que os perfis médios de resposta são definidos é mostrada na Figura 5.2
(b).

Assumindo que os perfis médios de resposta da população são paralelos,


eles também estão no mesmo nível no sentido de que os perfis médios de
resposta para os grupos coincidem?
Esta é uma questão que diz respeito ao efeito de grupo. Uma representação
gráfica da hipótese nula de que os perfis médios de resposta estão no
mesmo nível é exibida na Figura 5.2 (c).

Em estudos longitudinais, é a primeira questão que é de interesse científico


principal.A hipótese de perfis de resposta paralelos corresponde à hipótese
de que os padrões de mudança na resposta média ao longo do tempo são
os mesmos entre os grupos.Essa comparação de mudanças na resposta ao
longo do tempo é a razão de ser de um estudo longitudinal. Em contraste,
como veremos mais adiante, a segunda e terceira questões podem não ter
qualquer relevância científica. Ou seja, mesmo quando os perfis de resposta
podem ser considerados paralelos, qualquer interesse nas segunda e
terceira questões é secundário e depende do desenho do estudo
longitudinal.

Note que as segunda e terceira questões implicitamente fizeram uma


suposição sobre a resposta para a primeira. Há uma boa razão para
isso. Exceto em circunstâncias muito raras, não faz sentido fazer as
segunda e terceira perguntas se os perfis médios de resposta não forem
paralelos. De facto, isto é consistente com o princípio geral de que os
efeitos principais (por exemplo, efeitos de grupo ou tempo) não são
normalmente de interesse quando existe uma interacção entre eles. Ou
seja, quando há uma interação grupo x tempo, os perfis médios de resposta
nos grupos são diferentes (perfis não paralelos); consequentemente, sua
forma pode ser descrita apenas com referência a um grupo específico e seu
nível pode ser descrito apenas com referência a um tempo específico.

As hipóteses científicas apropriadas em qualquer estudo particular devem


ser derivadas das questões científicas relevantes nessa investigação. Aqui,
torna-se importante distinguir entre dados longitudinais decorrentes de um
estudo randomizado e de um estudo observacional. No primeiro caso,
quando os participantes do estudo foram randomizados para grupos de
tratamento e os valores basais da resposta foram obtidos antes de
quaisquer intervenções do estudo, a resposta média na ocasião 1 é
independente da atribuição do tratamento. Ou seja, por design, as médias
do grupo são iguais na linha de base (ocasião 1). Em contraste, em um
estudo observacional, não há razão a priori para assumir que os grupos
tenham a mesma resposta média no início, a menos que os grupos fossem
selecionados por correspondência na resposta basal.
Considere um ensaio clínico longitudinal randomizado comparando os
tratamentos em que a medição na primeira ocasião é uma resposta inicial,
obtida antes de qualquer intervenção do estudo. Por exemplo, no estudo de
TLC, os níveis de chumbo no sangue no início do estudo foram obtidos
antes de receber placebo ou succimer.Nesse caso, a única questão de
interesse científico é a primeira, porque aborda se os padrões de mudança
na resposta média ao longo do tempo são os mesmos em todos os
grupos. Por exemplo, no ensaio TLC, o teste da interação grupo x tempo
avalia se as mudanças nos níveis sanguíneos médios são as mesmas para
os grupos succímero e placebo. Em um ensaio randomizado, a segunda
questão é geralmente de menor importância, pois não envolve comparação
de grupos. A segunda questão diz respeito ao efeito do tempo, em que o
foco é a comparação da média da resposta em cada ocasião em média
sobre os grupos. As hipóteses relativas ao efeito principal do tempo
traduzem-se em perguntas sobre se a resposta média global (isto é, sobre
os grupos médios) mudou de baseline. Finalmente, em um estudo
randomizado, onde a resposta inicial foi obtida antes de qualquer
intervenção do estudo, não há interesse na terceira questão. A terceira
questão diz respeito ao efeito de grupo. Entretanto, nesse cenário, a
ausência de uma interação grupo x tempo implica que não há efeito de
grupo. Ou seja, se os grupos tiverem o mesmo padrão de mudança ao
longo do tempo e, por definição, não diferirem na linha de base, seus perfis
médios de resposta deverão necessariamente coincidir. Como resultado, o
teste de efeito de grupo é incluído no teste de interação grupo x tempo.
Em um estudo observacional, onde o fator do grupo pode representar exposições
diferentes ou características inerentes dos indivíduos, a primeira pergunta é geralmente
de interesse primário. Aborda a questão fundamental de saber se os padrões de mudança
ao longo do tempo na resposta média variam por grupo. Em contraste com um estudo
randomizado, no entanto, a segunda e terceira questões também podem ser de interesse
substantivo. Por exemplo, em um estudo longitudinal de crescimento ou
envelhecimento, pode haver interesse no padrão de mudança na resposta média ao longo
do tempo, mesmo quando o padrão de mudança é o mesmo em todos os grupos. Isto diz
respeito ao principal efeito do tempo e é abordado pela segunda questão. Normalmente,
quando há interesse no efeito do tempo, a maneira preferida de descrever a tendência na
resposta média é com uma curva paramétrica relativamente simples; Os métodos para
ajustar as curvas paramétricas ou semi-paramétricas à resposta média são descritos no
Capítulo 6. Finalmente, em um estudo observacional, pode haver interesse em
comparações de grupo da média da resposta média ao longo do tempo. Isto diz respeito
ao efeito de grupo e é abordado pela terceira questão. No entanto, na ausência de
qualquer interação grupo x tempo, deve-se reconhecer que o teste para o efeito principal
do grupo representa uma comparação dos grupos em termos de sua resposta inicial
(ocasião 1). Ou seja, se os grupos tiverem o mesmo padrão de mudança ao longo do
tempo, qualquer diferença de grupo na resposta média geral (ou seja, em média ao longo
das ocasiões) deve refletir as diferenças de linha de base existentes entre os grupos

Para destacar as principais características da análise dos perfis de resposta, considere o


seguinte exemplo de um estudo de dois grupos que compara um novo tratamento e um
controle. Assumimos que os dois grupos tenham medições repetidas no mesmo
conjunto de n ocasiões. A análise dos perfis de resposta é baseada na comparação dos
perfis médios de resposta nos dois grupos. Em uma notação um pouco relaxada, deixe
m, (T) = {m(T), ..., m(T)} 'denota o perfil de resposta médio para o grupo de tratamento
e m(C) = {m(C), ..., m{C) } 'denota o perfil de resposta médio para o grupo de controle.
A população significa nos dois grupos em cada ocasião são dadas na Tabela 5.1.

Neste estudo hipotético, estamos principalmente interessados em testar hipóteses


científicas que comparem o novo tratamento e o controle em termos de mudanças na
resposta média ao longo do tempo. Isso pode ser determinado considerando a hipótese
nula de nenhuma interação grupo x tempo, ou seja, a hipótese nula de que os perfis de
resposta médios são paralelos. Se os perfis de resposta médios são paralelos, a diferença
nas médias entre os dois grupos é constante ao longo do tempo. Como resultado, em
termos de A., -, o nulo
onde Aj = / ij (T) - Hj {C). Se a hipótese nula for rejeitada, os dois grupos têm perfis de
resposta médios não paralelos e os padrões de mudança ao longo do tempo diferem nos
dois grupos. Observe que o número de restrições nas respostas médias sob essa hipótese
nula é n -1. Como resultado, o teste desta hipótese nula tem n -1 graus de liberdade. Na
Seção 5.3, descrevemos como as restrições podem ser expressas em termos de
contrastes específicos dos meios. A ilustração anterior focalizou o caso especial de G =
2 grupos; no entanto, as idéias principais podem ser generalizadas de maneira direta
quando há mais de dois grupos. Quando há grupos G com medições repetidas no mesmo
conjunto de n ocasiões, deixamos fi (g) = {mi (p), ..., Mn (9)} 'denotar o perfil de
resposta médio para o grupo g (g = 1, ..., G). As médias populacionais nos grupos G em
cada ocasião são dadas na Tabela 5.2. Com G> 2, podemos comparar grupos de várias
maneiras diferentes. No entanto, com os grupos G, existem apenas comparações não
redundantes do G - 1. Definimos Aj {g} = nj {g) - Hj {G}, (para j = 1, „,, n; g = 1, ..., G
- 1), ou seja, A, (p) é um contraste ou comparação da resposta média na ocasião j para o
grupo gl (para g = 1, ..., G -1) com a resposta média na ocasião jih no grupo G. Então, a
hipótese nula de que a média perfis de resposta são paralelos é Com G> 2, o teste da
hipótese nula de nenhum efeito de interação grupo x tempo (G -1) x (n -1) graus de
liberdade. Até agora, nossa discussão sobre a análise dos perfis de resposta se
concentrou em um teste coletivo da interação grupo x tempo. No entanto, a menos que o
teste da interação grupo x tempo tenha apenas um único grau de liberdade, esse teste
não ajuda a discernir de que maneira os padrões de mudança ao longo do tempo diferem
entre os grupos. Para este último, devemos considerar estimativas (e seus erros padrão)
de contrastes relevantes do
significa. Na próxima seção, descrevemos uma formulação de modelo linear geral da
análise de perfis de resposta. Como mostraremos, a análise dos perfis de resposta pode
ser formulada de tal forma que certos parâmetros de regressão tenham interpretações
que incidem diretamente sobre as questões de interesse científico principal.

FORMULAÇÃO DO MODELO LINEAR GERAL

Antes de ilustrar as ideias principais com um exemplo numérico, consideramos como a


análise dos perfis de resposta pode ser implementada no modelo linear geral

E(Yi| Xi)=mi=Xbeta

para escolhas apropriadas de X, também descrevemos como a hipótese principal de


nenhum efeito de interação grupo x tempo pode ser expressa em termos de /? Seja n o
número de medidas repetidas e N o número de sujeitos. Para expressar o modelo para o
desenho longitudinal com grupos G e n ocasiões de medição, exigimos parâmetros Gxn
para os perfis de resposta média G. Por exemplo, com dois grupos medidos em três
ocasiões, existem 2 x 3 = 6 parâmetros médios (ver Tabela 5.2). Para o primeiro grupo,
deixe a matriz de desenho Xi ser a seguinte matriz 3 x 6;

(...)

5.4 Estudo de caso: ensaio TLC

A principal questão de interesse refere-se a comparação dos dois grupos de tratamentos


em termos de padrões de mudança em relação à baseline. Essa questão se traduz
diretamente em um teste da interação grupo x tempo. Os testes para efeitos principais
não são de interesse – uma das razões é que a interação foi significativa. Se ela não
tivesse sido e se houvesse interesse nos efeitos principais, o modelo teria que ser re-
ajustado aos dados, excluindo-se o termo da interação.

Para avaliar como os grupos diferem, devemos olhar para as estimativas de REML dos
betas e seus erros padrão. A medida baseline é usada como nível de referência para
tempo e o grupo placebo é usado como nível de referência para grupo. Ver
interpretações ao final da página 117!

Já que o TLC é estudo aleatorizado, a resposta média na baseline independe do


tratamento (o que é confirmado pelo teste não significativo de efeito principal de grupo
– que na verdade está comparando os dois grupos na baseline). Isso sugere que a análise
dos perfis de resposta pode ser simplificada ajustando um modelo que omite o efeito
principal de grupo, forçando os dois grupos a terem a mesma resposta na baseline. Os
méritos de tal ajuste são discutidos depois.

TRADUCAO

e comparado a uma distribuição de x2 com graus de liberdade iguais ao


número de linhas de L. O teste de razão de verossimilhança correspondente
poderia ser construído e exigiria a comparação da log-verossimilhança
maximizada de ML para dois modelos, um modelo que incorpora a
restrição que L @ = 0 (ou seja, o modelo sem interação grupo x tempo), o
outro modelo sem restrições (ou seja, o modelo com interação grupo x
tempo).
No TLC. julgamento a questão do interesse científico principal diz respeito à
comparação dos dois grupos de tratamento em termos de seus padrões de
mudança da linha de base nos níveis médios de chumbo no sangue. Esta
questão se traduz diretamente em um teste da interação grupo x tempo. Na
Tabela 5.4, o teste da interação grupo x tempo produz uma estatística de
Wald de 107,79 com 3 graus de liberdade (o teste da razão de
verossimilhança correspondente rende G2 = 74,2).Quando comparada com
a distribuição qui-quadrado de referência com 3 graus de liberdade, há
fortes evidências para rejeitar a hipótese nula e concluir que os padrões de
mudança da linha de base não são os mesmos nos dois grupos.
Dado o padrão de respostas observadas (ver Figura 5.1), esse resultado é
esperado.

Os testes dos principais efeitos do grupo e do tempo na Tabela 5.4 não são
significativos, por duas razões bem diferentes. Primeiro, os dados de TLC
são de um ensaio randomizado e o teste do efeito principal do tempo não é
de interesse do assunto enquanto o teste do efeito principal do grupo é
incluído no teste de interação grupo x tempo. Em segundo lugar, em geral,
os testes dos principais efeitos do tempo e do grupo na Tabela 5.4 não são
significativos na presença de uma interação significativa grupo x tempo. Isso
ressalta nosso conselho anterior de que testes de efeitos principais devem
ser considerados apenas quando a suposição de perfis de resposta
paralelos for sustentável. Quando os perfis são paralelos, e há interesse
científico nos principais efeitos do tempo e / ou grupo, os testes dos
principais efeitos do tempo e do grupo exigem que o modelo seja reajustado
aos dados, excluindo a interação grupo x tempo . Os testes de Wald
resultantes para os principais efeitos deste modelo reduzido têm as
interpretações desejadas.

Até agora, nossa análise dos perfis de resposta forneceu um teste coletivo da interação
grupo x tempo. No entanto, a menos que o teste da interação grupo x tempo tenha
apenas um único grau de liberdade, esse teste não indica como os dois grupos diferem.

Para este último, devemos considerar as estimativas REML de P e seus erros padrão
apresentados na Tabela 5.5; Testes alternativos de grau único de liberdade para
interação grupo x tempo serão discutidos na Seção 5.5. Para facilitar a interpretação, a
linha de base (semana 0) é escolhida como o nível de referência para o tempo e o grupo
placebo é escolhido como o nível de referência para o grupo de tratamento. De um
exame dos três contrastes de grau único de liberdade para a interação grupo x tempo, os
resultados indicam que as crianças tratadas com succímero têm uma diminuição
perceptível nos níveis médios de chumbo no sangue desde o início em todas as ocasiões
quando comparadas às crianças tratadas com placebo. Por exemplo, quando comparado
ao grupo placebo, o grupo succimer tem uma redução adicional de 3.152 / ^ g / dL (com
SE = 1.257) nos níveis médios de chumbo no sangue desde o início até a 6ª semana.
dois grupos de tratamento no início do estudo. Por exemplo, quando comparado ao
grupo placebo, o grupo succimer tem uma redução adicional de 11.406 Mg / dL nos
níveis médios de chumbo no sangue desde o início até a semana 1. Acredita-se que o
aparente rebote nos níveis de chumbo no sangue após a semana 1 no grupo succimer
seja devido ao chumbo que é armazenado nos ossos que estão sendo mobilizados,
resultando em um novo equilíbrio nos níveis de chumbo no sangue nas crianças tratadas
com succímero.

Lembramos ao leitor que nosso aviso anterior sobre o teste de efeitos principais na
presença de interações se aplica também aos resultados da Tabela 5.5. Por exemplo, o
teste do efeito principal do grupo na Tabela 5.5 (Z = 0.27) não compara a resposta
média (por vezes) nos grupos succímero e placebo; em vez disso, compara a resposta
média no início (aqui o nível de referência para o tempo) nos dois grupos de tratamento.
A falta de equivalência entre os testes para o efeito principal do grupo nas Tabelas 5.4 e
5.5 é uma conseqüência direta da parametrização do grupo de referência adotada aqui (e
comumente usada por muitos pacotes de software estatísticos, por exemplo, PROC
MIXED no SAS).

Finalmente, porque os dados de TLC são de um estudo randomizado, a resposta média


no início do estudo é independente da designação do tratamento (como foi confirmado
pelo teste não significativo do efeito principal do grupo na Tabela 5.5). Devido à
atribuição aleatória a grupos de tratamento, isso sugere que a análise dos perfis de
resposta poderia ser simplificada pela adaptação de um modelo que omite o efeito
principal do grupo, forçando assim os dois grupos a terem a mesma resposta média no
início do estudo. Nas Seções 5.6 e 5.7, consideramos os méritos de tal ajuste e
comparamos e contrastamos estratégias alternativas para lidar com a resposta da linha
de base em diferentes configurações. Nessas seções, destacamos como a análise de
perfis de resposta é um método flexível que pode ser facilmente adaptado para levar em
consideração o design do estudo e abordar questões que são cientificamente relevantes
para qualquer estudo em particular.

5.5 Testes com 1 g.l. para a interação grupo x tempo

O teste para a interação grupo x tempo é muito geral, não especifica um padrão nos
perfis de respostas entre os grupos. Essa falta de especificidade é um problema em
estudos em que há um grande número de ocasiões de medidas ao longo do tempo (ex.
muitas sessões) porque o teste geral de interação fica menos sensível a medida que n
aumenta. Ele não será sensível para detectar desvios da hipótese de paralelismo.

Alternativa: área abaixo da curva menos a baseline ou, simplesmente, AUC. (Pesquisar
sobre...ver se ainda é usado).

Esse tipo de teste é útil quando não conseguimos detectar efeito significativo para a
interação grupo X tempo.

Pa.104

A seguir, ilustramos as principais ideias, realizando uma análise dos perfis de resposta
dos dados de chumbo no sangue das 100 crianças dos grupos de succimer e placebo do
Estudo de Tratamento de Crianças Expostas a Chumbo (TLC).

Lembre-se que o estudo de TLC foi um ensaio randomizado controlado com placebo de
um agente quelante administrado oralmente, succimer, em crianças com níveis de
chumbo no sangue confirmados de 20-44 fj, ° / dL. As crianças do ensaio tinham entre
12 e 33 meses e viviam em um estado de deterioração da cidade. A análise a seguir é
baseada em dados sobre os níveis de chumbo no sangue no início (ou semana 0),
semana 1, semana 4 e semana 6 durante o primeiro período de tratamento. Os perfis
médios de resposta para os dois grupos foram exibidos na Figura 5.1. Na Tabela 5.3, as
estimativas de REML dos componentes da matriz de covariância não estruturada são
exibidas. Observe o aumento perceptível na variabilidade nos níveis de chumbo no
sangue da pré para a pós-randomização. Este aumento na variabilidade da linha de base
é provavelmente devido a dois fatores. Primeiro, dentro de cada grupo de tratamento,
pode haver heterogeneidade natural nas trajetórias individuais de resposta ao longo do
tempo. Segundo, o estudo teve um critério de inclusão de que os níveis de chumbo no
sangue no início do estudo estavam na faixa de 20-44 // g / dL; isso pode parcialmente
explicar a menor variação na linha de base. Na Tabela 5.4, os resultados da análise dos
perfis de resposta são apresentados. O interesse principal está no teste da interação
grupo x tempo. O teste da interação grupo x tempo é baseado em um teste de Wald
multivariado. O teste fornece um teste simultâneo de Ho: LP = 0 versus H4: LP ^ 0,
para uma escolha adequada de L, e a estatística de teste pode ser construída como e
comparada a uma distribuição x2 com graus de liberdade iguais ao número de linhas O
teste da razão de verossimilhança correspondente poderia ser construído e exigiria a
comparação da log-verossimilhança ML maximizada para dois modelos, um modelo
que incorpora a restrição que L = 0 (ou seja, o modelo sem interação grupo x tempo) , o
outro modelo sem restrições (ou seja, o modelo com interação grupo x tempo). No TLC.
julgamento a questão do interesse científico principal diz respeito à comparação dos
dois grupos de tratamento em termos de seus padrões de mudança da linha de base nos
níveis médios de chumbo no sangue. Esta questão se traduz diretamente em um teste da
interação grupo x tempo. Na Tabela 5.4, o teste da interação grupo x tempo produz uma
estatística de Wald de 107,79 com 3 graus de liberdade (o teste da razão de
verossimilhança correspondente rende G2 = 74,2). Quando comparada com a
distribuição qui-quadrado de referência com 3 graus de liberdade, há fortes evidências
para rejeitar a hipótese nula e concluir que os padrões de mudança da linha de base não
são os mesmos nos dois grupos. Dado o padrão de respostas observadas (ver Figura
5.1), esse resultado é esperado. Os testes dos principais efeitos do grupo e do tempo na
Tabela 5.4 não são significativos, por duas razões bem diferentes. Primeiro, os dados de
TLC são de um ensaio randomizado e o teste do efeito principal do tempo não é de
interesse do assunto enquanto o teste do efeito principal do grupo é incluído no teste de
interação grupo x tempo. Em segundo lugar, em geral, os testes dos principais efeitos do
tempo e do grupo na Tabela 5.4 não são significativos na presença de uma interação
significativa grupo x tempo. Isso ressalta nosso conselho anterior de que testes de
efeitos principais devem ser considerados apenas quando a suposição de perfis de
resposta paralelos for sustentável. Quando os perfis são paralelos, e há interesse
científico nos principais efeitos do tempo e / ou grupo, os testes dos principais efeitos
do tempo e do grupo exigem que o modelo seja reajustado aos dados, excluindo a
interação grupo x tempo . Os testes de Wald resultantes para os principais efeitos deste
modelo reduzido têm as interpretações desejadas.
Até agora, nossa análise dos perfis de resposta forneceu um teste coletivo da interação
grupo x tempo. No entanto, a menos que o teste da interação grupo x tempo tenha
apenas um único grau de liberdade, esse teste não indica como os dois grupos diferem.
Para este último, devemos considerar as estimativas REML de P e seus erros padrão
apresentados na Tabela 5.5; Testes alternativos de grau único de liberdade para
interação grupo x tempo serão discutidos na Seção 5.5. Para facilitar a interpretação, a
linha de base (semana 0) é escolhida como o nível de referência para o tempo e o grupo
placebo é escolhido como o nível de referência para o grupo de tratamento. De um
exame dos três contrastes de grau único de liberdade para a interação grupo x tempo, os
resultados indicam que as crianças tratadas com succímero têm uma diminuição
perceptivelmente maior nos níveis médios de chumbo no sangue desde o início em
todas as ocasiões quando comparadas às crianças tratadas com placebo. Por exemplo,
quando comparado ao grupo placebo, o grupo succimer tem uma redução adicional de
3.152 / ^ g / dL (com SE = 1.257) nos níveis médios de chumbo no sangue desde o
início até a 6ª semana. dois grupos de tratamento no início do estudo. Por exemplo,
quando comparado ao grupo placebo, o grupo succimer tem uma redução adicional de
11.406 Mg / dL nos níveis médios de chumbo no sangue desde o início até a semana 1.
Acredita-se que o aparente rebote nos níveis de chumbo no sangue após a semana 1 no
grupo succimer seja devido ao chumbo que é armazenado nos ossos que estão sendo
mobilizados, resultando em um novo equilíbrio nos níveis de chumbo no sangue nas
crianças tratadas com succímero

Lembramos ao leitor que nosso aviso anterior sobre o teste de efeitos principais na
presença de interações se aplica também aos resultados da Tabela 5.5. Por exemplo, o
teste do efeito principal do grupo na Tabela 5.5 (Z = 0.27) não compara a resposta
média (por vezes) nos grupos succímero e placebo; em vez disso, compara a resposta
média no início (aqui o nível de referência para o tempo) nos dois grupos de
tratamento. A falta de equivalência entre os testes para o efeito principal do grupo nas
Tabelas 5.4 e 5.5 é uma conseqüência direta da parametrização do grupo de referência
adotada aqui (e comumente usada por muitos pacotes de software estatísticos, por
exemplo, PROC MIXED no SAS).

Finalmente, porque os dados de TLC são de um estudo randomizado, a resposta média


no início do estudo é independente da designação do tratamento (como foi confirmado
pelo teste não significativo do efeito principal do grupo na Tabela 5.5).Devido à
atribuição aleatória a grupos de tratamento, isso sugere que a análise dos perfis de
resposta poderia ser simplificada pela adaptação de um modelo que omite o efeito
principal do grupo, forçando assim os dois grupos a terem a mesma resposta média no
início do estudo. Nas Seções 5.6 e 5.7, consideramos os méritos de tal ajuste e
comparamos e contrastamos estratégias alternativas para lidar com a resposta da linha
de base em diferentes configurações. Nessas seções, destacamos como a análise de
perfis de resposta é um método flexível que pode ser facilmente adaptado para levar em
consideração o design do estudo e abordar questões que são cientificamente relevantes
para qualquer estudo em particular.

TESTES DE UM GRAU DE LIBERDADE PARA GRUPO POR TEMPO


INTERAÇÃO

Como vimos na seção anterior, o teste da interação grupo x tempo é bastante geral. Não
há nenhum padrão específico para a diferença nos perfis de resposta entre os grupos.
Essa falta de especificidade torna-se um problema em estudos com grande número de
ocasiões de mensuração, pois o teste geral para interação grupo x tempo, com (G -1) x
(n -1) graus de liberdade, torna-se menos sensível a uma interação com um padrão
específico à medida que n aumenta. Mesmo com apenas três ou quatro ocasiões de
medição, o teste geral para interação não será tão sensível a desvios específicos do
paralelismo quanto os testes mais focados que discutiremos nesta seção. No típico
ensaio randomizado de intervenções, os indivíduos são randomizados para os grupos de
intervenção no início do estudo e o investigador procura determinar se o padrão de
resposta após a randomização difere entre os grupos. A randomização implica que a
média no início do estudo é independente do grupo de tratamento, ou seja, grupos têm a
mesma resposta média no início do estudo. Nesse cenário, os analistas freqüentemente
especificam um único contraste que acredita representar melhor a direção na qual o
padrão de resposta diferirá mais acentuadamente. Por exemplo, se assumirmos a
primeira parametrização descrita na Seção 5.3 com dois grupos e desejarmos testar a
igualdade da diferença entre a resposta média nas ocasiões de 2 a n e o valor da linha de
base nos dois grupos, podemos escolher o contraste

Formula pag. 119

Aqui, L 1 calcula a resposta média das ocasiões de 2 a n e subtrai a resposta média na


linha de base para um único grupo. Este último pode ser considerado como a mudança
média ao longo do intervalo para um único grupo. Assim, L é um contraste de grupo
dessa mudança média nos dois grupos.

Uma variante dessa abordagem, conhecida como Área Abaixo da Linha de Base de
Curva Menos, ou às vezes simplesmente AUC, corresponde a um cálculo da área sob a
curva trapezoidal criada conectando as respostas plotadas nos respectivos pontos
temporais e subtraindo yi x (em -ii ), a área do retângulo de altura yi e largura tn - * i-
Para fins ilustrativos, a AUC do perfil de níveis de chumbo no sangue para um único
indivíduo no ensaio de TLC é mostrada na Figura 5.3. Para este participante, como para
a maioria dos participantes no estudo de TLC, a AUC é negativa porque as respostas
após o início da intervenção são menores do que o valor da linha de base. A AUC (linha
de base negativa) pode ser construída subtraindo-se a média da linha de base, / ii, de
cada uma das médias, Mi por / em, e calculando a área sob o trapézio construída
conectando essas diferenças. Para testar a igualdade da AUC em dois grupos, emprega-
se o contraste
Formula

e 5 x (tj + i -ij_i) é o valor do vetor de contraste para pontos de tempo diferentes de 1


(linha de base) ou n (a última ocasião). Esses pesos de contraste não são intuitivamente
óbvios, mas podem ser derivados da fórmula para a área de um trapézio. Embora a
curva apresentada na Figura 5.3 sugira que L é aplicado às observações individuais,
devemos enfatizar que os pesos de contraste são aplicados às médias estimadas, e não às
observações individuais. Como resultado, a AUC pode ser estimada na configuração em
que alguns indivíduos têm dados de resposta ausentes. Um terceiro método popular para
construir um teste de grau único de liberdade corresponde a um teste da hipótese de que
a tendência ao longo do tempo é a mesma nos vários grupos de tratamento. Porque este
método é um caso especial de análise de curva de crescimento, a ser discutido em
profundidade no próximo capítulo, e porque o padrão esperado de resposta à terapia de
quelação no estudo TLC não preveria uma tendência linear nos níveis de chumbo no
sangue durante o período de tratamento. o grupo que recebe terapia de succimer, nós
adiamos uma discussão desta abordagem para o Capítulo 6

Área sob a curva, calculada usando a regra


trapezoidal, para o perfil dos níveis de chumbo no sangue para um único indivíduo no
estudo de TLC.

Aplicação ao tratamento de crianças expostas a chumbo

Como o estudo TLC mediu os níveis de chumbo no sangue em quatro momentos


durante o primeiro período de tratamento, o vetor que representa o contraste baseado na
resposta média nos momentos 2 a n menos linha de base é dado por

Formula
Para os dados exibidos na Figura 53, a mudança na resposta média em relação à linha de
base é de –5,0. Como os níveis de chumbo no sangue diminuíram para este assunto,
como para a maioria dos participantes no estudo de TLC, a resposta média em relação à
linha de base é negativa. A partir da estatística descritiva na Tabela 5.6, podemos
facilmente determinar que o valor médio da resposta média menos a linha de base é —
9,90 no grupo succímero e -2,17 no grupo placebo. Assim, se assumirmos a primeira
parametrização descrita na Seção 5.3, então LJ3 = 7.73 e o valor da estatística de teste
de Wald é Z = 8.21 (ou W2 = 67.4, com

um grau de liberdade), indicando uma diferença altamente significativa no padrão de


resposta entre os grupos de tratamento. Da mesma forma, como os pontos temporais no
ensaio de TLC foram 0, 1,4 e 6 semanas, o contraste para comparar a AUC (linha de
base menos) nos dois grou ps de tratamento é dado por

L = (-L2,L2) = (5.5, -2, -2.5, -1, -5.5, 2, 2.5, 1).

Uma vez que os dados do ensaio TLC fornecem evidência inequívoca de um efeito de
succimer no nível de chumbo no sangue, a sensibilidade adicionada aos efeitos do
tratamento alcançados pela maior especificidade de um teste de um grau de liberdade
não é importante nesta aplicação. Em muitas aplicações, no entanto, o teste de um grau
de liberdade será estatisticamente significativo quando o teste geral para a interação
grupo x tempo não for. Para aplicação válida de níveis de significância convencionais,
no entanto, a forma do contraste deve ser especificada antes da análise dos dados. Caso
contrário, correria o risco de buscar o melhor contraste e testar seu significado como se
tivesse sido escolhido antecipadamente. Para se proteger contra essa crítica, os
protocolos para ensaios randomizados geralmente especificam a forma do contraste.
Esse requisito destaca um risco de testes de um grau de liberdade. A sensibilidade
adicional vem com o preço da generalidade reduzida. Se a diferença entre grupos de
tratamento toma uma forma bastante diferente do padrão previsto pelo contraste, pode-
se não obter um resultado estatisticamente significativo para um teste de um grau de
liberdade, mesmo quando o teste global para interação grupo x tempo é estatisticamente
significativo. Assim, testes de um grau de liberdade devem ser empregados somente
quando houver informação prévia suficiente para especificar o contraste com confiança.

CAP:06

No capítulo anterior, descrevemos uma abordagem para modelar dados longitudinais


que efetivamente não impunham nenhuma estrutura sobre a tendência de resposta média
subjacente ao longo do tempo. Esta abordagem tem algum apelo quando todos os
indivíduos são medidos no mesmo conjunto de ocasiões e o número de ocasiões de
medição é relativamente pequeno (por exemplo, não mais do que 4 ou 5). Mas à medida
que o número de ocasiões aumenta e / ou quando as medidas repetidas são irregulares, a
análise dos perfis de resposta torna-se muito menos atraente. Mesmo nos casos em que
o número de medidas repetidas é relativamente pequeno, há duas desvantagens óbvias
da análise de perfis de resposta que limitam sua utilidade para a análise de dados
longitudinais. A primeira é que um teste estatístico da hipótese nula de nenhuma
interação grupo x tempo é um teste omnibus ou global e fornece apenas uma ampla
avaliação se os perfis médios de resposta são os mesmos nos diferentes grupos. Se a
hipótese nula for rejeitada, isso não indica as formas específicas em que os perfis
médios de resposta diferem. Como resultado, análises adicionais são invariavelmente
necessárias. Em segundo lugar, ignorando completamente a ordenação temporal das
medições repetidas, a análise dos perfis de resposta não reconhece que eles podem ser
considerados como observações de algum processo contínuo de resposta subjacente ao
longo do tempo. A resposta média ao longo do tempo pode muito frequentemente ser
descrita por curvas paramétricas relativamente simples (por exemplo, lineares ou
quadráticas) ou semi-paramétricas (por exemplo, linearmente lineares). De um ponto de
vista puramente substantivo, é improvável que o padrão de mudança na resposta média
ao longo da duração de um estudo longitudinal seja tão complicado que sua descrição
exija tantos parâmetros quanto há ocasiões de medição. A análise dos perfis de resposta
usa um modelo saturado para a resposta média sobretempo, e, assim, produz um ajuste
perfeito para o perfil médio de resposta observado. À primeira vista, isso pode parecer
uma característica desejável de qualquer abordagem analítica; ou seja, que se encaixa
bem as respostas médias observadas. (Na verdade, não apenas bem, mas perfeitamente!)
No entanto, ao fazê-lo, o método falha em descrever os aspectos mais salientes das
mudanças na resposta média ao longo do tempo em termos de algum padrão que pode
receber uma interpretação substantiva ou teórica. . Em resumo, na análise dos perfis de
resposta não há redução na complexidade. Em contraste, o ajuste de curvas paramétricas
ou semi-paramétricas a dados longitudinais pode ser justificado tanto em termos
substantivos quanto estatísticos. Substancialmente, em muitos estudos longitudinais, o
verdadeiro processo subjacente de resposta média é provável que mude com o tempo
em um padrão relativamente suave, crescente ou decrescente, pelo menos durante a
duração do estudo. Como resultado, curvas paramétricas ou semi-paramétricas simples
podem ser usadas para descrever como a resposta média muda ao longo do tempo. Do
ponto de vista estatístico, o ajuste de modelos parcimoniosos para a resposta média
resultará em testes estatísticos de efeitos covariáveis (por exemplo, interações
tratamento x tempo) que têm maior poder do que em uma análise de perfis de resposta.
A razão para o maior poder é que os testes de efeitos covariáveis se concentram apenas
em uma faixa relativamente estreita de hipóteses alternativas. Em contraste, as
estatísticas de teste na análise dos perfis de resposta dispersam seu poder sobre uma
gama de hipóteses alternativas muito mais ampla, mas em muitos casos menos
substancial ou plausível ou relevante. Por exemplo, quando as tendências na resposta
média ao longo do tempo são assumidas como lineares, e uma tendência linear fornece
uma aproximação razoável da verdadeira forma subjacente do perfil médio de resposta,
os testes resultantes de tendências temporais e efeitos covariáveis terão maior poder do
que os testes globais em uma análise de perfis de resposta. Note, no entanto, que os
testes baseados em curvas paramétricas serão apenas mais poderosos na detecção de
mudanças na resposta média que exibem uma tendência linear. Eles não serão mais
poderosos, no entanto, se a forma subjacente da resposta média ao longo do tempo for
em forma de U, ao invés de linear. Finalmente, as curvas paramétricas simples fornecem
uma descrição parcimoniosa das mudanças na resposta média ao longo do tempo em
termos de um número relativamente pequeno de parâmetros. Os resultados podem ser
comunicados facilmente a investigadores e pesquisadores empíricos. Nas duas seções a
seguir, descrevemos duas abordagens amplas para descrever padrões de mudança na
resposta média ao longo do tempo: tendências polinomiais e splines lineares.

Ensaios clínicos e estudos observacionais são os principais tipos de delineamentos


presentes nesses estudos. Quando um experimento é realizado em laboratório são
analisando pacientes como objeto de investigação, esse procedimento caracteriza um
ensaio clínico, a fim de evitar possíveis variações que interferem nas comparações entre
os grupos ou indivíduis analisados, a escolha dos pacientes é realizada de maneira
minuciosa, utilizando o processo de randomização.

Por outro lado, estudos observacionais , são realizados de forma longitudinal ou


transversal. Uma caracteristica predominante é que não provem de um experimento,
pois não há influência do pesquisador, as informações são colhidas de forma
sistemática, acarretando em conclusão causal.
Cap 8

Pag 212

somente uma única observação não fornece informações diretamente sobre mudanças
longitudinais ou intraindividuais ao longo do tempo, suas observações em uma única
ocasião contribuem para a análise (por exemplo, essas observações contribuem com
informações para a estimativa de variâncias e efeitos entre indivíduos). Os dados para
quatro meninas selecionadas são apresentados na Tabela 8.1. O exame da Tabela 8.1
revela que os dados tr: se são inerentemente desequilibrados com o passar do tempo, e o
grau de desequilíbrio é ainda mais acentuado quando o filho da criança é usado como o
metamômetro para o tempo. Ou seja, neste conjunto de dados, as crianças entram no
estudo em diferentes idades e também têm diferentes ocasiões de medição. A Figura 8.4
exibe um gráfico de tempo, com segmentos de linha unidos, de logtFEVi / height)
versus idade para 50 meninas selecionadas aleatoriamente.

Você também pode gostar