Escolar Documentos
Profissional Documentos
Cultura Documentos
Resumo Baseline
Resumo Baseline
A baseline também pode ter outro papel. Ela pode ser restrita a um intervalo e apenas
sujeitos com valor menor ou maior que determinado limiar são incluídos no estudo. Em
estudos observacionais de crescimento ou declínio, grupos podem ser conhecidos por
diferirem na baseline ou a comparação de grupos pode ser selecionada de forma que as
médias na baseline sejam comparáveis.
Então, como lidar com medidas de referência na avaliação de uma mudança (ex:
redução da PA)? Isso é importante, pois afeta a construção de TH e como eles devem
ser interpretados.
1) os perfis de resposta médios são similares nos grupos, i.e., os perfis são paralelos?
2) Assumindo que os perfis são paralelos, as médias são constantes ao longo do tempo?
3) assumindo que os perfis de respostas são paralelos, eles são os mesmos para os dois
grupos?
Ver exemplo na tabela 5.1. Ela mostra a hipótese de perfis paralelos, que está sendo
testada. Mas, a menos que esse teste tenha 1 grau de liberdade, ele não ajuda a
identificar de que maneira os padrões de mudança ao longo do tempo diferem entre os
grupos. Para isso, precisamos considerar estimativas (e erros padrão) de contrastes
relevantes de médias.
Para os dois testes (com 1 g.l.) descritos na seção anterior, a estatística resumo
corresponde a subtrair o valor da baseline (ocasião 1) de um resumo de respostas nas
ocasiões 2 a n. Por exemplo, para o teste de igualdade de resposta média menos a
baseline, a estatística resumo para o i-ésimo participante é (5.1):
𝑌 ∗𝑖 = 𝛽0 + 𝛽2 𝑌𝑖1 + 𝛽3 𝑇 + 𝑒 ∗𝑖
em que
Testes baseados nos dois procedimento acima correspondem à comparação entre dois
grupos de respostas médias nas ocasiões de 2 a n, ajustados para a baseline, e tem G-1
g.l. independente do número de ocasiões (sessões) medidas.
Surge, então, a questão sobre incorporar a baseline através de contraste ou como uma
covariável no modelo. A resposta depende se o estudo é observacional ou aleatorizado.
Em resumo, a escolha entre os dois métodos de ajuste para a baseline deve levar em
conta o delineamento do estudo longitudinal e a questão de pesquisa de interesse. A
análise que subtrai a resposta baseline é apropriada quando o principal objetivo do
estudo é comparar populações distintas em termos de mudança média ao longo do
tempo. Ex: “As populações diferem em termos de mudança média?” e é apropriado para
estudos observacionais ou aleatorizados. Por outro lado, a ANCOVA, em geral, é
apropriada apenas em estudos aleatorizados ou quando as distribuições das populações
das respostas baseline podem ser assumidas iguais. Se as populações na baseline são
iguais, faz sentido a pergunta: “A mudança esperada é a mesma nos grupos, quando
comparamos indivíduos com a mesma resposta baseline?”. Concluindo, o delineamento
do estudo e a questão científica que devem determinar qual método será usado para
ajustar a baseline, e não questões de precisão e poder estatístico.
Na seção anterior consideramos dois métodos de ajuste para a baseline em uma situação
relativamente simples. Essa noção pode ser estendida para casos mais gerais. Nessa
seção comparamos várias estratégias para lidar com a baseline e fazemos
recomendações sobre as mais adequadas em diferentes situações.
Agora cada uma dessas abordagens serão discutidas e ilustradas com os dados do ensaio
TLC.
A segunda estratégia corresponde a uma análise de perfis onde as médias dos grupos nas
baselines são assumidas iguais. Em um ensaio aleatorizado, em que a alocação dos
tratamentos é aleatória, ambas as estratégias produzem válidas estimativas, mas a
segunda é em geral mais poderosa. Então, em ensaios aleatórios ou estudos
observacionais em que há uma boa razão para assumir que os grupos têm a mesma
resposta média na baseline, a segunda estratégia é a preferida e deve ser usada. Por
outro lado, em estudos observacionais em que não há uma razão a priori para asusmir
que os grupos têm a mesma resposta média na baseline, a segunda estratégia não é
apropriada e apenas a primeira deve ser usada.
Na análise dos dados do ensaio TLC, a primeira estratégia foi apresentada nas tabelas
5.4 e 5.5. A segunda estratégia pode ser implementada excluindo o efeito principal de
tratamento do modelo. Esse modelo não é usual, pois contem uma interação grupo x
tempo, mas não tem efeito principal de grupo. Esse modelo parece contradizer a
“convenção” de que interações não devem ser incluídas em um modelo de regressão
sem os efeitos principais. No entanto essa é uma importante exceção à regra. Já que a
baseline foi escolhida como o nível de referência para tempo, a exclusão do efeito
principal de grupo força os dois grupos a terem a mesma resposta média na baseline. Os
resultados são apresentados na tabela 5.7 e são qualitativamente similares aos da tabela
5.5. VER COMENTÁRIOS SOBRE O TESTE DE WALD NAS DUAS
ABORDAGENS.
A terceira e quarta estratégias não retêm a resposta baseline como parte do vetor de
respostas. Em vez disso, elas focam nas mudanças brutas e ajustadas em relação à
baseline. A terceira estratégia é subtrair a resposta baseline das outras respostas e
analisar as diferenças em relação à baseline. Essa diferenças são escores de mudanças
brutos. Com respostas nas n ocasiões, o vetor (n - 1) x 1 de escores de mudanças brutos
é:
e uma análise de perfis é conduzida com 𝐷𝑖 como sendo o vetor de respostas. Já que a
resposta é “mudança em relação à baseline”, essa abordagem altera a interpretação dos
testes para todos os três efeitos. O teste para a interação grupo x tempo é um teste para
perfis paralelos para as mudanças em relação à baseline na resposta média a partir da
ocasião 2; o teste para efeito de grupo testa se as mudanças a partir da baseline na
ocasião 2 são as mesmas entre os grupos (assumindo que a ocasião 2 é o nível de
referência para tempo). Então, para responder a questão sobre se os padrões de mudança
ao longo do tempo são os mesmos para os grupos, o teste na terceira estratégia precisa
ser modificado. Seria um teste conjunto que combina o efeito principal de grupo e o
efeito de interação. Esse teste é equivalente ao teste de interação na primeira estratégia.
Ambas as estratégias produzem testes idênticos e mesmas estimativas dos efeitos.
Então, a terceira estratégia não oferece nenhum ganho em eficiência. Apesar de ambas
produzirem os mesmos resultados, a primeira é recomendada por facilidade de
realização dos testes e por ter uma estratégia melhor para lidar com dados ausentes.
e a resposta baseline, 𝑌𝑖1 , é tratada como uma covariável. A análise corresponde a uma
ANCOVA. Essa estratégia é apropriada para lidar com baseline em ensaios
aleatorizados. Por causa da aleatorização, as hipóteses de igualdade das médias
condicionais da resposta nas ocasiões 2 a n, dada a repsosta na baseline, implicam
hipóteses de igualdade de médias não condicionais da resposta nas ocasiões 2 a n. Essa
estratégia (4) também é apropriada para estudos observacionais quando há uma boa
razão para assumir que os grupos têm a mesma resposta média na baseline. Mas não
deve ser usada, no entanto, em estudos observacionais em que não há uma razão a priori
para assumir que os grupos têm as mesmas médias na baseline.
Fato interessante é que essa estratégia pode ser implementada conduzindo a análise nos
perfis de respostas (𝑌𝑖1 , como covariável) tanto nas respostas pós-baseline quanto nos
escores de mudança pós-baseline. As estimativas são idênticas. As análises diferem
apenas em relação ao slope estimado para 𝑌𝑖1 . Graças a essa equivalência, a quarta
análise é chamada “escores de mudanças ajustados” (i.e., diferenças ajustadas para 𝑌𝑖1 ).
Vimos que há diferentes maneiras de lidar com medidas baseline. Dois métodos que
retêm a baseline como parte da resposta são equivalentes às estratégias correspondentes
que restringem o vetor de respostas a medidas pós-baseline. As duas primeiras
estratégias são as melhores e diferem em termos de eficiência e a escolha por uma delas
deve ser guiada pelo delineamento experimental.
Por outro lado, estudos observacionais não provem de um experimento, pois não há
intervenção do pesquisador, sendo assim, as informações são colhidas de forma
sistemática, acarretando em conclusão causal, esses estudos são caracterizados como
longitudinal ou transversal.
E(Yi| Xi)=mi=Xbeta
(...)
Para avaliar como os grupos diferem, devemos olhar para as estimativas de REML dos
betas e seus erros padrão. A medida baseline é usada como nível de referência para
tempo e o grupo placebo é usado como nível de referência para grupo. Ver
interpretações ao final da página 117!
TRADUCAO
Os testes dos principais efeitos do grupo e do tempo na Tabela 5.4 não são
significativos, por duas razões bem diferentes. Primeiro, os dados de TLC
são de um ensaio randomizado e o teste do efeito principal do tempo não é
de interesse do assunto enquanto o teste do efeito principal do grupo é
incluído no teste de interação grupo x tempo. Em segundo lugar, em geral,
os testes dos principais efeitos do tempo e do grupo na Tabela 5.4 não são
significativos na presença de uma interação significativa grupo x tempo. Isso
ressalta nosso conselho anterior de que testes de efeitos principais devem
ser considerados apenas quando a suposição de perfis de resposta
paralelos for sustentável. Quando os perfis são paralelos, e há interesse
científico nos principais efeitos do tempo e / ou grupo, os testes dos
principais efeitos do tempo e do grupo exigem que o modelo seja reajustado
aos dados, excluindo a interação grupo x tempo . Os testes de Wald
resultantes para os principais efeitos deste modelo reduzido têm as
interpretações desejadas.
Até agora, nossa análise dos perfis de resposta forneceu um teste coletivo da interação
grupo x tempo. No entanto, a menos que o teste da interação grupo x tempo tenha
apenas um único grau de liberdade, esse teste não indica como os dois grupos diferem.
Para este último, devemos considerar as estimativas REML de P e seus erros padrão
apresentados na Tabela 5.5; Testes alternativos de grau único de liberdade para
interação grupo x tempo serão discutidos na Seção 5.5. Para facilitar a interpretação, a
linha de base (semana 0) é escolhida como o nível de referência para o tempo e o grupo
placebo é escolhido como o nível de referência para o grupo de tratamento. De um
exame dos três contrastes de grau único de liberdade para a interação grupo x tempo, os
resultados indicam que as crianças tratadas com succímero têm uma diminuição
perceptível nos níveis médios de chumbo no sangue desde o início em todas as ocasiões
quando comparadas às crianças tratadas com placebo. Por exemplo, quando comparado
ao grupo placebo, o grupo succimer tem uma redução adicional de 3.152 / ^ g / dL (com
SE = 1.257) nos níveis médios de chumbo no sangue desde o início até a 6ª semana.
dois grupos de tratamento no início do estudo. Por exemplo, quando comparado ao
grupo placebo, o grupo succimer tem uma redução adicional de 11.406 Mg / dL nos
níveis médios de chumbo no sangue desde o início até a semana 1. Acredita-se que o
aparente rebote nos níveis de chumbo no sangue após a semana 1 no grupo succimer
seja devido ao chumbo que é armazenado nos ossos que estão sendo mobilizados,
resultando em um novo equilíbrio nos níveis de chumbo no sangue nas crianças tratadas
com succímero.
Lembramos ao leitor que nosso aviso anterior sobre o teste de efeitos principais na
presença de interações se aplica também aos resultados da Tabela 5.5. Por exemplo, o
teste do efeito principal do grupo na Tabela 5.5 (Z = 0.27) não compara a resposta
média (por vezes) nos grupos succímero e placebo; em vez disso, compara a resposta
média no início (aqui o nível de referência para o tempo) nos dois grupos de tratamento.
A falta de equivalência entre os testes para o efeito principal do grupo nas Tabelas 5.4 e
5.5 é uma conseqüência direta da parametrização do grupo de referência adotada aqui (e
comumente usada por muitos pacotes de software estatísticos, por exemplo, PROC
MIXED no SAS).
O teste para a interação grupo x tempo é muito geral, não especifica um padrão nos
perfis de respostas entre os grupos. Essa falta de especificidade é um problema em
estudos em que há um grande número de ocasiões de medidas ao longo do tempo (ex.
muitas sessões) porque o teste geral de interação fica menos sensível a medida que n
aumenta. Ele não será sensível para detectar desvios da hipótese de paralelismo.
Alternativa: área abaixo da curva menos a baseline ou, simplesmente, AUC. (Pesquisar
sobre...ver se ainda é usado).
Esse tipo de teste é útil quando não conseguimos detectar efeito significativo para a
interação grupo X tempo.
Pa.104
A seguir, ilustramos as principais ideias, realizando uma análise dos perfis de resposta
dos dados de chumbo no sangue das 100 crianças dos grupos de succimer e placebo do
Estudo de Tratamento de Crianças Expostas a Chumbo (TLC).
Lembre-se que o estudo de TLC foi um ensaio randomizado controlado com placebo de
um agente quelante administrado oralmente, succimer, em crianças com níveis de
chumbo no sangue confirmados de 20-44 fj, ° / dL. As crianças do ensaio tinham entre
12 e 33 meses e viviam em um estado de deterioração da cidade. A análise a seguir é
baseada em dados sobre os níveis de chumbo no sangue no início (ou semana 0),
semana 1, semana 4 e semana 6 durante o primeiro período de tratamento. Os perfis
médios de resposta para os dois grupos foram exibidos na Figura 5.1. Na Tabela 5.3, as
estimativas de REML dos componentes da matriz de covariância não estruturada são
exibidas. Observe o aumento perceptível na variabilidade nos níveis de chumbo no
sangue da pré para a pós-randomização. Este aumento na variabilidade da linha de base
é provavelmente devido a dois fatores. Primeiro, dentro de cada grupo de tratamento,
pode haver heterogeneidade natural nas trajetórias individuais de resposta ao longo do
tempo. Segundo, o estudo teve um critério de inclusão de que os níveis de chumbo no
sangue no início do estudo estavam na faixa de 20-44 // g / dL; isso pode parcialmente
explicar a menor variação na linha de base. Na Tabela 5.4, os resultados da análise dos
perfis de resposta são apresentados. O interesse principal está no teste da interação
grupo x tempo. O teste da interação grupo x tempo é baseado em um teste de Wald
multivariado. O teste fornece um teste simultâneo de Ho: LP = 0 versus H4: LP ^ 0,
para uma escolha adequada de L, e a estatística de teste pode ser construída como e
comparada a uma distribuição x2 com graus de liberdade iguais ao número de linhas O
teste da razão de verossimilhança correspondente poderia ser construído e exigiria a
comparação da log-verossimilhança ML maximizada para dois modelos, um modelo
que incorpora a restrição que L = 0 (ou seja, o modelo sem interação grupo x tempo) , o
outro modelo sem restrições (ou seja, o modelo com interação grupo x tempo). No TLC.
julgamento a questão do interesse científico principal diz respeito à comparação dos
dois grupos de tratamento em termos de seus padrões de mudança da linha de base nos
níveis médios de chumbo no sangue. Esta questão se traduz diretamente em um teste da
interação grupo x tempo. Na Tabela 5.4, o teste da interação grupo x tempo produz uma
estatística de Wald de 107,79 com 3 graus de liberdade (o teste da razão de
verossimilhança correspondente rende G2 = 74,2). Quando comparada com a
distribuição qui-quadrado de referência com 3 graus de liberdade, há fortes evidências
para rejeitar a hipótese nula e concluir que os padrões de mudança da linha de base não
são os mesmos nos dois grupos. Dado o padrão de respostas observadas (ver Figura
5.1), esse resultado é esperado. Os testes dos principais efeitos do grupo e do tempo na
Tabela 5.4 não são significativos, por duas razões bem diferentes. Primeiro, os dados de
TLC são de um ensaio randomizado e o teste do efeito principal do tempo não é de
interesse do assunto enquanto o teste do efeito principal do grupo é incluído no teste de
interação grupo x tempo. Em segundo lugar, em geral, os testes dos principais efeitos do
tempo e do grupo na Tabela 5.4 não são significativos na presença de uma interação
significativa grupo x tempo. Isso ressalta nosso conselho anterior de que testes de
efeitos principais devem ser considerados apenas quando a suposição de perfis de
resposta paralelos for sustentável. Quando os perfis são paralelos, e há interesse
científico nos principais efeitos do tempo e / ou grupo, os testes dos principais efeitos
do tempo e do grupo exigem que o modelo seja reajustado aos dados, excluindo a
interação grupo x tempo . Os testes de Wald resultantes para os principais efeitos deste
modelo reduzido têm as interpretações desejadas.
Até agora, nossa análise dos perfis de resposta forneceu um teste coletivo da interação
grupo x tempo. No entanto, a menos que o teste da interação grupo x tempo tenha
apenas um único grau de liberdade, esse teste não indica como os dois grupos diferem.
Para este último, devemos considerar as estimativas REML de P e seus erros padrão
apresentados na Tabela 5.5; Testes alternativos de grau único de liberdade para
interação grupo x tempo serão discutidos na Seção 5.5. Para facilitar a interpretação, a
linha de base (semana 0) é escolhida como o nível de referência para o tempo e o grupo
placebo é escolhido como o nível de referência para o grupo de tratamento. De um
exame dos três contrastes de grau único de liberdade para a interação grupo x tempo, os
resultados indicam que as crianças tratadas com succímero têm uma diminuição
perceptivelmente maior nos níveis médios de chumbo no sangue desde o início em
todas as ocasiões quando comparadas às crianças tratadas com placebo. Por exemplo,
quando comparado ao grupo placebo, o grupo succimer tem uma redução adicional de
3.152 / ^ g / dL (com SE = 1.257) nos níveis médios de chumbo no sangue desde o
início até a 6ª semana. dois grupos de tratamento no início do estudo. Por exemplo,
quando comparado ao grupo placebo, o grupo succimer tem uma redução adicional de
11.406 Mg / dL nos níveis médios de chumbo no sangue desde o início até a semana 1.
Acredita-se que o aparente rebote nos níveis de chumbo no sangue após a semana 1 no
grupo succimer seja devido ao chumbo que é armazenado nos ossos que estão sendo
mobilizados, resultando em um novo equilíbrio nos níveis de chumbo no sangue nas
crianças tratadas com succímero
Lembramos ao leitor que nosso aviso anterior sobre o teste de efeitos principais na
presença de interações se aplica também aos resultados da Tabela 5.5. Por exemplo, o
teste do efeito principal do grupo na Tabela 5.5 (Z = 0.27) não compara a resposta
média (por vezes) nos grupos succímero e placebo; em vez disso, compara a resposta
média no início (aqui o nível de referência para o tempo) nos dois grupos de
tratamento. A falta de equivalência entre os testes para o efeito principal do grupo nas
Tabelas 5.4 e 5.5 é uma conseqüência direta da parametrização do grupo de referência
adotada aqui (e comumente usada por muitos pacotes de software estatísticos, por
exemplo, PROC MIXED no SAS).
Como vimos na seção anterior, o teste da interação grupo x tempo é bastante geral. Não
há nenhum padrão específico para a diferença nos perfis de resposta entre os grupos.
Essa falta de especificidade torna-se um problema em estudos com grande número de
ocasiões de mensuração, pois o teste geral para interação grupo x tempo, com (G -1) x
(n -1) graus de liberdade, torna-se menos sensível a uma interação com um padrão
específico à medida que n aumenta. Mesmo com apenas três ou quatro ocasiões de
medição, o teste geral para interação não será tão sensível a desvios específicos do
paralelismo quanto os testes mais focados que discutiremos nesta seção. No típico
ensaio randomizado de intervenções, os indivíduos são randomizados para os grupos de
intervenção no início do estudo e o investigador procura determinar se o padrão de
resposta após a randomização difere entre os grupos. A randomização implica que a
média no início do estudo é independente do grupo de tratamento, ou seja, grupos têm a
mesma resposta média no início do estudo. Nesse cenário, os analistas freqüentemente
especificam um único contraste que acredita representar melhor a direção na qual o
padrão de resposta diferirá mais acentuadamente. Por exemplo, se assumirmos a
primeira parametrização descrita na Seção 5.3 com dois grupos e desejarmos testar a
igualdade da diferença entre a resposta média nas ocasiões de 2 a n e o valor da linha de
base nos dois grupos, podemos escolher o contraste
Uma variante dessa abordagem, conhecida como Área Abaixo da Linha de Base de
Curva Menos, ou às vezes simplesmente AUC, corresponde a um cálculo da área sob a
curva trapezoidal criada conectando as respostas plotadas nos respectivos pontos
temporais e subtraindo yi x (em -ii ), a área do retângulo de altura yi e largura tn - * i-
Para fins ilustrativos, a AUC do perfil de níveis de chumbo no sangue para um único
indivíduo no ensaio de TLC é mostrada na Figura 5.3. Para este participante, como para
a maioria dos participantes no estudo de TLC, a AUC é negativa porque as respostas
após o início da intervenção são menores do que o valor da linha de base. A AUC (linha
de base negativa) pode ser construída subtraindo-se a média da linha de base, / ii, de
cada uma das médias, Mi por / em, e calculando a área sob o trapézio construída
conectando essas diferenças. Para testar a igualdade da AUC em dois grupos, emprega-
se o contraste
Formula
Formula
Para os dados exibidos na Figura 53, a mudança na resposta média em relação à linha de
base é de –5,0. Como os níveis de chumbo no sangue diminuíram para este assunto,
como para a maioria dos participantes no estudo de TLC, a resposta média em relação à
linha de base é negativa. A partir da estatística descritiva na Tabela 5.6, podemos
facilmente determinar que o valor médio da resposta média menos a linha de base é —
9,90 no grupo succímero e -2,17 no grupo placebo. Assim, se assumirmos a primeira
parametrização descrita na Seção 5.3, então LJ3 = 7.73 e o valor da estatística de teste
de Wald é Z = 8.21 (ou W2 = 67.4, com
Uma vez que os dados do ensaio TLC fornecem evidência inequívoca de um efeito de
succimer no nível de chumbo no sangue, a sensibilidade adicionada aos efeitos do
tratamento alcançados pela maior especificidade de um teste de um grau de liberdade
não é importante nesta aplicação. Em muitas aplicações, no entanto, o teste de um grau
de liberdade será estatisticamente significativo quando o teste geral para a interação
grupo x tempo não for. Para aplicação válida de níveis de significância convencionais,
no entanto, a forma do contraste deve ser especificada antes da análise dos dados. Caso
contrário, correria o risco de buscar o melhor contraste e testar seu significado como se
tivesse sido escolhido antecipadamente. Para se proteger contra essa crítica, os
protocolos para ensaios randomizados geralmente especificam a forma do contraste.
Esse requisito destaca um risco de testes de um grau de liberdade. A sensibilidade
adicional vem com o preço da generalidade reduzida. Se a diferença entre grupos de
tratamento toma uma forma bastante diferente do padrão previsto pelo contraste, pode-
se não obter um resultado estatisticamente significativo para um teste de um grau de
liberdade, mesmo quando o teste global para interação grupo x tempo é estatisticamente
significativo. Assim, testes de um grau de liberdade devem ser empregados somente
quando houver informação prévia suficiente para especificar o contraste com confiança.
CAP:06
Pag 212
somente uma única observação não fornece informações diretamente sobre mudanças
longitudinais ou intraindividuais ao longo do tempo, suas observações em uma única
ocasião contribuem para a análise (por exemplo, essas observações contribuem com
informações para a estimativa de variâncias e efeitos entre indivíduos). Os dados para
quatro meninas selecionadas são apresentados na Tabela 8.1. O exame da Tabela 8.1
revela que os dados tr: se são inerentemente desequilibrados com o passar do tempo, e o
grau de desequilíbrio é ainda mais acentuado quando o filho da criança é usado como o
metamômetro para o tempo. Ou seja, neste conjunto de dados, as crianças entram no
estudo em diferentes idades e também têm diferentes ocasiões de medição. A Figura 8.4
exibe um gráfico de tempo, com segmentos de linha unidos, de logtFEVi / height)
versus idade para 50 meninas selecionadas aleatoriamente.