Escolar Documentos
Profissional Documentos
Cultura Documentos
1. Causalidade em Epidemiologia 17
1.1. A difı́cil busca da causalidade . . . . . . . . . . . . . . . . . . . . . . . . 17
1.2. A história da terapia hormonal como fator de risco ou de proteção para
doença coronariana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.2.1. Qual a evidência atual? . . . . . . . . . . . . . . . . . . . . . . . 22
4. Estudos observacionais 47
4.1. Caracterı́sticas dos estudos observacionais . . . . . . . . . . . . . . . . . 47
4.2. Pressupostos para identificação do efeito causal . . . . . . . . . . . . . . 48
4.2.1. Intervenções bem definidas . . . . . . . . . . . . . . . . . . . . . 49
4.2.2. Permutabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.2.3. Positividade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.3. Exemplo - aplicação dos pressupostos em estudo observacional . . . . . 52
4.4. Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3
Sumário
4
Sumário
5
Lista de Figuras
2.1. Efeito causal individual - Paciente 1 - João . . . . . . . . . . . . . . . . 27
2.2. Efeito causal individual . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4. Desenho cruzado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.5. Desenho cruzado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.6. Causa e Associação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
7
Lista de Figuras
8
Lista de Figuras
7.10. Viés de colisão pela porta de trás - condicionamento por variável afetada
pela doença e por uma causa da exposição . . . . . . . . . . . . . . . . . 132
7.11. Viés M - Colisor no caminho pela porta dos fundos - condicionamento
por variável afetada por uma causa da exposição e por uma causa da
doença . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
7.12. Viés M - Colisor no caminho pela porta dos fundos - condicionamento
por variável afetada por uma causa da exposição e por uma consequência
de uma causa da doença . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
7.13. Viés de colisão pela porta da frente - variável intermediária afetada pelo
tratamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
7.14. Estrutura Gravata-Borboleta - Colisor/Confundidor no caminho pela
porta dos fundos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
7.15. Fumo materno durante a gravidez e mortalidade infantil . . . . . . . . . 141
9
Lista de Tabelas
1.1. Terapia Hormonal e Doença Coronariana . . . . . . . . . . . . . . . . . 22
11
Lista de Tabelas
12
Introdução
Este livro de Introdução à Inferência Causal em Epidemiologia: uma abordagem gráfica e
contrafatual nasceu a partir da disciplina de Inferência Causal, ministrada no Programa
de Pós-Graduação de Saúde Coletiva, da Universidade Federal do Maranhão, e no
Programa de Pós-Graduação em Epidemiologia, da Escola Nacional de Saúde Pública
(ENSP), Fundação Oswaldo Cruz (FIOCRUZ), Rio de Janeiro.
Ao ministrar esta disciplina percebi a dificuldade de alguns alunos de acessar e
compreender a literatura cientı́fica a respeito do tema. Resolvi, então, aproveitar os
slides, arquivos e exercı́cios que desenvolvi na disciplina para iniciar a redação de um
livro didático, que pudesse servir de apoio à ministração deste conteúdo, de importância
cada vez mais crescente, para os cursos de Epidemiologia e Saúde Pública, a nı́vel de
pós-graduação. Ainda há poucos livros publicados, mesmo em inglês, sobre o assunto e
muitos deles são muito densos para o iniciante. Desta forma, o objetivo deste livro é,
sem perder de vista a abrangência desta área em desenvolvimento, explicar os principais
conceitos e aplicá-los em exemplos concretos de pesquisa.
A redação do livro foi um desafio, pois sua redação ocorreu ao mesmo tempo em
que lutava para compreender conceitos e aplicá-los em situações de pesquisa, nos
projetos e junto aos meus alunos. Espero que o esforço tenha valido a pena e seja
recompensado, levando a um maior aprendizado e utilização destas abordagens em
estudos epidemiológicos.
Este material é dirigido para aqueles que iniciam a compreensão da literatura sobre
inferência causal, numa perspectiva gráfica e contrafatual. Como texto introdutório
contém os fundamentos necessários para a formulação de uma questão bem definida e
focada de pesquisa (estimativa da quantidade alvo). Esta abordagem é mais explanatória
e mais indicada para responder a perguntas do tipo: um determinado tratamento cura
ou controla a doença? Tal exposição é causal? É menos indicada para perguntas mais
exploratórias do tipo: quais as causas de um determinado desfecho?
A partir de uma pergunta bem definida e articulada em termos contrafatuais, o
passo seguinte é construir uma teoria, que possa alicerçar os pressupostos causais para
que a quantidade alvo possa ser estimada. Nesta teoria, é importante a incorporação
de modelos gráficos causais, codificados em um gráfico acı́clico direcionado (DAG). A
partir do DAG, que contém embutidas equações estruturais não paramétricas, será
possı́vel verificar se a quantidade alvo de interesse é identificável a partir das variáveis
coletadas pelo pesquisador, aplicando-se, por exemplo, o critério da porta de trás de
Pearl (2009a).
Nesta abordagem é possı́vel passar da verificação de uma associação para uma
tentativa de avaliação da relação causal. A resposta a questões causais requerem
conhecimento prévio do mecanismo de geração dos dados e não podem ser respondidas
apenas a partir dos dados ou do conhecimento de sua distribuição empı́rica, utilizando-
13
Lista de Tabelas
14
Lista de Tabelas
15
1. Causalidade em Epidemiologia
1.1. A difı́cil busca da causalidade
Desde tempos imemoriais o homem se preocupa em desvendar causalidade. Desde
crianças nos preocupamos em atribuir relações de causa e efeito entre fenômenos
corriqueiros da vida. Percebemos que se abrirmos uma torneira a água jorra e concluı́mos
que a abertura da torneira provocou a saı́da da água. Este é um exemplo de causa
determinı́stica, ou seja, toda vez que ocorrer a causa, fatalmente ocorrerá o efeito
(a não ser, é claro, que haja falta de água na tubulação). Relações de causa e efeito
determinı́sticas são mais fáceis de desvendar e normalmente conseguimos perceber
isto pela experimentação, observando situações do dia a dia. Modelos determinı́sticos
produzem uma solução única.
Entretanto, nem todos os fenômenos obedecem a leis determinı́sticas. Outras vezes
mesmo que o fenômeno tenda a seguir leis determinı́sticas, não temos conhecimento
suficiente para entender este sistema determinı́stico. Pode também ocorrer que um
fenômeno seja provocado por várias causas, estas causas se relacionam entre si e nem
sempre a ocorrência de uma causa é suficiente ou necessária para provocar o efeito.
Há muitos anos os estatı́sticos e epidemiologistas perceberam que na área da saúde a
maioria dos efeitos são produtos de múltiplas causas. Quando há muitas causas atuando
em um fenômeno geralmente as leis determinı́sticas não mais se aplicam. Entretanto,
se percebeu que é possı́vel calcular a probabilidade de ocorrência de um evento, em
função da presença ou da atuação de uma ou de várias causas. Desta forma, modelos
probabilı́sticos ou estocásticos foram construı́dos para tentar prever a ocorrência de
um efeito, dada a ocorrência de uma determinada causa ou de várias causas atuando
em conjunto. No entanto, modelos probabilı́sticos não produzem uma solução única,
mas um intervalo de soluções. A partir da observação destas probabilidades nasceu
a estatı́stica. Foi também percebido que fenômenos com múltiplas causas tendem a
seguir a distribuição normal. Desta forma, a partir do uso do arsenal probabilı́stico é
possı́vel prever a probabilidade de ocorrência de um evento a partir de suas causas ou,
até mesmo, a partir de fatores não causais correlacionados àquele efeito.
Assim, devido a esta complexidade do mundo, não é fácil atribuir causalidade entre
dois eventos. A noção de causa não implica somente predizer eventos, mas explicar
eventos. Podemos prever a partir de correlações mas para atribuir causalidade, X
precisa explicar Y. É muito difı́cil saber se e quando X causa Y. O desenvolvimento
da matemática e da estatı́stica facilitaram este processo de atribuição de causalidade.
Entretanto, a simples observação da ocorrência de associação ou correlação entre X e
Y não é capaz de determinar causalidade. Simplesmente observar que dois fenômenos
estão associados não significa que um seja causa do outro, porque várias situações
17
1. Causalidade em Epidemiologia
18
1.2. A história da terapia hormonal como fator de risco ou de proteção para doença coronariana
coronariana mas parecia, inclusive, aumentar o risco desta doença. Vamos recontar
esta história com maiores detalhes.
Em 1991 foram publicados resultados do seguimento de 10 anos de 48470 mulheres
do Nurse’s Health Study (NHS), que tinham idade de 30 a 63 anos (média em torno
de 53 anos). Estas mulheres estavam usando ou não terapia hormonal (TH) após
a menopausa e não tinham câncer ou doença cardiovascular no inı́cio do estudo.
Comparando-se mulheres que estavam usando TH após a menopausa com outras que
nunca a usaram e ajustando-se o modelo para idade, tabagismo, história familiar
de doença cardiovascular, ı́ndice de massa corporal, uso prévio de anticoncepcionais,
hipertensão, diabetes, colesterolemia e época de nascimento (para se controlar efeito
de coorte) foi estimado um risco relativo de 0,56 (Intervalo de confiança de 95% 0,40-
0,80) (Tabela 1.1). Portanto, a TH foi associada a uma redução de 44% do risco de
doença coronariana. Os autores concluı́ram que a ausência aparente de viés de seleção
ou confundimento sugere efeito causal e que os benefı́cios da TH superam os riscos
observados (aumento de câncer de endométrio e de mama em usuárias de TH), pois
não observaram risco aumentado de acidente vascular cerebral (Stampfer et al., 1991).
Em 1992, foi publicada uma revisão sistemática com metanálise de estudos observa-
cionais. Neste estudo, a estimativa conjunta foi de um risco relativo de 0,65 (Intervalo
de confiança de 95% 0,59-0,71) (Tabela 1.1), sugerindo que a TH está associada a uma
redução de 35% do risco de doença coronariana (Grady et al., 1992).
Entretanto, em 1998, foram publicados os resultados do HERS (Heart and Estro-
gen/Progestin Replacement Trial). Nesse estudo foram incluı́das 2763 mulheres com
doença coronariana, de 44 a 79 anos, com idade média de 67 anos. Foram randomizadas
para receber uma combinação de estrogênio e progesterona ou placebo. Ao final de 4,1
anos de seguimento, analisando-se os resultados segundo a intenção de tratar, o uso
de TH não reduziu o risco de morte por doença coronariana ou de infarto não fatal
(RR=0,99, IC 95% 0,80-1,22) (Tabela 1.1). Quando os autores analisaram os dados
segundo o número de anos após a randomização, observaram um maior risco de eventos
cardiovasculares no primeiro ano de uso da TH (RR=1,52, IC 95% 1,01-2,29), risco
este que decresceu nos anos subsequentes (Tabela 1.1). Entretanto, havia diferenças
importantes na população e no tratamento utilizado, em comparação com o NHS. As
mulheres do HERS eram mais velhas, tinham doença coronariana e tomaram uma
combinação de estrogênio e progesterona, enquanto no NHS elas eram mais jovens,
mais saudáveis e a maioria recebeu apenas estrogênio (Hulley et al., 1998).
Em seguida, em 2002, foram publicados os resultados do ensaio clı́nico controlado
denominado Women’s Health Initiative (WHI). Neste ensaio foram incluı́das 16608 mu-
lheres com idade de 50 a 79 anos, com idade média de 63 anos, que foram randomizadas
para receber uma combinação de estrogênio e progesterona ou placebo. Nesse estudo, a
maioria das mulheres era saudável, pois apenas 7,7% relataram doença coronariana
prévia. O estudo, previsto para durar 8 anos e meio, foi interrompido com 5,2 anos de
seguimento pelo aumento do risco de câncer de mama, detectado em análise interina. Os
resultados da análise por intenção de tratar mostraram um risco aumentado de morte
por doença coronariana ou infarto não fatal (RR=1,29, IC 95% 1,02-1,63) (Tabela
1.1). Os autores concluı́ram que a TH não deve ser utilizada na prevenção primária de
doença coronariana (Rossouw et al., 2002).
19
1. Causalidade em Epidemiologia
20
1.2. A história da terapia hormonal como fator de risco ou de proteção para doença coronariana
Assim, a pergunta dos ensaios clı́nicos era diferente dos estudos observacionais.
Enquanto os estudos experimentais indagaram qual o risco de doença coronariana para
mulheres que iniciam o uso de TH anos após a menopausa, os estudos observacionais
perguntaram se a TH é capaz de prevenir doença coronariana quando iniciada logo após
a menopausa (Taubes, 2007). Este aumento do risco de doença coronariana nos anos
iniciais da TH pode ser explicado pelo maior risco de trombose/isquemia associado
à TH. À medida em que o uso progride, este risco começa a ser contrabalanceado
pela redução dos lipı́dios séricos causado pela TH, quando então esta passa a ter um
papel protetor contra a doença coronariana (Hulley et al., 1998). Entretanto, uma
possibilidade explicativa plausı́vel para este possı́vel efeito protetor da TH a longo
prazo seria viés de sobrevivência, por meio do óbito de suscetı́veis no grupo que recebeu
a TH (Vandenbroucke, 2009).
Em suma, qual a lição que nos fica deste evento da história da epidemiologia? Que
resultados consistentes de vários estudos observacionais podem ser devidos a viés. A
busca da causalidade é difı́cil, mas ela não é impossı́vel tendo como base os estudos
observacionais. Obviamente a atribuição de causalidade é mais fácil por meio de ensaios
clı́nicos, pois a randomização tende a equilibrar os grupos experimental e controle em
relação a confundidores conhecidos e desconhecidos. Por outro lado, nem sempre a
ausência de randomização é a única razão explicativa da discordância entre estudos
experimentais e observacionais. Outra lição é que os desenhos observacionais e experi-
mentais se complementam e que é interessante analisar os estudos observacionais, como
se eles fossem estudos experimentais. Neste livro vamos abordar métodos analı́ticos, nos
quais vamos analisar estudos observacionais como se eles fossem estudos experimentais
fracassados (Imbens and Rubin, 2015).
21
1. Causalidade em Epidemiologia
22
Parte I.
O Modelo de Respostas
Potenciais: abordagem
contrafatual
23
2. O Modelo de Respostas Potenciais
2.1. Respostas Potenciais e Efeito Causal Individual
O modelo de respostas potenciais, também denominado modelo de respostas contra-
fatuais, foi desenvolvido por Rubin (1974), a partir dos trabalhos de Neyman (1923)
e está sistematizado em livro recentemente publicado (Imbens and Rubin, 2015). O
nome resposta potencial vem do fato de que, para se estudar causalidade sem viés, o
mesmo indivı́duo deveria ser submetido a diferentes situações ou tratamentos, às quais
teriam como consequência, várias respostas potenciais. Vejamos o caso mais simples,
no qual tanto o tratamento como o desfecho são dicotômicos. Assumindo-se tratamento
dicotômico (t) e desfecho (D) também dicotômico, teremos duas respostas potenciais
associadas a cada situação de tratamento1 . Representaremos t=12 se o indivı́duo tiver
sido tratado e t=0, se a pessoa não tiver recebido o tratamento). Usaremos D=13
para representar a ocorrência do desfecho e D=0 para significar que o desfecho não
aconteceu.
Teremos então uma situação na qual o indivı́duo foi submetido ao tratamento (Dt=1 ,
leia-se D sob o tratamento, ou seja, o valor do desfecho que teria sido observado na
situação de tratamento) e outra na qual o indivı́duo não recebeu o tratamento (Dt=0 ,
leia-se D sob o não tratamento, ou seja, o valor que o desfecho teria assumido na
situação controle). Em cada uma destas situação, o desfecho pode ocorrer (Dt=1 = 1,
Dt=0 = 1) ou não (Dt=1 = 0, Dt=0 = 0). O efeito causal é, então, calculado a partir da
comparação entre estas duas respostas potenciais, ou seja, (Dt=1 − Dt=0 , se usarmos a
diferença entre as respostas potenciais). Se Dt=1 = Dt=0 , então não há efeito causal.
Se Dt=1 6= Dt=0 , então há efeito causal. Vejamos com mais detalhe estas situações na
tabela 2.1 abaixo:
25
2. O Modelo de Respostas Potenciais
fatual, ou seja, pode ser observada como D (D1 ) 4 . Não sabemos o que teria acontecido
com o indivı́duo que na realidade foi submetido ao tratamento (Dt=1 ) caso ele tivesse
sido colocado no grupo controle D0 5 . Esta situação, não observável, é contrafatual, ou
seja, é contra situações de fato ocorridas, contra o fato. Representa a resposta potencial
que poderia ter acontecido, caso o indivı́duo alocado no grupo de tratamento tivesse
sido colocado no grupo controle. Da mesma forma, na situação em que o participante
não recebeu o tratamento (Dt=0 ) o desfecho pode ter ocorrido (Dt=0 = 1) ou não
(Dt=0 = 0) e, neste caso, a resposta potencial é fatual, ou seja, pode ser observada como
D (D0 ). Não sabemos o que teria ocorrido com o indivı́duo alocado no grupo controle
(Dt=0 ) caso ele tivesse sido tratado D1 . Esta possibilidade também é contrafatual e
não pode ser observada (tabela 2.1). Assim, o problema fundamental da inferência
causal, segundo Holland é que uma das respostas potenciais nunca pode ser observada,
permanecendo ignorada, e, desta forma, nunca se pode calcular o efeito causal individual
(Holland, 1986).
Assim para se calcular o efeito causal sem viés, terı́amos que inicialmente submeter
o indı́viduo ao tratamento, observar a resposta potencial na situação em que a pessoa
foi tratada (Dt=1 ). Esta resposta potencial poderia ter sido 0, se o desfecho não tivesse
ocorrido, ou 1, se o desfecho tivesse ocorrido. Em seguida, terı́amos que voltar no
tempo, ou observar esta mesma pessoa em um universo paralelo na situação em que ela
não tenha sido submetida ao tratamento (Dt=0 ). A resposta potencial nesta situação
poderia ter sido 0 ou 1. A partir da comparação entre estas duas respostas potenciais,
poderı́amos calcular, então, o efeito causal individual.
Como é impossı́vel se voltar no tempo e, até hoje a ciência não descobriu universo
paralelo, o que fazemos na realidade, quando vamos estudar uma determinada relação
causal, é comparar grupos. Comparamos um grupo submetido ao tratamento com outro
grupo não submetido ao tratamento e comparamos as respostas fatuais médias em
cada grupo. Se os grupos forem iguais entre si, conseguiremos calcular o efeito causal
sem viés. Como não observamos as respostas contrafatuais, elas não são consideradas
quando se realiza a estimativa do efeito causal.
Vejamos, agora, um exemplo prático. A nossa hipótese de estudo é se fumar causa
câncer de pulmão. Tomemos João, nosso bonequinho branco (figura 2.1), nosso partici-
pante número 16 . João é fumante. Em nosso estudo de coorte fictı́cio acompanharemos
João por muitos anos, para observar se ele desenvolverá ou não câncer de pulmão.
Assim, João é um indivı́duo exposto ao tabagismo. Se estivéssemos realizando um ensaio
clı́nico João seria um indivı́duo escolhido para o grupo de tratamento7 . Desta forma,
como João foi exposto ou tratado, e a exposição é dicotômica, precisaremos calcular
Dt=1 , ou seja, qual o valor que o desfecho dicotômico teria, se D=1 (se João desenvolver
câncer de pulmão) ou se D=0 (se João não tiver câncer de pulmão), na situação em que
João foi tratado. O tempo se passou e João, infelizmente, após 40 anos de tabagismo,
desenvolveu câncer de pulmão. Portanto, nosso desfecho Dt=1 = 1. Infelizmente, não
4 D1 é uma versão encurtada de Dt=1
5 D0 é uma versão encurtada de Dt=0
6 o subescrito 1 é usado para identificar o participante
7 consideraremos exposição e tratamento como intercambiáveis e representaremos a exposição também
pela letra t
26
2.1. Respostas Potenciais e Efeito Causal Individual
temos como saber o que teria acontecido com João na situação contrafatual na qual ele
não tivesse sido fumante (Dt=0 ).
Agora, vamos supor que foi recentemente inventada uma máquina em que se pode
viajar no tempo. Convidamos João para pegar uma carona no túnel do tempo e ter uma
chance de viver uma nova vida. João desembarcou há exatamente 40 anos atrás, um
pouco antes do instante em que iniciou o hábito de fumar. Nesta nova vida, João não
será fumante e poderemos, então, calcular, o desfecho contrafatual Dt=0 e compará-lo
com o desfecho fatual. Após 40 anos de seguimento, João não desenvolveu câncer de
pulmão nesta sua nova vida, portanto Dt=0 = 0. Para o nosso estudo hipotético, João
contribuirá com uma linha, e será nosso participante número 1. Assim, começamos
a preencher a tabela do nosso estudo (tabela 2.2). João desenvolveu câncer quando
exposto (tratado, Dt=1 = 1 ou D1 = 1) e não desenvolveu câncer quando não exposto
(não tratado, Dt=0 = 0 ou D0 = 0). Como João foi exposto nesta vida, sua situação
fatual está listada na segunda coluna da tabela, sob D1 . Perceba que, no nosso exemplo
imaginário, não haveria situação contrafatual pois, se existisse máquina do tempo, as
duas vidas de João teriam sido, na realidade, fatuais, já que ele teria tido a oportunidade
de viver ambas as vidas.
Nosso estudo hipotético teve também três outros participantes: Raimundo, Maria
e Rosa. Raimundo na vida fatual não era fumante mas, mesmo assim, desenvolveu
câncer de pulmão. Convidamos Raimundo a viajar no túnel do tempo. Nesta nova vida
contrafatual em que Raimundo fumou, ao final de 40 anos ele não teve câncer de pulmão
(figura 2.3(a)). Como Raimundo não era fumante nesta vida, sua situação fatual está
listada na terceira coluna da tabela, sob D0 . Raimundo é o segundo participante do
nosso estudo e seus dados estão compilados na tabela 2.2.
Maria era fumante na vida real, fatual e nesta vida ela teve câncer de pulmão.
Entretanto, após viajar no tempo e viver a outra vida contrafatual, Maria, que não
fumou nesta sua outra vida, mesmo assim, também desenvolveu câncer de pulmão (figura
27
2. O Modelo de Respostas Potenciais
Número Participante D1 D0
1 João 1 0
2 Raimundo 0 1
3 Maria 1 1
4 Rosa 0 0
2.3(b)). Ou seja, tanto quando fumou, quanto quando não fumou, Maria desenvolveu
câncer. Ou seja, tanto na vida fatual quanto na vida contrafatual Maria estava como
que ”predestinada”a ter câncer de pulmão. Os dados desta nossa terceira participante
estão mostrados na tabela 2.2.
Rosa é a nossa quarta participante. Na vida real Rosa não era fumante e não
desenvolveu câncer de pulmão. Entretanto, após viajar no tempo e viver sua outra vida
contrafatual, na qual fumou, também não desenvolveu câncer de pulmão. Parece que
Rosa é imune ao câncer de pulmão. Tanto na vida real, em que ela fumou, como na
vida contrafatual hipotética, em que ela não fumou, ela não teve câncer de pulmão
(figura 2.3(c). Os dados desta nossa quarta participante estão compilados na tabela 2.2.
Retornemos, agora à tabela 2.2. Nesta tabela vemos que para João, ocorreu efeito
causal, ou seja, o hábito de fumar foi a causa do seu câncer de pulmão. Tanto para
Maria como para Rosa, o tabagismo não influenciou no câncer de pulmão, pois, tanto
na situação de exposição quanto de não exposição Maria desenvolveu câncer e Rosa
não desenvolveu câncer. Já para Raimundo o hábito de fumar foi um fator de proteção,
pois quando ele fumou não teve câncer, mas quando não fumou desenvolveu câncer.
A grande vantagem de se comparar as duas respostas potenciais no mesmo indivı́duo
é que, como se trata da mesma pessoa, vivendo duas vidas idênticas, todo o resto é
igual: a única mudança que ocorreu na vida das pessoas foi a exposição. Desta forma,
se pudéssemos observar as duas respostas potenciais no mesmo indivı́duo, poderı́amos
calcular, sem viés, o efeito causal individual. Daı́ terı́amos a certeza se a exposição de
fato teria causado a doença.
Como não podemos calcular o efeito causal individual na prática o que teremos que
fazer é comparar apenas as respostas fatuais entre os grupos tratado e não tratado.
Ou seja, calcular o efeito causal médio. Na nossa tabela o que farı́amos seria comparar
as respostas fatuais de João e Raimundo na situação de tratamento, com as respostas
fatuais de Maria e Rosa na situação de não tratamento, ou controle (as respostas
marcadas em negrito na tabela). Se João e Raimundo forem semelhantes a Maria e Rosa
em todas as demais variáveis que poderiam interferir nesta associação, desvendarı́amos,
sem viés, o efeito causal do tratamento no desfecho.
28
2.2. Cálculo do Efeito Causal Médio
(c) 4 - Rosa
A primeira situação representa a resposta fatual
29
2. O Modelo de Respostas Potenciais
outra, está disposta na equação 2.1. Nesta fórmula temos o contador i, que indica a
quantidade de participantes do estudo. Na primeira parte da equação o efeito causal
médio está escrito em termos de média das diferenças dos efeitos causais individuais
(E[Dit=1 − Dit=0 ])8 . Na segunda parte da equação este mesmo efeito está explicitado
como diferença entre as médias dos efeitos causais individuais (E[Dit=1 ] − E[Dit=0 ]).
Como a média das diferenças é igual à diferença entre as médias, os dois cálculos podem
ser realizados de forma intercambiante, como veremos mais abaixo.
30
2.2. Cálculo do Efeito Causal Médio
D1 D0 n
1 0 20
1 1 5
0 1 20
0 0 15
Total 60
se calcular a razão de risco causal, teremos de dividir uma probabilidade pela outra.
Assim:
. use tabaco
. expand n
(46 observations created)
31
2. O Modelo de Respostas Potenciais
.
. * Cálculo das diferenças entre as respostas potenciais individuais
. gen d=d1-d0
. * Cálculo do Efeito Causal Médio (média das diferenças)
. sum d
Variable Obs Mean Std. Dev. Min Max
d 60 0 .823387 -1 1
.
. * Cálculo da média das respostas potenciais individuais
. sum d1
Variable Obs Mean Std. Dev. Min Max
d1 60 .4166667 .4971671 0 1
. gen md1=r(mean)
. sum d0
Variable Obs Mean Std. Dev. Min Max
d0 60 .4166667 .4971671 0 1
. gen md0=r(mean)
.
. * Cálculo da diferença entre as médias das respostas potenciais
. gen m=md1-md0
. sum m
Variable Obs Mean Std. Dev. Min Max
m 60 0 0 0 0
.
. * Cálculo da razão entre as médias das respostas potenciais
. gen r=md1/md0
. sum r
Variable Obs Mean Std. Dev. Min Max
r 60 1 0 1 1
32
2.3. Cálculo do efeito causal médio com a resposta fatual
contrafatual, já que não podemos mesmo viajar no tempo e calcular a medida de
efeito causal. Para comparar grupos, em caso de tratamento e desfecho dicotômicos,
usaremos as fórmulas das equações 2.4, para calcular a diferença de risco associacional
(DRA), e 2.5, para obter a razão de risco associacional (RRA). Nestas fórmulas usamos
a proporção de sujeitos que desenvolvem o desfecho entre aqueles que receberam o
tratamento, ou seja, a proporção da doença entre os tratados e diminuı́mos, para obter
o DRA, ou dividimos, para calcular o RRA, esta quantidade pela proporção da doença
entre os não tratados.
Medida de Associação
Diferença de Risco Associacional (DRA)
Medida de Associação
Razão de Risco Associacional (RRA)
Figura 2.3.:
33
2. O Modelo de Respostas Potenciais
Abaixo, na tabela 2.4 mostramos os dados fatuais do nosso estudo. Para isto, tivemos
que rearrumar a tabela 2.2, pois agora não temos mais as respostas contrafatuais
para contrastá-las com as respostas fatuais. Temos apenas a resposta fatual D1 para
os tratados e a resposta fatual D0 para os não tratados. As respostas contrafatuais,
representadas na tabela com a interrogação (?) não são estimáveis. Deste processo
resultou a tabela 2.4 em formato condensado. A partir da tabela 2.4 construı́mos a
tabela 2.5, colocando a exposição nas linhas e o desfecho nas colunas, no formato
padrão com a qual nós epidemiologistas estamos mais acostumados. A partir da tabela
calculamos a medida de associação condicional (RRA, razão de risco associacional).
Usando apenas os dados fatuais, obtivemos o valor 2, o que significa que na presença
da exposição, o risco de desenvolver o desfecho é duplicado. Ou seja, há associação e
a exposição é um fator de risco para a doença. Note que o resultado da RRA (1) é
diferente da RRC (0). Portanto, por causa da nossa máquina do tempo, neste caso
temos certeza de que a RRA é uma medida viciada da RRC. Viés é, portanto, a
diferença entre a medida de associação e a medida de efeito causal.
Continuamos assumindo que não há erro aleatório. Se levarmos em conta o erro
aleatório, o Intervalo de Confiança é de 0,88 - 4,54, e aı́ a nossa conclusão seria que a
diferença entre a RRC e a RRA está dentro da margem de erro e poderı́amos considerar
as duas como iguais. Entretanto, para fins didáticos estamos usando amostras pequenas
e assumindo que não existe erro aleatório. Se a amostra fosse grande esta diferença
seria estatisticamente significante.
T D D1 D0 n
1 1 1 ? 20
1 0 0 ? 20
0 1 ? 1 5
0 0 ? 0 15
Total 60
34
2.5. Causa e Associação
35
2. O Modelo de Respostas Potenciais
Placebo Tratamento
Tempo 1 Tempo 2
marginal se refere ao total da margem da tabela. Para isto, usamos a fórmula 2.6,
que serve tanto para resposta dicotômica, como não dicotômica. No caso de resposta
dicotômica a fórmula a ser utilizada é a 2.3. Comparando-se as respostas potenciais
em cada indivı́duo (tabela 2.6), podemos inferir se o tratamento não teve efeito causal,
quando E[Dit=1 ] = E[Dit=0 ], quando T for independente de D (T ⊥ D), ou se teve efeito
causal, quando E[Dit=1 ] 6= E[Dit=0 ], quando T for dependente de D (T 6⊥ D). Desta
forma, na primeira linha, que contém os dados do participante 1, como E[D1t=1 = 1]
e E[D1t=0 = 0], o tratamento teve efeito causal no desfecho, representando risco pois,
quando o tratamento foi administrado, o efeito ocorreu e no grupo controle o desfecho
não foi observado. No segundo caso, as respostas foram iguais, sendo ambas iguais a 1,
não ocorrendo efeito causal. No terceiro participante, como E[D3t=1 = 0] e E[D3t=0 = 1],
o tratamento também teve efeito causal, mas de proteção, pois quando o tratamento
foi administrado o efeito não foi observado, mas quando ele foi executado, o sujeito
manifestou o desfecho. No quarto participante, também não houve efeito causal, pois
nas duas situações o desfecho não ocorreu (0).
36
2.5. Causa e Associação
Ideal - Causa
Probabilidade Marginal
i Dt=1 Dt=0 Conclusão
1 1 0 Efeito causal - risco
2 1 1 Não há efeito causal
3 0 1 Efeito causal - proteção
4 0 0 Não há efeito causal
RRC = E[Dit=1 ]/E[Dit=0 ]
Possı́vel - Associação
Probabilidade Condicional
T D
1 0
1 1
0 1
0 0
RRA = E[Di = 1|Ti = 1]/E[Di = 1|Ti = 0]
37
2. O Modelo de Respostas Potenciais
38
2.5. Causa e Associação
acaso).
Em conclusão, se pudermos assumir que estes pressupostos são verdadeiros, podere-
mos, então, usar a RRA para estimar a RRC. Veremos, nos próximos capı́tulos, quais
são estes pressupostos.
39
3. Ensaio clı́nico randomizado
3.1. Caracterı́sticas do estudo experimental
Na figura 3.1 observamos a estrutura de um ensaio clı́nico controlado randomizado. A
partir da população de interesse, o pesquisador seleciona uma amostra de voluntários
para estudo, a partir da aplicação dos critérios de inclusão e exclusão. Os participantes
serão, então, divididos em dois grupos: intervenção e controle. O grupo de intervenção
receberá o tratamento em estudo e o grupo não exposto à intervenção será o grupo
controle, ou de comparação. Normalmente, o grupo controle receberá placebo ou o
tratamento convencional.
Neste estudo, o controle do experimento está nas mãos do investigador. Entretanto,
não é o pesquisador quem decide quem vai ser tratado ou quem vai fazer parte do grupo
controle. Esta decisão é tomada de forma aleatória, por sorteio. Esta forma de escolha
aleatória dos grupos aumenta a probabilidade de que os grupos sejam formados de
forma homogênea, ou seja, o mais parecidos entre si em relação a variáveis preditoras
do tratamento. Este processo de escolha aleatória dos integrantes dos grupos tratado e
controle é denominado de randomização. O processo de randomização, por ser aleatório,
tende a balancear covariáveis observadas e não observadas, eliminando ou reduzindo
viés de confundimento (Rosenbaum, 2017).
Após a formação dos grupos por randomização, os participantes serão, então, acompa-
nhados por um perı́odo determinado, para se observar a ocorrência ou não do desfecho.
Ao final se realiza a análise de dados. No estudo experimental o pesquisador parte da
causa para o efeito. É um estudo longitudinal, de caráter prospectivo. Denomina-se
controlado, porque tem um grupo controle.
Como o estudo experimental é realizado com voluntários, e geralmente os voluntários
são pessoas diferentes das não voluntárias em relação a variavéis pré-tratamento,
neste desenho a amostra de estudo tende a diferir da população de interesse, resul-
tando, portanto, viés de seleção. Isto faz com que os dados do estudo experimental
tenham redução de sua validade externa. Entretanto, por causa da randomização é o
estudo epidemiológico que apresenta maior validade interna, pela alta probabilidade de
balanceamento das variáveis pré-tratamento nos grupos experimental e controle.
Devido ao efeito placebo, explicado no capı́tulo anterior, é fundamental usar a
estratégia de duplo cegamento. Assim, nem o participante nem o avaliador devem saber
a qual dos grupos o indivı́duo pertence, se ao tratamento ou controle, para que suas
respostas não sejam induzidas (as pessoas tendem a melhorar se acreditam na eficácia
do tratamento e o avaliador tende a ver as coisas de forma mais favorável se acha que o
tratamento funciona). Desta forma, o estudo experimental deve ser duplo-cego, exceto
quando isto for impossı́vel (por exemplo, não é possı́vel cegar o paciente na comparação
41
3. Ensaio clı́nico randomizado
entre um método cirúrgico versus um método clı́nico de tratamento, pois não se vai
anestesiar um paciente e fingir que o operou para atingir o duplo cegamento).
No estudo experimental ideal, os grupos tratamento e controle são permutáveis entre
si, pois a randomização assegura que tanto os valores observados das respostas fatuais
quanto os valores ignorados das respostas contrafatuais estejam distribuı́dos ao acaso.
Assim imaginemos que T designe os indivı́duos sorteados para o grupo de tratamento
e C os participantes selecionados para o grupo controle. Se, porventura, trocarmos
as letras e tratarmos os rotulados com a letra C e colocarmos no grupo controle os
identificados pela letra T, isto, em tese, não alteraria os resultados do nosso estudo
(mas os resultados na prática podem ser um pouco diferentes, em decorrência do acaso).
Assim, P r[Dt = 1|T = 1] = P r[Dt |T = 0] = P r[Dt = 1], leia-se o risco condicional da
resposta potencial entre os tratados é igual ao risco condicional da resposta potencial
nos não tratados que, por sua vez, são iguais ao risco marginal da resposta potencial caso
todos os indivı́duos tivessem sido tratados (Hernan and Robins, 2018). Ou seja, podemos
usar o risco fatual entre os não tratados como substituto do risco contrafatual que
teria sido observado nos tratados, se eles não tivessem sido submetidos ao tratamento.
Da mesma forma, podemos usar o risco fatual entre os tratados para estimar o risco
contrafatual entre os não tratados, caso eles tivessem recebido o tratamento. Porisso,
a randomização tem alta probabilidade de levar à igualdade entre os grupos, o que
torna os grupos permutáveis entre si. Esta probabilidade é tanto mais elevada, quanto
maior for o tamanho da amostra, pela lei dos grandes números. Porisso é sempre
imprescindı́vel calcular o tamanho mı́nimo de amostra toda vez que formos realizar um
estudo epidemiológico.
42
3.1. Caracterı́sticas do estudo experimental
43
3. Ensaio clı́nico randomizado
segunda alternativa é a mais interessante e a mais utilizada nos ensaios clı́nicos, mas a
estratégia ideal é reduzir ao máximo as perdas de seguimento.
A co-intervenção também pode confundir os resultados de um estudo experimental.
Se a co-intervenção for aplicada mais em um grupo do que em outro, ela tem o potencial
de misturar os seus efeitos com o efeito da intervenção em estudo. A co-intervenção é
um exemplo de um desbalanço potencial que pode ocorrer nos grupos de intervenção
e controle em uma variável pós-tratamento, após a randomização. Co-intervenções
precisam ser padronizadas e administradas da mesmo forma a ambos os grupos ou
evitadas (Moher et al., 2010).
No ensaio clı́nico randomizado deve haver apenas uma única versão do tratamento
sendo administrada. Se houver mais de uma versão do tratamento, será impossı́vel
individualizar um único efeito do tratamento. Neste caso, não podemos dar uma inter-
pretação causal a uma medida que é uma mistura de efeitos de diferentes tratamentos
(Morgan and Winship, 2015; Hernan and Robins, 2018). Retornaremos a este ponto
quando discutirmos, no próximo capı́tulo 4, os pressupostos para inferência causal.
Assim, em estudos experimentais, a randomização tende a produzir grupos balancea-
dos em relação a variáveis pré-tratamento observadas e não observadas. Normalmente,
em todo ensaio clı́nico é publicada a tabela 1, comparando as variáveis pré-tratamento
entre os grupos, para que seja verificada, empiricamente a eficácia da randomização.
Neste caso não faz sentido realizar teste estatı́stico para verificar diferenças entre
os grupos e reportar o valor de P. Já sabemos que qualquer diferença observada foi
produzida pelo acaso, pois a escolha dos grupos foi feita por meio da randomização,
que é um procedimento aleatório (Moher et al., 2010).
Nos ensaios clı́nicos ideais, com aderência completa e sem perdas de seguimento,
nos quais foi verificado não haver, empiricamente, diferenças entre os grupos, pode-se
assumir o pressuposto da permutabilidade entre os grupos. Neste caso, diremos que a
variável de tratamento é independente das respostas potenciais (T ⊥ D1 , D0 ) (Morgan
and Winship, 2015). Dito em outras palavras, não há confundimento por variável
omitida. Nenhuma variável pré-tratamento é capaz alterar as respostas potenciais.
Como os grupos são iguais em todas as variáveis, não existe variável que influencie
ao mesmo tempo o tratamento e o desfecho e que seja capaz de provocar viés de
confundimento.
Se há permutabilidade, então P r[D = 1|T = 1] = P r[Dt=1 = 1], ou seja, o risco
observado do desfecho entre os tratados, uma medida condicional, é igual ao risco
do desfecho se todos os indivı́duos tivessem sido tratados, uma medida marginal. Da
mesma forma, P r[D = 1|T = 0] = P r[Dt=0 = 1], leia-se, o risco observado do desfecho
entre os não tratados, uma medida condicional, é igual ao risco do desfecho se todos
os indivı́duos não tivessem sido submetidos ao tratamento, uma medida marginal.
Assim, o risco relativo associacional (RRA) é igual ao risco relativo causal (RRC). Ou
P r[D = 1|T = 1]/P r[D = 1|T = 0] = P r[Dt=1 = 1]/P r[Dt=0 = 1] . Ou seja, podemos
interpretar uma medida de associação como uma medida de efeito causal (Hernan and
Robins, 2018).
Entretanto, o estudo experimental só pode ser utilizado para testar intervenções
potencialmente benéficas. Não é ético submeter seres humanos a intervenções poten-
cialmente maléficas. Além disso, outras vezes não é factı́vel se realizar ensaio clı́nico
44
3.2. Conclusão
controlado por variadas razões (Rosenbaum, 2017). Se, por exemplo, pretendemos
saber se a participação em programa de transferência de renda, como o Bolsa Famı́lia,
tem efeito no percentual de vacinação não poderı́amos aleatorizar o tratamento, por
isto ser inviável do ponto de vista polı́tico. Hoje, em virtude de outros benefı́cios já
demonstrados pelo programas, também não seria ético realizar um ensaio clı́nico para
testar esta hipótese.
3.2. Conclusão
Assim, se podemos no ensaio clı́nico controlado randomizado ideal interpretar uma
medida de associação como de causa se houver permutabilidade entre os grupos e a
versão do tratamento for única, o que fazer no caso de estudos observacionais, nos
quais os grupos estão desbalanceados em relação a variáveis preditoras do tratamento?
Simplesmente teremos que calcular uma medida de associação e deixar as considerações
causais à mercê da intuição e do bom senso? Ou haverá outra alternativa?
45
4. Estudos observacionais
4.1. Caracterı́sticas dos estudos observacionais
Nos estudos observacionais a alocação dos indivı́duos para os grupos tratamento e
controle está fora do controle do investigador. Os indivı́duos são selecionados, geralmente
por processos sociais, ou se autoselecionam e, assim, terminam em um dos grupos de
estudo. Nestes estudos não há randomização e, portanto, existe um grande potencial
para viés de confundimento. Isto torna a interpretação causal dos estudos observacionais
muito difı́cil.
O mecanismo de alocação que engendra a formação dos grupos geralmente leva a
diferenças sistemática entre os grupos de tratamento (ou de expostos) e o controle (de
não expostos). Assim, não há balanceamento entre os grupos e desta forma, a RRA
não é igual à RRC. Ou seja, a princı́pio não podemos usar uma medida de associação
como estimativa de uma medida de causa em estudos observacionais.
O grande problema nos estudos observacionais é que há diferenças nas caracterı́sticas
pré-tratamento ou pré-exposição, o que leva a viés. A grande pergunta é como rebalancer
os grupos nos estudos observacionais? Como criar contrafatuais adequados na ausência
de randomização?
Se pudermos conceber os estudos observacionais como estudos experimentais imper-
feitos e compreender como se dá o processo de alocação nos grupos, podemos tentar
remover diferenças sistemáticas existentes entre os grupos. Esta estratégia foi proposta
por Imbens and Rubin (2015). Vamos entender melhor como ela funciona com um
exemplo prático.
Queremos saber se participar do programa de saúde na famı́lia (PSF) causa maiores
percentuais de vacinação em crianças. Como a realização de um estudo experimental
randomizado é inviável, pois o PSF já está implantado há vários anos, além de ter
benefı́cios já testados, temos que realizar um estudo observacional para responder a
esta pergunta. Vamos imaginar que tenhamos realizado um estudo de coorte para
responder a esta pergunta. A estrutura de um estudo de coorte está demonstrada na
figura 4.1. Neste estudo, a partir de uma população alvo o pesquisador seleciona uma
amostra para estudo. Esta amostra também é composta por voluntários, pois apenas os
que aceitarem participar terão dados coletados. Em seguida, o pesquisador observa os
grupos tal como eles já se encontram formados na realidade: expostos e não expostos.
Depois acompanha os indivı́duos por um determinado perı́odo de tempo e registra a
ocorrência ou não do efeito. Assim, o estudo de coorte, tal como o ensaio clı́nico, parte
da causa para o efeito, sendo um estudo longitudinal prospectivo. O grupo controle são
os indivı́duos não expostos. A diferença entre o ensaio clı́nico e o estudo de coorte é
o controle da administração do tratamento pelo pesquisador e a randomização, que
47
4. Estudos observacionais
48
4.2. Pressupostos para identificação do efeito causal
Total
Vacinação Infantil
D=1 Incompleta % Incompleta D=0 Completa Total
T=1 40 40 60 100
T=0 20 20 80 100
Total 60 30 140 200
RRAT D = 40/20 = 2,00 (1,26 - 3,17)
RRA = Razão de Risco Associacional
T=1 Participação no Programa de Saúde da Famı́lia
T=0 Grupo controle
49
4. Estudos observacionais
Para Holland (1986) não se estuda causa, sem manipulação. Para este autor, só
efeitos causais que possam ser hipoteticamente manipulados devem ser considerados.
Assim, para Holland, não faz sentido se estudar o efeito causal do nı́vel socioeconômico,
já que não podemos ”manipulá-lo”, por meio de uma intervenção. Além disso, terı́amos
que considerar se nı́vel socioeconômico é uma ”intervenção”fixa e aplicada de forma
idêntica a todos. Assim, exposições como nı́vel socioeconômico não seriam manipuláveis
e, portanto, não poderiam ser consideradas para identificação do efeito causal ??.
Esta perspectiva é muito restritiva. Hernan and Robins (2018) considera esta variável
(nı́vel socioeconômico) imprecisa para se calcular efeito causal, mas pondera que, na
realidade a maioria das exposições (”intervenções”) em estudos observacionais são
inerentemente vagas. De qualquer modo, o uso de questões causais mais bem definidas
ajudam o pesquisador na interpretação da sua estimativa alvo. Efeitos causais definidos
de forma imprecisa têm quase nenhuma interpretação causal. Para Pearl, é possı́vel
”manipular”estudos observacionais por meio de uma ”intervenção cirúrgica”feita no
gráfico. Veremos esta estratégia no capı́tulo 5.
Como é difı́cil na vida real que haja apenas uma única versão do tratamento, há uma
versão mais branda deste pressuposto que é assumir a irrelevância das diferentes versões
do tratamento (VanderWeele, 2009). Neste pressuposto mais realista, se reconhece que
o tratamento tem diferentes versões, mas estas diferenças não têm relevância para se
medir o efeito causal.
50
4.2. Pressupostos para identificação do efeito causal
4.2.2. Permutabilidade
O pressuposto da permutabilidade significa que não há variável confundidora omitida.
No estudo experimental este pressuposto é razoável se a randomização tiver sido
eficaz. Não se pode testar este pressuposto em relação às variáveis não observadas,
mas sabemos, por teoria, que a randomização, desde que o tamanho da amostra seja
grande, tem o potencial de equilibrar também variáveis desconhecidas entre os grupos.
Permutabilidade significa que o risco contrafatual entre os não tratados (probabilidade
condicional) é igual ao risco que seria observado se todos não tivessem sido tratados
(probabilidade marginal). Da mesma forma, o risco contrafatual entre os tratados
(probabilidade condicional) é igual ao risco que seria observado se todos tivessem sido
tratados (probabilidade marginal). Havendo permutabilidade associação é igual a causa.
Neste pressuposto, aplicado aos estudos observacionais, se assume que a a probabili-
dade condicional de receber o tratamento (mecanismo de alocação) depende apenas das
variáveis mensuradas no estudo e que nenhum confundidor foi omitido. Isto equivale a
dizer que o tratamento é independente das respostas potenciais em cada nı́vel de C, ou
seja, (D1 , D0 )perpT |C. C pode ser apenas uma variável ou um conjunto de variáveis
confundidoras. Se, em cada nı́vel da variável confundidora as respostas potenciais forem
independentes do tratamento é, então, possı́vel se calcular o efeito causal estratificado
em cada nı́vel do tratamento e, em seguida, ponderar estas estimativas pela distri-
buição do confundidor na amostra geral. Veremos, mais abaixo, como realizar este
procedimento, denominado padronização.
Se a probabilidade de receber o tratamento depende apenas de C, então os tratados
são permutáveis com os não tratados em cada nı́vel de C. Ou seja, nos subgrupos de C
as demais variáveis estão igualmente distribuı́das nos grupos de tratamento e controle.
Neste caso, apesar de não se poder mais assumir permutabilidade marginal, como no
estudo experimental, é possı́vel pressupor que há permutabilidade condicional. Mas
para tanto precisamos também assumir que C é o único preditor que está desigualmente
distribuı́do nos grupos tratado e não tratado.
Este pressuposto não é verificável empiricamente, ou seja, não é revelado pelos dados.
Depende do conhecimento teórico prévio. Se a questão do estudo ainda não tiver sido
muito estudada o efeito causal pode não ser identificável, por não se conhecer ainda
bem a estrutura de confundimento que cerca o problema.
4.2.3. Positividade
Pelo pressuposto da positividade não há categoria(s) nos subgrupos de C com proba-
bilidade 0 ou 1 de receber o tratamento ou controle. Este pressuposto exige que haja
sobreposição entre os grupos, denominada zona de suporte comum, para que contra-
fatuais adequados possam ser calculados. Dito em outras palavras, há participantes
em todos os nı́veis de tratamento para cada grupo de C. Ou seja, a probabilidade
de encontrar pessoas no grupo de tratamento ou no grupo controle em cada nı́vel da
variável confundidora é maior do que zero e menor do que 1: 0 < P r(T = t|C = c) < 1
. Este pressuposto pode ser empiricamente verificável. No caso de variáveis categóricas,
ela se cumpre quando não há caselas vazias na tabela multidimensional T x D x C. Se
51
4. Estudos observacionais
houver caselas vazias ou com poucas observações o risco contrafatual naquele grupo não
poderá ser estimado ou será estimado de forma muito imprecisa. Assim, o pressuposto
da positividade tende a ser violado em amostras pequenas.
Vacinação Incompleta
+
Pobreza
?
+
PSF
52
4.3. Exemplo - aplicação dos pressupostos em estudo observacional
Total
Pobreza
C=1 Sim % Pobres C=0 Não Total
T=1 90 90 10 100
T=0 30 30 70 100
Total 80 60 120 200
RRAT C = 90/30 = 3,00 (2,21 - 4,08)
RRA = Razão de Risco Associacional
T=1 Participação no Programa de Saúde da Famı́lia
T=0 Grupo controle
incompleta e 8,8% dos não pobres não tinham completo o esquema de vacinação básica.
Assim, concluı́mos que C (pobreza) é uma causa comum de T e D.
Total
Vacinação Infantil
D=1 Incompleta % Incompleta D=0 Completa Total
C=1 52 44,2 67 120
C=0 7 8,8 73 80
Total 60 30 140 200
RRACD = 44,2/8,8 = 5,05 (2,42 - 10,53)
RRA = Razão de Risco Associacional
C=1 Pobres
C=0 Não Pobres
53
4. Estudos observacionais
A razão de risco ponderada foi 1, indicando que não há efeito causal do PSF na
vacinação infantil.
54
4.4. Conclusão
4.4. Conclusão
Na presença de pressupostos realistas e defensáveis, é possı́vel estimar valores contrafatu-
ais médios observáveis para grupos especı́ficos de indivı́duos e aplicando procedimentos
estatı́sticos paramétricos, semiparamétricos ou não paramétricos será possı́vel dar a
esta diferença de risco médio ou razão de risco uma interpretação causal. Neste caso
diremos que o mecanismo de alocação é ignorável (Morgan and Winship, 2015) ou que
não há confundimento por outra variável omitida.
A grande questão que resta é até que ponto C é o única variável ou conjunto de
variáveis que se encontra(m) desbalanceada(s) nos grupos de tratamento (expostos) e
controle (não expostos). Como selecionar as variáveis que provocam diferenças entre os
grupos? Como assegurar que o mecanismo de alocação possa ser considerado ignorável?
Teremos que lançar mão de sólida teoria e de pressupostos realistas e defensáveis para
atingir este objetivo. Porém, muitas vezes, não conhecemos o mecanismo de geração de
dados nos estudos observacionais e não será possı́vel identificar o efeito causal. Se a
interpretação causal não for possı́vel ainda podemos utilizar os dados coletados a partir
de estudos observacionais para predizer o evento com base nas variáveis observadas
(Hernan and Robins, 2018).
55
Parte II.
Abordagem Gráfica
57
5. Gráficos Acı́clicos Direcionados
(DAGs)
Os gráficos acı́clicos direcionados ou dirigidos, também chamados diagramas causais, são
utilizados para se realizar inferência causal. A sigla inglesa DAG (que significa directed
acyclic graph) é muito utilizada e está mais ou menos incorporada na linguagem do dia
a dia, de modo que seria estranho utilizar a sigla em português GAD. Assim, neste livro,
utilizaremos a sigla em inglês DAG, da mesma forma que nos referimos à sı́ndrome
da imunodeficiência adquirida como aids, ao invés de sida. Estes gráficos são acı́clicos,
pois não são permitidas circularidades (feed-back loops), refletindo o fato de que o
futuro não pode interferir no passado. Este caráter não cı́clico reflete o fato de que uma
variável não pode interferir nela mesma. Estes diagramas são direcionados, assumindo-se
que a causalidade flui em apenas uma direção, em um dado momento no tempo. No
DAG também está incorporada uma perspectiva temporal na noção de causalidade,
assumindo-se que o tempo flui da esquerda para a direita. Desta forma, influências
simultâneas recı́procas entre duas variáveis não são permitidas. Assim, se desejamos
considerar influências bidirecionais da renda na escolaridade, e da escolaridade na renda,
temos que admitir que a renda no tempo zero influencia a escolaridade no tempo um
que, por sua vez, influencia a renda no momento dois (R0 → E1 → R2).
A teoria por trás dos DAG, foi formalizada e sintetizada matematicamente por
Judea Pearl, a partir da contribuição de vários outros autores, e está publicada, com
todos os detalhes técnicos, no seu livro Causality (Pearl, 2009a). Outro livro que
contribuiu bastante para a consolidação desta teoria foi escrito por Spirtes, Glymour
and Scheines (Spirtes et al., 2000). Esta teoria, que surgiu nas disciplinas de ciência da
computação e inteligência artificial, consiste em uma teoria unificada de viés, visualizada
estruturalmente em formato gráfico. Neste capı́tulo vamos resumir algumas de suas
caracterı́sticas. Várias introduções técnicas a respeito estão publicadas (Hernan and
Robins, 2018; Elwert, 2013; Cortes et al., 2016; Morgan and Winship, 2015; Glymour
and Greenland, 2008). Uma excelente revisão em português, bem explicativa, contendo
um exemplo, foi recentemente publicada (Cortes et al., 2016). Há excelentes exemplos
de uso de DAGs para a construção de uma teoria a respeito de problemas causais
complexos (Fleischer and Diez Roux, 2008; Shrier and Platt, 2008). Existem boas
revisões do uso de DAG na pesquisa epidemiológica (Greenland et al., 1999; Glymour
and Greenland, 2008; Hernan and Robins, 2018).
O DAG é uma ferramenta visual simples, no qual são codificados conhecimentos
qualitativos especializados, ou seja, os pressupostos acerca da estrutura causal de
um problema. Estes pressupostos são alicerçados na pesquisa empı́rica e na teoria.
A partir da observação do desenho formalizado no DAG, assumindo-se que a nossa
59
5. Gráficos Acı́clicos Direcionados (DAGs)
60
5.2. Notação
equação 5.1. Formalmente, a probabilidade de D=d dado que T=t é igual à probabili-
dade de D=d. Ou seja, a probabilidade de, na população, observar valores da variável
D iguais a d, nos subgrupos de T=t continua igual à probabilidade de encontrar valores
de D=d (d e t podem assumir n valores, para simplificar vamos assumir que D possa
ser igual a 1=doentes e 0=sadios e T possa ser igual a 1=tratados e 0=não tratados).
Quer o indivı́duo tenha sido tratado ou não, conhecer o grupo de tratamento (tratado
ou não tratado) ao qual ele pertence não modifica a probabilidade do desfecho, ou seja,
T e D são marginalmente independentes. A barra vertical — denota ”condicional a
determinada variável”. Esta barra sempre se refere a uma probabilidade condicional,
obtida em um subgrupo ou estrato de uma determinada variável, ou seja condicional a
ela. Quando T e D são independentes, a distribuição de D condicional a T=t é sempre
igual à distribuição marginal ou não condicional de D, ou seja, exatamente igual à
obtida na população total antes do condicionamento.
Dependência
5.2. Notação
O DAG tem três elementos: nó, seta e ausência de seta. No DAG cada nó representa
uma variável aleatória. Na figura 5.1 temos 10 nós, ou seja, dez variáveis estão ali
representadas. Cada seta, que é sempre unidirecionada, assume um efeito causal direto,
ou, simplesmente, que não se quer assumir que não haja relação de causalidade entre
duas variáveis. A ausência de seta entre duas variáveis é um pressuposto forte, de
que não há efeito causal direto. Cada seta no DAG indica que uma variável causa
outra, mas não distingue efeito de dano de efeito protetor. Assim, quando no DAG
assumimos que o tratamento1 T causa o desfecho D, T tanto pode reduzir o valor ou
1 naabordagem contrafatual, o estudo observacional é entendido como um experimento fracassado.
Assim, neste livro, utilizaremos, de forma intercambiante, os termos tratamento e exposição para
nos referirmos à variável explanatória.
61
5. Gráficos Acı́clicos Direcionados (DAGs)
O DAG demonstrado na figura 5.1 foi desenhado no programa DAGitty (de domı́nio
público, disponı́vel na página http://www.dagitty.net/) (Textor et al., 2011). Neste
programa, a variável de exposição, ou tratamento (T), é representada por um botão de
play, enquanto a variável resposta, ou desfecho (D), é representada por um botão de
stop. Denominamos caminho uma sequência de setas que apontam em qualquer direção
entre duas variáveis, enquanto caminho causal é um caminho que sai de uma variável
com a seta apontando para outra variável. Assim, há dois caminhos diretos entre B e
D: um caminho causal de B para D (no sentido da seta, B → D), e um caminho não
causal de D para B (no sentido oposto ao da seta, B ← D). Há dois caminhos causais
de T para D, um direto (T → D), e outro indireto (T → M → D), por intermédio
do mediador M. De D para T há quatro caminhos não causais D ← T, D ← M ←
T, D ← G ← H → T e D ← A → E ← C → D. Resumindo, entre D e T há seis
caminhos, dois causais e quatro não causais. Os caminhos não causais são também
denominados caminhos espúrios, pois eles transmitem correlações não causais. Nestes
caminhos não causais, as associações fluem somente no sentido contrário ao da seta, ou
nos dois sentidos (tanto na mesma direção, quanto no sentido contrário ao da seta). Os
caminhos causais, por sua vez, transmitem correlações causais, que fluem sempre na
mesma direção da seta.
Denomina-se variável colisora, uma variável que tenha duas setas apontando para
ela. Na figura 1.1, E é uma variável colisora, já que duas setas (uma vindo de C e
62
5.2. Notação
outra vindo de A) apontam para E. O nome colisor vem da situação na qual duas setas
”colidem”em um nó.
Em um DAG existem pais, crianças, descendentes e ancestrais, tal qual em uma
famı́lia. Assim, T é pai de M e D. D é filho de T, M, G, A e B. A variável C é ancestral
de T, E, M e D. Por outro lado, D é descendente de todas as variáveis do gráfico, menos
de E.
No DAG temos dois tipos de caminhos: pela porta da frente (frontdoor path) e pela
porta de trás (backdoor path). No caminho pela porta da frente, a seta parte da variável
em questão para outra variável qualquer, enquanto no caminho pela porta dos fundos,
a seta chega na variável em questão, a partir de outra variável qualquer. Assim, vamos
analisar quais os caminhos que chegam e partem da variável T (tratamento). Todos
os caminhos que partem de T são caminhos pela porta da frente, enquanto que todos
os caminhos que chegam em T são caminhos pela porta dos fundos. Deste modo, em
relação à variável T, há dois caminhos pela porta da frente: T → D e T → M → D
e três caminhos pela porta de trás, chegando de F, C e H. Caminhos pela porta da
frente podem ser causais ou não causais, enquanto caminhos pela porta de trás são
sempre caminhos não causais, que podem transmitir associações espúrias2 .
O DAG é bastante útil para nos ajudar a realizar inferência causal, pois é possı́vel
se identificar caminhos pela porta da frente (causais e não causais) e caminhos pela
porta de trás (não causais). Uma das grandes dificuldades para se realizar inferência
causal é que os dados transmitem associações, tanto causais como não causais. Quando
desejamos estudar causa, estamos apenas interessados em isolar associações causais e
descartar associações espúrias. Quando estimamos associação entre duas variáveis, há
uma mistura de componentes causais e espúrios. Ficou famoso em estatı́stica o célebre
aforismo de que detectar uma associação não significa detectar uma relação causal.
A grande pergunta para se realizar inferência causal é se é possı́vel separar causa de
associação. Durante muitos anos o objetivo da estatı́stica foi estimar associações a
partir dos dados, deixando as considerações causais para uma etapa posterior, baseada
no raciocı́nio. Será que é possı́vel se separar associação de causa? Será que é possı́vel
retirar o componente espúrio da associação e medir causa? Para Judea Pearl isto não
só é possı́vel como é desejável (Pearl, 2009a). Entretanto, para podermos fazer isto
é necessário termos uma sólida teoria, que possa embasar o conhecimento prévio a
respeito de uma pergunta cientı́fica. Com base no conhecimento prévio, codificamos
estas informações qualitativas em um DAG e, a partir dele, isolamos o componente
espúrio da associação e medimos causa. Entretanto, para que a estimativa resultante
reflita mesmo causa, a nossa teoria e os nossos pressupostos precisam estar corretos.
Entretanto, nunca podemos saber se os nossos pressupostos estão corretos, pois eles
não são inteiramente testáveis. Assim, todo processo de realizar inferência causal é um
processo de tentativa e erro e todas as estimativas sempre são falsificáveis e sujeitas a
nova verificação empı́rica. Veremos, a seguir, como identificar o componente espúrio da
associação em um DAG e nos aproximarmos da medida da causa.
2 veremos,a seguir, que os caminhos pela porta de trás só transmitem associações espúrias se não
estiverem bloqueados.
63
5. Gráficos Acı́clicos Direcionados (DAGs)
• Cadeia
• Garfo
• Garfo invertido
5.3.1. Cadeia
A estrutura de cadeia que indica mediação. No exemplo da figura 5.2, a variável de
tratamento (T) tem efeito causal no desfecho (D), por intermédio da variável mediadora
(M). Nesta estrutura, a associação marginal3 identifica o efeito causal de T em D. Se
condicionarmos (ajustarmos)4 por M, criaremos viés. Vamos supor que T e D sejam
variáveis dicotômicas, e que indivı́duos expostos ao tratamento T=1 tenham maior
probabilidade de desenvolver o desfecho D=1. Se ajustarmos pelo mediador M, todo o
efeito causal de T em D desaparece, pois o único caminho causal de T para D passa
por M. A associação condicional5 em M bloqueia o fluxo de associação causal, que
flui pela porta da frente, e faz sumir o efeito causal, enquanto a associação marginal
identifica, sem viés, o efeito causal de T em D. Desta forma, diante de uma estrutura
de cadeia, indicadora de mediação, não há nenhuma intervenção a fazer no gráfico, ou
seja, não é necessário realizar ajuste estatı́stico. Isto vai ao encontro do que já se sabia
da epidemiologia clássica, que não se deve ajustar para mediador, quando se deseja
estimar o efeito total de uma variável em outra (Rothman et al., 2008; Gordis, 2014).
Se ajustarmos para um mediador criaremos viés de sobrecontrole (Elwert, 2013).
T M D
64
5.3. Estruturas de associação
5.3.2. Garfo
65
5. Gráficos Acı́clicos Direcionados (DAGs)
Desta forma, mesmo que não haja efeito causal de T em D, T e D estarão marginalmente
associados, em virtude da causa comum C que, neste caso, cria uma associação espúria
entre T e D. Assim, para bloquear o fluxo de associação espúria entre T e D, em
virtude desta causa comum C, é necessário se realizar uma intervenção no sistema,
condicionando para C. A associação marginal entre T e D está contaminada pelo viés de
confundimento, e só a associação condicional é capaz de identificar o efeito causal de T
em D. Vimos que a associação flui nos dois sentidos, independentemente da direção da
seta, enquanto a causa só flui na direção da seta. Assim, o efeito causal entre T e D flui
pela porta da frente, no sentido T → D, enquanto a associação espúria flui pela porta
dos fundos, no sentido T ← C → D. A associação espúria flui sem respeitar a direção
da seta, enquanto a causa flui sempre respeitando a direção da seta. Assim, o viés
de confundimento, em uma definição gráfica, estrutural, é definido como a existência
de uma causa comum do tratamento T e do desfecho M. Se houver caminho aberto
pela porta dos fundos, o fluxo de associação espúria de T para D via C enviesa a
estimativa do efeito causal. Desta forma, para se identificar o efeito causal na estrutura
de garfo é necessário condicionar, ou seja, ajustar para a causa comum C. A associação
condicional fecha a porta dos fundos que estava aberta e bloqueia o fluxo de associação
retrógrado entre T e D, deixando livre apenas o fluxo anterógrado da associação causal,
pela porta da frente. Na figura 5.5, ilustramos o condicionamento para C (um quadrado
desenhado em volta de C indica condicionamento), que é necessário para remover o
viés de confundimento em uma estrutura de garfo.
Figura 5.5.: Estrutura de garfo ilustrando condicionamento para causa comum, ne-
cessário para remover viés de confundimento
Vejamos agora um exemplo simples para ilustrar o conceito da estrutura de garfo, que
representa viés de confundimento. Imaginemos que desejamos realizar um estudo para
avaliar a qualidade do atendimento prestado em Unidades de Tratamento Intensivo.
Um dos indicadores desta avaliação seria a taxa de mortalidade nas UTIs. Assim,
desejamos saber se há efeito causal do desempenho operacional (estrutura e processos
de trabalho) no resultado (mortalidade). Ao se comparar várias UTIs, observamos
que há grande variação na taxa de mortalidade entre as unidades, sugerindo que a
66
5.3. Estruturas de associação
variável UTI esteja associada com a taxa de mortalidade. Entretanto, há uma causa
comum, que é a gravidade do paciente, que causa internação na UTI e também causa
mortalidade. O nosso conhecimento das relações de dependência entre estas variáveis
estão expressos no DAG da figura 5.6. Assim, para identificarmos o efeito causal da
UTI na mortalidade, precisamos fechar o fluxo de associação, que está passando pelo
caminho aberto pela porta de trás, que parte da variável de exposição UTI, viaja
no sentido contrário da seta pela gravidade do paciente6 e daı́ se transmite para a
mortalidade. Desta forma, para identificarmos o efeito causal da variável UTI na taxa
de mortalidade, precisamos ajustar (condicionar) para a variável gravidade do paciente.
Desta forma, numa estrutura de garfo, apenas a associação condicional entre a exposição
e o desfecho estima o efeito causal, enquanto a associação marginal está enviesada pelo
confundimento.
67
5. Gráficos Acı́clicos Direcionados (DAGs)
Figura 5.7.: Estrutura de garfo invertido representando efeito comum com colisor
costumam oferecer bolsas de estudo para alunos com bom desempenho esportivo ou
com altas notas na escola. Entretanto, se selecionarmos para a nossa pesquisa apenas os
candidatos que obtiveram bolsas de estudo na universidade, estarı́amos condicionando
para um efeito comum (colisor). Neste subgrupo selecionado de alunos agraciados
com bolsa de estudo, observarı́amos uma associação negativa entre bom desempenho
esportivo e notas altas na escola. Assim, se entrevistássemos um determinado aluno e ele
nos informasse que não tem bom desempenho esportivo, automaticamente deduzirı́amos
que ele deveria ter tido notas altas na escola. Apesar de bom desempenho esportivo e
notas altas na escola não estarem marginalmente associados na população geral, ao
condicionarmos para uma variável colisora, abre-se um fluxo espúrio de associação
entre desempenho esportivo e notas altas na escola, fluxo este que estava fechado pelo
colisor. O conhecimento do efeito comum (seleção apenas no subgrupo dos agraciados
com bolsa de estudo) nos facilita saber a causa do recebimento da bolsa de estudo.
Assim, dentre os alunos que recebem bolsa, quem tem bom desempenho esportivo não
68
5.3. Estruturas de associação
deve ter tido notas altas na escola e vice-versa, criando uma associação condicional
negativa entre estas variáveis e induzindo viés, chamado viés de colisão (seleção).
Desempenho esportivo
Bolsa de estudo
Assim, quando existir uma variável colisora no caminho, este se encontra fechado e
não transmite associação espúria. Entretanto, se condicionarmos (ajustarmos) para o
colisor este caminho se abrirá e criaremos uma associação espúria entre variáveis que,
antes do ajuste, eram marginalmente independentes. Condicionar por uma variável
colisora, que reflete efeito comum, implicaria permitir que o futuro interferira no
passado. Note que, neste exemplo, este fluxo espúrio de associação sai pela porta da
frente, da variável tratamento em direção à variável colisora, mas depois retorna pela
porta dos fundos, que parte da variável colisora em direção à variável que mede o
desfecho. Entretanto, este fluxo espúrio de associação só transitará se realizarmos,
inadequadamente, ajuste para o colisor.
Na figura 5.10 está representada outra estrutura de garfo invertido, demonstrando
efeito com colisor C e descendente de colisor DC. O colisor C é um efeito comum, tanto
do tratamento T, quanto do desfecho D. O colisor C é causa de DC, que é descendente
do colisor. Da mesma forma que em uma estrutura de garfo invertido, que representa
efeito comum, não se condiciona para um colisor, também não se deve condicionar
para um descendente de colisor. O condicionamento por um descendente do colisor
também abre o fluxo de associação entre T e D que se encontrava fechado pelo colisor.
Provavelmente neste caso, quando ajustamos para o descendente do colisor, o viés de
colisão induzido será de menor magnitude do que quando ajustamos para o próprio
colisor, a depender da magnitude da correlação entre o colisor e o seu descendente.
Quanto maior esta correlação entre o colisor C e seu descendente DC, maior será o viés
de colisão.
69
5. Gráficos Acı́clicos Direcionados (DAGs)
Figura 5.10.: Estrutura de garfo invertido representando efeito comum com colisor e
descendente de colisor
C DC
70
5.5. DAG como um sistema de equações estruturais não paramétricas
na qual está presente um colisor ou descendente de colisor, não há nenhuma intervenção
a fazer. A associação marginal identifica o efeito causal de T em D. Entretanto, se
inadvertidamente for realizado condicionamento pelo colisor ou pelo descendente de
colisor, será criado viés de colisão, o que sabotará a interpretação causal.
O caminho causal é sempre um caminho dirigido, ou seja, as setas fluem sempre
no sentido do exposição para o desfecho, e sempre incluem uma estrutura de cadeia,
com ou sem mediadores: T → D ou T → M → D. Caminhos não causais são sempre
não dirigidos e incluem estruturas de garfo T ← CONFUNDIDOR → D ou de garfo
invertido T → COLISOR ← D. Caminhos que contém colisores (garfo invertido)
encontram-se bloqueados e não transmitem viés, enquanto caminhos que não contém
colisores (garfo) encontram-se abertos e transmitem viés, sendo, por isso, denominados
caminhos enviesados.
Figura 5.11.: DAG sob magnificação representando estrutura de cadeia com os termos
de erro
UT UM UD
T M D
T = fT (UT ) (5.3)
7 variáveis
não mensuradas são usualmente representadas no DAG pela letra U, do inglês unknown.
Os termos de erro, como também não são mensurados, são também usualmente representados pela
letra U.
71
5. Gráficos Acı́clicos Direcionados (DAGs)
M = fM (T, UM ) (5.4)
D = fD (M, UD ) (5.5)
Assim, na equação 5.3, a variável T é descrita por meio de uma função não especificada
fT , com apenas um argumento, UT , que é o termo de erro, já que nenhuma outra
variável possui relação de dependência com T. Na equação 5.4, a variável M é descrita
por meio de uma função não especificada fM , com dois argumentos, T e UM . Da mesma
forma, na equação 5.5, a variável D é descrita por meio de uma função não especificada
fD , também com dois argumentos, M e UD . Assim, a variável desfecho D é uma função
não especificada de uma variável observada, o mediador M, e do seu termo de erro não
observado, UD , os quais transmitem seus efeitos causais em D, por meio da função fD .
Observe que cada seta hipotetizada no DAG representa um argumento da função não
restrita de cada equação. Assim, esta função não restrita pode ser depois definida como
linear, quadrática, incluir interações ou qualquer outra função não linear.
Com isto demonstramos que o DAG é equivalente a um sistema de equações não
paramétricas. Assim, todo DAG tem embutido este sistema de equações, que não
apresenta qualquer restrição em relação à distribuição das variáveis ou à forma funcional
da relação entre as variáveis no sistema. A única restrição são as relações de dependências
e independências causais, codificadas no diagrama por meio de setas. Assim, no DAG
sob magnificação da figura 5.11, não foi assumida relação de dependência causal direta
entre T e D, de forma que há uma restrição colocada no diagrama: todo o efeito causal
de T em D é indireto e transmitido via M. Não há efeito causal direto de T em D.
Outro ponto importante a destacar é que no DAG, por se tratar de um sistema não
paramétrico, no qual a função que liga as variáveis não está explicitada, potenciais
interações poderão também ser incluı́das nesta função. Assim, não há necessidade de se
incluir no DAG interações entre variáveis, pois elas são implicitamente permitidas pela
falta de restrições colocadas na função (Morgan and Winship, 2015). A especificação
das interações será feita posteriormente, no momento da estimação do efeito causal.
72
5.6. Separação direcional
(colisão) ou efeito causal. Uma das tarefas da epidemiologia é separar cada uma destas
explicações e verificar se a associação observada pode ser devida a um efeito causal.
De acordo com o pressuposto causal de Markov, descartando-se o acaso, to-
das as associações não condicionais (marginais) surgem de relações causais
ancestrais. Este pressuposto afirma que uma determinada variável V é independente
de qualquer outra variável no DAG, se condicionarmos por todas as suas causas diretas
(ancestrais ou pais), exceto os seus efeitos (descendentes). Isto é a mesma coisa que
afirmar que, descartando-se os efeitos de V, toda a informação probabilı́stica acerca
de V pode ser obtida a partir das suas causas diretas. Ou, dito de outra forma, uma
determinada variável V é independente dos seus não descendentes após ajuste para os
seus ancestrais.
Assumindo-se que o pressuposto causal de Markov será verdadeiro, são duas as fontes
que geram associações marginais entre a exposição e o desfecho8 : efeito causal, viés
de confundimento ou uma mistura das duas situações (Glymour and Greenland, 2008;
Pearl et al., 2016). Por outro lado, uma associação condicional entre a exposição e o
desfecho pode ser criada, como vimos anteriormente, se ajustarmos, inadvertidamente,
para um colisor ou descendente de colisor, produzindo-se viés de colisão. O pressuposto
causal de Markov afirma que uma associação marginal não pode ser produzida por
efeitos da variável em questão, mas apenas por suas causas.
Viés, numa definição gráfica, é entendido como uma associação estrutural entre o
tratamento e o desfecho que não se deve a um efeito causal. Assim, em um DAG é
possı́vel, se o nosso conhecimento a respeito de uma problema for verdadeiro e completo,
identificar viés de confundimento e evitar viés de colisão, como resumido na tabela
5.1. Viés de confundimento, numa definição estrutural, é aquele que surge quando há
uma causa comum do tratamento e do desfecho, e existe caminho aberto pela porta
dos fundos, que sai da variável de tratamento para a variável desfecho. O viés de
colisão surge quando se realiza um condicionamento para um colisor ou descendente
de colisor, abrindo-se, então, um caminho pela porta da frente ou de trás, que se
encontrava fechado pelo colisor. Assim, o viés de confundimento surge a partir dos
dados, mas o viés de colisão pode ser causado por uma intervenção do pesquisador, ao
condicionar, inadvertidamente, por um efeito comum9 . Desta forma, é importante se
desenhar um DAG com o nosso problema, codificado enquanto um sistema de relações
de dependência e independência causal entre variáveis, representado por meio de um
sistema de equações estruturais não paramétricas. No DAG será, então, possı́vel verificar
se o efeito causal é identificável, a partir das variáveis observadas e dos pressupostos
contidos no diagrama. Ou seja, desenhamos o DAG para verificar se é possı́vel se
identificar o efeito causal. Caso positivo, usamos o DAG para selecionar um conjunto
mı́nimo de variáveis de ajuste para confundimento, que feche todos os caminhos abertos
pela porta de trás entre a exposição e o desfecho e que não abra caminhos que já
estejam fechados por colisores. Também é importante que não seja realizado ajuste
para variável(is) mediadora(s) ou para outras variáveis descendentes do tratamento10 .
8 excluindo-se o acaso e viés de aferição, que não são relações causais ancestrais
9O viés de colisão também pode ser causado por perdas de seguimento. Neste caso o viés de colisão
não depende de uma intervenção no sistema feita pelo pesquisador
10 porque não se deve ajustar para descendentes do tratamento será explicado com pormenores na
73
5. Gráficos Acı́clicos Direcionados (DAGs)
Para se identificar o efeito causal é necessário controlar para todas as causas comuns
e assumir que não haja alguma causa comum que tenha sido omitida no DAG. Este é
um pressuposto muito forte e vários crı́ticos desta abordagem apontam que é impossı́vel
se incluir todas as causas comuns do tratamento e do desfecho em um DAG porque,
quase sempre, o nosso conhecimento a respeito de um problema é imperfeito. Assim,
o sistema codificado em um DAG será mais válido quanto mais completo for o nosso
conhecimento a respeito de uma questão. Um dos motivos apontados para o fato dos
DAGs ainda serem pouco utilizados na pesquisa epidemiológica é o grau de incerteza
sobre os processos causais que produzem os dados (Cortes et al., 2016).
Quando adicionamos uma variável (nó) em um DAG, não está especificada a forma
como esta variável será mensurada ou de qual tipo de variável se trata (nominal, ordinal,
binária, discreta, contı́nua). Da mesma forma, não definimos qual a distribuição das
variáveis (se normal, Poisson, exponencial, hipergeométrica ou outra). Como vimos
anteriormente, também não é definida a função de dependência entre as variáveis: se
linear ou qualquer outra. No DAG se define uma função não restrita, que pode assumir
qualquer forma funcional. O DAG codifica uma informação que é apenas qualitativa.
Portanto, o DAG não serve para estimação, mas é importante, como dito acima, para
verificar se é possı́vel se identificar o efeito causal a partir dos dados observados e
derivar as implicações testáveis do modelo causal.
Uma vez construı́do o DAG, assumindo-se que os pressupostos nele contidos sejam
verdadeiros, e que seja possı́vel se identificar o efeito causal com base nas variáveis obser-
vadas, como identificar um conjunto mı́nimo de variáveis de ajuste para confundimento?
Como derivar as implicações testáveis do modelo causal?
A grande questão é que é mais fácil se identificar as estruturas de associação mais
simples, cadeia, garfo e garfo invertido, em diagramas simplificados. O problema é
que, na maioria das vezes, os problemas que estudamos na vida real são complexos.
Dessa forma, quando desenhamos um DAG estas estruturas se misturam e aı́ fica
complicado selecionar um conjunto mı́nimo de variáveis de ajuste para confundimento.
Como proceder então?
74
5.6. Separação direcional
bloqueado por um colisor, estas variáveis estão direcionalmente conectadas. Pela regra
da fidelidade fraca, weak faithfullness, se o gráfico estiver correto, estas duas variáveis
devem, provavelmente, estar marginalmente associadas. Se adotarmos a regra da fide-
lidade, faithfullness, dirı́amos que variáveis direcionalmente conectadas estão
marginalmente associadas. Geralmente é prudente adotar a regra da fidelidade
fraca, pois há alguns casos raros nos quais exceções à regra da fidelidade acontecem.
Por exemplo, se o fumo tem efeito negativo na saúde e na prática de atividade fı́sica, e
a prática de atividade fı́sica tem efeito positivo na saúde, o fumo tanto direta como
indiretamente tem efeitos negativos na saúde. Dizemos que a população é fiel ao gráfico
que gerou estas relações. Mas, por outro lado, se o fumo tivesse efeito positivo na
prática de atividade fı́sica, terı́amos um efeito direto negativo e um efeito indireto
positivo do fumo na saúde, que poderiam se cancelar e no final o fumo não teria efeito
na saúde (Figura 5.12). Neste caso a população seria infiel ao gráfico que gerou esta
distribuição. De acordo com Scheines, assumir que a população é fiel é admitir que
quaisquer independências que ocorram entre variáveis em um DAG são consequência
do pressuposto causal de Markov e não do acaso (Scheines, 1997). A regra da fidelidade
descarta cancelamento perfeito de efeitos positivos e negativos.
Figura 5.12.: Exceção à regra da fidelidade - efeitos direto e indireto do fumo na saúde
se cancelariam
Fumo
+
- Atividade fı́sica
+
Saúde
Por outro lado, se todos os caminhos entre duas variáveis estiverem bloqueados por
colisores, elas estão direcionalmente separadas. Neste caso, pelo pressuposto causal
de Markov, elas são marginalmente independentes. Um resumo dos pressupostos das
regras gráficas de separação direcional está ilustrado na tabela 5.2.
75
5. Gráficos Acı́clicos Direcionados (DAGs)
Pressuposto Consequência
Pressuposto causal Uma determinada variável V é independente de quaisquer
de Markov outras variáveis (seus não descendentes), se condicionar-
mos por todas as suas causas diretas (ancestrais), exceto
os seus efeitos (descendentes)
Na tabela 5.3 estão listadas as cinco regras gráficas de separação direcional, que são
derivadas das três estruturas simples de associação descritas na tabela 5.1 (Hernan, 2002).
Para simplificar, vamos assumir que existe apenas um caminho entre duas variáveis. As
duas primeiras regras são de separação incondicional. A regra número 1 afirma que, sem
ajuste, um caminho está aberto se nele não houver colisor. A consequência desta regra é
que as variáveis estão direcionalmente conectadas, produzindo provavelmente associação
marginal entre elas, adotando-se a regra da fidelidade fraca11 . A regra número 2 diz
que um caminho está bloqueado se duas setas colidem em um nó. A consequência
desta regra é que, se o colisor bloqueia o caminho, as variáveis estão direcionalmente
separadas e, consequentemente, são marginalmente independentes.
As regras 3, 4 e 5 refletem separação condicional. A regra número 3 afirma que
qualquer caminho que tenha sido ajustado para um não colisor está bloqueado (isto
acontece quando se ajusta para a variável do meio em estrutura de cadeia ou para a causa
comum em estrutura de garfo). A consequência desta regra é que as variáveis foram
direcionalmente separadas por meio de ajuste, realizado por intervenção do pesquisador
no sistema, ficando, assim, condicionalmente independentes. A regra número 4 diz que o
ajuste para colisor abre o caminho (isto acontece quando se ajusta para o efeito comum
em estruturas de garfo invertido). Assim, a sua consequência é que as variáveis foram
conectadas pela intervenção do pesquisador e ficaram associadas condicionalmente. A
regra número 5, derivada da regra número 4, diz que o ajuste para descendente do
colisor também abre o caminho (isto acontece quando se ajusta para um descendente
do efeito comum em estruturas de garfo invertido). Assim, a sua consequência é que
as variáveis também foram conectadas pela intervenção do pesquisador, sendo criada
associação condicional entre elas. É bom ressaltar que todas estas consequências se
aplicam em expectativa, se a estrutura causal representada pelo DAG estiver correta.
Em resumo, um caminho entre duas variáveis estará bloqueado por um conjunto de
variáveis V se:
11 assumindo-se faithfullness (fidelidade), que é um pressuposto forte, dirı́amos que se duas variáveis
estão direcionalmente conectadas, elas também estão estatisticamente associadas
76
5.6. Separação direcional
SEPARAÇÃO CONDICIONAL
3 Qualquer caminho que tenha sido Variáveis direcionalmente sepa-
ajustado para um não colisor está radas por intervenção - Inde-
bloqueado pendência condicional
77
5. Gráficos Acı́clicos Direcionados (DAGs)
A C D
Figura 5.14.: Conexão Direcional entre A e D por meio de condicionamento pelo colisor
B
A C D
78
5.6. Separação direcional
Figura 5.15.: Conexão Direcional entre A e D por meio da causa comum E (de A e C)
A C D
A C D
79
5. Gráficos Acı́clicos Direcionados (DAGs)
80
5.8. Identificando o conjunto mı́nimo de variáveis de ajuste para confundimento no DAG
que, pelo critério da porta de trás, o analista só precisa se preocupar com os caminhos
que chegam por esta porta, que começam na seta dirigida para o tratamento T, sendo,
exatamente, porisso que esse critério é assim denominado. Por que o pesquisador não
precisa se preocupar com os caminhos pela porta da frente? Porque, por esta porta
saem caminhos causais, que precisam ser deixados abertos, e também caminhos não
causais, que, ou já se encontram bloqueados por colisores, ou não estão conectados com
o desfecho. Vamos demonstrar estes pontos, de forma bem detalhada, a seguir.
Porque não se dever realizar ajuste para nenhum descendente do trata-
mento T? Porque este ajuste pode ser desnecessário, ou porque ele pode sabotar
uma interpretação causal. Se neste ajuste se incluir um mediador se vai fazer
desaparecer total ou parcialmente o efeito causal. Se se deseja estimar o efeito
total do tratamento no desfecho, não se pode realizar condicionamento por mediadores,
pois o mediador está situado no caminho causal entre T e D. Se este condicionamento
for realizado, o efeito estimado resultante será o efeito direto, ou seja, a parcela da
associação que não se deve ao efeito de mediação. Assim, a parcela do efeito mediado
não será estimada. Entretanto, se se pretende estimar o efeito direto, o ajuste para
mediadores pode ser realizado.
Entretanto, por outro lado, se se incluir neste ajuste um colisor ou descen-
dente de colisor, se vai abrir um caminho não causal pela porta da frente,
já fechado por um colisor (Elwert, 2013). Na figura 5.17 vemos cada uma destas
situações. Inicialmente não devemos ajustar para DT2 , pois esta variável é mediadora,
situada no caminho causal entre T e D. Se ajustarmos para esta variável removeremos
todo o efeito causal de T em D. Se ajustarmos para DT3 , criaremos viés de colisão, pois
DT3 é descendente do colisor DT2 . Esta consequência nefasta é um pouco mais difı́cil
de ser percebida. Para que isto fique mais fácil de ser visualizado, magnificamos o DAG,
mostrando o termo de erro eDT2 , da variável DT2 . Com esta magnificação, vemos que
a variável DT2 é uma variável colisora no caminho T → DT2 ← eDT2 , pois ela tem
duas setas apontadas para ela, uma que parte de T e outra que parte do seu termo
de erro eDT2 . Da mesma forma, se ajustarmos para DT4 ou DT5 , criaremos viés de
colisão, pois DT4 é um colisor no caminho T → DT4 ← X → D e DT5 é descendente
deste colisor. Para finalizar, o ajuste para DT1 é desnecessário mas, se tal ajuste fosse
realizado, não prejudicaria a identificação do efeito causal.
81
5. Gráficos Acı́clicos Direcionados (DAGs)
Figura 5.17.: DAG ilustrando porque não se deve ajustar para descendentes do
tratamento
DT5
DT4
DT3
T DT2 D
DT1 eDT2
82
5.9. DAG incluindo variáveis não mensuradas
abrirı́amos este caminho e criarı́amos viés de colisão. Ajuste para M também sabotaria
uma identificação causal, porque estarı́amos retirando do sistema parte do fluxo de
associação causal entre T e D, que flui pela porta da frente. Se ajustarmos para M e H,
ou M e G estaremos estimando apenas o efeito causal direto, pois terı́amos removido
do sistema o efeito causal indireto, que flui pelo mediador M. Condicionar por uma
variável no caminho causal entre a exposição e o desfecho causa viés de sobrecontrole
(Elwert, 2013).
É interessante ressaltar que a prática mais comum na epidemiologia atual, de ajustar
por muitas variáveis ao mesmo tempo, pode ser danosa e falhar na tentativa de remover
confundimento, criando viés de sobrecontrole ou de colisão (Elwert, 2013).
Inicialmente precisamos identificar todos os caminhos pela porta de trás que começam
no tratamento T e terminam no desfecho D. São cinco caminhos, listados abaixo:
83
5. Gráficos Acı́clicos Direcionados (DAGs)
(1) T ← E → F←D
(2) T ← E → C→A→D
(3) T ← E → C←U→A→D
(4) T ← B ← U→A→D
(5) T ← B ← U→C→A→D
Em seguida, precisamos verificar se há algum caminho que esteja bloqueado por um
colisor. Perceba que os caminhos 1 e 3 estão fechados por colisores. O colisor F está
fechando o caminho 1 e o colisor C está fechando o caminho 3. Mostramos novamente
os caminhos, identificando agora, em negrito, os colisores em cada caminho:
(1) T ← E → F←D
(2) T ← E → C→A→D
(3) T ← E → C←U→A→D
(4) T ← B ← U→A→D
(5) T ← B ← U→C→A→D
Há portanto, 3 caminhos pela porta de trás entre a exposição e o desfecho que não
se encontram fechados por colisores: os caminhos 2, 4 e 5. O objetivo agora é encontrar
uma única variável que não seja colisora e que esteja em todos estes caminhos. Assim,
se condicionarmos por esta variável não colisora, o efeito causal é identificável. Observe
que a variável comum a todos estes caminhos é A. Desta forma, se condicionarmos por
A, conseguiremos identificar o efeito causal de T em D. Outra opção seria ajustarmos
por B e E. A variável B fecha os dois últimos caminhos (4 e 5) pela porta dos fundos que
estão abertos, enquanto a variável E fecha o caminho pela porta de trás número 2, que
também está aberto. A partir da aplicação do critério da porta de trás percebemos que
o efeito causal pode ser identificado, às vezes, por múltiplas alternativas de conjuntos
mı́nimos de ajuste. Assim, resta a pergunta: qual conjunto mı́nimo de variáveis de
ajuste escolher? Recomendamos usar de parcimônia, ou seja, selecionar o conjunto com
o menor número de variáveis possı́vel. Outra estratégia é escolher o conjunto mı́nimo de
variáveis de ajuste para confundimento que contenha variáveis mais bem mensuradas,
para se reduzir viés de aferição.
Assim demonstramos que, mesmo colocando uma variável não mensurada no DAG, a
variável U, podemos neste caso ajustar para B ou A (descendentes de U) e conseguiremos
fechar os dois caminhos pela porta de trás que contém U e que ainda não estavam
fechados por um colisor. Se U fosse uma variável observada, terı́amos mais duas opções
mı́nimas de ajuste U e E, ou U e C. Se ajustamos para U, abrimos o caminho 3
(que estava fechado, pois C é um colisor neste caminho) e fechamos os caminhos 4
e 5. Restam abertos os caminhos 2, que estava originalmente aberto, e 3 (que foi
aberto quando ajustamos para U, pois este caminho estava bloqueado pelo colisor C).
Precisamos, então, encontrar variáveis comuns a estes 2 caminhos abertos, para que
possamos fechá-los. Estas variáveis são C ou E. Outra opção poderia também ser A,
mas aı́, ajustar para U e A, já não seria ajuste mı́nimo pois, se ajustarmos apenas por
84
5.10. Identificação e estimação
A já estaremos bloqueando todos os caminhos abertos por não colisores e mantendo
fechados os caminhos bloqueados por colisores.
É importante observar que colisor não é uma propriedade da variável, mas sim do
caminho no qual uma determinada variável se encontra. Assim, veja que C é um colisor
no caminho 3, mas não é colisor no caminho 2.
Há casos em que desenhamos o DAG para descobrir que não é possı́vel identificar o
efeito causal por meio de ajuste por covariáveis, porque uma variável não mensurada
U é necessária para bloquear um dos caminhos abertos pela porta de trás, entre a
exposição e o desfecho (Figura 5.19. Assim, uma vez que isto foi detectado, a solução
seria incluir esta variável em novos estudos e poder, assim, identificar o efeito causal.
Outra alternativa seria utilizar outros métodos para estimação do efeito causal. Uma
revisão destes outros métodos como, por exemplo, o uso de variável instrumental ou de
isolamento de mecanismo pode ser encontrado em Morgan and Winship (2015).
Figura 5.19.: DAG ilustrando situação na qual o efeito causal não é identificável por
meio de ajuste por covariáveis
85
5. Gráficos Acı́clicos Direcionados (DAGs)
X
P (D = d|do(T = t)) = P (D = d|T = t, V = v)P (V = v) (5.6)
v
Teoria Dados
DAG
86
5.11. Desenhando o DAG no programa DAGitty
Vemos, na figura 5.21, um DAG já desenhado. No DAGitty, todas as variáveis são
representadas por cı́rculos. A variável de exposição ou tratamento (T) é representada
por um botão de play, enquanto a variável resposta ou desfecho (D) é representada por
um botão de stop. O programa usa várias cores para classificar as variáveis e os caminhos.
Todos os caminhos causais aparecem em verde e os caminhos que produzem viés são
marcados em vermelho. Outros caminhos são desenhados em preto. As causas comuns
são destacadas em vermelho. As demais legendas podem ser identificadas na parte
esquerda da figura. No canto superior direito, o programa identifica o(s) conjunto(s)
mı́nimos de ajuste para estimar o efeito total de T em D. Na parte da direita, no centro,
são mostradas as implicações testáveis (independências condicionais). Logo abaixo das
implicações testáveis aparece o código utilizado para gerar o diagrama causal. Este
código pode ser copiado para um programa de processamento de texto, salvo, e depois
colado nesta mesma caixa, caso você queira redesenhar o DAG, sem precisar executar
todos os passos novamente. Quando você colar o novo código, aparecerá nesta caixa a
mensagem Update DAG. Clicando nesta opção, o programa desenhará, novamente, o
DAG.
87
5. Gráficos Acı́clicos Direcionados (DAGs)
Figura 5.22.: Estrutura de garfo invertido mostrando Colisor no caminho pela porta
dos fundos entre o tratamento e o desfecho
Nesta estrutura, se for feito ajuste pelo colisor será criado viés de colisão. Este viés é
também chamado de viés M, porque o desenho tem a forma desta letra.
88
5.12. Exercı́cios
5.12. Exercı́cios
1. No DAG da figura 5.1 identifique o pai e o filho de G e os ancestrais e descendentes
de H.
11. Identifique, no DAG da figura 5.25, se existem caminhos pela porta de trás entre a
exposição e o desfecho. Se existirem, descreva quais são estes caminhos, incluindo
a direção de todas as setas.
12. Se existirem caminhos abertos pela porta de trás entre a exposição e o desfecho
no DAG da figura 5.25, descreva quais são estes caminhos, incluindo a direção de
todas as setas.
13. Se existirem caminhos fechados pela porta de trás entre a exposição e o desfecho
no DAG da figura 5.25, descreva quais são estes caminhos, incluindo a direção
de todas as setas. Identifique qual(is) colisor(es) está(ão) bloqueando este(s)
caminho(s).
15. Identifique, no DAG da figura 5.26, se existem caminhos pela porta de trás entre a
exposição e o desfecho. Se existirem, descreva quais são estes caminhos, incluindo
a direção de todas as setas.
89
5. Gráficos Acı́clicos Direcionados (DAGs)
16. Se existirem caminhos abertos pela porta de trás entre a exposição e o desfecho
no DAG da figura 5.26, descreva quais são estes caminhos, incluindo a direção de
todas as setas.
17. Se existirem caminhos fechados pela porta de trás entre a exposição e o desfecho
no DAG da figura 5.26, descreva quais são estes caminhos, incluindo a direção
de todas as setas. Identifique qual(is) colisor(es) está(ão) bloqueando este(s)
caminho(s).
18. Qual o(s) conjunto(s) mı́nimo(s) de variável(is) de ajuste para confundimento
necessário(s) para identificar o efeito causal no DAG da figura 5.26?
B D
A E
B D
A E
90
5.12. Exercı́cios
91
6. Viés de confundimento: do conceito
associacional ao conceito estrutural
6.1. O paradoxo de Simpson
Em 1951, Simpson publicou um artigo no qual apresenta um paradoxo com base em
dados fictı́cios, mas que ocorre bastante na realidade (Simpson, 1951). Um tratamento
foi aplicado para uma determinada doença e não foi associado à melhora clı́nica,
quando se analisou toda a amostra do estudo. Ou seja, o tratamento não foi associado
marginalmente à recuperação do paciente (OR - Odds Ratio ou RC - Razão de
Chances=1) (Tabela 6.1). Entretanto, quando os dados foram analisados separadamente
por sexo, paradoxalmente, em ambos os sexos, o tratamento foi associado a uma menor
taxa de recuperação, tanto no sexo feminino, como no masculino (OR=0,83) (Tabela
6.2). Quando foi analisada a associação condicional, por meio de estratificação pelo
sexo, foi observado um paradoxo. Como poderia um tratamento não ter efeito na
população como um todo mas, ao mesmo tempo, prejudicar a recuperação de homens e
mulheres? Este fenômeno foi denominado paradoxo de Simpson. Este exemplo, não é
apenas paradoxal, mas também não faz sentido lógico, considerando que esta situação
é irreal, impossı́vel de ocorrer na realidade. Não é plausı́vel que um tratamento possa
ser maléfico a cada sexo e, ao mesmo tempo, não ter efeito quando juntamos homens
com mulheres. Quando nos depararmos com tal paradoxo em uma situação de pesquisa,
devemos preferir a medida marginal ou condicional de associação? Para respondermos
a esta pergunta é preciso saber o que explica a ocorrência do paradoxo de Simpson.
RR=Razão de Risco
OR=Odds ratio
Fonte: adaptada de (Hernan et al., 2011)
93
6. Viés de confundimento: do conceito associacional ao conceito estrutural
RR=Razão de Risco
OR=Odds ratio
Fonte: adaptada de (Hernan et al., 2011)
Hernan discute o paradoxo de Simpson com o uso de DAGs (Hernan et al., 2011).
Este paradoxo poderia tanto representar viés de colisão, como ocorrer numa situação de
confundimento. Vimos, no capı́tulo 5, que os dados comunicam apenas associações. Neste
caso, queremos interpretar, em termos causais, uma medida de associação. Para isto,
vamos necessitar de conhecimento teórico prévio, para realizarmos inferência causal
com dados observacionais. Não é possı́vel interpretar causalmente uma associação
apenas com base nos dados. Precisamos conhecer a história por trás dos dados, ou
seja, necessitamos usar o que sabemos para identificar e explicar a natureza desta
situação paradoxal. No DAG da figura 6.1, o paradoxo de Simpson é interpretado como
viés de colisão. Na realidade não existe associação marginal entre o tratamento e a
recuperação. Mas, no momento em que condicionamos para sexo, abre-se um caminho
que estava fechado pelo colisor, e surge uma associação negativa entre tratamento e
desfecho: os tratados têm menores percentuais de recuperação do que os não tratados.
Entre homens, o percentual de recuperação foi de 39% para os tratados e de 43%
para os não tratados. Já entre a mulheres, dentre as tratadas, 56% se recuperaram,
enquanto este percentual foi de 60% para as do grupo controle (Tabela 6.2). Neste
DAG estarı́amos codificando o nosso conhecimento. Entretanto, é impossı́vel que a
recuperação e o tratamento interfiram no sexo do indivı́duo, pois o sexo das pessoas foi
determinado por outros fatores, muito antes delas receberam o tratamento e terem ou
não se recuperado da doença. Com base no nosso conhecimento, descartamos, então, a
hipótese de viés de colisão.
Vejamos agora a hipótese de confundimento. No DAG da figura 6.2, o paradoxo de
Simpson é interpretado como viés de confundimento. A nossa hipótese, baseada no
conhecimento prévio, é de que o sexo interfere no recebimento do tratamento e também
na recuperação do indivı́duo. Ou seja, o sexo é uma causa comum do tratamento e do
desfecho recuperação. No DAG há um caminho causal, que sai pela porta da frente,
fluindo do tratamento para a recuperação (Tratamento → Recuperação), e um
caminho não causal, que flui pela porta de trás, partindo do tratamento, voltando no
sentido contrário ao da seta para o sexo, e indo no sentido da seta para a recuperação
94
6.1. O paradoxo de Simpson
Recuperação
Sexo
Tratamento
95
6. Viés de confundimento: do conceito associacional ao conceito estrutural
que qualquer diferença observada nos percentuais dentre os sexos seja real e não obra
do acaso. Assim, consideramos que o DAG da figura 6.2 é compatı́vel com o nosso
conhecimento prévio. Desta forma, chegamos à conclusão de que o paradoxo de Simpson
é devido ao viés de confundimento e os resultados da associação condicional (OR nos
estratos, T D|C ) é que devem ser interpretados. O OR marginal (ORT D ), calculado
incluindo toda a amostra, não deve ser utilizado, pois é uma estimativa viciada. Apenas
com base nos dados não poderı́amos extrair qualquer conclusão, pois as associações
encontradas (sexo com tratamento e sexo com recuperação) são compatı́veis tanto com
a hipótese do sexo causar estas variáveis, quanto com estas duas variáveis causarem o
sexo. Assim, tanto a associação marginal quanto a condicional do tratamento com a
recuperação seriam possı́veis de ser interpretadas, tendo em conta os dados. Apenas
com base nos nossos pressupostos, isto é, no nosso conhecimento prévio, é possı́vel tirar
um conclusão e, dar aos dados uma interpretação causal.
Tratamento
Sexo
Recuperação
96
6.1. O paradoxo de Simpson
97
6. Viés de confundimento: do conceito associacional ao conceito estrutural
Total
D=1 D=0 Total
T=1 300 100 400
T=0 100 300 400
Total 400 400 800
DRT D = 0,50
RRT D = 3,00
ORT D = 9,00
DR=Diferença de Risco
RR=Razão de Risco
OR=Odds ratio
ser o mesmo nos estratos de C (ORT D|C=1 =ORT D|C=0 =13,50), este valor é diferente
do odds ratio marginal (ORT D =9,00). Desta forma, concluı́mos que a colapsibilidade
depende da escolha da medida de associação. Usando-se os mesmos dados, pode se
obter colapsibilidade com uma medida e não com outra.
Vimos que a razão de risco não é estritamente colapsável, pois seus valores diferem
nos estratos de C. Vamos agora verificar se a razão de risco pode ser colapsável de
forma não estrita, ou seja, se o seu valor marginal é igual à média ponderada de seus
valores condicionais. Para este cálculo vamos usar o estimador não paramétrico, a partir
da fórmula 6.1 abaixo :
X
P (D = d|do(T = t)) = P (D = d|T = t, C = c)P (C = c) (6.1)
c
98
6.1. O paradoxo de Simpson
Concluı́mos, portanto, que, apesar dos valores da razão de risco diferirem nos estratos
(RRT D|C=1 =6,00 6= RRT D|C=0 =2,25), devido a uma interação multiplicativa, a razão
de risco marginal (RRT D =3,00) é igual à soma ponderada de seus valores condicionais
nos estratos (RRT D|C =3,00). Assim, apesar da razão de risco não ser estritamente
colapsável, ela é colapsável de forma não estrita.
Vejamos agora se o odds ratio é colapsável de forma não estrita. Para isto vamos
usar o estimador ponderado de Mantel-Haenszel, de acordo com a fórmula 6.2 abaixo,
onde K é o número de estratos.
PK
ˆ (ai di /ni )
ORM H = Pi=1
K
(6.2)
i=1 (bi ci /ni )
Podemos, então, concluir que a estimativa bruta ou marginal do OR (ORT D =9,00) não
é igual à média ponderada dos valores do OR condicionais dos estratos (ORM H =13,50).
Ou seja, o OR é uma medida não colapsável, mesmo sem viés de confundimento, a
partir de dados obtidos de um ensaio clı́nico randomizado, perfeitamente balanceado.
A não colapsibilidade do OR é um fenômeno por meio do qual o OR bruto ou marginal,
não pode ser expresso como uma média ponderada das estimativas do OR especı́ficos
dos estratos, mesmo na ausência de confundimento. Esta caracterı́stica do odds ratio é
uma peculiaridade matemática, não uma indicação de viés (Hernan et al., 2011). O
odds ratio tem uma tendência a se afastar de 1, tanto para cima quanto para baixo
e, desta forma, se descolar do valor da razão de risco (no exemplo da tabela 6.4 o
OR=9,00 é maior do que o RR=3,00) . Entretanto, o OR tende a se aproximar da razão
de risco quando a doença for rara (Rothman et al., 2008). Assim, quando a doença
é comum o odds ratio tende a superestimar a razão de risco. Quando a doença for
rara, as diferenças entre o OR marginal, bruto, (ORT D ) e o OR ponderado, ajustado,
(ORM H ) são pequenas (Jewell, 2004) e, neste caso, podemos assumir que o OR também
será uma medida colapsável.
Este exemplo mostra que pode haver não colapsibilidade mesmo na ausência de
viés de confundimento, o que nos leva a concluir que viés de confundimento não é
sinônimo de colapsibilidade. Confundimento pode ocorrer tanto na presença quanto
na ausência de colapsibilidade, bem como colapsibilidade pode ser identificada com
ou sem confundimento (Greenland and Morgenstern, 2001). Portanto, colapsibilidade
e confundimento são conceitos distintos. Apenas pelo conceito da colapsibilidade,
que é puramente baseado nos dados, não se faz distinção se C causa T e D (o que
significaria viés de confundimento), ou se T e D causam C (o que representaria que
C seria um colisor). Para se interpretar uma situação de não colapsibilidade como de
confundimento é necessário conhecer a história por trás dos dados. Não colapsibilidade
pode representar confundimento ou viés de colisão. Pode também ser um reflexo de
viés de aferição, representar mediação, ser obra do acaso ou, no caso do odds ratio e de
outras medidas de associação (como a razão de taxas e a diferença de taxas (Greenland,
99
6. Viés de confundimento: do conceito associacional ao conceito estrutural
Tabela 6.5.: Razões para não colapsibilidade - diferença entre a estimativa bruta e
ajustada
. use simpson
. expand n
(44 observations created)
. cs d t, by(c)
100
6.1. O paradoxo de Simpson
. cc d t, by(c)
c OR [95% Conf. Interval] M-H Weight
• C é causa comum de T e D;
101
6. Viés de confundimento: do conceito associacional ao conceito estrutural
102
6.2. Definição associacional de confundimento
detecção de confundimento passa a incluir uma mistura de relações causais (teoria) com
associações baseadas nos dados. Entretanto, o critério da mudança da estimativa (bruta
versus ajustada) permanece como a principal referência na identificação do confundidor,
ou seja, o critério utilizado continua sendo, predominantemente, empı́rico, mesmo após
estes refinamentos (Kleinbaum et al., 1982).
Assim, de acordo com a definição associacional, são três as propriedades necessárias,
mas não suficientes, para se caracterizar um confundidor (supondo-se ausência de
interação entre exposição e confundidor): 1) a variável de confusão deve estar associada
com a exposição na população (em toda a coorte, no estudo de coorte, e nos controles,
no estudo caso-controle) ; 2) o fator de confusão deve ser um fator de risco para a
doença entre os não expostos e 3) o confundidor não pode ser um mediador entre a
exposição e a doença (Kleinbaum et al., 1982). Algumas variações nestas propriedades
existem: (Rothman et al., 2008) acrescenta à terceira condição que o confundidor não
pode ser afetado pela exposição ou pela doença (Rothman et al., 2008). (Szklo and
Nieto, 2014) acrescenta à segunda condição que o confundidor deve ser causa da doença.
Apesar de na maioria das vezes estes critérios funcionarem bem, há alguns casos
em que o critério associacional falha e pode provocar, ao invés de evitar, viés. Assim,
demonstraremos com exemplos, que o critério de identificação de confundidor baseado
em associações estatı́sticas é insuficiente e, portanto, obsoleto. O uso isolado deste
critério pode levar a ajuste inadequado para confundimento, ao se incluir uma variável
desnecessária no ajuste, abrindo portas já fechadas por colisores, provocando, assim,
viés de colisão, e sabotar a interpretação causal da medida de associação calculada.
Vimos, na análise do paradoxo de Simpson, que critérios de associação baseados nos
dados são insuficientes para identificar confundimento, pois este se trata de um conceito
causal.
Um dos problemas com o uso desta definição é que, o que aparece como uma
associação ou independência entre o potencial confundidor com a exposição ou com o
efeito, pode representar confundimento ou viés de colisão por outra variável, que não foi
levada em conta no ajuste. Ou seja, no uso dos critérios indicativos para identificação de
confundimento, se empregam associações marginais (bivariadas), que podem, também,
estar viciadas, devido a outras variáveis não incluı́das no ajuste (Greenland and Robins,
2009). Além disso, várias outras razões, além do confundimento, podem provocar uma
mudança da estimativa bruta para a ajustada (Greenland and Robins, 2009), como foi
demonstrado na seção anterior (vide tabela 6.5).
Quando o critério da mudança da estimativa bruta para a ajustada é utilizado, as
estimativas condicionais são produzidas, ajustando-se, geralmente, para um confundidor
por vez. Assim, este critério não tem bom desempenho para se lidar com situações de
confundimento múltiplo (Greenland et al., 1999).
Outro problema com este critério é que é sempre necessário que seja realizada
avaliação de potenciais interações entre a exposição (E) e o eventual confundidor (C).
Na presença de modificação de efeito (identificada por meio de interação em modelo
estatı́stico ou por meio de análise estratificada), a diferença entre a estimativa bruta e
a estimativa ajustada não faz sentido ser interpretada. Como há interação, o efeito se
modifica a depender das categorias de exposição e do confundidor (Miettinen and Cook,
1981). A prática frequente de se usar modelos paramétricos multivariáveis, nos quais se
103
6. Viés de confundimento: do conceito associacional ao conceito estrutural
104
6.3. Definição contrafatual de confundimento
mais indicados pois, comumente, criam viés de colisão. Além disso, como geralmente
são usados modelos paramétricos nos métodos de seleção stepwise, que dependem de
pressupostos frequentemente irrealistas em relação à forma funcional e distribuição das
variáveis, as estimativas derivadas destes modelos estão, comumente, erradas (Morgan
and Winship, 2015; Greenland et al., 1999). Outro problema é a frequente não inclusão
de termos de interação entre variáveis nestes modelos, o que pode gerar erros na
identificação de reais confundidores.
Se os critérios mais comumente usados para identificar potenciais confundidores
falham, qual a alternativa? A alternativa é utilizar o conhecimento prévio a respeito
do problema, pois o confundimento é um conceito causal. Partindo-se de um DAG
para representar as relações entre as variáveis selecionaremos um conjunto mı́nimo de
variáveis de ajuste para confundimento, a partir da aplicação de critérios gráficos como,
por exemplo, do critério da porta de trás, conforme explicado no capı́tulo 5.
105
6. Viés de confundimento: do conceito associacional ao conceito estrutural
descendente de uma causa comum que bloqueia o caminho aberto pela porta de trás.
O confundimento resulta em várias consequências, que distorcem a avaliação do
efeito causal. Estas consequências dependem da intensidade e da direção das associações
entre o confundidor C e o tratamento T, e também entre o confundidor C e o desfecho
D. O confundimento pode gerar uma associação falso positiva ou superestimar o
efeito do tratamento. Pode causar uma associação falso negativa ou substimar o efeito
do tratamento. Pode, ainda, em casos mais raros, inverter a direção da associação,
transformando um verdadeiro fator de risco em um falso fator de proteção ou vice-versa.
Na definição contrafatual o confundimento surge porque comparamos grupos, ao invés
de compararmos os mesmos indivı́duos em dois momentos no tempo. Assim, se estamos
interessados em saber se a infecção pelo vı́rus Zika causa microcefalia, idealmente
gostarı́amos de comparar as mesmas mulheres em dois momentos: quando infectadas e
quando não infectadas pelo vı́rus, para verificar se, em cada um destes momentos, o feto
vai desenvolver microcefalia. Para fazermos isso terı́amos que acompanhar mulheres
infectadas e verificar se os seus fetos vão desenvolver microcefalia (Pr[D1 ], significando
probabilidade da doença quando não exposto). Em seguida, precisarı́amos voltar no
tempo e observar, novamente, estas mesmas mulheres numa situação em que não
tenham sido infectadas pelo vı́rus Zika e observar se os seus fetos desenvolveriam
microcefalia (Pr[D0 ], probabilidade da doença quando não exposto). Ou seja, para se
calcular o efeito causal precisarı́amos realizar um contraste dos desfechos potenciais da
mesma pessoa, quando submetida a diferentes tratamentos, em momentos diferentes
do tempo (Pr[D1 ] - Pr[D0 ]). Entretanto, na vida real só conseguiremos verificar uma
destas duas respostas potenciais, a resposta fatual. A outra resposta potencial é sempre
contrafatual, não observável. Assim, não conseguiremos calcular diretamente o efeito
causal.
O que fazemos na prática é estimar uma associação, comparando-se a probabilidade
de desenvolvimento de microcefalia em um grupo de mulheres que tenha sido infectado
pelo vı́rus (Pr[D=1|T=1], probabilidade da doença condicional a pertencer ao grupo
de expostos) com a probabilidade da doença em outro grupo de mulheres que não foi
infectado pelo vı́rus (Pr[D=1|T=0], probabilidade da doença condicional a pertencer ao
grupo de não expostos). Se a taxa de microcefalia no grupo de mulheres não infectadas
for igual à taxa de microcefalia que teria sido observada no grupo de mulheres infectadas,
caso elas não tivessem sido infectadas, os grupos são permutáveis, (Pr[D=1|T=0 =
Pr[D0 ]) e não ocorre viés. Entretanto, se houver causa comum do tratamento e do
desfecho, que provoque falta de permutabilidade entre os grupos de mulheres infectadas
e não infectadas, a nossa estimativa de associação (Pr[D=1|T=1 - Pr[D=1|T=0]) será
diferente da estimativa de efeito causal (Pr[D1 ] - Pr[D0 ], impossı́vel de ser calculada,
pois terı́amos que comparar a resposta potencial fatual com a resposta potencial
contrafatual no mesmo grupo). Esta diferença entre a medida de associação, obtida a
partir da comparação de duas respostas fatuais observadas em dois grupos, e a medida
de causa, ideal, que compararia a taxa do desfecho fatual com a taxa do desfecho
contrafatual no mesmo grupo, provoca confundimento (Rothman et al., 2008). Um
potencial confundidor desta associação seria o nı́vel socioeconômico: mulheres mais
pobres tendem a residir em bairros cuja taxa de infecção pelo Aedes é mais elevada,
tendo, portanto, maiores riscos de serem infectadas pelo vı́rus Zika. Por outro lado,
106
6.3. Definição contrafatual de confundimento
mulheres mais pobres também apresentam maior risco de contrair outras infecções
causadoras de microcefalia (toxoplasmose ou citomegalovı́rus, por exemplo).
Na tabela 6.7, demonstramos esta situação de maneira mais clara. Vamos denominar
a população de mulheres infectadas, que usaremos como grupo exposto, de população
tratada A e a população de mulheres não infectadas, que usaremos como grupo controle,
de população não tratada B. No grupo A, observamos apenas a resposta potencial
fatual na presença do tratamento Pr[DA1 ] e no grupo B a resposta fatual na ausência do
tratamento Pr[DB0 ]. Não observamos as respostas contrafatuais Pr[DA0 ], probabilidade
da doença entre os tratados caso não tivessem recebido o tratamento, e Pr[DB1 ],
probabilidade da doença entre os não tratados, caso tivessem sido tratados. Ou seja,
não sabemos o que teria acontecido com o grupo infectado A, caso ele não tivesse sido
infectado, Pr[DA0 ]. Também não temos informação sobre o grupo não infectado B, caso
ele tivesse sido infectado, Pr[DB1 ]. Assim, não podemos calcular o efeito causal em
nenhum dos dois grupos.
O que fazemos na prática? Tomamos a resposta fatual no grupo não tratado B,
Pr[DB0 ], para estimar a resposta contrafatual no grupo tratado A, Pr[DA0 ], caso ele
não tivesse sido infectado. Assim, para calcular o efeito causal teremos que assumir
como pressuposto que a resposta potencial fatual observada no grupo não exposto B,
Pr[DB0 ], seja igual à resposta contrafatual não observada no grupo exposto A, Pr[DA0 ],
ou seja, que Pr[DB0 ] = Pr[DA0 ]. Ou seja, os indivı́duos não tratados observados no
grupo B são iguais aos indivı́duos tratados do grupo A, caso eles não tivessem sido
expostos (Greenland et al., 1999; Jewell, 2004). Isto é assumir que os indivı́duos dos
dois grupos são permutáveis entre si, e que tanto faz se pessoas do grupo A ou do
grupo B tivessem sido tratadas, isto não interferiria nas suas respostas potenciais. Se A
e B são permutáveis, a exposição ou o tratamento ao qual o indivı́duo foi submetido
não interfere nas respostas potenciais (T ⊥ RP, onde RP são as respostas potenciais).
Desta forma, confundimento também pode ser definido como a dependência entre a
exposição e as respostas potenciais (T 6⊥ RP).
107
6. Viés de confundimento: do conceito associacional ao conceito estrutural
108
6.3. Definição contrafatual de confundimento
critérios concordam, mas há situações em que eles discordam e, se utilizarmos somente
o critério associacional, acabarı́amos realizando ajuste para colisor, provocando, assim,
viés de colisão.
Na figura 6.3 está representado o confundimento numa perspectiva associacional.
Note que no diagrama não usamos setas direcionadas, para destacar que estamos
lidando apenas com associações estatı́sticas. A pergunta é se café causa infarto. A
questão é se o fumo seria um confundidor desta associação. O fumo cumpre os três
requisitos necessários para identificar um confundidor: está associado com a doença
entre os não expostos (os que não bebem café), com a doença na população de origem
dos casos (em toda a coorte) e não é uma variável descendente da exposição ou do
desfecho, não sendo, portanto, um mediador da relação causal entre T e D. Em vários
estudos, há diferença entre a estimativa marginal e a condicional ao fumo do RRT D .
Portanto, pelo critério associacional o fumo é um fator de confusão da relação causal
entre café e infarto.
C - Fumo
T - Café D - Infarto
109
6. Viés de confundimento: do conceito associacional ao conceito estrutural
causa comum dos hábitos de fumar e de beber café. Tanto o fumo - DC quanto o café -
T são descendentes do confundidor C. Notamos que há um caminho aberto pela porta
de trás T ← C → DC → D. Usando-se o critério da porta de trás, vemos que este
caminho pode ser bloqueado condicionando-se por C ou DC. Como normalmente C não
é medido, a solução seria condicionar para DC. Neste diagrama, por motivos diferentes,
o conceito associacional acerta também. No entanto, o verdadeiro confundidor, a causa
comum de T e D seria C e não o fumo.
DC - Fumo
T - Café
6.4. Viés M
Apresentamos, na figura 6.5, um exemplo quando a definição tradicional ou associacional
de confundimento falha (Elwert, 2013; Greenland et al., 1999; Hernan and Robins,
2018). Usando-se o critério associacional, o colisor seria identificado como potencial
confundidor: está associado com T e com D e não é descendente de T ou de D. Entretanto,
como vimos no capı́tulo 5, quando um caminho contém um colisor, este caminho está
bloqueado e nenhuma intervenção no sistema precisa ser feita pelo pesquisador. Se
condicionarmos para o Colisor, será aberto um fluxo de associação pela porta de trás
que enviesará nossa estimativa de efeito causal. Devido ao formato do gráfico este tipo
de viés de colisão é denominado de viés M. Este é um dos exemplos que ilustra o fato
de que o confundimento é um conceito causal e que só poderá ser desvelado com base
numa combinação de pressupostos teóricos acerca do mecanismo de geração de dados,
codificados em um DAG e de avaliação empı́rica a partir dos dados.
110
6.5. Estruturas comuns de confundimento
Figura 6.5.: DAG - Viés M - Colisor no caminho pela porta dos fundos
A B
Colisor
T D
ocorrência de uma causa comum e se há caminho aberto pela porta de trás, que precise
ser bloqueado por meio de uma intervenção do pesquisador no sistema.
Na figura 6.6 vemos uma estrutura simples de garfo, representando causa comum,
onde C é causa comum direta, tanto de T quanto de D. Há um caminho aberto pela
porta dos fundos T ← C → D. Nesta estrutura, condicionamento para C desvela o
efeito causal.
Na figura 6.7 vemos uma estrutura de garfo com mediação, onde C é causa comum
direta de D, e indireta de T, por meio de A. Há um caminho aberto pela porta dos
fundos T ← A ← C → D, sendo necessário bloqueá-lo para que o efeito causal seja
identificado. Nesta estrutura, condicionamento para A ou C (ajuste mı́nimo suficiente)
ou para A e C seriam recomendados para identificação, sem viés, do efeito causal.
Na figura 6.8 temos também uma estrutura de garfo com mediação. Nesta estrutura,
C é causa comum direta de T, e indireta de D, mediada por B. O caminho pela porta
dos fundos T ← C → B → D está aberto. Nesta estrutura, condicionamento para B ou
C (ajuste mı́nimo suficiente) ou para B e C seriam necessários para identificação, sem
viés, do efeito causal.
Finalmente, na figura 6.9 vemos uma estrutura de garfo com mediação, onde C é
causa comum indireta, tanto de D, por meio de B, quanto de T, por meio de A. O
caminho não causal aberto pela porta dos fundos T ← A ← C → B → D precisa ser
fechado. Nesta estrutura, condicionamento para A, B ou C (ajuste mı́nimo suficiente)
ou para A e B, A e C, B e C ou A, B e C seriam indicados para identificação do
efeito causal. Note que, usando-se analogia com o fluxo da água em uma tubulação, a
interrupção do fluxo de associação pode ser realizado em qualquer ponto do sistema,
para que o fluxo de associação não espúrio, que flui pela porta de trás, seja fechado.
A forma de se atingir a identificação do efeito causal é bloquear todos os fluxos de
associação espúrios que fluem pela porta de trás, em caminhos não bloqueados por
colisores, deixando aberto os fluxos causais de associação entre T e D, que fluem pela
porta da frente.
111
6. Viés de confundimento: do conceito associacional ao conceito estrutural
Figura 6.7.: DAG - Viés de confundimento - C como causa comum indireta de T via A
e direta de D
A C
T D
112
6.7. Conclusão
Figura 6.8.: DAG - Viés de confundimento - C como causa comum direta de T indireta
de D via B
C B
T D
Figura 6.9.: DAG - Viés de confundimento - C como causa comum indireta de T via A
e indireta de D via B
A B
T D
6.7. Conclusão
Na figura 6.9 resumimos as definições associacional e estrutural de confundimento.
Vimos que, muitas vezes, as duas definições chegam à mesma conclusão. Entretanto,
quando elas discordam é a definição estrutural que sempre acerta. Assim, vimos que
realizar inferência causal a partir de dados observacionais requer pressupostos causais
derivados do conhecimento prévio. Derivar a necessidade de ajuste a partir de associações
113
6. Viés de confundimento: do conceito associacional ao conceito estrutural
T D
Figura 6.11.: Gráfico mutilado demonstrando o operador do(.) para os dois valores do
tratamento T
C C
do(T=0) T D do(T=1) T D
detectadas nos dados empı́ricos pode levar a erros. Portanto, é impossı́vel decidir sobre
a ajuste com base em critérios puramente associacionais. A análise causal requer uma
mistura de dados e pressupostos, mas toda inferência causal é sempre condicional a
estes pressupostos (Pearl, 2001). Dito em outras palavras, só é possı́vel decidir qual o
conjunto mı́nimo de ajuste a partir de um entendimento teórico da estrutura causal
subjacente .
De acordo com Morgan and Winship (2015) é preciso mudar a perspectiva de análise
dos confundidores para o critério da porta dos fundos. A estrutura de confundimento
geralmente não é simples, pois, na maioria dos casos não existe apenas um confundidor
para que as regras de identificação possam funcionar, mesmo com os reparos mencionados
(Rothman 2008). Nos gráficos, as variáveis tem vários caminhos que as conectam e estes
caminhos são compostos por uma variedade de cadeias, garfos e colisores (Pearl 2016).
Assim, somente com a aplicação do critério da porta de trás, assumindo-se que não há
confundidor omitido (pressuposto quase sempre irrealista), será possı́vel se identificar
um conjunto mı́nimo de ajuste para confundimento e identificar o efeito causal.
114
6.8. Métodos de ajuste para confundimento
115
6. Viés de confundimento: do conceito associacional ao conceito estrutural
Para se avaliar o efeito de exposições causadoras de doenças temos que lançar mão
de estudos observacionais, nos quais, na maioria das vezes, não há permutabilidade
entre os grupos. Precisamos, então, usar o nosso conhecimento prévio para identificar
um conjunto mı́nimo de variáveis de ajuste para confundimento e usar métodos capazes
de minimizar este viés.
Os procedimentos de controle de confundimento podem ser divididos em métodos
baseados em estratificação e métodos generalizados (Hernan and Robins, 2018). Os
métodos baseados em estratificação são os mais usados e abrangem estratificação,
restrição, regressão e pareamento. Os métodos generalizados incluem a padronização,
a fórmula G-paramétrica, ponderação pelo inverso da probabilidade de seleção em
modelos estruturais marginais e estimação G em modelos estruturais aninhados. Nos
próximos capı́tulos veremos, em detalhes e com exemplos práticos, o uso de alguns destes
métodos. Na tabela ?? abaixo apresentamos um resumo destes métodos, dividindo-os
em não paramétricos e paramétricos ou semi-paramétricos.
6.9. Exercı́cios
1. Charig et al. (1986) compararam a taxa histórica de sucesso na remoção de cálculos
renais da cirurgia aberta versus a nefrolitotomia percutânea. Observaram que a
cirurgia aberta foi bem sucedida em 78% dos casos, enquanto a nefrolitotomia
percutânea teve uma taxa de sucesso mais elevada, de 83%. Entretanto, quando
observaram os resultados estratificando pelo tamanho dos cálculos renais, para os
116
6.9. Exercı́cios
cálculos menores que 2 cm, a taxa de sucesso da cirurgia aberta (93%) foi maior
do que a da nefrolitotomia (87%). Da mesma forma, para cálculos maiores ou
iguais a 2 cm, a cirurgia aberta também foi mais bem sucedida (73%) do que
a nefrolitotomia (69%). Como você explicaria que no conjunto a nefrolitotomia
apresentou maior taxa de sucesso, mas separadamente para cálculos maiores e
menores o resultado foi revertido e o sucesso da cirurgia aberta foi superior? Na
sua resposta, desconsidere a probabilidade de erro aleatório.
3. Na tabela 6.11 estão mostrados os dados do estudo de Charig et al. (1986). Usando
o arquivo charig.dta, e os comandos utilizados no exemplo resolvido do paradoxo
de Simpson 6.1.2, calcule a razão de risco em cada estrato e a razão de risco bruta
e ajustada. Alternativamente você pode realizar os cálculos no programa OpenEpi
(de domı́nio público, disponı́vel na página http://www.openepi.com). Clique no
menu à esquerda em Cálculos, Tabela 2 x 2. Depois clique em Entrar dados
e digite os dados para o estrato 1 (C=1). Em seguida clique no botão Adicionar
Estrato e digite os dados para o estrato 2 (C=0). Finalmente clique no botão
Calcular.
4. Há interação, ou seja, a razão de risco foi diferente nos estratos com cálculos
menores e maiores? Leve também em conta na sua resposta o resultado do teste
de heterogeneidade.
5. Há confundimento? Há causa comum? Há caminho aberto pela porta de trás no
DAG que você desenhou?
9. Se poderia concluir, com base no coeficiente de mortalidade geral, que uma cidade
tem maior risco de mortalidade do que a outra? Por quê?
117
6. Viés de confundimento: do conceito associacional ao conceito estrutural
13. Com base no DAG, você escolheria os coeficientes especı́ficos de mortalidade por
faixa etária ou o coeficiente de mortalidade geral para embasar a sua conclusão?
14. Qual das duas cidades, São Luı́s ou Porto Alegre, apresenta maior risco de
mortalidade?
Total
D=1 % Sucesso D=0 Total
T=1 289 83 61 350
T=0 273 78 77 350
Total 562 80 138 700
T=1 Nefrolitotomia percutânea
T=0 Cirurgia aberta
Fonte: Charig et al. (1986)
118
6.10. Apêndice - Interação e modificação de efeito
Tabela 6.12.: Coeficientes de mortalidade especı́ficos por faixa etária e geral em São
Luı́s e Porto Alegre, 2015
São Luı́s Porto Alegre
Coeficiente de mortalidade
Coeficiente de mortalidade
População residente
Número de óbitos
Número de óbitos
Faixa etária
por mil
por mil
0a4 328 85.023 3,86 211 85.004 2,48 1,55
5a9 25 87.255 0,29 19 86.585 0,22 1,31
10 a 14 36 91.791 0,39 40 101.110 0,40 0,99
15 a 19 206 88.450 2,33 169 103.528 1,63 1,43
20 a 29 527 206.505 2,55 401 223.411 1,79 1,42
30 a 39 475 197.950 2,40 500 255.554 1,96 1,23
40 a 49 502 137.303 3,66 662 178.861 3,70 0,99
50 a 59 647 94.333 6,86 1.313 187.645 7,00 0,98
60 a 69 835 51.017 16,37 1.873 136.345 13,74 1,19
70 a 79 1.033 22.864 45,18 2.302 74.591 30,86 1,46
≥80 1.520 11.402 133,31 3.819 44.232 86,34 1,54
Total 6.141 1.073.893 5,72 11.328 1.476.866 7,67 0,75
119
6. Viés de confundimento: do conceito associacional ao conceito estrutural
Total
D=1 D=0 Total
T=1 40 160 200
T=0 20 180 200
Total 60 340 400
RRT D = 2,00
RR=Razão de Risco
Total
D=1 D=0 Total
T=1 32 168 200
T=0 28 172 200
Total 60 340 400
RRT D = 1,14
RR=Razão de Risco
3 Para simplificar a questão, estamos considerando apenas a estimativa pontual, ignorando a pos-
sibilidade de que a razão de risco possa ser maior ou menor do que 1 apenas por acaso. Não
estamos prevendo a possibilidade de erro aleatório. Numa situação real, estas conclusões têm que
ser baseadas também na observação dos intervalos de confiança.
120
7. Viés de colisão
7.1. Viés de Berkson
Berkson, em 1946, publicou um artigo para tentar responder a uma pergunta da época: a
colecistite, inflamação da vesı́cula biliar, causa diabetes? A partir de dados provenientes
de estudos com pacientes internados em hospitais, se notou uma associação entre as
duas condições. Alguns cirurgiões começaram, inclusive, a indicar a retirada da vesı́cula
como tratamento para o diabetes. Apesar de Berkson ter analisado dados hipotéticos,
as tabelas apresentadas no seu artigo mimetizam o que vinha sendo observado com
base em dados reais (Berkson, 1946).
No seu artigo, Berkson ilustra um desenho de estudo caso-controle. Os casos são
pacientes diabéticos e os controles são pacientes com erros de refração, que procuraram
o hospital para atendimento. Pacientes com erros de refração foram escolhidos para
compor o grupo controle pois, a princı́pio, esta condição não se relaciona com o diabetes.
A colecistite ocorreu mais frequentemente no grupo de pacientes com diabetes (8,6%)
do que no grupo de pessoas com erros de refração (4,7%). O odds ratio foi de 1,89.
Portanto, os dados sugerem que a colecistite está associada com o diabetes (Tabela 7.1,
parte superior).
Vejamos agora o que ocorreria se toda a população tivesse sido estudada, ao invés
apenas quem procurou assistência hospitalar. Na parte inferior da tabela 7.1, vemos que
o percentual de diabéticos que apresentavam colecistite na população geral (3,0%) foi
idêntico ao percentual de pacientes com erros de refração que tinha colecistite (3,0%).
O odds ratio foi de 1,00, indicando que não há associação entre colecistite e diabetes a
nı́vel populacional. Berkson também demonstrou não haver associação entre colecistite e
diabetes ao examinar os dados apenas das pessoas que não tinham procurado o hospital
(OR=1,00, parte central da tabela 7.1). Assim, como explicamos que, ao considerar
apenas os pacientes que procuraram o hospital, encontramos associação entre colecistite
e diabetes e, quando analisamos toda a população, esta associação desaparece?
A resposta está nas diferentes probabilidades de ir ao hospital para as diferentes
doenças e combinações de doenças. A probabilidade de procurar o hospital depende de
fatores como nı́vel socioeconômico, existência de serviço de diagnóstico e tratamento
para a doença, reputação do hospital, dentre outros fatores. Além disso, se o indivı́duo
tiver mais de uma doença, a probabilidade de hospitalização é maior do que se a pessoa
tiver apenas uma doença. No exemplo de Berkson, a probabilidade de hospitalização
foi maior para os pacientes que tinham diabetes e colecistite (626/3000 x 100 =
20,9%) do que para aqueles que apresentavam apenas diabetes e não tinham colecistite
(6693/97000 x 100 = 6,9%). A probabilidade de procurar o hospital entre os controles
também foi maior para os que tinham colecistite e erros de refração (9504/29700
121
7. Viés de colisão
x 100 = 32,0%) do que para aqueles que apresentavam apenas erros de refração
(192060/960300 x 100 = 20,0%). Dessa forma, tanto a colecistite quando o diabetes
aumentam as probabilidades de hospitalização e esta probabilidade é maior quando as
duas condições estão combinadas, do que quando estas ocorrem separadamente. Isto
cria uma associação entre colecistite e diabetes entre as pessoas hospitalizadas. Esta
associação não se deve, então, a um efeito causal da colecistite no diabetes, mas é devido
a diferentes probabilidades de hospitalização. Como foram incluı́das apenas pessoas
que procuraram o hospital no estudo, a forma como os indivı́duos foram selecionados
gerou viés. Por isto, tradicionalmente, o viés de Berkson é considerado uma forma de
viés de seleção (Pearce and Richiardi, 2014; Westreich, 2012).
122
7.2. Conceito
Diabetes
Hospitalização (H=1)
Colecistite
7.2. Conceito
Viés de seleção é o viés causado pela forma como os indivı́duos são selecionados
para análise. A partir de uma determinada população alvo, apenas uma amostra desta
população é selecionada ou se auto-seleciona para estudo e esta parcela selecionada difere
em vários aspectos da população alvo, o que gera viés (Rothman et al., 2008; Hernan and
Robins, 2018). É sinônimo de viés de colisão que, numa definição estrutural, significa
condicionamento indevido por um efeito comum do tratamento e do desfecho. Este viés
ocorre também quando o condicionamento indevido for feito por um descendente do
colisor e também quando a variável colisora for um efeito comum de uma causa do
tratamento e de uma causa do desfecho. Assim, viés de colisão surge toda vez que se
realizar um condicionamento indevido para um colisor ou descendente do colisor que
seja efeito comum de duas variáveis: uma sendo o tratamento ou causa do tratamento
e a outra sendo o desfecho ou causa do desfecho (Hernan et al., 2004; Hernan and
Robins, 2018). A consequência é que a associação entre o tratamento e o desfecho entre
os selecionados para análise difere da associação que seria observada entre todos os
elegı́veis para o estudo (RRAT D|C 6= RRCT D , onde RRA=Risco Relativo Associacional,
RRC=Risco Relativo Causal). Como a associação entre os selecionados difere da que
seria observada entre os elegı́veis, isto provoca falta de permutabilidade entre os tratados
e os não tratados no grupo selecionado para estudo (Hernan and Robins, 2018).
Um exemplo de viés de colisão/seleção pode ser demonstrado ao se estudar efeitos
de fatores perinatais, que podem provocar desfechos fetais adversos intra-útero, apenas
entre nascidos vivos. Por exemplo, desejamos saber se a suplementação com ácido fólico
é capaz de prevenir malformação cardı́aca. O ideal é que estudemos esta hipótese em
todas as gestações, incluindo aquelas terminadas em abortos, natimortos ou nascidos
123
7. Viés de colisão
Figura 7.2.: DAG ilustrando o viés de colisão quando estudamos efeito de fatores
perinatais nos desfechos fetais adversos apenas em nascidos vivos
Malfomações Cardı́acas
Sabemos que a suplementação com ácido fólico previne malformações do tubo neural,
o que reduz a probabilidade da gestação terminar em abortamento ou natimorto. Assim,
a suplementação com ácido fólico aumenta a probabilidade da gestação terminar em
nascido vivo, pois reduz abortamento e natimortalidade devidas a malformações do
tubo neural, daı́ a seta partindo da suplementação para nascido vivo. Por outro lado,
um feto com malformação cardı́aca tem menor probabilidade de nascer vivo do que ter
a gestação terminada em aborto ou natimorto. Por isso colocamos uma seta partindo
da malformação cardı́aca para nascido vivo. Vamos supor que a suplementação com
ácido fólico não esteja associada com redução do risco de malformação cardı́aca na
população geral de gestações (que possam ter resultado em abortos, natimortos ou
nascidos vivos). Neste caso, condicionar por nascido vivo pode gerar uma falsa associação
entre suplementação com ácido fólico e malformação cardı́aca nesta subpopulação. Ao
condicionarmos pela sobrevivência, estudando apenas nascidos vivos, estaremos abrindo
um caminho espúrio, não causal, entre Suplementação com ácido fólico → Nascido vivo
← Malformação cardı́aca, que estava fechado pelo colisor. Este é um exemplo de viés
de colisão pela porta da frente (Hernan and Robins, 2018).
124
7.4. Exemplo numérico de viés de colisão - Dieta e risco de câncer não relacionado com a dieta
Hernan (2002) apresenta dados hipotéticos de um estudo para avaliar se fazer dieta
causa câncer não relacionado com a dieta. A variável de tratamento é estar fazendo
dieta e a variável desfecho é diagnóstico recente de câncer não relacionado com a dieta.
Vemos, na parte de baixo da tabela 7.2, que fazer dieta não causa câncer não relacionado
com a dieta (RRT D = 0,92 (0,71-1,21). Entretanto, se estudarmos esta associação
apenas entre aqueles que perderam peso recentemente, chegarı́amos à conclusão de que
fazer dieta é um fator de proteção para a ocorrência de câncer não relacionado com a
dieta (RRT D|C=1 = 0,79 (0,66-0,93). Como explicar este achado? Afinal de contas fazer
dieta protege ou não o indivı́duo de desenvolver câncer não relacionado com a dieta?
125
7. Viés de colisão
Total
D=1 % Dieta D=0 Total
Dieta (T=1) 100 50% 100 200
Dieta (T=0) 200 50% 200 400
Total 300 50% 300 600
RRT D = 1,00 (0,84-1,19)
Fonte: adaptado de Hernan (2002), com base em dados hipotéticos
Para ilustrar o exemplo numérico, vamos calcular as estimativa das razões de risco
bruta, nos estratos de C e combinada no Stata. Para isto, baixe o arquivo dieta.dta
da página da internet e utilize os seguintes comandos no Stata:
. use dieta
. expand n
(592 observations created)
. cs d t, by(c)
c RR [95% Conf. Interval] M-H Weight
126
7.4. Exemplo numérico de viés de colisão - Dieta e risco de câncer não relacionado com a dieta
Para responder a esta questão, é necessário que utilizemos, além dos dados, o nosso
conhecimento a respeito do problema. A princı́pio nos parece estranho que fazer dieta
possa proteger contra o risco de câncer não relacionado com a dieta. Esta associação nos
parece pouco plausı́vel de ser causal. O nosso conhecimento a respeito deste problema
está codificado no DAG da figura 7.3. Ora, tanto ter câncer não relacionado à dieta
como fazer dieta podem causar perda recente de peso. Assim, a perda recente de
peso é um efeito comum do câncer não relacionado com a dieta e de fazer dieta. Se
condicionarmos para o colisor, via restrição, estaremos abrindo um caminho pela porta
da frente que parte da Dieta no sentido da seta para Perda recente de peso e daı́, no
sentido contrário ao da seta, segue da variável Perda recente de peso para o desfecho
Câncer não relacionado com a dieta (Dieta → Perda Recente de Peso ← Câncer não
relacionado com a dieta). Vimos, no capı́tulo 5, que um caminho que contém um colisor
está fechado por definição e nele não passa associação espúria. Ao abrirmos este caminho
por meio de ajuste para o colisor, criamos uma associação espúria entre fazer Dieta e
Câncer não Relacionado com a Dieta. Se um indivı́duo que não fez dieta tiver perda
recente de peso, isto aumenta a probabilidade dele ter Câncer não relacionado com a
dieta. Da mesma forma, se um indivı́duo tiver perda de peso recente e soubermos que
ele foi diagnosticado com câncer, isto reduz a probabilidade dele ter feito dieta. Ou
seja, se, por meio de restrição, analisarmos a associação entre fazer dieta e câncer não
relacionado com a dieta apenas entre os que tiveram perda recente de peso, estaremos
gerando uma falsa associação negativa entre fazer dieta e câncer não relacionado com a
dieta. O conhecimento do efeito comum das duas variáveis, via restrição, nos permite
deduzir algo a respeito do passado. Por isso nunca devemos condicionar para um colisor.
Figura 7.3.: DAG ilustrando viés de colisão quando condicionamos para perda de peso
em estudo sobre efeito da dieta em câncer não relacionado com a dieta
Dieta
Usaremos então, a razão de risco bruta para interpretar os dados deste estudo,
concluindo que não há associação entre dieta e câncer não relacionado com a dieta.
A não colapsibilidade da medida de associação seria causada por viés de colisão, se
fosse realizado condicionamento indevido para o colisor perda recente de peso. Este
127
7. Viés de colisão
exemplo ilustra que o viés de colisão também causa não colapsibilidade da medida de
associação, tal como o viés de confundimento. Sendo assim, a não colapsibilidade só
pode ser interpretada com base no nosso conhecimento prévio, conhecendo-se a história
por trás dos dados, ou seja, o mecanismo de geração de dados (Pearl et al., 2016).
Figura 7.4.: Viés de colisão pela porta da frente - condicionamento por variável direta-
mente afetada pela exposição e pela doença
Exposição
Colisor
Doença
128
7.5. Exemplos de algumas estruturas de viés de colisão
Neste caso (figura 7.5), quando condicionamos por uma variável descendente de
um colisor da exposição e da doença, o viés tende a ser de menor intensidade
(Hernan, 2002).
Figura 7.5.: Viés de colisão pela porta da frente - condicionamento por descendente de
colisor
Exposição
Doença
3. Condicionamento por variável afetada pela exposição e por uma causa da doença
Nesta forma, conforme ilustrado na figura 7.6, o colisor é afetado diretamente
pela exposição e por uma causa da doença. Esta causa da doença é causa comum
da própria doença e do colisor. A associação espúria surge de um caminho aberto
pela porta da frente, a partir de condicionamento por um colisor (Exposição →
Colisor ← Causa da Doença → Doença). Como a associação entre a doença e
exposição é direta, mas a associação entre a doença e o colisor não é direta, mas
ocorre devido a uma causa comum da doença e do colisor, este viés também tende
a ser magnitude intermediária.
Figura 7.6.: Viés de colisão pela porta da frente - condicionamento por variável afetada
pela exposição e por uma causa da doença
Exposição
Doença Colisor
Causa da Doença
129
7. Viés de colisão
Neste caso o viés também tende a ser de magnitude intermediária. Como demons-
trado na figura 7.7, a associação entre a doença e o colisor é direta, mas a relação
entre a exposição e o colisor é indireta, mediada pelo descendente da exposição.
A associação espúria surge de um caminho aberto pela porta da frente, a partir
de condicionamento por um colisor (Exposição → Consequência da Exposição →
Colisor ← Doença).
Figura 7.7.: Viés de colisão pela porta da frente - condicionamento por variável afetada
por uma consequência da exposição e pela doença
Doença Colisor
Figura 7.8.: Viés de colisão pela porta da frente - condicionamento por variável afetada
por uma consequência da exposição e pela doença
Exposição
130
7.5. Exemplos de algumas estruturas de viés de colisão
Figura 7.9.: Viés de colisão pela porta da frente - condicionamento por variável inter-
mediária afetada pelo tratamento (mediador), que também é colisora do
mediador e do desfecho
Colisor/Mediador D
Vejamos, agora, alguns exemplos de viés de colisão pela porta dos fundos.
1. Condicionamento por variável afetada pela doença e por uma causa da exposição
1 colocamos efeito direto entre aspas porque, de fato, nem o efeito direto de T em D estaria sendo
estimado, mas sim uma medida de associação que não teria interpretação causal, nem mesmo como
efeito direto de T em D.
131
7. Viés de colisão
Figura 7.10.: Viés de colisão pela porta de trás - condicionamento por variável afetada
pela doença e por uma causa da exposição
Causa da Exposição
2. Condicionamento por variável não afetada pela exposição ou pela doença, mas
afetada por causas da exposição e da doença, situada em caminho pela porta dos
fundos
Este exemplo de viés de colisão é denominado viés M (Figura 7.11). Este viés
tende a ser de pequena intensidade (Wei et al., 2012), pois as associações tanto
entre a exposição e o colisor, como entre a doença e o colisor são devidas a causas
comuns da exposição e do colisor, e da doença e do colisor. A associação espúria
surge de um caminho aberto pela porta de trás, a partir de condicionamento por
um colisor (Exposição ← Causa da Exposição → Colisor ← Causa da Doença →
Doença).
Figura 7.11.: Viés M - Colisor no caminho pela porta dos fundos - condicionamento por
variável afetada por uma causa da exposição e por uma causa da doença
Colisor
Exposição Doença
132
7.7. Viés de colisão provocado por perdas de seguimento
ser de pequena intensidade (Greenland, 2003). Assim, o viés M, que é sempre devido a
causas comuns do colisor e da exposição(variáveis pré-tratamento ou pré-exposição), e
do colisor e do desfecho, é sempre de baixa intensidade.
Assim, a magnitude do viés de colisão depende da parcela da associação mediada, da
intensidade e direção das associações entre o colisor e a exposição e entre o colisor e a
doença, e também da presença de intermediários nestes caminhos.
Figura 7.12.: Viés M - Colisor no caminho pela porta dos fundos - condicionamento
por variável afetada por uma causa da exposição e por uma consequência
de uma causa da doença
133
7. Viés de colisão
(2018), não há confundimento por variável omitida, ou seja, o nosso conhecimento da
realidade é completo e expresso neste diagrama causal. Vamos também pressupor que
não há viés de aferição ou erro aleatório.
A ocorrência de efeitos colaterais dos medicamentos pode fazer com que o paciente
interrompa o uso da medicação (daı́ a seta CE - Efeitos colaterais → T - Uso de
antiretroviral). Por outro lado, a ocorrência de efeitos colaterais também pode fazer
com que o paciente desista do estudo e não mais participe do mesmo (CE - Efeitos
colaterais → COL - Participação no estudo). CD4 baixo, que reflete imunosupressão,
provoca sintomas e, por sua vez, é causa de mortalidade (CD - CD4 baixo → CCD -
Sintomas, CD - CD4 baixo → D - Mortalidade). Pacientes com sintomas graves podem
também não participar mais do estudo (CCD - Sintomas → COL - Participação no
estudo).
De qualquer forma, viés de colisão causado por restrição devido à não participação
no estudo de uma parte da amostra leva à quebra da permutabilidade entre os grupos.
Os grupos que participaram do estudo até o final não são mais permutáveis entre si,
pois diferem daqueles que deixaram de participar em relação a uma ou mais variáveis
preditoras do tratamento.
134
7.8. Exemplo de viés de colisão pela porta da frente - variável intermediária afetada pelo tratamento
Figura 7.13.: Viés de colisão pela porta da frente - variável intermediária afetada pelo
tratamento
Obesidade
Diabetes Mortalidade
Fumo
Fonte: adaptado de Preston and Stokes (2014)
Caminhos causais
(3) Obesidade → Mortalidade
(4) Obesidade → Diabetes → Mortalidade —— Mediador
Assim, de acordo com o conhecimento codificado neste DAG, para quais variáveis seria
necessário se realizar condicionamento/ajuste para se estimar o risco de mortalidade
associado à obesidade? Usando-se o critério da porta de trás, vemos que o único caminho
não causal pela porta da frente já está bloqueado por um colisor, Diabetes (caminho
5). Os caminhos causais pela porta da frente precisam ser deixados abertos (caminhos
3, direto e 4, com o mediador Diabetes). Pela porta de trás há dois caminhos abertos,
mas um deles contém um mediador, Diabetes e não podemos ajustar para um mediador
(caminho 2). Assim, precisamos encontrar uma variável que não seja mediadora ou
colisora e que feche ambos os caminhos pela porta de trás (caminhos 1 e 2), para que se
estime, sem viés, o efeito causal da obesidade na mortalidade. Ajustando-se para fumo,
135
7. Viés de colisão
bloquearemos estes dois caminhos pela porta dos fundos. Observe que neste exemplo,
Diabetes é simultaneamente um Colisor e um Mediador, portanto há dois motivos para
não se ajustar para Diabetes.
A partir deste DAG, usando o conhecimento empı́rico acumulado, Preston and Stokes
(2014) investigaram este viés de colisão. Um problema frequente quando se estuda o
risco de mortalidade associado à obesidade é a causalidade reversa. Indivı́duos doentes
podem ter perda de peso e maior risco de mortalidade. A doença pode ter provocado a
perda de peso e alterado o estado do indivı́duo de obeso para não obeso. Doença mais
grave pode levar a óbito, produzindo viés de sobrevivência, pois só os sobreviventes
participam do estudo. Estes fatores explicam porque há inversão do risco de óbito em
indivı́duos obesos com diabetes, que parece ser produzido, pelo menor parcialmente, por
viés de colisão. Os diabéticos mais graves ou morreram ou perderam peso. Isto poderia
explica este aparente ”paradoxo da obesidade”. Os diabéticos obesos sobreviventes
aparentemente ”morrem menos”porque alguns de seus pares obesos mais graves já
morreram ou perderam peso e passaram para o grupo dos não obesos e terão maior
mortalidade neste grupo, enviesando a associação. Este exemplo demonstra o perigo
de se extrapolar conclusões obtidas a partir de dados de um estudo clı́nico para a
população geral. O viés de colisão é suficiente para fazer uma exposição maléfica parecer
protetora (Banack and Kaufman, 2015).
Este exemplo também serve para ilustrar a necessidade de extrema cautela ao se
ajustar para variáveis pós-tratamento, tanto em ensaios clı́nicos, como em estudos
observacionais (Greenland, 2003). Para se analisar o efeito total do tratamento este
tipo de ajuste (para variável pós-tratamento) nunca deve ser realizado. Para se estimar
o efeito direto, ele pode ser realizado, desde que também seja feito ajuste para causas
comuns da variável pós-tratamento e do desfecho, além do ajuste para causas comuns
da exposição e da doença (Greenland, 2003). Voltaremos a esta questão de ajuste para
obtenção do efeito direto no capı́tulo ??.
136
7.10. Diferenças e semelhanças entre viés de confundimento e viés de colisão
CC - Colisor/Confundidor
T - Exposição D - Doença
137
7. Viés de colisão
7.12. Exercı́cios
1. Na tabela 7.3 são apresentados os dados de um estudo para avaliar o possı́vel efeito
da suplementação periconcepcional de ácido fólico na prevenção de malformações
do tubo neural (Hernan, 2002). Trata-se de um estudo caso controle, no qual
os casos são produtos da gestação, incluindo abortos, natimortos e nascidos
vivos com malformação do tubo neural (D=1) e os controles são produtos da
gestação com outras malformações congênitas (D=0). O tratamento (T=1) foi a
suplementação periconcepcional com ácido fólico. Os dados são apresentados para
toda a população e estratificados para C (C=1, incluindo abortos e natimortos, e
C=0, abrangendo apenas os nascidos vivos). Responda às perguntas seguintes
assumindo que não há erro de mensuração, que não há confundimento por outra
variável omitida e que o odds ratio é colapsável, pois a doença é rara.
138
7.12. Exercı́cios
4. Há interação, ou seja, a razão de risco foi diferente nos estratos? Leve também
em conta na sua resposta o resultado do teste de heterogeneidade.
5. Há confundimento? Há causa comum? Há caminho aberto pela porta de trás no
DAG que você desenhou?
9. Para responder a esta questão você utilizou o odds ratio bruto ou o ajustado?
Por quê?
139
7. Viés de colisão
C=1 Aborto/Natimorto
D=1 D=0 Total
T=1 19 8 27
% Ácido Fólico 16,0 14,8 15,6
T=0 100 46 146
Total 119 54 173
140
7.12. Exercı́cios
fumo materno durante a gravidez poderia ser modificado pelo peso ao nascer, de
maneira que o fumo seria benéfico para crianças com baixo peso ao nascer.
11. Assumindo-se que todas as variáveis foram medidas sem erro, que não há causas
comuns não incluı́das e baseado no DAG da figura 7.15 abaixo, como você
explicaria o paradoxo do peso ao nascer?
12. Há confundimento? Há causa comum? Há caminho aberto pela porta de trás no
DAG?
13. O risco relativo ajustado para o peso ao nascer foi 1,09 (IC 95% 1,05 - 1,12). Há
colapsibilidade da medida de associação?
14. Você usaria o risco relativo marginal (não ajustado) ou os riscos relativos condici-
onais, obtidos nos estratos para responder a esta questão?
15. Há permutabilidade entre tratados (fumantes) e não tratados (não fumantes) na
população geral?
16. Há permutabilidade entre tratados e não tratados no estrato de baixo peso ao
nascer?
17. Para analisar se a mortalidade infantil é maior entre crianças de mães fumantes,
comparadas a crianças de mães não fumantes, deveria ser realizado ajuste para o
peso ao nascer? Por quê?
Fumo materno
Malformações fetais
141
Parte III.
143
8. Métodos de análise com escore de
propensão
8.1. Escore de propensão
Os métodos de análise com escore de propensão foram desenvolvidos a partir do artigo
seminal de Rosenbaum and Rubin (1983) para reduzir viés de seleção na estimativa do
efeito causal do tratamento. Seu uso nos estudos observacionais ocorre na tentativa
de compensar a ausência de randomização, com o objetivo de equilibrar os grupos de
tratamento e controle. Rosenbaum and Rubin (1983) demonstraram que o escore de
propensão é suficiente para balancear a variável de exposição (ou de tratamento) em
relação às variáveis observadas.
Uma das técnicas mais utilizadas com o escore de propensão é o pareamento. Quando
pareamos por uma variável é mais fácil encontrar um par. Se desejamos parear pelo
sexo, por exemplo, é fácil encontrar pares homens e mulheres no banco de dados. Porém,
em estudos que envolvem muitas variáveis é difı́cil se encontrar um par para todos. Se
o pareamento for, por exemplo, por sexo, nı́vel socioeconômico, tabagismo e obesidade,
poderemos ter dificuldade, por exemplo, para encontrar pessoas em determinadas
combinações de categorias destas variáveis. Se cada variável tiver apenas 2 nı́veis, será
uma tabela 2 x 2 x 2 x 2, ou seja uma tabela com 16 caselas e precisaremos encontrar
pares em cada uma destas caselas nos grupos de tratamento e controle.
Na tabela 8.1 ilustramos a realização do pareamento pelas variáveis observadas,
utilizando dados fictı́cios. A pergunta do estudo é se a participação no programa de
saúde da famı́lia reduz o percentual de crianças com esquema vacinal básico incompleto
no primeiro ano de vida. Como variáveis de confundimento observadas, temos renda
familiar per capita, medida em salários mı́nimos, e escolaridade materna, mensurada
em anos de estudo. De um total de 10 famı́lias estudadas, 5 recebiam visitas regulares
de um agente de saúde do PSF (codificado como 1) e 5 não participavam do programa
(codificado como 0). Iniciemos com a observação 1. A renda familiar é de 0,25 salário
mı́nimo per capita e a mãe estudou até o segundo ano do ensino fundamental. Qual
o melhor par controle para esta observação? Qual a criança que não participou do
PSF cuja famı́lia tem os valores mais próximos de renda e escolaridade? Observando a
tabela, vemos que a observação com valores mais próximos é a criança 8. Desta forma
1 e 8 serão pareados na nossa análise. Procedendo da mesma forma, formamos os pares
2 - 6, 3 - 7, 4 - 8 e 5 - 8. Note que o nosso pareamento permite reposição. Então a
observação 8 será par para três casos: 1, 4 e 5. Teremos que descartar as observações
controle 9 e 10, pois elas não se parecem com nenhuma criança do grupo exposto ao
tratamento (participação no PSF). Este exemplo simples já nos serve para ilustrar
145
8. Métodos de análise com escore de propensão
146
8.1. Escore de propensão
como variáveis preditoras neste modelo. Ao final basta resolver a equação do modelo
logı́stico e calcular a probabilidade de tratamento. Esta probabilidade de tratamento
é o escore de propensão. Note que a regressão logı́stica é, neste caso, utilizada com
finalidade preditiva e não explicativa ou causal. Neste passo da modelagem, como
usamos um modelo preditivo, não teremos o problema de viés de confundimento, pois
uma variável de confusão, porque está associada ao tratamento, é uma boa preditora
da probabilidade do indivı́duo ser tratado.
Realizamos este cálculo e colocamos os resultados na última coluna da tabela 8.1.
Com base no escore de propensão vamos escolher, agora, os pares controles para as
nossas observações tratadas, ou seja, as que participaram do PSF. O escore de propensão
da criança 1 foi 0,90. O escore mais próximo deste no grupo controle é o da criança
8 (0,73). Assim pareamos a criança 1 com a criança 8. Continuando com o mesmo
procedimento formamos os pares 2 (0,43) com 6 (0,46), 3 (0,53) com 7 (0,49), 4 (0,81)
com 8 (0,73) e 5 (0,63) com 8 (0,73). Descartamos, portanto, as crianças 9 e 10. Note
que os pares formados foram os mesmos de quando realizamos o pareamento com
base nas variáveis observadas. Utilizando-se amostras pequenas e com poucas variáveis
preditoras, isto é fácil de ocorrer. Entretanto, agora podemos observar melhor se o
pareamento foi bom ou ruim. Para isto basta obter as diferenças entre os escores de
propensão de cada par. Quanto menor for esta diferença, mais próximos estão os valores
do par e, portanto, melhor o pareamento. Para o primeiro par (1 e 8) a diferença foi
0,90 - 0,73 = 0,17. E para os demais pares: 2 e 6 (0,03), 3 e 7 (0,04), 4 e 8 (0,08)
e 5 e 8 (0,10). Como há algumas diferenças grandes, o balanceamento das variáveis
não foi atingido neste caso. Este exemplo, com uma amostra muito pequena (n=10),
serve para demonstrar, de forma didática como se realiza o pareamento com o escore
de propensão. É muito difı́cil se obter balanceamento de variáveis com amostras tão
pequenas. É também óbvio que para responder a esta pergunta, de forma adequada,
precisaremos de mais observações. Veremos como avaliar de forma mais detalhada o
balanceamento das variáveis nos grupos tratado e controle mais adiante, com outro
exemplo, baseado em amostra maior.
De qualquer forma, este exemplo ilustra também que, muitas vezes, não vamos
encontrar controles adequados para cada observação e também seremos obrigados a
descartar algumas observações controles que sejam muito diferentes das tratados, como
foi o caso das crianças 9 e 10. Este procedimento de exclusão, se por um lado aumenta
a validade interna do estudo, porque se formam grupos mais comparáveis entre si, por
outro lado reduz a generalização externa dos achados para a população como um todo.
Assim, é importante que seja verificado se há zona de suporte comum, ou seja, se há
controles adequados para cada tratado. Muitas vezes, para se atingir um pareamento
mais adequado é comum se restringir a escolha de controles a uma zona mais restrita de
semelhança. Poderı́amos, por exemplo, aceitar pareamento apenas até uma determinada
diferença entre os pares, digamos 0,10. Neste caso, o par 1 - 8 não seria formado e
terı́amos que descartar a observação tratada 1. Isto aumentaria a validade interna do
estudo, mas reduziria a zona de suporte comum e, portanto, a validade externa dos
resultados.
Além do pareamento, há várias outras técnicas utilizadas com o escore de propensão
como a ponderação e a estratificação (Leite, 2017).
147
8. Métodos de análise com escore de propensão
148
8.3. Passos na análise com escore de propensão
Por meio de um DAG é possı́vel identificar caminhos abertos pela porta de trás e
escolher variáveis que não sejam colisoras e que bloqueie estes caminhos abertos pela
porta dos fundos (Pearl, 2009a).
Outra estratégia importante é escolher para ajuste variáveis que contenham menor
erro de mensuração, ou seja, que sejam bem medidas e que tenham boa confiabilidade
(Leite, 2017).
Os critérios de seleção de variáveis para ajuste estão resumidos na tabela 8.2.
149
8. Métodos de análise com escore de propensão
150
8.3. Passos na análise com escore de propensão
Podemos usar os métodos usuais, usando o teste t de Student para verificar diferenças
na média de variáveis contı́nuas e o teste do qui-quadrado para verificar diferenças
entre proporções, no caso de variáveis categóricas. Entretanto, testes estatı́sticos para
avaliar balanceamento entre os grupos não são recomendados pois o balanceamento de
covariáveis é uma propriedade da amostra, enquanto os testes de hipótese se referem
à população (Ho et al., 2007; Leite, 2017). Outro problema é que o p valor depende
do tamanho da amostra. Com amostras grandes há uma tendência de se identificar
como significantes diferenças triviais entre os grupos. Em amostras pequenas há maior
probabilidade de falso negativo, ou seja, de não se detectar diferenças importantes (Leite,
151
8. Métodos de análise com escore de propensão
2017). Por causa disto, outros métodos foram propostos para se verificar balanceamento.
O mais recomendado é verificar se há diferença padronizada absoluta nas médias
entre os grupos tratado e controle. Se a diferença padronizada absoluta entre as médias
for menor do que 0,10 desvio padrão considera-se que não há diferença entre os grupos,
ou seja, eles estão balanceados (Austin, 2011). Podemos usar também um ponto de
corte menos rigoroso, considerando que não há diferença quando esta diferença for
menor do que 0,25 desvio padrão (Stuart, 2010). Recomendamos o uso do critério mais
rigoroso (<0,10). A diferença padronizada absoluta nas médias entre os grupos tratado
e controle é obtida pela fórmula 8.2, onde x̄ é a média aritmética, s é o desvio padrão,
o subscrito t representa o grupo tratado e o c denota o grupo controle.
x̄ − x̄c
p t (8.2)
(s2t + s2c )/2)
Outro método muito usado é comparar toda a distribuição das variáveis nos dois
grupos (tratado e controle), por meio do teste de Kolmogorov-Smirnov. Se o valor de P
deste teste for ≥ 0,05, há equilı́brio entre os grupos. Da mesma forma, como nos demais
testes, este critério pode levar a falso positivo ou a falso negativo, como já comentamos
acima.
A razão de variância também tem sido usada para verificar balanceamento entre os
grupos. Por este critério, os grupos são considerados balanceados se a razão de variância
estiver no intervalo 0,8 - 1,2 (Leite, 2017).
Na saı́da abaixo, obtida por meio do pacote twang no R, vemos uma listagem das
estatı́sticas de balanceamento antes da implementação do escore de propensão. Na
primeira coluna constam os nomes das variáveis. As variáveis categóricas com mais de
dois nı́veis (ocup, escmae e sconj) foram fatoradas, para que sejam analisadas como
categóricas e não como contı́nuas. Porisso aparecem com os nomes ocupf, escmaef e
sconjf, pois o f indica que foram fatoradas. Após o f estão identificadas por um número
cada categoria. Assim, ocupf1 corresponde à ocupação manual não qualificada ou a
desemprego. Nas colunas subsequentes estão apresentadas a média do grupo tratado
(tx.mn), o desvio padrão do grupo tratado (tx.sd), a média do grupo controle (ct.mn),
o desvio padrão do grupo controle (ct.sd), a diferença padronizada absoluta entre as
médias do grupo tratado e controle (std.eff.sz), o resultado da estatı́stica utilizada para
comparar os tratados com os controles (stat, sendo teste t de Student para variáveis
contı́nuas e teste do qui-quadrado para variáveis categóricas), o resultado do p valor da
estatı́stica (p), o valor do teste de Kolmogorov-Smirmov (ks) e o p valor do teste de
Kolmogorov-Smirmov (ks.pval).
$unw
t x . mn t x . sd c t . mn c t . sd s t d . e f f . sz stat p ks ks . pval
idmae 27.257 5.809 25.401 5.703 0.320 6.491 0.000 0.140 0.000
parid 2.242 1.487 2.359 1.749 −0.070 −1.499 0 . 1 3 4 0 . 0 3 4 0.709
catint 0.113 0.317 0.059 0.236 0.203 3.700 0.000 0.054 0.178
ocupf : 1 0.140 0.347 0.235 0.424 −0.271 1 6 . 4 4 0 0 . 0 0 0 0 . 0 9 4 0.000
ocupf : 2 0.648 0.478 0.631 0.483 0.037 NA NA 0 . 0 1 7 0.000
ocupf : 3 0.212 0.408 0.135 0.342 0.188 NA NA 0 . 0 7 7 0.000
escmaef : 1 0.012 0.108 0.038 0.191 −0.243 6.885 0.000 0.026 0.000
escmaef : 2 0.387 0.487 0.463 0.499 −0.155 NA NA 0 . 0 7 6 0.000
152
8.3. Passos na análise com escore de propensão
Observe que há várias diferenças padronizadas absolutas nas médias maiores do que
0,10, que é o ponto de corte mais rı́gido (idade materna, categoria de internação, para
duas das três categorias de ocupação, para três das cinco categorias de escolaridade
materna, para uma categoria de situação conjugal e para trabalho materno). As demais
variáveis podem ser consideradas balanceadas entre os grupos tratamento e controle
por este critério. As variáveis com p valores não significantes nas estatı́sticas também
poderiam ser consideradas balanceadas (paridade, baixo peso ao nascer, nascimento
pré-termo, fumo materno durante a gravidez e sexo do recém-nascido). Pelo teste
de Kolmogorov-Smirnov também poderiam ser consideradas balanceadas as variáveis
categoria de internação e trabalho materno.
Na tabela 8.4 ilustramos os resultados dos testes para verificar balanceamento: t de
Student para variáveis contı́nuas e qui-quadrado para variáveis categóricas.
Como os testes não são indicados para verificar balanceamento, vamos utilizar o
resultado da diferença padronizada absoluta nas médias para detectar quais variáveis
não estão balanceadas nos grupos tratamento e controle. Desta forma, concluı́mos
que as variáveis idade materna, categoria de internação, ocupação do chefe de famı́lia,
escolaridade materna, situação conjugal materna e trabalho materno fora do lar não
estão balanceadas.
153
8. Métodos de análise com escore de propensão
154
8.3. Passos na análise com escore de propensão
155
8. Métodos de análise com escore de propensão
Qual estimativa de efeito causal usar? Isto vai depender dos objetivos, ou seja, da
pergunta do estudo. Se queremos extrapolar os resultados para toda a população,
é necessário o cálculo do ATE. Se estamos avaliando programas de intervenção não
randomizados, queremos saber o que aconteceria com os controles caso eles também
tivessem sido tratados. Neste caso podemos calcular o ATT.
Entretanto, nem sempre o pesquisador poderá calcular qualquer uma dessas três
medidas de efeito causal. Para que o ATE possa ser calculado é necessário que haja zona
de suporte comum, tanto para tratados quanto para não tratados. Neste caso, teremos
que encontrar controles adequados para todos os tratados, que sejam semelhantes
em termos do escore de propensão, e também encontrar tratados adequados para os
controles. Para o cálculo do ATT basta que haja zona de suporte comum para os
tratados, ou seja, há necessidade de encontrar contrastes adequados apenas para os
tratados.
A melhor forma de visualizar se há zona de suporte comum é por meio de um boxplot
do escore de propensão, plotado separadamente para tratados e controles. Se todos os
tratados tiverem controles adequados e todos os controles tiverem tratados adequados o
ATE pode ser estimado. Caso contrário, apenas o ATT ou ATC poderão ser estimados.
No estudo experimental randomizado o ATE é igual ao ATT, que por sua vez é igual
ao ATC.
Na figura 8.1 vemos o boxplot do escore de propensão nos dois grupos do estudo
(parto vaginal e cesáreo). Há uma boa zona de suporte comum, pois os dois boxplots
estão quase paralelos. Entretanto, nota-se que há uma tendência dos indivı́duos do grupo
de tratamento (nascidos por cesariana, codificados como 1) terem maiores valores do
escore de propensão do que os do grupo controle (nascidos de parto normal, codificados
como zero). Note que a mediana é maior no grupo tratado. Neste caso, como há suporte
comum, pode ser realizada a estimativa do ATE.
Veja, agora, na figura 8.2, obtida de outro banco de dados, que os tratados (codificados
como 1) possuem pouca zona de suporte comum com os não tratados (codificados
como 0). Praticamente toda a distribuição dos tratados está fora da distribuição dos
não tratados. Observe que no grupo tratado a maioria dos escores de propensão estão
acima de 0,4, enquanto no grupo controle os escores predominam na faixa inferior a
0,2. Neste caso o ATE não pode ser estimado, sendo a alternativa estimar o ATT.
Neste caso, ao usar o procedimento de ponderação pelo inverso da probabilidade de
seleção, teremos que dar maior peso aos tratados com escore de propensão baixo e maior
peso aos não tratados com escore de propensão alto, para compensar e, assim, poder
formar contrastes contrafatuais adequados na ausência de randomização. Usaremos
este exemplo no próximo capı́tulo, quando isto será mais bem explicado.
Na tabela 8.7 estão calculados o escore de propensão, por meio de regressão logı́stica e
o peso para estimativa do ATE, usando-se as fórmulas da tabela 8.6, a partir do banco de
dados fictı́cio, criado para responder à pergunta se a participação no programa de saúde
da famı́lia causa reduz o percentual de crianças com esquema vacinal básico incompleto
no primeiro ano de vida. Observe que às observações mais raras são atribuı́dos pesos
maiores e às observações mais comuns pesos menores para se atingir o balanceamento
dos grupos. Assim, no grupo controle são mais comuns crianças de famı́lias com baixa
renda e escolaridade, como, por exemplo, as observações 1 e 4. A estes casos foram
156
8.3. Passos na análise com escore de propensão
0.6
Escore de propensão
0.4
0.2
0 1
Tipo de parto
atribuı́dos pesos baixos. No grupo de participantes do PSF, por outro lado, são mais
raras crianças com maior renda e escolaridade, como a criança 2. Note que esta criança
recebeu um peso maior (2,35) para compensar. Já no grupo controle são mais comuns
crianças de maior renda e escolaridade, que receberam pesos baixos, e menos comuns
157
8. Métodos de análise com escore de propensão
0.8
0.6
Escore de propensao
0.4
0.2
0.0
0 1
crianças de menor renda e escolaridade, que receberam pesos mais elevados para
compensar. A atribuição de pesos diferenciados é uma estratégia para reequilibrar os
grupos e atingir a permutabilidade. Se o equilı́brio for atingido pode-se, então, estimar
o efeito causal sem viés em relação às variáveis observadas e incluı́das no modelo
preditivo.
158
8.3. Passos na análise com escore de propensão
Tabela 8.7.: Cálculo do escore de propensão e dos pesos para estimativa do ATE
escmae
1a4 -.1532383 .0055268 .9554554 1.001324
5a8 .0448425 -.0060748 1.044838 .9940105
9a11 .1007613 -.0054168 1.200763 .9898137
12+ .1476059 -.0000941 1.494564 .9997353
ocup
qualsemi .0362967 .0108872 .980052 .9937518
nmanual .2036214 -.0085443 1.43121 .9840537
159
8. Métodos de análise com escore de propensão
sconj
uniaocons -.0732544 .0180009 .7712619 1.061799
casada .1169 -.0113744 .7504987 1.026569
$ e s . mean .ATE
t x . mn t x . sd c t . mn c t . sd s t d . e f f . sz stat p ks ks . pval
catint 0.079 0.270 0.074 0.262 0.018 0.374 0.709 0.005 1.000
trabmat 0.199 0.400 0.195 0.396 0.010 0.195 0.845 0.004 1.000
escmaef : 1 0.019 0.136 0.031 0.173 −0.087 0.516 0.711 0.012 0.711
escmaef : 2 0.435 0.496 0.442 0.497 −0.012 NA NA 0.006 0.711
escmaef : 3 0.287 0.452 0.278 0.448 0.019 NA NA 0.009 0.711
escmaef : 4 0.163 0.370 0.158 0.365 0.013 NA NA 0.005 0.711
escmaef : 5 0.095 0.294 0.091 0.288 0.014 NA NA 0.004 0.711
ocupf : 1 0.190 0.392 0.207 0.405 −0.044 0.347 0.703 0.017 0.703
ocupf : 2 0.648 0.478 0.638 0.481 0.021 NA NA 0.010 0.703
ocupf : 3 0.162 0.369 0.155 0.362 0.019 NA NA 0.007 0.703
sconjf :1 0.047 0.211 0.052 0.223 −0.028 0.242 0.785 0.006 0.785
sconjf :2 0.061 0.239 0.067 0.250 −0.026 NA NA 0.006 0.785
sconjf :3 0.892 0.310 0.880 0.325 0.039 NA NA 0.012 0.785
idmae 25.855 5.520 25.822 5.706 0.006 0.111 0.911 0.014 1.000
parid 2.199 1.501 2.306 1.666 −0.067 −1.296 0.195 0.019 0.999
bpeso 0.056 0.230 0.061 0.239 −0.020 −0.394 0.694 0.005 1.000
premat 0.055 0.228 0.068 0.251 −0.053 −1.034 0.301 0.013 1.000
fumomat 0.248 0.432 0.254 0.435 −0.013 −0.254 0.799 0.006 1.000
160
8.3. Passos na análise com escore de propensão
es.mean.ATE
0.3
Absolute standard difference
0.2
0.1
0.0
Unweighted Weighted
sexo 0.481 0.500 0.480 0.500 0.001 0.022 0.982 0.001 1.000
Na figura 8.3, obtida no R, fica mais fácil de visualizar que todas as diferenças
padronizadas absolutas nas médias se encontram abaixo de 0,10. Note, ainda, que as
diferenças absolutas nas médias padronizadas diminuı́ram, comparando-se as estimativas
não ponderadas com as ponderadas.
161
8. Métodos de análise com escore de propensão
162
9. Exemplo de análise com escore de
propensão em Epidemiologia no R
Para rodar este exemplo prático é necessária a instalação do R, R Studio e dos seguintes
pacotes:
# I n s t a l a n d o o s p a c o t e s n e c e s s á r i o s
i n s t a l l . packages ( ” survey ” )
i n s t a l l . p a c k a g e s ( ” twang ” )
i n s t a l l . packages ( ” descr ” )
i n s t a l l . p a c k a g e s ( ” MatchIt ” )
i n s t a l l . p a c k a g e s ( ” Matching ” )
i n s t a l l . p a c k a g e s ( ” rbounds ” )
163
9. Exemplo de análise com escore de propensão em Epidemiologia no R
6 1 22 9 1 0 0 1 0 0 4056.4940
7 1 23 12 1 0 0 0 0 0 0.0000
8 1 32 11 1 0 0 1 0 0 8472.1580
9 1 22 16 1 0 0 0 0 0 2164.0220
10 1 33 12 0 0 1 0 0 0 12418.0700
11 1 19 9 1 0 0 1 0 0 8173.9080
12 1 21 13 1 0 0 0 0 0 17094.6400
13 1 18 8 1 0 0 1 0 0 0.0000
14 1 27 10 1 0 1 1 0 0 18739.9300
15 1 17 7 1 0 0 1 0 0 3023.8790
> t a i l ( l a l o n d e , n=15)
t r e a t a g e educ b l a c k h i s p a n m a r r i e d n o d e g r e e r e 7 4 r e 7 5 re78
600 0 43 6 0 0 1 1 0 0 0.0000
601 0 34 12 1 0 0 0 0 0 0.0000
602 0 16 8 0 1 0 1 0 0 12242.9600
603 0 27 12 0 0 1 0 0 0 1533.8800
604 0 51 4 1 0 0 1 0 0 0.0000
605 0 39 2 1 0 1 1 0 0 964.9555
606 0 55 8 0 0 1 1 0 0 0.0000
607 0 16 9 0 0 0 1 0 0 5551.8190
608 0 27 10 1 0 0 1 0 0 7543.7940
609 0 25 14 0 0 0 0 0 0 0.0000
610 0 18 11 0 0 0 1 0 0 10150.5000
611 0 24 1 0 1 1 1 0 0 19464.6100
612 0 21 18 0 0 0 0 0 0 0.0000
613 0 32 5 1 0 1 1 0 0 187.6713
614 0 16 9 0 0 0 1 0 0 1495.4590
# Carregando b i b l i o t e c a descr
> library ( descr )
# Obtendo a d i s t r i b u i ç ã o de f r e q u ê n c i a s da v a r i á v e l t r a t a m e n t o
> freq ( lalonde $ treat )
lalonde $ treat
164
9.1. Estimativa do efeito causal por meio de escore de propensão
F r e q uê n c i a P e r c e n t u a l
0 260 58.43
1 185 41.57
Total 445 100.00
Call :
lm ( f o r m u l a = r e 7 8 ˜ t r e a t , d a t a = l a l o n d e )
Residuals :
Min 1Q Median 3Q Max
−6984 −6349 −2048 4100 53959
Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( >| t | )
( Intercept ) 6984.2 360.7 19.362 <2e −16 ∗∗∗
treat −635.0 657.1 −0.966 0.334
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1
R e s i d u a l s t a n d a r d e r r o r : 7471 on 612 d e g r e e s o f f r e e d o m
M u l t i p l e R−s q u a r e d : 0.001524 , A d j u s t e d R−s q u a r e d : −0.0001079
F− s t a t i s t i c : 0 . 9 3 3 8 on 1 and 612 DF, p−v a l u e : 0 . 3 3 4 2
# Estimando a s s o c i a ç ã o em modelo de r e g r e s s ã o a j u s t a d o
> r e g <− lm ( r e 7 8 ˜ t r e a t + a g e + educ + b l a c k + h i s p a n + n o d e g r e e +
m a r r i e d + r e 7 4 + r e 7 5 , d a t a=l a l o n d e )
> summary ( r e g )
Call :
lm ( f o r m u l a = r e 7 8 ˜ t r e a t + a g e + educ + b l a c k + h i s p a n + n o d e g r e e +
married + re74 + re75 , data = l a l o n d e )
Residuals :
Min 1Q Median 3Q Max
−13595 −4894 −1662 3929 54570
Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( >| t | )
( Intercept ) 6 . 6 5 1 e+01 2 . 4 3 7 e+03 0.027 0.9782
treat 1 . 5 4 8 e+03 7 . 8 1 3 e+02 1.982 0.0480 ∗
age 1 . 2 9 8 e+01 3 . 2 4 9 e+01 0.399 0.6897
educ 4 . 0 3 9 e+02 1 . 5 8 9 e+02 2.542 0.0113 ∗
black −1.241 e+03 7 . 6 8 8 e+02 −1.614 0.1071
hispan 4 . 9 8 9 e+02 9 . 4 1 9 e+02 0.530 0.5966
nodegree 2 . 5 9 8 e+02 8 . 4 7 4 e+02 0.307 0.7593
married 4 . 0 6 6 e+02 6 . 9 5 5 e+02 0.585 0.5590
165
9. Exemplo de análise com escore de propensão em Epidemiologia no R
R e s i d u a l s t a n d a r d e r r o r : 6948 on 604 d e g r e e s o f f r e e d o m
M u l t i p l e R−s q u a r e d : 0.1478 , A d j u s t e d R−s q u a r e d : 0.1351
F− s t a t i s t i c : 1 1 . 6 4 on 9 and 604 DF, p−v a l u e : < 2 . 2 e −16
data : a g e by t r e a t
t = 2 . 5 5 9 , d f = 6 1 2 , p−v a l u e = 0 . 0 1 0 7 4
alternative hypothesis : true d i f f e r e n c e i n means i s n o t e q u a l t o 0
95 p e r c e n t c o n f i d e n c e i n t e r v a l :
0.5149437 3.9132300
sample e s t i m a t e s :
mean i n group 0 mean i n group 1
28.03030 25.81622
data : educ by t r e a t
t = −0. 47 77 5 , d f = 6 1 2 , p−v a l u e = 0 . 6 3 3
a l t e r n a t i v e h y p o t h e s i s : t r u e d i f f e r e n c e i n means i s n o t e q u a l t o 0
95 p e r c e n t c o n f i d e n c e i n t e r v a l :
−0.5648015 0.3437720
sample e s t i m a t e s :
mean i n group 0 mean i n group 1
10.23543 10.34595
data : r e 7 4 by t r e a t
t = 6 . 3 8 1 5 , d f = 6 1 2 , p−v a l u e = 3 . 4 6 5 e −10
a l t e r n a t i v e h y p o t h e s i s : t r u e d i f f e r e n c e i n means i s n o t e q u a l t o 0
95 p e r c e n t c o n f i d e n c e i n t e r v a l :
2439.282 4608.044
sample e s t i m a t e s :
mean i n group 0 mean i n group 1
5619.237 2095.574
166
9.1. Estimativa do efeito causal por meio de escore de propensão
data : r e 7 5 by t r e a t
t = 3 . 2 4 8 6 , d f = 6 1 2 , p−v a l u e = 0 . 0 0 1 2 2 3
a l t e r n a t i v e h y p o t h e s i s : t r u e d i f f e r e n c e i n means i s n o t e q u a l t o 0
95 p e r c e n t c o n f i d e n c e i n t e r v a l :
369.5384 1499.3199
sample e s t i m a t e s :
mean i n group 0 mean i n group 1
2466.484 1532.055
# v a r i á v e l c a t e g ó r i c a − t e s t e do qui−quadrado
======================================
lalonde $ nodegree
lalonde $ treat 0 1 Total
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
0 173 256 429
40.3% 59.7% 69.9%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
1 54 131 185
29.2% 70.8% 30.1%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Total 227 387 614
======================================
E s t a tı́ s t i c a s p a r a t o d o s o s f a t o r e s da t a b e l a
P e a r s o n ’ s Chi−s q u a r e d t e s t
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 6 . 8 8 0 3 2 3 g. l . = 1 p = 0.00871
P e a r s o n ’ s Chi−s q u a r e d t e s t w i t h Y at e s ’ c o n t i n u i t y c o r r e c t i o n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 6 . 4 1 0 6 8 2 g. l . = 1 p = 0.0113
F r e q uê n c i a e s p e r a d a mı́nima : 6 8 . 3 9 5 7 7
======================================
l a l o n d e $ married
lalonde $ treat 0 1 Total
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
0 209 220 429
48.7% 51.3% 69.9%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
1 150 35 185
81.1% 18.9% 30.1%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Total 359 255 614
167
9. Exemplo de análise com escore de propensão em Epidemiologia no R
======================================
E s t a tı́ s t i c a s p a r a t o d o s o s f a t o r e s da t a b e l a
P e a r s o n ’ s Chi−s q u a r e d t e s t
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 5 5 . 7 5 2 4 4 g. l . = 1 p = 8 . 2 2 e −14
P e a r s o n ’ s Chi−s q u a r e d t e s t w i t h Y a te s ’ c o n t i n u i t y c o r r e c t i o n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 5 4 . 4 2 7 6 4 g. l . = 1 p = 1 . 6 1 e −13
F r e q uê n c i a e s p e r a d a mı́nima : 7 6 . 8 3 2 2 5
======================================
lalonde $ black
lalonde $ treat 0 1 Total
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
0 342 87 429
79.7% 20.3% 69.9%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
1 29 156 185
15.7% 84.3% 30.1%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Total 371 243 614
======================================
E s t a tı́ s t i c a s p a r a t o d o s o s f a t o r e s da t a b e l a
P e a r s o n ’ s Chi−s q u a r e d t e s t
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 2 2 1 . 7 0 8 5 g. l . = 1 p <2e −16
P e a r s o n ’ s Chi−s q u a r e d t e s t w i t h Y a te s ’ c o n t i n u i t y c o r r e c t i o n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 2 1 9 . 0 3 8 4 g. l . = 1 p <2e −16
F r e q uê n c i a e s p e r a d a mı́nima : 7 3 . 2 1 6 6 1
======================================
lalonde $ hispan
lalonde $ treat 0 1 Total
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
0 368 61 429
85.8% 14.2% 69.9%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
1 174 11 185
94.1% 5.9% 30.1%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Total 542 72 614
======================================
168
9.1. Estimativa do efeito causal por meio de escore de propensão
E s t a tı́ s t i c a s p a r a t o d o s o s f a t o r e s da t a b e l a
P e a r s o n ’ s Chi−s q u a r e d t e s t
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 8 . 5 4 6 9 1 4 g. l . = 1 p = 0.00346
P e a r s o n ’ s Chi−s q u a r e d t e s t w i t h Y at e s ’ c o n t i n u i t y c o r r e c t i o n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 7 . 7 6 6 3 5 9 g. l . = 1 p = 0.00532
F r e q uê n c i a e s p e r a d a mı́nima : 2 1 . 6 9 3 8 1
Call :
lm ( f o r m u l a = r e 7 4 ˜ t r e a t , d a t a = l a l o n d e )
Residuals :
Min 1Q Median 3Q Max
−5619 −4970 −2096 2674 32944
Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( >| t | )
( Intercept ) 5619.2 303.1 1 8 . 5 4 0 < 2 e −16 ∗∗∗
treat −3523.7 552.2 −6.381 3 . 4 6 e −10 ∗∗∗
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1
R e s i d u a l s t a n d a r d e r r o r : 6278 on 612 d e g r e e s o f f r e e d o m
M u l t i p l e R−s q u a r e d : 0.06239 , A d j u s t e d R−s q u a r e d : 0.06086
F− s t a t i s t i c : 4 0 . 7 2 on 1 and 612 DF, p−v a l u e : 3 . 4 6 5 e −10
Call :
glm ( f o r m u l a = n o d e g r e e ˜ t r e a t , f a m i l y = binomial ( ) , data = l a l o n d e )
Deviance R e s i d u a l s :
Min 1Q Median 3Q Max
−1.5693 −1.3477 0.8308 1.0162 1.0162
Coefficients :
E s t i m a t e Std . E r r o r z v a l u e Pr ( >| z | )
( Intercept ) 0.39189 0.09842 3 . 9 8 2 6 . 8 4 e −05 ∗∗∗
treat 0.49433 0.18931 2.611 0 . 0 0 9 0 2 ∗∗
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1
169
9. Exemplo de análise com escore de propensão em Epidemiologia no R
( D i s p e r s i o n p a r a m e t e r f o r b i n o m i a l f a m i l y t a k e n t o be 1 )
Number o f F i s h e r S c o r i n g iterations : 4
6. Vamos agora calcular o escore de propensão para cada indivı́duo, que nada mais
é do que a probabilidade de participação no programa predita pelo modelo. Para
realizar isto, vamos rodar um modelo logı́stico, tendo como desfecho a participação
no treinamento (treat) e como variáveis preditoras: idade, escolaridade, cor da
pele preta, hispânico, casado, sem diploma universitário, renda em 74 e renda em
75.
# E s t i m a ç ã o do e s c o r e de p r o p e n s ã o p o r r e g r e s s ã o l o gı́ s t i c a
> p s l o g<− glm ( t r e a t ˜ a g e + educ + b l a c k + h i s p a n + n o d e g r e e + m a r r i e d +
re74 + re75 ,
+ f a m i l y=b i n o m i a l ( ) , d a t a=l a l o n d e )
> summary ( p s l o g )
Call :
glm ( f o r m u l a = t r e a t ˜ a g e + educ + b l a c k + h i s p a n + n o d e g r e e +
married + re74 + re75 , f a m i l y = binomial ( ) , data = l a l o n d e )
Deviance R e s i d u a l s :
Min 1Q Median 3Q Max
−1.7645 −0.4736 −0.2862 0.7508 2.7169
Coefficients :
E s t i m a t e Std . E r r o r z v a l u e Pr ( >| z | )
( I n t e r c e p t ) −4.729 e+00 1 . 0 1 7 e+00 −4.649 3 . 3 3 e −06 ∗∗∗
age 1 . 5 7 8 e −02 1 . 3 5 8 e −02 1.162 0.24521
educ 1 . 6 1 3 e −01 6 . 5 1 3 e −02 2.477 0.01325 ∗
black 3 . 0 6 5 e+00 2 . 8 6 5 e −01 1 0 . 6 9 9 < 2 e −16 ∗∗∗
hispan 9 . 8 3 6 e −01 4 . 2 5 7 e −01 2.311 0.02084 ∗
nodegree 7 . 0 7 3 e −01 3 . 3 7 7 e −01 2.095 0.03620 ∗
married −8.321 e −01 2 . 9 0 3 e −01 −2.866 0 . 0 0 4 1 5 ∗∗
re74 −7.178 e −05 2 . 8 7 5 e −05 −2.497 0.01253 ∗
re75 5 . 3 4 5 e −05 4 . 6 3 5 e −05 1.153 0.24884
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1
( D i s p e r s i o n p a r a m e t e r f o r b i n o m i a l f a m i l y t a k e n t o be 1 )
Number o f F i s h e r S c o r i n g iterations : 5
Agora peça uma listagem das primeiras observações (tratados) e verifique que o
escore de propensão (pslog) foi calculado e adicionado ao banco de dados.
# Obtendo l i s t a g e m d a s 10 p r i m e i r a s o b s e r v a ç õ e s
> head ( l a l o n d e , n =10)
t r e a t age educ b l a c k h i s p a n married n o d e g r e e re74 re75 re78 pslog
170
9.1. Estimativa do efeito causal por meio de escore de propensão
1 1 37 11 1 0 1 1 0 0 9930.0460 0.63876993
2 1 22 9 0 1 0 1 0 0 3595.8940 0.22463424
3 1 30 12 1 0 0 0 0 0 24909.4500 0.67824388
4 1 27 11 1 0 0 1 0 0 7506.1460 0.77632408
5 1 33 8 1 0 0 1 0 0 289.7899 0.70163874
6 1 22 9 1 0 0 1 0 0 4056.4940 0.69906990
7 1 23 12 1 0 0 0 0 0 0.0000 0.65368426
8 1 32 11 1 0 0 1 0 0 8472.1580 0.78972311
9 1 22 16 1 0 0 0 0 0 2164.0220 0.77983825
10 1 33 12 0 0 1 0 0 0 12418.0700 0.04292461
9. Apesar do efeito médio do tratamento (ATE) não ser a melhor estimativa, vamos
realizar o seu cálculo para demonstração. Inicialmente, calcularemos os pesos
para estimar o ATE em modelo estrutural marginal, com ponderação pelo inverso
da probabilidade de tratamento, utilizando as fórmulas da tabela 8.6. Em seguida,
vamos obter uma listagem das primeiras 10 observações para verificar que o peso
(peso.ATE) foi incorporado ao banco de dados.
# Ponderação com e s c o r e de p r o p e n s ã o
# C a l c u l a n d o o s p e s o s usando ATE − E f e i t o médio do t r a t a m e n t o
# p a r a o grupo de t r a t a m e n t o = 1 / ps
# p a r a o grupo c o n t r o l e= 1(1− ps )
> l a l o n d e $ p e s o .ATE <− i f e l s e ( l a l o n d e $ t r e a t == 1 , 1 / l a l o n d e $ p s l o g , 1 /(1−
lalonde $ pslog ) )
171
9. Exemplo de análise com escore de propensão em Epidemiologia no R
0.8
0.6
Escore de propensao
0.4
0.2
0.0
0 1
4 1 27 11 1 0 0 1 0 0 7506.1460 0.77632408
1.288122
5 1 33 8 1 0 0 1 0 0 289.7899 0.70163874
1.425235
6 1 22 9 1 0 0 1 0 0 4056.4940 0.69906990
1.430472
7 1 23 12 1 0 0 0 0 0 0.0000 0.65368426
1.529791
8 1 32 11 1 0 0 1 0 0 8472.1580 0.78972311
1.266267
9 1 22 16 1 0 0 0 0 0 2164.0220 0.77983825
1.282317
10 1 33 12 0 0 1 0 0 0 12418.0700 0.04292461
23.296656
>
172
9.1. Estimativa do efeito causal por meio de escore de propensão
# Checando b a l a n c e a m e n t o a p ó s a p o n d e r a ç ã o com e s c o r e de p r o p e n s ã o
# Carregando o p a c o t e s u r v e y p a r a o b t e r e s t i m a t i v a r o b u s t a da v a r i â n c i a
> l i b r a r y ( survey )
Call :
svyglm ( f o r m u l a = r e 7 4 ˜ t r e a t , design = design . pslog )
Survey d e s i g n :
s v y d e s i g n ( i d s = ˜ 1 , w e i g h t s = ˜ p e s o . ATE, d a t a = l a l o n d e )
Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( >| t | )
( Intercept ) 4552.7 309.6 14.705 <2e −16 ∗∗∗
treat −1620.6 786.0 −2.062 0.0396 ∗
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1
( D i s p e r s i o n p a r a m e t e r f o r g a u s s i a n f a m i l y t a k e n t o be 3 6 5 0 6 4 3 7 )
Number o f F i s h e r S c o r i n g iterations : 2
11. E para variável categórica, vamos estimar modelo de regressão logı́stica ponderado
pelo escore de propensão, colocando a variável categórica como resposta e o
tratamento como variável explanatória. Observe que para a variável não possuir
diploma universitário, o balanceamento foi obtido, pois o valor de P deixou de ser
significante (P=0,452). Faça, agora, o teste para as demais variáveis (contı́nuas e
categóricas) e anote para quais variáveis o balanceamento não foi obtido.
# v a r i á v e l c a t e g ó r i c a − r e g r e s s ã o l i n e a r ponderada com o t r a t a m e n t o como
v a r i á v e l e x p l a n a t ó r i a e a v a r i á v e l c a t e g ó r i c a ( sem d ip lo m a
u n i v e r s i t á r i o ) como r e s p o s t a
> glm <− svyglm ( n o d e g r e e ˜ t r e a t , f a m i l y=b i n o m i a l , d e s i g n=d e s i g n . p s l o g )
Warning message :
I n e v a l ( expr , e n v i r , e n c l o s ) : non−i n t e g e r #s u c c e s s e s i n a b i n o m i a l glm !
> summary ( glm )
Call :
svyglm ( f o r m u l a = n o d e g r e e ˜ t r e a t , family = binomial , design = design .
pslog )
Survey d e s i g n :
s v y d e s i g n ( i d s = ˜ 1 , w e i g h t s = ˜ p e s o . ATE, d a t a = l a l o n d e )
Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( >| t | )
( Intercept ) 0.5106 0.1112 4 . 5 9 3 5 . 3 1 e −06 ∗∗∗
treat −0.2278 0.3024 −0.753 0.452
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1
( D i s p e r s i o n p a r a m e t e r f o r b i n o m i a l f a m i l y t a k e n t o be 1 . 0 0 1 6 3 1 )
Number o f F i s h e r S c o r i n g iterations : 4
173
9. Exemplo de análise com escore de propensão em Epidemiologia no R
12. Como os testes estatı́sticos não são o método mais adequado para verificar
balanceamento, vamos usar o pacote twang, que realiza o cálculo das diferenças
padronizadas absolutas nas médias das variáveis preditoras do tratamento entre
os grupos tratado e controle. Diferença padronizada absoluta nas médias < 0,10
indica balanceamento. Observe que as estimativas das diferenças padronizadas
absolutas entre as médias dos grupos tratamento e controle após o balanceamento
para a maioria das variáveis continua acima de 0,10. Se usarmos um critério menos
rigoroso, <0,25, concluirı́amos que apenas a variável renda em 1974 não estaria
balanceada entre os grupos. Esta falta de balanceamento se deve, provavelmente,
à pouca zona de suporte comum existente entre os grupos. A alternativa, neste
caso, seria estimar o ATT ou tentar outro método para estimativa do escore
de propensão. Pode ser que o balanceamento não tenha sido atingido por má
especificação do modelo logı́stico, ou seja, a não inclusão de termos polinomiais,
no caso de relações não lineares, e o não teste para interações entre os preditores.
# Usando r o t i n a do p a c o t e twang p a r a v e r i f i c a r b a l a n c e a m e n t o
# D i f e r e n ç a s p a d r o n i z a d a s a b s o l u t a s e n t r e a s médias
> b a l . p s l o g <− dx . wts ( x = l a l o n d e \ $ p e s o . ATE, d a t a=l a l o n d e , v a r s=c ( ” a g e ” ,
” educ ” , ” b l a c k ” , ” h i s p a n ” , ” n o d e g r e e ” ,
+ ” m a r r i e d ” , ” r e 7 4 ” , ” r e 7 5 ” ) , t r e a t . v a r=” t r e a t ” , e s t i m a n d = ”
ATE” )
> bal . pslog
type n . t r e a t n . c t r l ess . treat ess . ctrl max . e s mean . e s max . k s mean . k s iter
1 unw 185 429 185.00000 429.0000 1.3085999 0.4432341 0.6404460 0.2702451 NA
2 185 429 58.32666 329.0078 0.2658351 0.1441768 0.3121388 0.1170512 NA
> b a l <− b a l . t a b l e ( b a l . p s l o g )
> bal
\ $unw
t x . mn tx . sd c t . mn c t . sd std . e f f . sz stat p ks ks . pval
age 25.816 7.155 28.030 10.787 −0.224 −2.994 0.003 0.158 0.003
educ 10.346 2.011 10.235 2.855 0.042 0.547 0.584 0.111 0.074
black 0.843 0.365 0.203 0.403 1.309 19.371 0.000 0.640 0.000
hispan 0.059 0.237 0.142 0.350 −0.257 −3.413 0.001 0.083 0.317
nodegree 0.708 0.456 0.597 0.491 0.231 2.716 0.007 0.111 0.074
married 0.189 0.393 0.513 0.500 −0.656 −8.607 0.000 0.324 0.000
re74 2095.574 4886.620 5619.237 6788.751 −0.544 −7.254 0.000 0.447 0.000
re75 1532.055 3219.251 2466.484 3291.996 −0.284 −3.282 0.001 0.288 0.000
[[2]]
t x . mn tx . sd c t . mn c t . sd std . e f f . sz stat p ks ks . pval
age 25.566 6.525 27.100 10.803 −0.169 −1.709 0.088 0.191 0.046
educ 10.606 2.051 10.286 2.742 0.131 1.032 0.303 0.077 0.908
black 0.448 0.499 0.398 0.490 0.101 0.746 0.456 0.050 0.999
hispan 0.122 0.328 0.117 0.322 0.014 0.115 0.909 0.005 1.000
nodegree 0.570 0.496 0.625 0.485 −0.112 −0.743 0.458 0.055 0.996
married 0.315 0.466 0.409 0.492 −0.196 −1.207 0.228 0.094 0.732
re74 2932.185 5709.424 4552.736 6337.089 −0.266 −2.062 0.040 0.312 0.000
re75 1658.065 3072.886 2172.039 3160.142 −0.164 −1.492 0.136 0.153 0.179
13. Mesmo sem ter obtido o balanceamento entre as variáveis, vamos calcular o efeito
médio do tratamento (ATE) em modelo de regressão linear ponderado pelo escore
de propensão, no pacote survey, com estimativa robusta da variância. Veja que
a estimativa ajustada para o efeito do tratamento foi de US$224,70, com p=0,805,
portanto não significante.
# Efeito causal
# R e g r e s s ã o l i n e a r i n c l u i n d o d e s f e c h o e a p e n a s o t r a t a m e n t o como
v a r i a v e l e x p l a n a t ó r i a
# com p o n d e r a c ã o p e l o e s c o r e de p r o p e n s ã o
174
9.1. Estimativa do efeito causal por meio de escore de propensão
# p a c o t e s u r v e y − e s t i m a t i v a r o b u s t a da v a r i â n c i a
> d e s i g n . p s l o g <− s v y d e s i g n ( i d s=˜ 1 , w e i g h t s=˜ p e s o . ATE, d a t a=l a l o n d e )
> glm <− svyglm ( r e 7 8 ˜ t r e a t , d e s i g n=d e s i g n . p s l o g )
> summary ( glm )
Call :
svyglm ( f o r m u l a = r e 7 8 ˜ t r e a t , design = design . pslog )
Survey d e s i g n :
s v y d e s i g n ( i d s = ˜ 1 , w e i g h t s = ˜ p e s o . ATE, d a t a = l a l o n d e )
Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( >| t | )
( Intercept ) 6422.8 365.3 17.584 <2e −16 ∗∗∗
treat 224.7 910.2 0.247 0.805
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1
( D i s p e r s i o n p a r a m e t e r f o r g a u s s i a n f a m i l y t a k e n t o be 5 0 9 9 2 1 8 7 )
Number o f F i s h e r S c o r i n g iterations : 2
14. Em seguida, vamos utilizar GBM (Generalized Boosted Model) para calcular o
ATE no pacote twang, para testar se o não balanceamento dos grupos tratamento
e controle possa ter sido devido à má especificação do modelo logı́stico.
# GBM
# e s t i m a t i v a do e s c o r e de p r o p e n s a o − ATE
set . seed (1)
psgbmate <− ps ( t r e a t ˜ a g e + educ + b l a c k + h i s p a n + n o d e g r e e + m a r r i e d
+ re74 + re75 , data = l a l o n d e ,
perm . t e s t . i t e r s =0 , e s t i m a n d = ”ATE” , s t o p . method=(” e s .
mean” ) , v e r b o s e=”F” )
15. Utilize os seguintes comandos para verificar balanceamento. Observe que, agora,
apenas para as variáveis percentual de hispânicos e não possuir diploma uni-
versitário foi obtido balanceamento, pois as diferenças padronizadas absolutas
entre as médias dos grupos tratamento e controle ficaram <0,10. Para as demais
variáveis não obtivemos o balanceamento. Este resultado sugere que o não ba-
lanceamento em relação às variáveis observadas não se deveu a problemas na
especificação do modelo logı́stico, mas sim à falta de uma zona de suporte comum.
# v e r i f i c a n d o balanceamento
> b a l <− b a l . t a b l e ( psgbmate )
> bal
$unw
t x . mn tx . sd c t . mn c t . sd std . e f f . sz stat p ks ks . pval
age 25.816 7.155 28.030 10.787 −0.224 −2.994 0.003 0.158 0.003
educ 10.346 2.011 10.235 2.855 0.042 0.547 0.584 0.111 0.074
black 0.843 0.365 0.203 0.403 1.309 19.371 0.000 0.640 0.000
hispan 0.059 0.237 0.142 0.350 −0.257 −3.413 0.001 0.083 0.317
nodegree 0.708 0.456 0.597 0.491 0.231 2.716 0.007 0.111 0.074
married 0.189 0.393 0.513 0.500 −0.656 −8.607 0.000 0.324 0.000
re74 2095.574 4886.620 5619.237 6788.751 −0.544 −7.254 0.000 0.447 0.000
re75 1532.055 3219.251 2466.484 3291.996 −0.284 −3.282 0.001 0.288 0.000
$ e s . mean . ATE
t x . mn tx . sd c t . mn c t . sd std . e f f . sz stat p ks ks . pval
age 25.145 7.104 27.438 10.167 −0.249 −2.936 0.003 0.138 0.168
educ 10.587 2.012 10.295 2.700 0.118 1.132 0.258 0.090 0.655
black 0.649 0.479 0.345 0.476 0.609 4.099 0.000 0.304 0.000
hispan 0.126 0.332 0.120 0.325 0.017 0.114 0.909 0.005 1.000
nodegree 0.621 0.487 0.607 0.489 0.027 0.200 0.842 0.013 1.000
married 0.283 0.452 0.440 0.497 −0.322 −2.272 0.023 0.157 0.081
re74 2761.677 5137.961 4702.171 6467.311 −0.319 −2.854 0.004 0.204 0.009
re75 1698.704 3284.007 2169.352 3182.606 −0.146 −1.330 0.184 0.161 0.068
175
9. Exemplo de análise com escore de propensão em Epidemiologia no R
es.mean.ATE
1.0
Absolute standard difference
0.5
0.0
Unweighted Weighted
Figura 9.2.: Verificando diferenças padronizadas absolutas por método gráfico - ATE.
# o b t e n d o l i s t a g e m do b a n c o de d a d o s
> head ( l a l o n d e , n =10)
t r e a t age educ b l a c k h i s p a n married nodegree re74 re75 re78 wate
1 1 37 11 1 0 1 1 0 0 9930.0460 2.108394
2 1 22 9 0 1 0 1 0 0 3595.8940 1.377677
3 1 30 12 1 0 0 0 0 0 24909.4500 1.075554
4 1 27 11 1 0 0 1 0 0 7506.1460 1.051143
5 1 33 8 1 0 0 1 0 0 289.7899 1.045883
6 1 22 9 1 0 0 1 0 0 4056.4940 1.040317
7 1 23 12 1 0 0 0 0 0 0.0000 1.067911
8 1 32 11 1 0 0 1 0 0 8472.1580 1.056780
9 1 22 16 1 0 0 0 0 0 2164.0220 1.676679
10 1 33 12 0 0 1 0 0 0 12418.0700 4.593865
176
9.1. Estimativa do efeito causal por meio de escore de propensão
> t a i l ( l a l o n d e , n =10)
t r e a t age educ b l a c k hispan married nodegree re74 re75 re78 wate
605 0 39 2 1 0 1 1 0 0 964.9555 1.485184
606 0 55 8 0 0 1 1 0 0 0.0000 1.013105
607 0 16 9 0 0 0 1 0 0 5551.8190 1.015311
608 0 27 10 1 0 0 1 0 0 7543.7940 20.798188
609 0 25 14 0 0 0 0 0 0 0.0000 1.346533
610 0 18 11 0 0 0 1 0 0 10150.5000 1.174878
611 0 24 1 0 1 1 1 0 0 19464.6100 1.106458
612 0 21 18 0 0 0 0 0 0 0.0000 1.072995
613 0 32 5 1 0 1 1 0 0 187.6713 3.164705
614 0 16 9 0 0 0 1 0 0 1495.4590 1.015311
17. Mesmo sem termos obtido balanceamento, vamos calcular o ATE em modelo de
regressão linear ponderado pelo escore de propensão. A estimativa foi US$491,90,
com p=0,516, portanto igual no grupo tratado em comparação ao grupo controle,
também não significante.
# E f e i t o c a u s a l − GBM
# R e g r e s s ã o l i n e a r i n c l u i n d o d e s f e c h o e a p e n a s o t r a t a m e n t o como
v a r i á v e l e x p l a n a t ó r i a
# com p o n d e r a ç ã o p e l o e s c o r e de p r o p e n s ã o
> glm1 <− svyglm ( r e 7 8 ˜ t r e a t , d e s i g n=d e s i g n . p s a t e )
> summary ( glm1 )
Call :
svyglm ( f o r m u l a = r e 7 8 ˜ t r e a t , design = design . psate )
Survey d e s i g n :
s v y d e s i g n ( i d s = ˜ 1 , w e i g h t s = ˜ wate , d a t a = l a l o n d e )
Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( >| t | )
( Intercept ) 6703.7 368.1 18.209 <2e −16 ∗∗∗
treat −491.9 757.3 −0.649 0.516
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1
( D i s p e r s i o n p a r a m e t e r f o r g a u s s i a n f a m i l y t a k e n t o be 5 0 2 0 1 9 3 1 )
Number o f F i s h e r S c o r i n g iterations : 2
18. Finalmente, vamos utilizar GBM (Generalized Boosted Model) para calcular o
ATT no pacote twang, para testar se o não balanceamento dos grupos tratamento
e controle possa ter sido devido à falta de zona de suporte comum.
# GBM
# e s t i m a t i v a do e s c o r e de p r o p e n s a o − ATT
> set . seed (1)
> psgbmatt <− ps ( t r e a t ˜ a g e + educ + b l a c k + h i s p a n + n o d e g r e e +
married + re74 + re75 , data = l a l o n d e ,
+ perm . t e s t . i t e r s =0 , e s t i m a n d = ”ATT” , s t o p . method=(” e s .
mean” ) , v e r b o s e=”F” )
19. Utilize os seguintes comandos para verificar balanceamento. Observe que, agora,
apenas para as variáveis renda em 1974 e renda em 1975 não foi obtido balance-
amento, pois as diferenças padronizadas absolutas entre as médias dos grupos
tratamento e controle ficaram >0,10. Se adotarmos um ponto de corte menos rigo-
roso, concluı́mos que o balanceamento foi obtido em relação a todas as variáveis
observadas. Este resultado sugere que o não balanceamento em relação às variáveis
observadas na estimativa do ATE não se deveu a problemas na especificação do
177
9. Exemplo de análise com escore de propensão em Epidemiologia no R
modelo logı́stico, mas sim à falta de uma zona de suporte comum. Usando-se
apenas os tratados, o balanceamento consideramos que o balanceamento foi obtido
e podemos, então, dar prosseguimento à análise e interpretação do ATT.
# v e r i f i c a n d o balanceamento
> b a l <− b a l . t a b l e ( psgbmatt )
> bal
$unw
t x . mn tx . sd c t . mn c t . sd std . e f f . sz stat p ks ks . pval
age 25.816 7.155 28.030 10.787 −0.309 −2.994 0.003 0.158 0.003
educ 10.346 2.011 10.235 2.855 0.055 0.547 0.584 0.111 0.074
black 0.843 0.365 0.203 0.403 1.757 19.371 0.000 0.640 0.000
hispan 0.059 0.237 0.142 0.350 −0.349 −3.413 0.001 0.083 0.317
nodegree 0.708 0.456 0.597 0.491 0.244 2.716 0.007 0.111 0.074
married 0.189 0.393 0.513 0.500 −0.824 −8.607 0.000 0.324 0.000
re74 2095.574 4886.620 5619.237 6788.751 −0.721 −7.254 0.000 0.447 0.000
re75 1532.055 3219.251 2466.484 3291.996 −0.290 −3.282 0.001 0.288 0.000
$ e s . mean .ATT
t x . mn tx . sd c t . mn c t . sd std . e f f . sz stat p ks ks . pval
age 25.816 7.155 25.472 7.295 0.048 0.352 0.725 0.092 0.992
educ 10.346 2.011 10.447 2.040 −0.050 −0.346 0.729 0.064 1.000
black 0.843 0.365 0.829 0.377 0.040 0.300 0.764 0.014 1.000
hispan 0.059 0.237 0.045 0.207 0.062 0.666 0.506 0.015 1.000
nodegree 0.708 0.456 0.664 0.473 0.097 0.478 0.633 0.044 1.000
married 0.189 0.393 0.189 0.392 0.001 0.006 0.995 0.000 1.000
re74 2095.574 4886.620 1510.258 3744.029 0.120 1.119 0.264 0.070 1.000
re75 1532.055 3219.251 1074.077 2464.235 0.142 1.276 0.202 0.102 0.976
# o b t e n d o l i s t a g e m do b a n c o de d a d o s
> head ( l a l o n d e , n =10)
t r e a t age educ b l a c k h i s p a n married n o d e g r e e r e 7 4 r e 7 5 re78 wate watt
1 1 37 11 1 0 1 1 0 0 9930.0460 2.108394 1
2 1 22 9 0 1 0 1 0 0 3595.8940 1.377677 1
3 1 30 12 1 0 0 0 0 0 24909.4500 1.075554 1
4 1 27 11 1 0 0 1 0 0 7506.1460 1.051143 1
5 1 33 8 1 0 0 1 0 0 289.7899 1.045883 1
6 1 22 9 1 0 0 1 0 0 4056.4940 1.040317 1
7 1 23 12 1 0 0 0 0 0 0.0000 1.067911 1
8 1 32 11 1 0 0 1 0 0 8472.1580 1.056780 1
9 1 22 16 1 0 0 0 0 0 2164.0220 1.676679 1
10 1 33 12 0 0 1 0 0 0 12418.0700 4.593865 1
> t a i l ( l a l o n d e , n =10)
t r e a t age educ b l a c k h i s p a n married n o d e g r e e r e 7 4 r e 7 5 re78 wate
watt
605 0 39 2 1 0 1 1 0 0 964.9555 1.485184
0.42964533
606 0 55 8 0 0 1 1 0 0 0.0000 1.013105
0.01075173
607 0 16 9 0 0 0 1 0 0 5551.8190 1.015311
0.01311116
608 0 27 10 1 0 0 1 0 0 7543.7940 20.798188
22.39606172
609 0 25 14 0 0 0 0 0 0 0.0000 1.346533
0.32141652
610 0 18 11 0 0 0 1 0 0 10150.5000 1.174878
0.16604204
611 0 24 1 0 1 1 1 0 0 19464.6100 1.106458
0.07992029
612 0 21 18 0 0 0 0 0 0 0.0000 1.072995
0.06439535
613 0 32 5 1 0 1 1 0 0 187.6713 3.164705
2.10541066
614 0 16 9 0 0 0 1 0 0 1495.4590 1.015311
0.01311116
178
9.1. Estimativa do efeito causal por meio de escore de propensão
es.mean.ATT
1.5
Absolute standard difference
1.0
0.5
0.0
Unweighted Weighted
Figura 9.3.: Verificando diferenças padronizadas absolutas por método gráfico - ATT.
21. Vamos, para concluir este exercı́cio, calcular o ATT em modelo de regressão
linear ponderado pelo escore de propensão. A estimativa obtida, US$461,00,
foi igual no grupo tratado em comparação ao grupo controle, com p=0,632.
Concluı́mos, então, que o programa de retreinamento não aumentou a renda dos
indivı́duos. Esta conclusão é válida se os pressupostos para inferência causal forem
verdadeiros: permutabilidade, positividade e única versão do tratamento (SUTVA,
stable unit treatment value assumption). Considerando que o tratamento foi
administrado de forma padronizada e que não houve contaminação, consideramos
que o pressuposto SUTVA é razoável. Usando-se o ATT supõe-se que foi possı́vel
obter contrastes contrafatuais adequados na ausência de randomização para os
tratados. O pressuposto da positividade é bem razoável neste exemplo. Obtivemos
permutabilidade em relação às variáveis observadas. Resta a possibilidade de
confundimento por variável omitida. Esta nossa estimativa do efeito causal é
válida, desde que sejam válidos os nossos pressupostos, que foram explicitados.
É interessante neste exemplo que o modelo de regressão convencional, ajustado
para as variáveis de confundimento sugeriu associação entre o programa de
179
9. Exemplo de análise com escore de propensão em Epidemiologia no R
Call :
svyglm ( f o r m u l a = r e 7 8 ˜ t r e a t , design = design . psatt )
Survey d e s i g n :
s v y d e s i g n ( i d s = ˜ 1 , w e i g h t s = ˜ watt , d a t a = l a l o n d e )
Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( >| t | )
( Intercept ) 5888.2 767.9 7 . 6 6 8 6 . 9 1 e −14 ∗∗∗
treat 461.0 960.7 0.480 0.632
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1
( D i s p e r s i o n p a r a m e t e r f o r g a u s s i a n f a m i l y t a k e n t o be 5 0 1 9 2 2 8 3 )
Number o f F i s h e r S c o r i n g iterations : 2
180
10. Exemplo de análise com escore de
propensão em Epidemiologia no
Stata
10.1. Estimativa do efeito causal por meio de escore de
propensão
Neste exemplo, vamos realizar a estimativa do efeito de um programa de retreinamento
profissional no rendimento dos indivı́duos. Os dados são do National Supported Work
Project, publicados por Dehejia e Wahba (1999). Na tabela 9.1 constam as variáveis
que utilizaremos neste exercı́cio.
Os comandos que se seguem realizam a análise no Stata.
1. 1 37 11 1 0 1 1 9930.046
2. 1 22 9 0 1 0 1 3595.894
3. 1 30 12 1 0 0 0 24909.45
4. 1 27 11 1 0 0 1 7506.146
5. 1 33 8 1 0 0 1 289.7899
. list treat age educ black hispan married nodegree re78 in 610/614
610. 0 18 11 0 0 0 1 10150.5
611. 0 24 1 0 1 1 1 19464.61
612. 0 21 18 0 0 0 0 0
181
10. Exemplo de análise com escore de propensão em Epidemiologia no Stata
613. 0 32 5 1 0 1 1 187.6713
614. 0 16 9 0 0 0 1 1495.459
.
. * Obtendo a distribuição de frequências da variável tratamento
. tab treat
treat Freq. Percent Cum.
.
. * Estimando associação em modelo de regressão ajustado
. regress re78 treat age educ black hispan nodegree married re74 re75
Source SS df MS Number of obs = 614
F(9, 604) = 11.64
Model 5.0554e+09 9 561713774 Prob > F = 0.0000
Residual 2.9157e+10 604 48273544.4 R-squared = 0.1478
Adj R-squared = 0.1351
Total 3.4213e+10 613 55811818.6 Root MSE = 6947.9
182
10.1. Estimativa do efeito causal por meio de escore de propensão
Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
183
10. Exemplo de análise com escore de propensão em Epidemiologia no Stata
Pr(T < t) = 0.3165 Pr(|T| > |t|) = 0.6330 Pr(T > t) = 0.6835
Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
Key
frequency
row percentage
nodegree
treat 0 1 Total
1 54 131 185
29.19 70.81 100.00
184
10.1. Estimativa do efeito causal por meio de escore de propensão
Key
frequency
row percentage
married
treat 0 1 Total
1 150 35 185
81.08 18.92 100.00
Key
frequency
row percentage
black
treat 0 1 Total
0 342 87 429
79.72 20.28 100.00
1 29 156 185
15.68 84.32 100.00
Key
frequency
row percentage
hispan
treat 0 1 Total
185
10. Exemplo de análise com escore de propensão em Epidemiologia no Stata
0 368 61 429
85.78 14.22 100.00
1 174 11 185
94.05 5.95 100.00
6. Vamos agora calcular o escore de propensão para cada indivı́duo, que nada mais
é do que a probabilidade de participação no programa predita pelo modelo. Para
realizar isto, vamos rodar um modelo logı́stico, tendo como desfecho a participação
no treinamento (treat) e como variáveis preditoras: idade, escolaridade, cor da
186
10.1. Estimativa do efeito causal por meio de escore de propensão
Agora peça uma listagem das 10 primeiras observações (tratados) e verifique que
o escore de propensão (pslog) foi calculado e adicionado ao banco de dados.
1. 1 37 11 9930.046 .6387699
2. 1 22 9 3595.894 .2246342
3. 1 30 12 24909.45 .6782439
4. 1 27 11 7506.146 .7763241
5. 1 33 8 289.7899 .7016388
6. 1 22 9 4056.494 .6990699
7. 1 23 12 0 .6536843
8. 1 32 11 8472.158 .7897231
9. 1 22 16 2164.022 .7798383
10. 1 33 12 12418.07 .0429246
187
10. Exemplo de análise com escore de propensão em Epidemiologia no Stata
0 1
.8
.6
Escore de propensão
.4
.2
0
-.2
Graphs by treat
9. Apesar do efeito médio do tratamento (ATE) não ser a melhor estimativa, vamos
realizar o seu cálculo para demonstração. Inicialmente, calcularemos os pesos
para estimar o ATE em modelo estrutural marginal, com ponderação pelo inverso
da probabilidade de tratamento, utilizando as fórmulas da tabela 8.6. Em seguida,
188
10.1. Estimativa do efeito causal por meio de escore de propensão
vamos obter uma listagem das primeiras 10 observações para verificar que o peso
(wa) foi incorporado ao banco de dados.
Robust
re74 Coef. Std. Err. t P>|t| [95% Conf. Interval]
189
10. Exemplo de análise com escore de propensão em Epidemiologia no Stata
11. E para variável categórica, vamos estimar modelo de regressão logı́stica ponderado
pelo escore de propensão, colocando a variável categórica como resposta e o
tratamento como variável explanatória. Observe que para a variável não possuir
diploma universitário, o balanceamento foi obtido, pois o valor de P deixou de ser
significante (P=0,451). Faça, agora, o teste para as demais variáveis (contı́nuas e
categóricas) e anote para quais variáveis o balanceamento não foi obtido.
Robust
nodegree Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
12. Mesmo sem ter obtido o balanceamento entre as variáveis, vamos calcular o efeito
médio do tratamento (ATE) em modelo de regressão linear ponderado pelo escore
de propensão. Veja que a estimativa ajustada para o efeito do tratamento foi de
US$224,70, com p=0,805, portanto não significante.
. * Efeito causal
. * Regressão linear incluindo desfecho e apenas o tratamento como
. * variável explanatória com ponderacão pelo escore de propensão
. regress re78 treat [pweight=wa]
(sum of wgt is 1.1696e+03)
Linear regression Number of obs = 614
F(1, 612) = 0.06
Prob > F = 0.8053
R-squared = 0.0002
Root MSE = 7146.7
Robust
re78 Coef. Std. Err. t P>|t| [95% Conf. Interval]
190
10.1. Estimativa do efeito causal por meio de escore de propensão
Robust
re78 Coef. Std. Err. z P>|z| [95% Conf. Interval]
ATE
treat
(1 vs 0) 224.6763 876.1932 0.26 0.798 -1492.631 1941.983
POmean
treat
0 6422.839 353.3568 18.18 0.000 5730.272 7115.406
14. Como os testes estatı́sticos não são o método mais adequado para verificar
balanceamento, vamos usar o comando tebalance summ, que, após o teffects,
realiza o cálculo das diferenças padronizadas absolutas nas médias das variáveis
preditoras do tratamento entre os grupos tratado e controle e das razões de
variância. Diferença padronizada absoluta nas médias < 0,10 e razão de variâncias
entre 0,80 e 1,20 indicam balanceamento. Observe que as estimativas das diferenças
padronizadas absolutas entre as médias dos grupos tratamento e controle após o
balanceamento para a maioria das variáveis continua acima de 0,10. Se usarmos
um critério menos rigoroso, <0,25, concluirı́amos que apenas a variável renda em
1974 não estaria balanceada entre os grupos. As razões de variância das variáveis
idade e escolaridade se encontram abaixo de 0,80, sugerindo não balanceamento
para estas variáveis. Esta falta de balanceamento se deve, provavelmente, à
pouca zona de suporte comum existente entre os grupos. A alternativa, neste
caso, seria estimar o ATT ou tentar outro método para estimativa do escore de
propensão (GBM, modelagem ampliada generalizada, por exemplo). Pode ser
que o balanceamento não tenha sido atingido por má especificação do modelo
logı́stico, ou seja, a não inclusão de termos polinomiais, no caso de relações não
lineares, e o não teste para interações entre os preditores. No capı́tulo 9 realizamos
estimativa do escore de propensão por GBM e concluı́mos que o balanceamento
não melhorou com este método, o que sugere que o não balanceamento se deva
à falta de uma zona de suporte comum. Assim, com a estimativa do ATE não
obtivemos um bom balanceamento, mesmo com GBM.
. * Checando balanceamento apos a ponderacao com escore de propensao
. tebalance summ
Covariate balance summary
191
10. Exemplo de análise com escore de propensão em Epidemiologia no Stata
Raw Weighted
15. Em seguida, vamos estimar o efeito causal médio entre os tratados (ATT) por
meio do comando teffects. A única mudança em relação ao comando usado
anteriormente é a inclusão da opção atet, pois o padrão (default) deste comando
é a estimativa do ATE.
. * Usando teffects - estimando ATT
. teffects ipw (re78) (treat age educ black hispan nodegree married re74 re75)
, atet
Iteration 0: EE criterion = 3.071e-23
Iteration 1: EE criterion = 8.124e-27
Treatment-effects estimation Number of obs = 614
Estimator : inverse-probability weights
Outcome model : weighted mean
Treatment model: logit
Robust
re78 Coef. Std. Err. z P>|z| [95% Conf. Interval]
ATET
treat
(1 vs 0) 1214.071 798.1546 1.52 0.128 -350.2831 2778.426
POmean
treat
0 5135.072 583.7629 8.80 0.000 3990.918 6279.227
16. Finalmente, vamos usar o comando tebalance summ, após o teffects, para
verificar balanceamento. Observe que, desta vez, todas as diferenças padronizadas
absolutas entre as médias dos grupos tratamento e controle são menores do que
0,10, embora algumas razões de variâncias sejam <0,80 ou >1,20. Isto indica que
o ATT é uma estimativa melhor do que o ATE.
A estimativa obtida, US$1214,00, foi igual no grupo tratado em comparação ao
grupo controle, com p=0,128. Concluı́mos, então, que o programa de retreinamento
192
10.1. Estimativa do efeito causal por meio de escore de propensão
17. Podemos também verificar o balanceamento por método gráfico, usando o comando
tebalance density, para plotar gráficos de densidade kernel, para cada variável
quantitativa, separadamente para os grupos tratamento e controle. Se houver
sobreposição das distribuições, concluı́mos que a variável está balanceada, como é
o caso para a variável escolaridade (figura 10.2).
. tebalance density educ
193
10. Exemplo de análise com escore de propensão em Epidemiologia no Stata
Balance plot
Raw Weighted
.3
.2
Density
.1
0
0 5 10 15 20 0 5 10 15 20
educ
control treated
194
Referências Bibliográficas
P C Austin. An Introduction to Propensity Score Methods for Re-
ducing the Effects of Confounding in Observational Studies. Mul-
tivariate Behav Res, 46(3):399–424, 2011. doi: 10.1080/00273171.2011.
568786. URL http://www.ncbi.nlm.nih.gov/pubmed/21818162http://www.
ncbi.nlm.nih.gov/pmc/articles/PMC3144483/pdf/hmbr46-399.pdf.
H R Banack and J S Kaufman. From bad to worse: collider stratification amplifies
confounding bias in the obesity paradox. Eur J Epidemiol, 30(10):1111–1114, 2015.
doi: 10.1007/s10654-015-0069-7. URL https://www.ncbi.nlm.nih.gov/pubmed/
26187718.
J Berkson. Limitations of the application of fourfold table analysis to hospital data. Bio-
metrics, 2(3):47–53, 1946. URL http://www.ncbi.nlm.nih.gov/pubmed/21001024.
H M Boardman, L Hartley, A Eisinga, C Main, M Roque i Figuls, X Bonfill
Cosp, R Gabriel Sanchez, and B Knight. Hormone therapy for preventing
cardiovascular disease in post-menopausal women. Cochrane Database Syst
Rev, (3):CD002229, 2015. doi: 10.1002/14651858.CD002229.pub4. URL
https://www.ncbi.nlm.nih.gov/pubmed/25754617http://onlinelibrary.
wiley.com/store/10.1002/14651858.CD002229.pub4/asset/CD002229.pdf?v=
1{&}t=iypv7m09{&}s=dcf431e2d97c5b5ba38053afb232d430b17f41a4.
M A Brookhart, S Schneeweiss, K J Rothman, R J Glynn, J Avorn,
and T Sturmer. Variable selection for propensity score models. Am
J Epidemiol, 163(12):1149–1156, 2006. doi: 10.1093/aje/kwj149. URL
https://www.ncbi.nlm.nih.gov/pubmed/16624967http://oup.silverchair-
cdn.com/oup/backfile/Content{_}public/Journal/aje/163/12/10.
1093/aje/kwj149/2/kwj149.pdf?Expires=1485355879{&}Signature=L1h-
WjNrHg79UpBtbzN1zFHHQAWpXmXo1mFEMF{˜}VMRHNJOaU8g4VtplIc2mQh3c4cIOC9Hl.
C R Charig, D R Webb, S R Payne, and J E Wickham. Comparison of treatment
of renal calculi by open surgery, percutaneous nephrolithotomy, and extracorporeal
shockwave lithotripsy. British medical journal (Clinical research ed.), 292(6524):
879–82, 1986. ISSN 0267-0623. doi: 10.1136/bmj.292.6524.879. URL https://www.
ncbi.nlm.nih.gov/pmc/articles/PMC1339981/pdf/bmjcred00227-0031.pdf.
T R Cortes, E Faerstein, and C J Struchiner. [Use of causal diagrams in Epidemiology:
application to a situation with confounding]. Cadernos de Saude Publica, 32(8):
e00103115, 2016. doi: 10.1590/0102-311X00103115. URL http://www.scielo.br/
pdf/csp/v32n8/1678-4464-csp-32-08-e00103115.pdf.
195
Referências Bibliográficas
Nguyen Viet Cuong. Which covariates should be controlled in propensity score mat-
ching? Evidence from a simulation study. Statistica Neerlandica, 67(2):169–180, 2013.
ISSN 00390402. doi: 10.1111/stan.12000.
G Davey Smith and S Ebrahim. Epidemiology–is it time to call it a day? Int J Epidemiol,
30(1):1–11, 2001. URL https://www.ncbi.nlm.nih.gov/pubmed/11171840.
F Elwert. Graphical causal models. In S L Morgan, editor, Handbook of causal analysis
for social research, chapter 13, pages 245–274. Springer, New York, 2013. ISBN 978-
94-007-6094-3. URL http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.
1.1.364.7505{&}rep=rep1{&}type=pdf.
Craig K. Enders. Applied missing data analysis. Methodology in the social sciences,
page 377, 2010. ISSN 1098-6596. doi: 10.1017/CBO9781107415324.004. URL https:
//ezp.lib.unimelb.edu.au/login?url=https://search.ebscohost.com/login.
aspx?direct=true{&}db=cat00006a{&}AN=melb.b3527645{&}site=eds-live.
N L Fleischer and A V Diez Roux. Using directed acyclic graphs to guide analyses
of neighbourhood health effects: an introduction. J Epidemiol Community Health,
62(9):842–846, 2008. doi: 10.1136/jech.2007.067371. URL http://jech.bmj.com/
content/62/9/842.full.pdf.
M M Glymour and S Greenland. Causal diagrams. In K J Rothman, S Greenland, and
T L Lash, editors, Modern Epidemiology, chapter 12, pages 183–209. Wolters Kluwer:
Lipincott Williams & Wilkins, Philadelphia, 3rd edition, 2008. ISBN 978-1451190052.
H. A. Goldani, H Bettiol, M A Barbieri, A. A. Silva, M Agranonik, M B
Morais, and M Z Goldani. Cesarean delivery is associated with an in-
creased risk of obesity in adulthood in a Brazilian birth cohort study.
American Journal of Clinical Nutrition, 93(6):1344–1347, 2011. ISSN
0002-9165. doi: 10.3945/ajcn.110.010033. URL http://www.scopus.com/
inward/record.url?eid=2-s2.0-79956303990{&}partnerID=MN8TOARShttp:
//www.ajcn.org/cgi/doi/10.3945/ajcn.110.010033.
L Gordis. Epidemiology. Elsevier Saunders, Philadelphia, 5th edition, 2014. ISBN
978-1-4557-3733-8.
D. Grady, S. M. Rubin, D. B. Petitti, C. S. Fox, D. Black, B. Ettinger, V. L. Ernster,
and S. R. Cummings. Hormone therapy to prevent disease and prolong life in
postmenopausal women. Annals of Internal Medicine, 117(12):1016–1037, 1992.
ISSN 00034819. doi: 10.1016/0020-7292(93)90679-Q.
S Greenland. Modeling and variable selection in epidemiologic analysis. Am J Public
Health, 79(3):340–349, 1989. URL https://www.ncbi.nlm.nih.gov/pmc/articles/
PMC1349563/pdf/amjph00229-0086.pdf.
S Greenland. Absence of confounding does not correspond to collapsibility of the rate
ratio or rate difference. Epidemiology, 7(5):498–501, 1996. URL https://www.ncbi.
nlm.nih.gov/pubmed/8862980.
196
Referências Bibliográficas
197
Referências Bibliográficas
Miguel A. Hernán, Alvaro Alonso, Roger Logan, Francine Grodstein, Karin B. Michels,
Walter C. Willett, Joann E. Manson, and James M. Robins. Observational studies
analyzed like randomized experiments: An application to postmenopausal hormone
therapy and coronary heart disease. Epidemiology, 19(6):766–779, 2008. ISSN
10443983. doi: 10.1097/EDE.0b013e3181875e61.
Stephen Hulley, Deborah Grady, Trudy Bush, Curt Furberg, David Herrington, Betty
Riggs, Eric Vittinghoff, and Heart and Estrogen/progestin Replacement Study
(HERS) Research Group. Randomized Trial of Estrogen Plus Progestin for Secondary
Prevention of Coronary Heart Disease in Postmenopausal Women. JAMA, 280
(7):605, 1998. ISSN 0098-7484. doi: 10.1001/jama.280.7.605. URL http://jama.
jamanetwork.com/article.aspx?doi=10.1001/jama.280.7.605.
G W Imbens and D B Rubin. Causal Inference for Statistics, Social, and Biomedical
Sciences: an Introduction. Cambridge University Press, Cambridge, 2015. ISBN
978-0-521-88588-1.
Nicholas P. Jewell. Statistics for epidemiology. Chapman & Hall/CRC, Boca Raton,
2004. ISBN 9781584884330. URL https://www.crcpress.com/Statistics-for-
Epidemiology/Jewell/p/book/9781584884330.
Walter. Leite. Practical propensity score methods using R. Sage, Thousand Oaks, 2017.
ISBN 9781452288888. URL https://us.sagepub.com/en-us/sam/practical-
propensity-score-methods-using-r/book241054.
198
Referências Bibliográficas
David Moher, Sally Hopewell, Kenneth F. Schulz, Victor Montori, Peter C. Gøtzsche,
P. J. Devereaux, Diana Elbourne, Matthias Egger, and Douglas G. Altman. CON-
SORT 2010 explanation and elaboration: updated guidelines for reporting parallel
group randomised trials. BMJ (Clinical research ed.), 340:c869, 2010. ISSN 14685833.
doi: 10.1136/bmj.c869.
J Neyman. Sur les applications de la thar des probabilities aux experiences Agaricales:
Essay des principle. Excerpts reprinted (1990) in English (D. Dabrowska and T.
Speed, translators) . Statistical Science,, 5:463–472, 1923.
A Olmos and P Govindasamy. A practical guide for using propensity score weighting
in R. Practical Assessment Research & Evaluation, 20(13):1–8, 2015.
Neil Pearce and Lorenzo Richiardi. Commentary: Three worlds collide: Berkson’s bias,
selection bias and collider bias. International Journal of Epidemiology, 43(2):521–524,
2014. ISSN 14643685. doi: 10.1093/ije/dyu025.
Judea Pearl, Madelyn Glymour, and Nicholas P. Jewell. Causal inference in statistics:
a primer. John Wiley & Sons, Chichester, UK, 2016. ISBN 1119186846. URL
http://www.wiley.com/WileyCDA/WileyTitle/productCd-1119186846.html.
M L Petersen and M J van der Laan. Causal models and learning from data: integrating
causal modeling and statistical estimation. Epidemiology, 25(3):418–426, 2014. doi:
10.1097/EDE.0000000000000078. URL http://www.ncbi.nlm.nih.gov/pubmed/
24713881.
199
Referências Bibliográficas
D B Rubin. The design versus the analysis of observational studies for causal effects:
parallels with the design of randomized trials. Stat Med, 26(1):20–36, 2007. doi:
10.1002/sim.2739. URL https://www.ncbi.nlm.nih.gov/pubmed/17072897http:
//onlinelibrary.wiley.com/store/10.1002/sim.2739/asset/2739{_}ftp.
pdf?v=1{&}t=iy7bouh7{&}s=1bf6c4d9839b1ab3a69d5004e70f90496628a8f3.
200
Referências Bibliográficas
Erigene Rutayisire, Kun Huang, Yehao Liu, and Fangbiao Tao. The mode of delivery
affects the diversity and colonization pattern of the gut microbiota during the first
year of infants’ life: A systematic review. BMC Gastroenterology, 16(1):1–12, 2016.
ISSN 1471230X. doi: 10.1186/s12876-016-0498-0. URL http://dx.doi.org/10.
1186/s12876-016-0498-0.
R Scheines. An Introduction to Causal Inference. 1997. URL https://pdfs.
semanticscholar.org/ba18/30ac5ba38d9d19daad4fc0065785ecc36cca.pdf.
Ilya Shpitser, Tyler J VanderWeele, and James M Robins. On the validity of covariate
adjustment for estimating causal effects. In Proceedings of the Twenty Sixth Con-
ference on Uncertainty in Artificial Intelligence $(UAI-10)$, pages 527–536, 2010.
ISBN 978-0-9749039-6-5.
I Shrier and R W Platt. Reducing bias through directed acyclic graphs. BMC Med Res
Methodol, 8:70, 2008. doi: 10.1186/1471-2288-8-70. URL http://www.ncbi.nlm.
nih.gov/pmc/articles/PMC2601045/pdf/1471-2288-8-70.pdf.
E H Simpson. The Interpretation of Interaction in Contingency Ta-
bles. Journal of the Royal Statistical Society. Series B, 13(2):
238–241, 1951. URL http://www.epidemiology.ch/history/PDFbg/
SimpsonEH1951theinterpretationofinteraction.pdf.
P Spirtes, C Glymour, and R Scheines. Causation, prediction and search. MIT Press,
Cambridge/MA, 2nd edition, 2000. ISBN 9780262527927.
Meir J. Stampfer, Graham A. Colditz, Walter C. Willett, JoAnn E. Manson, Bernard
Rosner, Frank E. Speizer, and Charles H. Hennekens. Postmenopausal Estrogen
Therapy and Cardiovascular Disease. New England Journal of Medicine, 325(11):
756–762, sep 1991. ISSN 0028-4793. doi: 10.1056/NEJM199109123251102. URL
http://www.nejm.org/doi/abs/10.1056/NEJM199109123251102.
E A Stuart. Matching methods for causal inference: A review and a look
forward. Stat Sci, 25(1):1–21, 2010. doi: 10.1214/09-STS313. URL
http://www.ncbi.nlm.nih.gov/pubmed/20871802http://www.ncbi.nlm.nih.
gov/pmc/articles/PMC2943670/pdf/nihms200640.pdf.
Moyses Szklo and F Javier Nieto. Epidemiology: beyond the basics. Jones & Bartlett
Learning, Burlington,MA, 3rd edition, 2014. ISBN 9781449604691. doi: 10.1016/j.
ijmedinf.2010.04.003.
G Taubes. Epidemiology faces its limits. Science (New York, N.Y.), 269(5221):164–9,
jul 1995. ISSN 0036-8075. URL http://www.ncbi.nlm.nih.gov/pubmed/7618077.
G Taubes. Do we really know what makes us healthy?, 2007.
J Textor, J Hardt, and S Knuppel. DAGitty: a graphical tool for analyzing causal
diagrams. Epidemiology, 22(5):745, 2011. doi: 10.1097/EDE.0b013e318225c2be. URL
http://www.ncbi.nlm.nih.gov/pubmed/21811114.
201
Referências Bibliográficas
Mark J van der Laan and Sherri Rose. Targeted Learning. Springer Series in Statistics.
Springer New York, New York, NY, 2011. ISBN 978-1-4419-9781-4. doi: 10.1007/978-
1-4419-9782-1. URL http://link.springer.com/10.1007/978-1-4419-9782-1.
Jan P. Vandenbroucke. The HRT controversy: observational studies and RCTs fall in
line. The Lancet, 373(9671):1233–1235, 2009. ISSN 01406736. doi: 10.1016/S0140-
6736(09)60708-X.
Tyler J. VanderWeele. Concerning the consistency assumption in causal inference. Epide-
miology, 20(6):880–883, 2009. ISSN 10443983. doi: 10.1097/EDE.0b013e3181bd5638.
Tyler J VanderWeele and Ilya Shpitser. On the definition of a confounder. The Annals
of Statistics, 41(1):196–220, feb 2013. ISSN 0090-5364. doi: 10.1214/12-AOS1058.
URL http://projecteuclid.org/euclid.aos/1364302740.
Liu Wei, M. Alan Brookhart, Sebastian Schneeweiss, Xiaojuan Mi, and Soko Setoguchi.
Implications of M bias in epidemiologic studies: A simulation study. American Journal
of Epidemiology, 176(10):938–948, 2012. ISSN 00029262. doi: 10.1093/aje/kws165.
Daniel Westreich. Berkson’s Bias, Selection Bias, and Missing Data. Epi-
demiology, 23(1):159–164, 2012. ISSN 1044-3983. doi: 10.1097/EDE.
0b013e31823b6296. URL http://content.wkhealth.com/linkback/openurl?
sid=WKPTLP:landingpage{&}an=00001648-201201000-00024.
202