Antonio Augusto Moura - Introducao A Inferencia Causal

Introdução à Inferência Causal em
Epidemiologia: uma abordagem gráfica e

contrafatual
Antônio Augusto Moura da Silva
Universidade Federal do Maranhão

27 de fevereiro de 2018
Sumário
Introdução 13
1. Causalidade em Epidemiologia 17
1.1. A difı́cil busca da causalidade . . . . . . . . . . . . . . . . . . . . . . . . 17
1.2. A história da terapia hormonal como fator de risco ou de proteção para
doença coronariana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.2.1. Qual a evidência atual? . . . . . . . . . . . . . . . . . . . . . . . 22
I. O Modelo de Respostas Potenciais: abordagem contrafatual 23

2. O Modelo de Respostas Potenciais 25
2.1. Respostas Potenciais e Efeito Causal Individual . . . . . . . . . . . . . . 25
2.2. Cálculo do Efeito Causal Médio . . . . . . . . . . . . . . . . . . . . . . . 29
2.2.1. Cálculo no Stata . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.3. Cálculo do efeito causal médio com a resposta fatual . . . . . . . . . . . 32
2.4. Quadrado Latino: contrafatuais no mundo real . . . . . . . . . . . . . . 34
2.5. Causa e Associação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3. Ensaio clı́nico randomizado 41

3.1. Caracterı́sticas do estudo experimental . . . . . . . . . . . . . . . . . . . 41
3.2. Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4. Estudos observacionais 47
4.1. Caracterı́sticas dos estudos observacionais . . . . . . . . . . . . . . . . . 47
4.2. Pressupostos para identificação do efeito causal . . . . . . . . . . . . . . 48
4.2.1. Intervenções bem definidas . . . . . . . . . . . . . . . . . . . . . 49
4.2.2. Permutabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.2.3. Positividade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.3. Exemplo - aplicação dos pressupostos em estudo observacional . . . . . 52
4.4. Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
II. Abordagem Gráfica 57

5. Gráficos Acı́clicos Direcionados (DAGs) 59
5.2. Notação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3
Sumário
5.3. Estruturas de associação . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

5.3.1. Cadeia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
5.3.2. Garfo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.3.3. Garfo Invertido . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.4. Intervenções necessárias e danosas nas estruturas de associação . . . . . 70
5.5. DAG como um sistema de equações estruturais não paramétricas . . . . 71
5.6. Separação direcional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
5.6.1. Separação direcional incondicional . . . . . . . . . . . . . . . . . 74
5.6.2. Separação direcional condicional . . . . . . . . . . . . . . . . . . 75
5.7. O critério da porta de trás . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.8. Identificando o conjunto mı́nimo de variáveis de ajuste para confundi-
mento no DAG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.9. DAG incluindo variáveis não mensuradas . . . . . . . . . . . . . . . . . 83
5.10. Identificação e estimação . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
5.11. Desenhando o DAG no programa DAGitty . . . . . . . . . . . . . . . . . 86
5.12. Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
6. Viés de confundimento: do conceito associacional ao conceito estrutural 93

6.1. O paradoxo de Simpson . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
6.1.1. Colapsibilidade da Medida de Associação . . . . . . . . . . . . . 96
6.1.2. Exercı́cio resolvido - o paradoxo de Simpson . . . . . . . . . . . . 100
6.2. Definição associacional de confundimento . . . . . . . . . . . . . . . . . 102
6.3. Definição contrafatual de confundimento . . . . . . . . . . . . . . . . . . 105
6.4. Viés M . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
6.5. Estruturas comuns de confundimento . . . . . . . . . . . . . . . . . . . . 110
6.6. Exemplo de viés de confundimento com intervenção no DAG por meio
do operador .do . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
6.7. Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.8. Métodos de ajuste para confundimento . . . . . . . . . . . . . . . . . . . 115
6.9. Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
6.10. Apêndice - Interação e modificação de efeito . . . . . . . . . . . . . . . . 119
7. Viés de colisão 121

7.1. Viés de Berkson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
7.2. Conceito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
7.3. Algumas causas de viés de colisão . . . . . . . . . . . . . . . . . . . . . . 124
7.4. Exemplo numérico de viés de colisão - Dieta e risco de câncer não
relacionado com a dieta . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
7.5. Exemplos de algumas estruturas de viés de colisão . . . . . . . . . . . . 128
7.5.1. Viés de colisão pela porta da frente . . . . . . . . . . . . . . . . . 128
7.5.2. Viés de colisão pela porta dos fundos . . . . . . . . . . . . . . . . 131
7.6. Intensidade do viés de colisão . . . . . . . . . . . . . . . . . . . . . . . . 132
7.7. Viés de colisão provocado por perdas de seguimento . . . . . . . . . . . 133
7.8. Exemplo de viés de colisão pela porta da frente - variável intermediária
afetada pelo tratamento . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
4
Sumário
7.9. Variável simultaneamente colisora e confundidora . . . . . . . . . . . . . 136

7.10. Diferenças e semelhanças entre viés de confundimento e viés de colisão . 137
7.11. Ajuste para viés de seleção . . . . . . . . . . . . . . . . . . . . . . . . . 138
7.12. Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
III. Estimação do Efeito Causal 143

8. Métodos de análise com escore de propensão 145
8.1. Escore de propensão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
8.2. Quais variáveis incluir no ajuste? . . . . . . . . . . . . . . . . . . . . . . 148
8.3. Passos na análise com escore de propensão . . . . . . . . . . . . . . . . . 149
8.3.1. Análise em modelos de regressão convencional . . . . . . . . . . . 150
8.3.2. Verificar balanceamento entre os grupos . . . . . . . . . . . . . . 150
8.3.3. Estimação do escore de propensão . . . . . . . . . . . . . . . . . 154
8.3.4. Ponderação pelo escore de propensão . . . . . . . . . . . . . . . . 154
8.3.5. Verificação do balanceamento após a implementação do escore
de propensão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
8.3.6. Cálculo do efeito causal em modelo ponderado pelo escore de
propensão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
8.4. Correção para efeito do desenho e/ou para perdas de seguimento . . . . 162
9. Exemplo de análise com escore de propensão em Epidemiologia no R 163

9.1. Estimativa do efeito causal por meio de escore de propensão . . . . . . . 163
9.1.1. Ponderação com escore de propensão . . . . . . . . . . . . . . . . 163
10.Exemplo de análise com escore de propensão em Epidemiologia no Stata 181

10.1. Estimativa do efeito causal por meio de escore de propensão . . . . . . . 181
10.1.1. Ponderação com escore de propensão . . . . . . . . . . . . . . . . 181
5
Lista de Figuras
2.1. Efeito causal individual - Paciente 1 - João . . . . . . . . . . . . . . . . 27
2.2. Efeito causal individual . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4. Desenho cruzado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.5. Desenho cruzado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.1. Ensaio clı́nico randomizado . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.1. Estudo de coorte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

4.2. Gráfico causal - PSF e Vacinação infantil . . . . . . . . . . . . . . . . . 52
5.1. DAG - Gráfico acı́clico direcionado. . . . . . . . . . . . . . . . . . . . . . 62

5.2. Estrutura de cadeia representando mediação . . . . . . . . . . . . . . . . 64
5.3. Cadeia - mediação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.4. Estrutura de garfo representando causa comum - viés de confundimento 65
5.5. Estrutura de garfo ilustrando condicionamento para causa comum, ne-
cessário para remover viés de confundimento . . . . . . . . . . . . . . . . 66
5.6. Garfo - confundimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.7. Estrutura de garfo invertido representando efeito comum com colisor . . 68
5.8. Estrutura de garfo invertido representando viés de colisão . . . . . . . . 68
5.9. Estrutura de garfo invertido representando viés de colisão . . . . . . . . 69
5.10. Estrutura de garfo invertido representando efeito comum com colisor e
descendente de colisor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.11. DAG sob magnificação representando estrutura de cadeia com os termos
de erro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.12. Exceção à regra da fidelidade - efeitos direto e indireto do fumo na saúde
se cancelariam . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.13. Separação Direcional entre A e D pelo colisor B . . . . . . . . . . . . . . 78
5.14. Conexão Direcional entre A e D por meio de condicionamento pelo colisor B 78
5.15. Conexão Direcional entre A e D por meio da causa comum E (de A e C) 79
5.16. Separação Direcional entre A e D por meio do colisor B e de condiciona-
mento por E . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.17. DAG ilustrando porque não se deve ajustar para descendentes do trata-
mento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
5.18. DAG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
5.19. DAG ilustrando situação na qual o efeito causal não é identificável por
meio de ajuste por covariáveis . . . . . . . . . . . . . . . . . . . . . . . . 85
7
Lista de Figuras
5.20. Identificação e Estimação . . . . . . . . . . . . . . . . . . . . . . . . . . 86

5.21. Programa DAGitty . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
5.22. Estrutura de garfo invertido mostrando Colisor no caminho pela porta
dos fundos entre o tratamento e o desfecho . . . . . . . . . . . . . . . . 88
5.23. DAG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
5.24. DAG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
5.25. DAG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
5.26. DAG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
6.1. DAG interpretando o paradoxo de Simpson como viés de colisão . . . . 95

6.2. DAG interpretando o paradoxo de Simpson como viés de confundimento 96
6.3. Viés de confundimento numa perspectiva associacional . . . . . . . . . . 109
6.4. Viés de confundimento numa perspectiva estrutural . . . . . . . . . . . . 110
6.5. DAG - Viés M - Colisor no caminho pela porta dos fundos . . . . . . . . 111
6.6. DAG - Viés de confundimento - C como causa comum direta de T e D . 112
6.7. DAG - Viés de confundimento - C como causa comum indireta de T via
A e direta de D . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
6.8. DAG - Viés de confundimento - C como causa comum direta de T
indireta de D via B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.9. DAG - Viés de confundimento - C como causa comum indireta de T via
A e indireta de D via B . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.10. Viés de confundimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
6.11. Gráfico mutilado demonstrando o operador do(.) para os dois valores do
tratamento T . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
7.1. DAG ilustrando o viés de Berkson como viés de colisão . . . . . . . . . 123

7.2. DAG ilustrando o viés de colisão quando estudamos efeito de fatores
perinatais nos desfechos fetais adversos apenas em nascidos vivos . . . . 124
7.3. DAG ilustrando viés de colisão quando condicionamos para perda de
peso em estudo sobre efeito da dieta em câncer não relacionado com a
dieta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
7.4. Viés de colisão pela porta da frente - condicionamento por variável
diretamente afetada pela exposição e pela doença . . . . . . . . . . . . . 128
7.5. Viés de colisão pela porta da frente - condicionamento por descendente
de colisor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
afetada pela exposição e por uma causa da doença . . . . . . . . . . . . 129
afetada por uma consequência da exposição e pela doença . . . . . . . . 130
afetada por uma consequência da exposição e pela doença . . . . . . . . 130
intermediária afetada pelo tratamento (mediador), que também é colisora
do mediador e do desfecho . . . . . . . . . . . . . . . . . . . . . . . . . . 131
8
Lista de Figuras
7.10. Viés de colisão pela porta de trás - condicionamento por variável afetada
pela doença e por uma causa da exposição . . . . . . . . . . . . . . . . . 132
7.11. Viés M - Colisor no caminho pela porta dos fundos - condicionamento
por variável afetada por uma causa da exposição e por uma causa da
doença . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
7.12. Viés M - Colisor no caminho pela porta dos fundos - condicionamento
por variável afetada por uma causa da exposição e por uma consequência
de uma causa da doença . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
7.13. Viés de colisão pela porta da frente - variável intermediária afetada pelo
tratamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
7.14. Estrutura Gravata-Borboleta - Colisor/Confundidor no caminho pela
porta dos fundos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
7.15. Fumo materno durante a gravidez e mortalidade infantil . . . . . . . . . 141
8.1. Verificando área de suporte comum pelo boxplot. . . . . . . . . . . . . . 157

8.3. Diferenças absolutas na médias padronizadas. . . . . . . . . . . . . . . . 161

9.2. Verificando diferenças padronizadas absolutas por método gráfico - ATE.176
9.3. Verificando diferenças padronizadas absolutas por método gráfico - ATT.179

10.2. Verificando balanceamento por método gráfico de densidade kernel. . . . 194
9
Lista de Tabelas
1.1. Terapia Hormonal e Doença Coronariana . . . . . . . . . . . . . . . . . 22
2.1. Modelo de Respostas Potenciais . . . . . . . . . . . . . . . . . . . . . . . 25

2.2. Estudo hipotético - tabagismo e câncer de pulmão . . . . . . . . . . . . 28
2.3. Exemplo hipotético - tratamento e desfecho dicotômicos . . . . . . . . . 31
2.4. Exemplo hipotético - respostas fatuais . . . . . . . . . . . . . . . . . . . 34
2.5. Cálculo da Razão de Risco Associacional . . . . . . . . . . . . . . . . . . 35
2.6. Situações Ideal (Causa) e Possı́vel (Associação) . . . . . . . . . . . . . . 37
4.1. Participação no Programa de Saúde da Famı́lia e Vacinação Infantil . . 49

4.2. Participação no Programa de Saúde da Famı́lia e Pobreza . . . . . . . . 53
4.3. Pobreza e Vacinação Infantil . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.4. Programa de Saúde da Famı́lia e Vacinação Infantil de acordo com a
pobreza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
5.1. Estruturas de associação no DAG e necessidade de intervenção . . . . . 70

5.2. Pressupostos da regras gráficas de separação direcional . . . . . . . . . . 76
5.3. Regras gráficas de separação direcional . . . . . . . . . . . . . . . . . . . 77
6.1. O paradoxo de Simpson - associação marginal . . . . . . . . . . . . . . . 93

6.2. O paradoxo de Simpson - associação condicional por sexo . . . . . . . . 94
6.3. Definições de colapsibilidade . . . . . . . . . . . . . . . . . . . . . . . . . 97
6.4. Não colapsibilidade do odds ratio na ausência de confundimento . . . . 98
6.5. Razões para não colapsibilidade - diferença entre a estimativa bruta e
ajustada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
6.6. Problemas e limitações no uso da definição associacional de confundimento104
6.7. Estimação do efeito causal . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.8. Definições associacional e estrutural de confundimento . . . . . . . . . . 109
6.9. Definições associacional e estrutural de confundimento . . . . . . . . . . 115
6.10. Métodos para controle de confundimento . . . . . . . . . . . . . . . . . . 116
6.11. Taxa de sucesso da cirurgia aberta e da nefrolitotomia percutânea no
tratamento de cálculos renais . . . . . . . . . . . . . . . . . . . . . . . . 118
6.12. Coeficientes de mortalidade especı́ficos por faixa etária e geral em São
Luı́s e Porto Alegre, 2015 . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6.13. Exemplo 1- Ausência de interação . . . . . . . . . . . . . . . . . . . . . . 120
6.14. Exemplo 2. Interação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
7.1. Viés de Berkson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
11
Lista de Tabelas
7.2. Viés de colisão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

7.3. Suplementação com ácido fólico e malformações do tubo neural . . . . . 140
8.1. Pareamento com base nas variáveis observadas . . . . . . . . . . . . . . 146

8.2. Critérios de seleção de variáveis para ajuste . . . . . . . . . . . . . . . . 149
8.3. Variáveis da coorte de Ribeirão Preto 1978/79 . . . . . . . . . . . . . . 151
8.4. Balanceamento das variáveis da coorte de Ribeirão Preto 1978/79 . . . 153
8.5. Tipos de efeito causal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
8.6. Cálculo dos pesos para tratamento binário . . . . . . . . . . . . . . . . . 157
8.7. Cálculo do escore de propensão e dos pesos para estimativa do ATE . . 159
9.1. Descrição do banco de dados lalonde . . . . . . . . . . . . . . . . . . . . 164
12
Introdução
Este livro de Introdução à Inferência Causal em Epidemiologia: uma abordagem gráfica e
contrafatual nasceu a partir da disciplina de Inferência Causal, ministrada no Programa
de Pós-Graduação de Saúde Coletiva, da Universidade Federal do Maranhão, e no
Programa de Pós-Graduação em Epidemiologia, da Escola Nacional de Saúde Pública
(ENSP), Fundação Oswaldo Cruz (FIOCRUZ), Rio de Janeiro.
Ao ministrar esta disciplina percebi a dificuldade de alguns alunos de acessar e
compreender a literatura cientı́fica a respeito do tema. Resolvi, então, aproveitar os
slides, arquivos e exercı́cios que desenvolvi na disciplina para iniciar a redação de um
livro didático, que pudesse servir de apoio à ministração deste conteúdo, de importância
cada vez mais crescente, para os cursos de Epidemiologia e Saúde Pública, a nı́vel de
pós-graduação. Ainda há poucos livros publicados, mesmo em inglês, sobre o assunto e
muitos deles são muito densos para o iniciante. Desta forma, o objetivo deste livro é,
sem perder de vista a abrangência desta área em desenvolvimento, explicar os principais
conceitos e aplicá-los em exemplos concretos de pesquisa.
A redação do livro foi um desafio, pois sua redação ocorreu ao mesmo tempo em
que lutava para compreender conceitos e aplicá-los em situações de pesquisa, nos
projetos e junto aos meus alunos. Espero que o esforço tenha valido a pena e seja
recompensado, levando a um maior aprendizado e utilização destas abordagens em
estudos epidemiológicos.
Este material é dirigido para aqueles que iniciam a compreensão da literatura sobre
inferência causal, numa perspectiva gráfica e contrafatual. Como texto introdutório
contém os fundamentos necessários para a formulação de uma questão bem definida e
focada de pesquisa (estimativa da quantidade alvo). Esta abordagem é mais explanatória
e mais indicada para responder a perguntas do tipo: um determinado tratamento cura
ou controla a doença? Tal exposição é causal? É menos indicada para perguntas mais
exploratórias do tipo: quais as causas de um determinado desfecho?
A partir de uma pergunta bem definida e articulada em termos contrafatuais, o
passo seguinte é construir uma teoria, que possa alicerçar os pressupostos causais para
que a quantidade alvo possa ser estimada. Nesta teoria, é importante a incorporação
de modelos gráficos causais, codificados em um gráfico acı́clico direcionado (DAG). A
partir do DAG, que contém embutidas equações estruturais não paramétricas, será
possı́vel verificar se a quantidade alvo de interesse é identificável a partir das variáveis
coletadas pelo pesquisador, aplicando-se, por exemplo, o critério da porta de trás de
Pearl (2009a).
Nesta abordagem é possı́vel passar da verificação de uma associação para uma
tentativa de avaliação da relação causal. A resposta a questões causais requerem
conhecimento prévio do mecanismo de geração dos dados e não podem ser respondidas
apenas a partir dos dados ou do conhecimento de sua distribuição empı́rica, utilizando-
13
Lista de Tabelas
se apenas o instrumental clássico da estatı́stica. Tal estimativa do efeito causal será

possı́vel desde que os pressupostos para sua realização sejam defensáveis (Pearl, 2009b).
Veremos que uma forma mais fácil para representar e comunicar relações causais se
dá por meio de uma combinação de equações estruturais não paramétricas e gráficos
causais. Entretanto, em estudos observacionais os pressupostos necessários para se
estimar o efeito causal não são testáveis empiricamente. Portanto, toda e qualquer
aventura de desvendamento de relações causais é sempre uma tentativa, sujeita a
erro. Sua diferença é que os pressupostos para as interpretações causais são deixados
explı́citos e discutidos exaustivamente, antes que se passe para o processo de estimação
da quantidade alvo.
A primeira parte do livro introduz o leitor para a busca difı́cil da causalidade e
reconta a história da elucidação de causalidade entre a terapia hormonal e a doença
coronariana. Prossegue descrevendo o modelo de respostas potenciais, a partir de sua
proposição por Rubin (1974). Em seguida, aborda o ensaio clı́nico randomizado como
padrão ouro para se realizar inferência causal, pois a randomização tende a assegurar
que os grupos sejam permutáveis entre si e que os padrões de resposta contrafatual
ignorados se distribuam de forma semelhante entre os tratados e os não tratados. A
partir daı́, se consideram os estudos observacionais como se fossem ensaios clı́nicos cuja
randomização foi comprometida e se descrevem quais as estratégias para remendar esta
”quebra do processo de randomização”. Como vimos, estas estratégias terão que estar
alicerçadas em sólidos pressupostos teóricos para que se avance para o passo seguinte
da pesquisa.
A segunda parte do livro trata dos diagramas causais (DAGs). Veremos que, a partir
dos DAGs é possı́vel, se a nossa teoria for completa, evitar viés de colisão e realizar
condicionamento por algumas variáveis para se controlar para o viés de confundimento.
O viés de confundimento será visto numa perspectiva estrutural, sendo impossı́vel
identificá-lo usando-se apenas critérios associacionais. O viés de colisão será retratado
como o nome estrutural do conhecido viés de seleção e serão descritas estratégias para
evitá-lo em situações de pesquisa.
A terceira parte do livro aborda a estimação do efeito causal. Iniciamos com um
resumo das principais estratégias convencionalmente usadas em epidemiologia para
este fim e descrevemos como, por que e quando elas falham. Segue discussão pormeno-
rizada sobre as limitações dos modelos de regressão paramétrica mais utilizados em
Epidemiologia. Por fim, abordamos as estratégias de condicionamento para estimação
do efeito causal mais utilizadas numa abordagem contrafatual: pareamento por escore
de propensão, ponderação pelo inverso da probabilidade de seleção e estimação g. Por
fim trataremos dos métodos duplamente robustos e da aprendizagem de máquinas
direcionada (que inclui uma biblioteca de métodos paramétricos e semiparamétricos de
estimação). Exemplos concretos de pesquisa utilizando estes métodos são apresentados
e os bancos de dados e comandos para a realização das análises podem ser baixados da
página deste livro na internet (http::).
A redação deste livro não seria possı́vel sem a colaboração de várias pessoas...
A jornada é longa. Espero que você aprecie o caminhar pelas páginas deste livro e ao
final possa utilizar os conhecimentos adquiridos para lhe ajudar a responder às suas
indagações causais em Epidemiologia numa perspectiva gráfica e contrafatual.
14
Lista de Tabelas
São Luı́s, Maranhão, 2018
Antônio Augusto Moura da Silva é professor de Epidemiologia do Programa de

Pós-Graduação em Saúde Coletiva da Universidade Federal do Maranhão (UFMA) e
pesquisador 1-B do CNPq na área de Saúde Coletiva.
15
1. Causalidade em Epidemiologia
1.1. A difı́cil busca da causalidade
Desde tempos imemoriais o homem se preocupa em desvendar causalidade. Desde
crianças nos preocupamos em atribuir relações de causa e efeito entre fenômenos
corriqueiros da vida. Percebemos que se abrirmos uma torneira a água jorra e concluı́mos
que a abertura da torneira provocou a saı́da da água. Este é um exemplo de causa
determinı́stica, ou seja, toda vez que ocorrer a causa, fatalmente ocorrerá o efeito
(a não ser, é claro, que haja falta de água na tubulação). Relações de causa e efeito
determinı́sticas são mais fáceis de desvendar e normalmente conseguimos perceber
isto pela experimentação, observando situações do dia a dia. Modelos determinı́sticos
produzem uma solução única.
Entretanto, nem todos os fenômenos obedecem a leis determinı́sticas. Outras vezes
mesmo que o fenômeno tenda a seguir leis determinı́sticas, não temos conhecimento
suficiente para entender este sistema determinı́stico. Pode também ocorrer que um
fenômeno seja provocado por várias causas, estas causas se relacionam entre si e nem
sempre a ocorrência de uma causa é suficiente ou necessária para provocar o efeito.
Há muitos anos os estatı́sticos e epidemiologistas perceberam que na área da saúde a
maioria dos efeitos são produtos de múltiplas causas. Quando há muitas causas atuando
em um fenômeno geralmente as leis determinı́sticas não mais se aplicam. Entretanto,
se percebeu que é possı́vel calcular a probabilidade de ocorrência de um evento, em
função da presença ou da atuação de uma ou de várias causas. Desta forma, modelos
probabilı́sticos ou estocásticos foram construı́dos para tentar prever a ocorrência de
um efeito, dada a ocorrência de uma determinada causa ou de várias causas atuando
em conjunto. No entanto, modelos probabilı́sticos não produzem uma solução única,
mas um intervalo de soluções. A partir da observação destas probabilidades nasceu
a estatı́stica. Foi também percebido que fenômenos com múltiplas causas tendem a
seguir a distribuição normal. Desta forma, a partir do uso do arsenal probabilı́stico é
possı́vel prever a probabilidade de ocorrência de um evento a partir de suas causas ou,
até mesmo, a partir de fatores não causais correlacionados àquele efeito.
Assim, devido a esta complexidade do mundo, não é fácil atribuir causalidade entre
dois eventos. A noção de causa não implica somente predizer eventos, mas explicar
eventos. Podemos prever a partir de correlações mas para atribuir causalidade, X
precisa explicar Y. É muito difı́cil saber se e quando X causa Y. O desenvolvimento
da matemática e da estatı́stica facilitaram este processo de atribuição de causalidade.
Entretanto, a simples observação da ocorrência de associação ou correlação entre X e
Y não é capaz de determinar causalidade. Simplesmente observar que dois fenômenos
estão associados não significa que um seja causa do outro, porque várias situações
17
não causais ou espúrias podem ocorrer. A estatı́stica nasceu identificando associações

entre eventos a partir da sua matéria prima que são os dados. Entretanto, a simples
observação empı́rica (dos dados) não é suficiente para a atribuição de causalidade.
É preciso conhecer a história por trás dos dados, ou seja, é preciso entender qual o
mecanismo de geração destes dados.
A ocorrência de associações espúrias tem enganado os homens através da história e,
por isso, até hoje a ciência luta para identificar mecanismos causais. O aforismo clássico
é bem conhecido: correlação não implica causalidade. Algumas vezes os mecanismos
causais são rapidamente percebidos, de forma intuitiva. Outras vezes é possı́vel pensar
em diversos mecanismos alternativos para explicar a ocorrência de uma determinada
associação e perceber que um destes mecanismos desafia as leis da lógica ou tem muito
baixa probabilidade de ocorrência. Vários exemplos deste fenômeno são bem ilustrativos
e estão presentes em livros de Epidemiologia e de Sociologia.
Um exemplo vem da Sociologia. É bem conhecida a associação entre vendas de
sorvete e crime. Quando as vendas de sorvete aumentam, também aumenta a taxa de
criminalidade. Então se poderia concluir que o aumento das vendas de sorvete seja a
causa da criminalidade? Como este mecanismo para explicar a geração dos dados é
ilógico, facilmente se pode perceber que esta correlação não é causal, pois aumento
de venda de sorvete não pode causar crime. Como explicar, então, a ocorrência desta
associação, qual o mecanismo que está por trás da geração destes dados? Ora, o aumento
das vendas de sorvete ocorre nos meses de verão, em que há aumento da temperatura.
O aumento da temperatura também faz com que as pessoas saiam mais de casa. Em
conclusão, há uma causa comum que provocou ao mesmo tempo o aumento da venda de
sorvetes e o aumento da taxa de criminalidade, que foi o aumento da temperatura. Logo,
os dados não contam toda a história, há processos escondidos que não são revelados
pela simples observação dos dados. Para se identificar causalidade é preciso se conhecer
os mecanismos que geram este padrão de dados e descartar associações espúrias. Há
que se propor uma teoria para explicar os padrões de associação revelados a partir
dos dados e submeter esta teoria a teste. A principal dificuldade está em como fazer
isto a partir de associações que são lógicas e que podem ter uma explicação causal
ou ser espúrias. É possı́vel separar o componente espúrio das associações e identificar
causalidade?
1.2. A história da terapia hormonal como fator de risco

ou de proteção para doença coronariana
Nas décadas de 80 e 90, estudos observacionais de coorte concluı́ram que mulheres que
tomavam terapia hormonal (TH) com estrogênios para aliviar sintomas da menopausa
apresentavam menor risco de desenvolver doença coronariana, subsequentemente. A
partir destas observações a TH passou a ser recomendada para a prevenção de doença
coronariana em mulheres, quando os hormônios femininos passaram a ser um dos
fármacos mais vendidos no mundo. Entretanto, no inı́cio deste século, ensaios clı́nicos
randomizados (ECR) concluı́ram que a TH não reduzia o risco futuro de doença
18
1.2. A história da terapia hormonal como fator de risco ou de proteção para doença coronariana
coronariana mas parecia, inclusive, aumentar o risco desta doença. Vamos recontar
esta história com maiores detalhes.
Em 1991 foram publicados resultados do seguimento de 10 anos de 48470 mulheres
do Nurse’s Health Study (NHS), que tinham idade de 30 a 63 anos (média em torno
de 53 anos). Estas mulheres estavam usando ou não terapia hormonal (TH) após
a menopausa e não tinham câncer ou doença cardiovascular no inı́cio do estudo.
Comparando-se mulheres que estavam usando TH após a menopausa com outras que
nunca a usaram e ajustando-se o modelo para idade, tabagismo, história familiar
de doença cardiovascular, ı́ndice de massa corporal, uso prévio de anticoncepcionais,
hipertensão, diabetes, colesterolemia e época de nascimento (para se controlar efeito
de coorte) foi estimado um risco relativo de 0,56 (Intervalo de confiança de 95% 0,40-
0,80) (Tabela 1.1). Portanto, a TH foi associada a uma redução de 44% do risco de
doença coronariana. Os autores concluı́ram que a ausência aparente de viés de seleção
ou confundimento sugere efeito causal e que os benefı́cios da TH superam os riscos
observados (aumento de câncer de endométrio e de mama em usuárias de TH), pois
não observaram risco aumentado de acidente vascular cerebral (Stampfer et al., 1991).
Em 1992, foi publicada uma revisão sistemática com metanálise de estudos observa-
cionais. Neste estudo, a estimativa conjunta foi de um risco relativo de 0,65 (Intervalo
de confiança de 95% 0,59-0,71) (Tabela 1.1), sugerindo que a TH está associada a uma
redução de 35% do risco de doença coronariana (Grady et al., 1992).
Entretanto, em 1998, foram publicados os resultados do HERS (Heart and Estro-
gen/Progestin Replacement Trial). Nesse estudo foram incluı́das 2763 mulheres com
doença coronariana, de 44 a 79 anos, com idade média de 67 anos. Foram randomizadas
para receber uma combinação de estrogênio e progesterona ou placebo. Ao final de 4,1
anos de seguimento, analisando-se os resultados segundo a intenção de tratar, o uso
de TH não reduziu o risco de morte por doença coronariana ou de infarto não fatal
(RR=0,99, IC 95% 0,80-1,22) (Tabela 1.1). Quando os autores analisaram os dados
segundo o número de anos após a randomização, observaram um maior risco de eventos
cardiovasculares no primeiro ano de uso da TH (RR=1,52, IC 95% 1,01-2,29), risco
este que decresceu nos anos subsequentes (Tabela 1.1). Entretanto, havia diferenças
importantes na população e no tratamento utilizado, em comparação com o NHS. As
mulheres do HERS eram mais velhas, tinham doença coronariana e tomaram uma
combinação de estrogênio e progesterona, enquanto no NHS elas eram mais jovens,
mais saudáveis e a maioria recebeu apenas estrogênio (Hulley et al., 1998).
Em seguida, em 2002, foram publicados os resultados do ensaio clı́nico controlado
denominado Women’s Health Initiative (WHI). Neste ensaio foram incluı́das 16608 mu-
lheres com idade de 50 a 79 anos, com idade média de 63 anos, que foram randomizadas
para receber uma combinação de estrogênio e progesterona ou placebo. Nesse estudo, a
maioria das mulheres era saudável, pois apenas 7,7% relataram doença coronariana
prévia. O estudo, previsto para durar 8 anos e meio, foi interrompido com 5,2 anos de
seguimento pelo aumento do risco de câncer de mama, detectado em análise interina. Os
resultados da análise por intenção de tratar mostraram um risco aumentado de morte
por doença coronariana ou infarto não fatal (RR=1,29, IC 95% 1,02-1,63) (Tabela
1.1). Os autores concluı́ram que a TH não deve ser utilizada na prevenção primária de
doença coronariana (Rossouw et al., 2002).
19
O que explicaria esta diferença entre os resultados dos estudos observacionais e

experimentais. Por que a epidemiologia muitas vezes chega a resultados contraditórios
e envia mensagens para o público que muitas vezes mudam? Como pode uma terapia
considerada protetora ser agora causa da mesma doença para a qual milhares de
prescrições foram indicadas?
Taubes publicou, em 2007, no The New York Times Magazine, uma reportagem,
perguntando se nós sabemos o que nos faz saudáveis. Criticou a epidemiologia que,
um dia recomenda com confiança que as mulheres devem tomar TH para a prevenção
primária da doença coronariana e, outro dia, reverte este conselho e o que era proteção
agora se torna danoso (Taubes, 2007).
Como reconciliar estes resultados antagônicos? Será que a epidemiologia encontrou
os seus limites (Taubes, 1995)? As ferramentas usadas pela Epidemiologia não seriam
confiáveis (Taubes, 2007)? Já não seria a hora de dar a Epidemiologia por encerrada
(Davey Smith and Ebrahim, 2001)? Afinal, os estudos observacionais são dignos de
crédito (Vandenbroucke, 2009) ou devemos confiar apenas nos resultados dos ensaios
clı́nicos, menos sujeitos a viés?
Uma das primeiras considerações diz respeito aos estudos observacionais. São as
únicas ferramentas que podemos usar quando as intervenções são danosas, mas eles são
muito vulneráveis a viés. O viés de seleção (health-user bias, viés do usuário saudável)
seria uma possibilidade para explicar este resultado contraditório dos estudos em relação
à TH (Grodstein et al., 2003). Mulheres mais saudáveis e conscientes de sua saúde, que
têm menor risco de doença cardiovascular, têm menor ı́ndice de massa corporal, são
mais educadas e ricas, fazem mais atividade fı́sica e também tendem a fazer maior uso
de TH (Taubes, 2007). Ou seja, as mulheres que usam TH não são comparáveis às que
não a usam, pois as usuárias de TH são mais saudáveis que as não usuárias e, assim,
o menor risco de doença coronariana nas usuárias de TH não seria causado pela TH
em si, mas sim pelo fato destas mulheres serem mais saudáveis. Assim, esta correlação
espúria dá uma impressão de relação causa-efeito. Sabemos que correlação não é causa.
Há, claramente, problemas na interpretação dos resultados dos estudos epidemiológicos
(Taubes, 2007).
Por outro lado, os estudos experimentais são muito caros e levam anos para produzir
resultados. Além disso, os ensaios clı́nicos tendem a recrutar pessoas mais saudáveis,
motivadas e com propensão a comparecer regularmente para as avaliações (Taubes,
2007). Assim, muitas vezes, os resultados dos ensaios têm menor generalização externa.
Entretanto, quando os pesquisadores começaram a reanalisar os dados levando em
conta o tempo decorrido desde o inı́cio da TH, percebeu-se que os estudos observacionais
e experimentais passaram a concordar entre si. Nos ensaios clı́nicos randomizados esta
análise pelo tempo já é feita naturalmente. Os resultados dos ensaios clı́nicos mostraram
que há um aumento do risco de doença coronariana nos primeiros anos após o inı́cio
da TH, risco este que diminui e desaparece com o tempo de uso. Nas análises iniciais
dos estudos observacionais o que se fez foi um contraste entre quem estava tomando
TH com quem nunca recebeu TH. Assim, como muitas usuárias já estavam usando TH
há alguns anos, já tinham passado da fase de maior risco cardiovascular, porisso foi
detectada apenas proteção nestes estudos (Vandenbroucke, 2009). A tarefa agora seria
reanalisar os dados segundo tempo de uso. Hernán et al. (2008) reanalisaram os dados
20
1.2. A história da terapia hormonal como fator de risco ou de proteção para doença coronariana
do NHS imitando um ensaio clı́nico. Ao invés de compararem quem estava tomando TH

com quem nunca recebeu TH, compararam quem iniciou uma combinação de estrógenos
e progestina com quem não iniciou a TH em cada intervalo de tempo do estudo. Além
disso, só incluı́ram mulheres que não tinham realizado histerectomia, que não tinham
tomado hormônio nos dois últimos anos, e aquelas que não tinham tido diagnóstico
prévio de doença coronariana ou câncer. Quando esta reanálise foi feita, foi também
demonstrado, a partir dos dados dos estudos observacionais, que há um aumento do
risco de doença coronariana nos primeiros anos de uso (RR=1,42, IC 95% 0,92-2,20),
risco este que desapareceu à medida em que o tempo passou. Observaram também que
o risco só parece aumentar para as mulheres que começaram a tomar hormônio com 10
ou mais anos após a menopausa (RR=1,20 IC 95% 0,78-1,84) (Tabela 1.1) (Hernán
et al., 2008). Entretanto, todas estas diferenças também podem ser explicadas pela
variabilidade amostral, visto que a unidade está incluı́da em todos os intervalos de
confiança. Nesta reanálise, pequena parte da discrepância foi também atribuı́da ao viés
da usuária sadia (Prentice et al., 2005; Hernán et al., 2008), mas a maior parte da não
concordância se deveu ao efeito diferencial da TH de acordo com o tempo após o seu
inı́cio (Vandenbroucke, 2009).
Assim, a pergunta dos ensaios clı́nicos era diferente dos estudos observacionais.
Enquanto os estudos experimentais indagaram qual o risco de doença coronariana para
mulheres que iniciam o uso de TH anos após a menopausa, os estudos observacionais
perguntaram se a TH é capaz de prevenir doença coronariana quando iniciada logo após
a menopausa (Taubes, 2007). Este aumento do risco de doença coronariana nos anos
iniciais da TH pode ser explicado pelo maior risco de trombose/isquemia associado
à TH. À medida em que o uso progride, este risco começa a ser contrabalanceado
pela redução dos lipı́dios séricos causado pela TH, quando então esta passa a ter um
papel protetor contra a doença coronariana (Hulley et al., 1998). Entretanto, uma
possibilidade explicativa plausı́vel para este possı́vel efeito protetor da TH a longo
prazo seria viés de sobrevivência, por meio do óbito de suscetı́veis no grupo que recebeu
a TH (Vandenbroucke, 2009).
Em suma, qual a lição que nos fica deste evento da história da epidemiologia? Que
resultados consistentes de vários estudos observacionais podem ser devidos a viés. A
busca da causalidade é difı́cil, mas ela não é impossı́vel tendo como base os estudos
observacionais. Obviamente a atribuição de causalidade é mais fácil por meio de ensaios
clı́nicos, pois a randomização tende a equilibrar os grupos experimental e controle em
relação a confundidores conhecidos e desconhecidos. Por outro lado, nem sempre a
ausência de randomização é a única razão explicativa da discordância entre estudos
experimentais e observacionais. Outra lição é que os desenhos observacionais e experi-
mentais se complementam e que é interessante analisar os estudos observacionais, como
se eles fossem estudos experimentais. Neste livro vamos abordar métodos analı́ticos, nos
quais vamos analisar estudos observacionais como se eles fossem estudos experimentais
fracassados (Imbens and Rubin, 2015).
21
1.2.1. Qual a evidência atual?

Em 2015, foi publicada revisão sistemática da Cochrane resumindo a evidência disponı́vel
até o momento em relação a esta pergunta. Há evidência moderada de que a terapia
hormonal seja um fator de proteção para doença coronariana quando iniciada com
menos de 10 anos após a menopausa e uma evidência forte de que não seja fator de
proteção nem de risco quando iniciada com 10 ou mais anos após a menopausa (Tabela
1.1) (Boardman et al., 2015).
Tabela 1.1.: Terapia Hormonal e Doença Coronariana

Ano Estudo/Tempo de uso Intervalo de
Confiança de 95%
Estudos observacionais
1991 NHS - Nurse’s Health Studya 0,56 (0,40-0,80)
2008 Reanálise NHS como ensaio clı́nicob
Total 0,98 (0,66-1,49)
<2 anos 1,61 (0,97-2,66)
<10 anos 0,54 (0,19-1,51)
≥10 anos 1,20 (0,78-1,84)
1992 Revisão sistemática de estudos
Observacionaisc 0,65 (0,59-0,71)
Ensaios clı́nicos
1998 Heart and Estrogen/Progestind
Replacement Study - HERS 0,99 (0,80-1,22)
HERS - Primeiro Ano 1,52 (1,01-2,29)
2002 Women’s Health Initiative - WHI
Totale 1,29 (1,02-1,63)
<2 anosf 1,68 (1,15-2,45)
2 a 5 anosf 1,25 (0,87-1,79)
≥5 anosf 0,66 (0,36-1,21)
2015 Revisão Sistemática da Cochraneg
Total 1,00 (0,78-1,29)
<10 anos 0,52 (0,29-0,96)
≥10 anos 1,07 (0,96-1,20)
Fonte:
a
Stampfer et al. (1991).
b
Hernán et al. (2008).
c
Grady et al. (1992).
d
Hulley et al. (1998).
e
Rossouw et al. (2002).
f
Prentice et al. (2005).
g
Boardman et al. (2015).
22
Parte I.
O Modelo de Respostas
Potenciais: abordagem
contrafatual
23
2. O Modelo de Respostas Potenciais
2.1. Respostas Potenciais e Efeito Causal Individual
O modelo de respostas potenciais, também denominado modelo de respostas contra-
fatuais, foi desenvolvido por Rubin (1974), a partir dos trabalhos de Neyman (1923)
e está sistematizado em livro recentemente publicado (Imbens and Rubin, 2015). O
nome resposta potencial vem do fato de que, para se estudar causalidade sem viés, o
mesmo indivı́duo deveria ser submetido a diferentes situações ou tratamentos, às quais
teriam como consequência, várias respostas potenciais. Vejamos o caso mais simples,
no qual tanto o tratamento como o desfecho são dicotômicos. Assumindo-se tratamento
dicotômico (t) e desfecho (D) também dicotômico, teremos duas respostas potenciais
associadas a cada situação de tratamento1 . Representaremos t=12 se o indivı́duo tiver
sido tratado e t=0, se a pessoa não tiver recebido o tratamento). Usaremos D=13
para representar a ocorrência do desfecho e D=0 para significar que o desfecho não
aconteceu.
Teremos então uma situação na qual o indivı́duo foi submetido ao tratamento (Dt=1 ,
leia-se D sob o tratamento, ou seja, o valor do desfecho que teria sido observado na
situação de tratamento) e outra na qual o indivı́duo não recebeu o tratamento (Dt=0 ,
leia-se D sob o não tratamento, ou seja, o valor que o desfecho teria assumido na
situação controle). Em cada uma destas situação, o desfecho pode ocorrer (Dt=1 = 1,
Dt=0 = 1) ou não (Dt=1 = 0, Dt=0 = 0). O efeito causal é, então, calculado a partir da
comparação entre estas duas respostas potenciais, ou seja, (Dt=1 − Dt=0 , se usarmos a
diferença entre as respostas potenciais). Se Dt=1 = Dt=0 , então não há efeito causal.
Se Dt=1 6= Dt=0 , então há efeito causal. Vejamos com mais detalhe estas situações na
tabela 2.1 abaixo:
Tabela 2.1.: Modelo de Respostas Potenciais

Grupo D1 D0
Tratamento (t=1) Observável como D Não observável - contrafatual
Controle (t=0) Não observável - Contrafatual Observável como D
Assim, na situação em que o indivı́duo foi submetido ao tratamento (Dt=1 ) o desfecho

pode ter ocorrido (Dt=1 = 1) ou não (Dt=1 = 0) e, neste caso, a resposta potencial é
1 utilizaremos a letra t para representar tratamento e D para representar Desfecho
2 letras minúsculas serão usadas para representar valores assumidos por variáveis aleatórias, ou seja,
realizações destas variáveis
3 letras maiúsculas serão utilizadas para representar variáveis aleatórias
25
fatual, ou seja, pode ser observada como D (D1 ) 4 . Não sabemos o que teria acontecido
com o indivı́duo que na realidade foi submetido ao tratamento (Dt=1 ) caso ele tivesse
sido colocado no grupo controle D0 5 . Esta situação, não observável, é contrafatual, ou
seja, é contra situações de fato ocorridas, contra o fato. Representa a resposta potencial
que poderia ter acontecido, caso o indivı́duo alocado no grupo de tratamento tivesse
sido colocado no grupo controle. Da mesma forma, na situação em que o participante
não recebeu o tratamento (Dt=0 ) o desfecho pode ter ocorrido (Dt=0 = 1) ou não
(Dt=0 = 0) e, neste caso, a resposta potencial é fatual, ou seja, pode ser observada como
D (D0 ). Não sabemos o que teria ocorrido com o indivı́duo alocado no grupo controle
(Dt=0 ) caso ele tivesse sido tratado D1 . Esta possibilidade também é contrafatual e
não pode ser observada (tabela 2.1). Assim, o problema fundamental da inferência
causal, segundo Holland é que uma das respostas potenciais nunca pode ser observada,
permanecendo ignorada, e, desta forma, nunca se pode calcular o efeito causal individual
(Holland, 1986).
Assim para se calcular o efeito causal sem viés, terı́amos que inicialmente submeter
o indı́viduo ao tratamento, observar a resposta potencial na situação em que a pessoa
foi tratada (Dt=1 ). Esta resposta potencial poderia ter sido 0, se o desfecho não tivesse
ocorrido, ou 1, se o desfecho tivesse ocorrido. Em seguida, terı́amos que voltar no
tempo, ou observar esta mesma pessoa em um universo paralelo na situação em que ela
não tenha sido submetida ao tratamento (Dt=0 ). A resposta potencial nesta situação
poderia ter sido 0 ou 1. A partir da comparação entre estas duas respostas potenciais,
poderı́amos calcular, então, o efeito causal individual.
Como é impossı́vel se voltar no tempo e, até hoje a ciência não descobriu universo
paralelo, o que fazemos na realidade, quando vamos estudar uma determinada relação
causal, é comparar grupos. Comparamos um grupo submetido ao tratamento com outro
grupo não submetido ao tratamento e comparamos as respostas fatuais médias em
cada grupo. Se os grupos forem iguais entre si, conseguiremos calcular o efeito causal
sem viés. Como não observamos as respostas contrafatuais, elas não são consideradas
quando se realiza a estimativa do efeito causal.
Vejamos, agora, um exemplo prático. A nossa hipótese de estudo é se fumar causa
câncer de pulmão. Tomemos João, nosso bonequinho branco (figura 2.1), nosso partici-
pante número 16 . João é fumante. Em nosso estudo de coorte fictı́cio acompanharemos
João por muitos anos, para observar se ele desenvolverá ou não câncer de pulmão.
Assim, João é um indivı́duo exposto ao tabagismo. Se estivéssemos realizando um ensaio
clı́nico João seria um indivı́duo escolhido para o grupo de tratamento7 . Desta forma,
como João foi exposto ou tratado, e a exposição é dicotômica, precisaremos calcular
Dt=1 , ou seja, qual o valor que o desfecho dicotômico teria, se D=1 (se João desenvolver
câncer de pulmão) ou se D=0 (se João não tiver câncer de pulmão), na situação em que
João foi tratado. O tempo se passou e João, infelizmente, após 40 anos de tabagismo,
desenvolveu câncer de pulmão. Portanto, nosso desfecho Dt=1 = 1. Infelizmente, não
4 D1 é uma versão encurtada de Dt=1
5 D0 é uma versão encurtada de Dt=0
6 o subescrito 1 é usado para identificar o participante
7 consideraremos exposição e tratamento como intercambiáveis e representaremos a exposição também
pela letra t
26
2.1. Respostas Potenciais e Efeito Causal Individual
temos como saber o que teria acontecido com João na situação contrafatual na qual ele
não tivesse sido fumante (Dt=0 ).
Figura 2.1.: Efeito causal individual - Paciente 1 - João
A primeira situação representa a resposta fatual
Agora, vamos supor que foi recentemente inventada uma máquina em que se pode
viajar no tempo. Convidamos João para pegar uma carona no túnel do tempo e ter uma
chance de viver uma nova vida. João desembarcou há exatamente 40 anos atrás, um
pouco antes do instante em que iniciou o hábito de fumar. Nesta nova vida, João não
será fumante e poderemos, então, calcular, o desfecho contrafatual Dt=0 e compará-lo
com o desfecho fatual. Após 40 anos de seguimento, João não desenvolveu câncer de
pulmão nesta sua nova vida, portanto Dt=0 = 0. Para o nosso estudo hipotético, João
contribuirá com uma linha, e será nosso participante número 1. Assim, começamos
a preencher a tabela do nosso estudo (tabela 2.2). João desenvolveu câncer quando
exposto (tratado, Dt=1 = 1 ou D1 = 1) e não desenvolveu câncer quando não exposto
(não tratado, Dt=0 = 0 ou D0 = 0). Como João foi exposto nesta vida, sua situação
fatual está listada na segunda coluna da tabela, sob D1 . Perceba que, no nosso exemplo
imaginário, não haveria situação contrafatual pois, se existisse máquina do tempo, as
duas vidas de João teriam sido, na realidade, fatuais, já que ele teria tido a oportunidade
de viver ambas as vidas.
Nosso estudo hipotético teve também três outros participantes: Raimundo, Maria
e Rosa. Raimundo na vida fatual não era fumante mas, mesmo assim, desenvolveu
câncer de pulmão. Convidamos Raimundo a viajar no túnel do tempo. Nesta nova vida
contrafatual em que Raimundo fumou, ao final de 40 anos ele não teve câncer de pulmão
(figura 2.3(a)). Como Raimundo não era fumante nesta vida, sua situação fatual está
listada na terceira coluna da tabela, sob D0 . Raimundo é o segundo participante do
nosso estudo e seus dados estão compilados na tabela 2.2.
Maria era fumante na vida real, fatual e nesta vida ela teve câncer de pulmão.
Entretanto, após viajar no tempo e viver a outra vida contrafatual, Maria, que não
fumou nesta sua outra vida, mesmo assim, também desenvolveu câncer de pulmão (figura
27
Tabela 2.2.: Estudo hipotético - tabagismo e câncer de pulmão
Número Participante D1 D0
1 João 1 0
2 Raimundo 0 1
3 Maria 1 1
4 Rosa 0 0
Os desfechos das situações fatuais estão destacados em negrito
2.3(b)). Ou seja, tanto quando fumou, quanto quando não fumou, Maria desenvolveu
câncer. Ou seja, tanto na vida fatual quanto na vida contrafatual Maria estava como
que ”predestinada”a ter câncer de pulmão. Os dados desta nossa terceira participante
estão mostrados na tabela 2.2.
Rosa é a nossa quarta participante. Na vida real Rosa não era fumante e não
desenvolveu câncer de pulmão. Entretanto, após viajar no tempo e viver sua outra vida
contrafatual, na qual fumou, também não desenvolveu câncer de pulmão. Parece que
Rosa é imune ao câncer de pulmão. Tanto na vida real, em que ela fumou, como na
vida contrafatual hipotética, em que ela não fumou, ela não teve câncer de pulmão
(figura 2.3(c). Os dados desta nossa quarta participante estão compilados na tabela 2.2.
Retornemos, agora à tabela 2.2. Nesta tabela vemos que para João, ocorreu efeito
causal, ou seja, o hábito de fumar foi a causa do seu câncer de pulmão. Tanto para
Maria como para Rosa, o tabagismo não influenciou no câncer de pulmão, pois, tanto
na situação de exposição quanto de não exposição Maria desenvolveu câncer e Rosa
não desenvolveu câncer. Já para Raimundo o hábito de fumar foi um fator de proteção,
pois quando ele fumou não teve câncer, mas quando não fumou desenvolveu câncer.
A grande vantagem de se comparar as duas respostas potenciais no mesmo indivı́duo
é que, como se trata da mesma pessoa, vivendo duas vidas idênticas, todo o resto é
igual: a única mudança que ocorreu na vida das pessoas foi a exposição. Desta forma,
se pudéssemos observar as duas respostas potenciais no mesmo indivı́duo, poderı́amos
calcular, sem viés, o efeito causal individual. Daı́ terı́amos a certeza se a exposição de
fato teria causado a doença.
Como não podemos calcular o efeito causal individual na prática o que teremos que
fazer é comparar apenas as respostas fatuais entre os grupos tratado e não tratado.
Ou seja, calcular o efeito causal médio. Na nossa tabela o que farı́amos seria comparar
as respostas fatuais de João e Raimundo na situação de tratamento, com as respostas
fatuais de Maria e Rosa na situação de não tratamento, ou controle (as respostas
marcadas em negrito na tabela). Se João e Raimundo forem semelhantes a Maria e Rosa
em todas as demais variáveis que poderiam interferir nesta associação, desvendarı́amos,
sem viés, o efeito causal do tratamento no desfecho.
28
2.2. Cálculo do Efeito Causal Médio
Figura 2.2.: Efeito causal individual
(a) 2 - Raimundo (b) 3 - Maria
(c) 4 - Rosa
A primeira situação representa a resposta fatual

Para se calcular o efeito causal médio na população, sem viés, terı́amos que conhecer as
duas respostas potenciais ou, então, assumir que os grupos tratamento e controle são
iguais em relação a todas as demais variáveis que potencialmente poderiam interferir no
nosso resultado. Como na vida real só obtemos uma das respostas potenciais, a fatual e
a outra resposta potencial, a contrafatual é ignorada, não temos condições de calcular
o efeito causal médio na população, sem viés, de uma forma livre de pressupostos. Para
calcular o efeito causal médio a partir da comparação de grupos, vários pressupostos são
necessários. Veremos isto mais adiante neste capı́tulo. Agora vamos realizar um novo
estudo utilizando nossa máquina do tempo e comparar o efeito causal médio na amostra
de estudo, comparando as duas respostas potenciais fatual e contrafatual no mesmo
indivı́duo. Realizaremos o cálculo de uma medida de efeito marginal ou incondicional.
Denomina-se marginal pois todos os indivı́duos são incluı́dos no seu cálculo, pois foram
observados nas duas situações, fatual e contrafatual. A denominação marginal vem
da margem da tabela, ou seja, o total da tabela, que inclui todos os participantes. O
sinônimo incondicional indica que não se estabeleceu nenhuma condição para a inclusão
no cálculo, o que significa que todos serão utilizados no cálculo da medida. A fórmula
para o seu cálculo, assumindo-se qualquer tipo de resposta, contı́nua, dicotômica ou
29
outra, está disposta na equação 2.1. Nesta fórmula temos o contador i, que indica a
quantidade de participantes do estudo. Na primeira parte da equação o efeito causal
médio está escrito em termos de média das diferenças dos efeitos causais individuais
(E[Dit=1 − Dit=0 ])8 . Na segunda parte da equação este mesmo efeito está explicitado
como diferença entre as médias dos efeitos causais individuais (E[Dit=1 ] − E[Dit=0 ]).
Como a média das diferenças é igual à diferença entre as médias, os dois cálculos podem
ser realizados de forma intercambiante, como veremos mais abaixo.
Efeito Causal Médio na População
E[Dit=1 − Dit=0 ] = E[Dit=1 ] − E[Dit=0 ] (2.1)
Efeito Causal Médio na População (resposta dicotômica)

Diferença de Risco Causal (DRC)
P r[Dit=1 = 1] − P r[Dit=0 = 1] (2.2)

Como, no nosso exemplo, usaremos tratamento e desfecho de forma dicotômica, a
fórmula 2.1 pode ser reescrita em termos de probabilidades. A fórmula para se calcular
o efeito causal médio na população no caso de uma resposta dicotômica consta na
equação 2.2.
Vamos, agora, calcular o efeito causal médio em outra situação hipotética, realizado
com 60 participantes. Inicialmente o tratamento foi administrado a 40 participantes e
não o foi aos 20 restantes. Após a finalização do tempo de seguimento, cada sujeito
desenvolveu ou não o desfecho, e isto foi anotado em nossa planilha. Em seguida,
convidamos os 60 participantes a viajar na nossa máquina do tempo. Nesta segunda
situação invertemos a administração do tratamento. Assim, os 20 que não tinham
sido tratados foram tratados na sua vida contrafatual, enquanto os 40 que tinham
sido tratados participaram agora do grupo controle na sua outra vida. Os dados do
nosso estudo hipotético se encontram registrados no arquivo tabaco.dta, reproduzido
abaixo em formato tabular condensado 2.3. Note que as respostas fatuais, reais estão
destacadas em negrito. Perceba que tivemos 20 pessoas que nesta vida foram expostas
e desenvolveram a doença, mas que na outra vida não foram expostos e não tiveram
a doença (D1 = 1 e D0 = 0). Por outro lado, 5 sujeitos expostos nesta vida e não
expostos na outra desenvolveram a doença em ambas as situações potenciais (D1 = 1
e D0 = 1). Além disso, outras 20 pessoas na vida fatual foram expostas mas não
adoeceram, enquanto na vida contrafatual não foram expostas mas adoeceram (D1 = 0
e D0 = 1). E, para completar, 15 participantes não adoeceram em ambas as situações
fatual e contrafatual (D1 = 0 e D0 = 0).
Para calcular o efeito causal médio, é necessário primeiro calcular a probabilidade de
ocorrência do desfecho na situação de exposição P r[Dt=1 1 = 1] e a probabilidade de
ocorrência do desfecho na situação de não exposição P r[Dt=0 = 1]. Depois, para se
obter a diferença de risco causal basta diminuir uma probabilidade da outra. E, para
8 Na fórmula, E significa o valor médio esperado de uma experiência, se ela for repetida inúmeras
vezes, ou Esperança. Se todos os eventos tiverem a mesma probabilidade de ocorrência, o valor
esperado é a média aritmética
30
Tabela 2.3.: Exemplo hipotético - tratamento e desfecho dicotômicos
D1 D0 n
1 0 20
1 1 5
0 1 20
0 0 15
Total 60
Os desfechos das situações fatuais estão destacados em negrito
se calcular a razão de risco causal, teremos de dividir uma probabilidade pela outra.
Assim:
Probabilidade do desfecho se exposto = P r[Dt=1 = 1] = 25/60 = 0,417

Probabilidade do desfecho se não exposto = P r[Dt=0 = 1] = 25/60=0,417
Cálculo do efeito causal médio:
Diferença de risco causal = 0,417 - 0,417 = 0

Concluı́mos que o tratamento não teve efeito causal no desfecho. Para efeitos práticos
e para simplificar o entendimento, estamos ignorando o erro aleatório. Numa situação
real, terı́amos também que calcular os intervalos de confiança em torno desta estimativa.
Poderı́amos também ter calculado o efeito causal não como diferença de risco, mas
como razão de risco, usando a equação 2.3. Neste caso, o resultado seria 0,417/0,417 =
1, ou seja, a exposição não teria aumentado a probabilidade de ocorrência do desfecho.
Efeito Causal Médio na População (resposta dicotômica)

Razão de Risco Causal (RRC)
P r[Dit=1 = 1]/P r[Dit=0 = 1] (2.3)
2.2.1. Cálculo no Stata

Os cálculos do efeito causal médio foram também realizados no Stata e estão reprodu-
zidos abaixo. Note que primeiro calculamos as diferenças entre as respostas potenciais
individuais e depois realizamos o cálculo das médias destas diferenças. O resultado foi
0. Em seguida, fizemos o cálculo da outra forma, calculando as médias nas situações de
tratamento (0,417) e controle (0,417). Finalmente, obtivemos a diferença entre estas
médias (0), chegando ao mesmo resultado.
. use tabaco
. expand n
(46 observations created)
31
.
. * Cálculo das diferenças entre as respostas potenciais individuais
. gen d=d1-d0
. * Cálculo do Efeito Causal Médio (média das diferenças)
. sum d
Variable Obs Mean Std. Dev. Min Max
d 60 0 .823387 -1 1
.
. * Cálculo da média das respostas potenciais individuais
. sum d1
d1 60 .4166667 .4971671 0 1
. gen md1=r(mean)
. sum d0
d0 60 .4166667 .4971671 0 1
. gen md0=r(mean)
.
. * Cálculo da diferença entre as médias das respostas potenciais
. gen m=md1-md0
. sum m
m 60 0 0 0 0
.
. * Cálculo da razão entre as médias das respostas potenciais
. gen r=md1/md0
. sum r
r 60 1 0 1 1
2.3. Cálculo do efeito causal médio com a resposta

fatual
Como não existe máquina do tempo, vamos voltar à realidade. Como calcular o efeito
causal médio, se não observamos as respostas contrafatuais? Como vimos anteriormente,
a única solução possı́vel é comparar grupos, calcular a diferença entre as respostas
fatuais nos dois grupos e usar esta medida como uma estimativa do efeito causal.
Entretanto, ao comparar grupos, estaremos calculando uma medida de associação e
não mais uma medida de causa. Aprendemos muito bem que correlação não é causa.
Como podemos usar uma medida de correlação para medir causa? Os dados comunicam
apenas associações e se quisermos inferir causa a partir dos dados necessitaremos de
vários pressupostos. Deixemos de lado estes pressupostos por um momento e vamos
utilizar os nossos dados para calcular a medida de associação, ignorando a resposta
32
2.3. Cálculo do efeito causal médio com a resposta fatual
contrafatual, já que não podemos mesmo viajar no tempo e calcular a medida de
efeito causal. Para comparar grupos, em caso de tratamento e desfecho dicotômicos,
usaremos as fórmulas das equações 2.4, para calcular a diferença de risco associacional
(DRA), e 2.5, para obter a razão de risco associacional (RRA). Nestas fórmulas usamos
a proporção de sujeitos que desenvolvem o desfecho entre aqueles que receberam o
tratamento, ou seja, a proporção da doença entre os tratados e diminuı́mos, para obter
o DRA, ou dividimos, para calcular o RRA, esta quantidade pela proporção da doença
entre os não tratados.
Medida de Associação
Diferença de Risco Associacional (DRA)
P r[Di = 1|Ti = 1] − P r[Di = 1|Ti = 0] (2.4)
Medida de Associação
Razão de Risco Associacional (RRA)
P r[Di = 1|Ti = 1]/P r[Di = 1|Ti = 0] (2.5)

Observe que agora, estaremos comparando não mais as mesmas pessoas em dois
momentos do tempo, mas sim pessoas diferentes em dois grupos. Ou seja, não estare-
mos mais estimando um efeito marginal, mas um efeito condicional. Estamos, agora,
estabelecendo uma condição para a pessoa participar do cálculo, que é pertencer a um
determinado grupo, ou ter sido exposto ou não exposto. Porisso, quando calculamos
uma medida em um grupo, estamos condicionando para a variável de pertencimento no
grupo. Na figura 2.3 ilustramos esta situação. Estamos comparando o desfecho ocorrido
com João na situação de tratamento (t=1), pois João na realidade é fumante com o
desfecho ocorrido com Raimundo na situação de não tratamento (t=0), pois Raimundo
não é fumante (Figura 2.3). Esqueçamos nossa viagem hipotética no tempo e utilizemos
apenas os dados reais.
Figura 2.3.:
33
Abaixo, na tabela 2.4 mostramos os dados fatuais do nosso estudo. Para isto, tivemos
que rearrumar a tabela 2.2, pois agora não temos mais as respostas contrafatuais
para contrastá-las com as respostas fatuais. Temos apenas a resposta fatual D1 para
os tratados e a resposta fatual D0 para os não tratados. As respostas contrafatuais,
representadas na tabela com a interrogação (?) não são estimáveis. Deste processo
resultou a tabela 2.4 em formato condensado. A partir da tabela 2.4 construı́mos a
tabela 2.5, colocando a exposição nas linhas e o desfecho nas colunas, no formato
padrão com a qual nós epidemiologistas estamos mais acostumados. A partir da tabela
calculamos a medida de associação condicional (RRA, razão de risco associacional).
Usando apenas os dados fatuais, obtivemos o valor 2, o que significa que na presença
da exposição, o risco de desenvolver o desfecho é duplicado. Ou seja, há associação e
a exposição é um fator de risco para a doença. Note que o resultado da RRA (1) é
diferente da RRC (0). Portanto, por causa da nossa máquina do tempo, neste caso
temos certeza de que a RRA é uma medida viciada da RRC. Viés é, portanto, a
diferença entre a medida de associação e a medida de efeito causal.
Continuamos assumindo que não há erro aleatório. Se levarmos em conta o erro
aleatório, o Intervalo de Confiança é de 0,88 - 4,54, e aı́ a nossa conclusão seria que a
diferença entre a RRC e a RRA está dentro da margem de erro e poderı́amos considerar
as duas como iguais. Entretanto, para fins didáticos estamos usando amostras pequenas
e assumindo que não existe erro aleatório. Se a amostra fosse grande esta diferença
seria estatisticamente significante.
Tabela 2.4.: Exemplo hipotético - respostas fatuais
T D D1 D0 n
1 1 1 ? 20
1 0 0 ? 20
0 1 ? 1 5
0 0 ? 0 15
Total 60
2.4. Quadrado Latino: contrafatuais no mundo real

Há uma possibilidade de estudo real, no qual podemos estimar as quantidades fatuais e
contrafatuais neste mundo, mesmo sem a existência da máquina do tempo. Trata-se do
quadrado latino ou desenho cruzado (cross-over). Neste desenho, a exposição precisa ter
efeito efêmero e não deixar cicatriz e o desfecho também necessita ser reversı́vel. Nesta
situação podemos expor primeiro o indivı́duo a uma situação (tratamento ou placebo)
no tempo 1, registrar o desfecho, deixar passar um tempo sem tratamento, para que o
efeito da exposição desapareça (chamado perı́odo de lavagem ou livre de tratamento,
wash-out) e, em seguida, expor o mesmo sujeito à outra situação (placebo ou tratamento)
no tempo 2 e anotar o desfecho (figura 2.4). Desta forma podemos, mesmo neste mundo,
34
2.5. Causa e Associação
Tabela 2.5.: Cálculo da Razão de Risco Associacional

D=1 D=0 Total
n % n
T=1 20 50,0 20 40
T=0 5 25,0 15 20
Total 25 41,7 35 60
RRAT D = 20/40 / 5/20 = 2
RRA=Razão de Risco Associacional
comparar as duas respostas potenciais no mesmo indivı́duo, quando exposto a diferentes

situações de exposição. Neste caso, não haveria situação contrafatual, já que ambas as
respostas potenciais seriam fatuais, sendo que uma ocorre primeiro no tempo do que a
outra. Neste desenho, como foi percebido que a ordem de administração das situações
interfere no desfecho, é necessário aleatorizar a ordem da exposição. Este é o único
desenho que nos permite obter os efeitos causais individuais, sem viés, assumindo-se
que todas as demais condições, exceto a intervenção, permaneçam imutáveis no tempo.
Na figura 2.5 ilustramos o desenho cruzado, com o nosso personagem João para verificar
se a aspirina tem efeito na cefaléia. Inicialmente sorteamos a ordem de tratamento
para o nosso paciente 1, João. Sorteamos para realizar o tratamento no tempo 1 e
administrar o placebo no tempo 2. Assim, no tempo 1, quando João estiver com dor
de cabeça, representada na figura pela cabeça vermelha, administramos aspirina para
João (P r[D1t=1 ])9 . Sem seguida, observamos se a cefaléia cessa (P r[D1t=1 = 1], se a
cabeça de João ficar branca) ou persiste (P r[D1t=1 = 0], se a cabeça de João continuar
vermelha). Esperamos passar um certo perı́odo livre de tratamento. E, quando João
apresentar novamente dor de cabeça (tempo 2), prescrevemos placebo (P r[D1t=0 ]) e
vemos se a cefaléia persiste (P r[D1t=0 = 0]) ou desaparece (P r[D1t=0 = 1]). Observe
que neste desenho também é imprescindı́vel a administração de placebo para controlar
o efeito placebo10 .

Considerando tratamento e desfecho dicotômicos, para se avaliar causa, o ideal é que
cada indivı́duo seja exposto aos dois tratamentos e possamos, então, comparar as duas
respostas potenciais no mesmo indivı́duo. Nesta caso podemos calcular a RRC (Razão
de Risco Causal). Causa é o risco de desenvolver o desfecho quando se observa as
duas respostas potenciais em toda a população. Ou seja, para se estimar causa, temos
que estimar uma probabilidade não condicional ou marginal. Como vimos, o termo
9o subscrito 1 é para identificar o participante João
10 quando o paciente tem conhecimento se está recebendo o tratamento ou não, é descrito que ele
se sente melhor quando recebe o tratamento, quando acredita que o tratamento é eficaz. Este
fenômeno é denominado efeito placebo
35
Figura 2.4.: Desenho cruzado
Placebo Tratamento
Tempo 1 Tempo 2
Tratamento Sem Tratamento Placebo
Figura 2.5.: Desenho cruzado
marginal se refere ao total da margem da tabela. Para isto, usamos a fórmula 2.6,
que serve tanto para resposta dicotômica, como não dicotômica. No caso de resposta
dicotômica a fórmula a ser utilizada é a 2.3. Comparando-se as respostas potenciais
em cada indivı́duo (tabela 2.6), podemos inferir se o tratamento não teve efeito causal,
quando E[Dit=1 ] = E[Dit=0 ], quando T for independente de D (T ⊥ D), ou se teve efeito
causal, quando E[Dit=1 ] 6= E[Dit=0 ], quando T for dependente de D (T 6⊥ D). Desta
forma, na primeira linha, que contém os dados do participante 1, como E[D1t=1 = 1]
e E[D1t=0 = 0], o tratamento teve efeito causal no desfecho, representando risco pois,
quando o tratamento foi administrado, o efeito ocorreu e no grupo controle o desfecho
não foi observado. No segundo caso, as respostas foram iguais, sendo ambas iguais a 1,
não ocorrendo efeito causal. No terceiro participante, como E[D3t=1 = 0] e E[D3t=0 = 1],
o tratamento também teve efeito causal, mas de proteção, pois quando o tratamento
foi administrado o efeito não foi observado, mas quando ele foi executado, o sujeito
manifestou o desfecho. No quarto participante, também não houve efeito causal, pois
nas duas situações o desfecho não ocorreu (0).
36
Medida de Efeito Causal

Razão de Risco Causal (RRC)
E[Dit=1 ]/E[Dit=0 ] (2.6)
Tabela 2.6.: Situações Ideal (Causa) e Possı́vel (Associação)
Ideal - Causa
Probabilidade Marginal
i Dt=1 Dt=0 Conclusão
1 1 0 Efeito causal - risco
2 1 1 Não há efeito causal
3 0 1 Efeito causal - proteção
4 0 0 Não há efeito causal
RRC = E[Dit=1 ]/E[Dit=0 ]
Possı́vel - Associação
Probabilidade Condicional
T D
1 0
1 1
0 1
0 0
RRA = E[Di = 1|Ti = 1]/E[Di = 1|Ti = 0]
Entretanto, com exceção do desenho quadrado latino, na vida real é impossı́vel a

observação da resposta potencial contrafatual. Assim, o possı́vel é ter cada indivı́duo
exposto a apenas um tratamento e assim, observar apenas uma resposta potencial, o
desfecho fatual (tabela 2.6). Assim, a única estratégia que podemos usar é comparar
grupos de expostos e não expostos e comparar a resposta fatual nestes dois grupos
de indivı́duos. Desta forma, estaremos medindo associação, que é a comparação de
duas probabilidades condicionais em dois grupos. Medimos o risco de desenvolver o
desfecho dado que o indivı́duo foi exposto ou não ao tratamento. O resultado é a razão
de risco associacional (RRA), calculada pela fórmula 2.5, na qual dividimos o risco da
doença entre tratados pelo risco da doença entre indivı́duos não tratados. A RRA é
uma medida condicional.
Na figura 2.6 demonstramos a diferença entre causa e associação de uma maneira
mais visual. Imaginemos que o nosso estudo tem 10 participantes. Para se estudar
causa, terı́amos que observar todos os 10 indivı́duos nas duas situações de tratamento,
o que fazemos na parte esquerda da figura. Retratamos a situação de tratamento
pintando os bonecos de preto e a situação controle ilustrando os bonecos de branco.
Note que expomos todos os 10 participantes às duas situações e assim, podemos
calcular tanto E[Dit=1 ] quanto E[Dit=0 ] e comparar as duas respostas potenciais fatual
37
Figura 2.6.: Causa e Associação
e contrafatual em todo o grupo. Como obtivemos duas probabilidades marginais, pois

obtidas nos mesmos indivı́duos, é possı́vel calcular uma medida marginal de causa
(DRC ou RRC). Esta seria a situação ideal, obter uma medida marginal, calculada em
todos os indivı́duos.
Entretanto, na vida real, procedemos como na parte direita da figura 2.6. Dividimos
os participantes em dois grupos, tratamos uma parte, no caso 4 indivı́duos, e deixamos
de tratar os outros 6. Assim, vamos comparar dois grupos de pessoas e obter duas
probabilidades condicionais: no grupo tratado (E[Di = 1|Ti = 1]), e no grupo não
tratado (E[Di = 1|Ti = 0]. Vamos comparar apenas as respostas fatuais de diferentes
indivı́duos. Obteremos uma medida condicional de associação (DRA ou RRA).
Vimos que associação não é causa, pela possibilidade de existir viés, que vai tornar a
medida de associação (RRA) diferente da medida de efeito causal (RRC). A questão
central da inferência causal é se é possı́vel calcular uma medida de associação e
interpretá-la como uma medida de causa. Ou seja, se é possı́vel usar a RRA para
estimar a RRC, sem viés.
Dito em outras palavras, em quais condições se pode assumir que E[Dit=1 ]/E[Dit=0 ] é
igual a E[Di = 1|Ti = 1]/E[Di = 1|Ti = 0]? Em quais condições medidas de associação
podem ser usadas para estimar efeitos causais?
Vimos que o problema fundamental da inferência causal é como estimar a resposta
contrafatual, não observada, ignorada (missing). Se o grupo não tratado for um
substituto adequado para estimar a resposta contrafatual não observada no grupo de
tratamento, podemos estimar a resposta contrafatual sem viés.
Assim, para usarmos a RRA como estimativa sem viés da RRC, precisamos de
pressupostos. Dentre estes pressupostos, o mais importante é o da permutabilidade. Se
os indivı́duos tratados forem iguais aos indivı́duos não tratados, eles são permutáveis
entre si. Desta forma, poderı́amos inverter os grupos, tratando os não tratados ou
deixando de tratar os tratados e o resultado não mudaria (descartando-se o papel do
38
acaso).
Em conclusão, se pudermos assumir que estes pressupostos são verdadeiros, podere-
mos, então, usar a RRA para estimar a RRC. Veremos, nos próximos capı́tulos, quais
são estes pressupostos.
39
3. Ensaio clı́nico randomizado
3.1. Caracterı́sticas do estudo experimental
Na figura 3.1 observamos a estrutura de um ensaio clı́nico controlado randomizado. A
partir da população de interesse, o pesquisador seleciona uma amostra de voluntários
para estudo, a partir da aplicação dos critérios de inclusão e exclusão. Os participantes
serão, então, divididos em dois grupos: intervenção e controle. O grupo de intervenção
receberá o tratamento em estudo e o grupo não exposto à intervenção será o grupo
controle, ou de comparação. Normalmente, o grupo controle receberá placebo ou o
tratamento convencional.
Neste estudo, o controle do experimento está nas mãos do investigador. Entretanto,
não é o pesquisador quem decide quem vai ser tratado ou quem vai fazer parte do grupo
controle. Esta decisão é tomada de forma aleatória, por sorteio. Esta forma de escolha
aleatória dos grupos aumenta a probabilidade de que os grupos sejam formados de
forma homogênea, ou seja, o mais parecidos entre si em relação a variáveis preditoras
do tratamento. Este processo de escolha aleatória dos integrantes dos grupos tratado e
controle é denominado de randomização. O processo de randomização, por ser aleatório,
tende a balancear covariáveis observadas e não observadas, eliminando ou reduzindo
viés de confundimento (Rosenbaum, 2017).
Após a formação dos grupos por randomização, os participantes serão, então, acompa-
nhados por um perı́odo determinado, para se observar a ocorrência ou não do desfecho.
Ao final se realiza a análise de dados. No estudo experimental o pesquisador parte da
causa para o efeito. É um estudo longitudinal, de caráter prospectivo. Denomina-se
controlado, porque tem um grupo controle.
Como o estudo experimental é realizado com voluntários, e geralmente os voluntários
são pessoas diferentes das não voluntárias em relação a variavéis pré-tratamento,
neste desenho a amostra de estudo tende a diferir da população de interesse, resul-
tando, portanto, viés de seleção. Isto faz com que os dados do estudo experimental
tenham redução de sua validade externa. Entretanto, por causa da randomização é o
estudo epidemiológico que apresenta maior validade interna, pela alta probabilidade de
balanceamento das variáveis pré-tratamento nos grupos experimental e controle.
Devido ao efeito placebo, explicado no capı́tulo anterior, é fundamental usar a
estratégia de duplo cegamento. Assim, nem o participante nem o avaliador devem saber
a qual dos grupos o indivı́duo pertence, se ao tratamento ou controle, para que suas
respostas não sejam induzidas (as pessoas tendem a melhorar se acreditam na eficácia
do tratamento e o avaliador tende a ver as coisas de forma mais favorável se acha que o
tratamento funciona). Desta forma, o estudo experimental deve ser duplo-cego, exceto
quando isto for impossı́vel (por exemplo, não é possı́vel cegar o paciente na comparação
41
Figura 3.1.: Ensaio clı́nico randomizado
entre um método cirúrgico versus um método clı́nico de tratamento, pois não se vai
anestesiar um paciente e fingir que o operou para atingir o duplo cegamento).
No estudo experimental ideal, os grupos tratamento e controle são permutáveis entre
si, pois a randomização assegura que tanto os valores observados das respostas fatuais
quanto os valores ignorados das respostas contrafatuais estejam distribuı́dos ao acaso.
Assim imaginemos que T designe os indivı́duos sorteados para o grupo de tratamento
e C os participantes selecionados para o grupo controle. Se, porventura, trocarmos
as letras e tratarmos os rotulados com a letra C e colocarmos no grupo controle os
identificados pela letra T, isto, em tese, não alteraria os resultados do nosso estudo
(mas os resultados na prática podem ser um pouco diferentes, em decorrência do acaso).
Assim, P r[Dt = 1|T = 1] = P r[Dt |T = 0] = P r[Dt = 1], leia-se o risco condicional da
resposta potencial entre os tratados é igual ao risco condicional da resposta potencial
nos não tratados que, por sua vez, são iguais ao risco marginal da resposta potencial caso
todos os indivı́duos tivessem sido tratados (Hernan and Robins, 2018). Ou seja, podemos
usar o risco fatual entre os não tratados como substituto do risco contrafatual que
teria sido observado nos tratados, se eles não tivessem sido submetidos ao tratamento.
Da mesma forma, podemos usar o risco fatual entre os tratados para estimar o risco
contrafatual entre os não tratados, caso eles tivessem recebido o tratamento. Porisso,
a randomização tem alta probabilidade de levar à igualdade entre os grupos, o que
torna os grupos permutáveis entre si. Esta probabilidade é tanto mais elevada, quanto
maior for o tamanho da amostra, pela lei dos grandes números. Porisso é sempre
imprescindı́vel calcular o tamanho mı́nimo de amostra toda vez que formos realizar um
estudo epidemiológico.
42
3.1. Caracterı́sticas do estudo experimental
A randomização é a melhor estratégia para controle de confundimento, pois só ela

tende a tornar balanceados os grupos tratamento e controle em relação a variáveis
não observadas, não coletadas no estudo e que nem pensamos que pudessem confundir
o resultado do mesmo. Podemos usar várias técnicas de controle de confundimento
(veremos estas técnicas com detalhes na terceira parte deste livro), mas estas técnicas,
se funcionarem e se todos os pressupostos para sua utilização forem atendidos, são
capazes de balancear os grupos apenas em relação às variáveis observadas e incluı́das
no ajuste (Morgan and Winship, 2015).
O estudo experimental é considerado o padrão ouro da inferência causal, pelas
caracterı́sticas acima apontadas. A randomização torna alta a probabilidade de que os
grupos estejam balanceados em relação a variáveis pré-tratamento. Entretanto, alguns
problemas podem acontecer após a randomização e reduzir a sua eficácia: não aderência
ao tratamento, perdas de seguimento e co-intervenção.
A não aderência ao tratamento faz com que pessoas escolhidas para receber o
tratamento não façam uso do mesmo e coloca o pesquisador em uma encruzilhada. Se
ele optar por excluir estas pessoas, a eficácia da randomização pode ser quebrada, pois
se estaria utilizando de restrição, ao se analisar apenas os aderentes. Se os aderentes
forem diferentes dos não aderentes em relação a variáveis preditoras do tratamento (o
que geralmente acontece) isto pode resultar em viés de seleção. Se, ao contrário, ele
utilizar a análise pela intenção de tratar e analisar os tratados que não aderiram ao
tratamento como se tivessem sido tratados, isto pode gerar falso positivo (um efeito
benéfico do tratamento que não existiria no grupo total se todos tivessem realmente
aderido ao tratamento é identificado) ou falso negativo (um possı́vel efeito benéfico
do tratamento pode não ser detectado). Apesar dos problemas relatados acima em
relação à análise pela intenção de tratar, o procedimento mais recomendado hoje é de
se utilizar esta forma de análise para se evitar a quebra da eficácia da randomização
(Moher et al., 2010).
Outro problema potencial são as perdas de seguimento. Neste caso, como o pesquisador
não acompanhou os indivı́duos até o final do estudo, não se sabe qual o desfecho ocorrido.
O que o pesquisador deve fazer neste caso: excluir os casos perdidos? Se excluir os casos
perdidos e o desfecho for diferente entre os que participaram até o final, comparados
com os que abandonaram o estudo, ocorrerá viés de seleção, que pode levar a resultados
falsos. Uma das alternativas disponı́veis é realizar a análise pelo pior cenário. O
pesquisador atribui o pior desfecho possı́vel aos tratados e o melhor desfecho possı́vel
aos não tratados. Ou seja, no grupo tratado será considerado que o tratamento não
foi eficaz e no grupo não tratado será registrado que o tratamento teria sido eficaz.
Se os dados resistirem a esta prova de força isto será uma demonstração de que os
resultados permanecem válidos, apesar das perdas sofridas no estudo (Guyatte et al.,
2015). Entretanto, por esta estratégia ser muito conservadora, ela tem sido pouco
utilizada. Outra alternativa é analisar o tempo até o desfecho ocorrido até o último
momento do seguimento de cada indivı́duo. Assim, se o estudo tiver duração de dois
anos, aqueles que que não tiveram o desfecho e permaneceram até o final contribuirão,
cada um, com 24 meses para o tempo de seguimento. Se o desfecho tiver ocorrido será
considerado o tempo até a ocorrência do desfecho. Para os perdidos, entre os quais o
desfecho ainda não ocorreu, será contabilizado o tempo até a perda de seguimento. A
43
segunda alternativa é a mais interessante e a mais utilizada nos ensaios clı́nicos, mas a
estratégia ideal é reduzir ao máximo as perdas de seguimento.
A co-intervenção também pode confundir os resultados de um estudo experimental.
Se a co-intervenção for aplicada mais em um grupo do que em outro, ela tem o potencial
de misturar os seus efeitos com o efeito da intervenção em estudo. A co-intervenção é
um exemplo de um desbalanço potencial que pode ocorrer nos grupos de intervenção
e controle em uma variável pós-tratamento, após a randomização. Co-intervenções
precisam ser padronizadas e administradas da mesmo forma a ambos os grupos ou
evitadas (Moher et al., 2010).
No ensaio clı́nico randomizado deve haver apenas uma única versão do tratamento
sendo administrada. Se houver mais de uma versão do tratamento, será impossı́vel
individualizar um único efeito do tratamento. Neste caso, não podemos dar uma inter-
pretação causal a uma medida que é uma mistura de efeitos de diferentes tratamentos
(Morgan and Winship, 2015; Hernan and Robins, 2018). Retornaremos a este ponto
quando discutirmos, no próximo capı́tulo 4, os pressupostos para inferência causal.
Assim, em estudos experimentais, a randomização tende a produzir grupos balancea-
dos em relação a variáveis pré-tratamento observadas e não observadas. Normalmente,
em todo ensaio clı́nico é publicada a tabela 1, comparando as variáveis pré-tratamento
entre os grupos, para que seja verificada, empiricamente a eficácia da randomização.
Neste caso não faz sentido realizar teste estatı́stico para verificar diferenças entre
os grupos e reportar o valor de P. Já sabemos que qualquer diferença observada foi
produzida pelo acaso, pois a escolha dos grupos foi feita por meio da randomização,
que é um procedimento aleatório (Moher et al., 2010).
Nos ensaios clı́nicos ideais, com aderência completa e sem perdas de seguimento,
nos quais foi verificado não haver, empiricamente, diferenças entre os grupos, pode-se
assumir o pressuposto da permutabilidade entre os grupos. Neste caso, diremos que a
variável de tratamento é independente das respostas potenciais (T ⊥ D1 , D0 ) (Morgan
and Winship, 2015). Dito em outras palavras, não há confundimento por variável
omitida. Nenhuma variável pré-tratamento é capaz alterar as respostas potenciais.
Como os grupos são iguais em todas as variáveis, não existe variável que influencie
ao mesmo tempo o tratamento e o desfecho e que seja capaz de provocar viés de
confundimento.
Se há permutabilidade, então P r[D = 1|T = 1] = P r[Dt=1 = 1], ou seja, o risco
observado do desfecho entre os tratados, uma medida condicional, é igual ao risco
do desfecho se todos os indivı́duos tivessem sido tratados, uma medida marginal. Da
mesma forma, P r[D = 1|T = 0] = P r[Dt=0 = 1], leia-se, o risco observado do desfecho
entre os não tratados, uma medida condicional, é igual ao risco do desfecho se todos
os indivı́duos não tivessem sido submetidos ao tratamento, uma medida marginal.
Assim, o risco relativo associacional (RRA) é igual ao risco relativo causal (RRC). Ou
P r[D = 1|T = 1]/P r[D = 1|T = 0] = P r[Dt=1 = 1]/P r[Dt=0 = 1] . Ou seja, podemos
interpretar uma medida de associação como uma medida de efeito causal (Hernan and
Robins, 2018).
Entretanto, o estudo experimental só pode ser utilizado para testar intervenções
potencialmente benéficas. Não é ético submeter seres humanos a intervenções poten-
cialmente maléficas. Além disso, outras vezes não é factı́vel se realizar ensaio clı́nico
44
3.2. Conclusão
controlado por variadas razões (Rosenbaum, 2017). Se, por exemplo, pretendemos
saber se a participação em programa de transferência de renda, como o Bolsa Famı́lia,
tem efeito no percentual de vacinação não poderı́amos aleatorizar o tratamento, por
isto ser inviável do ponto de vista polı́tico. Hoje, em virtude de outros benefı́cios já
demonstrados pelo programas, também não seria ético realizar um ensaio clı́nico para
testar esta hipótese.
3.2. Conclusão
Assim, se podemos no ensaio clı́nico controlado randomizado ideal interpretar uma
medida de associação como de causa se houver permutabilidade entre os grupos e a
versão do tratamento for única, o que fazer no caso de estudos observacionais, nos
quais os grupos estão desbalanceados em relação a variáveis preditoras do tratamento?
Simplesmente teremos que calcular uma medida de associação e deixar as considerações
causais à mercê da intuição e do bom senso? Ou haverá outra alternativa?
45
4. Estudos observacionais
4.1. Caracterı́sticas dos estudos observacionais
Nos estudos observacionais a alocação dos indivı́duos para os grupos tratamento e
controle está fora do controle do investigador. Os indivı́duos são selecionados, geralmente
por processos sociais, ou se autoselecionam e, assim, terminam em um dos grupos de
estudo. Nestes estudos não há randomização e, portanto, existe um grande potencial
para viés de confundimento. Isto torna a interpretação causal dos estudos observacionais
muito difı́cil.
O mecanismo de alocação que engendra a formação dos grupos geralmente leva a
diferenças sistemática entre os grupos de tratamento (ou de expostos) e o controle (de
não expostos). Assim, não há balanceamento entre os grupos e desta forma, a RRA
não é igual à RRC. Ou seja, a princı́pio não podemos usar uma medida de associação
como estimativa de uma medida de causa em estudos observacionais.
O grande problema nos estudos observacionais é que há diferenças nas caracterı́sticas
pré-tratamento ou pré-exposição, o que leva a viés. A grande pergunta é como rebalancer
os grupos nos estudos observacionais? Como criar contrafatuais adequados na ausência
de randomização?
Se pudermos conceber os estudos observacionais como estudos experimentais imper-
feitos e compreender como se dá o processo de alocação nos grupos, podemos tentar
remover diferenças sistemáticas existentes entre os grupos. Esta estratégia foi proposta
por Imbens and Rubin (2015). Vamos entender melhor como ela funciona com um
exemplo prático.
Queremos saber se participar do programa de saúde na famı́lia (PSF) causa maiores
percentuais de vacinação em crianças. Como a realização de um estudo experimental
randomizado é inviável, pois o PSF já está implantado há vários anos, além de ter
benefı́cios já testados, temos que realizar um estudo observacional para responder a
esta pergunta. Vamos imaginar que tenhamos realizado um estudo de coorte para
responder a esta pergunta. A estrutura de um estudo de coorte está demonstrada na
figura 4.1. Neste estudo, a partir de uma população alvo o pesquisador seleciona uma
amostra para estudo. Esta amostra também é composta por voluntários, pois apenas os
que aceitarem participar terão dados coletados. Em seguida, o pesquisador observa os
grupos tal como eles já se encontram formados na realidade: expostos e não expostos.
Depois acompanha os indivı́duos por um determinado perı́odo de tempo e registra a
ocorrência ou não do efeito. Assim, o estudo de coorte, tal como o ensaio clı́nico, parte
da causa para o efeito, sendo um estudo longitudinal prospectivo. O grupo controle são
os indivı́duos não expostos. A diferença entre o ensaio clı́nico e o estudo de coorte é
o controle da administração do tratamento pelo pesquisador e a randomização, que
47
ocorrem apenas no primeiro estudo.
Figura 4.1.: Estudo de coorte
No inı́cio do nosso estudo de coorte identificamos um grupo de expostos ou tratados,

que recebiam visita domiciliar de um agente de saúde do PSF, e um grupo controle
ou não tratado, que não participava do programa. No inı́cio do segundo ano de vida,
inspecionamos as carteiras de vacinação das crianças e criamos uma variável dicotômica,
à qual atribuı́mos o valor 1 se a criança não tivesse tomado todas as vacinas do
calendário básico de vacinação até completar 1 ano de idade (vacinação incompleta),
ou 0 se o esquema básico estivesse completo.
Os dados dos grupos de tratamento e controle estão apresentados na tabela ??.
Na tabela verificamos que o percentual de vacinação incompleta foi maior nos que
participam do PSF (40%), comparados aos não participantes (20%). Calculamos a
razão de risco associacional (RRA), que foi igual a 2. Ou seja, o risco de ter vacinação
incompleta foi duas vezes maior para os que participam do PSF, comparados aos que
não participam do PSF. Como se trata de um estudo observacional, não podemos
interpretar esta medida de associação como uma medida de causa, pois o estudo não foi
randomizado. Em um estudo observacional, como vimos, para se dar uma interpretação
causal a uma medida de associação teremos que assumir vários pressupostos não
testáveis empiricamente. Vamos, a seguir, conhecer quais são estes pressupostos.
4.2. Pressupostos para identificação do efeito causal

Antes que possamos dar uma interpretação causal a uma medida de associação, é
preciso verificar se o efeito causal é identificável. Ele será identificável, se pudermos
48
Tabela 4.1.: Participação no Programa de Saúde da Famı́lia e Vacinação Infantil
Total
Vacinação Infantil
D=1 Incompleta % Incompleta D=0 Completa Total
T=1 40 40 60 100
T=0 20 20 80 100
Total 60 30 140 200
RRAT D = 40/20 = 2,00 (1,26 - 3,17)
RRA = Razão de Risco Associacional
T=1 Participação no Programa de Saúde da Famı́lia
T=0 Grupo controle
assumir como razoáveis 3 pressupostos: intervenções bem definidas (consistência),

permutabilidade e positividade.
4.2.1. Intervenções bem definidas

Quando realizamos um estudo experimental, seguimos um protocolo de intervenção,
onde são delineadas todas as ações que fazem parte do pacote de ações. Desta forma,
a intervenção é aplicada de forma padronizada a todos os sujeitos do estudo, que
recebem uma intervenção bem definida e única. Para se estimar o efeito causal este
mesmo critério se aplica ao estudo observacional. Apesar da ”intervenção”não ser
aplicada no estudo observacional pelo pesquisador, e ser chamada, na maioria das vezes,
de exposição, ela deve ter sido padronizada e aplicada da mesma forma a todos os
participantes.
Vimos, que Rubin nos sugeriu que devemos imaginar o estudo observacional como
um estudo experimental fracassado, no qual houve quebra da randomização (Imbens
and Rubin, 2015). Assim, na abordagem proposta por ele, temos que hipotetizar que
no estudo observacional houve uma ”intervenção”. No nosso exemplo, o PSF é uma
intervenção de saúde. Assim, temos que verificar se há uma única forma de intervenção
no PSF e se esta intervenção é aplicada de forma padronizada e igual a todas as
famı́lias participantes. Assim, em teoria, cada famı́lia deve receber uma visita mensal
do agente de saúde, e esta visita deve conter um ”pacote”de ações, que é sempre
aplicado da mesma forma a todos os participantes. Esta ação, para crianças menores
de um ano incluiria o incentivo ao aleitamento materno, a orientação em relação às
vacinas do calendário básico do primeiro ano de vida, orientações em caso de doenças,
como infecção respiratória aguda ou diarreias e a monitorização do crescimento e
desenvolvimento. Além disso, o tempo despendido com cada famı́lia também teria que
ser semelhante. Se pudermos assumir que esta ”intervenção”no mundo real é aplicada
de forma mais ou menos homogênea a todos, podemos assumir que este pressuposto é
razoável neste caso. Isto, é claro, vai depender da realidade de cada local.
Este pressuposto é denominado por Rubin pela sigla em inglês SUTVA (stable unit
49
treatment value assumption), ou seja, a suposição de que o valor de cada unidade de

tratamento é estável ou fixo (estabilidade do efeito causal). Porisso este pressuposto
também é denominado de consistência (Hernan and Robins, 2018). Neste pressuposto
também está incluı́da a ausência de contaminação. As respostas potenciais de um parti-
cipante não podem ter sido afetadas pelo tratamento recebido por outro participante.
Este pressuposto seria violado neste exemplo se famı́lias participantes do PSF ensinem
ações aprendidas no programa a outras famı́lias não participantes da intervenção.
Para Holland (1986) não se estuda causa, sem manipulação. Para este autor, só
efeitos causais que possam ser hipoteticamente manipulados devem ser considerados.
Assim, para Holland, não faz sentido se estudar o efeito causal do nı́vel socioeconômico,
já que não podemos ”manipulá-lo”, por meio de uma intervenção. Além disso, terı́amos
que considerar se nı́vel socioeconômico é uma ”intervenção”fixa e aplicada de forma
idêntica a todos. Assim, exposições como nı́vel socioeconômico não seriam manipuláveis
e, portanto, não poderiam ser consideradas para identificação do efeito causal ??.
Esta perspectiva é muito restritiva. Hernan and Robins (2018) considera esta variável
(nı́vel socioeconômico) imprecisa para se calcular efeito causal, mas pondera que, na
realidade a maioria das exposições (”intervenções”) em estudos observacionais são
inerentemente vagas. De qualquer modo, o uso de questões causais mais bem definidas
ajudam o pesquisador na interpretação da sua estimativa alvo. Efeitos causais definidos
de forma imprecisa têm quase nenhuma interpretação causal. Para Pearl, é possı́vel
”manipular”estudos observacionais por meio de uma ”intervenção cirúrgica”feita no
gráfico. Veremos esta estratégia no capı́tulo 5.
Devemos formular questões contrafatuais bem definidas, baseados em pressupostos

realistas baseados em sólida teoria. As perguntas causais devem apresentar estados
contrafatuais claros, estreitos e especı́ficos (Morgan and Winship, 2015). A pergunta
se a aspirina reduz a mortalidade é muito ampla, pois não inclui a dosagem, via de
administração e número de tomadas por dia. Uma pergunta mais estreita seria tomar por
via oral 100 mg de aspirina uma vez ao dia. Outra pergunta muito ampla é se a atividade
fı́sica é capaz de aumentar a longevidade, pois não se define a duração, intensidade,
frequência e tipo da atividade fı́sica. Uma pergunta mais especı́fica seria praticar
atividade fı́sica intensa (corrida) 3 vezes na semana com duração de 30 minutos por vez.
Vimos, com estes exemplos, que nem sempre é fácil criar ”intervenções”especı́ficas a
partir de estudos observacionais. Desta forma, nos estudos observacionais é quase sempre
problemático assumir o pressuposto da consistência. Na presença de estados causais
(”intervenções”) mal definidos a interpretabilidade do efeito causal fica prejudicada.
(Rehkopf et al., 2016)
Como é difı́cil na vida real que haja apenas uma única versão do tratamento, há uma
versão mais branda deste pressuposto que é assumir a irrelevância das diferentes versões
do tratamento (VanderWeele, 2009). Neste pressuposto mais realista, se reconhece que
o tratamento tem diferentes versões, mas estas diferenças não têm relevância para se
medir o efeito causal.
50
4.2.2. Permutabilidade
O pressuposto da permutabilidade significa que não há variável confundidora omitida.
No estudo experimental este pressuposto é razoável se a randomização tiver sido
eficaz. Não se pode testar este pressuposto em relação às variáveis não observadas,
mas sabemos, por teoria, que a randomização, desde que o tamanho da amostra seja
grande, tem o potencial de equilibrar também variáveis desconhecidas entre os grupos.
Permutabilidade significa que o risco contrafatual entre os não tratados (probabilidade
condicional) é igual ao risco que seria observado se todos não tivessem sido tratados
(probabilidade marginal). Da mesma forma, o risco contrafatual entre os tratados
(probabilidade condicional) é igual ao risco que seria observado se todos tivessem sido
tratados (probabilidade marginal). Havendo permutabilidade associação é igual a causa.
Neste pressuposto, aplicado aos estudos observacionais, se assume que a a probabili-
dade condicional de receber o tratamento (mecanismo de alocação) depende apenas das
variáveis mensuradas no estudo e que nenhum confundidor foi omitido. Isto equivale a
dizer que o tratamento é independente das respostas potenciais em cada nı́vel de C, ou
seja, (D1 , D0 )perpT |C. C pode ser apenas uma variável ou um conjunto de variáveis
confundidoras. Se, em cada nı́vel da variável confundidora as respostas potenciais forem
independentes do tratamento é, então, possı́vel se calcular o efeito causal estratificado
em cada nı́vel do tratamento e, em seguida, ponderar estas estimativas pela distri-
buição do confundidor na amostra geral. Veremos, mais abaixo, como realizar este
procedimento, denominado padronização.
Se a probabilidade de receber o tratamento depende apenas de C, então os tratados
são permutáveis com os não tratados em cada nı́vel de C. Ou seja, nos subgrupos de C
as demais variáveis estão igualmente distribuı́das nos grupos de tratamento e controle.
Neste caso, apesar de não se poder mais assumir permutabilidade marginal, como no
estudo experimental, é possı́vel pressupor que há permutabilidade condicional. Mas
para tanto precisamos também assumir que C é o único preditor que está desigualmente
distribuı́do nos grupos tratado e não tratado.
Este pressuposto não é verificável empiricamente, ou seja, não é revelado pelos dados.
Depende do conhecimento teórico prévio. Se a questão do estudo ainda não tiver sido
muito estudada o efeito causal pode não ser identificável, por não se conhecer ainda
bem a estrutura de confundimento que cerca o problema.
4.2.3. Positividade
Pelo pressuposto da positividade não há categoria(s) nos subgrupos de C com proba-
bilidade 0 ou 1 de receber o tratamento ou controle. Este pressuposto exige que haja
sobreposição entre os grupos, denominada zona de suporte comum, para que contra-
fatuais adequados possam ser calculados. Dito em outras palavras, há participantes
em todos os nı́veis de tratamento para cada grupo de C. Ou seja, a probabilidade
de encontrar pessoas no grupo de tratamento ou no grupo controle em cada nı́vel da
variável confundidora é maior do que zero e menor do que 1: 0 < P r(T = t|C = c) < 1
. Este pressuposto pode ser empiricamente verificável. No caso de variáveis categóricas,
ela se cumpre quando não há caselas vazias na tabela multidimensional T x D x C. Se
51
houver caselas vazias ou com poucas observações o risco contrafatual naquele grupo não
poderá ser estimado ou será estimado de forma muito imprecisa. Assim, o pressuposto
da positividade tende a ser violado em amostras pequenas.
4.3. Exemplo - aplicação dos pressupostos em estudo

observacional
Voltemos agora ao nosso exemplo. Vamos examinar a estrutura do problema e verificar
se o efeito causal é identificável. Para isto vamos usar o método gráfico, que será mais
detalhadamente explicado no próximo capı́tulo 5.
Sabemos que a participação no PSF é maior para famı́lias pobres, pois este programa
é desenvolvido nas periferias urbanas ou áreas rurais e voltado para população de baixa
renda. Vamos assumir, também, que há maior probabilidade de que uma criança de
baixa renda tenha o calendário básico de vacinação incompleto, em comparação a uma
criança de média ou alta renda. Assumiremos também que a única variável que está
distribuı́da desigualmente nos grupos que participam ou não no PSF é a pobreza. O
nosso diagrama causal, que codifica o nosso conhecimento teórico sobre o problema,
está demonstrado na figura 4.2.
Figura 4.2.: Gráfico causal - PSF e Vacinação infantil
Vacinação Incompleta
+
Pobreza
?
+
PSF
PSF = Programa de Saúde da Famı́lia
Na tabela 4.2 apresentamos a distribuição do percentual de pobreza segundo par-

ticipação no PSF. Vemos que entre os participantes, 90% são pobres, enquanto que
apenas 30% dos não participantes são pobres. Ou seja, o risco de participar do PSF é 3
vezes maior para quem é pobre, comparado a quem não se encaixou na definição de
pobreza. A distribuição da variável pobreza não está equilibrada nos grupos tratamento
e controle. Portanto, não podemos assumir que há permutabilidade marginal.
Na tabela 4.3 mostramos a distribuição do percentual de pobreza de acordo com os
percentuais de vacinação incompleta. O risco de uma criança pobre estar com a sua
vacinação básica no primeiro ano de vida incompleto é 5 vezes maior, comparada a
uma criança fora da faixa de pobreza, pois 44,2% dos pobres estavam com a vacinação
52
4.3. Exemplo - aplicação dos pressupostos em estudo observacional
Tabela 4.2.: Participação no Programa de Saúde da Famı́lia e Pobreza
Total
Pobreza
C=1 Sim % Pobres C=0 Não Total
T=1 90 90 10 100
T=0 30 30 70 100
Total 80 60 120 200
RRAT C = 90/30 = 3,00 (2,21 - 4,08)
T=1 Participação no Programa de Saúde da Famı́lia
T=0 Grupo controle
incompleta e 8,8% dos não pobres não tinham completo o esquema de vacinação básica.
Assim, concluı́mos que C (pobreza) é uma causa comum de T e D.
Tabela 4.3.: Pobreza e Vacinação Infantil
Total
C=1 52 44,2 67 120
C=0 7 8,8 73 80
Total 60 30 140 200
RRACD = 44,2/8,8 = 5,05 (2,42 - 10,53)
C=1 Pobres
C=0 Não Pobres
Se não podemos assumir permutabilidade marginal, podemos assumir permutabilidade

condicional? É razoável pressupor que a única variável que está desbalanceada nos
grupos de tratamento e controle é a taxa de pobreza? Provavelmente não. Devem haver
outras variáveis não observadas que estejam também tornando estes grupos (tratamento
e controle) não comparáveis. Entretanto, para efeitos didáticos, vamos assumir que
a variável taxa de pobreza é a única que está desigualmente distribuı́da entre os que
participam ou não do PSF. Desta forma, podemos assumir permutabilidade condicional.
Vejamos, na tabela 4.4, a associação entre participação no PSF e vacinação infantil
de acordo com a pobreza. Dentre os pobres (C=1), aqueles que participam do PSF têm
taxas de vacinação incompleta mais baixas (42%) do que aqueles que não participam
(50%). Por outro lado, dentre os não pobres, a situação se inverte: os participantes têm
maiores percentuais de vacinação incompleta (20%), comparados aos não participantes
(7%). Podemos verificar, nesta tabela, o pressuposto da positividade. Vemos que todas
53
as caselas estão preenchidas. Entretanto, algumas caselas possuem poucas observações,

o que reduz a precisão das estimativas e aumenta a largura dos intervalos de confiança,
no estrato dos não pobres.
Tabela 4.4.: Programa de Saúde da Famı́lia e Vacinação Infantil de acordo com a

pobreza
C=1 (Pobres)
T=1 38 42 52 90
T=0 15 50 15 30
Total 53 44 67 120
RRT D|C=1 = 42/50 = 0,84 (0,55 - 1,30)
C=0 (Não Pobres)

T=1 2 20 8 10
T=0 5 7 65 70
Total 7 9 73 80
RRT D|C=0 = 20/7 = 2,80 (0,62 - 12,55)
Vimos que, se pudermos assumir que os três pressupostos sejam verdadeiros em um

estudo observacional, consistência, positividade e permutabilidade condicional, podemos
usar o procedimento de padronização e obter uma medida condicional, o risco relativo
associacional ponderado por estrato da variável C. A esta medida podemos dar uma
interpretação causal. Vamos realizar estes cálculos, usando a fórmula não paramétrica
de ajuste 4.1 para obter o RR médio ponderado por estrato (Pearl et al., 2016).
X
P (D = d|do(T = t)) = P (D = d|T = t, C = c)P (C = c) (4.1)
c
Razão de Risco Ponderada= [P(D=1 | do(T=1) / P(D=1 | do(T=0)]
P (D = 1 | do(T = 1) = [P (D = 1 | T = 1, C = 1)xP (C = 1)] + [P (D = 1 | T = 1, C = 0)xP (C = 0)]

[38/90x120/200] + [2/10x80/200] = [0, 422x0, 60] + [0, 20x0, 40] = 0, 253 + 0, 08 = 0, 333

[15/30x120/200] + [5/70x80/200] = [0, 50x0, 60] + [0, 0714x0, 40] = 0, 30 + 0, 02857 = 0, 328
Razão de Risco Ponderada = 0,333 / 0,328 = 1,02
A razão de risco ponderada foi 1, indicando que não há efeito causal do PSF na
vacinação infantil.
54
4.4. Conclusão
4.4. Conclusão
Na presença de pressupostos realistas e defensáveis, é possı́vel estimar valores contrafatu-
ais médios observáveis para grupos especı́ficos de indivı́duos e aplicando procedimentos
estatı́sticos paramétricos, semiparamétricos ou não paramétricos será possı́vel dar a
esta diferença de risco médio ou razão de risco uma interpretação causal. Neste caso
diremos que o mecanismo de alocação é ignorável (Morgan and Winship, 2015) ou que
não há confundimento por outra variável omitida.
A grande questão que resta é até que ponto C é o única variável ou conjunto de
variáveis que se encontra(m) desbalanceada(s) nos grupos de tratamento (expostos) e
controle (não expostos). Como selecionar as variáveis que provocam diferenças entre os
grupos? Como assegurar que o mecanismo de alocação possa ser considerado ignorável?
Teremos que lançar mão de sólida teoria e de pressupostos realistas e defensáveis para
atingir este objetivo. Porém, muitas vezes, não conhecemos o mecanismo de geração de
dados nos estudos observacionais e não será possı́vel identificar o efeito causal. Se a
interpretação causal não for possı́vel ainda podemos utilizar os dados coletados a partir
de estudos observacionais para predizer o evento com base nas variáveis observadas
(Hernan and Robins, 2018).
55
Parte II.
Abordagem Gráfica
57
5. Gráficos Acı́clicos Direcionados
(DAGs)
Os gráficos acı́clicos direcionados ou dirigidos, também chamados diagramas causais, são
utilizados para se realizar inferência causal. A sigla inglesa DAG (que significa directed
acyclic graph) é muito utilizada e está mais ou menos incorporada na linguagem do dia
a dia, de modo que seria estranho utilizar a sigla em português GAD. Assim, neste livro,
utilizaremos a sigla em inglês DAG, da mesma forma que nos referimos à sı́ndrome
da imunodeficiência adquirida como aids, ao invés de sida. Estes gráficos são acı́clicos,
pois não são permitidas circularidades (feed-back loops), refletindo o fato de que o
futuro não pode interferir no passado. Este caráter não cı́clico reflete o fato de que uma
variável não pode interferir nela mesma. Estes diagramas são direcionados, assumindo-se
que a causalidade flui em apenas uma direção, em um dado momento no tempo. No
DAG também está incorporada uma perspectiva temporal na noção de causalidade,
assumindo-se que o tempo flui da esquerda para a direita. Desta forma, influências
simultâneas recı́procas entre duas variáveis não são permitidas. Assim, se desejamos
considerar influências bidirecionais da renda na escolaridade, e da escolaridade na renda,
temos que admitir que a renda no tempo zero influencia a escolaridade no tempo um
que, por sua vez, influencia a renda no momento dois (R0 → E1 → R2).
A teoria por trás dos DAG, foi formalizada e sintetizada matematicamente por
Judea Pearl, a partir da contribuição de vários outros autores, e está publicada, com
todos os detalhes técnicos, no seu livro Causality (Pearl, 2009a). Outro livro que
contribuiu bastante para a consolidação desta teoria foi escrito por Spirtes, Glymour
and Scheines (Spirtes et al., 2000). Esta teoria, que surgiu nas disciplinas de ciência da
computação e inteligência artificial, consiste em uma teoria unificada de viés, visualizada
estruturalmente em formato gráfico. Neste capı́tulo vamos resumir algumas de suas
caracterı́sticas. Várias introduções técnicas a respeito estão publicadas (Hernan and
Robins, 2018; Elwert, 2013; Cortes et al., 2016; Morgan and Winship, 2015; Glymour
and Greenland, 2008). Uma excelente revisão em português, bem explicativa, contendo
um exemplo, foi recentemente publicada (Cortes et al., 2016). Há excelentes exemplos
de uso de DAGs para a construção de uma teoria a respeito de problemas causais
complexos (Fleischer and Diez Roux, 2008; Shrier and Platt, 2008). Existem boas
revisões do uso de DAG na pesquisa epidemiológica (Greenland et al., 1999; Glymour
and Greenland, 2008; Hernan and Robins, 2018).
O DAG é uma ferramenta visual simples, no qual são codificados conhecimentos
qualitativos especializados, ou seja, os pressupostos acerca da estrutura causal de
um problema. Estes pressupostos são alicerçados na pesquisa empı́rica e na teoria.
A partir da observação do desenho formalizado no DAG, assumindo-se que a nossa
59
5. Gráficos Acı́clicos Direcionados (DAGs)
teoria é correta, é possı́vel se identificar viés de confundimento e evitar viés de colisão

(seleção). A partir do DAG será verificado se é possı́vel se identificar o efeito causal. Esta
abordagem é apropriada para se responder a uma pergunta especı́fica de causalidade, se
T (tratamento) causa D (desfecho), como, por exemplo, se o recebimento de renda pelo
programa bolsa famı́lia causa aumento na cobertura da vacinação infantil. Entretanto,
não é aplicável a perguntas do tipo quais as causas de D, como, por exemplo, quais as
causas da obesidade. Desta forma, é possı́vel codificar o conhecimento acumulado e
organizar um DAG, e nele verificar se é possı́vel se responder a uma pergunta especı́fica,
com uma causa e apenas um efeito, sendo necessário se realizar um recorte na realidade,
geralmente complexa. Desenhar um DAG é importante para se evitar erros comuns
em inferência causal, pois o gráfico nos ajuda a identificar quais variáveis devem ser
incluı́das no ajuste e quais variáveis, se incluı́das, podem sabotar uma interpretação
causal.
A teoria por trás do DAG está integrada a um modelo contrafatual subjacente, baseado
na teoria das respostas potenciais de Rubin (Imbens and Rubin, 2015). No DAG estão
embutidas representações de modelos de equações estruturais não paramétricos. A
facilidade do desenho gráfico simplifica o pensamento a respeito de sistemas causais, e
evita a derivação do sistema de dependências e independências causais entre as variáveis
a partir da notação matemática.
A partir do DAG é possı́vel, usando-se regras de separação gráfica, comparar as
relações (pressupostos) causais codificadas no diagrama com associações estatı́sticas
deduzı́veis pelo gráfico, e tentar separar causa de associação. A partir das independências
preditas pelo diagrama, é possı́vel se verificar a compatibilidade da estrutural causal,
construı́da com base na teoria prévia, com os dados empı́ricos (Glymour and Greenland,
2008).

Para um melhor entendimento das seções subsequentes, é importante, neste ponto,
distinguir causa de associação. Causa será aqui considerada a partir da definição
contrafatual. O tratamento causa o desfecho se, para pelo menos uma unidade da
população, uma intervenção na variável T (tratamento) resulta em mudança na variável
D (desfecho). Por outro lado, associação se refere à diferença observada no valor de
D (desfecho) em diferentes subgrupos de T (tratamento) (Imbens and Rubin, 2015;
Glymour and Greenland, 2008). Observe que a noção de causa pressupõe a necessidade
de uma intervenção sobre a realidade, manipulando-se o tratamento, enquanto que a
associação expressa apenas uma observação da realidade, baseada na diferença dos
valores do desfecho nos subgrupos de tratamento. A diferença entre causa na abordagem
contrafatual e associação encontra-se mais detalhadamente explicada no capı́tulo 1.
Quando duas variáveis não estão associadas elas são estatisticamente independentes.
A distribuição de D não muda nos diferentes subgrupos de T. O conhecimento do
valor de T nada acrescenta a respeito do valor de D. Se o tratamento não interfere na
doença, T e D serão marginal ou incondicionalmente independentes. O conhecimento
da exposição não permite antecipar a ocorrência do desfecho. Isto está demonstrado na
60
5.2. Notação
equação 5.1. Formalmente, a probabilidade de D=d dado que T=t é igual à probabili-
dade de D=d. Ou seja, a probabilidade de, na população, observar valores da variável
D iguais a d, nos subgrupos de T=t continua igual à probabilidade de encontrar valores
de D=d (d e t podem assumir n valores, para simplificar vamos assumir que D possa
ser igual a 1=doentes e 0=sadios e T possa ser igual a 1=tratados e 0=não tratados).
Quer o indivı́duo tenha sido tratado ou não, conhecer o grupo de tratamento (tratado
ou não tratado) ao qual ele pertence não modifica a probabilidade do desfecho, ou seja,
T e D são marginalmente independentes. A barra vertical — denota ”condicional a
determinada variável”. Esta barra sempre se refere a uma probabilidade condicional,
obtida em um subgrupo ou estrato de uma determinada variável, ou seja condicional a
ela. Quando T e D são independentes, a distribuição de D condicional a T=t é sempre
igual à distribuição marginal ou não condicional de D, ou seja, exatamente igual à
obtida na população total antes do condicionamento.
Independência Marginal ou Incondicional
P r(D = d|T = t) = P r(D = d) (5.1)

Por outro lado, quando duas variáveis estão associadas, elas são estatisticamente
dependentes. A distribuição de D difere nos subgrupos de T. Dessa forma, o conheci-
mento de T indica algo referente ao valor de D. Se o tratamento afeta a doença, T e D
serão dependentes. Conhecer em qual grupo o indivı́duo se encontra permite antecipar
algo a respeito do desfecho. Esta situação está detalhada na equação 5.2.
Dependência
P r(D = d|T = t) 6= P r(D = d) (5.2)

Vejamos agora a notação utilizada e alguns conceitos fundamentais a respeito do
DAG. Depois explicaremos as fontes de associação estatı́stica encontradas no DAG.
5.2. Notação
O DAG tem três elementos: nó, seta e ausência de seta. No DAG cada nó representa
uma variável aleatória. Na figura 5.1 temos 10 nós, ou seja, dez variáveis estão ali
representadas. Cada seta, que é sempre unidirecionada, assume um efeito causal direto,
ou, simplesmente, que não se quer assumir que não haja relação de causalidade entre
duas variáveis. A ausência de seta entre duas variáveis é um pressuposto forte, de
que não há efeito causal direto. Cada seta no DAG indica que uma variável causa
outra, mas não distingue efeito de dano de efeito protetor. Assim, quando no DAG
assumimos que o tratamento1 T causa o desfecho D, T tanto pode reduzir o valor ou
1 naabordagem contrafatual, o estudo observacional é entendido como um experimento fracassado.
Assim, neste livro, utilizaremos, de forma intercambiante, os termos tratamento e exposição para
nos referirmos à variável explanatória.
61
diminuir a probabilidade de ocorrência de D(efeito protetor) quanto aumentar o valor

ou incrementar a probabilidade de ocorrência de D (efeito de dano). É importante
ressaltar que todas as setas colocadas no DAG representam relações causais.
Assim, correlações entre variáveis que não sejam causais (correlações espúrias) não
são representadas. Cabe aqui ressaltar uma diferença fundamental entre o DAG e o
diagrama de caminhos, usado em modelos de equações estruturais. No diagrama de
caminhos as setas representam apenas correlações (que podem tanto ser causais, como
não causais ou espúrias) (Kline, 2016).
Figura 5.1.: DAG - Gráfico acı́clico direcionado.
O DAG demonstrado na figura 5.1 foi desenhado no programa DAGitty (de domı́nio
público, disponı́vel na página http://www.dagitty.net/) (Textor et al., 2011). Neste
programa, a variável de exposição, ou tratamento (T), é representada por um botão de
play, enquanto a variável resposta, ou desfecho (D), é representada por um botão de
stop. Denominamos caminho uma sequência de setas que apontam em qualquer direção
entre duas variáveis, enquanto caminho causal é um caminho que sai de uma variável
com a seta apontando para outra variável. Assim, há dois caminhos diretos entre B e
D: um caminho causal de B para D (no sentido da seta, B → D), e um caminho não
causal de D para B (no sentido oposto ao da seta, B ← D). Há dois caminhos causais
de T para D, um direto (T → D), e outro indireto (T → M → D), por intermédio
do mediador M. De D para T há quatro caminhos não causais D ← T, D ← M ←
T, D ← G ← H → T e D ← A → E ← C → D. Resumindo, entre D e T há seis
caminhos, dois causais e quatro não causais. Os caminhos não causais são também
denominados caminhos espúrios, pois eles transmitem correlações não causais. Nestes
caminhos não causais, as associações fluem somente no sentido contrário ao da seta, ou
nos dois sentidos (tanto na mesma direção, quanto no sentido contrário ao da seta). Os
caminhos causais, por sua vez, transmitem correlações causais, que fluem sempre na
mesma direção da seta.
Denomina-se variável colisora, uma variável que tenha duas setas apontando para
ela. Na figura 1.1, E é uma variável colisora, já que duas setas (uma vindo de C e
62
5.2. Notação
outra vindo de A) apontam para E. O nome colisor vem da situação na qual duas setas
”colidem”em um nó.
Em um DAG existem pais, crianças, descendentes e ancestrais, tal qual em uma
famı́lia. Assim, T é pai de M e D. D é filho de T, M, G, A e B. A variável C é ancestral
de T, E, M e D. Por outro lado, D é descendente de todas as variáveis do gráfico, menos
de E.
No DAG temos dois tipos de caminhos: pela porta da frente (frontdoor path) e pela
porta de trás (backdoor path). No caminho pela porta da frente, a seta parte da variável
em questão para outra variável qualquer, enquanto no caminho pela porta dos fundos,
a seta chega na variável em questão, a partir de outra variável qualquer. Assim, vamos
analisar quais os caminhos que chegam e partem da variável T (tratamento). Todos
os caminhos que partem de T são caminhos pela porta da frente, enquanto que todos
os caminhos que chegam em T são caminhos pela porta dos fundos. Deste modo, em
relação à variável T, há dois caminhos pela porta da frente: T → D e T → M → D
e três caminhos pela porta de trás, chegando de F, C e H. Caminhos pela porta da
frente podem ser causais ou não causais, enquanto caminhos pela porta de trás são
sempre caminhos não causais, que podem transmitir associações espúrias2 .
O DAG é bastante útil para nos ajudar a realizar inferência causal, pois é possı́vel
se identificar caminhos pela porta da frente (causais e não causais) e caminhos pela
porta de trás (não causais). Uma das grandes dificuldades para se realizar inferência
causal é que os dados transmitem associações, tanto causais como não causais. Quando
desejamos estudar causa, estamos apenas interessados em isolar associações causais e
descartar associações espúrias. Quando estimamos associação entre duas variáveis, há
uma mistura de componentes causais e espúrios. Ficou famoso em estatı́stica o célebre
aforismo de que detectar uma associação não significa detectar uma relação causal.
A grande pergunta para se realizar inferência causal é se é possı́vel separar causa de
associação. Durante muitos anos o objetivo da estatı́stica foi estimar associações a
partir dos dados, deixando as considerações causais para uma etapa posterior, baseada
no raciocı́nio. Será que é possı́vel se separar associação de causa? Será que é possı́vel
retirar o componente espúrio da associação e medir causa? Para Judea Pearl isto não
só é possı́vel como é desejável (Pearl, 2009a). Entretanto, para podermos fazer isto
é necessário termos uma sólida teoria, que possa embasar o conhecimento prévio a
respeito de uma pergunta cientı́fica. Com base no conhecimento prévio, codificamos
estas informações qualitativas em um DAG e, a partir dele, isolamos o componente
espúrio da associação e medimos causa. Entretanto, para que a estimativa resultante
reflita mesmo causa, a nossa teoria e os nossos pressupostos precisam estar corretos.
Entretanto, nunca podemos saber se os nossos pressupostos estão corretos, pois eles
não são inteiramente testáveis. Assim, todo processo de realizar inferência causal é um
processo de tentativa e erro e todas as estimativas sempre são falsificáveis e sujeitas a
nova verificação empı́rica. Veremos, a seguir, como identificar o componente espúrio da
associação em um DAG e nos aproximarmos da medida da causa.
2 veremos,a seguir, que os caminhos pela porta de trás só transmitem associações espúrias se não
estiverem bloqueados.
63
5.3. Estruturas de associação

Três estruturas ou fontes de associação são encontradas quando vamos investigar
causalidade: cadeia, garfo e garfo invertido. É importante detectar estas estruturas
graficamente pois, para cada uma delas, teremos uma decisão a tomar (intervir ou não
intervir no sistema) para se identificar o efeito causal. Veremos, a seguir, cada uma
destas estruturas e qual decisão precisaremos tomar na presença de cada uma delas.
• Cadeia
• Garfo
• Garfo invertido
5.3.1. Cadeia
A estrutura de cadeia que indica mediação. No exemplo da figura 5.2, a variável de
tratamento (T) tem efeito causal no desfecho (D), por intermédio da variável mediadora
(M). Nesta estrutura, a associação marginal3 identifica o efeito causal de T em D. Se
condicionarmos (ajustarmos)4 por M, criaremos viés. Vamos supor que T e D sejam
variáveis dicotômicas, e que indivı́duos expostos ao tratamento T=1 tenham maior
probabilidade de desenvolver o desfecho D=1. Se ajustarmos pelo mediador M, todo o
efeito causal de T em D desaparece, pois o único caminho causal de T para D passa
por M. A associação condicional5 em M bloqueia o fluxo de associação causal, que
flui pela porta da frente, e faz sumir o efeito causal, enquanto a associação marginal
identifica, sem viés, o efeito causal de T em D. Desta forma, diante de uma estrutura
de cadeia, indicadora de mediação, não há nenhuma intervenção a fazer no gráfico, ou
seja, não é necessário realizar ajuste estatı́stico. Isto vai ao encontro do que já se sabia
da epidemiologia clássica, que não se deve ajustar para mediador, quando se deseja
estimar o efeito total de uma variável em outra (Rothman et al., 2008; Gordis, 2014).
Se ajustarmos para um mediador criaremos viés de sobrecontrole (Elwert, 2013).
Figura 5.2.: Estrutura de cadeia representando mediação
T M D
T=tratamento; D=desfecho; M=mediador
Vejamos agora um exemplo simples de uma estrutura simplificada de cadeia em um

DAG. No DAG da figura 5.3 há 4 nós, representando quatro variáveis e 4 setas, exibindo
3 associação marginal ou não condicional é a associação entre duas variáveis sem ajuste para variáveis
de confundimento, ou seja, a associação bruta.
4 em epidemiologia o termo ajuste é mais utilizado do que condicionamento.
5 associação condicional é a associação entre duas variáveis com ajuste para variáveis de confundimento,
ou seja, a associação ajustada.
64
quatro efeitos causais. A variável de exposição é violência na gravidez, representada

pelo botão de play e a variável desfecho é nascimento pré-termo, representada pelo
botão de stop. Assumimos as seguintes relações de dependência entre as variáveis:
violência na gravidez tem um efeito causal direto no nascimento pré-termo e também
um efeito causal indireto no nascimento pré-termo, por meio de uma estrutura de
cadeia: a violência na gravidez gera stress, que altera os nı́veis séricos de cortisol que,
por sua vez, leva a nascimento pré-termo. Neste DAG, por simplificação didática, não
incluı́mos confundidores. Para se identificar o efeito causal total da violência na gravidez
no nascimento pré-termo não ajustarı́amos para nenhuma das variáveis da cadeia. Se
o ajuste para stress fosse realizado, pelo menos parte do efeito total da violência na
gravidez no nascimento pré-termo desapareceria, e estarı́amos subestimando o efeito
da violência durante a gravidez no nascimento pré-termo. O uso do DAG nos ajuda
a visualizar de forma bem clara estas relações de dependência, identificar potenciais
ajustes necessários e descartar ajustes desnecessários e prejudiciais para a identificação
do efeito causal.
Figura 5.3.: Cadeia - mediação
5.3.2. Garfo
Figura 5.4.: Estrutura de garfo representando causa comum - viés de confundimento
T=tratamento; D=desfecho; C=confundidor
A estrutura de garfo indica viés de confundimento. No DAG da figura 5.4, a existência

da causa comum C, do tratamento T e do desfecho D, faz com que T e D se associem
marginalmente, independentemente da existência ou não de efeito causal de T em D.
65
Desta forma, mesmo que não haja efeito causal de T em D, T e D estarão marginalmente
associados, em virtude da causa comum C que, neste caso, cria uma associação espúria
entre T e D. Assim, para bloquear o fluxo de associação espúria entre T e D, em
virtude desta causa comum C, é necessário se realizar uma intervenção no sistema,
condicionando para C. A associação marginal entre T e D está contaminada pelo viés de
confundimento, e só a associação condicional é capaz de identificar o efeito causal de T
em D. Vimos que a associação flui nos dois sentidos, independentemente da direção da
seta, enquanto a causa só flui na direção da seta. Assim, o efeito causal entre T e D flui
pela porta da frente, no sentido T → D, enquanto a associação espúria flui pela porta
dos fundos, no sentido T ← C → D. A associação espúria flui sem respeitar a direção
da seta, enquanto a causa flui sempre respeitando a direção da seta. Assim, o viés
de confundimento, em uma definição gráfica, estrutural, é definido como a existência
de uma causa comum do tratamento T e do desfecho M. Se houver caminho aberto
pela porta dos fundos, o fluxo de associação espúria de T para D via C enviesa a
estimativa do efeito causal. Desta forma, para se identificar o efeito causal na estrutura
de garfo é necessário condicionar, ou seja, ajustar para a causa comum C. A associação
condicional fecha a porta dos fundos que estava aberta e bloqueia o fluxo de associação
retrógrado entre T e D, deixando livre apenas o fluxo anterógrado da associação causal,
pela porta da frente. Na figura 5.5, ilustramos o condicionamento para C (um quadrado
desenhado em volta de C indica condicionamento), que é necessário para remover o
viés de confundimento em uma estrutura de garfo.
Figura 5.5.: Estrutura de garfo ilustrando condicionamento para causa comum, ne-
cessário para remover viés de confundimento
T=tratamento; D=desfecho; C=confundidor

O quadrado desenhado em volta de C indica condicionamento
Vejamos agora um exemplo simples para ilustrar o conceito da estrutura de garfo, que
representa viés de confundimento. Imaginemos que desejamos realizar um estudo para
avaliar a qualidade do atendimento prestado em Unidades de Tratamento Intensivo.
Um dos indicadores desta avaliação seria a taxa de mortalidade nas UTIs. Assim,
desejamos saber se há efeito causal do desempenho operacional (estrutura e processos
de trabalho) no resultado (mortalidade). Ao se comparar várias UTIs, observamos
que há grande variação na taxa de mortalidade entre as unidades, sugerindo que a
66
Figura 5.6.: Garfo - confundimento
variável UTI esteja associada com a taxa de mortalidade. Entretanto, há uma causa
comum, que é a gravidade do paciente, que causa internação na UTI e também causa
mortalidade. O nosso conhecimento das relações de dependência entre estas variáveis
estão expressos no DAG da figura 5.6. Assim, para identificarmos o efeito causal da
UTI na mortalidade, precisamos fechar o fluxo de associação, que está passando pelo
caminho aberto pela porta de trás, que parte da variável de exposição UTI, viaja
no sentido contrário da seta pela gravidade do paciente6 e daı́ se transmite para a
mortalidade. Desta forma, para identificarmos o efeito causal da variável UTI na taxa
de mortalidade, precisamos ajustar (condicionar) para a variável gravidade do paciente.
Desta forma, numa estrutura de garfo, apenas a associação condicional entre a exposição
e o desfecho estima o efeito causal, enquanto a associação marginal está enviesada pelo
confundimento.
5.3.3. Garfo Invertido

A estrutura de garfo invertido representa efeito comum. No DAG da figura 5.7, a
variável colisora C é um efeito comum, tanto do tratamento, quanto do desfecho. Na
estrutura de garfo invertido, que reflete efeito comum, a associação marginal (não
ajustada) identifica o efeito causal de T em D. Se ajustarmos para o colisor C será
aberto um fluxo espúrio de associação, de T para D, que estava fechado pelo colisor, e
será induzido viés de colisão (Figura 5.8). Ou seja, a associação condicional a C cria
uma falsa associação entre T e D, se T e D forem marginalmente independentes. O
viés de colisão é uma outra denominação do viés de seleção, tal como conhecido em
epidemiologia (Rothman et al., 2008; Gordis, 2014), que é causado pela maneira como
se seleciona os indivı́duos para o estudo, ou por perdas após a seleção.
Na figura 5.9, demonstramos um exemplo clássico de viés de colisão. Sabemos que
as variáveis desempenho esportivo e notas altas na escola não estão associadas na
população de estudantes pré-universitários. Dito de outra maneira, ter bom desempenho
esportivo não causa notas altas na escola. Sabemos, também, que as universidades
6 vimos anteriormente que o fluxo de associação espúria não respeita o sentido da seta, enquanto o
fluxo de associação causal se transmite sempre no sentido da seta. A seta no DAG significa que
pressupomos haver efeito causal entre duas variáveis a partir da nossa teoria.
67
Figura 5.7.: Estrutura de garfo invertido representando efeito comum com colisor
T=tratamento; D=desfecho; C=colisor
Figura 5.8.: Estrutura de garfo invertido representando viés de colisão
T=tratamento; D=desfecho; C=colisor

O quadrado desenhado em volta de C indica condicionamento
A linha interrompida conectando T e D indica associação espúria,
induzida por condicionamento indevido por um colisor
costumam oferecer bolsas de estudo para alunos com bom desempenho esportivo ou
com altas notas na escola. Entretanto, se selecionarmos para a nossa pesquisa apenas os
candidatos que obtiveram bolsas de estudo na universidade, estarı́amos condicionando
para um efeito comum (colisor). Neste subgrupo selecionado de alunos agraciados
com bolsa de estudo, observarı́amos uma associação negativa entre bom desempenho
esportivo e notas altas na escola. Assim, se entrevistássemos um determinado aluno e ele
nos informasse que não tem bom desempenho esportivo, automaticamente deduzirı́amos
que ele deveria ter tido notas altas na escola. Apesar de bom desempenho esportivo e
notas altas na escola não estarem marginalmente associados na população geral, ao
condicionarmos para uma variável colisora, abre-se um fluxo espúrio de associação
entre desempenho esportivo e notas altas na escola, fluxo este que estava fechado pelo
colisor. O conhecimento do efeito comum (seleção apenas no subgrupo dos agraciados
com bolsa de estudo) nos facilita saber a causa do recebimento da bolsa de estudo.
Assim, dentre os alunos que recebem bolsa, quem tem bom desempenho esportivo não
68
deve ter tido notas altas na escola e vice-versa, criando uma associação condicional
negativa entre estas variáveis e induzindo viés, chamado viés de colisão (seleção).
Figura 5.9.: Estrutura de garfo invertido representando viés de colisão
Desempenho esportivo
Bolsa de estudo
Notas altas na escola
O quadrado desenhado em volta de Bolsa de estudo

indica condicionamento.
A linha interrompida conectando Desempenho esportivo
e Notas altas na escola indica associação espúria,
induzida por condicionamento indevido por um colisor.
Assim, quando existir uma variável colisora no caminho, este se encontra fechado e
não transmite associação espúria. Entretanto, se condicionarmos (ajustarmos) para o
colisor este caminho se abrirá e criaremos uma associação espúria entre variáveis que,
antes do ajuste, eram marginalmente independentes. Condicionar por uma variável
colisora, que reflete efeito comum, implicaria permitir que o futuro interferira no
passado. Note que, neste exemplo, este fluxo espúrio de associação sai pela porta da
frente, da variável tratamento em direção à variável colisora, mas depois retorna pela
porta dos fundos, que parte da variável colisora em direção à variável que mede o
desfecho. Entretanto, este fluxo espúrio de associação só transitará se realizarmos,
inadequadamente, ajuste para o colisor.
Na figura 5.10 está representada outra estrutura de garfo invertido, demonstrando
efeito com colisor C e descendente de colisor DC. O colisor C é um efeito comum, tanto
do tratamento T, quanto do desfecho D. O colisor C é causa de DC, que é descendente
do colisor. Da mesma forma que em uma estrutura de garfo invertido, que representa
efeito comum, não se condiciona para um colisor, também não se deve condicionar
para um descendente de colisor. O condicionamento por um descendente do colisor
também abre o fluxo de associação entre T e D que se encontrava fechado pelo colisor.
Provavelmente neste caso, quando ajustamos para o descendente do colisor, o viés de
colisão induzido será de menor magnitude do que quando ajustamos para o próprio
colisor, a depender da magnitude da correlação entre o colisor e o seu descendente.
Quanto maior esta correlação entre o colisor C e seu descendente DC, maior será o viés
de colisão.
69
Figura 5.10.: Estrutura de garfo invertido representando efeito comum com colisor e
descendente de colisor
C DC
T=tratamento; D=desfecho; C=colisor; DC=descendente do colisor
5.4. Intervenções necessárias e danosas nas estruturas

de associação
Tabela 5.1.: Estruturas de associação no DAG e necessidade de intervenção
Estrutura Significado Viés Intervenção

Cadeia Mediação Nenhuma Nenhuma
Garfo Causa comum Confundimento Condicionar, se houver
caminho aberto pela
porta de trás
Garfo invertido Efeito comum Nenhumb Nenhuma
a
Se for realizado ajuste para mediador que estiver no caminho causal entre a
exposição e o desfecho será criado viés de sobrecontrole.
b
Na presença de efeito comum, se ajustarmos para um colisor ou descendente de
colisor será criado viés de colisão (seleção).
Na tabela 5.1, demonstramos as estruturas de associação no DAG, seu significado, se

há transmissão de viés e se há necessidade de intervenção.
Em resumo, a estrutura de cadeia demonstra a presença de mediação. Nesta estrutura,
não há nenhuma intervenção a fazer. A associação marginal identifica o efeito causal
de T em D.
A estrutura de garfo demonstra a presença de uma causa comum. Nesta estrutura,
na qual está presente um confundidor, há intervenção a fazer. A associação marginal
não identifica o efeito causal de T em D. Será necessário condicionar para a causa
comum, se houver caminho aberto pela porta dos fundos. Neste caso, só a associação
condicional identificará o efeito causal de T em D.
A estrutura de garfo invertido demonstra a presença de efeito comum. Nesta estrutura,
70
5.5. DAG como um sistema de equações estruturais não paramétricas
na qual está presente um colisor ou descendente de colisor, não há nenhuma intervenção
a fazer. A associação marginal identifica o efeito causal de T em D. Entretanto, se
inadvertidamente for realizado condicionamento pelo colisor ou pelo descendente de
colisor, será criado viés de colisão, o que sabotará a interpretação causal.
O caminho causal é sempre um caminho dirigido, ou seja, as setas fluem sempre
no sentido do exposição para o desfecho, e sempre incluem uma estrutura de cadeia,
com ou sem mediadores: T → D ou T → M → D. Caminhos não causais são sempre
não dirigidos e incluem estruturas de garfo T ← CONFUNDIDOR → D ou de garfo
invertido T → COLISOR ← D. Caminhos que contém colisores (garfo invertido)
encontram-se bloqueados e não transmitem viés, enquanto caminhos que não contém
colisores (garfo) encontram-se abertos e transmitem viés, sendo, por isso, denominados
caminhos enviesados.
5.5. DAG como um sistema de equações estruturais não

paramétricas
Tomemos a estrutura de cadeia representada na figura 5.2. Vimos que uma das formas
de se representar o sistema de relações de dependências e independências causais entre
variáveis é por meio de um DAG. Outra forma de se representar este mesmo sistema é
por meio de um conjunto de equações estruturais não paramétricas. Na figura 5.11,
representamos a estrutura de cadeia da figura 5.2, incluindo os termos de erro (aqui
denominados U7 ) que, por simplificação, são normalmente omitidos no DAG. Quando o
DAG é representado com os termos de erro, dizemos que o DAG está sob magnificação.
Cada relação de dependência causal pode ser descrita por uma equação não paramétrica,
na qual não se fazem pressupostos a respeito da distribuição ou da forma funcional das
relações entre as variáveis.
Figura 5.11.: DAG sob magnificação representando estrutura de cadeia com os termos
de erro
UT UM UD
T M D
T = fT (UT ) (5.3)
7 variáveis
não mensuradas são usualmente representadas no DAG pela letra U, do inglês unknown.
Os termos de erro, como também não são mensurados, são também usualmente representados pela
letra U.
71
M = fM (T, UM ) (5.4)
D = fD (M, UD ) (5.5)
Assim, na equação 5.3, a variável T é descrita por meio de uma função não especificada
fT , com apenas um argumento, UT , que é o termo de erro, já que nenhuma outra
variável possui relação de dependência com T. Na equação 5.4, a variável M é descrita
por meio de uma função não especificada fM , com dois argumentos, T e UM . Da mesma
forma, na equação 5.5, a variável D é descrita por meio de uma função não especificada
fD , também com dois argumentos, M e UD . Assim, a variável desfecho D é uma função
não especificada de uma variável observada, o mediador M, e do seu termo de erro não
observado, UD , os quais transmitem seus efeitos causais em D, por meio da função fD .
Observe que cada seta hipotetizada no DAG representa um argumento da função não
restrita de cada equação. Assim, esta função não restrita pode ser depois definida como
linear, quadrática, incluir interações ou qualquer outra função não linear.
Com isto demonstramos que o DAG é equivalente a um sistema de equações não
paramétricas. Assim, todo DAG tem embutido este sistema de equações, que não
apresenta qualquer restrição em relação à distribuição das variáveis ou à forma funcional
da relação entre as variáveis no sistema. A única restrição são as relações de dependências
e independências causais, codificadas no diagrama por meio de setas. Assim, no DAG
sob magnificação da figura 5.11, não foi assumida relação de dependência causal direta
entre T e D, de forma que há uma restrição colocada no diagrama: todo o efeito causal
de T em D é indireto e transmitido via M. Não há efeito causal direto de T em D.
Outro ponto importante a destacar é que no DAG, por se tratar de um sistema não
paramétrico, no qual a função que liga as variáveis não está explicitada, potenciais
interações poderão também ser incluı́das nesta função. Assim, não há necessidade de se
incluir no DAG interações entre variáveis, pois elas são implicitamente permitidas pela
falta de restrições colocadas na função (Morgan and Winship, 2015). A especificação
das interações será feita posteriormente, no momento da estimação do efeito causal.
5.6. Separação direcional

Vimos que o DAG é um diagrama utilizado para se desenhar as relações de dependência
e independência entre as variáveis em um sistema. O DAG é, por natureza, uma
ferramenta populacional, ou seja, para todos os efeitos não há a questão de que uma
associação possa ter acontecido ao acaso. Desta forma, não precisamos nos preocupar
com erros padrão ou intervalos de confiança. Assim, quando desenhamos uma seta e
atribuı́mos uma relação de dependência causal, assumimos que isto seja válido para a
população de interesse.
Quando observamos associação entre duas variáveis, este fenômeno pode ter várias
explicações: acaso, viés de aferição (mensuração), viés de confundimento, viés de seleção
72
(colisão) ou efeito causal. Uma das tarefas da epidemiologia é separar cada uma destas
explicações e verificar se a associação observada pode ser devida a um efeito causal.
De acordo com o pressuposto causal de Markov, descartando-se o acaso, to-
das as associações não condicionais (marginais) surgem de relações causais
ancestrais. Este pressuposto afirma que uma determinada variável V é independente
de qualquer outra variável no DAG, se condicionarmos por todas as suas causas diretas
(ancestrais ou pais), exceto os seus efeitos (descendentes). Isto é a mesma coisa que
afirmar que, descartando-se os efeitos de V, toda a informação probabilı́stica acerca
de V pode ser obtida a partir das suas causas diretas. Ou, dito de outra forma, uma
determinada variável V é independente dos seus não descendentes após ajuste para os
seus ancestrais.
Assumindo-se que o pressuposto causal de Markov será verdadeiro, são duas as fontes
que geram associações marginais entre a exposição e o desfecho8 : efeito causal, viés
de confundimento ou uma mistura das duas situações (Glymour and Greenland, 2008;
Pearl et al., 2016). Por outro lado, uma associação condicional entre a exposição e o
desfecho pode ser criada, como vimos anteriormente, se ajustarmos, inadvertidamente,
para um colisor ou descendente de colisor, produzindo-se viés de colisão. O pressuposto
causal de Markov afirma que uma associação marginal não pode ser produzida por
efeitos da variável em questão, mas apenas por suas causas.
Viés, numa definição gráfica, é entendido como uma associação estrutural entre o
tratamento e o desfecho que não se deve a um efeito causal. Assim, em um DAG é
possı́vel, se o nosso conhecimento a respeito de uma problema for verdadeiro e completo,
identificar viés de confundimento e evitar viés de colisão, como resumido na tabela
5.1. Viés de confundimento, numa definição estrutural, é aquele que surge quando há
uma causa comum do tratamento e do desfecho, e existe caminho aberto pela porta
dos fundos, que sai da variável de tratamento para a variável desfecho. O viés de
colisão surge quando se realiza um condicionamento para um colisor ou descendente
de colisor, abrindo-se, então, um caminho pela porta da frente ou de trás, que se
encontrava fechado pelo colisor. Assim, o viés de confundimento surge a partir dos
dados, mas o viés de colisão pode ser causado por uma intervenção do pesquisador, ao
condicionar, inadvertidamente, por um efeito comum9 . Desta forma, é importante se
desenhar um DAG com o nosso problema, codificado enquanto um sistema de relações
de dependência e independência causal entre variáveis, representado por meio de um
sistema de equações estruturais não paramétricas. No DAG será, então, possı́vel verificar
se o efeito causal é identificável, a partir das variáveis observadas e dos pressupostos
contidos no diagrama. Ou seja, desenhamos o DAG para verificar se é possı́vel se
identificar o efeito causal. Caso positivo, usamos o DAG para selecionar um conjunto
mı́nimo de variáveis de ajuste para confundimento, que feche todos os caminhos abertos
pela porta de trás entre a exposição e o desfecho e que não abra caminhos que já
estejam fechados por colisores. Também é importante que não seja realizado ajuste
para variável(is) mediadora(s) ou para outras variáveis descendentes do tratamento10 .
8 excluindo-se o acaso e viés de aferição, que não são relações causais ancestrais
9O viés de colisão também pode ser causado por perdas de seguimento. Neste caso o viés de colisão
não depende de uma intervenção no sistema feita pelo pesquisador
10 porque não se deve ajustar para descendentes do tratamento será explicado com pormenores na
73
Para se identificar o efeito causal é necessário controlar para todas as causas comuns
e assumir que não haja alguma causa comum que tenha sido omitida no DAG. Este é
um pressuposto muito forte e vários crı́ticos desta abordagem apontam que é impossı́vel
se incluir todas as causas comuns do tratamento e do desfecho em um DAG porque,
quase sempre, o nosso conhecimento a respeito de um problema é imperfeito. Assim,
o sistema codificado em um DAG será mais válido quanto mais completo for o nosso
conhecimento a respeito de uma questão. Um dos motivos apontados para o fato dos
DAGs ainda serem pouco utilizados na pesquisa epidemiológica é o grau de incerteza
sobre os processos causais que produzem os dados (Cortes et al., 2016).
Quando adicionamos uma variável (nó) em um DAG, não está especificada a forma
como esta variável será mensurada ou de qual tipo de variável se trata (nominal, ordinal,
binária, discreta, contı́nua). Da mesma forma, não definimos qual a distribuição das
variáveis (se normal, Poisson, exponencial, hipergeométrica ou outra). Como vimos
anteriormente, também não é definida a função de dependência entre as variáveis: se
linear ou qualquer outra. No DAG se define uma função não restrita, que pode assumir
qualquer forma funcional. O DAG codifica uma informação que é apenas qualitativa.
Portanto, o DAG não serve para estimação, mas é importante, como dito acima, para
verificar se é possı́vel se identificar o efeito causal a partir dos dados observados e
derivar as implicações testáveis do modelo causal.
Uma vez construı́do o DAG, assumindo-se que os pressupostos nele contidos sejam
verdadeiros, e que seja possı́vel se identificar o efeito causal com base nas variáveis obser-
vadas, como identificar um conjunto mı́nimo de variáveis de ajuste para confundimento?
Como derivar as implicações testáveis do modelo causal?
A grande questão é que é mais fácil se identificar as estruturas de associação mais
simples, cadeia, garfo e garfo invertido, em diagramas simplificados. O problema é
que, na maioria das vezes, os problemas que estudamos na vida real são complexos.
Dessa forma, quando desenhamos um DAG estas estruturas se misturam e aı́ fica
complicado selecionar um conjunto mı́nimo de variáveis de ajuste para confundimento.
Como proceder então?
5.6.1. Separação direcional incondicional

Neste ponto entra o conceito de separação direcional (d-separation). A partir da
aplicação de regras gráficas, é possı́vel identificar se duas variáveis estão direcionalmente
separadas (d-separated) ou direcionalmente conectadas (d-connected). Duas variáveis
estão direcionalmente separadas se todos os caminhos entre elas estiverem
bloqueados. Duas variáveis estão direcionalmente conectadas quando há
pelo menos um caminho aberto entre elas. Se duas variáveis estão direcionalmente
separadas elas são independentes, caso contrário, ou seja, se estão direcionalmente
conectadas, são, muito provavelmente, dependentes (Pearl et al., 2016). Estas regras
gráficas de separação direcional permitem deduzir independências entre variáveis
implicadas pelo diagrama, conforme explicitado a seguir.
Se houver qualquer caminho conectando duas variáveis, e este caminho não estiver
seção sobre o critério da porta de trás.
74
bloqueado por um colisor, estas variáveis estão direcionalmente conectadas. Pela regra
da fidelidade fraca, weak faithfullness, se o gráfico estiver correto, estas duas variáveis
devem, provavelmente, estar marginalmente associadas. Se adotarmos a regra da fide-
lidade, faithfullness, dirı́amos que variáveis direcionalmente conectadas estão
marginalmente associadas. Geralmente é prudente adotar a regra da fidelidade
fraca, pois há alguns casos raros nos quais exceções à regra da fidelidade acontecem.
Por exemplo, se o fumo tem efeito negativo na saúde e na prática de atividade fı́sica, e
a prática de atividade fı́sica tem efeito positivo na saúde, o fumo tanto direta como
indiretamente tem efeitos negativos na saúde. Dizemos que a população é fiel ao gráfico
que gerou estas relações. Mas, por outro lado, se o fumo tivesse efeito positivo na
prática de atividade fı́sica, terı́amos um efeito direto negativo e um efeito indireto
positivo do fumo na saúde, que poderiam se cancelar e no final o fumo não teria efeito
na saúde (Figura 5.12). Neste caso a população seria infiel ao gráfico que gerou esta
distribuição. De acordo com Scheines, assumir que a população é fiel é admitir que
quaisquer independências que ocorram entre variáveis em um DAG são consequência
do pressuposto causal de Markov e não do acaso (Scheines, 1997). A regra da fidelidade
descarta cancelamento perfeito de efeitos positivos e negativos.
Figura 5.12.: Exceção à regra da fidelidade - efeitos direto e indireto do fumo na saúde
se cancelariam
Fumo
+
- Atividade fı́sica
+
Saúde
Fonte: (Scheines, 1997).
Por outro lado, se todos os caminhos entre duas variáveis estiverem bloqueados por
colisores, elas estão direcionalmente separadas. Neste caso, pelo pressuposto causal
de Markov, elas são marginalmente independentes. Um resumo dos pressupostos das
regras gráficas de separação direcional está ilustrado na tabela 5.2.
5.6.2. Separação direcional condicional

Duas variáveis também poderão ser direcionalmente conectadas por intervenção do
pesquisador, ao se condicionador por colisor ou descendente de colisor. Duas variáveis
poderão também ser direcionalmente separadas por intervenção do pesquisador, ao se
condicionar pela variável mediadora na estrutura de cadeia, ou pela causa comum na
estrutura de garfo.
75
Tabela 5.2.: Pressupostos da regras gráficas de separação direcional
Pressuposto Consequência
Pressuposto causal Uma determinada variável V é independente de quaisquer
de Markov outras variáveis (seus não descendentes), se condicionar-
mos por todas as suas causas diretas (ancestrais), exceto
os seus efeitos (descendentes)
Fidelidade Variáveis direcionalmente conectadas estão marginal-

mente associadas
Fidelidade fraca Variáveis direcionalmente conectadas devem, provavel-

mente, estar marginalmente associadas
Na tabela 5.3 estão listadas as cinco regras gráficas de separação direcional, que são
derivadas das três estruturas simples de associação descritas na tabela 5.1 (Hernan, 2002).
Para simplificar, vamos assumir que existe apenas um caminho entre duas variáveis. As
duas primeiras regras são de separação incondicional. A regra número 1 afirma que, sem
ajuste, um caminho está aberto se nele não houver colisor. A consequência desta regra é
que as variáveis estão direcionalmente conectadas, produzindo provavelmente associação
marginal entre elas, adotando-se a regra da fidelidade fraca11 . A regra número 2 diz
que um caminho está bloqueado se duas setas colidem em um nó. A consequência
desta regra é que, se o colisor bloqueia o caminho, as variáveis estão direcionalmente
separadas e, consequentemente, são marginalmente independentes.
As regras 3, 4 e 5 refletem separação condicional. A regra número 3 afirma que
qualquer caminho que tenha sido ajustado para um não colisor está bloqueado (isto
acontece quando se ajusta para a variável do meio em estrutura de cadeia ou para a causa
comum em estrutura de garfo). A consequência desta regra é que as variáveis foram
direcionalmente separadas por meio de ajuste, realizado por intervenção do pesquisador
no sistema, ficando, assim, condicionalmente independentes. A regra número 4 diz que o
ajuste para colisor abre o caminho (isto acontece quando se ajusta para o efeito comum
em estruturas de garfo invertido). Assim, a sua consequência é que as variáveis foram
conectadas pela intervenção do pesquisador e ficaram associadas condicionalmente. A
regra número 5, derivada da regra número 4, diz que o ajuste para descendente do
colisor também abre o caminho (isto acontece quando se ajusta para um descendente
do efeito comum em estruturas de garfo invertido). Assim, a sua consequência é que
as variáveis também foram conectadas pela intervenção do pesquisador, sendo criada
associação condicional entre elas. É bom ressaltar que todas estas consequências se
aplicam em expectativa, se a estrutura causal representada pelo DAG estiver correta.
Em resumo, um caminho entre duas variáveis estará bloqueado por um conjunto de
variáveis V se:
11 assumindo-se faithfullness (fidelidade), que é um pressuposto forte, dirı́amos que se duas variáveis
estão direcionalmente conectadas, elas também estão estatisticamente associadas
76
Tabela 5.3.: Regras gráficas de separação direcional
Número Regra Consequência

SEPARAÇÃO INCONDICIONAL
1 Na ausência de ajuste, um caminho Variáveis direcionalmente conec-
está aberto se não houver colisor tadas - Associação marginal
2 Na ausência de ajuste, um caminho Variáveis direcionalmente separa-

está bloqueado se duas setas colidem das - Independência marginal
em um nó
SEPARAÇÃO CONDICIONAL
3 Qualquer caminho que tenha sido Variáveis direcionalmente sepa-
ajustado para um não colisor está radas por intervenção - Inde-
bloqueado pendência condicional
4 Ajuste para colisor abre o caminho Variáveis direcionalmente conec-

tadas por intervenção - Asso-
ciação condicional
5 Ajuste para descendente do colisor Variáveis direcionalmente conec-

abre o caminho tadas por intervenção - Asso-
ciação condicional
1. O caminho contém uma cadeia A → B → C ou um garfo A ← B → C, e o nó

do meio (B) esteja em V (ou seja, foi feito ajuste pela variável do meio B);
2. O caminho contém um colisor A → B ← C, e B não está em V e nenhum
descendente de B está em V.
Em conclusão, se duas variáveis estão direcionalmente conectadas ou separadas

em um DAG vai depender de dois fatores: da estrutura do mecanismo de geração
de dados codificadas no diagrama causal e também das ações de condicionamento
(intervenções ou ajustes) realizadas no sistema pelo pesquisador. Vimos que a única
fonte de associação marginal entre variáveis é a existência de caminhos abertos en-
tre elas provocados por estruturas de cadeia ou de garfo (pois estruturas de garfo
invertido contém colisores e caminhos que contém colisores se encontram fechados por
definição). Na ausência de caminhos abertos entre elas, duas variáveis são
marginalmente independentes.
Condicionar significa filtrar por uma condição, incorporar alguma informação da
variável na análise. Pressupõe que tenha sido realizada uma estratificação perfeita
por uma ou mais variáveis. Assim, se condicionarmos por uma variável, estimaremos
o efeito causal nos subgrupos ou nas categorias daquela variável. São estratégias
77
de condicionamento: restrição, pareamento, estratificação, subclassicação, regressão

ponderada e ajuste em modelo estatı́stico de regressão. Quando há perdas ou recusas,
isto também equivale a uma estratégia de condicionamento, já que será estudado
apenas um subconjunto do todo, ou seja, também se estará filtrando por uma condição,
participação no estudo, ainda que involuntariamente (Elwert, 2013).
Na figura 5.13 vemos uma situação em que A e D estão ligados pelo caminho A
→ B ← C → D. Vemos que estas variáveis estão direcionalmente separadas, pois o
caminho está bloqueado pelo colisor B. Em consequência, A e D são marginalmente
independentes.
Figura 5.13.: Separação Direcional entre A e D pelo colisor B
A C D
No diagrama estão codificadas as seguintes independências marginais e condicionais:

A ⊥ D, leia-se A é marginalmente independente de D
A ⊥ C, leia-se A é marginalmente independente de C
B ⊥ D | C, leia-se B é independente de D, condicional a C
Na figura 5.14 está representada uma conexão direcional entre A e D. Apesar do

caminho A → B ← C → D conter o colisor B, o ajuste para este colisor abriu este
caminho (o quadrado em volta de B significa que foi realizado ajuste para esta variável)
e, com esta intervenção, agora A e D não mais estão direcionalmente separados. Neste
exemplo ilustramos uma situação em que a conexão direcional é induzida por uma
ação realizada pelo pesquisador, ao condicionar por um colisor, que estava bloqueando
o único caminho, A → B ← C → D, existente entre A e D. Como consequência,
assumindo-se fidelidade fraca, A e D agora ficaram, provavelmente, condicionalmente
associados.
Figura 5.14.: Conexão Direcional entre A e D por meio de condicionamento pelo colisor
B
A C D
O quadrado desenhado em volta de B indica condicionamento
Na figura 5.15 há dois caminhos entre A e D. O caminho A → B ← C → D está

fechado pelo colisor B. O outro caminho, A ← E → C → D contém a causa comum E,
78
que simultaneamente age em A e em C. Em virtude desta causa comum E, o fluxo de

associação entre A e D está aberto neste caminho. Por meio do fluxo deste caminho, A
e D estão, portanto, direcionalmente conectados. Como consequência, assumindo-se
fidelidade fraca, A e D são, provavelmente, marginalmente associados. No diagrama
estão codificadas as seguintes independências condicionais:
A ⊥ C | E, leia-se A é independente de C, condicional a E
A ⊥ D | E, leia-se A é independente de D, condicional a E
A ⊥ D | C, leia-se A é independente de D, condicional a C
B ⊥ D | C, leia-se B é independente de D, condicional a C
D ⊥ E | C, leia-se D é independente de E, condicional a C
B ⊥ E | A, C, leia-se B é independente de E, condicional a A e C
Figura 5.15.: Conexão Direcional entre A e D por meio da causa comum E (de A e C)
A C D
Na figura 5.16 há também dois caminhos entre A e D. O caminho A → B ← C

→ D está fechado pelo colisor B. O outro caminho, A ← E → C → D contém a
causa comum E, que simultaneamente age em A e em C. Entretanto, neste DAG, foi
realizado ajuste para a causa comum E e, desta forma, o fluxo de associação que fluı́a
livremente de A para D foi fechado. Assim, como os dois caminhos que ligam A e D
estão fechados, o primeiro por um colisor e o segundo por intervenção a partir de ajuste,
A e D estão, agora, direcionamente separados. Consequentemente, agora, A e D são,
condicionalmente, independentes.
Figura 5.16.: Separação Direcional entre A e D por meio do colisor B e de condiciona-

mento por E
A C D
O quadrado desenhado em volta de E indica condicionamento
79
5.7. O critério da porta de trás

O conceito de separação direcional ajuda, mas não resolve totalmente a situação quando
se trata da estimação do efeito causal. Para que se possa estimá-lo, a exposição e o
desfecho precisam estar direcionalmente conectados, mas não pode ser de qualquer
forma nem por todos os caminhos. Na realidade, para se estimar o efeito causal,
sem viés, é necessário que todos caminhos causais entre as variáveis de
tratamento (exposição) e desfecho estejam abertos, e que todos caminhos
não causais estejam fechados.
Pearl desenvolveu o critério da porta de trás (backdoor criterion) para determinar
se o condicionamento por um determinado conjunto de variáveis, que denominaremos
de V, será capaz de identificar o efeito causal do tratamento T no desfecho D (Pearl,
2009a; Pearl et al., 2016). O objetivo do condicionamento é bloquear todos os caminhos
abertos pela porta de trás, que estejam gerando associações espúrias, e não bloquear,
inadvertidamente, caminhos pela porta da frente que transmitam causa.
Pelo critério da porta dos fundos, o efeito causal entre o tratamento T e o desfecho
D será identificado, condicionando-se por um determinado conjunto V de variáveis, se:
(a) nenhum elemento do conjunto de ajuste V for descendente do tratamento T;

(b) o conjunto de ajuste V bloqueia todos os caminhos pela porta de trás entre o
tratamento T e o desfecho D.
Assim, o objetivo é identificar um conjunto mı́nimo de variáveis de ajuste que:
1. bloqueie todos os caminhos abertos pela porta de trás entre a exposição e o

desfecho que não contenham colisores;
2. mantenha fechados (não abra inadvertidamente) caminhos pela porta de trás entre
a exposição e o desfecho que contenham colisores ou descendentes de colisores;
3. não contenha mediadores situados entre a exposição e o desfecho, ou descendentes
de mediadores ou quaisquer outros descendentes do tratamento T;
A aplicação deste critério move a pesquisa de uma simples medida de associação

para uma medida de causa, se os pressupostos para inferência causal forem satisfeitos e
a estrutura causal representada pelo DAG esteja correta. O critério da porta de trás
foi desenvolvido para facilitar, na prática, a aplicação destas regras em um sistema
causal de relações, a partir do DAG. O objetivo da aplicação destas regras é identificar
um conjunto mı́nimo de variáveis de ajuste para confundimento, evitar viés de colisão
e evitar a inclusão de mediadores neste conjunto de ajuste. A inclusão de variáveis
desnecessárias, além de ter um risco de provocar viés de colisão, também contribui para
a redução da precisão das estimativas.12
Por definição, todos os caminhos causais saem pela porta da frente, enquanto os
caminhos não causais saem pela porta da frente ou chegam pela porta de trás. Note
12 existem outros critérios gráficos para verificar se é possı́vel se identificar o efeito causal, além do
critério da porta de trás. Dentre outros, o critério de ajuste (Shpitser et al., 2010) e o critério dos
pais do tratamento (Pearl et al., 2016) são dignos de nota.
80
5.8. Identificando o conjunto mı́nimo de variáveis de ajuste para confundimento no DAG
que, pelo critério da porta de trás, o analista só precisa se preocupar com os caminhos
que chegam por esta porta, que começam na seta dirigida para o tratamento T, sendo,
exatamente, porisso que esse critério é assim denominado. Por que o pesquisador não
precisa se preocupar com os caminhos pela porta da frente? Porque, por esta porta
saem caminhos causais, que precisam ser deixados abertos, e também caminhos não
causais, que, ou já se encontram bloqueados por colisores, ou não estão conectados com
o desfecho. Vamos demonstrar estes pontos, de forma bem detalhada, a seguir.
Porque não se dever realizar ajuste para nenhum descendente do trata-
mento T? Porque este ajuste pode ser desnecessário, ou porque ele pode sabotar
uma interpretação causal. Se neste ajuste se incluir um mediador se vai fazer
desaparecer total ou parcialmente o efeito causal. Se se deseja estimar o efeito
total do tratamento no desfecho, não se pode realizar condicionamento por mediadores,
pois o mediador está situado no caminho causal entre T e D. Se este condicionamento
for realizado, o efeito estimado resultante será o efeito direto, ou seja, a parcela da
associação que não se deve ao efeito de mediação. Assim, a parcela do efeito mediado
não será estimada. Entretanto, se se pretende estimar o efeito direto, o ajuste para
mediadores pode ser realizado.
Entretanto, por outro lado, se se incluir neste ajuste um colisor ou descen-
dente de colisor, se vai abrir um caminho não causal pela porta da frente,
já fechado por um colisor (Elwert, 2013). Na figura 5.17 vemos cada uma destas
situações. Inicialmente não devemos ajustar para DT2 , pois esta variável é mediadora,
situada no caminho causal entre T e D. Se ajustarmos para esta variável removeremos
todo o efeito causal de T em D. Se ajustarmos para DT3 , criaremos viés de colisão, pois
DT3 é descendente do colisor DT2 . Esta consequência nefasta é um pouco mais difı́cil
de ser percebida. Para que isto fique mais fácil de ser visualizado, magnificamos o DAG,
mostrando o termo de erro eDT2 , da variável DT2 . Com esta magnificação, vemos que
a variável DT2 é uma variável colisora no caminho T → DT2 ← eDT2 , pois ela tem
duas setas apontadas para ela, uma que parte de T e outra que parte do seu termo
de erro eDT2 . Da mesma forma, se ajustarmos para DT4 ou DT5 , criaremos viés de
colisão, pois DT4 é um colisor no caminho T → DT4 ← X → D e DT5 é descendente
deste colisor. Para finalizar, o ajuste para DT1 é desnecessário mas, se tal ajuste fosse
realizado, não prejudicaria a identificação do efeito causal.
5.8. Identificando o conjunto mı́nimo de variáveis de

ajuste para confundimento no DAG
Retornemos agora ao DAG da figura 5.1. Vamos agora selecionar, neste DAG, qual o
conjunto mı́nimo de variáveis de ajuste para confundimento, para que se possa proceder
à identificação do efeito causal.
A primeira coisa que devemos procurar é se existe algum caminho pela porta de trás
entre a exposição e o desfecho. Podemos observar que há dois caminhos: T ← H → G
→ D e T ← C → E ← A→ D. No primeiro caminho T ← H → G → D não há colisor
e, portanto, este caminho está aberto. Para fechar este caminho é necessário o ajuste
81
Figura 5.17.: DAG ilustrando porque não se deve ajustar para descendentes do
tratamento
DT5
DT4
DT3
T DT2 D
DT1 eDT2
Fonte: diagrama adaptado de (Elwert, 2013).
para H (que é causa comum da exposição e do desfecho, ou seja, confundidor) ou para

G (que é descendente do confundidor). Veja que, se bloquearmos o caminho aberto em
qualquer um dos seus pontos (em H ou em G), bloqueamos o fluxo de associação espúria
retrógrado, que flui pela porta dos fundos entre T e D. A transmissão da associação
em um DAG pode ser comparada ao fluxo de água passando por uma tubulação. Se
desejarmos interromper o fluxo de água em uma tubulação, podemos interromper este
fluxo em qualquer ponto do cano, que ele cessará. A mesma coisa também ocorre com
o fluxo de associação em um DAG. Este ponto conceitual é interessante porque, mesmo
se não tivéssemos medido o confundidor H, se tivéssemos mensurado seu descendente
G, o efeito causal poderia ser identificado, realizando-se ajuste para G.
Agora vejamos o segundo caminho T ← C → E ← A→ D. Podemos observar que
este caminho está fechado pelo colisor E. Portanto, nenhuma intervenção precisa ser
feita neste caminho. Para finalizar, então, o conjunto mı́nimo de variáveis de ajuste para
confundimento neste DAG é H ou G. Perceba, também, que não precisamos realizar
nenhum ajuste para F (que é causa somente da exposição) ou para B (que é causa
somente do desfecho). Ajustes para F e B são desnecessários. Ajuste para E é danoso,
pois criaria viés de colisão. Ajuste para A ou C também seriam danosos, pois o caminho
em que eles estão já se encontra fechado pelo colisor E e, se realizássemos o ajuste,
82
5.9. DAG incluindo variáveis não mensuradas
abrirı́amos este caminho e criarı́amos viés de colisão. Ajuste para M também sabotaria
uma identificação causal, porque estarı́amos retirando do sistema parte do fluxo de
associação causal entre T e D, que flui pela porta da frente. Se ajustarmos para M e H,
ou M e G estaremos estimando apenas o efeito causal direto, pois terı́amos removido
do sistema o efeito causal indireto, que flui pelo mediador M. Condicionar por uma
variável no caminho causal entre a exposição e o desfecho causa viés de sobrecontrole
(Elwert, 2013).
É interessante ressaltar que a prática mais comum na epidemiologia atual, de ajustar
por muitas variáveis ao mesmo tempo, pode ser danosa e falhar na tentativa de remover
confundimento, criando viés de sobrecontrole ou de colisão (Elwert, 2013).
5.9. DAG incluindo variáveis não mensuradas

Como no DAG codificamos apenas informações qualitativas e os dados não estão
incluı́dos no diagrama, nele se pode incluir também variáveis não mensuradas, com o
objetivo de verificar se é necessário realizar ajuste para elas. Uma das mais interessantes
conclusões a que podemos chegar, com a ajuda de um DAG, é que se pode descobrir que
não é necessário se realizar ajuste para uma variável não mensurada. Isto pode ocorrer
por vários motivos: a variável pode não ser uma causa comum no modelo teórico, pode
ser uma causa comum em um caminho que já está bloqueado por um colisor, ou pode
ser uma causa comum em um caminho que pode ser bloqueado por meio de ajuste por
um ascendente ou descendente daquela causa comum, contido neste mesmo caminho.
Cada uma destas situações está ilustrada no diagrama causal da figura 5.18, que contém
a variável não observada U.
Figura 5.18.: DAG.
Inicialmente precisamos identificar todos os caminhos pela porta de trás que começam
no tratamento T e terminam no desfecho D. São cinco caminhos, listados abaixo:
83
(1) T ← E → F←D
(2) T ← E → C→A→D
(3) T ← E → C←U→A→D
(4) T ← B ← U→A→D
(5) T ← B ← U→C→A→D
Em seguida, precisamos verificar se há algum caminho que esteja bloqueado por um
colisor. Perceba que os caminhos 1 e 3 estão fechados por colisores. O colisor F está
fechando o caminho 1 e o colisor C está fechando o caminho 3. Mostramos novamente
os caminhos, identificando agora, em negrito, os colisores em cada caminho:
(1) T ← E → F←D
(2) T ← E → C→A→D
(3) T ← E → C←U→A→D
(4) T ← B ← U→A→D
(5) T ← B ← U→C→A→D
Há portanto, 3 caminhos pela porta de trás entre a exposição e o desfecho que não
se encontram fechados por colisores: os caminhos 2, 4 e 5. O objetivo agora é encontrar
uma única variável que não seja colisora e que esteja em todos estes caminhos. Assim,
se condicionarmos por esta variável não colisora, o efeito causal é identificável. Observe
que a variável comum a todos estes caminhos é A. Desta forma, se condicionarmos por
A, conseguiremos identificar o efeito causal de T em D. Outra opção seria ajustarmos
por B e E. A variável B fecha os dois últimos caminhos (4 e 5) pela porta dos fundos que
estão abertos, enquanto a variável E fecha o caminho pela porta de trás número 2, que
também está aberto. A partir da aplicação do critério da porta de trás percebemos que
o efeito causal pode ser identificado, às vezes, por múltiplas alternativas de conjuntos
mı́nimos de ajuste. Assim, resta a pergunta: qual conjunto mı́nimo de variáveis de
ajuste escolher? Recomendamos usar de parcimônia, ou seja, selecionar o conjunto com
o menor número de variáveis possı́vel. Outra estratégia é escolher o conjunto mı́nimo de
variáveis de ajuste para confundimento que contenha variáveis mais bem mensuradas,
para se reduzir viés de aferição.
Assim demonstramos que, mesmo colocando uma variável não mensurada no DAG, a
variável U, podemos neste caso ajustar para B ou A (descendentes de U) e conseguiremos
fechar os dois caminhos pela porta de trás que contém U e que ainda não estavam
fechados por um colisor. Se U fosse uma variável observada, terı́amos mais duas opções
mı́nimas de ajuste U e E, ou U e C. Se ajustamos para U, abrimos o caminho 3
(que estava fechado, pois C é um colisor neste caminho) e fechamos os caminhos 4
e 5. Restam abertos os caminhos 2, que estava originalmente aberto, e 3 (que foi
aberto quando ajustamos para U, pois este caminho estava bloqueado pelo colisor C).
Precisamos, então, encontrar variáveis comuns a estes 2 caminhos abertos, para que
possamos fechá-los. Estas variáveis são C ou E. Outra opção poderia também ser A,
mas aı́, ajustar para U e A, já não seria ajuste mı́nimo pois, se ajustarmos apenas por
84
5.10. Identificação e estimação
A já estaremos bloqueando todos os caminhos abertos por não colisores e mantendo
fechados os caminhos bloqueados por colisores.
É importante observar que colisor não é uma propriedade da variável, mas sim do
caminho no qual uma determinada variável se encontra. Assim, veja que C é um colisor
no caminho 3, mas não é colisor no caminho 2.
Há casos em que desenhamos o DAG para descobrir que não é possı́vel identificar o
efeito causal por meio de ajuste por covariáveis, porque uma variável não mensurada
U é necessária para bloquear um dos caminhos abertos pela porta de trás, entre a
exposição e o desfecho (Figura 5.19. Assim, uma vez que isto foi detectado, a solução
seria incluir esta variável em novos estudos e poder, assim, identificar o efeito causal.
Outra alternativa seria utilizar outros métodos para estimação do efeito causal. Uma
revisão destes outros métodos como, por exemplo, o uso de variável instrumental ou de
isolamento de mecanismo pode ser encontrado em Morgan and Winship (2015).
Figura 5.19.: DAG ilustrando situação na qual o efeito causal não é identificável por
meio de ajuste por covariáveis
5.10. Identificação e estimação

Os dados transmitem associações. Entretanto, nós pesquisadores queremos estudar as
causas dos eventos. Isto é difı́cil porque a associação é uma mistura de componentes
causais e não causais. Vimos, anteriormente, que é possı́vel derivar causa a partir
dos dados, se conhecermos a história por trás dos dados, isto é, como eles foram
gerados, desde que os pressupostos teóricos para inferência causal sejam satisfeitos. A
identificação do efeito causal, na qual utilizamos o DAG como uma ferramenta, é um
processo de verificação de se é possı́vel separar causa de associação.
Estimação, por outro lado, é o processo de cálculo do efeito causal, geralmente
realizado em modelos estatı́sticos. É importante ressaltar que o DAG serve apenas para
verificar se é possı́vel identificar o efeito causal, a partir dos pressupostos nele contidos.
Se isto for possı́vel, numa segunda etapa, realizaremos a estimação a partir dos dados.
Se o conjunto de variáveis de ajuste V satisfizer o critério da porta de trás, então o
efeito causal de T em D poderá ser obtido, de forma não paramétrica, utilizando-se a
fórmula de ajuste abaixo:
85
X
P (D = d|do(T = t)) = P (D = d|T = t, V = v)P (V = v) (5.6)
v
Na prática, temos dificuldade de usar estimadores não paramétricos, porque traba-

lhamos com amostras pequenas ou porque muitas variáveis são necessárias no ajuste
para viés (Elwert, 2013). Desta forma, usualmente são utilizados modelos paramétricos
restritivos ou semi-paramétricos menos restritivos no processo de estimação (van der
Laan and Rose, 2011; Petersen and van der Laan, 2014). É importante ressaltar que o
DAG, como não contém dados, não serve para estimação, sendo importante distinguir o
DAG de um modelo de regressão. Mas o conjunto das relações causais entre as variáveis
contidos em um DAG pode, em um segundo momento, ser relacionado aos dados e a
distribuições de probabilidade, no processo de estimação, para cálculo do efeito causal.
Se a nossa teoria for verdadeira e verdadeiros forem também os nossos pressupostos,
poderemos dar uma interpretação causal à nossa medida estimada de efeito (figura
5.20).
A forma de condicionamento mais utilizada em epidemiologia é o ajuste em modelos
estatı́sticos de regressão. Este ajuste geralmente produz um condicionamento imperfeito,
que geralmente não bloqueia totalmente os caminhos abertos pela porta dos fundos,
deixando sempre fluir alguma associação residual espúria entre o tratamento e o desfecho
(Elwert, 2013). Além disso, muitos estimadores paramétricos assumem linearidade nas
relações entre as variáveis e ausência de interações, o que geralmente não corresponde à
realidade (Morgan and Winship, 2015).
Figura 5.20.: Identificação e Estimação
Teoria Dados
DAG
Identificação Estimação Interpretação do efeito causal
5.11. Desenhando o DAG no programa DAGitty

Em DAGs complexos, o processo de identificação é complicado e muito trabalhoso.
Identificar todos os caminhos pela porta de trás, verificar quais caminhos contém
colisores, quais caminhos estão abertos, e escolher o conjunto mı́nimo de variáveis de
ajuste para confundimento, que feche todos os caminhos abertos pela porta dos fundos,
consome tempo e é passı́vel de erro. Um algoritmo gráfico manual, que facilita este
processo, está bem descrito em outros trabalhos (Cortes et al., 2016; Shrier and Platt,
2008). Entretanto, não recomendamos este procedimento, porque é laborioso. É mais
prático, fácil, rápido e menos sujeito a erro, utilizar programas que automatizem este
86
5.11. Desenhando o DAG no programa DAGitty
processo de identificação do conjunto mı́nimo de ajuste para confundimento. Existem

vários programas desenvolvidos com este objetivo.
Vamos agora demonstrar como desenhar um DAG e verificar suas implicações
testáveis no programa DAGitty (de domı́nio público, disponı́vel na página http:
//www.dagitty.net/)(Textor et al., 2011). O programa pode ser baixado e executado
no computador ou manuseado on line diretamente no navegador.
Figura 5.21.: Programa DAGitty
Vemos, na figura 5.21, um DAG já desenhado. No DAGitty, todas as variáveis são
representadas por cı́rculos. A variável de exposição ou tratamento (T) é representada
por um botão de play, enquanto a variável resposta ou desfecho (D) é representada por
um botão de stop. O programa usa várias cores para classificar as variáveis e os caminhos.
Todos os caminhos causais aparecem em verde e os caminhos que produzem viés são
marcados em vermelho. Outros caminhos são desenhados em preto. As causas comuns
são destacadas em vermelho. As demais legendas podem ser identificadas na parte
esquerda da figura. No canto superior direito, o programa identifica o(s) conjunto(s)
mı́nimos de ajuste para estimar o efeito total de T em D. Na parte da direita, no centro,
são mostradas as implicações testáveis (independências condicionais). Logo abaixo das
implicações testáveis aparece o código utilizado para gerar o diagrama causal. Este
código pode ser copiado para um programa de processamento de texto, salvo, e depois
colado nesta mesma caixa, caso você queira redesenhar o DAG, sem precisar executar
todos os passos novamente. Quando você colar o novo código, aparecerá nesta caixa a
mensagem Update DAG. Clicando nesta opção, o programa desenhará, novamente, o
DAG.
87
Vejamos, rapidamente, como desenhar um diagrama simples no DAGitty. Escolha,

no menu Model, a opção New Model. Aparecerá uma janela solicitando o nome da
variável de exposição: digite Tratamento e tecle em OK. Em seguida, aparecerá outra
janela, solicitando o nome da variável desfecho: digite Desfecho e tecle em OK. Note
que o programa desenha, automaticamente, uma seta do tratamento para o desfecho.
Arraste as duas variáveis para uma melhor posição na tela. Vamos agora incluir uma
variável colisora. Dê um duplo clique no local onde deseja incluir a variável. Surgirá
uma janela, solicitando o nome da nova variável: digite Colisor e tecle em OK. Usando
o mesmo procedimento, inclua duas novas variáveis, A e B, na posição mostrada na
figura 5.22. Agora desenhe as setas conectando as demais variáveis. Para desenhar uma
seta, dê um duplo clique na variável de origem e, a seguir, um duplo clique na variável
de destino. Quando terminar de desenhar o DAG, observe, na janela no canto superior
direito, que nenhum ajuste é necessário para se estimar o efeito total do tratamento no
desfecho. Você acabou de desenhar um exemplo de estrutura de associação de garfo
invertido, onde o colisor é um efeito comum de A e B. Se for realizado ajuste para o
colisor, o caminho pela porta de trás, que está fechado pelo colisor, será aberto. Este
tipo de viés é também chamado de viés M (Greenland, 2003), pois o gráfico a ele
associado tem a forma de um M.
Se quiser saber como apagar ou renomear uma variável, apagar uma seta e outros
comandos úteis, consulte no menu a opção How to....
Figura 5.22.: Estrutura de garfo invertido mostrando Colisor no caminho pela porta
dos fundos entre o tratamento e o desfecho
Nesta estrutura, se for feito ajuste pelo colisor será criado viés de colisão. Este viés é
também chamado de viés M, porque o desenho tem a forma desta letra.
88
5.12. Exercı́cios
5.12. Exercı́cios
1. No DAG da figura 5.1 identifique o pai e o filho de G e os ancestrais e descendentes
de H.
2. No DAG da figura 5.1 identifique as variáveis que possuem mais de um filho.
3. No DAG da figura 5.1 identifique estruturas de cadeia, garfo e garfo invertido.
4. Represente o DAG da figura 5.4 sob magnificação.
5. Escreva o sistema de equações estruturais não paramétricas embutidas no DAG

da figura 5.4.
6. Verifique no DAG da figura 5.23 se A e E estão direcionalmente separados ou

direcionalmente conectados.
7. Verifique no DAG da figura 5.23 se A e C estão direcionalmente separados ou

8. Identifique as independências marginais e/ou condicionais codificadas no DAG

da figura 5.23
9. Verifique no DAG da figura 5.24 se A e E estão direcionalmente separados ou

10. Identifique as independências marginais e/ou condicionais codificadas no DAG

da figura 5.24
11. Identifique, no DAG da figura 5.25, se existem caminhos pela porta de trás entre a
exposição e o desfecho. Se existirem, descreva quais são estes caminhos, incluindo
a direção de todas as setas.
12. Se existirem caminhos abertos pela porta de trás entre a exposição e o desfecho
no DAG da figura 5.25, descreva quais são estes caminhos, incluindo a direção de
todas as setas.
13. Se existirem caminhos fechados pela porta de trás entre a exposição e o desfecho
no DAG da figura 5.25, descreva quais são estes caminhos, incluindo a direção
de todas as setas. Identifique qual(is) colisor(es) está(ão) bloqueando este(s)
caminho(s).
14. Qual o(s) conjunto(s) mı́nimo(s) de variável(is) de ajuste para confundimento

necessário(s) para identificar o efeito causal no DAG da figura 5.25?
15. Identifique, no DAG da figura 5.26, se existem caminhos pela porta de trás entre a
exposição e o desfecho. Se existirem, descreva quais são estes caminhos, incluindo
a direção de todas as setas.
89
16. Se existirem caminhos abertos pela porta de trás entre a exposição e o desfecho
no DAG da figura 5.26, descreva quais são estes caminhos, incluindo a direção de
todas as setas.
17. Se existirem caminhos fechados pela porta de trás entre a exposição e o desfecho
no DAG da figura 5.26, descreva quais são estes caminhos, incluindo a direção
de todas as setas. Identifique qual(is) colisor(es) está(ão) bloqueando este(s)
caminho(s).
18. Qual o(s) conjunto(s) mı́nimo(s) de variável(is) de ajuste para confundimento
necessário(s) para identificar o efeito causal no DAG da figura 5.26?
Figura 5.23.: DAG.
B D
A E
Figura 5.24.: DAG.
B D
A E
90
5.12. Exercı́cios
Figura 5.25.: DAG.
Figura 5.26.: DAG.
91
6. Viés de confundimento: do conceito
associacional ao conceito estrutural
6.1. O paradoxo de Simpson
Em 1951, Simpson publicou um artigo no qual apresenta um paradoxo com base em
dados fictı́cios, mas que ocorre bastante na realidade (Simpson, 1951). Um tratamento
foi aplicado para uma determinada doença e não foi associado à melhora clı́nica,
quando se analisou toda a amostra do estudo. Ou seja, o tratamento não foi associado
marginalmente à recuperação do paciente (OR - Odds Ratio ou RC - Razão de
Chances=1) (Tabela 6.1). Entretanto, quando os dados foram analisados separadamente
por sexo, paradoxalmente, em ambos os sexos, o tratamento foi associado a uma menor
taxa de recuperação, tanto no sexo feminino, como no masculino (OR=0,83) (Tabela
6.2). Quando foi analisada a associação condicional, por meio de estratificação pelo
sexo, foi observado um paradoxo. Como poderia um tratamento não ter efeito na
população como um todo mas, ao mesmo tempo, prejudicar a recuperação de homens e
mulheres? Este fenômeno foi denominado paradoxo de Simpson. Este exemplo, não é
apenas paradoxal, mas também não faz sentido lógico, considerando que esta situação
é irreal, impossı́vel de ocorrer na realidade. Não é plausı́vel que um tratamento possa
ser maléfico a cada sexo e, ao mesmo tempo, não ter efeito quando juntamos homens
com mulheres. Quando nos depararmos com tal paradoxo em uma situação de pesquisa,
devemos preferir a medida marginal ou condicional de associação? Para respondermos
a esta pergunta é preciso saber o que explica a ocorrência do paradoxo de Simpson.
Tabela 6.1.: O paradoxo de Simpson - associação marginal

D=1 D=0 Total
n % n
T=1 20 50 20 40
T=0 6 50 6 12
Total 26 50 26 52
RRT D = 20/40 / 6/12 = 1
ORT D = 20 x 6 / 20 x 6 = 1
RR=Razão de Risco
OR=Odds ratio
Fonte: adaptada de (Hernan et al., 2011)
93
6. Viés de confundimento: do conceito associacional ao conceito estrutural
Tabela 6.2.: O paradoxo de Simpson - associação condicional por sexo

C=1 Masculino C=0 Feminino
D=1 D=0 Total D=1 D=0 Total
n % n n % n
T=1 5 39 8 13 T=1 15 56 12 27
T=0 3 43 4 7 T=0 3 60 2 5
Total 8 40 12 20 Total 18 56 14 32
RRT D|C=1 = 5/13 / 3/7 = 0,90 RRT D|C=0 = 15/27 / 3/5 = 0,93
ORT D|C=1 = 5 x 4 / 8 x 3 = 0,83 ORT D|C=0 = 15 x 2 / 12 x 3 = 0,83
RR=Razão de Risco
OR=Odds ratio
Fonte: adaptada de (Hernan et al., 2011)
Hernan discute o paradoxo de Simpson com o uso de DAGs (Hernan et al., 2011).
Este paradoxo poderia tanto representar viés de colisão, como ocorrer numa situação de
confundimento. Vimos, no capı́tulo 5, que os dados comunicam apenas associações. Neste
caso, queremos interpretar, em termos causais, uma medida de associação. Para isto,
vamos necessitar de conhecimento teórico prévio, para realizarmos inferência causal
com dados observacionais. Não é possı́vel interpretar causalmente uma associação
apenas com base nos dados. Precisamos conhecer a história por trás dos dados, ou
seja, necessitamos usar o que sabemos para identificar e explicar a natureza desta
situação paradoxal. No DAG da figura 6.1, o paradoxo de Simpson é interpretado como
viés de colisão. Na realidade não existe associação marginal entre o tratamento e a
recuperação. Mas, no momento em que condicionamos para sexo, abre-se um caminho
que estava fechado pelo colisor, e surge uma associação negativa entre tratamento e
desfecho: os tratados têm menores percentuais de recuperação do que os não tratados.
Entre homens, o percentual de recuperação foi de 39% para os tratados e de 43%
para os não tratados. Já entre a mulheres, dentre as tratadas, 56% se recuperaram,
enquanto este percentual foi de 60% para as do grupo controle (Tabela 6.2). Neste
DAG estarı́amos codificando o nosso conhecimento. Entretanto, é impossı́vel que a
recuperação e o tratamento interfiram no sexo do indivı́duo, pois o sexo das pessoas foi
determinado por outros fatores, muito antes delas receberam o tratamento e terem ou
não se recuperado da doença. Com base no nosso conhecimento, descartamos, então, a
hipótese de viés de colisão.
Vejamos agora a hipótese de confundimento. No DAG da figura 6.2, o paradoxo de
Simpson é interpretado como viés de confundimento. A nossa hipótese, baseada no
conhecimento prévio, é de que o sexo interfere no recebimento do tratamento e também
na recuperação do indivı́duo. Ou seja, o sexo é uma causa comum do tratamento e do
desfecho recuperação. No DAG há um caminho causal, que sai pela porta da frente,
fluindo do tratamento para a recuperação (Tratamento → Recuperação), e um
caminho não causal, que flui pela porta de trás, partindo do tratamento, voltando no
sentido contrário ao da seta para o sexo, e indo no sentido da seta para a recuperação
94
Figura 6.1.: DAG interpretando o paradoxo de Simpson como viés de colisão
Recuperação
Sexo
Tratamento
O quadrado desenhado em volta da variável Sexo

indica condicionamento.
A linha interrompida conectando Tratamento
e Recuperação indica associação espúria,
induzida por condicionamento indevido por um colisor.
(Tratamento ← Sexo → Recuperação). Vimos, no capı́tulo 5, que um caminho não

causal pela porta de trás, se não estiver fechado por um colisor, encontra-se aberto. Se
o caminho pela porta dos fundos estiver aberto, associação não espúria flui pela porta
de trás e enviesa a estimativa marginal do efeito causal do tratamento na recuperação.
Quando há caminho aberto pela porta dos fundos, a associação marginal entre o
tratamento e a recuperação é formada por dois componentes: um componente causal,
que transmite o efeito causal, e um componente não causal, que transmite associação
espúria. Apenas bloqueando o caminho pela porta de trás é que interrompemos o fluxo
de associação espúria e impedimos que o viés contamine nossa estimativa de efeito
causal. Este bloqueio pode ser feito por meio de condicionamento pelo sexo. Uma das
formas de se realizar este condicionamento é por meio do cálculo da estimativa do
efeito causal nos estratos da causa comum, neste caso o sexo. Ou seja, calculando-se a
estimativa condicional pelo sexo. Outra forma de se realizar este condicionamento é
por meio de ajuste em modelos estatı́sticos de regressão.
Vamos agora utilizar os dados para ver se eles são compatı́veis com as nossas hipóteses.
O percentual de tratamento teve variação segundo o sexo? O percentual de recuperação
também variou de acordo com o sexo, ou seja, os homens se recuperaram mais ou
menos do que as mulheres? Vemos que, dentre os homens, 13/20 (65%) foram tratados,
enquanto 27/32 (84%) das mulheres receberam o tratamento. Concluı́mos que os homens
tiveram menor probabilidade de receber o tratamento que as mulheres. Portanto, os
dados não estão balanceados em relação ao sexo, pois os homens receberam menos o
tratamento do que as mulheres. Por outro lado, também verificamos que 5/8 (63%)
dos homens e 15/18 (83%) das mulheres se recuperaram da doença. Desta forma,
concluı́mos que os homens tiveram menor percentual de recuperação do que as mulheres.
Como o DAG é uma ferramenta populacional, mesmo diante de uma amostra pequena,
não estamos considerando erro de amostragem neste exemplo. Estamos assumindo
95
que qualquer diferença observada nos percentuais dentre os sexos seja real e não obra
do acaso. Assim, consideramos que o DAG da figura 6.2 é compatı́vel com o nosso
conhecimento prévio. Desta forma, chegamos à conclusão de que o paradoxo de Simpson
é devido ao viés de confundimento e os resultados da associação condicional (OR nos
estratos, T D|C ) é que devem ser interpretados. O OR marginal (ORT D ), calculado
incluindo toda a amostra, não deve ser utilizado, pois é uma estimativa viciada. Apenas
com base nos dados não poderı́amos extrair qualquer conclusão, pois as associações
encontradas (sexo com tratamento e sexo com recuperação) são compatı́veis tanto com
a hipótese do sexo causar estas variáveis, quanto com estas duas variáveis causarem o
sexo. Assim, tanto a associação marginal quanto a condicional do tratamento com a
recuperação seriam possı́veis de ser interpretadas, tendo em conta os dados. Apenas
com base nos nossos pressupostos, isto é, no nosso conhecimento prévio, é possı́vel tirar
um conclusão e, dar aos dados uma interpretação causal.
Figura 6.2.: DAG interpretando o paradoxo de Simpson como viés de confundimento
Tratamento
Sexo
Recuperação
6.1.1. Colapsibilidade da Medida de Associação

Outra possı́vel explicação para o paradoxo de Simpson é a não colapsibilidade da
medida de associação. Uma medida de associação é considerada não colapsável quando
as estimativas obtidas em cada um dos estratos diferem da medida obtida quando se
combinam os estratos. Portanto, a estimativa dos estratos não é colapsável, combinável
em uma única medida que reflita, fielmente, os valores dos estratos. Isto acontece
quando, mesmo que as medidas de associação dos dois estratos sejam iguais ou bem
semelhantes, a medida de associação combinada falha em produzir um valor igual aos
valores observados nos estratos (Jewell, 2004). Se uma medida for colapsável, esta pode
ser colapsável de forma estrita ou não estrita.
Uma medida de associação entre T (tratamento) e D (desfecho) é estritamente
colapsável sobre C (variável de estratificação) se esta for constante nos estratos de
C e se este valor constante for igual ao valor obtido na tabela marginal (Greenland
and Morgenstern, 2001). Por outro lado, uma medida pode ser colapsável, de forma
não estrita, se o seu valor marginal puder ser expresso como uma média ponderada
de seus valores condicionais, isto é, nos estratos de C, mesmo quando os seus valores
condicionais diferirem nesses estratos. Assim, uma medida é considerada não
colapsável quando o seu valor marginal não for igual à média ponderada de
96
seus valores condicionais (Hernan et al., 2011). Um resumo destas definições de

colapsibilidade estrita, colapsibilidade não estrita e não colapsibilidade está demonstrado
na tabela 6.3.
Tabela 6.3.: Definições de colapsibilidade

Colapsibilidade Definição
Estrita MAT D|C=1 = MAT D|C=0 e MAT D = MAT D|C
Não estrita MAT D|C=1 6= MAT D|C=0 e MAT D = MAT D|C
Não colapsável MAT D 6= MAT D|C
MA = Medida de Associação
No exemplo da tabela 6.2, considerando-se o odds ratio, o valor da medida de

associação da variável de estratificação (sexo) é igual nos dois estratos (ORT D|C=1 =0,83
e ORT D|C=0 =0,83). Isto indica que não há interação multiplicativa1 entre sexo e
tratamento na ocorrência do desfecho recuperação. A ausência de interação é uma
pré-condição para que uma medida de associação seja estritamente colapsável. Se o
efeito do tratamento nos dois estratos do sexo, masculino e feminino, for diferente, não
faz sentido se calcular uma medida única do efeito. Nesta primeira situação, quando há
ocorrência de interação, a medida de associação não é estritamente colapsável.
Em havendo igualdade do efeito nos estratos, uma medida de associação é estritamente
colapsável se o valor da associação condicional (obtida nos estratos) for igual ao valor
da associação marginal (incluindo todas as unidades estudadas). Dito em outras
palavras, uma medida de associação é colapsável quando o valor da medida
de associação bruta for igual ao valor da medida de associação ajustada para
a variável C. O viés de confundimento é uma das razões que fazem com que uma medida
de associação não seja colapsável. No exemplo das tabelas 6.1 e 6.2 o odds ratio não é
colapsável, pois o seu valor condicional, calculado nos estratos do sexo (ORT D|C =0,83),
é diferente do valor marginal, obtido incluindo-se ambos os sexos (ORT D =1). Ou seja,
T e D são marginalmente independentes (T ⊥ D), mas condicionalmente dependentes
dado C (T 6⊥ D | C).
Peculiaridades matemáticas também provocam não colapsibilidade de al-
gumas medidas de associação e podem gerar situações semelhantes às demonstradas
na situação exemplificada no paradoxo de Simpson. Para demonstrar tal questão com
clareza, vamos recorrer a um exemplo com dados simulados de um ensaio clı́nico
randomizado.
Na tabela 6.4 não há confundimento, pois os grupos estão balanceados em relação
à variável de tratamento: igual quantidade de indivı́duos foi tratada (n=200, 50%)
em cada estrato de C. A diferença de risco é estritamente colapsável: seu valor nos
estratos de C é igual ao seu valor na amostra combinada (DRT D|C =DRT D =0,50). A
razão de risco, entretanto, não é estritamente colapsável, pois seu valor condicional
varia nos estratos de C (RRT D|C=1 =6,00 e RRT D|C=0 =2,25) e difere do seu valor
marginal (RRT D =3,00). O odds ratio também não é colapsável: apesar do seu valor
1 uma revisão dos conceitos de interação aditiva e multiplicativa pode ser encontrada em (Jewell,
2004), capı́tulo 10.
97
Tabela 6.4.: Não colapsibilidade do odds ratio na ausência de confundimento

C=1 C=0
T=1 120 80 200 T=1 180 20 200
T=0 20 180 200 T=0 80 120 200
Total 140 260 400 Total 260 140 400
DRT D|C=1 = 0,50 DRT D|C=0 = 0,50
RRT D|C=1 = 6,00 RRT D|C=0 = 2,25
ORT D|C=1 = 13,50 ORT D|C=0 = 13,50
Total
D=1 D=0 Total
T=1 300 100 400
T=0 100 300 400
Total 400 400 800
DRT D = 0,50
RRT D = 3,00
ORT D = 9,00
DR=Diferença de Risco
RR=Razão de Risco
OR=Odds ratio
ser o mesmo nos estratos de C (ORT D|C=1 =ORT D|C=0 =13,50), este valor é diferente
do odds ratio marginal (ORT D =9,00). Desta forma, concluı́mos que a colapsibilidade
depende da escolha da medida de associação. Usando-se os mesmos dados, pode se
obter colapsibilidade com uma medida e não com outra.
Vimos que a razão de risco não é estritamente colapsável, pois seus valores diferem
nos estratos de C. Vamos agora verificar se a razão de risco pode ser colapsável de
forma não estrita, ou seja, se o seu valor marginal é igual à média ponderada de seus
valores condicionais. Para este cálculo vamos usar o estimador não paramétrico, a partir
da fórmula 6.1 abaixo :
X
P (D = d|do(T = t)) = P (D = d|T = t, C = c)P (C = c) (6.1)
c
Razão de Risco Ponderada= [P(D=1 | do(T=1) / P(D=1 | do(T=0)]

[120/200x400/800] + [180/200x400/800] = [0, 60x0, 50] + [0, 90x0, 50] = 0, 30 + 0, 45 = 0, 75

[20/200x400/800] + [80/200x400/800] = [0, 10x0, 50] + [0, 40x0, 50] = 0, 05 + 0, 20 = 0, 25
98
Razão de Risco Ponderada = 0,75 / 0,25 = 3
Concluı́mos, portanto, que, apesar dos valores da razão de risco diferirem nos estratos
(RRT D|C=1 =6,00 6= RRT D|C=0 =2,25), devido a uma interação multiplicativa, a razão
de risco marginal (RRT D =3,00) é igual à soma ponderada de seus valores condicionais
nos estratos (RRT D|C =3,00). Assim, apesar da razão de risco não ser estritamente
colapsável, ela é colapsável de forma não estrita.
Vejamos agora se o odds ratio é colapsável de forma não estrita. Para isto vamos
usar o estimador ponderado de Mantel-Haenszel, de acordo com a fórmula 6.2 abaixo,
onde K é o número de estratos.
PK
ˆ (ai di /ni )
ORM H = Pi=1
K
(6.2)
i=1 (bi ci /ni )
(120x180/400)+(180x120/400) (21600/400)+(21600/400) 54+54 54

(80x20/400)+(20x80/400) = (1600/400)+(1600/400) = 4+4 = 4 = 13, 5
Podemos, então, concluir que a estimativa bruta ou marginal do OR (ORT D =9,00) não
é igual à média ponderada dos valores do OR condicionais dos estratos (ORM H =13,50).
Ou seja, o OR é uma medida não colapsável, mesmo sem viés de confundimento, a
partir de dados obtidos de um ensaio clı́nico randomizado, perfeitamente balanceado.
A não colapsibilidade do OR é um fenômeno por meio do qual o OR bruto ou marginal,
não pode ser expresso como uma média ponderada das estimativas do OR especı́ficos
dos estratos, mesmo na ausência de confundimento. Esta caracterı́stica do odds ratio é
uma peculiaridade matemática, não uma indicação de viés (Hernan et al., 2011). O
odds ratio tem uma tendência a se afastar de 1, tanto para cima quanto para baixo
e, desta forma, se descolar do valor da razão de risco (no exemplo da tabela 6.4 o
OR=9,00 é maior do que o RR=3,00) . Entretanto, o OR tende a se aproximar da razão
de risco quando a doença for rara (Rothman et al., 2008). Assim, quando a doença
é comum o odds ratio tende a superestimar a razão de risco. Quando a doença for
rara, as diferenças entre o OR marginal, bruto, (ORT D ) e o OR ponderado, ajustado,
(ORM H ) são pequenas (Jewell, 2004) e, neste caso, podemos assumir que o OR também
será uma medida colapsável.
Este exemplo mostra que pode haver não colapsibilidade mesmo na ausência de
viés de confundimento, o que nos leva a concluir que viés de confundimento não é
sinônimo de colapsibilidade. Confundimento pode ocorrer tanto na presença quanto
na ausência de colapsibilidade, bem como colapsibilidade pode ser identificada com
ou sem confundimento (Greenland and Morgenstern, 2001). Portanto, colapsibilidade
e confundimento são conceitos distintos. Apenas pelo conceito da colapsibilidade,
que é puramente baseado nos dados, não se faz distinção se C causa T e D (o que
significaria viés de confundimento), ou se T e D causam C (o que representaria que
C seria um colisor). Para se interpretar uma situação de não colapsibilidade como de
confundimento é necessário conhecer a história por trás dos dados. Não colapsibilidade
pode representar confundimento ou viés de colisão. Pode também ser um reflexo de
viés de aferição, representar mediação, ser obra do acaso ou, no caso do odds ratio e de
outras medidas de associação (como a razão de taxas e a diferença de taxas (Greenland,
99
Tabela 6.5.: Razões para não colapsibilidade - diferença entre a estimativa bruta e
ajustada
Peculiaridade matemática do odds ratio quando a doença for rara

Particularidade da razão de taxas ou da diferença de taxas
Viés de confundimento
Viés de colisão
Viés de aferição
Mediação
Acaso
Viés de confundimento ou de colisão por outra variável omitida
1996), simplesmente significar uma peculiaridade matemática. Pode também se dever

a confundimento ou viés de seleção (colisão) por outra variável omitida e, portanto,
não controlada (Greenland and Robins, 2009). Os motivos de não colapsibilidade das
medidas de associação estão sumarizadas na tabela 6.5. Vale lembrar que só faz sentido
investigar não colapsibilidade na ausência de interação.
Para concluir, usando-se medidas de associação colapsáveis (diferença de risco ou
razão de risco), a não colapsibilidade pode ser interpretada como indicativa de viés
de confundimento, a partir do uso do nosso conhecimento teórico, quando assumimos
que C é uma causa comum de T e de D. Quando usamos o OR, se a doença for rara,
também podemos interpretar a não colapsibilidade do OR como evidência de viés de
confundimento, se também assumirmos uma estrutura de garfo (C é causa comum
de T e de D). No entanto, colapsibilidade não pode ser interpretada como ausência
de confundimento, pois há situações em que há confundimento mesmo na presença
de colapsibilidade (Greenland and Morgenstern, 2001). Apesar disso, na maioria dos
casos em que há colapsibilidade o confundimento está ausente, sendo raros os casos
de confundimento com colapsibilidade (Greenland and Morgenstern, 2001). Isto talvez
explique o fato de que, em grande parte da literatura epidemiológica, não colapsibilidade
é considerada sinônimo de confundimento.
6.1.2. Exercı́cio resolvido - o paradoxo de Simpson

Assim, como interpretamos o exemplo da tabela 6.1, do paradoxo de Simpson? Para
nos ajudar nesta decisão vamos calcular a estimativa ponderada da razão de risco e o
OR ajustado de Mantel-Haenszel. Para isto, baixe o arquivo simpson.dta da página
da internet e utilize os seguintes comandos no Stata:
. use simpson
. expand n
. cs d t, by(c)
100
c RR [95% Conf. Interval] M-H Weight
0 .9259259 .4197179 2.042655 2.53125

1 .8974359 .2994789 2.689309 1.95
Crude 1 .5246084 1.906184

M-H combined .9135286 .4754405 1.755287
Test of homogeneity (M-H) chi2(1) = 0.002 Pr>chi2 = 0.9633
. cc d t, by(c)
c OR [95% Conf. Interval] M-H Weight
0 .8333333 .0607084 8.611738 1.125 (exact)

1 .8333333 .0914952 8.328274 1.2 (exact)
Crude 1 .2241313 4.461623 (exact)

M-H combined .8333333 .2167209 3.204326

Test that combined OR = 1:
Mantel-Haenszel chi2(1) = 0.07
Pr>chi2 = 0.7949
Em relação à razão de risco, como se trata de uma medida colapsável, podemos

interpretar a diferença entre o RR marginal (RRT D =1) e o RR ponderado a partir
das médias dos estratos (RRT D|C =0,91) como sugestiva de viés de confundimento.
No caso do OR, como se trata de uma medida não colapsável, precisamos verificar o
pressuposto da doença rara, para que possamos usar a diferença entre as estimativas
bruta (ORT D =1) e ajustada (ORM H =0,83) como indicativa de confundimento. Vemos,
na tabela 6.1, que o desfecho é frequente, pois 50% dos pacientes se recuperaram. Assim,
neste exemplo, a diferença entre as estimativas bruta e ajustada do OR também pode
refletir, analisando-se apenas os dados, a não colapsibilidade do odds ratio.
Note que foi também calculado o teste de homogeneidade das estimativas condicionais
dos estratos nos dois casos. O p valor >0,05 para as duas situações sugere que não
há evidência de interação2 . Na ausência de interação podemos interpretar diferenças
entre as estimativas bruta e ajustada das medidas de associação como evidência de
confundimento, se assumirmos que C é causa comum de T e de D.
Como usamos também o RR, que é uma medida colapsável, para verificar diferença
entre as estimativas bruta e ajustada, verificando que há observações em todas as
caselas da tabela (pressuposto da positividade) (Greenland and Morgenstern, 2001) e
assumindo-se que:
• C é causa comum de T e D;
• o acaso é improvável como explicação, apesar do pequeno tamanho da amostra;
• o viés de aferição também é improvável;

2 umarevisão dos testes de homogeneidade para detectar evidência de interação pode ser encontrada
em (Jewell, 2004), capı́tulo 10.
101
• C não é mediador (variável intermediária) entre T e D;

• não há confundimento por outra causa comum omitida;
• há apenas uma única versão do tratamento e o tratamento de um indivı́duo
não interferiu no desfecho de outro indivı́duo (pressuposto SUTVA, stable unit
treatment value assumption) (Morgan and Winship, 2015);
Uma interpretação deste exemplo do paradoxo de Simpson seria:

• A diferença entre as estimativas bruta e ajustada do RR sugere a presença de
viés de confundimento.
• O tratamento reduziu o percentual de recuperação em 9% (1-0,91), (RRT D =1,
RRT D|C =0,91).
• Em relação ao odds ratio, parte da diferença de 17% entre as estimativas bruta
(ORT D =1) e ajustada (ORM H =0,83) reflete viés de confundimento (9%, derivada
a partir da estimativa da diferença entre a RR bruta e ajustada) e parte indica
não colapsibilidade desta medida de associação (17%-9%=8%, calculada a partir
das diferenças entre as estimativas da RR e do OR).
Vimos assim que, para se fazer uma interpretação causal de uma medida de associação
são necessários vários pressupostos. Muitos destes pressupostos não são testáveis
empiricamente. Apenas com base nos dados, não é possı́vel interpretar o paradoxo de
Simpson.
6.2. Definição associacional de confundimento

Em grande parte da literatura epidemiológica da segunda metade do século XX, o con-
fundimento é geralmente considerado com base nos dados, definição que denominamos
aqui de associacional ou estatı́stica de confundimento, pois está baseada em associações
para identificação do provável fator de confusão. Inicialmente é verificado se o potencial
confundidor está associado com a exposição. Depois se observa se está associado com a
doença entre os não expostos. Em seguida, se usa o critério de mudança na estimativa
ajustada, em relação à estimativa bruta. Se houver diferença, então há confundimento
(Kleinbaum et al., 1982). Uma diferença ≥10% tem sido considerada, arbitrariamente,
para decidir se a variável é, então, um possı́vel confundidor (Greenland, 1989).
Esta definição equipara o conceito de confundimento com o de colapsibilidade
(Greenland and Robins, 1986; Greenland and Morgenstern, 2001). O confundidor é,
então, considerado como a variável que, uma vez controlada, modifica a estimativa de
associação (Kleinbaum et al., 1982). Por este conceito tradicional, todas as variáveis
que passarem por este critério, sendo, assim, identificadas como confundidoras, devem
ser incluı́das no ajuste.
Refinamentos deste critério utilizam também teoria causal neste processo de identi-
ficação, por exemplo, quando se exclui a possibilidade do confundidor ser uma variável
interveniente ou mediadora da relação causal. Desta forma, o critério utilizado para
102
6.2. Definição associacional de confundimento
detecção de confundimento passa a incluir uma mistura de relações causais (teoria) com
associações baseadas nos dados. Entretanto, o critério da mudança da estimativa (bruta
versus ajustada) permanece como a principal referência na identificação do confundidor,
ou seja, o critério utilizado continua sendo, predominantemente, empı́rico, mesmo após
estes refinamentos (Kleinbaum et al., 1982).
Assim, de acordo com a definição associacional, são três as propriedades necessárias,
mas não suficientes, para se caracterizar um confundidor (supondo-se ausência de
interação entre exposição e confundidor): 1) a variável de confusão deve estar associada
com a exposição na população (em toda a coorte, no estudo de coorte, e nos controles,
no estudo caso-controle) ; 2) o fator de confusão deve ser um fator de risco para a
doença entre os não expostos e 3) o confundidor não pode ser um mediador entre a
exposição e a doença (Kleinbaum et al., 1982). Algumas variações nestas propriedades
existem: (Rothman et al., 2008) acrescenta à terceira condição que o confundidor não
pode ser afetado pela exposição ou pela doença (Rothman et al., 2008). (Szklo and
Nieto, 2014) acrescenta à segunda condição que o confundidor deve ser causa da doença.
Apesar de na maioria das vezes estes critérios funcionarem bem, há alguns casos
em que o critério associacional falha e pode provocar, ao invés de evitar, viés. Assim,
demonstraremos com exemplos, que o critério de identificação de confundidor baseado
em associações estatı́sticas é insuficiente e, portanto, obsoleto. O uso isolado deste
critério pode levar a ajuste inadequado para confundimento, ao se incluir uma variável
desnecessária no ajuste, abrindo portas já fechadas por colisores, provocando, assim,
viés de colisão, e sabotar a interpretação causal da medida de associação calculada.
Vimos, na análise do paradoxo de Simpson, que critérios de associação baseados nos
dados são insuficientes para identificar confundimento, pois este se trata de um conceito
causal.
Um dos problemas com o uso desta definição é que, o que aparece como uma
associação ou independência entre o potencial confundidor com a exposição ou com o
efeito, pode representar confundimento ou viés de colisão por outra variável, que não foi
levada em conta no ajuste. Ou seja, no uso dos critérios indicativos para identificação de
confundimento, se empregam associações marginais (bivariadas), que podem, também,
estar viciadas, devido a outras variáveis não incluı́das no ajuste (Greenland and Robins,
2009). Além disso, várias outras razões, além do confundimento, podem provocar uma
mudança da estimativa bruta para a ajustada (Greenland and Robins, 2009), como foi
demonstrado na seção anterior (vide tabela 6.5).
Quando o critério da mudança da estimativa bruta para a ajustada é utilizado, as
estimativas condicionais são produzidas, ajustando-se, geralmente, para um confundidor
por vez. Assim, este critério não tem bom desempenho para se lidar com situações de
confundimento múltiplo (Greenland et al., 1999).
Outro problema com este critério é que é sempre necessário que seja realizada
avaliação de potenciais interações entre a exposição (E) e o eventual confundidor (C).
Na presença de modificação de efeito (identificada por meio de interação em modelo
estatı́stico ou por meio de análise estratificada), a diferença entre a estimativa bruta e
a estimativa ajustada não faz sentido ser interpretada. Como há interação, o efeito se
modifica a depender das categorias de exposição e do confundidor (Miettinen and Cook,
1981). A prática frequente de se usar modelos paramétricos multivariáveis, nos quais se
103
avalia apenas confundimento, ignorando-se teste de interações é danosa neste sentido.

Outra limitação do uso do critério de mudança da estimativa é que uma associação
estatisticamente significante pode ser um falso-positivo, quando a associação reflete
apenas o acaso (Miettinen and Cook, 1981). Este critério também depende da medida
de associação que é utilizada: mudança na estimativa pode ocorrer com o uso do OR e
não ser observado com o RR (Greenland and Morgenstern, 2001; Miettinen and Cook,
1981).
Pearl (2001) considera que o critério associacional não é necessário nem suficiente
para detecção de confundimento. Alguns confundidores podem não estar associados
com X ou com Y, e alguns não confundidores podem estar associados tanto com X,
quanto com Y. Os principais problemas e limitações no uso da definição associacional
de confundimento estão ilustradas na tabela 6.6.
Tabela 6.6.: Problemas e limitações no uso da definição associacional de confundimento
1) A mudança da estimativa bruta para a ajustada é dependente da medida de

associação utilizada
2) A mudança da estimativa bruta para a ajustada pode representar confun-
dimento por outra variável omitida, que interfira nas associações bivariadas
marginais entre C e E, e C e D
3) Associações significantes entre o confundidor com a exposição e o desfecho
podem ser apenas fruto do acaso
4) A mudança da estimativa bruta para a ajustada pode representar viés de
colisão, se a variável de ajuste for um colisor
5) A mudança da estimativa bruta para a ajustada pode ocorrer por erro de
mensuração
6) Não faz sentido interpretar diferença entre a estimativa bruta e ajustada na
presença de interação entre E e C
Outros critérios populares usados para identificar confundimento também podem

levar a viés, tanto por omissão de confundidores importantes, como por inclusão de
variáveis desnecessárias e danosas no ajuste. Os métodos automáticos de seleção de
confundidores, stepwise, ainda são muito usados, apesar de sua baixa performance na
identificação de confundidores (Greenland, 1989), com a ideia de que os confundidores
mais importantes serão identificados, mesmo que algumas variáveis selecionadas não
sejam confundidoras (Hernan, 2002). Os métodos de seleção stepwise de confundidores
estão baseados nos dados e nos testes de significância. Possuem baixa sensibilidade
para identificar reais confundidores, mesmo com o aumento do p-valor para retenção de
variáveis no modelo, por exemplo, para ≥0,20 (Mickey and Greenland, 1989). Isto pode
se dever ao fato de que, na seleção de variáveis só são levadas em conta associações entre
os potenciais confundidores e o desfecho, ignorando-se associações entre os possı́veis
confundidores com a exposição. Ademais, não é incomum que critérios stepwise de
seleção de confundidores produzam resultados absurdos e implausı́veis (Greenland,
1989). O uso de métodos stepwise de seleção de variáveis de confundimento não estão
104
6.3. Definição contrafatual de confundimento
mais indicados pois, comumente, criam viés de colisão. Além disso, como geralmente
são usados modelos paramétricos nos métodos de seleção stepwise, que dependem de
pressupostos frequentemente irrealistas em relação à forma funcional e distribuição das
variáveis, as estimativas derivadas destes modelos estão, comumente, erradas (Morgan
and Winship, 2015; Greenland et al., 1999). Outro problema é a frequente não inclusão
de termos de interação entre variáveis nestes modelos, o que pode gerar erros na
identificação de reais confundidores.
Se os critérios mais comumente usados para identificar potenciais confundidores
falham, qual a alternativa? A alternativa é utilizar o conhecimento prévio a respeito
do problema, pois o confundimento é um conceito causal. Partindo-se de um DAG
para representar as relações entre as variáveis selecionaremos um conjunto mı́nimo de
variáveis de ajuste para confundimento, a partir da aplicação de critérios gráficos como,
por exemplo, do critério da porta de trás, conforme explicado no capı́tulo 5.

Confundimento é um viés que surge quando se chega a uma conclusão falsa a respeito
do efeito causal entre a exposição (tratamento) e o desfecho. Este viés aparece quando
a associação estatı́stica difere da relação causal. Esta conclusão falsa se deve a uma
associação não causal que surge entre o tratamento T e o desfecho D devido a uma
terceira variável C. O efeito deste outro fator C está misturado, confundido com o
efeito do tratamento. Os grupos de tratamento e controle estão desbalanceados em
relação a este fator C e, portanto, não são mais permutáveis entre si. Esta falta de
permutabilidade entre os grupos de tratamento e controle é devido a este fator C ser
uma causa comum, tanto do tratamento, quanto do desfecho. Por isto, a associação
deixa de ser causal, devido a um desbalanceamento entre os grupos tratamento e
controle.
O confundimento, numa definição estrutural, é o viés que surge quando a exposição
e o desfecho possuem uma causa comum e existe pelo menos um caminho aberto pela
porta de trás entre a exposição e o desfecho. A existência de caminho aberto pela
porta de trás significa que há pelo menos uma causa comum não controlada, que
provoca associação espúria e quebra da permutalidade entre os grupos. Desta forma,
confundidores são variáveis que quando estratificadas ou incluı́das no ajuste eliminarão
ou diminuirão o componente espúrio da associação entre T e D (Hernan, 2002).
VanderWeele and Shpitser (2013) definem confundidor como uma ”covariável pré-
exposição C para a qual existe um conjunto de outras covariáveis X, de tal modo que
o efeito da exposição no desfecho não esteja confundido condicionalmente a (X, C),
mas de tal forma que para nenhum subconjunto de (X , C) o efeito da exposição no
desfecho não esteja confundido dado o subconjunto”. Assim, confundidor é uma variável
C que compõe o conjunto mı́nimo de ajuste suficiente para eliminar confundimento,
identificado, por exemplo, pelo critério da porta de trás. Este conjunto mı́nimo de
ajuste pode incluir apenas esta variável C, ou também outra(s) variável(is) necessária(s)
para bloquear todos os caminhos abertos pela porta dos fundos entre T e D. Por esta
definição, nem sempre o confundidor é uma causa comum de T e D, pois pode ser um
105
descendente de uma causa comum que bloqueia o caminho aberto pela porta de trás.
O confundimento resulta em várias consequências, que distorcem a avaliação do
efeito causal. Estas consequências dependem da intensidade e da direção das associações
entre o confundidor C e o tratamento T, e também entre o confundidor C e o desfecho
D. O confundimento pode gerar uma associação falso positiva ou superestimar o
efeito do tratamento. Pode causar uma associação falso negativa ou substimar o efeito
do tratamento. Pode, ainda, em casos mais raros, inverter a direção da associação,
transformando um verdadeiro fator de risco em um falso fator de proteção ou vice-versa.
Na definição contrafatual o confundimento surge porque comparamos grupos, ao invés
de compararmos os mesmos indivı́duos em dois momentos no tempo. Assim, se estamos
interessados em saber se a infecção pelo vı́rus Zika causa microcefalia, idealmente
gostarı́amos de comparar as mesmas mulheres em dois momentos: quando infectadas e
quando não infectadas pelo vı́rus, para verificar se, em cada um destes momentos, o feto
vai desenvolver microcefalia. Para fazermos isso terı́amos que acompanhar mulheres
infectadas e verificar se os seus fetos vão desenvolver microcefalia (Pr[D1 ], significando
probabilidade da doença quando não exposto). Em seguida, precisarı́amos voltar no
tempo e observar, novamente, estas mesmas mulheres numa situação em que não
tenham sido infectadas pelo vı́rus Zika e observar se os seus fetos desenvolveriam
microcefalia (Pr[D0 ], probabilidade da doença quando não exposto). Ou seja, para se
calcular o efeito causal precisarı́amos realizar um contraste dos desfechos potenciais da
mesma pessoa, quando submetida a diferentes tratamentos, em momentos diferentes
do tempo (Pr[D1 ] - Pr[D0 ]). Entretanto, na vida real só conseguiremos verificar uma
destas duas respostas potenciais, a resposta fatual. A outra resposta potencial é sempre
contrafatual, não observável. Assim, não conseguiremos calcular diretamente o efeito
causal.
O que fazemos na prática é estimar uma associação, comparando-se a probabilidade
de desenvolvimento de microcefalia em um grupo de mulheres que tenha sido infectado
pelo vı́rus (Pr[D=1|T=1], probabilidade da doença condicional a pertencer ao grupo
de expostos) com a probabilidade da doença em outro grupo de mulheres que não foi
infectado pelo vı́rus (Pr[D=1|T=0], probabilidade da doença condicional a pertencer ao
grupo de não expostos). Se a taxa de microcefalia no grupo de mulheres não infectadas
for igual à taxa de microcefalia que teria sido observada no grupo de mulheres infectadas,
caso elas não tivessem sido infectadas, os grupos são permutáveis, (Pr[D=1|T=0 =
Pr[D0 ]) e não ocorre viés. Entretanto, se houver causa comum do tratamento e do
desfecho, que provoque falta de permutabilidade entre os grupos de mulheres infectadas
e não infectadas, a nossa estimativa de associação (Pr[D=1|T=1 - Pr[D=1|T=0]) será
diferente da estimativa de efeito causal (Pr[D1 ] - Pr[D0 ], impossı́vel de ser calculada,
pois terı́amos que comparar a resposta potencial fatual com a resposta potencial
contrafatual no mesmo grupo). Esta diferença entre a medida de associação, obtida a
partir da comparação de duas respostas fatuais observadas em dois grupos, e a medida
de causa, ideal, que compararia a taxa do desfecho fatual com a taxa do desfecho
contrafatual no mesmo grupo, provoca confundimento (Rothman et al., 2008). Um
potencial confundidor desta associação seria o nı́vel socioeconômico: mulheres mais
pobres tendem a residir em bairros cuja taxa de infecção pelo Aedes é mais elevada,
tendo, portanto, maiores riscos de serem infectadas pelo vı́rus Zika. Por outro lado,
106
mulheres mais pobres também apresentam maior risco de contrair outras infecções
causadoras de microcefalia (toxoplasmose ou citomegalovı́rus, por exemplo).
Na tabela 6.7, demonstramos esta situação de maneira mais clara. Vamos denominar
a população de mulheres infectadas, que usaremos como grupo exposto, de população
tratada A e a população de mulheres não infectadas, que usaremos como grupo controle,
de população não tratada B. No grupo A, observamos apenas a resposta potencial
fatual na presença do tratamento Pr[DA1 ] e no grupo B a resposta fatual na ausência do
tratamento Pr[DB0 ]. Não observamos as respostas contrafatuais Pr[DA0 ], probabilidade
da doença entre os tratados caso não tivessem recebido o tratamento, e Pr[DB1 ],
probabilidade da doença entre os não tratados, caso tivessem sido tratados. Ou seja,
não sabemos o que teria acontecido com o grupo infectado A, caso ele não tivesse sido
infectado, Pr[DA0 ]. Também não temos informação sobre o grupo não infectado B, caso
ele tivesse sido infectado, Pr[DB1 ]. Assim, não podemos calcular o efeito causal em
nenhum dos dois grupos.
O que fazemos na prática? Tomamos a resposta fatual no grupo não tratado B,
Pr[DB0 ], para estimar a resposta contrafatual no grupo tratado A, Pr[DA0 ], caso ele
não tivesse sido infectado. Assim, para calcular o efeito causal teremos que assumir
como pressuposto que a resposta potencial fatual observada no grupo não exposto B,
Pr[DB0 ], seja igual à resposta contrafatual não observada no grupo exposto A, Pr[DA0 ],
ou seja, que Pr[DB0 ] = Pr[DA0 ]. Ou seja, os indivı́duos não tratados observados no
grupo B são iguais aos indivı́duos tratados do grupo A, caso eles não tivessem sido
expostos (Greenland et al., 1999; Jewell, 2004). Isto é assumir que os indivı́duos dos
dois grupos são permutáveis entre si, e que tanto faz se pessoas do grupo A ou do
grupo B tivessem sido tratadas, isto não interferiria nas suas respostas potenciais. Se A
e B são permutáveis, a exposição ou o tratamento ao qual o indivı́duo foi submetido
não interfere nas respostas potenciais (T ⊥ RP, onde RP são as respostas potenciais).
Desta forma, confundimento também pode ser definido como a dependência entre a
exposição e as respostas potenciais (T 6⊥ RP).
Tabela 6.7.: Estimação do efeito causal

Tratamento População Tratada A População Não Tra- Pressuposto
tada B
T=1 Pr[DA1 ] Pr[DB1 ]
T=0 Pr[DA0 ] Pr[DB0 ]
Efeito Pr[DA1 ]-Pr[DA0 ] Pr[DB1 ]-Pr[DB0 ]
Causal
Associação Pr[DA1 ]-Pr[DB0 ] Pr[DB0 ]=Pr[DA0 ]
Respostas fatuais destacadas em negrito
Quando desejamos saber se a exposição causa o desfecho a melhor forma de se

investigar isto seria por meio de um estudo experimental randomizado. A partir de
sorteio aleatório, um grupo de indivı́duos seria exposto à intervenção, e um outro grupo,
também sorteado, não seria exposto e funcionaria como grupo controle. Como a inter-
venção foi randomizada, há alta probabilidade, mais alta quanto maior for o tamanho
107
dos grupos, de que as variáveis pré-tratamento, que podem causar confundimento,

tanto as observadas, quanto as não observadas, estejam balanceadas nos dois grupos.
Desta forma, associação seria igual a causa. A associação é uma medida condicional de
efeito, obtida comparando-se grupos, contrastando-se a probabilidade de ocorrência do
desfecho, dado que ocorreu a exposição, com a probabilidade de ocorrência do desfecho,
dado que não ocorreu a exposição (Equação 6.3). O efeito causal é uma medida marginal
de efeito, obtida a partir da comparação da probabilidade de ocorrência do desfecho
no mesmo grupo: quando o grupo foi exposto (fatual) com o que teria ocorrido caso o
mesmo grupo não tivesse sido exposto (contrafatual) ou vice-versa (quando também o
grupo não foi exposto (fatual) com o que teria ocorrido caso o mesmo grupo tivesse sido
exposto (contrafatual) (Equação 6.4). Se o grupo não exposto for um bom substituto
para representar o que teria ocorrido com o grupo exposto, caso ele não tivesse sido
exposto, a medida de associação será igual à medida de causa. No estudo randomizado
sem perdas ou falta de aderência, com grande tamanho amostral, é alta a probabilidade
disto ocorrer. Entretanto, mesmo neste caso, podem ainda restar diferenças aleatórias
entre os grupos de tratamento e controle.
Associação é o que vemos, observamos em condições estáticas. Causa é o resultado
de uma intervenção, que muda as condições iniciais, a partir de uma manipulação por
forças externas (Pearl, 2001).
Medida de associação (condicional, em dois grupos)

P r[D = 1|T = 1] − P r[D = 1|T = 0] (6.3)
Medida de efeito causal(marginal, em um grupo)
P r[DT =1 = 1] − P r[DT =0 = 1] (6.4)
Entretanto, nos estudos observacionais, como não há permutabilidade marginal entre
os grupos devido à causa ou causas comum(ns) a medida de associação condicional
difere da medida de efeito causal marginal, o que provoca confundimento. Assim,
confundimento não é a diferença entre uma medida de associação marginal entre T
e D, como, por exemplo, a razão de risco bruta (RRT D = Pr[D=1 | T=1] / Pr[D=1
| T=0]) e uma medida de associação entre T e D, condicional a C (confundidor,
RRT D|C = Pr[D=1 | T=1, C] / Pr[D=1 | T=0, C]) ou a V (conjunto de variáveis
confundidoras, RRT D|S = Pr[D=1 | T=1, V] / Pr[D=1 | T=0, V])), como a razão de
risco ponderada a partir das médias dos estratos. Confundimento não é sinônimo de
colapsibilidade da medida de associação. Confundimento é a diferença entre a medida de
efeito, RRT D marginal causal = Pr[DT =1 =1] / Pr[DT =0 =1], e a medida de associação
RRT D marginal= Pr[D=1 | T=1] / Pr[D=1 | T=0] (Jewell, 2004). Entretanto, pela
impossibilidade de se estimar a resposta contrafatual no grupo exposto, caso ele não
tivesse sido exposto, no cálculo do RRT D marginal causal = Pr[DT =1 =1] / Pr[DT =0 =1],
assumindo-se permutabilidade entre os grupos, substituı́mos Pr[DT =0 =1] por Pr[D=1 |
T=0] e calculamos, de fato, RRT D = Pr[DT =1 =1] / Pr[D=1 | T=0] (Tabela 6.8).
Vamos, agora demonstrar dois exemplos, contrastando os critérios associacional e
gráfico de identificação de confundimento. Veremos que, na maioria das situações os dois
108
Tabela 6.8.: Definições associacional e estrutural de confundimento

Definição Associacional
Em que se baseia Não colapsibilidade da medida de associação
Fórmula RRT D 6= RRT D|C
Pr[D=1 | T=1] / Pr[D=1 | T=0]) 6= Pr[D=1 | T=1, C] / Pr[D=1 | T=0, C]
Definição Estrutural
Em que se baseia Falta de permutabilidade marginal entre tratados e não tratados
Fórmula RRT D marginal causal 6= RRT D
Pr[DT =1 =1] / Pr[D=1 | T=0] 6= Pr[D=1 | T=1] / Pr[D=1 | T=0]
critérios concordam, mas há situações em que eles discordam e, se utilizarmos somente
o critério associacional, acabarı́amos realizando ajuste para colisor, provocando, assim,
viés de colisão.
Na figura 6.3 está representado o confundimento numa perspectiva associacional.
Note que no diagrama não usamos setas direcionadas, para destacar que estamos
lidando apenas com associações estatı́sticas. A pergunta é se café causa infarto. A
questão é se o fumo seria um confundidor desta associação. O fumo cumpre os três
requisitos necessários para identificar um confundidor: está associado com a doença
entre os não expostos (os que não bebem café), com a doença na população de origem
dos casos (em toda a coorte) e não é uma variável descendente da exposição ou do
desfecho, não sendo, portanto, um mediador da relação causal entre T e D. Em vários
estudos, há diferença entre a estimativa marginal e a condicional ao fumo do RRT D .
Portanto, pelo critério associacional o fumo é um fator de confusão da relação causal
entre café e infarto.
Figura 6.3.: Viés de confundimento numa perspectiva associacional
C - Fumo
T - Café D - Infarto
Na figura 6.4 está representada a mesma estrutura de confundimento, retratada com

critérios associacionais na 6.3, agora numa perspectiva estrutural. Representamos o nosso
conhecimento acumulado, em termos de relações causais e, agora, cada seta direcionada
representa um caminho causal. Deduzimos que, no processo que gerou os dados, o fumo
é causa de infarto. Apesar de fumo e café estarem associados marginalmente, assumimos
que ambos foram causados por determinados fatores sociais e de personalidade não
observados, que denominamos C. Estes fatores sociais e de personalidade são, portanto,
109
causa comum dos hábitos de fumar e de beber café. Tanto o fumo - DC quanto o café -
T são descendentes do confundidor C. Notamos que há um caminho aberto pela porta
de trás T ← C → DC → D. Usando-se o critério da porta de trás, vemos que este
caminho pode ser bloqueado condicionando-se por C ou DC. Como normalmente C não
é medido, a solução seria condicionar para DC. Neste diagrama, por motivos diferentes,
o conceito associacional acerta também. No entanto, o verdadeiro confundidor, a causa
comum de T e D seria C e não o fumo.
Figura 6.4.: Viés de confundimento numa perspectiva estrutural
DC - Fumo
C - Fatores sociais e de personalidade D - Infarto
T - Café
6.4. Viés M
Apresentamos, na figura 6.5, um exemplo quando a definição tradicional ou associacional
de confundimento falha (Elwert, 2013; Greenland et al., 1999; Hernan and Robins,
2018). Usando-se o critério associacional, o colisor seria identificado como potencial
confundidor: está associado com T e com D e não é descendente de T ou de D. Entretanto,
como vimos no capı́tulo 5, quando um caminho contém um colisor, este caminho está
bloqueado e nenhuma intervenção no sistema precisa ser feita pelo pesquisador. Se
condicionarmos para o Colisor, será aberto um fluxo de associação pela porta de trás
que enviesará nossa estimativa de efeito causal. Devido ao formato do gráfico este tipo
de viés de colisão é denominado de viés M. Este é um dos exemplos que ilustra o fato
de que o confundimento é um conceito causal e que só poderá ser desvelado com base
numa combinação de pressupostos teóricos acerca do mecanismo de geração de dados,
codificados em um DAG e de avaliação empı́rica a partir dos dados.
6.5. Estruturas comuns de confundimento

Vamos ilustrar agora as estruturas mais comuns de confundimento encontradas em
DAGs e qual a ação necessária do pesquisador para recuperar a permutabilidade diante
destas estruturas. Já vimos que a utilização de critérios de identificação de propriedades
de confundidores individualmente não funcionam bem muitas vezes, pois quando o
confundimento é múltiplo, é difı́cil desvelar as relações entre as variáveis em associações
bivariadas entre C e T, e entre C e D. Desta forma, uma visão destas relações entre
variáveis, a partir do nosso conhecimento prévio, é fundamental para se verificar a
110
6.5. Estruturas comuns de confundimento
Figura 6.5.: DAG - Viés M - Colisor no caminho pela porta dos fundos
A B
Colisor
T D
ocorrência de uma causa comum e se há caminho aberto pela porta de trás, que precise
ser bloqueado por meio de uma intervenção do pesquisador no sistema.
Na figura 6.6 vemos uma estrutura simples de garfo, representando causa comum,
onde C é causa comum direta, tanto de T quanto de D. Há um caminho aberto pela
porta dos fundos T ← C → D. Nesta estrutura, condicionamento para C desvela o
efeito causal.
Na figura 6.7 vemos uma estrutura de garfo com mediação, onde C é causa comum
direta de D, e indireta de T, por meio de A. Há um caminho aberto pela porta dos
fundos T ← A ← C → D, sendo necessário bloqueá-lo para que o efeito causal seja
identificado. Nesta estrutura, condicionamento para A ou C (ajuste mı́nimo suficiente)
ou para A e C seriam recomendados para identificação, sem viés, do efeito causal.
Na figura 6.8 temos também uma estrutura de garfo com mediação. Nesta estrutura,
C é causa comum direta de T, e indireta de D, mediada por B. O caminho pela porta
dos fundos T ← C → B → D está aberto. Nesta estrutura, condicionamento para B ou
C (ajuste mı́nimo suficiente) ou para B e C seriam necessários para identificação, sem
viés, do efeito causal.
Finalmente, na figura 6.9 vemos uma estrutura de garfo com mediação, onde C é
causa comum indireta, tanto de D, por meio de B, quanto de T, por meio de A. O
caminho não causal aberto pela porta dos fundos T ← A ← C → B → D precisa ser
fechado. Nesta estrutura, condicionamento para A, B ou C (ajuste mı́nimo suficiente)
ou para A e B, A e C, B e C ou A, B e C seriam indicados para identificação do
efeito causal. Note que, usando-se analogia com o fluxo da água em uma tubulação, a
interrupção do fluxo de associação pode ser realizado em qualquer ponto do sistema,
para que o fluxo de associação não espúrio, que flui pela porta de trás, seja fechado.
A forma de se atingir a identificação do efeito causal é bloquear todos os fluxos de
associação espúrios que fluem pela porta de trás, em caminhos não bloqueados por
colisores, deixando aberto os fluxos causais de associação entre T e D, que fluem pela
porta da frente.
111
Figura 6.6.: DAG - Viés de confundimento - C como causa comum direta de T e D
Figura 6.7.: DAG - Viés de confundimento - C como causa comum indireta de T via A
e direta de D
A C
T D
6.6. Exemplo de viés de confundimento com

intervenção no DAG por meio do operador .do
Na figura 6.10 vemos um exemplo de viés de confundimento. Queremos saber se
caracterı́sticas do atendimento em duas UTIs A e B causam mortalidade. Se a internação
na UTI pudesse ter sido randomizada, provavelmente os grupos que teriam internado na
UTI A ou B seriam comparáveis entre si. Entretanto, sabemos que a internação na UTI
é primariamente determinada pela gravidade do paciente. Assim, uma determinada
UTI pode receber maior proporção de pacientes graves do que outra e, por isto, ter
maior mortalidade. Neste caso o excesso de óbitos não seria devido a caracterı́sticas do
atendimento na UTI. Por outro lado, também sabemos que a gravidade do paciente
aumenta as chances de morte. Estamos diante de uma causa comum: a gravidade do
paciente provoca a internação na UTI e também aumenta o risco de morte. Assim,
pacientes graves estão desigualmente distribuı́dos nos grupos que internaram na UTI A
ou B: no grupo que internou na UTI A, por exemplo, há um excesso de pacientes graves,
o que faz com que os grupos não sejam permutáveis entre si e provoca confundimento.
Dito em outras palavras, os pacientes internados na UTI não são semelhantes aos
internados na UTI B e, portanto, não são permutáveis entre si. Na UTI A há uma
maior proporção de pacientes graves do que na UTI B. Assim, a comparação marginal
entre internados nas duas UTIs provocará uma conclusão errada acerca do efeito causal:
pacientes internados na UTI A morrem mais, mas a causa da morte pode não ser as
112
6.7. Conclusão
Figura 6.8.: DAG - Viés de confundimento - C como causa comum direta de T indireta
de D via B
C B
T D
Figura 6.9.: DAG - Viés de confundimento - C como causa comum indireta de T via A
e indireta de D via B
A B
T D
caracterı́sticas da atenção prestada no hospital, mas a gravidade do paciente. Assim,

para estimar, sem viés, o efeito causal das caracterı́sticas do atendimento da UTI
na mortalidade, em um estudo observacional, precisamos fazer uma intervenção no
gráfico, para tentar ”isolar”o efeito da UTI do efeito da gravidade do paciente. Esta
intervenção ”cirúrgica”no gráfico é representada, nos trabalhos de Judea Pearl, pelo
operador do(.) (Pearl et al., 2016). Esta intervenção ”simulada”é feita apagando-se
a seta que sai do confundidor, gravidade do paciente, para o tratamento, internação
na UTI. Ao apagar a seta, criamos dois gráficos mutilados, simulando intervenções:
um com o tratamento (T=0) e outro com o tratamento (T=1). O operador do indica
intervenção do pesquisador no gráfico. Veremos, no capı́tulo XX, como estimar o efeito
causal a partir desta ”intervenção simulada”no gráfico.
6.7. Conclusão
Na figura 6.9 resumimos as definições associacional e estrutural de confundimento.
Vimos que, muitas vezes, as duas definições chegam à mesma conclusão. Entretanto,
quando elas discordam é a definição estrutural que sempre acerta. Assim, vimos que
realizar inferência causal a partir de dados observacionais requer pressupostos causais
derivados do conhecimento prévio. Derivar a necessidade de ajuste a partir de associações
113
Figura 6.10.: Viés de confundimento
T D
T=UTI; D=mortalidade; C=gravidade
Figura 6.11.: Gráfico mutilado demonstrando o operador do(.) para os dois valores do
tratamento T
C C
do(T=0) T D do(T=1) T D
T=UTI; D=mortalidade; C=gravidade

O quadrado desenhado em volta de T indica
que foi realizada intervenção nesta variável
detectadas nos dados empı́ricos pode levar a erros. Portanto, é impossı́vel decidir sobre
a ajuste com base em critérios puramente associacionais. A análise causal requer uma
mistura de dados e pressupostos, mas toda inferência causal é sempre condicional a
estes pressupostos (Pearl, 2001). Dito em outras palavras, só é possı́vel decidir qual o
conjunto mı́nimo de ajuste a partir de um entendimento teórico da estrutura causal
subjacente .
De acordo com Morgan and Winship (2015) é preciso mudar a perspectiva de análise
dos confundidores para o critério da porta dos fundos. A estrutura de confundimento
geralmente não é simples, pois, na maioria dos casos não existe apenas um confundidor
para que as regras de identificação possam funcionar, mesmo com os reparos mencionados
(Rothman 2008). Nos gráficos, as variáveis tem vários caminhos que as conectam e estes
caminhos são compostos por uma variedade de cadeias, garfos e colisores (Pearl 2016).
Assim, somente com a aplicação do critério da porta de trás, assumindo-se que não há
confundidor omitido (pressuposto quase sempre irrealista), será possı́vel se identificar
um conjunto mı́nimo de ajuste para confundimento e identificar o efeito causal.
114
6.8. Métodos de ajuste para confundimento
Tabela 6.9.: Definições associacional e estrutural de confundimento

Associacional Estrutural
Confundidor está associado com a ex- Confundidor é causa comum
posição
Confundidor é fator de risco para o des- Há caminho aberto pela porta de trás
fecho
Confundidor não é descendente do tra-
tamento ou da doença
Há diferença entre a medida de asso-
ciação marginal e condicional
A partir da construção do DAG e da aplicação do critério da porta de trás, podemos

detectar três situações de identificabilidade do efeito causal. Pode não haver causa
comum. Neste caso não há confundimento. O efeito causal pode ser identificado a partir
do cálculo do RRT D . Esta situação equivale a um ensaio clı́nico randomizado sem
falhas. Na segunda situação há causa()s comum(ns) e, a partir das variáveis observadas
V é possı́vel bloquear todos os caminhos abertos pela porta de trás. Por meio de
condicionamento para estas variáveis V (RRT D|V ) será possı́vel também identificar
o efeito causal. Entretanto, se há causa(s) comum(ns) mas, a partir das variáveis
observadas, não é possı́vel bloquear todos os caminhos abertos pela porta dos fundos o
efeito causal não é identificável.
Mesmo nas situações de identificabilidade listadas acima, restam questões abertas.
Como determinar que o ajuste foi suficiente? Como garantir que todos os confundidores
foram identificados e que não há confundimento por variável omitida?
Em resumo, o grande problema é que geralmente nosso conhecimento é insuficiente
para desenhar um DAG que possa ser usado para determinar qual o conjunto mı́nimo
de variáveis de ajuste que possam produzir permutabilidade condicional. É muito difı́cil
saber todos os fatores que influenciam as decisões de tratamento.
Assim, todo processo de ajuste para confundimento é uma tentativa. É quase inevitável
que reste algum confundimento residual. As regras baseadas em um único confundidor
só funcionam em casos mais simples, o critério da porta de trás funcionará em alguns
casos, mas em muitos casos a medida de associação será diferente da medida de causa
e, apesar de todas as tentativas, persistirá o viés. Nestes casos, outros métodos de
identificação do efeito causal, que não utilizam condicionamento para variáveis podem
ser utilizados (variável instrumental, uso de mecanismos, delineamento de regressão
descontı́nua - regression descontinuity design) (Morgan and Winship, 2015).
6.8. Métodos de ajuste para confundimento

O método de ajuste ideal para confundimento é a randomização, mas esta só é viável
em estudos experimentais, que só podem ser realizados quando a exposição e/ou o
tratamento sejam benéficos, por motivos éticos (Gordis, 2014).
115
Para se avaliar o efeito de exposições causadoras de doenças temos que lançar mão
de estudos observacionais, nos quais, na maioria das vezes, não há permutabilidade
entre os grupos. Precisamos, então, usar o nosso conhecimento prévio para identificar
um conjunto mı́nimo de variáveis de ajuste para confundimento e usar métodos capazes
de minimizar este viés.
Os procedimentos de controle de confundimento podem ser divididos em métodos
baseados em estratificação e métodos generalizados (Hernan and Robins, 2018). Os
métodos baseados em estratificação são os mais usados e abrangem estratificação,
restrição, regressão e pareamento. Os métodos generalizados incluem a padronização,
a fórmula G-paramétrica, ponderação pelo inverso da probabilidade de seleção em
modelos estruturais marginais e estimação G em modelos estruturais aninhados. Nos
próximos capı́tulos veremos, em detalhes e com exemplos práticos, o uso de alguns destes
métodos. Na tabela ?? abaixo apresentamos um resumo destes métodos, dividindo-os
em não paramétricos e paramétricos ou semi-paramétricos.
Tabela 6.10.: Métodos para controle de confundimento
Baseados em estratificação Generalizados

Não paramétricos Paramétricos ou Não Paramétricos ou
semiparamétricos paramétricos semiparamétricos
Estratificação Regressão Padronização Fórmula G pa-
ramétrica
Restrição Modelos estru-
turais marginais
(Ponderação
pelo inverso da
probabilidade de
seleção)
Pareamento Modelos estrutu-
rais aninhados
(Estimação G)
Escore de propensãoa
a
O escore de propensão pode ser estimado de forma não paramétrica, paramétrica ou
semiparamétrica.
6.9. Exercı́cios
1. Charig et al. (1986) compararam a taxa histórica de sucesso na remoção de cálculos
renais da cirurgia aberta versus a nefrolitotomia percutânea. Observaram que a
cirurgia aberta foi bem sucedida em 78% dos casos, enquanto a nefrolitotomia
percutânea teve uma taxa de sucesso mais elevada, de 83%. Entretanto, quando
observaram os resultados estratificando pelo tamanho dos cálculos renais, para os
116
6.9. Exercı́cios
cálculos menores que 2 cm, a taxa de sucesso da cirurgia aberta (93%) foi maior
do que a da nefrolitotomia (87%). Da mesma forma, para cálculos maiores ou
iguais a 2 cm, a cirurgia aberta também foi mais bem sucedida (73%) do que
a nefrolitotomia (69%). Como você explicaria que no conjunto a nefrolitotomia
apresentou maior taxa de sucesso, mas separadamente para cálculos maiores e
menores o resultado foi revertido e o sucesso da cirurgia aberta foi superior? Na
sua resposta, desconsidere a probabilidade de erro aleatório.
2. Construa um DAG para organizar o conhecimento teórico a respeito do problema

descrito por Charig et al. (1986).
3. Na tabela 6.11 estão mostrados os dados do estudo de Charig et al. (1986). Usando
o arquivo charig.dta, e os comandos utilizados no exemplo resolvido do paradoxo
de Simpson 6.1.2, calcule a razão de risco em cada estrato e a razão de risco bruta
e ajustada. Alternativamente você pode realizar os cálculos no programa OpenEpi
(de domı́nio público, disponı́vel na página http://www.openepi.com). Clique no
menu à esquerda em Cálculos, Tabela 2 x 2. Depois clique em Entrar dados
e digite os dados para o estrato 1 (C=1). Em seguida clique no botão Adicionar
Estrato e digite os dados para o estrato 2 (C=0). Finalmente clique no botão
Calcular.
4. Há interação, ou seja, a razão de risco foi diferente nos estratos com cálculos
menores e maiores? Leve também em conta na sua resposta o resultado do teste
de heterogeneidade.
5. Há confundimento? Há causa comum? Há caminho aberto pela porta de trás no
DAG que você desenhou?
6. Usando o critério da não colapsibilidade para avaliar a presença de confundimento,

há diferença entre a razão de risco bruta e ajustada?
7. Em conclusão, qual dos procedimentos cirúrgicos teve maior taxa de sucesso? Em

quais critérios você baseou a sua resposta?
8. Na tabela 6.12 estão apresentados os coeficientes de mortalidade especı́ficos por

faixa etária e geral nas cidades de São Luı́s e Porto Alegre. Qual das duas cidades
apresentou maior coeficiente de mortalidade geral?
9. Se poderia concluir, com base no coeficiente de mortalidade geral, que uma cidade
tem maior risco de mortalidade do que a outra? Por quê?
10. Inspecionando os coeficientes de mortalidade especı́ficos por faixa etária, a sua

conclusão continuaria a mesma ou mudaria? Por quê?

retratado na tabela 6.12.
12. Há confundimento por idade?
117
13. Com base no DAG, você escolheria os coeficientes especı́ficos de mortalidade por
faixa etária ou o coeficiente de mortalidade geral para embasar a sua conclusão?
14. Qual das duas cidades, São Luı́s ou Porto Alegre, apresenta maior risco de
mortalidade?
Tabela 6.11.: Taxa de sucesso da cirurgia aberta e da nefrolitotomia percutânea no

tratamento de cálculos renais
C=1 (<2 cm)
D=1 % Sucesso D=0 Total
T=1 234 87 36 270
T=0 81 93 6 87
Total 315 88 42 357
C=0 (≥2 cm)

T=1 55 69 25 80
T=0 192 73 71 263
Total 247 72 96 343
Total
T=1 289 83 61 350
T=0 273 78 77 350
Total 562 80 138 700
T=1 Nefrolitotomia percutânea
T=0 Cirurgia aberta
Fonte: Charig et al. (1986)
118
6.10. Apêndice - Interação e modificação de efeito
Tabela 6.12.: Coeficientes de mortalidade especı́ficos por faixa etária e geral em São
Luı́s e Porto Alegre, 2015
São Luı́s Porto Alegre
Coeficiente de mortalidade
Coeficiente de mortalidade
mortalidade em São Luı́s

Razão do excesso de
População residente
População residente
Número de óbitos
Número de óbitos
Faixa etária
por mil
por mil
0a4 328 85.023 3,86 211 85.004 2,48 1,55
5a9 25 87.255 0,29 19 86.585 0,22 1,31
10 a 14 36 91.791 0,39 40 101.110 0,40 0,99
15 a 19 206 88.450 2,33 169 103.528 1,63 1,43
20 a 29 527 206.505 2,55 401 223.411 1,79 1,42
30 a 39 475 197.950 2,40 500 255.554 1,96 1,23
40 a 49 502 137.303 3,66 662 178.861 3,70 0,99
50 a 59 647 94.333 6,86 1.313 187.645 7,00 0,98
60 a 69 835 51.017 16,37 1.873 136.345 13,74 1,19
70 a 79 1.033 22.864 45,18 2.302 74.591 30,86 1,46
≥80 1.520 11.402 133,31 3.819 44.232 86,34 1,54
Total 6.141 1.073.893 5,72 11.328 1.476.866 7,67 0,75
6.10. Apêndice - Interação e modificação de efeito

Dizemos que há interação entre dois fatores quando o efeito conjunto destes dois fatores
difere dos efeitos individuais de cada fator. Assim, a interação pode ser detectada
inspecionando-se a medida de associação em cada um dos estratos de uma terceira
variável C e verificar se a razão de risco em cada um dos estratos é igual ou diferente da
razão de risco na amostra total não estratificada. No exemplo da tabela 6.13, podemos
verificar que a razão de risco em cada um dos estratos (C=1 ou C=0) é igual a 2. Vemos
também que a razão de risco na amostra total (estimativa marginal ou não condicional)
também é igual a 2. Neste caso, então, não há interação.
A situação é diferente na tabela 6.14. O risco no estrato C=1 é igual a 0,50, enquanto
o risco no estrato C=0 é igual a 2. Portanto os riscos são diferentes em cada estrato,
confirmando a presença de interação. O risco na amostra total é 1,14. Entretanto, na
presença de interação, não faz sentido interpretar o risco total, pois na presença de
C o tratamento exerce um efeito protetor, enquanto na ausência de C o tratamento é
maléfico. Se considerarmos que na amostra total o tratamento é maléfico, não estarı́amos
percebendo o fato de que na presença de C o tratamento reduz a ocorrência do desfecho,
119
Tabela 6.13.: Exemplo 1- Ausência de interação

C=1 C=0
T=1 16 64 80 T=1 24 96 120
T=0 8 72 80 T=0 12 108 120
Total 24 136 160 Total 36 204 240
RRT D|C=1 = 2,00 RRT D|C=0 = 2,00
Total
D=1 D=0 Total
T=1 40 160 200
T=0 20 180 200
Total 60 340 400
RRT D = 2,00
RR=Razão de Risco
e que apenas na ausência de C o tratamento é maléfico3 .
Tabela 6.14.: Exemplo 2. Interação

C=1 C=0
T=1 8 72 80 T=1 24 96 120
T=0 16 64 80 T=0 12 108 120
Total 24 136 160 Total 36 204 240
RRT D|C=1 = 0,50 RRT D|C=0 = 2,00
Total
D=1 D=0 Total
T=1 32 168 200
T=0 28 172 200
Total 60 340 400
RRT D = 1,14
RR=Razão de Risco
3 Para simplificar a questão, estamos considerando apenas a estimativa pontual, ignorando a pos-
sibilidade de que a razão de risco possa ser maior ou menor do que 1 apenas por acaso. Não
estamos prevendo a possibilidade de erro aleatório. Numa situação real, estas conclusões têm que
ser baseadas também na observação dos intervalos de confiança.
120
7. Viés de colisão
7.1. Viés de Berkson
Berkson, em 1946, publicou um artigo para tentar responder a uma pergunta da época: a
colecistite, inflamação da vesı́cula biliar, causa diabetes? A partir de dados provenientes
de estudos com pacientes internados em hospitais, se notou uma associação entre as
duas condições. Alguns cirurgiões começaram, inclusive, a indicar a retirada da vesı́cula
como tratamento para o diabetes. Apesar de Berkson ter analisado dados hipotéticos,
as tabelas apresentadas no seu artigo mimetizam o que vinha sendo observado com
base em dados reais (Berkson, 1946).
No seu artigo, Berkson ilustra um desenho de estudo caso-controle. Os casos são
pacientes diabéticos e os controles são pacientes com erros de refração, que procuraram
o hospital para atendimento. Pacientes com erros de refração foram escolhidos para
compor o grupo controle pois, a princı́pio, esta condição não se relaciona com o diabetes.
A colecistite ocorreu mais frequentemente no grupo de pacientes com diabetes (8,6%)
do que no grupo de pessoas com erros de refração (4,7%). O odds ratio foi de 1,89.
Portanto, os dados sugerem que a colecistite está associada com o diabetes (Tabela 7.1,
parte superior).
Vejamos agora o que ocorreria se toda a população tivesse sido estudada, ao invés
apenas quem procurou assistência hospitalar. Na parte inferior da tabela 7.1, vemos que
o percentual de diabéticos que apresentavam colecistite na população geral (3,0%) foi
idêntico ao percentual de pacientes com erros de refração que tinha colecistite (3,0%).
O odds ratio foi de 1,00, indicando que não há associação entre colecistite e diabetes a
nı́vel populacional. Berkson também demonstrou não haver associação entre colecistite e
diabetes ao examinar os dados apenas das pessoas que não tinham procurado o hospital
(OR=1,00, parte central da tabela 7.1). Assim, como explicamos que, ao considerar
apenas os pacientes que procuraram o hospital, encontramos associação entre colecistite
e diabetes e, quando analisamos toda a população, esta associação desaparece?
A resposta está nas diferentes probabilidades de ir ao hospital para as diferentes
doenças e combinações de doenças. A probabilidade de procurar o hospital depende de
fatores como nı́vel socioeconômico, existência de serviço de diagnóstico e tratamento
para a doença, reputação do hospital, dentre outros fatores. Além disso, se o indivı́duo
tiver mais de uma doença, a probabilidade de hospitalização é maior do que se a pessoa
tiver apenas uma doença. No exemplo de Berkson, a probabilidade de hospitalização
foi maior para os pacientes que tinham diabetes e colecistite (626/3000 x 100 =
20,9%) do que para aqueles que apresentavam apenas diabetes e não tinham colecistite
(6693/97000 x 100 = 6,9%). A probabilidade de procurar o hospital entre os controles
também foi maior para os que tinham colecistite e erros de refração (9504/29700
121
x 100 = 32,0%) do que para aqueles que apresentavam apenas erros de refração
(192060/960300 x 100 = 20,0%). Dessa forma, tanto a colecistite quando o diabetes
aumentam as probabilidades de hospitalização e esta probabilidade é maior quando as
duas condições estão combinadas, do que quando estas ocorrem separadamente. Isto
cria uma associação entre colecistite e diabetes entre as pessoas hospitalizadas. Esta
associação não se deve, então, a um efeito causal da colecistite no diabetes, mas é devido
a diferentes probabilidades de hospitalização. Como foram incluı́das apenas pessoas
que procuraram o hospital no estudo, a forma como os indivı́duos foram selecionados
gerou viés. Por isto, tradicionalmente, o viés de Berkson é considerado uma forma de
viés de seleção (Pearce and Richiardi, 2014; Westreich, 2012).
Tabela 7.1.: Viés de Berkson

Hospitalizados (H=1)
Casos (D=1) Controles (D=0) Total
Colecistite (T=1) 626 9504 10130
% Colecistite 8,6 4,7 4,8
Sem colecistite (T=0) 6693 192060 198753
Total 7319 201564 208883
RRT D|H=1 = 1,89
Não hospitalizados (H=0)

Colecistite (T=1) 2374 20196 22570
Total 92681 788436 881117
RRT D|H=0 = 1,00
População Geral (H)

Colecistite (T=1) 3000 29700 32700
Total 100000 990000 1090000
RRT D = 1,00
Fonte: Berkson (1946)
Vejamos agora, como representar esta situação em um DAG. Tanto a colecistite

quanto o diabetes aumentam as probabilidades de hospitalização. Representamos esta
situação com setas partindo da colecistite e do diabetes para a hospitalização. Mesmo
que colecistite e diabetes não estejam associados na população geral, como é o caso no
exemplo de Berkson, ao se condicionar indevidamente por um colisor (Hospitalização
= 1), surge uma associação espúria entre colecistite e diabetes. No DAG existem dois
122
7.2. Conceito
caminhos pela porta da frente, um potencialmente causal, ligando Colecistite e Diabetes

(Colecistite → Diabetes) e outro espúrio, não causal, que foi aberto a partir da restrição
por um colisor (Colecistite → Hospitalização ← Diabetes). Como vimos no capı́tulo 5,
viés de colisão é sinônimo de viés de seleção (Hernan et al., 2004).
Figura 7.1.: DAG ilustrando o viés de Berkson como viés de colisão
Diabetes
Hospitalização (H=1)
Colecistite
O quadrado desenhado em volta da variável Hospitalização indica condicionamento.

A linha interrompida conectando Colecistite e Diabetes indica associação espúria,
induzida por condicionamento indevido por um colisor
7.2. Conceito
Viés de seleção é o viés causado pela forma como os indivı́duos são selecionados
para análise. A partir de uma determinada população alvo, apenas uma amostra desta
população é selecionada ou se auto-seleciona para estudo e esta parcela selecionada difere
em vários aspectos da população alvo, o que gera viés (Rothman et al., 2008; Hernan and
Robins, 2018). É sinônimo de viés de colisão que, numa definição estrutural, significa
condicionamento indevido por um efeito comum do tratamento e do desfecho. Este viés
ocorre também quando o condicionamento indevido for feito por um descendente do
colisor e também quando a variável colisora for um efeito comum de uma causa do
tratamento e de uma causa do desfecho. Assim, viés de colisão surge toda vez que se
realizar um condicionamento indevido para um colisor ou descendente do colisor que
seja efeito comum de duas variáveis: uma sendo o tratamento ou causa do tratamento
e a outra sendo o desfecho ou causa do desfecho (Hernan et al., 2004; Hernan and
Robins, 2018). A consequência é que a associação entre o tratamento e o desfecho entre
os selecionados para análise difere da associação que seria observada entre todos os
elegı́veis para o estudo (RRAT D|C 6= RRCT D , onde RRA=Risco Relativo Associacional,
RRC=Risco Relativo Causal). Como a associação entre os selecionados difere da que
seria observada entre os elegı́veis, isto provoca falta de permutabilidade entre os tratados
e os não tratados no grupo selecionado para estudo (Hernan and Robins, 2018).
Um exemplo de viés de colisão/seleção pode ser demonstrado ao se estudar efeitos
de fatores perinatais, que podem provocar desfechos fetais adversos intra-útero, apenas
entre nascidos vivos. Por exemplo, desejamos saber se a suplementação com ácido fólico
é capaz de prevenir malformação cardı́aca. O ideal é que estudemos esta hipótese em
todas as gestações, incluindo aquelas terminadas em abortos, natimortos ou nascidos
123
vivos. Se estudarmos esta associação apenas em nascidos vivos, estaremos condicionando

via restrição, selecionando uma parte da população para estudo. Vejamos, no DAG da
figura 7.2, uma representação desta situação.
Figura 7.2.: DAG ilustrando o viés de colisão quando estudamos efeito de fatores
perinatais nos desfechos fetais adversos apenas em nascidos vivos
Malfomações Cardı́acas
Nascido vivo (C=1)
Suplementação com Ácido Fólico
O quadrado desenhado em volta da variável Nascido vivo indica condicionamento. A

linha interrompida conectando Suplementação com Ácido fólico e Malformações
Cardı́acas indica associação espúria, induzida por condicionamento indevido por um
colisor. Fonte: adaptado de Hernan and Robins (2018)
Sabemos que a suplementação com ácido fólico previne malformações do tubo neural,
o que reduz a probabilidade da gestação terminar em abortamento ou natimorto. Assim,
a suplementação com ácido fólico aumenta a probabilidade da gestação terminar em
nascido vivo, pois reduz abortamento e natimortalidade devidas a malformações do
tubo neural, daı́ a seta partindo da suplementação para nascido vivo. Por outro lado,
um feto com malformação cardı́aca tem menor probabilidade de nascer vivo do que ter
a gestação terminada em aborto ou natimorto. Por isso colocamos uma seta partindo
da malformação cardı́aca para nascido vivo. Vamos supor que a suplementação com
ácido fólico não esteja associada com redução do risco de malformação cardı́aca na
população geral de gestações (que possam ter resultado em abortos, natimortos ou
nascidos vivos). Neste caso, condicionar por nascido vivo pode gerar uma falsa associação
entre suplementação com ácido fólico e malformação cardı́aca nesta subpopulação. Ao
condicionarmos pela sobrevivência, estudando apenas nascidos vivos, estaremos abrindo
um caminho espúrio, não causal, entre Suplementação com ácido fólico → Nascido vivo
← Malformação cardı́aca, que estava fechado pelo colisor. Este é um exemplo de viés
de colisão pela porta da frente (Hernan and Robins, 2018).
7.3. Algumas causas de viés de colisão

O viés de colisão pode ser causado por vários motivos: perda diferencial de seguimento,
não resposta, uso de voluntários, estudo de doenças relacionadas ao trabalho apenas
em trabalhadores sadios, ajuste indevido por um colisor na análise estatı́stica, dentre
outras causas.
124
7.4. Exemplo numérico de viés de colisão - Dieta e risco de câncer não relacionado com a dieta
Quando há perda diferencial de seguimento em um estudo de coorte ou em um ensaio

clı́nico após a randomização, os não perdidos passam a não ser mais permutáveis com
os perdidos. Assim, a análise apenas dos dados dos acompanhados provoca viés de
colisão, pois, via restrição, esta será feita apenas em um dos estratos do estudo (o dos
acompanhados), que difere em uma ou mais variáveis do estrato dos não acompanhados.
Quando há não resposta a alguma variável do estudo por alguns participantes,
normalmente se tende a realizar a análise apenas incluindo as pessoas com dados
completos. Esta estratégia pode levar a viés de colisão, especialmente se o percentual
de dados perdidos for alto e houver diferenças nas outras variáveis entre aqueles com
informação incompleta e completa. Procedimentos de imputação múltipla de dados
estão indicados na tentativa de se reduzir esta causa de viés de colisão (Leite, 2017;
Enders, 2010).
Em estudos de saúde do trabalhador, é comum se estudar a doença apenas naqueles
que estão trabalhando. Se a doença for causa de absenteı́smo ou afastamento do trabalho,
os que continuam sadios e trabalham podem não ser permutáveis com aqueles que se
afastaram do trabalho, por causa da doença, em algumas das variáveis importantes
para o estudo. Este viés é denominado viés do trabalhador sadio.
O viés de colisão também pode surgir quando se inclui apenas voluntários em um
estudo (autoseleção), a partir de uma amostra de conveniência. Se os voluntários
não forem permutáveis com os não voluntários ocorrerá viés de seleção. Este viés é
denominado viés de voluntariado. É importante ressaltar que o uso de voluntários em
um ensaio clı́nico randomizado dificilmente provoca viés de colisão, pois a randomização
ocorre após a seleção dos indivı́duos para o estudo. Se a randomização conseguir
equilibrar os fatores prognósticos (variáveis pré-tratamento) nos grupos experimental e
controle, a ocorrência tanto de viés de confundimento, quanto de colisão, é improvável.
Entretanto, no ensaio clı́nico randomizado perdas de seguimento ou não resposta após
a randomização podem levar a viés de colisão.
7.4. Exemplo numérico de viés de colisão - Dieta e risco

de câncer não relacionado com a dieta
Hernan (2002) apresenta dados hipotéticos de um estudo para avaliar se fazer dieta
causa câncer não relacionado com a dieta. A variável de tratamento é estar fazendo
dieta e a variável desfecho é diagnóstico recente de câncer não relacionado com a dieta.
Vemos, na parte de baixo da tabela 7.2, que fazer dieta não causa câncer não relacionado
com a dieta (RRT D = 0,92 (0,71-1,21). Entretanto, se estudarmos esta associação
apenas entre aqueles que perderam peso recentemente, chegarı́amos à conclusão de que
fazer dieta é um fator de proteção para a ocorrência de câncer não relacionado com a
dieta (RRT D|C=1 = 0,79 (0,66-0,93). Como explicar este achado? Afinal de contas fazer
dieta protege ou não o indivı́duo de desenvolver câncer não relacionado com a dieta?
125
Tabela 7.2.: Viés de colisão

Perda recente de peso (C=1)
D=1 % Dieta D=0 Total
Dieta (T=1) 55 69% 25 80
Dieta (T=0) 70 88% 10 80
Total 125 78% 35 160
RRT D|C=1 = 0,79 (0,66-0,93)
Sem perda recente de peso (C=0)

Dieta (T=1) 45 38% 75 120
Dieta (T=0) 130 41% 190 320
Total 175 40% 265 440
RRT D|C=0 = 0,92 (0,71-1,21)
Total
Dieta (T=1) 100 50% 100 200
Dieta (T=0) 200 50% 200 400
Total 300 50% 300 600
RRT D = 1,00 (0,84-1,19)
Fonte: adaptado de Hernan (2002), com base em dados hipotéticos
Para ilustrar o exemplo numérico, vamos calcular as estimativa das razões de risco
bruta, nos estratos de C e combinada no Stata. Para isto, baixe o arquivo dieta.dta
da página da internet e utilize os seguintes comandos no Stata:
. use dieta
. expand n
. cs d t, by(c)
c RR [95% Conf. Interval] M-H Weight
0 .9230769 .7072926 1.204694 35.45455

1 .7857143 .6632972 .9307245 35
Crude 1 .843886 1.184994

M-H combined .8548387 .727778 1.004083
Note que não houve colapsibilidade da medida de associação (razão de risco). A

estimativa bruta (RRT D = 1,00) foi diferente da estimativa combinada (RRT D|C
= 0,85), o que poderia ser interpretado como viés de confundimento. O teste de
homogeneidade do RR sugere que as medidas não diferem nos estratos, ou seja, que
não há interação significante (p=0,2595).
126
7.4. Exemplo numérico de viés de colisão - Dieta e risco de câncer não relacionado com a dieta
Para responder a esta questão, é necessário que utilizemos, além dos dados, o nosso
conhecimento a respeito do problema. A princı́pio nos parece estranho que fazer dieta
possa proteger contra o risco de câncer não relacionado com a dieta. Esta associação nos
parece pouco plausı́vel de ser causal. O nosso conhecimento a respeito deste problema
está codificado no DAG da figura 7.3. Ora, tanto ter câncer não relacionado à dieta
como fazer dieta podem causar perda recente de peso. Assim, a perda recente de
peso é um efeito comum do câncer não relacionado com a dieta e de fazer dieta. Se
condicionarmos para o colisor, via restrição, estaremos abrindo um caminho pela porta
da frente que parte da Dieta no sentido da seta para Perda recente de peso e daı́, no
sentido contrário ao da seta, segue da variável Perda recente de peso para o desfecho
Câncer não relacionado com a dieta (Dieta → Perda Recente de Peso ← Câncer não
relacionado com a dieta). Vimos, no capı́tulo 5, que um caminho que contém um colisor
está fechado por definição e nele não passa associação espúria. Ao abrirmos este caminho
por meio de ajuste para o colisor, criamos uma associação espúria entre fazer Dieta e
Câncer não Relacionado com a Dieta. Se um indivı́duo que não fez dieta tiver perda
recente de peso, isto aumenta a probabilidade dele ter Câncer não relacionado com a
dieta. Da mesma forma, se um indivı́duo tiver perda de peso recente e soubermos que
ele foi diagnosticado com câncer, isto reduz a probabilidade dele ter feito dieta. Ou
seja, se, por meio de restrição, analisarmos a associação entre fazer dieta e câncer não
relacionado com a dieta apenas entre os que tiveram perda recente de peso, estaremos
gerando uma falsa associação negativa entre fazer dieta e câncer não relacionado com a
dieta. O conhecimento do efeito comum das duas variáveis, via restrição, nos permite
deduzir algo a respeito do passado. Por isso nunca devemos condicionar para um colisor.
Figura 7.3.: DAG ilustrando viés de colisão quando condicionamos para perda de peso
em estudo sobre efeito da dieta em câncer não relacionado com a dieta
Câncer não relacionado à dieta
Perda recente de peso (C=1)
Dieta
O quadrado desenhado em volta da variável Perda recente de peso indica

condicionamento. A linha interrompida conectando Dieta e Câncer não relacionado à
dieta indica associação espúria, induzida por condicionamento indevido por um colisor.
Fonte: adaptado de Hernan (2002)
Usaremos então, a razão de risco bruta para interpretar os dados deste estudo,
concluindo que não há associação entre dieta e câncer não relacionado com a dieta.
A não colapsibilidade da medida de associação seria causada por viés de colisão, se
fosse realizado condicionamento indevido para o colisor perda recente de peso. Este
127
exemplo ilustra que o viés de colisão também causa não colapsibilidade da medida de
associação, tal como o viés de confundimento. Sendo assim, a não colapsibilidade só
pode ser interpretada com base no nosso conhecimento prévio, conhecendo-se a história
por trás dos dados, ou seja, o mecanismo de geração de dados (Pearl et al., 2016).
7.5. Exemplos de algumas estruturas de viés de colisão

Vejamos, agora, exemplos de algumas estruturas com colisores nas quais o condiciona-
mento pelo colisor pode provocar viés de colisão. Vejamos inicialmente viés de colisão
que pode ser causado pela porta da frente, ao se condicionar por um colisor que esteja
situado em um caminho não causal entre T e D.
7.5.1. Viés de colisão pela porta da frente

1. Condicionamento por variável diretamente afetada pela exposição e pela doença.
Quando o condicionamento é feito por uma variável diretamente afetada pela
exposição e pela doença, como demonstrado na figura 7.4, o viés criado é de
maior intensidade. Este é o exemplo clássico de viés de colisão. Neste caso, a
associação espúria surge de um caminho aberto pela porta da frente, a partir de
condicionamento por um colisor (Exposição → Colisor ← Doença).
Como veremos em seguida, vários outros tipos de viés de colisão podem também
ser encontrados, ao se condicionar por um colisor e existirem relações indiretas
entre a exposição e a doença com o colisor. Este viés também pode ocorrer
quando houver causa comum da exposição e do colisor, e também causa comum
da doença e do colisor. Viés de colisão também pode surgir quando se realiza
condicionamento por um descendente do colisor.
Figura 7.4.: Viés de colisão pela porta da frente - condicionamento por variável direta-
mente afetada pela exposição e pela doença
Exposição
Colisor
Doença
2. Condicionamento por descendente de colisor (variável afetada pela exposição e

pela doença)
128
Neste caso (figura 7.5), quando condicionamos por uma variável descendente de
um colisor da exposição e da doença, o viés tende a ser de menor intensidade
(Hernan, 2002).
Figura 7.5.: Viés de colisão pela porta da frente - condicionamento por descendente de
colisor
Exposição
Colisor Descendente do Colisor
Doença
3. Condicionamento por variável afetada pela exposição e por uma causa da doença
Nesta forma, conforme ilustrado na figura 7.6, o colisor é afetado diretamente
pela exposição e por uma causa da doença. Esta causa da doença é causa comum
da própria doença e do colisor. A associação espúria surge de um caminho aberto
pela porta da frente, a partir de condicionamento por um colisor (Exposição →
Colisor ← Causa da Doença → Doença). Como a associação entre a doença e
exposição é direta, mas a associação entre a doença e o colisor não é direta, mas
ocorre devido a uma causa comum da doença e do colisor, este viés também tende
a ser magnitude intermediária.
Figura 7.6.: Viés de colisão pela porta da frente - condicionamento por variável afetada
pela exposição e por uma causa da doença
Exposição
Doença Colisor
Causa da Doença
4. Condicionamento por variável afetada por uma consequência da exposição e pela

doença
129
Neste caso o viés também tende a ser de magnitude intermediária. Como demons-
trado na figura 7.7, a associação entre a doença e o colisor é direta, mas a relação
entre a exposição e o colisor é indireta, mediada pelo descendente da exposição.
A associação espúria surge de um caminho aberto pela porta da frente, a partir
de condicionamento por um colisor (Exposição → Consequência da Exposição →
Colisor ← Doença).
por uma consequência da exposição e pela doença
Exposição Consequência da Exposição
Doença Colisor
5. Condicionamento por variável afetada pela exposição e por uma consequência da

doença
Como ilustrado na figura 7.8, a associação entre a exposição e o colisor é direta,
mas a relação entre a doença e o colisor é indireta, mediada por um descendente
da doença. Neste exemplo, o viés também é de magnitude intermediária. A
associação espúria surge de um caminho aberto pela porta da frente, a partir
de condicionamento por um colisor (Exposição → Colisor ← Consequência da
Doença ← Doença).
por uma consequência da exposição e pela doença
Exposição
Doença Consequência da Doença Colisor
6. Condicionamento por uma variável que é simultaneamente mediadora entre T e

D, e colisora de T e de uma causa comum dela mesma e de D
Este tipo de viés de colisão é um pouco mais complexo (Figura 7.9). Neste caso,
a variável colisora é simultaneamente mediadora da associação entre T e D. A
colisão ocorre porque esta variável é causada pela exposição e por uma causa
130
comum dela mesma e da doença. A associação espúria surge de um caminho aberto

pela porta da frente, a partir de condicionamento por um colisor (Exposição →
Colisor ← Causa comum do Colisor e da Doença ← Doença). Se ajustarmos
indevidamente para o colisor/mediador estaremos sabotando duplamente uma
interpretação causal: ao ajustarmos para o mediador estarı́amos estimando apenas
o efeito direto de T em D e, ao condicionarmos para o colisor, estarı́amos criando
uma associação espúria entre T e D. No final estarı́amos estimando, de forma
espúria, apenas o ”efeito direto”de T em D1 .
Figura 7.9.: Viés de colisão pela porta da frente - condicionamento por variável inter-
mediária afetada pelo tratamento (mediador), que também é colisora do
mediador e do desfecho
Colisor/Mediador D
Causa comum do Colisor/Mediador e D
7.5.2. Viés de colisão pela porta dos fundos
Vejamos, agora, alguns exemplos de viés de colisão pela porta dos fundos.
1. Condicionamento por variável afetada pela doença e por uma causa da exposição
Neste caso, a associação entre a doença e o colisor é direta, mas a associação

entre a exposição e o colisor ocorre devido a uma causa comum da exposição e
do colisor (Figura 7.10). Neste caso a associação espúria surge de um caminho
aberto pela porta de trás, a partir de condicionamento por um colisor (Exposição
← Causa da Exposição → Colisor ← Doença). Este tipo de viés de colisão tende
a ser de magnitude intermediária.
1 colocamos efeito direto entre aspas porque, de fato, nem o efeito direto de T em D estaria sendo
estimado, mas sim uma medida de associação que não teria interpretação causal, nem mesmo como
efeito direto de T em D.
131
Figura 7.10.: Viés de colisão pela porta de trás - condicionamento por variável afetada
pela doença e por uma causa da exposição
Causa da Exposição
Exposição Doença Colisor
2. Condicionamento por variável não afetada pela exposição ou pela doença, mas
afetada por causas da exposição e da doença, situada em caminho pela porta dos
fundos
Este exemplo de viés de colisão é denominado viés M (Figura 7.11). Este viés
tende a ser de pequena intensidade (Wei et al., 2012), pois as associações tanto
entre a exposição e o colisor, como entre a doença e o colisor são devidas a causas
comuns da exposição e do colisor, e da doença e do colisor. A associação espúria
surge de um caminho aberto pela porta de trás, a partir de condicionamento por
um colisor (Exposição ← Causa da Exposição → Colisor ← Causa da Doença →
Doença).
Figura 7.11.: Viés M - Colisor no caminho pela porta dos fundos - condicionamento por
variável afetada por uma causa da exposição e por uma causa da doença
Causa da Exposição Causa da Doença
Colisor
Exposição Doença
7.6. Intensidade do viés de colisão

O viés de colisão depende da força da associação entre o colisor com a exposição e o
desfecho. É de maior intensidade quando ambas as associações entre a exposição e o
desfecho com o colisor forem diretas. Se apenas uma destas associações for direta e a
outra indireta ou devida a causas comuns, o viés é de intensidade intermediária. Se
ambas as associações forem indiretas ou devidas a uma causa comum, o viés tende a
132
7.7. Viés de colisão provocado por perdas de seguimento
ser de pequena intensidade (Greenland, 2003). Assim, o viés M, que é sempre devido a
causas comuns do colisor e da exposição(variáveis pré-tratamento ou pré-exposição), e
do colisor e do desfecho, é sempre de baixa intensidade.
Assim, a magnitude do viés de colisão depende da parcela da associação mediada, da
intensidade e direção das associações entre o colisor e a exposição e entre o colisor e a
doença, e também da presença de intermediários nestes caminhos.
7.7. Viés de colisão provocado por perdas de

seguimento
Vejamos, abaixo, um exemplo aplicado do viés M (Figura 7.12), ou seja, de viés de
colisão, causado por perda de seguimento. Quando há perda de seguimento, isto equivale
ao pesquisador fazer uma restrição forçada, continuando no estudo apenas aqueles
que continuaram a participar até o final do mesmo. Dito de outro modo, apenas o
estrato dos participantes (P=1) ficaram no estudo, enquanto os que desistiram do
estudo (P=0), não tiveram os dados coletados.
Figura 7.12.: Viés M - Colisor no caminho pela porta dos fundos - condicionamento
por variável afetada por uma causa da exposição e por uma consequência
de uma causa da doença
CE - Efeitos Colaterais CD - CD4 baixo
COL - Participação no estudo CCD - Sintomas
T - Uso de antiretroviral D - Mortalidade
T - tratamento D - doença COL - colisor CD - causa da doença CCD - consequência

da causa da doença CE - causa da exposição
Fonte: adaptado de Hernan and Robins (2018)
A questão deset exemplo é se o uso de antiretroviral diminui a mortalidade por

HIV/aids. Vamos assumir que, no DAG da figura 7.12, adaptado de Hernan and Robins
133
(2018), não há confundimento por variável omitida, ou seja, o nosso conhecimento da
realidade é completo e expresso neste diagrama causal. Vamos também pressupor que
não há viés de aferição ou erro aleatório.
A ocorrência de efeitos colaterais dos medicamentos pode fazer com que o paciente
interrompa o uso da medicação (daı́ a seta CE - Efeitos colaterais → T - Uso de
antiretroviral). Por outro lado, a ocorrência de efeitos colaterais também pode fazer
com que o paciente desista do estudo e não mais participe do mesmo (CE - Efeitos
colaterais → COL - Participação no estudo). CD4 baixo, que reflete imunosupressão,
provoca sintomas e, por sua vez, é causa de mortalidade (CD - CD4 baixo → CCD -
Sintomas, CD - CD4 baixo → D - Mortalidade). Pacientes com sintomas graves podem
também não participar mais do estudo (CCD - Sintomas → COL - Participação no
estudo).
De qualquer forma, viés de colisão causado por restrição devido à não participação
no estudo de uma parte da amostra leva à quebra da permutabilidade entre os grupos.
Os grupos que participaram do estudo até o final não são mais permutáveis entre si,
pois diferem daqueles que deixaram de participar em relação a uma ou mais variáveis
preditoras do tratamento.
7.8. Exemplo de viés de colisão pela porta da frente -

variável intermediária afetada pelo tratamento
É bem conhecido na literatura médica o chamado ”paradoxo da obesidade”. Indivı́duos

obesos têm maior sobrevida do que os não obesos quando diagnosticados com uma
doença. Assim, diabéticos obesos apresentam menor mortalidade do que diabéticos
não obesos. Esta situação é paradoxal, pois a obesidade tem sido associada a maior
mortalidade em estudos populacionais.
Tem sido comum, em estudos que tenham por objetivo estimar os riscos de mortalidade
associados à obesidade, condicionar para doença. Assim, por exemplo, para investigar se
a obesidade aumenta o risco de óbito, é habitual, por exemplo, se ajustar para diabetes,
no intuito de se estimar o risco de mortalidade associado à obesidade, independentemente
do diabetes. Em estudos clı́nicos este condicionamento ocorre por meio de restrição, ao
se estudar apenas diabéticos. Preston and Stokes (2014) demonstraram que condicionar
por uma variável intermediária afetada pelo tratamento produz viés de colisão.
Na figura 7.13, está codificado o nosso conhecimento sobre o tema, de forma sim-
plificada, em um DAG, assumindo-se que não há causas comuns omitidas, viés de
aferição ou erro aleatório. Neste diagrama, a obesidade causa mortalidade diretamente
ou indiretamente por meio do diabetes. O hábito de fumar reduz o peso corporal e,
portanto, reduz o risco de obesidade, além de causar diabetes e maior mortalidade.
134
7.8. Exemplo de viés de colisão pela porta da frente - variável intermediária afetada pelo tratamento
Figura 7.13.: Viés de colisão pela porta da frente - variável intermediária afetada pelo
tratamento
Obesidade
Diabetes Mortalidade
Fumo
Fonte: adaptado de Preston and Stokes (2014)
Abaixo listamos todos os caminhos presentes neste DAG:
1. Pela Porta de trás
Caminhos não causais

(1) Obesidade ← Fumo → Mortalidade
(2) Obesidade ← Fumo → Diabetes → Mortalidade
2. Pela Porta da frente:
Caminhos causais
(3) Obesidade → Mortalidade
(4) Obesidade → Diabetes → Mortalidade —— Mediador
Caminhos não causais

(5) Obesidade → Diabetes ← Fumo → Mortalidade —— Colisor
Assim, de acordo com o conhecimento codificado neste DAG, para quais variáveis seria
necessário se realizar condicionamento/ajuste para se estimar o risco de mortalidade
associado à obesidade? Usando-se o critério da porta de trás, vemos que o único caminho
não causal pela porta da frente já está bloqueado por um colisor, Diabetes (caminho
5). Os caminhos causais pela porta da frente precisam ser deixados abertos (caminhos
3, direto e 4, com o mediador Diabetes). Pela porta de trás há dois caminhos abertos,
mas um deles contém um mediador, Diabetes e não podemos ajustar para um mediador
(caminho 2). Assim, precisamos encontrar uma variável que não seja mediadora ou
colisora e que feche ambos os caminhos pela porta de trás (caminhos 1 e 2), para que se
estime, sem viés, o efeito causal da obesidade na mortalidade. Ajustando-se para fumo,
135
bloquearemos estes dois caminhos pela porta dos fundos. Observe que neste exemplo,
Diabetes é simultaneamente um Colisor e um Mediador, portanto há dois motivos para
não se ajustar para Diabetes.
A partir deste DAG, usando o conhecimento empı́rico acumulado, Preston and Stokes
(2014) investigaram este viés de colisão. Um problema frequente quando se estuda o
risco de mortalidade associado à obesidade é a causalidade reversa. Indivı́duos doentes
podem ter perda de peso e maior risco de mortalidade. A doença pode ter provocado a
perda de peso e alterado o estado do indivı́duo de obeso para não obeso. Doença mais
grave pode levar a óbito, produzindo viés de sobrevivência, pois só os sobreviventes
participam do estudo. Estes fatores explicam porque há inversão do risco de óbito em
indivı́duos obesos com diabetes, que parece ser produzido, pelo menor parcialmente, por
viés de colisão. Os diabéticos mais graves ou morreram ou perderam peso. Isto poderia
explica este aparente ”paradoxo da obesidade”. Os diabéticos obesos sobreviventes
aparentemente ”morrem menos”porque alguns de seus pares obesos mais graves já
morreram ou perderam peso e passaram para o grupo dos não obesos e terão maior
mortalidade neste grupo, enviesando a associação. Este exemplo demonstra o perigo
de se extrapolar conclusões obtidas a partir de dados de um estudo clı́nico para a
população geral. O viés de colisão é suficiente para fazer uma exposição maléfica parecer
protetora (Banack and Kaufman, 2015).
Este exemplo também serve para ilustrar a necessidade de extrema cautela ao se
ajustar para variáveis pós-tratamento, tanto em ensaios clı́nicos, como em estudos
observacionais (Greenland, 2003). Para se analisar o efeito total do tratamento este
tipo de ajuste (para variável pós-tratamento) nunca deve ser realizado. Para se estimar
o efeito direto, ele pode ser realizado, desde que também seja feito ajuste para causas
comuns da variável pós-tratamento e do desfecho, além do ajuste para causas comuns
da exposição e da doença (Greenland, 2003). Voltaremos a esta questão de ajuste para
obtenção do efeito direto no capı́tulo ??.
7.9. Variável simultaneamente colisora e confundidora

No diagrama abaixo (Figura 7.14), denominado de bow-tie (gravata borboleta), há
uma variável que é simultaneamente uma causa comum e um colisor em um caminho
pela porta de trás entre T e D. Neste caso, se CT e CD tiverem sido mensurados no
estudo, poderia ser feito ajuste para CC e CT, ou para CC e CD. Ajustando-se para
CC, fecharı́amos o caminho pela porta de trás (T ← CC → D), mas abrirı́amos outro
caminho pela porta de trás (T ← CT → CC ← CD → D). Porisso terı́amos que fechar
este segundo caminho aberto, por meio de ajuste adicional para CT ou CD. O problema
surgirá se não tivermos medido CT nem CD, e tivermos medido apenas CC. O que
farı́amos nesta situação? Se não ajustarmos para CC, estarı́amos evitando viés de colisão,
mas a causa comum permaneceria não controlada, daı́ resultando viés de confundimento.
Se ajustarmos para CC, realizarı́amos ajuste para causa comum, controlando o viés de
confundimento, mas criarı́amos viés de colisão. Neste caso, como o viés M é de pequena
magnitude, em relação à maior intensidade do viés de confundimento, a recomendação
é ajustar para CC (Greenland, 2003).
136
7.10. Diferenças e semelhanças entre viés de confundimento e viés de colisão
Figura 7.14.: Estrutura Gravata-Borboleta - Colisor/Confundidor no caminho pela

porta dos fundos
CT - Causa do Tratamento CD - Causa da Doença
CC - Colisor/Confundidor
T - Exposição D - Doença
7.10. Diferenças e semelhanças entre viés de

confundimento e viés de colisão
O viés de confundimento sempre ocorre devido a causas comuns. Por outro lado, o viés
de colisão é causado por condicionamento indevido por um efeito comum da exposição
ou de uma causa da exposição e do desfecho ou causa do desfecho (Hernan, 2002).
Como vimos no capı́tulo 5, o viés de confundimento é representado no DAG por uma
estrutura de garfo, enquanto o viés de colisão é representando por uma estrutura
de garfo invertido, na qual foi realizado condicionamento por um colisor. O viés de
confundimento está presente nos dados, enquanto o viés de colisão é provocado por
uma ação do pesquisador (condicionamento indevido) ou por uma restrição causada
por perdas de seguimento, não resposta ou autoseleção. Dito em outras palavras, o viés
de colisão é causado por restrição ou por ajuste para um efeito comum.
Tanto o viés de confundimento quanto o viés de colisão produzem não colapsibilidade
da medida de associação, quando a estimativa bruta do risco relativo difere da ajustada
(Greenland, 2003; Jewell, 2004). O resultado final destes dois vieses é uma perda da
permutabilidade entre os grupos (Hernan et al., 2004).
Sendo assim, é impossı́vel distinguir viés de confundimento ou viés de colisão apenas
com base nos dados. É, portanto, essencial, conhecer o mecanismo de geração de dados
e construir um DAG a partir deste conhecimento, para que se possa distinguir estes
dois tipos de vieses e tomar as ações adequadas com vistas a estimar, sem viés, o efeito
causal. A partir do DAG escolhemos quais variáveis deverão ser utilizadas no ajuste.
A decisão de incluir ou não qualquer covariável na análise deve ser feita de acordo
com a pergunta de pesquisa e deve estar baseada no conhecimento prévio (Banack
and Kaufman, 2015). Na presença de viés de confundimento, devemos ajustar para a
137
causa comum causadora do confundimento. Na presença de viés de colisão, as soluções

necessárias estão apontadas na próxima seção.
7.11. Ajuste para viés de seleção

Na ocorrência de viés de colisão, causado tanto por perda de seguimento, não resposta,
autoseleção ou por ajuste indevido por um colisor, o que se pode fazer para tentar
eliminá-lo ou reduzi-lo?
Há várias formas para isto. No caso de ajuste indevido por um colisor a solução é
fácil: basta não condicionar pelo colisor. Nunca se deve realizar ajuste para variáveis
afetadas pela exposição ou pela doença. Também não se deve realizar ajuste se houve
caminho pela porta de trás, que já esteja fechado por um colisor, para se evitar viés
do tipo M (Greenland, 2003). No viés M, o colisor se comporta como um confundidor
clássico e, se usarmos as regras convencionais para identificação de confundidor, iremos
tratar um colisor como um confundidor. E, pior ainda, detectaremos não colapsibilidade
da medida de associação, o que confirmaria a nossa suspeita de estarmos diante de um
confundidor. Assim, não terı́amos dúvida e incluirı́amos o colisor no ajuste, sabotando
nossa pesquisa. Porisso é fundamental usar o conhecimento adquirido, tanto para
identificação de confundidor como de colisor, com a ajuda de ferramenta gráfica (DAG)
e do critério da porta de trás.
Para as outras situações, nas quais o pesquisador está trabalhando com uma suba-
mostra, ou seja, já houve restrição a partir de uma população, há outras possibilidades.
Uma delas é tentar fechar o caminho aberto pelo colisor por meio de outra variável que
esteja neste caminho. Outra forma é usar ponderação pelo inverso da probabilidade de
seleção. Estes métodos serão abordados no capı́tulo ??.
7.12. Exercı́cios
1. Na tabela 7.3 são apresentados os dados de um estudo para avaliar o possı́vel efeito
da suplementação periconcepcional de ácido fólico na prevenção de malformações
do tubo neural (Hernan, 2002). Trata-se de um estudo caso controle, no qual
os casos são produtos da gestação, incluindo abortos, natimortos e nascidos
vivos com malformação do tubo neural (D=1) e os controles são produtos da
gestação com outras malformações congênitas (D=0). O tratamento (T=1) foi a
suplementação periconcepcional com ácido fólico. Os dados são apresentados para
toda a população e estratificados para C (C=1, incluindo abortos e natimortos, e
C=0, abrangendo apenas os nascidos vivos). Responda às perguntas seguintes
assumindo que não há erro de mensuração, que não há confundimento por outra
variável omitida e que o odds ratio é colapsável, pois a doença é rara.

descrito por Hernan (2002).
138
7.12. Exercı́cios
3. Usando o arquivo neural.dta, e os comandos utilizados no exemplo resolvido do pa-

radoxo de Simpson (seção 6.1.2), calcule o odds ratio em cada estrato e o odds ratio
bruto e ajustado. Alternativamente você pode realizar os cálculos no programa
OpenEpi (de domı́nio público, disponı́vel na página http://www.openepi.com).
Clique no menu à esquerda em Cálculos, Tabela 2 x 2. Depois clique em
Entrar dados e digite os dados para o estrato 1 (C=1). Em seguida clique no
botão Adicionar Estrato e digite os dados para o estrato 2 (C=0). Finalmente
clique no botão Calcular.
4. Há interação, ou seja, a razão de risco foi diferente nos estratos? Leve também
em conta na sua resposta o resultado do teste de heterogeneidade.
DAG que você desenhou?
6. Usando o critério da não colapsibilidade para avaliar a possı́vel presença de

confundimento, há diferença entre o odds ratio bruto e ajustado?
7. Há permutabilidade entre tratados e não tratados?
8. Em conclusão, a suplementação de ácido fólico foi eficaz em reduzir malformações

do tubo neural? Em qual(is) critério(s) você baseou a sua resposta?
9. Para responder a esta questão você utilizou o odds ratio bruto ou o ajustado?
Por quê?
139
Tabela 7.3.: Suplementação com ácido fólico e malformações do tubo neural

Total
D=1 D=0 Total
T=1 43 239 282
% Ácido Fólico 18,1 25,3 23,9
T=0 194 704 898
Total 237 943 1180
C=1 Aborto/Natimorto
D=1 D=0 Total
T=1 19 8 27
% Ácido Fólico 16,0 14,8 15,6
T=0 100 46 146
Total 119 54 173
C=0 Nascidos Vivos

D=1 D=0 Total
T=1 24 231 255
% Ácido Fólico 20,3 26,0 26,1
T=0 94 658 752
Total 118 889 1007
D=1 Casos - malformações do tubo neural
D=0 Controles - outras malformações congênitas
T=1 Suplementação com ácido fólico
T=0 Não suplementação com ácido fólico
Fonte: Hernan (2002)
10. Hernandez-Diaz et al. (2006) analisaram o chamado ”paradoxo do peso ao nascer”.

Usando dados dos nascimentos e óbitos relacionados, dos Estados Unidos, em
1991, descreveram que a razão da taxa de mortalidade dos fumantes, comparados
aos não fumantes foi 1,55 (Intervalo de confiança - IC - de 95% 1,50-1,59) na
população geral, ou seja, filhos de mães fumantes tiveram maior risco de óbito do
que filhos de mães não fumantes. Esta mesma razão foi 0,79 (IC 95% 0,76-0,82)
entre os nascidos com baixo peso e 1,80 (IC 95% 1,72-1,88) para os nascidos sem
baixo peso ao nascer. Ou seja, entre os nascidos com baixo peso, a mortalidade foi
revertida e os filhos de fumantes agora apresentaram menor mortalidade do que os
filhos de mães não fumantes. Entre os nascidos sem baixo peso ocorreu o mesmo
que na população geral: filhos de fumantes tiveram maior taxa de mortalidade
do que filhos de mães não fumantes. Como você explicaria este paradoxo: como
pode o fumo ser danoso na população geral e, ao mesmo tempo, ser um fator
de proteção para mortalidade entre os nascidos com baixo peso ao nascer? Leve
em consideração, na sua resposta, que foi sugerido, na literatura, que o efeito do
140
7.12. Exercı́cios
fumo materno durante a gravidez poderia ser modificado pelo peso ao nascer, de
maneira que o fumo seria benéfico para crianças com baixo peso ao nascer.
11. Assumindo-se que todas as variáveis foram medidas sem erro, que não há causas
comuns não incluı́das e baseado no DAG da figura 7.15 abaixo, como você
explicaria o paradoxo do peso ao nascer?
DAG?
13. O risco relativo ajustado para o peso ao nascer foi 1,09 (IC 95% 1,05 - 1,12). Há
colapsibilidade da medida de associação?
14. Você usaria o risco relativo marginal (não ajustado) ou os riscos relativos condici-
onais, obtidos nos estratos para responder a esta questão?
15. Há permutabilidade entre tratados (fumantes) e não tratados (não fumantes) na
população geral?
16. Há permutabilidade entre tratados e não tratados no estrato de baixo peso ao
nascer?
17. Para analisar se a mortalidade infantil é maior entre crianças de mães fumantes,
comparadas a crianças de mães não fumantes, deveria ser realizado ajuste para o
peso ao nascer? Por quê?
Figura 7.15.: Fumo materno durante a gravidez e mortalidade infantil
Fumo materno
Baixo peso ao nascer Mortalidade
Malformações fetais
141
Parte III.
Estimação do Efeito Causal
143
8. Métodos de análise com escore de
propensão
8.1. Escore de propensão
Os métodos de análise com escore de propensão foram desenvolvidos a partir do artigo
seminal de Rosenbaum and Rubin (1983) para reduzir viés de seleção na estimativa do
efeito causal do tratamento. Seu uso nos estudos observacionais ocorre na tentativa
de compensar a ausência de randomização, com o objetivo de equilibrar os grupos de
tratamento e controle. Rosenbaum and Rubin (1983) demonstraram que o escore de
propensão é suficiente para balancear a variável de exposição (ou de tratamento) em
relação às variáveis observadas.
Uma das técnicas mais utilizadas com o escore de propensão é o pareamento. Quando
pareamos por uma variável é mais fácil encontrar um par. Se desejamos parear pelo
sexo, por exemplo, é fácil encontrar pares homens e mulheres no banco de dados. Porém,
em estudos que envolvem muitas variáveis é difı́cil se encontrar um par para todos. Se
o pareamento for, por exemplo, por sexo, nı́vel socioeconômico, tabagismo e obesidade,
poderemos ter dificuldade, por exemplo, para encontrar pessoas em determinadas
combinações de categorias destas variáveis. Se cada variável tiver apenas 2 nı́veis, será
uma tabela 2 x 2 x 2 x 2, ou seja uma tabela com 16 caselas e precisaremos encontrar
pares em cada uma destas caselas nos grupos de tratamento e controle.
Na tabela 8.1 ilustramos a realização do pareamento pelas variáveis observadas,
utilizando dados fictı́cios. A pergunta do estudo é se a participação no programa de
saúde da famı́lia reduz o percentual de crianças com esquema vacinal básico incompleto
no primeiro ano de vida. Como variáveis de confundimento observadas, temos renda
familiar per capita, medida em salários mı́nimos, e escolaridade materna, mensurada
em anos de estudo. De um total de 10 famı́lias estudadas, 5 recebiam visitas regulares
de um agente de saúde do PSF (codificado como 1) e 5 não participavam do programa
(codificado como 0). Iniciemos com a observação 1. A renda familiar é de 0,25 salário
mı́nimo per capita e a mãe estudou até o segundo ano do ensino fundamental. Qual
o melhor par controle para esta observação? Qual a criança que não participou do
PSF cuja famı́lia tem os valores mais próximos de renda e escolaridade? Observando a
tabela, vemos que a observação com valores mais próximos é a criança 8. Desta forma
1 e 8 serão pareados na nossa análise. Procedendo da mesma forma, formamos os pares
2 - 6, 3 - 7, 4 - 8 e 5 - 8. Note que o nosso pareamento permite reposição. Então a
observação 8 será par para três casos: 1, 4 e 5. Teremos que descartar as observações
controle 9 e 10, pois elas não se parecem com nenhuma criança do grupo exposto ao
tratamento (participação no PSF). Este exemplo simples já nos serve para ilustrar
145
8. Métodos de análise com escore de propensão
as dificuldades de se realizar o pareamento com base nas variáveis observadas. Neste

caso, são apenas duas variáveis observadas contı́nuas e já tivemos que descartar dois
controles, porque não tinham semelhança com nenhum dos tratados.
Tabela 8.1.: Pareamento com base nas variáveis observadas
Número PSFa Rendab Escolaridadec Par Escored

1 1 0,25 2 8 0,90
2 1 1 4 6 0,43
3 1 0,75 6 7 0,53
4 1 0,50 2 8 0,81
5 1 0,50 8 8 0,63
6 0 1 3 2 0,46
7 0 0,75 7 3 0,49
8 0 0,50 5 1, 4, 5 0,73
9 0 2 10 ? 0,02
10 0 3 15 ? 0,01
a
PSF = Participação no Programa de Saúde da Famı́lia
b
Renda familiar per capita em salários mı́nimos
c
Escolaridade materna em anos de estudo
d
Escore de propensão
Para atenuar esta dificuldade, de se realizar o pareamento na presença de muitas

variáveis observadas, foi criado o escore de propensão. Trata-se de um escore único,
obtido a partir da soma das relações entre as variáveis e o tratamento. Em um estudo
multidimensional, envolvendo muitas variáveis observadas, é gerada uma única variável,
denominada escore de propensão. Desta forma, se diminui a dimensionalidade, porque
todas as variáveis são transformadas em um escore único e fica mais fácil se encontrar
um par para todos (Rosenbaum and Rubin, 1983; Morgan and Winship, 2015; Guo
and Fraser, 2015).
O escore de propensão é a probabilidade condicional de recebimento do tratamento em
função das variáveis preditoras observadas, ou seja, das caracterı́sticas pré-tratamento
(Rosenbaum and Rubin, 1983). Seu cálculo é feito de acordo com a fórmula 8.1, onde
p é o conjunto de variáveis preditoras. No nosso exemplo, seria a probabilidade de
participação no PSF em função da renda familiar per capita e da escolaridade materna.
e(p) = P r[t = 1|p] (8.1)

Seu cálculo é mais comumente realizado em modelo logı́stico (Leite, 2017), no qual
a variável resposta é o tratamento, codificado em T=1 se o indivı́duo foi tratado e
T=0 se a pessoa não tiver sido tratada. As variáveis preditoras podem ser categóricas
ou contı́nuas. Para prever a probabilidade de tratamento (participação no PSF) a
partir das variáveis preditoras renda familiar per capita e escolaridade materna basta
rodar um modelo logı́stico com PSF como variável resposta e renda e escolaridade
146
8.1. Escore de propensão
como variáveis preditoras neste modelo. Ao final basta resolver a equação do modelo
logı́stico e calcular a probabilidade de tratamento. Esta probabilidade de tratamento
é o escore de propensão. Note que a regressão logı́stica é, neste caso, utilizada com
finalidade preditiva e não explicativa ou causal. Neste passo da modelagem, como
usamos um modelo preditivo, não teremos o problema de viés de confundimento, pois
uma variável de confusão, porque está associada ao tratamento, é uma boa preditora
da probabilidade do indivı́duo ser tratado.
Realizamos este cálculo e colocamos os resultados na última coluna da tabela 8.1.
Com base no escore de propensão vamos escolher, agora, os pares controles para as
nossas observações tratadas, ou seja, as que participaram do PSF. O escore de propensão
da criança 1 foi 0,90. O escore mais próximo deste no grupo controle é o da criança
8 (0,73). Assim pareamos a criança 1 com a criança 8. Continuando com o mesmo
procedimento formamos os pares 2 (0,43) com 6 (0,46), 3 (0,53) com 7 (0,49), 4 (0,81)
com 8 (0,73) e 5 (0,63) com 8 (0,73). Descartamos, portanto, as crianças 9 e 10. Note
que os pares formados foram os mesmos de quando realizamos o pareamento com
base nas variáveis observadas. Utilizando-se amostras pequenas e com poucas variáveis
preditoras, isto é fácil de ocorrer. Entretanto, agora podemos observar melhor se o
pareamento foi bom ou ruim. Para isto basta obter as diferenças entre os escores de
propensão de cada par. Quanto menor for esta diferença, mais próximos estão os valores
do par e, portanto, melhor o pareamento. Para o primeiro par (1 e 8) a diferença foi
0,90 - 0,73 = 0,17. E para os demais pares: 2 e 6 (0,03), 3 e 7 (0,04), 4 e 8 (0,08)
e 5 e 8 (0,10). Como há algumas diferenças grandes, o balanceamento das variáveis
não foi atingido neste caso. Este exemplo, com uma amostra muito pequena (n=10),
serve para demonstrar, de forma didática como se realiza o pareamento com o escore
de propensão. É muito difı́cil se obter balanceamento de variáveis com amostras tão
pequenas. É também óbvio que para responder a esta pergunta, de forma adequada,
precisaremos de mais observações. Veremos como avaliar de forma mais detalhada o
balanceamento das variáveis nos grupos tratado e controle mais adiante, com outro
exemplo, baseado em amostra maior.
De qualquer forma, este exemplo ilustra também que, muitas vezes, não vamos
encontrar controles adequados para cada observação e também seremos obrigados a
descartar algumas observações controles que sejam muito diferentes das tratados, como
foi o caso das crianças 9 e 10. Este procedimento de exclusão, se por um lado aumenta
a validade interna do estudo, porque se formam grupos mais comparáveis entre si, por
outro lado reduz a generalização externa dos achados para a população como um todo.
Assim, é importante que seja verificado se há zona de suporte comum, ou seja, se há
controles adequados para cada tratado. Muitas vezes, para se atingir um pareamento
mais adequado é comum se restringir a escolha de controles a uma zona mais restrita de
semelhança. Poderı́amos, por exemplo, aceitar pareamento apenas até uma determinada
diferença entre os pares, digamos 0,10. Neste caso, o par 1 - 8 não seria formado e
terı́amos que descartar a observação tratada 1. Isto aumentaria a validade interna do
estudo, mas reduziria a zona de suporte comum e, portanto, a validade externa dos
resultados.
Além do pareamento, há várias outras técnicas utilizadas com o escore de propensão
como a ponderação e a estratificação (Leite, 2017).
147
8.2. Quais variáveis incluir no ajuste?

Antes de se inicar a análise a grande pergunta é: quais variáveis incluir no ajuste? Devo
selecionar as variáveis pela significância ou pela teoria? Ou usando os dois critérios?
A este respeito, não há consenso absoluto na literatura. Leite (2017) recomenda que
as variáveis sejam incluı́das com base na teoria. Segundo este autor, apenas verdadeiros
confundidores e variáveis apenas preditoras do desfecho devem ser incluı́dos no ajuste.
Como vimos no capı́tulo 5, confundidores são causa comum do tratamento e do desfecho.
A inclusão de verdadeiros confundidores reduz ao mesmo tempo viés e variância do
efeito do tratamento (Brookhart et al., 2006; Cuong, 2013).
A justificativa para incluir no ajuste variáveis que são apenas preditoras do desfecho
se deve à redução da variância na estimativa do efeito do tratamento obtida com a sua
inclusão (Brookhart et al., 2006; Cuong, 2013). Por outro lado, a inclusão de variáveis
que são apenas preditoras do tratamento não leva à redução de viés, mas causa aumento
da variância na estimativa do efeito do tratamento (Brookhart et al., 2006; Cuong,
2013). Já vimos, também no capı́tulo 5 que não devemos incluir mediadores no ajuste
pois, com a sua inclusão, se remove total ou parcialmente o efeito do tratamento.
Não é consenso na literatura a inclusão de variáveis que são apenas preditoras do
desfecho no ajuste. Para Rubin (2007), para se garantir que a seleção de variáveis
não seja dirigida pelos dados, não se deve realizar a análise do desfecho antes de se
escolher as variáveis de ajuste e calcular o escore de propensão. Isto garante maior
objetividade na escolha das variáveis e na implementação dos métodos baseados no
escore de propensão. A cegueira do pesquisador em relação às variáveis associadas
com o desfecho mimetiza o que acontece no estudo experimental, quando só se toma
conhecimento do desfecho muito tempo depois da implementação do tratamento. Assim,
a inclusão de preditores do desfecho é uma tı́pica questão de busca de equilı́brio entre
viés e variância. Há uma tendência de, ao se reduzir viés, se aumentar a variabilidade
na estimativa do efeito do tratamento e vice-versa. Deste modo, a inclusão de variáveis
que são apenas preditoras do desfecho tende a reduzir a variância da estimativa do
efeito do tratamento mas tende, por outro lado, a aumentar viés, pela ausência de
cegamento do pesquisador, tal como sugerido por Rubin (2007). Para este autor os
métodos baseados em escore de propensão foram desenhados para eliminar viés, não
para aumentar a precisão na estimativa do efeito do tratamento (Rubin, 2007).
Assim, somente variáveis pré-tratamento devem ser incluı́das no ajuste e o ajuste não
pode incluir variáveis afetadas pelo tratamento ou mediadoras. Desta forma, seguindo
(Rubin, 2007), não recomendamos a inclusão de variáveis apenas preditoras do desfecho
no ajuste, pois esta estratégia, que tem por objetivo reduzir a variância, pode acabar,
inadvertidamente, introduzindo viés na estimativa do efeito do tratamento.
Vimos, também no capı́tulo 5 como se dá a seleção de variáveis para inclusão no
ajuste, com a ajuda de métodos gráficos. Por este método, a seleção de variáveis se
dá por meio da aplicação do critério da porta de trás. Se o conhecimento a respeito
das relações entre as variáveis for completo, consideramos este método superior aos
acima mencionados para escolha das variáveis para ajuste. A importância deste critério
se dá pelo fato de que a ênfase na escolha do ajuste se desloca da variável para o
caminho. Uma variável pode ser confundidora em um caminho e ser colisora em outro.
148
8.3. Passos na análise com escore de propensão
Por meio de um DAG é possı́vel identificar caminhos abertos pela porta de trás e
escolher variáveis que não sejam colisoras e que bloqueie estes caminhos abertos pela
porta dos fundos (Pearl, 2009a).
Outra estratégia importante é escolher para ajuste variáveis que contenham menor
erro de mensuração, ou seja, que sejam bem medidas e que tenham boa confiabilidade
(Leite, 2017).
Os critérios de seleção de variáveis para ajuste estão resumidos na tabela 8.2.
Tabela 8.2.: Critérios de seleção de variáveis para ajuste
Variável Consequência para estimativa do efeito do trata-

mento
Verdadeiros confundidores Reduzem viés e variância
Preditores do desfecho Reduzem variância, mas podem aumentar viés
Preditores do tratamento Aumentam a variância e não reduzem viés
Mediadores Desaparecimento total ou parcial do efeito
Descendentes do tratamento Aumentam viés pela abertura de caminhos pela
porta da frente, provocando viés de colisão
Colisor Provoca viés
Critério da porta de trás Reduz viés, sendo mais adequado porque se fixa
nos caminhos e não nas variáveis. Uma variável
pode ser confundidora em um caminho e colisora
em outro

Seguimos os seguintes passos na realização de uma análise com escore de propensão
(Olmos and Govindasamy, 2015)
• Análise ajustada em modelos de regressão convencional

• Verificação do balanceamento antes da implementação do escore de propensão
• Estimação do escore de propensão
• Ponderação, pareamento ou estratificação com escore de propensão
• Verificação do balanceamento após a implementação do escore de propensão
• Cálculo do efeito causal em modelos ponderados, estratificados ou com pareamento
pelo escore de propensão
Veremos cada um destes passos a seguir. Inicialmente vamos descrever a pergunta,

o banco de dados e as variáveis que usaremos no exemplo. Vamos usar os dados da
coorte de nascimentos de Ribeirão Preto de 1978/79.
149
A pergunta é se nascimento cesáreo causa obesidade na vida adulta jovem. Esta

hipótese nasceu de alguns estudos que detectaram que o parto cesárea estava associado a
maiores taxas de obesidade ao longo da vida. Uma das explicações para esta associação,
se ela for causal, é que o parto cesáreo, ao impedir que o bebê entre em contato com
a flora vaginal materna, altera a microbiota intestinal, aumentando a proporção de
bactérias do filo Firmicute e reduzindo a proporção de bactérias dos filos Bacteroidetes
e Actinobacteria (no qual se encontra o gênero Bifidobacterium (Rutayisire et al., 2016).
A longo prazo, esta alteração da microbiota levaria à obesidade (Goldani et al., 2011).
Os dados dos estudo foram coletados em dois momentos: ao nascimento e na vida
adulta jovem, dos 23 aos 25 anos de idade. Veja na tabela 8.3 a lista das variáveis, suas
categorias e a codificação utilizada. A variável tratamento é tipo de parto e a variável
resposta é o ı́ndice de massa corporal, mensurado em quilogramas por metro quadrado
(kg/m2 ). As demais variáveis serão consideradas como preditoras do tratamento.
O banco de dados contém 1904 observações completas, a partir de 2063 adultos jovens
participantes da terceira fase do estudo de coorte de Ribeirão Preto de 1978/79 (7% dos
casos tinham valores ignorados para uma ou mais das variáveis e foram descartadas).
Destes, 591 eram tratados (nasceram de parto cesárea) e 1313 não foram tratatos
(nasceram de parto vaginal). Na vida adulta, 226 (11,87% desenvolveram obesidade,
medida pelo ı́ndice de massa corporal maior ou igual a 30 kg/m2 .
8.3.1. Análise em modelos de regressão convencional

A análise não ajustada em modelo de regressão linear, tendo o ı́ndice de massa corporal
como variável dependente e o tipo de parto como variável explanatória, resultou no
coeficiente 1,11 (Intervalo de confiança 95% 0,64 - 1,58), p<0,001. Na análise ajustada
para todas as variáveis potencialmente confundidoras obteve-se o coeficiente 1,28
(Intervalo de confiança 95% 0,80 - 1,75), p<0,001. O resultados nos sugerem que as
pessoas nascidas de parto cesáreo apresentam ı́ndice de massa corporal na vida adulta
1,28 kg/m2 maior do que os nascidos de parto vaginal.
O problema com os modelos de regressão convencional é a grande quantidade de
pressupostos que precisamos levar em conta. Na quase totalidade das vezes, estes
pressupostos são irrealistas. Neste caso, primeiro temos que supor que todas as relações
entre os preditores e o desfecho são lineares e, no modelo testado, também pressupomos
que não haja interações entre o tratamento e os preditores. Isso além de todos os demais
pressupostos que precisam ser verificados em modelos de regressão linear (distribuição
normal, homocedasticidade, independência entre os preditores e o erro, distribuição
normal dos resı́duos e resı́duos pequenos). Outra desvantagem é que não temos como
testar balanceamento após o ajuste para verificar se, após a análise, os grupos tratamento
e controle são permutáveis entre si, pelo menos em relação às variáveis observadas.
8.3.2. Verificar balanceamento entre os grupos

Inicialmente vamos verificar o balanceamento entre os grupos tratado e controle, ou
seja, verificar se as variáveis pré-tratamento (preditoras do tratamento) estão igual
ou desigualmente distribuı́das entre os nascidos por cesárea ou por parto vaginal.
150
Tabela 8.3.: Variáveis da coorte de Ribeirão Preto 1978/79
Variável Nome Codificação

Índice de Massa Corporal imc contı́nuo (13,5 a 51,3)
Idade da mãe idmae contı́nua (14 a 48)
Paridade parid contı́nua (1 a 12)
Escolaridade materna escmae 1=0
(anos de estudo) 2=1a4
3=5a8
4 = 9 a 11
5 = 12 ou mais
Ocupação do chefe ocup 1 = não qualificado/desempregado
de famı́lia 2 = qualificado/semiqualificado
3 = não manual
Situação conjugal materna sconj 1 = sem companheiro
2 = união consensual
3 = casada
Trabalho materno trabmat 0 = não
fora do lar 1 = sim
Categoria de internação catint 0 = pública
1 = privada
Fumo materno fumomat 0 = não
1 = sim
Baixo peso ao nascer bpeso 0 = não
1 = sim
Nascimento pré-termo premat 0 = não
1 = sim
Sexo sexo 0 = feminino
1 = masculino
Obesidade obeso 0 = não
1 = sim
Tipo de parto tiparto 0 = vaginal
1 = cesárea
Podemos usar os métodos usuais, usando o teste t de Student para verificar diferenças
na média de variáveis contı́nuas e o teste do qui-quadrado para verificar diferenças
entre proporções, no caso de variáveis categóricas. Entretanto, testes estatı́sticos para
avaliar balanceamento entre os grupos não são recomendados pois o balanceamento de
covariáveis é uma propriedade da amostra, enquanto os testes de hipótese se referem
à população (Ho et al., 2007; Leite, 2017). Outro problema é que o p valor depende
do tamanho da amostra. Com amostras grandes há uma tendência de se identificar
como significantes diferenças triviais entre os grupos. Em amostras pequenas há maior
probabilidade de falso negativo, ou seja, de não se detectar diferenças importantes (Leite,
151
2017). Por causa disto, outros métodos foram propostos para se verificar balanceamento.
O mais recomendado é verificar se há diferença padronizada absoluta nas médias
entre os grupos tratado e controle. Se a diferença padronizada absoluta entre as médias
for menor do que 0,10 desvio padrão considera-se que não há diferença entre os grupos,
ou seja, eles estão balanceados (Austin, 2011). Podemos usar também um ponto de
corte menos rigoroso, considerando que não há diferença quando esta diferença for
menor do que 0,25 desvio padrão (Stuart, 2010). Recomendamos o uso do critério mais
rigoroso (<0,10). A diferença padronizada absoluta nas médias entre os grupos tratado
e controle é obtida pela fórmula 8.2, onde x̄ é a média aritmética, s é o desvio padrão,
o subscrito t representa o grupo tratado e o c denota o grupo controle.
x̄ − x̄c
p t (8.2)
(s2t + s2c )/2)
Outro método muito usado é comparar toda a distribuição das variáveis nos dois
grupos (tratado e controle), por meio do teste de Kolmogorov-Smirnov. Se o valor de P
deste teste for ≥ 0,05, há equilı́brio entre os grupos. Da mesma forma, como nos demais
testes, este critério pode levar a falso positivo ou a falso negativo, como já comentamos
acima.
A razão de variância também tem sido usada para verificar balanceamento entre os
grupos. Por este critério, os grupos são considerados balanceados se a razão de variância
estiver no intervalo 0,8 - 1,2 (Leite, 2017).
Na saı́da abaixo, obtida por meio do pacote twang no R, vemos uma listagem das
estatı́sticas de balanceamento antes da implementação do escore de propensão. Na
primeira coluna constam os nomes das variáveis. As variáveis categóricas com mais de
dois nı́veis (ocup, escmae e sconj) foram fatoradas, para que sejam analisadas como
categóricas e não como contı́nuas. Porisso aparecem com os nomes ocupf, escmaef e
sconjf, pois o f indica que foram fatoradas. Após o f estão identificadas por um número
cada categoria. Assim, ocupf1 corresponde à ocupação manual não qualificada ou a
desemprego. Nas colunas subsequentes estão apresentadas a média do grupo tratado
(tx.mn), o desvio padrão do grupo tratado (tx.sd), a média do grupo controle (ct.mn),
o desvio padrão do grupo controle (ct.sd), a diferença padronizada absoluta entre as
médias do grupo tratado e controle (std.eff.sz), o resultado da estatı́stica utilizada para
comparar os tratados com os controles (stat, sendo teste t de Student para variáveis
contı́nuas e teste do qui-quadrado para variáveis categóricas), o resultado do p valor da
estatı́stica (p), o valor do teste de Kolmogorov-Smirmov (ks) e o p valor do teste de
Kolmogorov-Smirmov (ks.pval).
$unw
t x . mn t x . sd c t . mn c t . sd s t d . e f f . sz stat p ks ks . pval
idmae 27.257 5.809 25.401 5.703 0.320 6.491 0.000 0.140 0.000
parid 2.242 1.487 2.359 1.749 −0.070 −1.499 0 . 1 3 4 0 . 0 3 4 0.709
catint 0.113 0.317 0.059 0.236 0.203 3.700 0.000 0.054 0.178
ocupf : 1 0.140 0.347 0.235 0.424 −0.271 1 6 . 4 4 0 0 . 0 0 0 0 . 0 9 4 0.000
ocupf : 2 0.648 0.478 0.631 0.483 0.037 NA NA 0 . 0 1 7 0.000
ocupf : 3 0.212 0.408 0.135 0.342 0.188 NA NA 0 . 0 7 7 0.000
escmaef : 1 0.012 0.108 0.038 0.191 −0.243 6.885 0.000 0.026 0.000
escmaef : 2 0.387 0.487 0.463 0.499 −0.155 NA NA 0 . 0 7 6 0.000
152
escmaef : 3 0.294 0.456 0.274 0.446 0.044 NA NA 0.020 0.000

escmaef : 4 0.184 0.388 0.147 0.354 0.097 NA NA 0.037 0.000
escmaef : 5 0.122 0.327 0.078 0.268 0.135 NA NA 0.044 0.000
sconjf :1 0.039 0.193 0.058 0.234 −0.098 2.697 0.068 0.019 0.068
sconjf :2 0.056 0.230 0.074 0.262 −0.079 NA NA 0.018 0.068
sconjf :3 0.905 0.293 0.868 0.338 0.126 NA NA 0.037 0.068
bpeso 0.064 0.245 0.062 0.241 0.011 0.216 0.829 0.003 1.000
premat 0.059 0.236 0.073 0.260 −0.055 −1.150 0 . 2 5 0 0.014 1.000
trabmat 0.237 0.426 0.181 0.385 0.139 2.717 0.007 0.056 0.153
fumomat 0.247 0.432 0.260 0.439 −0.031 −0.625 0 . 5 3 2 0.013 1.000
sexo 0.475 0.500 0.479 0.500 −0.007 −0.145 0 . 8 8 5 0.004 1.000
Observe que há várias diferenças padronizadas absolutas nas médias maiores do que
0,10, que é o ponto de corte mais rı́gido (idade materna, categoria de internação, para
duas das três categorias de ocupação, para três das cinco categorias de escolaridade
materna, para uma categoria de situação conjugal e para trabalho materno). As demais
variáveis podem ser consideradas balanceadas entre os grupos tratamento e controle
por este critério. As variáveis com p valores não significantes nas estatı́sticas também
poderiam ser consideradas balanceadas (paridade, baixo peso ao nascer, nascimento
pré-termo, fumo materno durante a gravidez e sexo do recém-nascido). Pelo teste
de Kolmogorov-Smirnov também poderiam ser consideradas balanceadas as variáveis
categoria de internação e trabalho materno.
Na tabela 8.4 ilustramos os resultados dos testes para verificar balanceamento: t de
Student para variáveis contı́nuas e qui-quadrado para variáveis categóricas.
Tabela 8.4.: Balanceamento das variáveis da coorte de Ribeirão Preto 1978/79
Variável Vaginal Cesárea P valor

Idade 25,4 27,3 <0,001
Paridade 2,36 2,24 0,159
Hospital Privado 5,9% 11,3% <0,001
Escolaridade materna ≥ 12 anos 7,8% 12,2% <0,001
Ocupação não manual 21,2% 13,5% <0,001
Casada 90,5% 86,8% 0,067
Fumo materno na gravidez 24,7% 26,1% 0,534
Trabalho materno fora do lar 23,7% 18,1% 0,005
Baixo peso ao nascer 6,4% 6,2% 0,828
Nascimento pré-termo 5,9% 7,3% 0,268
Sexo masculino 47,6% 47,9% 0,885
Como os testes não são indicados para verificar balanceamento, vamos utilizar o
resultado da diferença padronizada absoluta nas médias para detectar quais variáveis
não estão balanceadas nos grupos tratamento e controle. Desta forma, concluı́mos
que as variáveis idade materna, categoria de internação, ocupação do chefe de famı́lia,
escolaridade materna, situação conjugal materna e trabalho materno fora do lar não
estão balanceadas.
153
8.3.3. Estimação do escore de propensão

O próximo passo na análise é estimar o escore de propensão. Como vimos, o escore
de propensão é a probabilidade de receber o tratamento, no caso de nascer por parto
cesárea, em função das variáveis preditoras do tratamento. Normalmente esta estimativa
é realizada por meio de regressão logı́stica, mas este método tem alguns problemas. O
modelo pode estar mal especificado. A má especificação pode ser causada pela não
inclusão de termos polinomiais, no caso de relações não lineares entre os preditores
contı́nuos e a probabilidade do tratamento. Porisso é importante sempre que se teste
a não linearidade do logito para preditores contı́nuos, pois o modelo de regressão
logı́stica é muito sensı́vel à forma funcional da relação entre os preditores contı́nuos e a
probabilidade do tratamento. Isto pode ser testado por meio de um gráfico de dispersão,
colocando-se no eixo X a variável contı́nua e no eixo Y a probabilidade de ocorrência
do tratamento, ou seja, o próprio escore de propensão. Se no gráfico não se distinguir
uma reta, pode-se, então, adicionar ao modelo termos quadráticos e cúbicos, para se
dar conta de relações não lineares.
A má especificação também pode ocorrer pela falta de teste para interações entre os
preditores. Para a correta especificação do modelo é importante que se teste para estas
interações e que as interações significantes sejam incluı́das no modelo preditivo final.
Todos estes problemas podem levar ao não balanceamento.
Como este processo de inclusão de termos polinomiais e de interação é interativo e
trabalhoso, métodos automatizados para estimativa do escore de propensão usando
aprendizagem de máquinas foram propostos. A vantagem destes métodos é que se
tende a conseguir, de forma bastante rápida, modelos mais bem especificados do que os
obtidos por regressão logı́stica. O método de aprendizagem de máquinas mais utilizado
para estimativa do escore de propensão é o GBM (abreviatura de generalized boosted
modeling, modelagem ampliada generalizada). Este método é baseado em árvores de
decisão e, por meio de algoritmos iterativos, seleciona automaticamente covariáveis,
termos polinomiais e de interação a serem incluı́dos na modelagem, para que se obtenha
o melhor balanceamento possı́vel entre os grupos de tratamento e controle.
Há outros métodos propostos para cálculo do escore de propensão. O leitor interessado
poderá consultar Leite (2017); Guo and Fraser (2015).
8.3.4. Ponderação pelo escore de propensão

Uma vez calculado o escore de propensão, por regressão logı́stica ou por modelagem
ampliada generalizada, o próximo passo é obter os pesos e estimar o efeito causal em
modelo ponderado pelo escore de propensão. No método de ponderação pelo escore de
propensão, também denominado, ponderação pelo inverso da probabilidade de seleção,
a estimativa é feita em duas etapas.
Na primeira etapa se usa um modelo preditivo, por meio do qual se estima o escore
de propensão, ou seja, a probabilidade de ter nascido de parto cesáreo, em função
das variáveis preditoras do tipo de parto. Na segunda etapa se utiliza um modelo
explicativo, incluindo-se apenas o tratamento e o desfecho, ou seja o tipo de parto e o
ı́ndice de massa corporal. Neste modelo explicativo é estimada a diferença, em kg/m2 ,
154
do ı́ndice de massa corporal entre nascidos de parto cesáreo e normal, ponderando-se

pelas diferentes probabilidades de recebimento do tratamento.
Na primeira etapa, inicialmente se calcula a probabilidade de tratamento para cada
indivı́duo, ou seja, se estima o escore de propensão, como fizemos na seção anterior.
Em seguida, é necessário se calcular os pesos que serão usados na ponderação no
modelo explicativo. Desta forma, os indivı́duos que tiverem maior probabilidade de
serem selecionados para receber o tratamento terão um peso menor. Por outro lado,
os participantes que tiverem menor probabilidade de receber o tratamento terão um
peso maior. O objetivo final é balancear os grupos de tratamento e controle, de forma
que, ao final, eles se tornem permutáveis, condicionalmente às variáveis incluı́das na
primeira etapa, ou seja, no modelo preditivo.
Este método de ponderação pelo escore de propensão também é denominado de
modelo estrutural marginal (Hernan and Robins, 2018). É chamado de estrutural,
porque é baseado na estimativa de respostas contrafatuais. Usamos as observações
do grupo controle, ponderadas pelo escore de propensão, para reequilibrar os grupos,
como estimativa da resposta contrafatual no grupo tratado, caso ele não tivesse sido
tratado. Usamos também as observações do grupo tratado, ponderadas pelo escore de
propensão, para estimar a resposta contrafatual no grupo controle, caso este grupo
tivesse sido tratado. O modelo é denominado marginal, pois não se inclui variável de
ajuste no modelo, ou seja, este modelo é não condicional. Como o modelo é saturado
por só incluir o desfecho e uma variável explanatória (o tratamento), por definição este
modelo tem ajuste perfeito (Hernan and Robins, 2018).
Como estes pesos são calculados? Bem, isto depende do tipo de efeito causal que se
deseja estimar. Há 3 tipos de efeito causal que podem ser estimados (tabela 8.5). Por
meio do ATE (Efeito médio do tratamento), a eficácia relativa média do tratamento em
toda a população é estimada. Quando se calcula o ATT (Efeito médio do tratamento
entre os tratados), esta eficácia média do tratamento é calculada apenas nos tratados.
Neste caso se estima o que teria acontecido com os controles, caso eles tivessem sido
tratados. Quando se calcula o ATC (Efeito médio do tratamento entre os tratados), se
estima a eficácia média do tratamento entre os controles.
Tabela 8.5.: Tipos de efeito causal
Abreviatura Efeito Causal Fórmula O que é estimado?

ATE Efeito médio do E(D1 − D0 ) Eficácia relativa média
tratamento do tratamento na po-
pulação
ATT Efeito médio do E(D1 − D0 |T = 1) Eficácia relativa média
tratamento en- do tratamento nos tra-
tre os tratados tados
ATC Efeito médio do E(D1 − D0 |T = 0) Eficácia relativa média
tratamento en- do tratamento nos con-
tre os controles troles
155
Qual estimativa de efeito causal usar? Isto vai depender dos objetivos, ou seja, da
pergunta do estudo. Se queremos extrapolar os resultados para toda a população,
é necessário o cálculo do ATE. Se estamos avaliando programas de intervenção não
randomizados, queremos saber o que aconteceria com os controles caso eles também
tivessem sido tratados. Neste caso podemos calcular o ATT.
Entretanto, nem sempre o pesquisador poderá calcular qualquer uma dessas três
medidas de efeito causal. Para que o ATE possa ser calculado é necessário que haja zona
de suporte comum, tanto para tratados quanto para não tratados. Neste caso, teremos
que encontrar controles adequados para todos os tratados, que sejam semelhantes
em termos do escore de propensão, e também encontrar tratados adequados para os
controles. Para o cálculo do ATT basta que haja zona de suporte comum para os
tratados, ou seja, há necessidade de encontrar contrastes adequados apenas para os
tratados.
A melhor forma de visualizar se há zona de suporte comum é por meio de um boxplot
do escore de propensão, plotado separadamente para tratados e controles. Se todos os
tratados tiverem controles adequados e todos os controles tiverem tratados adequados o
ATE pode ser estimado. Caso contrário, apenas o ATT ou ATC poderão ser estimados.
No estudo experimental randomizado o ATE é igual ao ATT, que por sua vez é igual
ao ATC.
Na figura 8.1 vemos o boxplot do escore de propensão nos dois grupos do estudo
(parto vaginal e cesáreo). Há uma boa zona de suporte comum, pois os dois boxplots
estão quase paralelos. Entretanto, nota-se que há uma tendência dos indivı́duos do grupo
de tratamento (nascidos por cesariana, codificados como 1) terem maiores valores do
escore de propensão do que os do grupo controle (nascidos de parto normal, codificados
como zero). Note que a mediana é maior no grupo tratado. Neste caso, como há suporte
comum, pode ser realizada a estimativa do ATE.
Veja, agora, na figura 8.2, obtida de outro banco de dados, que os tratados (codificados
como 1) possuem pouca zona de suporte comum com os não tratados (codificados
como 0). Praticamente toda a distribuição dos tratados está fora da distribuição dos
não tratados. Observe que no grupo tratado a maioria dos escores de propensão estão
acima de 0,4, enquanto no grupo controle os escores predominam na faixa inferior a
0,2. Neste caso o ATE não pode ser estimado, sendo a alternativa estimar o ATT.
Neste caso, ao usar o procedimento de ponderação pelo inverso da probabilidade de
seleção, teremos que dar maior peso aos tratados com escore de propensão baixo e maior
peso aos não tratados com escore de propensão alto, para compensar e, assim, poder
formar contrastes contrafatuais adequados na ausência de randomização. Usaremos
este exemplo no próximo capı́tulo, quando isto será mais bem explicado.
Na tabela 8.7 estão calculados o escore de propensão, por meio de regressão logı́stica e
o peso para estimativa do ATE, usando-se as fórmulas da tabela 8.6, a partir do banco de
dados fictı́cio, criado para responder à pergunta se a participação no programa de saúde
da famı́lia causa reduz o percentual de crianças com esquema vacinal básico incompleto
no primeiro ano de vida. Observe que às observações mais raras são atribuı́dos pesos
maiores e às observações mais comuns pesos menores para se atingir o balanceamento
dos grupos. Assim, no grupo controle são mais comuns crianças de famı́lias com baixa
renda e escolaridade, como, por exemplo, as observações 1 e 4. A estes casos foram
156
0.6
Escore de propensão
0.4
0.2
0 1
Tipo de parto
Figura 8.1.: Verificando área de suporte comum pelo boxplot.
Tabela 8.6.: Cálculo dos pesos para tratamento binário
Efeito Causal Grupo Peso

Efeito médio do trata- Tratamento 1/P r[T = 1|P ]
mento (ATE)
Controle 1/(1 − P r[T = 1|P ])
Efeito médio do trata- Tratamento 1
mento entre os tratados
(ATT)
Controle P r[T = 1|P ]/(1 − P r[T = 1|P ])
atribuı́dos pesos baixos. No grupo de participantes do PSF, por outro lado, são mais
raras crianças com maior renda e escolaridade, como a criança 2. Note que esta criança
recebeu um peso maior (2,35) para compensar. Já no grupo controle são mais comuns
crianças de maior renda e escolaridade, que receberam pesos baixos, e menos comuns
157
0.8
0.6
Escore de propensao
0.4
0.2
0.0
0 1
Programa de Retreinamento Profissional
crianças de menor renda e escolaridade, que receberam pesos mais elevados para
compensar. A atribuição de pesos diferenciados é uma estratégia para reequilibrar os
grupos e atingir a permutabilidade. Se o equilı́brio for atingido pode-se, então, estimar
o efeito causal sem viés em relação às variáveis observadas e incluı́das no modelo
preditivo.
8.3.5. Verificação do balanceamento após a implementação do

escore de propensão
Uma vez calculados os escores de propensão e atribuı́dos os pesos para cálculo do ATE
ou ATT, é fundamental, antes do cálculo do efeito causal, verificar se o balanceamento
foi atingido em relação às variáveis observadas. A melhor forma de se avaliar isto é por
meio da diferença padronizada absoluta nas médias e da razão de variâncias. Como
vimos, para que se considere que o balanceamento adequado foi atingido, a diferença
padronizada absoluta nas médias idealmente deve ser <0,10 e a razão de variâncias
deve estar entre 0,8 e 1,2.
158
Tabela 8.7.: Cálculo do escore de propensão e dos pesos para estimativa do ATE
Número PSFa Rendab Escolaridadec Escored Peso

1 1 0,25 2 0,90 1,11
2 1 1 4 0,43 2,35
3 1 0,75 6 0,53 1,89
4 1 0,50 2 0,81 1,23
5 1 0,50 8 0,63 1,58
6 0 1 3 0,46 1,87
7 0 0,75 7 0,49 1,96
8 0 0,50 5 0,73 3,72
9 0 2 10 0,02 1.02
10 0 3 15 0,01 1,00
a
PSF = Participação no Programa de Saúde da Famı́lia
b
Renda familiar per capita em salários mı́nimos
c
Escolaridade materna em anos de estudo
d
Escore de propensão
Observe, abaixo, a avaliação do balanceamento obtida no Stata após a realização

da ponderação pelo inverso da probabilidade de seleção por meio do comando teffects.
Note que todas as diferenças absolutas nas médias padronizadas idealmente são <0,10
e todas as razões de variâncias estão no intervalo entre 0,8 e 1,2. Desta forma, pelo
menos em relação às variáveis observadas, pode-se afirmar que o balanceamento foi
atingido.
Covariate balance summary

Raw Weighted
Number of obs = 1,904 1,904.0

Treated obs = 591 952.4
Control obs = 1,313 951.6
Standardized differences Variance ratio

Raw Weighted Raw Weighted
catint .1928387 -.0031279 1.800543 .9899896

trabmat .1370162 -.0014911 1.219209 .9977647
escmae
1a4 -.1532383 .0055268 .9554554 1.001324
5a8 .0448425 -.0060748 1.044838 .9940105
9a11 .1007613 -.0054168 1.200763 .9898137
12+ .1476059 -.0000941 1.494564 .9997353
ocup
qualsemi .0362967 .0108872 .980052 .9937518
nmanual .2036214 -.0085443 1.43121 .9840537
159
sconj
uniaocons -.0732544 .0180009 .7712619 1.061799
casada .1169 -.0113744 .7504987 1.026569
idmae .3225247 -.0078283 1.037367 .9415375

parid -.0719253 -.011124 .7226207 .9273329
bpeso .0107241 .0045579 1.040332 1.016417
premat -.0558805 -.0219809 .8228868 .9255912
fumomat -.0308547 .0001705 .9665551 1.000191
sexo -.0071836 -.0038842 1.000277 .9996545
Usando o pacote twang do R, estimamos o escore de propensão por meio de GBM.

Veja, abaixo, a listagem das estatı́sticas de balanceamento antes e após a implementação
do escore de propensão. Note que todas as diferenças padronizadas absolutas nas médias
foram inferiores a 0,10 e todas as estatı́sticas (teste t de Student para variáveis contı́nuas,
qui-quadrado para variáveis categóricas e o teste de Kolmogorov-Smirnov) foram não
significantes, indicando que o balanceamento foi atingido em relação as variáveis
observadas.
$unw
catint 0.113 0.317 0.059 0.236 0.203 3.700 0.000 0.054 0.178
trabmat 0.237 0.426 0.181 0.385 0.139 2.717 0.007 0.056 0.153
escmaef : 1 0.012 0.108 0.038 0.191 −0.243 6.885 0.000 0.026 0.000
escmaef : 2 0.387 0.487 0.463 0.499 −0.155 NA NA 0.076 0.000
escmaef : 3 0.294 0.456 0.274 0.446 0.044 NA NA 0.020 0.000
escmaef : 4 0.184 0.388 0.147 0.354 0.097 NA NA 0.037 0.000
escmaef : 5 0.122 0.327 0.078 0.268 0.135 NA NA 0.044 0.000
ocupf : 1 0.140 0.347 0.235 0.424 −0.271 16.440 0.000 0.094 0.000
ocupf : 2 0.648 0.478 0.631 0.483 0.037 NA NA 0.017 0.000
ocupf : 3 0.212 0.408 0.135 0.342 0.188 NA NA 0.077 0.000
sconjf :1 0.039 0.193 0.058 0.234 −0.098 2.697 0.068 0.019 0.068
sconjf :2 0.056 0.230 0.074 0.262 −0.079 NA NA 0.018 0.068
sconjf :3 0.905 0.293 0.868 0.338 0.126 NA NA 0.037 0.068
idmae 27.257 5.809 25.401 5.703 0.320 6.491 0.000 0.140 0.000
parid 2.242 1.487 2.359 1.749 −0.070 −1.499 0.134 0.034 0.709
bpeso 0.064 0.245 0.062 0.241 0.011 0.216 0.829 0.003 1.000
premat 0.059 0.236 0.073 0.260 −0.055 −1.150 0.250 0.014 1.000
fumomat 0.247 0.432 0.260 0.439 −0.031 −0.625 0.532 0.013 1.000
sexo 0.475 0.500 0.479 0.500 −0.007 −0.145 0.885 0.004 1.000
$ e s . mean .ATE
catint 0.079 0.270 0.074 0.262 0.018 0.374 0.709 0.005 1.000
trabmat 0.199 0.400 0.195 0.396 0.010 0.195 0.845 0.004 1.000
escmaef : 1 0.019 0.136 0.031 0.173 −0.087 0.516 0.711 0.012 0.711
escmaef : 2 0.435 0.496 0.442 0.497 −0.012 NA NA 0.006 0.711
escmaef : 3 0.287 0.452 0.278 0.448 0.019 NA NA 0.009 0.711
escmaef : 4 0.163 0.370 0.158 0.365 0.013 NA NA 0.005 0.711
escmaef : 5 0.095 0.294 0.091 0.288 0.014 NA NA 0.004 0.711
ocupf : 1 0.190 0.392 0.207 0.405 −0.044 0.347 0.703 0.017 0.703
ocupf : 2 0.648 0.478 0.638 0.481 0.021 NA NA 0.010 0.703
ocupf : 3 0.162 0.369 0.155 0.362 0.019 NA NA 0.007 0.703
sconjf :1 0.047 0.211 0.052 0.223 −0.028 0.242 0.785 0.006 0.785
sconjf :2 0.061 0.239 0.067 0.250 −0.026 NA NA 0.006 0.785
sconjf :3 0.892 0.310 0.880 0.325 0.039 NA NA 0.012 0.785
idmae 25.855 5.520 25.822 5.706 0.006 0.111 0.911 0.014 1.000
parid 2.199 1.501 2.306 1.666 −0.067 −1.296 0.195 0.019 0.999
bpeso 0.056 0.230 0.061 0.239 −0.020 −0.394 0.694 0.005 1.000
premat 0.055 0.228 0.068 0.251 −0.053 −1.034 0.301 0.013 1.000
fumomat 0.248 0.432 0.254 0.435 −0.013 −0.254 0.799 0.006 1.000
160
es.mean.ATE
0.3
Absolute standard difference
0.2
0.1
0.0
Unweighted Weighted
Figura 8.3.: Diferenças absolutas na médias padronizadas.
sexo 0.481 0.500 0.480 0.500 0.001 0.022 0.982 0.001 1.000
Na figura 8.3, obtida no R, fica mais fácil de visualizar que todas as diferenças
padronizadas absolutas nas médias se encontram abaixo de 0,10. Note, ainda, que as
diferenças absolutas nas médias padronizadas diminuı́ram, comparando-se as estimativas
não ponderadas com as ponderadas.
8.3.6. Cálculo do efeito causal em modelo ponderado pelo escore

de propensão
Uma vez verificado o balanceamento podemos prosseguir agora para a estimativa
do efeito causal (ATE) em modelo de regressão linear, ponderado pelo inverso da
probabilidade de seleção (ou de tratamento). Quando estimamos o escore de propensão
por regressão logı́stica, a estimativa obtida foi 1,29 (Intervalo de Confiança de 95% 0,77
- 1,82), com p <0,001, sugerindo que dentre os nascidos com parto cesárea o ı́ndice
de massa corporal é 1,29 kg/m2 do que entre os nascidos de parto vaginal. Quando
usamos GBM a estimativa foi bastante próxima, 1,25, com p <0,001.
161
8.4. Correção para efeito do desenho e/ou para perdas

de seguimento
Usando-se ponderação pelo inverso da probabilidade de seleção é também possı́vel
levar-se em conta o delineamento complexo de amostragem e corrigir para o efeito de
desenho. Se as probabilidades de seleção para cada participante não forem as mesmas,
é possı́vel se incluir o peso referente ao processo desigual de seleção dos indivı́duos.
Em vários programas estatı́sticos também é possı́vel levar-se em conta o efeito de
conglomerado (cluster) e a estratificação utilizada quando da escolha da amostra.
Além disso, se houver perdas de seguimento e for possı́vel se recuperar as probabili-
dades de participação no estudo, é possı́vel se realizar ponderação também por perdas
de seguimento, corrigindo-se ou atenuando-se o viés de seleção. Assim, bastar calcular,
por exemplo, em um modelo logı́stico, as probabilidades de cada indivı́duo participar
no seguimento e, depois disso, calcular o inverso desta probabilidade de seleção, que
corresponderá ao peso que o participante terá na análise. Desta forma o peso para
corrigir o viés de seleção será dado pela fórmula 8.3, onde P=participação no estudo , T
= tratamento e P = demais variáveis preditoras da participação (Hernan and Robins,
2018).
1
P esoP art = (8.3)
P r[P art = 1|T, P ]
E, no final, basta multiplicar o peso calculado a partir do escore de propensão, pelo

peso referente à probabilidade de participação no estudo. Este peso final, P esoF inal =
P esoEP ∗ P esoP art será, então, usado na ponderação, quando se estará corrigindo ou
atenuando, simultaneamente, para viés de confundimento e para viés de seleção. O
primeiro peso, P esoEP , é o inverso da probabilidade de tratamento, em função das
variáveis preditoras do tratamento, que corresponde ao escore de propensão. Por meio
deste peso é feito o ajuste para a distribuição desigual de algumas caracterı́sticas dos
sujeitos nos grupos de tratamento e controle. Assim, a amostra ponderada representa
uma pseudo-população na qual tratados e não tratados passam a possuir distribuições
similares em relação às variáveis observadas (Leite, 2017). O segundo peso P esoP art é
o inverso da probabilidade de participação no estudo em função das variáveis preditoras
da participação, sendo que, geralmente, o tratamento também é preditor da participação
no estudo. Este peso amostral ajusta para viés de seleção devido à superamostragem de
indivı́duos com determinadas caracterı́sticas por efeito deliberado do desenho ou por
perdas de seguimento, de tal forma que a amostra ponderada passa a ser semelhante à
população de origem (Leite, 2017).
162
9. Exemplo de análise com escore de
propensão em Epidemiologia no R
Para rodar este exemplo prático é necessária a instalação do R, R Studio e dos seguintes
pacotes:
# I n s t a l a n d o o s p a c o t e s n e c e s s á r i o s
i n s t a l l . packages ( ” survey ” )
i n s t a l l . p a c k a g e s ( ” twang ” )
i n s t a l l . packages ( ” descr ” )
i n s t a l l . p a c k a g e s ( ” MatchIt ” )
i n s t a l l . p a c k a g e s ( ” Matching ” )
i n s t a l l . p a c k a g e s ( ” rbounds ” )
9.1. Estimativa do efeito causal por meio de escore de

propensão
Neste exemplo, vamos realizar a estimativa do efeito de um programa de retreinamento
profissional no rendimento dos indivı́duos. Os dados são do National Supported Work
Project, publicados por Dehejia e Wahba (1999). Na tabela 9.1 constam as variáveis
que utilizaremos neste exercı́cio.
Os comandos que se seguem realizam a análise no R.
9.1.1. Ponderação com escore de propensão

1. Para abrir o arquivo precisamos primeiro carregar o pacote twang. Em seguida abra
o arquivo lalonde e peça a listagem das primeiras 15 e das últimas 15 observações.
Em seguida, carregue o pacote ou biblioteca descr e obtenha a frequência da
variável treat. Observe que há 185 casos que receberam o retreinamento e 429
não treinados, que servirão como controles.
# Carregando p a c o t e twang
> l i b r a r y ( twang )
# Abrindo banco de dados − l a l o n d e

# Obtendo l i s t a g e m da s o b s e r v a ç õ e s
> data ( l a l o n d e )
> head ( l a l o n d e , n=15)

t r e a t a g e educ b l a c k h i s p a n m a r r i e d n o d e g r e e r e 7 4 r e 7 5 re78
1 1 37 11 1 0 1 1 0 0 9930.0460
2 1 22 9 0 1 0 1 0 0 3595.8940
3 1 30 12 1 0 0 0 0 0 24909.4500
4 1 27 11 1 0 0 1 0 0 7506.1460
5 1 33 8 1 0 0 1 0 0 289.7899
163
9. Exemplo de análise com escore de propensão em Epidemiologia no R
Tabela 9.1.: Descrição do banco de dados lalonde
Variável Descrição Codificação

treat Participação no programa de treinamento 0 = não
1= sim
age Idade em anos 17 a 55
educ Escolaridade em anos de estudo 0 a 18
black Cor da pele preta 0 = não
1= sim
hispan Hispânico 0 = não
1= sim
married Casado 0 = não
1= sim
nodegree Sem diploma universitário 0 = não
1= sim
re74 Rendimento anual em 1974 0 a 35040.07
6 1 22 9 1 0 0 1 0 0 4056.4940
7 1 23 12 1 0 0 0 0 0 0.0000
8 1 32 11 1 0 0 1 0 0 8472.1580
9 1 22 16 1 0 0 0 0 0 2164.0220
10 1 33 12 0 0 1 0 0 0 12418.0700
11 1 19 9 1 0 0 1 0 0 8173.9080
12 1 21 13 1 0 0 0 0 0 17094.6400
13 1 18 8 1 0 0 1 0 0 0.0000
14 1 27 10 1 0 1 1 0 0 18739.9300
15 1 17 7 1 0 0 1 0 0 3023.8790
> t a i l ( l a l o n d e , n=15)
t r e a t a g e educ b l a c k h i s p a n m a r r i e d n o d e g r e e r e 7 4 r e 7 5 re78
600 0 43 6 0 0 1 1 0 0 0.0000
601 0 34 12 1 0 0 0 0 0 0.0000
602 0 16 8 0 1 0 1 0 0 12242.9600
603 0 27 12 0 0 1 0 0 0 1533.8800
604 0 51 4 1 0 0 1 0 0 0.0000
605 0 39 2 1 0 1 1 0 0 964.9555
606 0 55 8 0 0 1 1 0 0 0.0000
607 0 16 9 0 0 0 1 0 0 5551.8190
608 0 27 10 1 0 0 1 0 0 7543.7940
609 0 25 14 0 0 0 0 0 0 0.0000
610 0 18 11 0 0 0 1 0 0 10150.5000
611 0 24 1 0 1 1 1 0 0 19464.6100
612 0 21 18 0 0 0 0 0 0 0.0000
613 0 32 5 1 0 1 1 0 0 187.6713
614 0 16 9 0 0 0 1 0 0 1495.4590
# Carregando b i b l i o t e c a descr
> library ( descr )
# Obtendo a d i s t r i b u i ç ã o de f r e q u ê n c i a s da v a r i á v e l t r a t a m e n t o
> freq ( lalonde $ treat )
lalonde $ treat
164
9.1. Estimativa do efeito causal por meio de escore de propensão
F r e q uê n c i a P e r c e n t u a l
0 260 58.43
1 185 41.57
Total 445 100.00
2. Após a abertura do arquivo, vamos primeiro calcular as estimativas de associação

em modelos de regressão simples (não ajustado) e múltipla (ajustado). A variável
explanatória é treat, codificada como 1 quando o indivı́duo participou do programa
de retreinamento profissional e 0 em caso contrário. A variável desfecho é a renda
em 1978, quatro anos após o inı́cio do programa de retreinamento. Compare as
duas estimativas do efeito médio do tratamento (ATE). Observe que a estimativa
não ajustada não foi significante (p=0,334), enquanto a estimativa ajustada foi de
um aumento de US$ 1,548, p<0,048 no grupo tratado, que frequentou o programa
de retreinamento profissional, comparado com o grupo controle, que participou
do programa.
# Estimando a s s o c i a ç ã o em modelo de r e g r e s s ã o não a j u s t a d o
> r e g <− lm ( r e 7 8 ˜ t r e a t , d a t a=l a l o n d e )
> summary ( r e g )
Call :
lm ( f o r m u l a = r e 7 8 ˜ t r e a t , d a t a = l a l o n d e )
Residuals :
Min 1Q Median 3Q Max
−6984 −6349 −2048 4100 53959
Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( >| t | )
( Intercept ) 6984.2 360.7 19.362 <2e −16 ∗∗∗
treat −635.0 657.1 −0.966 0.334
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1
R e s i d u a l s t a n d a r d e r r o r : 7471 on 612 d e g r e e s o f f r e e d o m
M u l t i p l e R−s q u a r e d : 0.001524 , A d j u s t e d R−s q u a r e d : −0.0001079
F− s t a t i s t i c : 0 . 9 3 3 8 on 1 and 612 DF, p−v a l u e : 0 . 3 3 4 2
# Estimando a s s o c i a ç ã o em modelo de r e g r e s s ã o a j u s t a d o
> r e g <− lm ( r e 7 8 ˜ t r e a t + a g e + educ + b l a c k + h i s p a n + n o d e g r e e +
m a r r i e d + r e 7 4 + r e 7 5 , d a t a=l a l o n d e )
> summary ( r e g )
Call :
lm ( f o r m u l a = r e 7 8 ˜ t r e a t + a g e + educ + b l a c k + h i s p a n + n o d e g r e e +
married + re74 + re75 , data = l a l o n d e )
Residuals :
−13595 −4894 −1662 3929 54570
Coefficients :
( Intercept ) 6 . 6 5 1 e+01 2 . 4 3 7 e+03 0.027 0.9782
treat 1 . 5 4 8 e+03 7 . 8 1 3 e+02 1.982 0.0480 ∗
age 1 . 2 9 8 e+01 3 . 2 4 9 e+01 0.399 0.6897
educ 4 . 0 3 9 e+02 1 . 5 8 9 e+02 2.542 0.0113 ∗
black −1.241 e+03 7 . 6 8 8 e+02 −1.614 0.1071
hispan 4 . 9 8 9 e+02 9 . 4 1 9 e+02 0.530 0.5966
nodegree 2 . 5 9 8 e+02 8 . 4 7 4 e+02 0.307 0.7593
married 4 . 0 6 6 e+02 6 . 9 5 5 e+02 0.585 0.5590
165
re74 2 . 9 6 4 e −01 5 . 8 2 7 e −02 5 . 0 8 6 4 . 8 9 e −07 ∗∗∗

re75 2 . 3 1 5 e −01 1 . 0 4 6 e −01 2.213 0.0273 ∗
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1
M u l t i p l e R−s q u a r e d : 0.1478 , A d j u s t e d R−s q u a r e d : 0.1351
F− s t a t i s t i c : 1 1 . 6 4 on 9 and 604 DF, p−v a l u e : < 2 . 2 e −16
3. Agora vamos verificar o balanceamento das variáveis antes da implementação do

escore de propensão. Faremos teste t de Student para variáveis contı́nuas e teste
do qui-quadrado para variáveis categóricas. Observe que as variáveis idade, renda
em 1974, renda em 1975, não possuir diploma universitário, percentual de pretos,
percentual de hispânicos e ser casado(a) não se encontram balanceadas entre os
grupos (todos os p valores são significantes). Apenas a variável escolaridade está
balanceada entre os grupos tratamento e controle (p valor não significante).
# Checando b a l a n c e a m e n t o e n t r e o s g r u p o s a n t e s da i m p l e m e n t a ç ã o do
e s c o r e de p r o p e n s ã o
# v a r i á v e l c o n tı́ n u a − t e s t t de S t u d e n t
> t . t e s t ( a g e ˜ t r e a t , d a t a=l a l o n d e , v a r . e q u a l=TRUE)
Two Sample t−t e s t
data : a g e by t r e a t
t = 2 . 5 5 9 , d f = 6 1 2 , p−v a l u e = 0 . 0 1 0 7 4
alternative hypothesis : true d i f f e r e n c e i n means i s n o t e q u a l t o 0
95 p e r c e n t c o n f i d e n c e i n t e r v a l :
0.5149437 3.9132300
sample e s t i m a t e s :
mean i n group 0 mean i n group 1
28.03030 25.81622
> t . t e s t ( educ ˜ t r e a t , d a t a=l a l o n d e , v a r . e q u a l=TRUE)
data : educ by t r e a t
t = −0. 47 77 5 , d f = 6 1 2 , p−v a l u e = 0 . 6 3 3
a l t e r n a t i v e h y p o t h e s i s : t r u e d i f f e r e n c e i n means i s n o t e q u a l t o 0
−0.5648015 0.3437720
10.23543 10.34595
> t . t e s t ( r e 7 4 ˜ t r e a t , d a t a=l a l o n d e , v a r . e q u a l=TRUE)
data : r e 7 4 by t r e a t
t = 6 . 3 8 1 5 , d f = 6 1 2 , p−v a l u e = 3 . 4 6 5 e −10
2439.282 4608.044
5619.237 2095.574
166
> t . t e s t ( r e 7 5 ˜ t r e a t , d a t a=l a l o n d e , v a r . e q u a l=TRUE)
data : r e 7 5 by t r e a t
t = 3 . 2 4 8 6 , d f = 6 1 2 , p−v a l u e = 0 . 0 0 1 2 2 3
369.5384 1499.3199
2466.484 1532.055
# v a r i á v e l c a t e g ó r i c a − t e s t e do qui−quadrado
> c r o s s t a b ( l a l o n d e $ t r e a t , l a l o n d e $ n o d e g r e e , prop . r=TRUE, c h i s q=TRUE,

p l o t = F)
Conte údo d as c é l u l a s
|−−−−−−−−−−−−−−−−−−−−−−−−−|
| Contagem |
| P e r c e n t u a l por l i n h a |
|−−−−−−−−−−−−−−−−−−−−−−−−−|
======================================
lalonde $ nodegree
lalonde $ treat 0 1 Total
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
0 173 256 429
40.3% 59.7% 69.9%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
1 54 131 185
29.2% 70.8% 30.1%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Total 227 387 614
======================================
E s t a tı́ s t i c a s p a r a t o d o s o s f a t o r e s da t a b e l a
P e a r s o n ’ s Chi−s q u a r e d t e s t
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 6 . 8 8 0 3 2 3 g. l . = 1 p = 0.00871
P e a r s o n ’ s Chi−s q u a r e d t e s t w i t h Y at e s ’ c o n t i n u i t y c o r r e c t i o n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 6 . 4 1 0 6 8 2 g. l . = 1 p = 0.0113
F r e q uê n c i a e s p e r a d a mı́nima : 6 8 . 3 9 5 7 7
> c r o s s t a b ( l a l o n d e $ t r e a t , l a l o n d e $ m a r r i e d , prop . r=TRUE, c h i s q=TRUE, plot

= F)
|−−−−−−−−−−−−−−−−−−−−−−−−−|
| Contagem |
|−−−−−−−−−−−−−−−−−−−−−−−−−|
======================================
l a l o n d e $ married
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
0 209 220 429
48.7% 51.3% 69.9%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
1 150 35 185
81.1% 18.9% 30.1%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Total 359 255 614
167
======================================
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 5 5 . 7 5 2 4 4 g. l . = 1 p = 8 . 2 2 e −14
P e a r s o n ’ s Chi−s q u a r e d t e s t w i t h Y a te s ’ c o n t i n u i t y c o r r e c t i o n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 5 4 . 4 2 7 6 4 g. l . = 1 p = 1 . 6 1 e −13
> c r o s s t a b ( l a l o n d e $ t r e a t , l a l o n d e $ b l a c k , prop . r=TRUE, c h i s q=TRUE, plot =

F)
Conte údo das c é l u l a s
|−−−−−−−−−−−−−−−−−−−−−−−−−|
| Contagem |
|−−−−−−−−−−−−−−−−−−−−−−−−−|
======================================
lalonde $ black
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
0 342 87 429
79.7% 20.3% 69.9%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
1 29 156 185
15.7% 84.3% 30.1%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Total 371 243 614
======================================
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 2 2 1 . 7 0 8 5 g. l . = 1 p <2e −16
P e a r s o n ’ s Chi−s q u a r e d t e s t w i t h Y a te s ’ c o n t i n u i t y c o r r e c t i o n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 2 1 9 . 0 3 8 4 g. l . = 1 p <2e −16
> c r o s s t a b ( l a l o n d e $ t r e a t , l a l o n d e $ h i s p a n , prop . r=TRUE, c h i s q=TRUE, plot

= F)
|−−−−−−−−−−−−−−−−−−−−−−−−−|
| Contagem |
|−−−−−−−−−−−−−−−−−−−−−−−−−|
======================================
lalonde $ hispan
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
0 368 61 429
85.8% 14.2% 69.9%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
1 174 11 185
94.1% 5.9% 30.1%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Total 542 72 614
======================================
168
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 8 . 5 4 6 9 1 4 g. l . = 1 p = 0.00346
P e a r s o n ’ s Chi−s q u a r e d t e s t w i t h Y at e s ’ c o n t i n u i t y c o r r e c t i o n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 7 . 7 6 6 3 5 9 g. l . = 1 p = 0.00532
4. Podemos também fazer o teste em modelo de regressão linear, colocando a variável

contı́nua como resposta e o tratamento como variável explanatória. Veja um
exemplo abaixo com a variável contı́nua renda em 1974.
# v a r i á v e l c o n tı́ n u a − r e g r e s s ã o l i n e a r com o t r a t a m e n t o como v a r i á v e l
e x p l a n a t ó r i a e a v a r i á v e l c o n tı́ n u a ( r e n d a em 1 9 7 4 ) como r e s p o s t a
> r e g <− lm ( r e 7 4 ˜ t r e a t , d a t a=l a l o n d e )
> summary ( r e g )
Call :
lm ( f o r m u l a = r e 7 4 ˜ t r e a t , d a t a = l a l o n d e )
Residuals :
−5619 −4970 −2096 2674 32944
Coefficients :
( Intercept ) 5619.2 303.1 1 8 . 5 4 0 < 2 e −16 ∗∗∗
treat −3523.7 552.2 −6.381 3 . 4 6 e −10 ∗∗∗
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1
M u l t i p l e R−s q u a r e d : 0.06239 , A d j u s t e d R−s q u a r e d : 0.06086
F− s t a t i s t i c : 4 0 . 7 2 on 1 and 612 DF, p−v a l u e : 3 . 4 6 5 e −10
5. Podemos também fazer o teste em modelo de regressão logı́stica, colocando a

variável categórica como resposta e o tratamento como variável explanatória. Veja
um exemplo abaixo com a variável categórica sem diploma universitário.
# v a r i á v e l c a t e g ó r i c a − r e g r e s s ã o l o gı́ s t i c a com o t r a t a m e n t o como
v a r i á v e l e x p l a n a t ó r i a e a v a r i á v e l c a t e g ó r i c a ( sem d i s p l o m a
u n i v e r s i t á r i o ) como r e s p o s t a
> r e g <− glm ( n o d e g r e e ˜ t r e a t , f a m i l y=b i n o m i a l ( ) , d a t a=l a l o n d e )
> summary ( r e g )
Call :
glm ( f o r m u l a = n o d e g r e e ˜ t r e a t , f a m i l y = binomial ( ) , data = l a l o n d e )
Deviance R e s i d u a l s :
−1.5693 −1.3477 0.8308 1.0162 1.0162
Coefficients :
E s t i m a t e Std . E r r o r z v a l u e Pr ( >| z | )
( Intercept ) 0.39189 0.09842 3 . 9 8 2 6 . 8 4 e −05 ∗∗∗
treat 0.49433 0.18931 2.611 0 . 0 0 9 0 2 ∗∗
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1
169
( D i s p e r s i o n p a r a m e t e r f o r b i n o m i a l f a m i l y t a k e n t o be 1 )
Null deviance : 809.01 on 613 d e g r e e s o f freedom

Residual deviance : 801.98 on 612 d e g r e e s o f freedom
AIC : 8 0 5 . 9 8
Number o f F i s h e r S c o r i n g iterations : 4
6. Vamos agora calcular o escore de propensão para cada indivı́duo, que nada mais
é do que a probabilidade de participação no programa predita pelo modelo. Para
realizar isto, vamos rodar um modelo logı́stico, tendo como desfecho a participação
no treinamento (treat) e como variáveis preditoras: idade, escolaridade, cor da
pele preta, hispânico, casado, sem diploma universitário, renda em 74 e renda em
75.
# E s t i m a ç ã o do e s c o r e de p r o p e n s ã o p o r r e g r e s s ã o l o gı́ s t i c a
> p s l o g<− glm ( t r e a t ˜ a g e + educ + b l a c k + h i s p a n + n o d e g r e e + m a r r i e d +
re74 + re75 ,
+ f a m i l y=b i n o m i a l ( ) , d a t a=l a l o n d e )
> summary ( p s l o g )
Call :
glm ( f o r m u l a = t r e a t ˜ a g e + educ + b l a c k + h i s p a n + n o d e g r e e +
married + re74 + re75 , f a m i l y = binomial ( ) , data = l a l o n d e )
Deviance R e s i d u a l s :
−1.7645 −0.4736 −0.2862 0.7508 2.7169
Coefficients :
E s t i m a t e Std . E r r o r z v a l u e Pr ( >| z | )
( I n t e r c e p t ) −4.729 e+00 1 . 0 1 7 e+00 −4.649 3 . 3 3 e −06 ∗∗∗
age 1 . 5 7 8 e −02 1 . 3 5 8 e −02 1.162 0.24521
educ 1 . 6 1 3 e −01 6 . 5 1 3 e −02 2.477 0.01325 ∗
black 3 . 0 6 5 e+00 2 . 8 6 5 e −01 1 0 . 6 9 9 < 2 e −16 ∗∗∗
hispan 9 . 8 3 6 e −01 4 . 2 5 7 e −01 2.311 0.02084 ∗
nodegree 7 . 0 7 3 e −01 3 . 3 7 7 e −01 2.095 0.03620 ∗
married −8.321 e −01 2 . 9 0 3 e −01 −2.866 0 . 0 0 4 1 5 ∗∗
re74 −7.178 e −05 2 . 8 7 5 e −05 −2.497 0.01253 ∗
re75 5 . 3 4 5 e −05 4 . 6 3 5 e −05 1.153 0.24884
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1
( D i s p e r s i o n p a r a m e t e r f o r b i n o m i a l f a m i l y t a k e n t o be 1 )
Null deviance : 751.49 on 613 d e g r e e s o f freedom

Residual deviance : 487.84 on 605 d e g r e e s o f freedom
AIC : 5 0 5 . 8 4
7. Em seguida vamos gravar o escore de propensão no banco de dados.

# I n c l u i n d o o e s c o r e de p r o p e n s ã o no banco de dados
> l a l o n d e \ $ p s l o g <− p r e d i c t ( p s l o g , t y p e=” r e s p o n s e ” )
Agora peça uma listagem das primeiras observações (tratados) e verifique que o
escore de propensão (pslog) foi calculado e adicionado ao banco de dados.
# Obtendo l i s t a g e m d a s 10 p r i m e i r a s o b s e r v a ç õ e s
> head ( l a l o n d e , n =10)
t r e a t age educ b l a c k h i s p a n married n o d e g r e e re74 re75 re78 pslog
170
1 1 37 11 1 0 1 1 0 0 9930.0460 0.63876993
2 1 22 9 0 1 0 1 0 0 3595.8940 0.22463424
3 1 30 12 1 0 0 0 0 0 24909.4500 0.67824388
4 1 27 11 1 0 0 1 0 0 7506.1460 0.77632408
5 1 33 8 1 0 0 1 0 0 289.7899 0.70163874
6 1 22 9 1 0 0 1 0 0 4056.4940 0.69906990
7 1 23 12 1 0 0 0 0 0 0.0000 0.65368426
8 1 32 11 1 0 0 1 0 0 8472.1580 0.78972311
9 1 22 16 1 0 0 0 0 0 2164.0220 0.77983825
10 1 33 12 0 0 1 0 0 0 12418.0700 0.04292461
Agora peça uma listagem das últimas observações (não tratados)

# Obtendo l i s t a g e m d a s 10 ú l t i m a s o b s e r v a ç õ e s
> t a i l ( l a l o n d e , n =10)
t r e a t age educ b l a c k h i s p a n married n o d e g r e e re74 re75 re78 pslog
605 0 39 2 1 0 1 1 0 0 964.9555 0.29939542
606 0 55 8 0 0 1 1 0 0 0.0000 0.06325293
607 0 16 9 0 0 0 1 0 0 5551.8190 0.08971192
608 0 27 10 1 0 0 1 0 0 7543.7940 0.74707356
609 0 25 14 0 0 0 0 0 0 0.0000 0.11145877
610 0 18 11 0 0 0 1 0 0 10150.5000 0.12314388
611 0 24 1 0 1 1 1 0 0 19464.6100 0.03456038
612 0 21 18 0 0 0 0 0 0 0.0000 0.18335100
613 0 32 5 1 0 1 1 0 0 187.6713 0.38303231
614 0 16 9 0 0 0 1 0 0 1495.4590 0.08971192
8. Antes de se realizar qualquer estimativa, é importante avaliar se existe área de

suporte comum entre os tratados e seus potenciais controles. Vamos verificar a
área de suporte comum, desenhando um boxplot da distribuição do escore de
propensão, separadamente nos grupos tratamento e controle. Como você pode
observar na figura 9.1 (este exemplo foi também mostrado no capı́tulo 8), há pouca
zona de suporte comum. No grupo tratado, a maioria dos escores de propensão
estão acima de 0,4, enquanto no grupo controle os escores predominam na faixa
inferior a 0,2. Como vimos, neste caso seria mais adequado estimar o ATT (Efeito
médio do tratamento nos tratados).
# V e r i f i c a n d o á r e a de s u p o r t e comum p e l o b o x p l o t
> b o x p l o t ( p s l o g ˜ t r e a t , d a t a=l a l o n d e , y l a b=” E s c o r e de p r o p e n s a o ” , x l a b=
” Programa de R e t r e i n a m e n t o P r o f i s s i o n a l ” )
9. Apesar do efeito médio do tratamento (ATE) não ser a melhor estimativa, vamos
realizar o seu cálculo para demonstração. Inicialmente, calcularemos os pesos
para estimar o ATE em modelo estrutural marginal, com ponderação pelo inverso
da probabilidade de tratamento, utilizando as fórmulas da tabela 8.6. Em seguida,
vamos obter uma listagem das primeiras 10 observações para verificar que o peso
(peso.ATE) foi incorporado ao banco de dados.
# Ponderação com e s c o r e de p r o p e n s ã o
# C a l c u l a n d o o s p e s o s usando ATE − E f e i t o médio do t r a t a m e n t o
# p a r a o grupo de t r a t a m e n t o = 1 / ps
# p a r a o grupo c o n t r o l e= 1(1− ps )
> l a l o n d e $ p e s o .ATE <− i f e l s e ( l a l o n d e $ t r e a t == 1 , 1 / l a l o n d e $ p s l o g , 1 /(1−
lalonde $ pslog ) )
# V e r i f i c a n d o se o peso foi incorporado ao banco de dados

> head ( l a l o n d e , n =10)
t r e a t age educ b l a c k hispan married nodegree re74 re75 re78 pslog peso
. ATE
1 1 37 11 1 0 1 1 0 0 9930.0460 0.63876993
1.565509
2 1 22 9 0 1 0 1 0 0 3595.8940 0.22463424
4.451681
3 1 30 12 1 0 0 0 0 0 24909.4500 0.67824388
1.474396
171
0.8
0.6
Escore de propensao
0.4
0.2
0.0
0 1
Programa de Retreinamento Profissional
4 1 27 11 1 0 0 1 0 0 7506.1460 0.77632408
1.288122
5 1 33 8 1 0 0 1 0 0 289.7899 0.70163874
1.425235
6 1 22 9 1 0 0 1 0 0 4056.4940 0.69906990
1.430472
7 1 23 12 1 0 0 0 0 0 0.0000 0.65368426
1.529791
8 1 32 11 1 0 0 1 0 0 8472.1580 0.78972311
1.266267
9 1 22 16 1 0 0 0 0 0 2164.0220 0.77983825
1.282317
10 1 33 12 0 0 1 0 0 0 12418.0700 0.04292461
23.296656
>
10. Para checar o balanceamento após a ponderação com o escore de propensão,

vamos estimar um modelo de regressão linear ponderado pelo escore de propensão,
colocando a variável contı́nua como resposta e o tratamento como variável expla-
natória. Para isto vamos precisar usar o pacote survey, que calcula estimativa
robusta da variância, utilizando o método de Taylor. Veja que, para a variável
contı́nua (renda em 1974) não foi obtido balanceamento, pois o valor de P continua
significante (P=0,040).
172
# Checando b a l a n c e a m e n t o a p ó s a p o n d e r a ç ã o com e s c o r e de p r o p e n s ã o
# Carregando o p a c o t e s u r v e y p a r a o b t e r e s t i m a t i v a r o b u s t a da v a r i â n c i a
> l i b r a r y ( survey )
# v a r i á v e l c o n tı́ n u a − r e g r e s s ã o l i n e a r ponderada com o t r a t a m e n t o como

v a r i á v e l e x p l a n a t ó r i a e a v a r i á v e l c o n tı́ n u a ( r e n d a em 1 9 7 4 ) como
resposta
> d e s i g n . p s l o g <− s v y d e s i g n ( i d s=˜ 1 , w e i g h t s=˜ p e s o . ATE, d a t a=l a l o n d e )
> glm <− svyglm ( r e 7 4 ˜ t r e a t , d e s i g n=d e s i g n . p s l o g )
> summary ( glm )
Call :
svyglm ( f o r m u l a = r e 7 4 ˜ t r e a t , design = design . pslog )
Survey d e s i g n :
s v y d e s i g n ( i d s = ˜ 1 , w e i g h t s = ˜ p e s o . ATE, d a t a = l a l o n d e )
Coefficients :
( Intercept ) 4552.7 309.6 14.705 <2e −16 ∗∗∗
treat −1620.6 786.0 −2.062 0.0396 ∗
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1
( D i s p e r s i o n p a r a m e t e r f o r g a u s s i a n f a m i l y t a k e n t o be 3 6 5 0 6 4 3 7 )
11. E para variável categórica, vamos estimar modelo de regressão logı́stica ponderado
pelo escore de propensão, colocando a variável categórica como resposta e o
tratamento como variável explanatória. Observe que para a variável não possuir
diploma universitário, o balanceamento foi obtido, pois o valor de P deixou de ser
significante (P=0,452). Faça, agora, o teste para as demais variáveis (contı́nuas e
categóricas) e anote para quais variáveis o balanceamento não foi obtido.
# v a r i á v e l c a t e g ó r i c a − r e g r e s s ã o l i n e a r ponderada com o t r a t a m e n t o como
v a r i á v e l e x p l a n a t ó r i a e a v a r i á v e l c a t e g ó r i c a ( sem d ip lo m a
u n i v e r s i t á r i o ) como r e s p o s t a
> glm <− svyglm ( n o d e g r e e ˜ t r e a t , f a m i l y=b i n o m i a l , d e s i g n=d e s i g n . p s l o g )
Warning message :
I n e v a l ( expr , e n v i r , e n c l o s ) : non−i n t e g e r #s u c c e s s e s i n a b i n o m i a l glm !
> summary ( glm )
Call :
svyglm ( f o r m u l a = n o d e g r e e ˜ t r e a t , family = binomial , design = design .
pslog )
Coefficients :
( Intercept ) 0.5106 0.1112 4 . 5 9 3 5 . 3 1 e −06 ∗∗∗
treat −0.2278 0.3024 −0.753 0.452
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1
( D i s p e r s i o n p a r a m e t e r f o r b i n o m i a l f a m i l y t a k e n t o be 1 . 0 0 1 6 3 1 )
173
12. Como os testes estatı́sticos não são o método mais adequado para verificar
balanceamento, vamos usar o pacote twang, que realiza o cálculo das diferenças
padronizadas absolutas nas médias das variáveis preditoras do tratamento entre
os grupos tratado e controle. Diferença padronizada absoluta nas médias < 0,10
indica balanceamento. Observe que as estimativas das diferenças padronizadas
absolutas entre as médias dos grupos tratamento e controle após o balanceamento
para a maioria das variáveis continua acima de 0,10. Se usarmos um critério menos
rigoroso, <0,25, concluirı́amos que apenas a variável renda em 1974 não estaria
balanceada entre os grupos. Esta falta de balanceamento se deve, provavelmente,
à pouca zona de suporte comum existente entre os grupos. A alternativa, neste
caso, seria estimar o ATT ou tentar outro método para estimativa do escore
de propensão. Pode ser que o balanceamento não tenha sido atingido por má
especificação do modelo logı́stico, ou seja, a não inclusão de termos polinomiais,
no caso de relações não lineares, e o não teste para interações entre os preditores.
# Usando r o t i n a do p a c o t e twang p a r a v e r i f i c a r b a l a n c e a m e n t o
# D i f e r e n ç a s p a d r o n i z a d a s a b s o l u t a s e n t r e a s médias
> b a l . p s l o g <− dx . wts ( x = l a l o n d e \ $ p e s o . ATE, d a t a=l a l o n d e , v a r s=c ( ” a g e ” ,
” educ ” , ” b l a c k ” , ” h i s p a n ” , ” n o d e g r e e ” ,
+ ” m a r r i e d ” , ” r e 7 4 ” , ” r e 7 5 ” ) , t r e a t . v a r=” t r e a t ” , e s t i m a n d = ”
ATE” )
> bal . pslog
type n . t r e a t n . c t r l ess . treat ess . ctrl max . e s mean . e s max . k s mean . k s iter
1 unw 185 429 185.00000 429.0000 1.3085999 0.4432341 0.6404460 0.2702451 NA
2 185 429 58.32666 329.0078 0.2658351 0.1441768 0.3121388 0.1170512 NA
> b a l <− b a l . t a b l e ( b a l . p s l o g )
> bal
\ $unw
t x . mn tx . sd c t . mn c t . sd std . e f f . sz stat p ks ks . pval
age 25.816 7.155 28.030 10.787 −0.224 −2.994 0.003 0.158 0.003
educ 10.346 2.011 10.235 2.855 0.042 0.547 0.584 0.111 0.074
black 0.843 0.365 0.203 0.403 1.309 19.371 0.000 0.640 0.000
hispan 0.059 0.237 0.142 0.350 −0.257 −3.413 0.001 0.083 0.317
nodegree 0.708 0.456 0.597 0.491 0.231 2.716 0.007 0.111 0.074
married 0.189 0.393 0.513 0.500 −0.656 −8.607 0.000 0.324 0.000
re74 2095.574 4886.620 5619.237 6788.751 −0.544 −7.254 0.000 0.447 0.000
re75 1532.055 3219.251 2466.484 3291.996 −0.284 −3.282 0.001 0.288 0.000
[[2]]
age 25.566 6.525 27.100 10.803 −0.169 −1.709 0.088 0.191 0.046
educ 10.606 2.051 10.286 2.742 0.131 1.032 0.303 0.077 0.908
black 0.448 0.499 0.398 0.490 0.101 0.746 0.456 0.050 0.999
hispan 0.122 0.328 0.117 0.322 0.014 0.115 0.909 0.005 1.000
nodegree 0.570 0.496 0.625 0.485 −0.112 −0.743 0.458 0.055 0.996
married 0.315 0.466 0.409 0.492 −0.196 −1.207 0.228 0.094 0.732
re74 2932.185 5709.424 4552.736 6337.089 −0.266 −2.062 0.040 0.312 0.000
re75 1658.065 3072.886 2172.039 3160.142 −0.164 −1.492 0.136 0.153 0.179
13. Mesmo sem ter obtido o balanceamento entre as variáveis, vamos calcular o efeito
médio do tratamento (ATE) em modelo de regressão linear ponderado pelo escore
de propensão, no pacote survey, com estimativa robusta da variância. Veja que
a estimativa ajustada para o efeito do tratamento foi de US$224,70, com p=0,805,
portanto não significante.
# Efeito causal
# R e g r e s s ã o l i n e a r i n c l u i n d o d e s f e c h o e a p e n a s o t r a t a m e n t o como
v a r i a v e l e x p l a n a t ó r i a
# com p o n d e r a c ã o p e l o e s c o r e de p r o p e n s ã o
174
# p a c o t e s u r v e y − e s t i m a t i v a r o b u s t a da v a r i â n c i a
> d e s i g n . p s l o g <− s v y d e s i g n ( i d s=˜ 1 , w e i g h t s=˜ p e s o . ATE, d a t a=l a l o n d e )
> glm <− svyglm ( r e 7 8 ˜ t r e a t , d e s i g n=d e s i g n . p s l o g )
> summary ( glm )
Call :
svyglm ( f o r m u l a = r e 7 8 ˜ t r e a t , design = design . pslog )
Coefficients :
( Intercept ) 6422.8 365.3 17.584 <2e −16 ∗∗∗
treat 224.7 910.2 0.247 0.805
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1
14. Em seguida, vamos utilizar GBM (Generalized Boosted Model) para calcular o
ATE no pacote twang, para testar se o não balanceamento dos grupos tratamento
e controle possa ter sido devido à má especificação do modelo logı́stico.
# GBM
# e s t i m a t i v a do e s c o r e de p r o p e n s a o − ATE
set . seed (1)
psgbmate <− ps ( t r e a t ˜ a g e + educ + b l a c k + h i s p a n + n o d e g r e e + m a r r i e d
+ re74 + re75 , data = l a l o n d e ,
perm . t e s t . i t e r s =0 , e s t i m a n d = ”ATE” , s t o p . method=(” e s .
mean” ) , v e r b o s e=”F” )
15. Utilize os seguintes comandos para verificar balanceamento. Observe que, agora,
apenas para as variáveis percentual de hispânicos e não possuir diploma uni-
versitário foi obtido balanceamento, pois as diferenças padronizadas absolutas
entre as médias dos grupos tratamento e controle ficaram <0,10. Para as demais
variáveis não obtivemos o balanceamento. Este resultado sugere que o não ba-
lanceamento em relação às variáveis observadas não se deveu a problemas na
especificação do modelo logı́stico, mas sim à falta de uma zona de suporte comum.
# v e r i f i c a n d o balanceamento
> b a l <− b a l . t a b l e ( psgbmate )
> bal
$unw
age 25.816 7.155 28.030 10.787 −0.224 −2.994 0.003 0.158 0.003
educ 10.346 2.011 10.235 2.855 0.042 0.547 0.584 0.111 0.074
black 0.843 0.365 0.203 0.403 1.309 19.371 0.000 0.640 0.000
hispan 0.059 0.237 0.142 0.350 −0.257 −3.413 0.001 0.083 0.317
nodegree 0.708 0.456 0.597 0.491 0.231 2.716 0.007 0.111 0.074
married 0.189 0.393 0.513 0.500 −0.656 −8.607 0.000 0.324 0.000
re74 2095.574 4886.620 5619.237 6788.751 −0.544 −7.254 0.000 0.447 0.000
re75 1532.055 3219.251 2466.484 3291.996 −0.284 −3.282 0.001 0.288 0.000
$ e s . mean . ATE
age 25.145 7.104 27.438 10.167 −0.249 −2.936 0.003 0.138 0.168
educ 10.587 2.012 10.295 2.700 0.118 1.132 0.258 0.090 0.655
black 0.649 0.479 0.345 0.476 0.609 4.099 0.000 0.304 0.000
hispan 0.126 0.332 0.120 0.325 0.017 0.114 0.909 0.005 1.000
nodegree 0.621 0.487 0.607 0.489 0.027 0.200 0.842 0.013 1.000
married 0.283 0.452 0.440 0.497 −0.322 −2.272 0.023 0.157 0.081
re74 2761.677 5137.961 4702.171 6467.311 −0.319 −2.854 0.004 0.204 0.009
re75 1698.704 3284.007 2169.352 3182.606 −0.146 −1.330 0.184 0.161 0.068
175
> p l o t ( psgbmate , p l o t s =3)
Verifique as diferenças padronizadas absolutas para a estimativa do ATE plotadas

no gráfico da figura 9.2.
es.mean.ATE
1.0
0.5
0.0
Unweighted Weighted
Figura 9.2.: Verificando diferenças padronizadas absolutas por método gráfico - ATE.
16. Em seguida vamos extrair os pesos a serem incluı́dos na ponderação, usando as

fórmulas da tabela 8.6.
# extraindo os pesos
> l a l o n d e $ wate <− g e t . w e i g h t s ( psgbmate , s t o p . method=” e s . mean” )
> d e s i g n . p s a t e <− s v y d e s i g n ( i d s=˜ 1 , w e i g h t s=˜ wate , d a t a=l a l o n d e )
# o b t e n d o l i s t a g e m do b a n c o de d a d o s
> head ( l a l o n d e , n =10)
t r e a t age educ b l a c k h i s p a n married nodegree re74 re75 re78 wate
1 1 37 11 1 0 1 1 0 0 9930.0460 2.108394
2 1 22 9 0 1 0 1 0 0 3595.8940 1.377677
3 1 30 12 1 0 0 0 0 0 24909.4500 1.075554
4 1 27 11 1 0 0 1 0 0 7506.1460 1.051143
5 1 33 8 1 0 0 1 0 0 289.7899 1.045883
6 1 22 9 1 0 0 1 0 0 4056.4940 1.040317
7 1 23 12 1 0 0 0 0 0 0.0000 1.067911
8 1 32 11 1 0 0 1 0 0 8472.1580 1.056780
9 1 22 16 1 0 0 0 0 0 2164.0220 1.676679
10 1 33 12 0 0 1 0 0 0 12418.0700 4.593865
176
> t a i l ( l a l o n d e , n =10)
t r e a t age educ b l a c k hispan married nodegree re74 re75 re78 wate
605 0 39 2 1 0 1 1 0 0 964.9555 1.485184
606 0 55 8 0 0 1 1 0 0 0.0000 1.013105
607 0 16 9 0 0 0 1 0 0 5551.8190 1.015311
608 0 27 10 1 0 0 1 0 0 7543.7940 20.798188
609 0 25 14 0 0 0 0 0 0 0.0000 1.346533
610 0 18 11 0 0 0 1 0 0 10150.5000 1.174878
611 0 24 1 0 1 1 1 0 0 19464.6100 1.106458
612 0 21 18 0 0 0 0 0 0 0.0000 1.072995
613 0 32 5 1 0 1 1 0 0 187.6713 3.164705
614 0 16 9 0 0 0 1 0 0 1495.4590 1.015311
17. Mesmo sem termos obtido balanceamento, vamos calcular o ATE em modelo de
regressão linear ponderado pelo escore de propensão. A estimativa foi US$491,90,
com p=0,516, portanto igual no grupo tratado em comparação ao grupo controle,
também não significante.
# E f e i t o c a u s a l − GBM
v a r i á v e l e x p l a n a t ó r i a
# com p o n d e r a ç ã o p e l o e s c o r e de p r o p e n s ã o
> glm1 <− svyglm ( r e 7 8 ˜ t r e a t , d e s i g n=d e s i g n . p s a t e )
> summary ( glm1 )
Call :
svyglm ( f o r m u l a = r e 7 8 ˜ t r e a t , design = design . psate )
s v y d e s i g n ( i d s = ˜ 1 , w e i g h t s = ˜ wate , d a t a = l a l o n d e )
Coefficients :
( Intercept ) 6703.7 368.1 18.209 <2e −16 ∗∗∗
treat −491.9 757.3 −0.649 0.516
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1
18. Finalmente, vamos utilizar GBM (Generalized Boosted Model) para calcular o
ATT no pacote twang, para testar se o não balanceamento dos grupos tratamento
e controle possa ter sido devido à falta de zona de suporte comum.
# GBM
# e s t i m a t i v a do e s c o r e de p r o p e n s a o − ATT
> set . seed (1)
> psgbmatt <− ps ( t r e a t ˜ a g e + educ + b l a c k + h i s p a n + n o d e g r e e +
married + re74 + re75 , data = l a l o n d e ,
+ perm . t e s t . i t e r s =0 , e s t i m a n d = ”ATT” , s t o p . method=(” e s .
mean” ) , v e r b o s e=”F” )
19. Utilize os seguintes comandos para verificar balanceamento. Observe que, agora,
apenas para as variáveis renda em 1974 e renda em 1975 não foi obtido balance-
amento, pois as diferenças padronizadas absolutas entre as médias dos grupos
tratamento e controle ficaram >0,10. Se adotarmos um ponto de corte menos rigo-
roso, concluı́mos que o balanceamento foi obtido em relação a todas as variáveis
observadas. Este resultado sugere que o não balanceamento em relação às variáveis
observadas na estimativa do ATE não se deveu a problemas na especificação do
177
modelo logı́stico, mas sim à falta de uma zona de suporte comum. Usando-se
apenas os tratados, o balanceamento consideramos que o balanceamento foi obtido
e podemos, então, dar prosseguimento à análise e interpretação do ATT.
# v e r i f i c a n d o balanceamento
> b a l <− b a l . t a b l e ( psgbmatt )
> bal
$unw
age 25.816 7.155 28.030 10.787 −0.309 −2.994 0.003 0.158 0.003
educ 10.346 2.011 10.235 2.855 0.055 0.547 0.584 0.111 0.074
black 0.843 0.365 0.203 0.403 1.757 19.371 0.000 0.640 0.000
hispan 0.059 0.237 0.142 0.350 −0.349 −3.413 0.001 0.083 0.317
nodegree 0.708 0.456 0.597 0.491 0.244 2.716 0.007 0.111 0.074
married 0.189 0.393 0.513 0.500 −0.824 −8.607 0.000 0.324 0.000
re74 2095.574 4886.620 5619.237 6788.751 −0.721 −7.254 0.000 0.447 0.000
re75 1532.055 3219.251 2466.484 3291.996 −0.290 −3.282 0.001 0.288 0.000
$ e s . mean .ATT
age 25.816 7.155 25.472 7.295 0.048 0.352 0.725 0.092 0.992
educ 10.346 2.011 10.447 2.040 −0.050 −0.346 0.729 0.064 1.000
black 0.843 0.365 0.829 0.377 0.040 0.300 0.764 0.014 1.000
hispan 0.059 0.237 0.045 0.207 0.062 0.666 0.506 0.015 1.000
nodegree 0.708 0.456 0.664 0.473 0.097 0.478 0.633 0.044 1.000
married 0.189 0.393 0.189 0.392 0.001 0.006 0.995 0.000 1.000
re74 2095.574 4886.620 1510.258 3744.029 0.120 1.119 0.264 0.070 1.000
re75 1532.055 3219.251 1074.077 2464.235 0.142 1.276 0.202 0.102 0.976
> p l o t ( psgbmatt , p l o t s =3)
Verifique as diferenças padronizadas absolutas para a estimativa do ATT plotadas

no gráfico da figura 9.3.
20. Em seguida vamos extrair os pesos a serem incluı́dos na ponderação, usando as
fórmulas da tabela 8.6.
# extraindo os pesos
> l a l o n d e $ watt <− g e t . w e i g h t s ( psgbmatt , s t o p . method=” e s . mean” )
> d e s i g n . p s a t t <− s v y d e s i g n ( i d s=˜ 1 , w e i g h t s=˜ watt , d a t a=l a l o n d e )
# o b t e n d o l i s t a g e m do b a n c o de d a d o s
> head ( l a l o n d e , n =10)
t r e a t age educ b l a c k h i s p a n married n o d e g r e e r e 7 4 r e 7 5 re78 wate watt
1 1 37 11 1 0 1 1 0 0 9930.0460 2.108394 1
2 1 22 9 0 1 0 1 0 0 3595.8940 1.377677 1
3 1 30 12 1 0 0 0 0 0 24909.4500 1.075554 1
4 1 27 11 1 0 0 1 0 0 7506.1460 1.051143 1
5 1 33 8 1 0 0 1 0 0 289.7899 1.045883 1
6 1 22 9 1 0 0 1 0 0 4056.4940 1.040317 1
7 1 23 12 1 0 0 0 0 0 0.0000 1.067911 1
8 1 32 11 1 0 0 1 0 0 8472.1580 1.056780 1
9 1 22 16 1 0 0 0 0 0 2164.0220 1.676679 1
10 1 33 12 0 0 1 0 0 0 12418.0700 4.593865 1
> t a i l ( l a l o n d e , n =10)
t r e a t age educ b l a c k h i s p a n married n o d e g r e e r e 7 4 r e 7 5 re78 wate
watt
605 0 39 2 1 0 1 1 0 0 964.9555 1.485184
0.42964533
606 0 55 8 0 0 1 1 0 0 0.0000 1.013105
0.01075173
607 0 16 9 0 0 0 1 0 0 5551.8190 1.015311
0.01311116
608 0 27 10 1 0 0 1 0 0 7543.7940 20.798188
22.39606172
609 0 25 14 0 0 0 0 0 0 0.0000 1.346533
0.32141652
610 0 18 11 0 0 0 1 0 0 10150.5000 1.174878
0.16604204
611 0 24 1 0 1 1 1 0 0 19464.6100 1.106458
0.07992029
612 0 21 18 0 0 0 0 0 0 0.0000 1.072995
0.06439535
613 0 32 5 1 0 1 1 0 0 187.6713 3.164705
2.10541066
614 0 16 9 0 0 0 1 0 0 1495.4590 1.015311
0.01311116
178
es.mean.ATT
1.5
1.0
0.5
0.0
Unweighted Weighted
Figura 9.3.: Verificando diferenças padronizadas absolutas por método gráfico - ATT.
21. Vamos, para concluir este exercı́cio, calcular o ATT em modelo de regressão
linear ponderado pelo escore de propensão. A estimativa obtida, US$461,00,
foi igual no grupo tratado em comparação ao grupo controle, com p=0,632.
Concluı́mos, então, que o programa de retreinamento não aumentou a renda dos
indivı́duos. Esta conclusão é válida se os pressupostos para inferência causal forem
verdadeiros: permutabilidade, positividade e única versão do tratamento (SUTVA,
stable unit treatment value assumption). Considerando que o tratamento foi
administrado de forma padronizada e que não houve contaminação, consideramos
que o pressuposto SUTVA é razoável. Usando-se o ATT supõe-se que foi possı́vel
obter contrastes contrafatuais adequados na ausência de randomização para os
tratados. O pressuposto da positividade é bem razoável neste exemplo. Obtivemos
permutabilidade em relação às variáveis observadas. Resta a possibilidade de
confundimento por variável omitida. Esta nossa estimativa do efeito causal é
válida, desde que sejam válidos os nossos pressupostos, que foram explicitados.
É interessante neste exemplo que o modelo de regressão convencional, ajustado
para as variáveis de confundimento sugeriu associação entre o programa de
179
retreinamento profissional e o aumento da renda. Entretanto, nas estimativas

obtidas em modelos ponderados pelo inverso da probabilidade de tratamento,
este efeito não foi significante.
# E f e i t o c a u s a l − GBM
v a r i á v e l e x p l a n a t ó r i a
# com p o n d e r a ç ã o p e l o e s c o r e de p r o p e n s ã o
> glm1 <− svyglm ( r e 7 8 ˜ t r e a t , d e s i g n=d e s i g n . p s a t t )
> summary ( glm1 )
Call :
svyglm ( f o r m u l a = r e 7 8 ˜ t r e a t , design = design . psatt )
s v y d e s i g n ( i d s = ˜ 1 , w e i g h t s = ˜ watt , d a t a = l a l o n d e )
Coefficients :
( Intercept ) 5888.2 767.9 7 . 6 6 8 6 . 9 1 e −14 ∗∗∗
treat 461.0 960.7 0.480 0.632
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1
180
10. Exemplo de análise com escore de
propensão em Epidemiologia no
Stata
10.1. Estimativa do efeito causal por meio de escore de
propensão
Neste exemplo, vamos realizar a estimativa do efeito de um programa de retreinamento
profissional no rendimento dos indivı́duos. Os dados são do National Supported Work
Project, publicados por Dehejia e Wahba (1999). Na tabela 9.1 constam as variáveis
que utilizaremos neste exercı́cio.
Os comandos que se seguem realizam a análise no Stata.
10.1.1. Ponderação com escore de propensão

1. Inicialmente, abra o arquivo lalonde.dta e peça a listagem de algumas variáveis
das primeiras 5 e das últimas 5 observações. Em seguida, obtenha a frequência
da variável treat. Observe que há 185 casos que receberam o retreinamento e
429 não treinados, que servirão como controles.
. * Abrindo banco de dados - lalonde

. use lalonde
.
. * Obtendo listagem das 5 primeiras e das 5 últimas observações
. list treat age educ black hispan married nodegree re78 in 1/5
treat age educ black hispan married nodegree re78
1. 1 37 11 1 0 1 1 9930.046
2. 1 22 9 0 1 0 1 3595.894
3. 1 30 12 1 0 0 0 24909.45
4. 1 27 11 1 0 0 1 7506.146
5. 1 33 8 1 0 0 1 289.7899
. list treat age educ black hispan married nodegree re78 in 610/614
treat age educ black hispan married nodegree re78
610. 0 18 11 0 0 0 1 10150.5
611. 0 24 1 0 1 1 1 19464.61
612. 0 21 18 0 0 0 0 0
181
10. Exemplo de análise com escore de propensão em Epidemiologia no Stata
613. 0 32 5 1 0 1 1 187.6713
614. 0 16 9 0 0 0 1 1495.459
.
. * Obtendo a distribuição de frequências da variável tratamento
. tab treat
treat Freq. Percent Cum.
0 429 69.87 69.87

1 185 30.13 100.00
Total 614 100.00
2. Após a abertura do arquivo, vamos primeiro calcular as estimativas de associação

em modelos de regressão simples (não ajustado) e múltipla (ajustado). A variável
explanatória é treat, codificada como 1 quando o indivı́duo participou do programa
de retreinamento profissional e 0 em caso contrário. A variável desfecho é a renda
em 1978, quatro anos após o inı́cio do programa de retreinamento. Compare as
duas estimativas do efeito médio do tratamento (ATE). Observe que a estimativa
não ajustada não foi significante (p=0,334), enquanto a estimativa ajustada
foi de um aumento de US$ 1,548, p<0,048 no grupo tratado, que frequentou o
programa de retreinamento profissional, comparado com o grupo controle, que
não participou do programa.
. * Estimando associação em modelo de regressão não ajustado

. regress re78 treat
Source SS df MS Number of obs = 614
F(1, 612) = 0.93
Model 52124746.2 1 52124746.2 Prob > F = 0.3342
Residual 3.4161e+10 612 55817843.2 R-squared = 0.0015
Adj R-squared = -0.0001
Total 3.4213e+10 613 55811818.6 Root MSE = 7471.1
re78 Coef. Std. Err. t P>|t| [95% Conf. Interval]
treat -635.0262 657.1374 -0.97 0.334 -1925.544 655.4917

_cons 6984.17 360.7097 19.36 0.000 6275.791 7692.549
.
. * Estimando associação em modelo de regressão ajustado
. regress re78 treat age educ black hispan nodegree married re74 re75
F(9, 604) = 11.64
Model 5.0554e+09 9 561713774 Prob > F = 0.0000
Adj R-squared = 0.1351
Total 3.4213e+10 613 55811818.6 Root MSE = 6947.9
treat 1548.244 781.2793 1.98 0.048 13.88991 3082.598

age 12.97763 32.48891 0.40 0.690 -50.82731 76.78257
educ 403.9412 158.9062 2.54 0.011 91.86538 716.0171
182
black -1240.644 768.7644 -1.61 0.107 -2750.42 269.1318

hispan 498.8969 941.9425 0.53 0.597 -1350.983 2348.777
nodegree 259.8174 847.4421 0.31 0.759 -1404.474 1924.108
married 406.6208 695.4723 0.58 0.559 -959.2168 1772.458
re74 .2963774 .0582726 5.09 0.000 .1819359 .410819
re75 .2315259 .1046199 2.21 0.027 .026063 .4369888
_cons 66.51452 2436.746 0.03 0.978 -4719.009 4852.038
3. Agora vamos verificar o balanceamento das variáveis antes da implementação do

escore de propensão. Faremos teste t de Student para variáveis contı́nuas e teste
do qui-quadrado para variáveis categóricas. Observe que as variáveis idade, renda
em 1974, renda em 1975, não possuir diploma universitário, percentual de pretos,
percentual de hispânicos e ser casado(a) não se encontram balanceadas entre os
grupos (todos os p valores são significantes). Apenas a variável escolaridade está
balanceada entre os grupos tratamento e controle (p valor não significante).
. * Checando balanceamento entre os grupos antes da implementação
. * do escore de propensão
. * variável contı́nua - test t de Student
. ttest age, by(treat)

Two-sample t test with equal variances
Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
0 429 28.0303 .5207845 10.78665 27.00669 29.05392

1 185 25.81622 .5260475 7.155019 24.77836 26.85408
combined 614 27.36319 .3987723 9.881187 26.58007 28.14632
diff 2.214087 .8652112 .5149437 3.91323
diff = mean(0) - mean(1) t = 2.5590

Ho: diff = 0 degrees of freedom = 612
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
Pr(T < t) = 0.9946 Pr(|T| > |t|) = 0.0107 Pr(T > t) = 0.0054
. ttest educ, by(treat)

0 429 10.23543 .1378522 2.855238 9.96448 10.50638

1 185 10.34595 .1478259 2.01065 10.05429 10.6376
combined 614 10.26873 .1060706 2.628325 10.06042 10.47704
diff -.1105147 .2313248 -.5648015 .343772
diff = mean(0) - mean(1) t = -0.4777

183
Pr(T < t) = 0.3165 Pr(|T| > |t|) = 0.6330 Pr(T > t) = 0.6835
. ttest re74, by(treat)

0 429 5619.237 327.764 6788.751 4975.009 6263.464

1 185 2095.574 359.2715 4886.62 1386.752 2804.395
combined 614 4557.547 261.4294 6477.964 4044.141 5070.952
diff 3523.663 552.1715 2439.282 4608.044
diff = mean(0) - mean(1) t = 6.3815

Pr(T < t) = 1.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 0.0000
. ttest re75, by(treat)

0 429 2466.484 158.9391 3291.996 2154.086 2778.883

1 185 1532.055 236.684 3219.251 1065.092 1999.019
combined 614 2184.938 133.0028 3295.679 1923.742 2446.135
diff 934.4291 287.6449 369.5384 1499.32
diff = mean(0) - mean(1) t = 3.2486

Pr(T < t) = 0.9994 Pr(|T| > |t|) = 0.0012 Pr(T > t) = 0.0006
. * variável categórica - teste do qui-quadrado

. tab treat nodegree, row chi2
Key
frequency
row percentage
nodegree
treat 0 1 Total
0 173 256 429

40.33 59.67 100.00
1 54 131 185
29.19 70.81 100.00
Total 227 387 614
184
36.97 63.03 100.00

Pearson chi2(1) = 6.8803 Pr = 0.009
. tab treat married, row chi2
Key
frequency
row percentage
married
treat 0 1 Total
0 209 220 429

48.72 51.28 100.00
1 150 35 185
81.08 18.92 100.00
Total 359 255 614

58.47 41.53 100.00
Pearson chi2(1) = 55.7524 Pr = 0.000
. tab treat black, row chi2
Key
frequency
row percentage
black
treat 0 1 Total
0 342 87 429
79.72 20.28 100.00
1 29 156 185
15.68 84.32 100.00
Total 371 243 614

60.42 39.58 100.00
Pearson chi2(1) = 221.7085 Pr = 0.000
. tab treat hispan, row chi2
Key
frequency
row percentage
hispan
treat 0 1 Total
185
0 368 61 429
85.78 14.22 100.00
1 174 11 185
94.05 5.95 100.00
Total 542 72 614

88.27 11.73 100.00
Pearson chi2(1) = 8.5469 Pr = 0.003
4. Podemos também fazer o teste em modelo de regressão linear, colocando a variável

contı́nua como resposta e o tratamento como variável explanatória. Veja um
exemplo abaixo com a variável contı́nua renda em 1974.
. * variável contı́nua - regressão linear com o tratamento
. * como variável explanatória
. * e a variável contı́nua (renda em 1974) como resposta
. regress re74 treat
F(1, 612) = 40.72
Model 1.6049e+09 1 1.6049e+09 Prob > F = 0.0000
Adj R-squared = 0.0609
Total 2.5724e+10 613 41964023.8 Root MSE = 6277.8
treat -3523.663 552.1715 -6.38 0.000 -4608.044 -2439.282

_cons 5619.237 303.0928 18.54 0.000 5024.008 6214.465
5. Podemos também fazer o teste em modelo de regressão logı́stica, colocando a

variável categórica como resposta e o tratamento como variável explanatória. Veja
um exemplo abaixo com a variável categórica sem diploma universitário.
. * variável categórica - regressão logı́stica com o tratamento como
. * variável explanatória
. * e a variável categórica (sem diploma universitário) como resposta
. logistic nodegree treat
Logistic regression Number of obs = 614
LR chi2(1) = 7.03
Prob > chi2 = 0.0080
Log likelihood = -400.98999 Pseudo R2 = 0.0087
nodegree Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
treat 1.639395 .3103558 2.61 0.009 1.131206 2.375886

_cons 1.479769 .1456396 3.98 0.000 1.220164 1.794608
6. Vamos agora calcular o escore de propensão para cada indivı́duo, que nada mais
é do que a probabilidade de participação no programa predita pelo modelo. Para
realizar isto, vamos rodar um modelo logı́stico, tendo como desfecho a participação
no treinamento (treat) e como variáveis preditoras: idade, escolaridade, cor da
186
pele preta, hispânico, casado, sem diploma universitário, renda em 74 e renda em

75.
. * Estimação do escore de propensão por regressão logı́stica

. logistic treat age educ black hispan nodegree married re74 re75
LR chi2(8) = 263.65
Prob > chi2 = 0.0000
Log likelihood = -243.92197 Pseudo R2 = 0.3508
treat Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
age 1.015902 .013793 1.16 0.245 .989225 1.043299

educ 1.175046 .0765265 2.48 0.013 1.034234 1.335028
black 21.44235 6.143794 10.70 0.000 12.22871 37.59792
hispan 2.674155 1.138292 2.31 0.021 1.161076 6.159032
nodegree 2.028501 .6849603 2.09 0.036 1.046529 3.931868
married .4351288 .1263306 -2.87 0.004 .246314 .7686815
re74 .9999282 .0000287 -2.50 0.013 .9998719 .9999846
re75 1.000053 .0000464 1.15 0.249 .9999626 1.000144
_cons .0088384 .0089893 -4.65 0.000 .001204 .0648791
7. Em seguida vamos gravar o escore de propensão no banco de dados.
. * Incluindo o escore de propensão no banco de dados

. predict pslog
(option pr assumed; Pr(treat))
Agora peça uma listagem das 10 primeiras observações (tratados) e verifique que
o escore de propensão (pslog) foi calculado e adicionado ao banco de dados.
. * Obtendo listagem das 10 primeiras observações

. list treat age educ re78 pslog in 1/10
treat age educ re78 pslog
1. 1 37 11 9930.046 .6387699
2. 1 22 9 3595.894 .2246342
3. 1 30 12 24909.45 .6782439
4. 1 27 11 7506.146 .7763241
5. 1 33 8 289.7899 .7016388
6. 1 22 9 4056.494 .6990699
7. 1 23 12 0 .6536843
8. 1 32 11 8472.158 .7897231
9. 1 22 16 2164.022 .7798383
10. 1 33 12 12418.07 .0429246
Agora peça uma listagem das 10 últimas observações (não tratados).
. list treat age educ re78 pslog in 605/614
treat age educ re78 pslog
187
605. 0 39 2 964.9555 .2993954

606. 0 55 8 0 .0632529
607. 0 16 9 5551.819 .0897119
608. 0 27 10 7543.794 .7470736
609. 0 25 14 0 .1114588
610. 0 18 11 10150.5 .1231439

611. 0 24 1 19464.61 .0345604
612. 0 21 18 0 .183351
613. 0 32 5 187.6713 .3830323
614. 0 16 9 1495.459 .0897119
8. Antes de se realizar qualquer estimativa, é importante avaliar se existe área de

suporte comum entre os tratados e seus potenciais controles. Vamos verificar a
área de suporte comum, desenhando um boxplot da distribuição do escore de
propensão, separadamente nos grupos tratamento e controle. Como você pode
observar na figura 10.1 (este exemplo foi também mostrado no capı́tulo 8), há
pouca zona de suporte comum. No grupo tratado, a maioria dos escores de
propensão estão acima de 0,4, enquanto no grupo controle os escores predominam
na faixa inferior a 0,2. Como vimos, neste caso seria mais adequado estimar o
ATT (Efeito médio do tratamento nos tratados).
. * Verificando área de suporte comum pelo boxplot
. graph box pslog, ytitle(Escore de propensão) by(treat)
0 1
.8
.6
Escore de propensão
.4
.2
0
-.2
Graphs by treat
9. Apesar do efeito médio do tratamento (ATE) não ser a melhor estimativa, vamos
realizar o seu cálculo para demonstração. Inicialmente, calcularemos os pesos
para estimar o ATE em modelo estrutural marginal, com ponderação pelo inverso
da probabilidade de tratamento, utilizando as fórmulas da tabela 8.6. Em seguida,
188
vamos obter uma listagem das primeiras 10 observações para verificar que o peso
(wa) foi incorporado ao banco de dados.
. * Ponderacao com escore de propensao

. * calculando os pesos usando ATE - Efeito medio do tratamento
. * para o grupo de tratamento = 1/ps
. * para o grupo controle= 1(1-ps)
. gen wa=1/pslog if treat==1
(429 missing values generated)
. replace wa=1/(1-pslog) if treat==0
(429 real changes made)
.
. * Verificando se o peso foi incorporado ao banco de dados
. list treat age educ re78 pslog wa in 1/10
treat age educ re78 pslog wa
1. 1 37 11 9930.046 .6387699 1.565509

2. 1 22 9 3595.894 .2246342 4.451681
3. 1 30 12 24909.45 .6782439 1.474396
4. 1 27 11 7506.146 .7763241 1.288122
5. 1 33 8 289.7899 .7016388 1.425235
6. 1 22 9 4056.494 .6990699 1.430472

7. 1 23 12 0 .6536843 1.529791
8. 1 32 11 8472.158 .7897231 1.266267
9. 1 22 16 2164.022 .7798383 1.282317
10. 1 33 12 12418.07 .0429246 23.29666
10. Para checar o balanceamento após a ponderação com o escore de propensão,

vamos estimar um modelo de regressão linear ponderado pelo escore de propensão,
colocando a variável contı́nua como resposta e o tratamento como variável ex-
planatória. Veja que, para a variável contı́nua (renda em 1974) não foi obtido
balanceamento, pois o valor de P continua significante (P=0,040).
. * Checando balanceamento após a ponderação com escore de propensão

. * variável contı́nua - regressão linear ponderada com o tratamento como
. * variável explanatória e a variável continua como desfecho
. regress re74 treat [pweight=wa]
(sum of wgt is 1.1696e+03)
Linear regression Number of obs = 614
F(1, 612) = 4.24
Prob > F = 0.0398
R-squared = 0.0176
Root MSE = 6047
Robust
treat -1620.552 786.6203 -2.06 0.040 -3165.354 -75.74923

_cons 4552.736 309.8639 14.69 0.000 3944.211 5161.262
189
11. E para variável categórica, vamos estimar modelo de regressão logı́stica ponderado
pelo escore de propensão, colocando a variável categórica como resposta e o
tratamento como variável explanatória. Observe que para a variável não possuir
diploma universitário, o balanceamento foi obtido, pois o valor de P deixou de ser
significante (P=0,451). Faça, agora, o teste para as demais variáveis (contı́nuas e
categóricas) e anote para quais variáveis o balanceamento não foi obtido.
. * variável categórica binária- regressão logı́stica ponderada com o tratamento

. * como variável explanatória
. * e a variável categórica (sem diploma universitário) como resposta
. logistic nodegree treat [pweight=wa]
Wald chi2(1) = 0.57
Prob > chi2 = 0.4513
Log pseudolikelihood = -785.80561 Pseudo R2 = 0.0023
Robust
nodegree Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
treat .7962906 .2407911 -0.75 0.451 .4402262 1.440347

_cons 1.666337 .1852614 4.59 0.000 1.340069 2.072041
12. Mesmo sem ter obtido o balanceamento entre as variáveis, vamos calcular o efeito
médio do tratamento (ATE) em modelo de regressão linear ponderado pelo escore
de propensão. Veja que a estimativa ajustada para o efeito do tratamento foi de
US$224,70, com p=0,805, portanto não significante.
. * Efeito causal
. * Regressão linear incluindo desfecho e apenas o tratamento como
. * variável explanatória com ponderacão pelo escore de propensão
. regress re78 treat [pweight=wa]
(sum of wgt is 1.1696e+03)
Linear regression Number of obs = 614
F(1, 612) = 0.06
Prob > F = 0.8053
R-squared = 0.0002
Root MSE = 7146.7
Robust
treat 224.6763 910.9625 0.25 0.805 -1564.315 2013.668

_cons 6422.839 365.5556 17.57 0.000 5704.943 7140.735
13. Vamos, agora, realizar a a ponderação pelo inverso da probabilidade de tratamento

no Stata usando um único comando, o teffects que realiza, de forma automática,
todos os passos: ajuste do modelo preditivo, cálculo do escore de propensão e
dos pesos e, em seguida, ajuste do modelo explicativo ponderado. Note que o
resultado foi o mesmo obtido anteriormente, com a vantagem de que o processo é
mais rápido. O comando teffects também está disponı́vel no menu Statistics, na
190
aba Treatment Effects.

. * Usando teffects - estimando ATE
. teffects ipw (re78) (treat age educ black hispan nodegree married re74 re75)
Iteration 0: EE criterion = 8.192e-26
Iteration 1: EE criterion = 7.907e-26 (backed up)
Treatment-effects estimation Number of obs = 614
Estimator : inverse-probability weights
Outcome model : weighted mean
Treatment model: logit
Robust
re78 Coef. Std. Err. z P>|z| [95% Conf. Interval]
ATE
treat
(1 vs 0) 224.6763 876.1932 0.26 0.798 -1492.631 1941.983
POmean
treat
0 6422.839 353.3568 18.18 0.000 5730.272 7115.406
14. Como os testes estatı́sticos não são o método mais adequado para verificar
balanceamento, vamos usar o comando tebalance summ, que, após o teffects,
realiza o cálculo das diferenças padronizadas absolutas nas médias das variáveis
preditoras do tratamento entre os grupos tratado e controle e das razões de
variância. Diferença padronizada absoluta nas médias < 0,10 e razão de variâncias
entre 0,80 e 1,20 indicam balanceamento. Observe que as estimativas das diferenças
padronizadas absolutas entre as médias dos grupos tratamento e controle após o
balanceamento para a maioria das variáveis continua acima de 0,10. Se usarmos
um critério menos rigoroso, <0,25, concluirı́amos que apenas a variável renda em
1974 não estaria balanceada entre os grupos. As razões de variância das variáveis
idade e escolaridade se encontram abaixo de 0,80, sugerindo não balanceamento
para estas variáveis. Esta falta de balanceamento se deve, provavelmente, à
pouca zona de suporte comum existente entre os grupos. A alternativa, neste
caso, seria estimar o ATT ou tentar outro método para estimativa do escore de
propensão (GBM, modelagem ampliada generalizada, por exemplo). Pode ser
que o balanceamento não tenha sido atingido por má especificação do modelo
logı́stico, ou seja, a não inclusão de termos polinomiais, no caso de relações não
lineares, e o não teste para interações entre os preditores. No capı́tulo 9 realizamos
estimativa do escore de propensão por GBM e concluı́mos que o balanceamento
não melhorou com este método, o que sugere que o não balanceamento se deva
à falta de uma zona de suporte comum. Assim, com a estimativa do ATE não
obtivemos um bom balanceamento, mesmo com GBM.
. * Checando balanceamento apos a ponderacao com escore de propensao
. tebalance summ
191
Raw Weighted
Number of obs = 614 614.0

Control obs = 429 323.4

age -.2419036 -.1718535 .4399955 .363823

educ .0447551 .1321896 .4958934 .5579332
black 1.667719 .1010261 .8201414 1.032512
hispan -.2769396 .0143612 .4599131 1.03472
nodegree .2350482 -.1115614 .8615699 1.045929
married -.719492 -.1970169 .6158881 .8923596
re74 -.5957516 -.2687467 .5181285 .8094992
re75 -.2870021 -.1649499 .956293 .9429552
15. Em seguida, vamos estimar o efeito causal médio entre os tratados (ATT) por
meio do comando teffects. A única mudança em relação ao comando usado
anteriormente é a inclusão da opção atet, pois o padrão (default) deste comando
é a estimativa do ATE.
. * Usando teffects - estimando ATT
. teffects ipw (re78) (treat age educ black hispan nodegree married re74 re75)
, atet
Treatment-effects estimation Number of obs = 614
Estimator : inverse-probability weights
Outcome model : weighted mean
Treatment model: logit
Robust
re78 Coef. Std. Err. z P>|z| [95% Conf. Interval]
ATET
treat
(1 vs 0) 1214.071 798.1546 1.52 0.128 -350.2831 2778.426
POmean
treat
0 5135.072 583.7629 8.80 0.000 3990.918 6279.227
16. Finalmente, vamos usar o comando tebalance summ, após o teffects, para
verificar balanceamento. Observe que, desta vez, todas as diferenças padronizadas
absolutas entre as médias dos grupos tratamento e controle são menores do que
0,10, embora algumas razões de variâncias sejam <0,80 ou >1,20. Isto indica que
o ATT é uma estimativa melhor do que o ATE.
A estimativa obtida, US$1214,00, foi igual no grupo tratado em comparação ao
grupo controle, com p=0,128. Concluı́mos, então, que o programa de retreinamento
192
não aumentou a renda dos indivı́duos. Esta conclusão é válida se os pressupostos

para inferência causal forem verdadeiros: permutabilidade, positividade e versão
única do tratamento (SUTVA, stable unit treatment value assumption). Conside-
rando que o tratamento foi administrado de forma padronizada e que não houve
contaminação, consideramos que o pressuposto SUTVA é razoável. Usando-se
o ATT supõe-se que foi possı́vel obter contrastes contrafatuais adequados na
ausência de randomização para os tratados. O pressuposto da positividade é
bem razoável neste exemplo. Obtivemos permutabilidade em relação às variáveis
observadas. Resta a possibilidade de confundimento por variável omitida. Esta
nossa estimativa do efeito causal é válida, desde que sejam válidos os nossos
pressupostos, que foram explicitados.
É interessante neste exemplo que o modelo de regressão convencional, ajustado
para as variáveis de confundimento sugeriu associação entre o programa de
retreinamento profissional e o aumento da renda. Entretanto, nas estimativas
obtidas em modelos ponderados pelo inverso da probabilidade de tratamento,
este efeito não foi significante.
. * Checando balanceamento após a ponderação com escore de propensão
. tebalance summ
Raw Weighted
Number of obs = 614 614.0

Control obs = 429 308.6

age -.2419036 .0944384 .4399955 .4599028

educ .0447551 -.0254442 .4958934 .6667641
black 1.667719 -.0061589 .8201414 1.011825
hispan -.2769396 .0007062 .4599131 1.002677
nodegree .2350482 .0400984 .8615699 .965795
married -.719492 .0483847 .6158881 1.084247
re74 -.5957516 -.0022908 .5181285 1.326828
re75 -.2870021 .0119291 .956293 1.400369
17. Podemos também verificar o balanceamento por método gráfico, usando o comando
tebalance density, para plotar gráficos de densidade kernel, para cada variável
quantitativa, separadamente para os grupos tratamento e controle. Se houver
sobreposição das distribuições, concluı́mos que a variável está balanceada, como é
o caso para a variável escolaridade (figura 10.2).
. tebalance density educ
193
Balance plot
Raw Weighted
.3
.2
Density
.1
0
0 5 10 15 20 0 5 10 15 20
educ
control treated
Figura 10.2.: Verificando balanceamento por método gráfico de densidade kernel.
194
Referências Bibliográficas
P C Austin. An Introduction to Propensity Score Methods for Re-
ducing the Effects of Confounding in Observational Studies. Mul-
tivariate Behav Res, 46(3):399–424, 2011. doi: 10.1080/00273171.2011.
568786. URL http://www.ncbi.nlm.nih.gov/pubmed/21818162http://www.
ncbi.nlm.nih.gov/pmc/articles/PMC3144483/pdf/hmbr46-399.pdf.
H R Banack and J S Kaufman. From bad to worse: collider stratification amplifies
confounding bias in the obesity paradox. Eur J Epidemiol, 30(10):1111–1114, 2015.
doi: 10.1007/s10654-015-0069-7. URL https://www.ncbi.nlm.nih.gov/pubmed/
26187718.
J Berkson. Limitations of the application of fourfold table analysis to hospital data. Bio-
metrics, 2(3):47–53, 1946. URL http://www.ncbi.nlm.nih.gov/pubmed/21001024.
H M Boardman, L Hartley, A Eisinga, C Main, M Roque i Figuls, X Bonfill
Cosp, R Gabriel Sanchez, and B Knight. Hormone therapy for preventing
cardiovascular disease in post-menopausal women. Cochrane Database Syst
Rev, (3):CD002229, 2015. doi: 10.1002/14651858.CD002229.pub4. URL
https://www.ncbi.nlm.nih.gov/pubmed/25754617http://onlinelibrary.
wiley.com/store/10.1002/14651858.CD002229.pub4/asset/CD002229.pdf?v=
1{&}t=iypv7m09{&}s=dcf431e2d97c5b5ba38053afb232d430b17f41a4.
M A Brookhart, S Schneeweiss, K J Rothman, R J Glynn, J Avorn,
and T Sturmer. Variable selection for propensity score models. Am
J Epidemiol, 163(12):1149–1156, 2006. doi: 10.1093/aje/kwj149. URL
https://www.ncbi.nlm.nih.gov/pubmed/16624967http://oup.silverchair-
cdn.com/oup/backfile/Content{_}public/Journal/aje/163/12/10.
1093/aje/kwj149/2/kwj149.pdf?Expires=1485355879{&}Signature=L1h-
WjNrHg79UpBtbzN1zFHHQAWpXmXo1mFEMF{˜}VMRHNJOaU8g4VtplIc2mQh3c4cIOC9Hl.
C R Charig, D R Webb, S R Payne, and J E Wickham. Comparison of treatment
of renal calculi by open surgery, percutaneous nephrolithotomy, and extracorporeal
shockwave lithotripsy. British medical journal (Clinical research ed.), 292(6524):
879–82, 1986. ISSN 0267-0623. doi: 10.1136/bmj.292.6524.879. URL https://www.
ncbi.nlm.nih.gov/pmc/articles/PMC1339981/pdf/bmjcred00227-0031.pdf.
T R Cortes, E Faerstein, and C J Struchiner. [Use of causal diagrams in Epidemiology:
application to a situation with confounding]. Cadernos de Saude Publica, 32(8):
e00103115, 2016. doi: 10.1590/0102-311X00103115. URL http://www.scielo.br/
pdf/csp/v32n8/1678-4464-csp-32-08-e00103115.pdf.
195
Nguyen Viet Cuong. Which covariates should be controlled in propensity score mat-
ching? Evidence from a simulation study. Statistica Neerlandica, 67(2):169–180, 2013.
ISSN 00390402. doi: 10.1111/stan.12000.
G Davey Smith and S Ebrahim. Epidemiology–is it time to call it a day? Int J Epidemiol,
30(1):1–11, 2001. URL https://www.ncbi.nlm.nih.gov/pubmed/11171840.
F Elwert. Graphical causal models. In S L Morgan, editor, Handbook of causal analysis
for social research, chapter 13, pages 245–274. Springer, New York, 2013. ISBN 978-
94-007-6094-3. URL http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.
1.1.364.7505{&}rep=rep1{&}type=pdf.
Craig K. Enders. Applied missing data analysis. Methodology in the social sciences,
page 377, 2010. ISSN 1098-6596. doi: 10.1017/CBO9781107415324.004. URL https:
//ezp.lib.unimelb.edu.au/login?url=https://search.ebscohost.com/login.
aspx?direct=true{&}db=cat00006a{&}AN=melb.b3527645{&}site=eds-live.
N L Fleischer and A V Diez Roux. Using directed acyclic graphs to guide analyses
of neighbourhood health effects: an introduction. J Epidemiol Community Health,
62(9):842–846, 2008. doi: 10.1136/jech.2007.067371. URL http://jech.bmj.com/
content/62/9/842.full.pdf.
M M Glymour and S Greenland. Causal diagrams. In K J Rothman, S Greenland, and
T L Lash, editors, Modern Epidemiology, chapter 12, pages 183–209. Wolters Kluwer:
Lipincott Williams & Wilkins, Philadelphia, 3rd edition, 2008. ISBN 978-1451190052.
H. A. Goldani, H Bettiol, M A Barbieri, A. A. Silva, M Agranonik, M B
Morais, and M Z Goldani. Cesarean delivery is associated with an in-
creased risk of obesity in adulthood in a Brazilian birth cohort study.
American Journal of Clinical Nutrition, 93(6):1344–1347, 2011. ISSN
0002-9165. doi: 10.3945/ajcn.110.010033. URL http://www.scopus.com/
inward/record.url?eid=2-s2.0-79956303990{&}partnerID=MN8TOARShttp:
//www.ajcn.org/cgi/doi/10.3945/ajcn.110.010033.
L Gordis. Epidemiology. Elsevier Saunders, Philadelphia, 5th edition, 2014. ISBN
978-1-4557-3733-8.
D. Grady, S. M. Rubin, D. B. Petitti, C. S. Fox, D. Black, B. Ettinger, V. L. Ernster,
and S. R. Cummings. Hormone therapy to prevent disease and prolong life in
postmenopausal women. Annals of Internal Medicine, 117(12):1016–1037, 1992.
ISSN 00034819. doi: 10.1016/0020-7292(93)90679-Q.
S Greenland. Modeling and variable selection in epidemiologic analysis. Am J Public
Health, 79(3):340–349, 1989. URL https://www.ncbi.nlm.nih.gov/pmc/articles/
PMC1349563/pdf/amjph00229-0086.pdf.
S Greenland. Absence of confounding does not correspond to collapsibility of the rate
ratio or rate difference. Epidemiology, 7(5):498–501, 1996. URL https://www.ncbi.
nlm.nih.gov/pubmed/8862980.
196
S Greenland and H Morgenstern. Confounding in health research. Annu

Rev Public Health, 22:189–212, 2001. doi: 10.1146/annurev.publhealth.22.
1.189. URL https://www.ncbi.nlm.nih.gov/pubmed/11274518http://www.
annualreviews.org/doi/pdf/10.1146/annurev.publhealth.22.1.189.
S Greenland and J M Robins. Identifiability, exchangeability, and epidemiological
confounding. Int J Epidemiol, 15(3):413–419, 1986. URL http://citeseerx.ist.
psu.edu/viewdoc/download?doi=10.1.1.157.6445{&}rep=rep1{&}type=pdf.
S Greenland and J M Robins. Identifiability, exchangeability and confounding revisited.
Epidemiol Perspect Innov, 6:4, 2009. doi: 10.1186/1742-5573-6-4. URL https:
//www.ncbi.nlm.nih.gov/pmc/articles/PMC2745408/pdf/1742-5573-6-4.pdf.
Sander Greenland. Quantifying Biases in Causal Models: Classical Confounding vs
Collider-Stratification Bias. Epidemiology, 14(3):300–306, may 2003. ISSN 1044-3983.
doi: 10.1097/01.EDE.0000042804.12056.6C. URL https://www.ncbi.nlm.nih.gov/
pubmed/12859030.
Sander Greenland, Judea Pearl, and James M Robins. Causal diagrams for epidemiologic
research. Epidemiology (Cambridge, Mass.), 10(1):37–48, jan 1999. ISSN 1044-3983.
doi: 10.1097/00001648-199901000-00008. URL https://cdn1.sph.harvard.edu/
wp-content/uploads/sites/343/2013/03/causaldia.pdf.
Francine Grodstein, Thomas B. Clarkson, and JoAnn E. Manson. Understan-
ding the Divergent Data on Postmenopausal Hormone Therapy. New England
Journal of Medicine, 348(7):645–650, feb 2003. ISSN 0028-4793. doi: 10.1056/
NEJMsb022365. URL http://www.ncbi.nlm.nih.gov/pubmed/12584376http://
www.nejm.org/doi/abs/10.1056/NEJMsb022365.
S Guo and M W Fraser. Propensity score analysis: statistical methods and applications.
Sage, Los Angeles, 2nd edition, 2015.
Gordon Guyatte, Drummond Rennie, Maureen Meade, and Deborah Cook. User’s
guide to the medical literature: essentials of evidence-based clinical practice. McGraw
Hill, New York, 3rd edition, sep 2015. ISBN 9780071808729.
M A Hernan. Causal Knowledge as a Prerequisite for Confounding Evaluation: An
Application to Birth Defects Epidemiology. American Journal of Epidemiology,
155(2):176–184, jan 2002. ISSN 00029262. doi: 10.1093/aje/155.2.176. URL http:
//aje.oxfordjournals.org/content/155/2/176.full.pdf.
M A Hernan and J M Robins. Causal Inference. Chapman & Hall/CRC, forthco-
ming, Boca Raton, 2018. URL https://www.hsph.harvard.edu/miguel-hernan/
causal-inference-book/.
M A Hernan, S Hernandez-Diaz, and J M Robins. A structural approach to selection
bias. Epidemiology, 15(5):615–625, 2004. URL http://www.ncbi.nlm.nih.gov/
pubmed/15308962http://graphics.tx.ovid.com/ovftpdfs/FPDDNCJCMAIDBI00/
fs047/ovft/live/gv024/00001648/00001648-200409000-00020.pdf.
197
M A Hernan, D Clayton, and N Keiding. The Simpson’s paradox unraveled. Int J

Epidemiol, 40(3):780–785, 2011. doi: 10.1093/ije/dyr041. URL https://www.ncbi.
nlm.nih.gov/pubmed/21454324.
Miguel A. Hernán, Alvaro Alonso, Roger Logan, Francine Grodstein, Karin B. Michels,
Walter C. Willett, Joann E. Manson, and James M. Robins. Observational studies
analyzed like randomized experiments: An application to postmenopausal hormone
therapy and coronary heart disease. Epidemiology, 19(6):766–779, 2008. ISSN
10443983. doi: 10.1097/EDE.0b013e3181875e61.
S Hernandez-Diaz, E F Schisterman, and M A Hernan. The birth weight ”pa-

radox”uncovered? Am J Epidemiol, 164(11):1115–1120, 2006. doi: 10.1093/
aje/kwj275. URL http://www.ncbi.nlm.nih.gov/pubmed/16931543http://aje.
oxfordjournals.org/content/164/11/1115.full.pdf.
D E Ho, K Imai, G King, and E A Stuart. Matching as Nonparametric Preprocessing for

Reducing Model Dependence in Parametric Causal Inference. Political Analysis, 15:
199–236, 2007. URL http://gking.harvard.edu/files/abs/matchp-abs.shtml.
P W Holland. Statistics and causal inference. J Am Stat Assoc, 81(396):945–960, 1986.
Stephen Hulley, Deborah Grady, Trudy Bush, Curt Furberg, David Herrington, Betty
Riggs, Eric Vittinghoff, and Heart and Estrogen/progestin Replacement Study
(HERS) Research Group. Randomized Trial of Estrogen Plus Progestin for Secondary
Prevention of Coronary Heart Disease in Postmenopausal Women. JAMA, 280
(7):605, 1998. ISSN 0098-7484. doi: 10.1001/jama.280.7.605. URL http://jama.
jamanetwork.com/article.aspx?doi=10.1001/jama.280.7.605.
G W Imbens and D B Rubin. Causal Inference for Statistics, Social, and Biomedical
Sciences: an Introduction. Cambridge University Press, Cambridge, 2015. ISBN
978-0-521-88588-1.
Nicholas P. Jewell. Statistics for epidemiology. Chapman & Hall/CRC, Boca Raton,
2004. ISBN 9781584884330. URL https://www.crcpress.com/Statistics-for-
Epidemiology/Jewell/p/book/9781584884330.
David Kleinbaum, Lawrence Kupper, and Hal Morgenstern. Epidemiology: principles

and quantitative methods. John Wiley & Sons, New York, 1982. ISBN 0-471-28985-
X. URL http://www.wiley.com/WileyCDA/WileyTitle/productCd-047128985X.
html.
R B Kline. Principles and practice of structural equation modeling, volume Guilford.

Guilford, New York, 4th edition, 2016. ISBN 978-1-4625-2334-4.
Walter. Leite. Practical propensity score methods using R. Sage, Thousand Oaks, 2017.
ISBN 9781452288888. URL https://us.sagepub.com/en-us/sam/practical-
propensity-score-methods-using-r/book241054.
198
R M Mickey and S Greenland. The impact of confounder selection criteria on effect

estimation. Am J Epidemiol, 129(1):125–137, 1989. URL https://www.ncbi.nlm.
nih.gov/pubmed/2910056.
O S Miettinen and E F Cook. Confounding: essence and detection. Am J Epidemiol,

114(4):593–603, 1981. URL https://www.ncbi.nlm.nih.gov/pubmed/7304589.
David Moher, Sally Hopewell, Kenneth F. Schulz, Victor Montori, Peter C. Gøtzsche,
P. J. Devereaux, Diana Elbourne, Matthias Egger, and Douglas G. Altman. CON-
SORT 2010 explanation and elaboration: updated guidelines for reporting parallel
group randomised trials. BMJ (Clinical research ed.), 340:c869, 2010. ISSN 14685833.
doi: 10.1136/bmj.c869.
S L Morgan and C Winship. Counterfactuals and causal inference: methods and

principles for social research. Cambridge University Press, Cambridge, 2nd edition,
2015. ISBN 1107694167.
J Neyman. Sur les applications de la thar des probabilities aux experiences Agaricales:
Essay des principle. Excerpts reprinted (1990) in English (D. Dabrowska and T.
Speed, translators) . Statistical Science,, 5:463–472, 1923.
A Olmos and P Govindasamy. A practical guide for using propensity score weighting
in R. Practical Assessment Research & Evaluation, 20(13):1–8, 2015.
Neil Pearce and Lorenzo Richiardi. Commentary: Three worlds collide: Berkson’s bias,
selection bias and collider bias. International Journal of Epidemiology, 43(2):521–524,
2014. ISSN 14643685. doi: 10.1093/ije/dyu025.
J Pearl. Causal Inference in the Health Sciences: A Conceptual Intro-

duction. Health Services & Outcomes Research Methodology, 2:189–220,
2001. URL http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.15.
8830{&}rep=rep1{&}type=pdf.
J Pearl. Causality: models, reasoning and inference. Cambridge University Press,

Cambridge, 2nd edition, 2009a. ISBN 978-0-521-89560-6.
Judea Pearl. Causal inference in statistics: An overview. Statistics Surveys, 3:96–146,

2009b. ISSN 1935-7516. doi: 10.1214/09-SS057. URL http://projecteuclid.org/
euclid.ssu/1255440554.
Judea Pearl, Madelyn Glymour, and Nicholas P. Jewell. Causal inference in statistics:
a primer. John Wiley & Sons, Chichester, UK, 2016. ISBN 1119186846. URL
http://www.wiley.com/WileyCDA/WileyTitle/productCd-1119186846.html.
M L Petersen and M J van der Laan. Causal models and learning from data: integrating
causal modeling and statistical estimation. Epidemiology, 25(3):418–426, 2014. doi:
10.1097/EDE.0000000000000078. URL http://www.ncbi.nlm.nih.gov/pubmed/
24713881.
199
Ross L. Prentice, Robert Langer, Marcia L. Stefanick, Barbara V. Howard, Mary

Pettinger, Garnet Anderson, David Barad, J. David Curb, Jane Kotchen, Lewis
Kuller, Marian Limacher, Jean Wactawski-Wende, and Women’s Health Initiative
Investigators. Combined Postmenopausal Hormone Therapy and Cardiovascular
Disease: Toward Resolving the Discrepancy between Observational Studies and
the Women’s Health Initiative Clinical Trial. American Journal of Epidemiology,
162(5):404–414, sep 2005. ISSN 1476-6256. doi: 10.1093/aje/kwi223. URL http:
//www.ncbi.nlm.nih.gov/pubmed/16033876http://academic.oup.com/aje/
article/162/5/404/82544/Combined-Postmenopausal-Hormone-Therapy-and.
S H Preston and A Stokes. Obesity paradox: conditioning on disease

enhances biases in estimating the mortality risks of obesity. Epidemi-
ology, 25(3):454–461, 2014. doi: 10.1097/EDE.0000000000000075. URL
http://www.ncbi.nlm.nih.gov/pubmed/24608666http://www.ncbi.nlm.nih.
gov/pmc/articles/PMC3984024/pdf/ede-25-454.pdf.
David H. Rehkopf, M. Maria Glymour, and Theresa L. Osypuk. The Consistency

Assumption for Causal Inference in Social Epidemiology: When a Rose Is Not a Rose.
Current Epidemiology Reports, 3(1):63–71, 2016. ISSN 2196-2995. doi: 10.1007/s40471-
016-0069-5. URL http://link.springer.com/10.1007/s40471-016-0069-5.
P R Rosenbaum and D B Rubin. The Central Role of the Propensity Score in

Observational Studies for Causal Effects. Biometrika, 70(1):41–55, 1983. doi: DOI10.
1093/biomet/70.1.41. URL http://biomet.oxfordjournals.org/content/70/1/
41.full.pdf.
Paul R. Rosenbaum. Observation and experiment : an introduction to causal inference.

Harvard University Press, Cambridge/MA, 2017. ISBN 9780674975576. URL
http://www.hup.harvard.edu/catalog.php?isbn=9780674975576.
JE Rossouw, GL Anderson, RL Prentice, and Women’s Health Initiative Investigators.

Risks and Benefits of Estrogen Plus Progestin in Healthy Postmenopausal Women.
The Jornal of the American Medical Association, 288(3):321–333, 2002.
K J Rothman, S Greenland, and T L Lash. Modern Epidemiology. Wolters Kluwer:

Lipincott Williams & Wilkins, Philadelphia, 3rd edition, 2008. ISBN 978-1451190052.
D B Rubin. Estimating Causal Effects of Treatments in Randomized and Nonrandomized

Studies. Journal of Educational Psychology, 66(5):688–701, 1974. doi: Doi10.1037/
H0037350. URL http://psycnet.apa.org/journals/edu/66/5/688.pdf.
D B Rubin. The design versus the analysis of observational studies for causal effects:
parallels with the design of randomized trials. Stat Med, 26(1):20–36, 2007. doi:
10.1002/sim.2739. URL https://www.ncbi.nlm.nih.gov/pubmed/17072897http:
//onlinelibrary.wiley.com/store/10.1002/sim.2739/asset/2739{_}ftp.
pdf?v=1{&}t=iy7bouh7{&}s=1bf6c4d9839b1ab3a69d5004e70f90496628a8f3.
200
Erigene Rutayisire, Kun Huang, Yehao Liu, and Fangbiao Tao. The mode of delivery
affects the diversity and colonization pattern of the gut microbiota during the first
year of infants’ life: A systematic review. BMC Gastroenterology, 16(1):1–12, 2016.
ISSN 1471230X. doi: 10.1186/s12876-016-0498-0. URL http://dx.doi.org/10.
1186/s12876-016-0498-0.
R Scheines. An Introduction to Causal Inference. 1997. URL https://pdfs.
semanticscholar.org/ba18/30ac5ba38d9d19daad4fc0065785ecc36cca.pdf.
Ilya Shpitser, Tyler J VanderWeele, and James M Robins. On the validity of covariate
adjustment for estimating causal effects. In Proceedings of the Twenty Sixth Con-
ference on Uncertainty in Artificial Intelligence $(UAI-10)$, pages 527–536, 2010.
ISBN 978-0-9749039-6-5.
I Shrier and R W Platt. Reducing bias through directed acyclic graphs. BMC Med Res
Methodol, 8:70, 2008. doi: 10.1186/1471-2288-8-70. URL http://www.ncbi.nlm.
nih.gov/pmc/articles/PMC2601045/pdf/1471-2288-8-70.pdf.
E H Simpson. The Interpretation of Interaction in Contingency Ta-
bles. Journal of the Royal Statistical Society. Series B, 13(2):
238–241, 1951. URL http://www.epidemiology.ch/history/PDFbg/
SimpsonEH1951theinterpretationofinteraction.pdf.
P Spirtes, C Glymour, and R Scheines. Causation, prediction and search. MIT Press,
Cambridge/MA, 2nd edition, 2000. ISBN 9780262527927.
Meir J. Stampfer, Graham A. Colditz, Walter C. Willett, JoAnn E. Manson, Bernard
Rosner, Frank E. Speizer, and Charles H. Hennekens. Postmenopausal Estrogen
Therapy and Cardiovascular Disease. New England Journal of Medicine, 325(11):
756–762, sep 1991. ISSN 0028-4793. doi: 10.1056/NEJM199109123251102. URL
http://www.nejm.org/doi/abs/10.1056/NEJM199109123251102.
E A Stuart. Matching methods for causal inference: A review and a look
forward. Stat Sci, 25(1):1–21, 2010. doi: 10.1214/09-STS313. URL
http://www.ncbi.nlm.nih.gov/pubmed/20871802http://www.ncbi.nlm.nih.
gov/pmc/articles/PMC2943670/pdf/nihms200640.pdf.
Moyses Szklo and F Javier Nieto. Epidemiology: beyond the basics. Jones & Bartlett
Learning, Burlington,MA, 3rd edition, 2014. ISBN 9781449604691. doi: 10.1016/j.
ijmedinf.2010.04.003.
G Taubes. Epidemiology faces its limits. Science (New York, N.Y.), 269(5221):164–9,
jul 1995. ISSN 0036-8075. URL http://www.ncbi.nlm.nih.gov/pubmed/7618077.
G Taubes. Do we really know what makes us healthy?, 2007.
J Textor, J Hardt, and S Knuppel. DAGitty: a graphical tool for analyzing causal
diagrams. Epidemiology, 22(5):745, 2011. doi: 10.1097/EDE.0b013e318225c2be. URL
http://www.ncbi.nlm.nih.gov/pubmed/21811114.
201
Mark J van der Laan and Sherri Rose. Targeted Learning. Springer Series in Statistics.
Springer New York, New York, NY, 2011. ISBN 978-1-4419-9781-4. doi: 10.1007/978-
1-4419-9782-1. URL http://link.springer.com/10.1007/978-1-4419-9782-1.
Jan P. Vandenbroucke. The HRT controversy: observational studies and RCTs fall in
line. The Lancet, 373(9671):1233–1235, 2009. ISSN 01406736. doi: 10.1016/S0140-
6736(09)60708-X.
Tyler J. VanderWeele. Concerning the consistency assumption in causal inference. Epide-
miology, 20(6):880–883, 2009. ISSN 10443983. doi: 10.1097/EDE.0b013e3181bd5638.
Tyler J VanderWeele and Ilya Shpitser. On the definition of a confounder. The Annals
of Statistics, 41(1):196–220, feb 2013. ISSN 0090-5364. doi: 10.1214/12-AOS1058.
URL http://projecteuclid.org/euclid.aos/1364302740.
Liu Wei, M. Alan Brookhart, Sebastian Schneeweiss, Xiaojuan Mi, and Soko Setoguchi.
Implications of M bias in epidemiologic studies: A simulation study. American Journal
of Epidemiology, 176(10):938–948, 2012. ISSN 00029262. doi: 10.1093/aje/kws165.
Daniel Westreich. Berkson’s Bias, Selection Bias, and Missing Data. Epi-
demiology, 23(1):159–164, 2012. ISSN 1044-3983. doi: 10.1097/EDE.
0b013e31823b6296. URL http://content.wkhealth.com/linkback/openurl?
sid=WKPTLP:landingpage{&}an=00001648-201201000-00024.
202

Antonio Augusto Moura - Introducao A Inferencia Causal

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Antonio Augusto Moura - Introducao A Inferencia Causal

Enviado por

Direitos autorais:

Formatos disponíveis

Introdução à Inferência Causal em

Epidemiologia: uma abordagem gráfica e

Antônio Augusto Moura da Silva

Universidade Federal do Maranhão

I. O Modelo de Respostas Potenciais: abordagem contrafatual 23

3. Ensaio clı́nico randomizado 41

II. Abordagem Gráfica 57

5.3. Estruturas de associação . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

6. Viés de confundimento: do conceito associacional ao conceito estrutural 93

7. Viés de colisão 121

7.9. Variável simultaneamente colisora e confundidora . . . . . . . . . . . . . 136

III. Estimação do Efeito Causal 143

9. Exemplo de análise com escore de propensão em Epidemiologia no R 163

10.Exemplo de análise com escore de propensão em Epidemiologia no Stata 181

3.1. Ensaio clı́nico randomizado . . . . . . . . . . . . . . . . . . . . . . . . . 42

4.1. Estudo de coorte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

5.1. DAG - Gráfico acı́clico direcionado. . . . . . . . . . . . . . . . . . . . . . 62

5.20. Identificação e Estimação . . . . . . . . . . . . . . . . . . . . . . . . . . 86

6.1. DAG interpretando o paradoxo de Simpson como viés de colisão . . . . 95

7.1. DAG ilustrando o viés de Berkson como viés de colisão . . . . . . . . . 123

8.1. Verificando área de suporte comum pelo boxplot. . . . . . . . . . . . . . 157

9.1. Verificando área de suporte comum pelo boxplot. . . . . . . . . . . . . . 172

10.1. Verificando área de suporte comum pelo boxplot. . . . . . . . . . . . . . 188

2.1. Modelo de Respostas Potenciais . . . . . . . . . . . . . . . . . . . . . . . 25

4.1. Participação no Programa de Saúde da Famı́lia e Vacinação Infantil . . 49

5.1. Estruturas de associação no DAG e necessidade de intervenção . . . . . 70

6.1. O paradoxo de Simpson - associação marginal . . . . . . . . . . . . . . . 93

7.1. Viés de Berkson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

7.2. Viés de colisão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

8.1. Pareamento com base nas variáveis observadas . . . . . . . . . . . . . . 146

9.1. Descrição do banco de dados lalonde . . . . . . . . . . . . . . . . . . . . 164

se apenas o instrumental clássico da estatı́stica. Tal estimativa do efeito causal será

São Luı́s, Maranhão, 2018

Antônio Augusto Moura da Silva é professor de Epidemiologia do Programa de

não causais ou espúrias podem ocorrer. A estatı́stica nasceu identificando associações

1.2. A história da terapia hormonal como fator de risco

O que explicaria esta diferença entre os resultados dos estudos observacionais e

do NHS imitando um ensaio clı́nico. Ao invés de compararem quem estava tomando TH

1.2.1. Qual a evidência atual?

Tabela 1.1.: Terapia Hormonal e Doença Coronariana

Tabela 2.1.: Modelo de Respostas Potenciais

Assim, na situação em que o indivı́duo foi submetido ao tratamento (Dt=1 ) o desfecho

Figura 2.1.: Efeito causal individual - Paciente 1 - João

A primeira situação representa a resposta fatual

Tabela 2.2.: Estudo hipotético - tabagismo e câncer de pulmão

Os desfechos das situações fatuais estão destacados em negrito

Figura 2.2.: Efeito causal individual

(a) 2 - Raimundo (b) 3 - Maria

2.2. Cálculo do Efeito Causal Médio

Efeito Causal Médio na População

E[Dit=1 − Dit=0 ] = E[Dit=1 ] − E[Dit=0 ] (2.1)

Efeito Causal Médio na População (resposta dicotômica)

P r[Dit=1 = 1] − P r[Dit=0 = 1] (2.2)

Tabela 2.3.: Exemplo hipotético - tratamento e desfecho dicotômicos

Os desfechos das situações fatuais estão destacados em negrito

Probabilidade do desfecho se exposto = P r[Dt=1 = 1] = 25/60 = 0,417

Cálculo do efeito causal médio:

Diferença de risco causal = 0,417 - 0,417 = 0

Efeito Causal Médio na População (resposta dicotômica)

P r[Dit=1 = 1]/P r[Dit=0 = 1] (2.3)

2.2.1. Cálculo no Stata

2.3. Cálculo do efeito causal médio com a resposta

P r[Di = 1|Ti = 1] − P r[Di = 1|Ti = 0] (2.4)