Você está na página 1de 202

Introdução à Inferência Causal em

Epidemiologia: uma abordagem gráfica e


contrafatual

Antônio Augusto Moura da Silva

Universidade Federal do Maranhão


27 de fevereiro de 2018
Sumário
Introdução 13

1. Causalidade em Epidemiologia 17
1.1. A difı́cil busca da causalidade . . . . . . . . . . . . . . . . . . . . . . . . 17
1.2. A história da terapia hormonal como fator de risco ou de proteção para
doença coronariana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.2.1. Qual a evidência atual? . . . . . . . . . . . . . . . . . . . . . . . 22

I. O Modelo de Respostas Potenciais: abordagem contrafatual 23


2. O Modelo de Respostas Potenciais 25
2.1. Respostas Potenciais e Efeito Causal Individual . . . . . . . . . . . . . . 25
2.2. Cálculo do Efeito Causal Médio . . . . . . . . . . . . . . . . . . . . . . . 29
2.2.1. Cálculo no Stata . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.3. Cálculo do efeito causal médio com a resposta fatual . . . . . . . . . . . 32
2.4. Quadrado Latino: contrafatuais no mundo real . . . . . . . . . . . . . . 34
2.5. Causa e Associação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3. Ensaio clı́nico randomizado 41


3.1. Caracterı́sticas do estudo experimental . . . . . . . . . . . . . . . . . . . 41
3.2. Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4. Estudos observacionais 47
4.1. Caracterı́sticas dos estudos observacionais . . . . . . . . . . . . . . . . . 47
4.2. Pressupostos para identificação do efeito causal . . . . . . . . . . . . . . 48
4.2.1. Intervenções bem definidas . . . . . . . . . . . . . . . . . . . . . 49
4.2.2. Permutabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.2.3. Positividade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.3. Exemplo - aplicação dos pressupostos em estudo observacional . . . . . 52
4.4. Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

II. Abordagem Gráfica 57


5. Gráficos Acı́clicos Direcionados (DAGs) 59
5.1. Causa e Associação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.2. Notação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

3
Sumário

5.3. Estruturas de associação . . . . . . . . . . . . . . . . . . . . . . . . . . . 64


5.3.1. Cadeia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
5.3.2. Garfo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.3.3. Garfo Invertido . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.4. Intervenções necessárias e danosas nas estruturas de associação . . . . . 70
5.5. DAG como um sistema de equações estruturais não paramétricas . . . . 71
5.6. Separação direcional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
5.6.1. Separação direcional incondicional . . . . . . . . . . . . . . . . . 74
5.6.2. Separação direcional condicional . . . . . . . . . . . . . . . . . . 75
5.7. O critério da porta de trás . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.8. Identificando o conjunto mı́nimo de variáveis de ajuste para confundi-
mento no DAG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.9. DAG incluindo variáveis não mensuradas . . . . . . . . . . . . . . . . . 83
5.10. Identificação e estimação . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
5.11. Desenhando o DAG no programa DAGitty . . . . . . . . . . . . . . . . . 86
5.12. Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

6. Viés de confundimento: do conceito associacional ao conceito estrutural 93


6.1. O paradoxo de Simpson . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
6.1.1. Colapsibilidade da Medida de Associação . . . . . . . . . . . . . 96
6.1.2. Exercı́cio resolvido - o paradoxo de Simpson . . . . . . . . . . . . 100
6.2. Definição associacional de confundimento . . . . . . . . . . . . . . . . . 102
6.3. Definição contrafatual de confundimento . . . . . . . . . . . . . . . . . . 105
6.4. Viés M . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
6.5. Estruturas comuns de confundimento . . . . . . . . . . . . . . . . . . . . 110
6.6. Exemplo de viés de confundimento com intervenção no DAG por meio
do operador .do . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
6.7. Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.8. Métodos de ajuste para confundimento . . . . . . . . . . . . . . . . . . . 115
6.9. Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
6.10. Apêndice - Interação e modificação de efeito . . . . . . . . . . . . . . . . 119

7. Viés de colisão 121


7.1. Viés de Berkson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
7.2. Conceito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
7.3. Algumas causas de viés de colisão . . . . . . . . . . . . . . . . . . . . . . 124
7.4. Exemplo numérico de viés de colisão - Dieta e risco de câncer não
relacionado com a dieta . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
7.5. Exemplos de algumas estruturas de viés de colisão . . . . . . . . . . . . 128
7.5.1. Viés de colisão pela porta da frente . . . . . . . . . . . . . . . . . 128
7.5.2. Viés de colisão pela porta dos fundos . . . . . . . . . . . . . . . . 131
7.6. Intensidade do viés de colisão . . . . . . . . . . . . . . . . . . . . . . . . 132
7.7. Viés de colisão provocado por perdas de seguimento . . . . . . . . . . . 133
7.8. Exemplo de viés de colisão pela porta da frente - variável intermediária
afetada pelo tratamento . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

4
Sumário

7.9. Variável simultaneamente colisora e confundidora . . . . . . . . . . . . . 136


7.10. Diferenças e semelhanças entre viés de confundimento e viés de colisão . 137
7.11. Ajuste para viés de seleção . . . . . . . . . . . . . . . . . . . . . . . . . 138
7.12. Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

III. Estimação do Efeito Causal 143


8. Métodos de análise com escore de propensão 145
8.1. Escore de propensão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
8.2. Quais variáveis incluir no ajuste? . . . . . . . . . . . . . . . . . . . . . . 148
8.3. Passos na análise com escore de propensão . . . . . . . . . . . . . . . . . 149
8.3.1. Análise em modelos de regressão convencional . . . . . . . . . . . 150
8.3.2. Verificar balanceamento entre os grupos . . . . . . . . . . . . . . 150
8.3.3. Estimação do escore de propensão . . . . . . . . . . . . . . . . . 154
8.3.4. Ponderação pelo escore de propensão . . . . . . . . . . . . . . . . 154
8.3.5. Verificação do balanceamento após a implementação do escore
de propensão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
8.3.6. Cálculo do efeito causal em modelo ponderado pelo escore de
propensão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
8.4. Correção para efeito do desenho e/ou para perdas de seguimento . . . . 162

9. Exemplo de análise com escore de propensão em Epidemiologia no R 163


9.1. Estimativa do efeito causal por meio de escore de propensão . . . . . . . 163
9.1.1. Ponderação com escore de propensão . . . . . . . . . . . . . . . . 163

10.Exemplo de análise com escore de propensão em Epidemiologia no Stata 181


10.1. Estimativa do efeito causal por meio de escore de propensão . . . . . . . 181
10.1.1. Ponderação com escore de propensão . . . . . . . . . . . . . . . . 181

5
Lista de Figuras
2.1. Efeito causal individual - Paciente 1 - João . . . . . . . . . . . . . . . . 27
2.2. Efeito causal individual . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4. Desenho cruzado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.5. Desenho cruzado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.6. Causa e Associação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.1. Ensaio clı́nico randomizado . . . . . . . . . . . . . . . . . . . . . . . . . 42

4.1. Estudo de coorte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48


4.2. Gráfico causal - PSF e Vacinação infantil . . . . . . . . . . . . . . . . . 52

5.1. DAG - Gráfico acı́clico direcionado. . . . . . . . . . . . . . . . . . . . . . 62


5.2. Estrutura de cadeia representando mediação . . . . . . . . . . . . . . . . 64
5.3. Cadeia - mediação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.4. Estrutura de garfo representando causa comum - viés de confundimento 65
5.5. Estrutura de garfo ilustrando condicionamento para causa comum, ne-
cessário para remover viés de confundimento . . . . . . . . . . . . . . . . 66
5.6. Garfo - confundimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.7. Estrutura de garfo invertido representando efeito comum com colisor . . 68
5.8. Estrutura de garfo invertido representando viés de colisão . . . . . . . . 68
5.9. Estrutura de garfo invertido representando viés de colisão . . . . . . . . 69
5.10. Estrutura de garfo invertido representando efeito comum com colisor e
descendente de colisor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.11. DAG sob magnificação representando estrutura de cadeia com os termos
de erro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.12. Exceção à regra da fidelidade - efeitos direto e indireto do fumo na saúde
se cancelariam . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.13. Separação Direcional entre A e D pelo colisor B . . . . . . . . . . . . . . 78
5.14. Conexão Direcional entre A e D por meio de condicionamento pelo colisor B 78
5.15. Conexão Direcional entre A e D por meio da causa comum E (de A e C) 79
5.16. Separação Direcional entre A e D por meio do colisor B e de condiciona-
mento por E . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.17. DAG ilustrando porque não se deve ajustar para descendentes do trata-
mento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
5.18. DAG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
5.19. DAG ilustrando situação na qual o efeito causal não é identificável por
meio de ajuste por covariáveis . . . . . . . . . . . . . . . . . . . . . . . . 85

7
Lista de Figuras

5.20. Identificação e Estimação . . . . . . . . . . . . . . . . . . . . . . . . . . 86


5.21. Programa DAGitty . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
5.22. Estrutura de garfo invertido mostrando Colisor no caminho pela porta
dos fundos entre o tratamento e o desfecho . . . . . . . . . . . . . . . . 88
5.23. DAG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
5.24. DAG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
5.25. DAG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
5.26. DAG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

6.1. DAG interpretando o paradoxo de Simpson como viés de colisão . . . . 95


6.2. DAG interpretando o paradoxo de Simpson como viés de confundimento 96
6.3. Viés de confundimento numa perspectiva associacional . . . . . . . . . . 109
6.4. Viés de confundimento numa perspectiva estrutural . . . . . . . . . . . . 110
6.5. DAG - Viés M - Colisor no caminho pela porta dos fundos . . . . . . . . 111
6.6. DAG - Viés de confundimento - C como causa comum direta de T e D . 112
6.7. DAG - Viés de confundimento - C como causa comum indireta de T via
A e direta de D . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
6.8. DAG - Viés de confundimento - C como causa comum direta de T
indireta de D via B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.9. DAG - Viés de confundimento - C como causa comum indireta de T via
A e indireta de D via B . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.10. Viés de confundimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
6.11. Gráfico mutilado demonstrando o operador do(.) para os dois valores do
tratamento T . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

7.1. DAG ilustrando o viés de Berkson como viés de colisão . . . . . . . . . 123


7.2. DAG ilustrando o viés de colisão quando estudamos efeito de fatores
perinatais nos desfechos fetais adversos apenas em nascidos vivos . . . . 124
7.3. DAG ilustrando viés de colisão quando condicionamos para perda de
peso em estudo sobre efeito da dieta em câncer não relacionado com a
dieta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
7.4. Viés de colisão pela porta da frente - condicionamento por variável
diretamente afetada pela exposição e pela doença . . . . . . . . . . . . . 128
7.5. Viés de colisão pela porta da frente - condicionamento por descendente
de colisor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
7.6. Viés de colisão pela porta da frente - condicionamento por variável
afetada pela exposição e por uma causa da doença . . . . . . . . . . . . 129
7.7. Viés de colisão pela porta da frente - condicionamento por variável
afetada por uma consequência da exposição e pela doença . . . . . . . . 130
7.8. Viés de colisão pela porta da frente - condicionamento por variável
afetada por uma consequência da exposição e pela doença . . . . . . . . 130
7.9. Viés de colisão pela porta da frente - condicionamento por variável
intermediária afetada pelo tratamento (mediador), que também é colisora
do mediador e do desfecho . . . . . . . . . . . . . . . . . . . . . . . . . . 131

8
Lista de Figuras

7.10. Viés de colisão pela porta de trás - condicionamento por variável afetada
pela doença e por uma causa da exposição . . . . . . . . . . . . . . . . . 132
7.11. Viés M - Colisor no caminho pela porta dos fundos - condicionamento
por variável afetada por uma causa da exposição e por uma causa da
doença . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
7.12. Viés M - Colisor no caminho pela porta dos fundos - condicionamento
por variável afetada por uma causa da exposição e por uma consequência
de uma causa da doença . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
7.13. Viés de colisão pela porta da frente - variável intermediária afetada pelo
tratamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
7.14. Estrutura Gravata-Borboleta - Colisor/Confundidor no caminho pela
porta dos fundos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
7.15. Fumo materno durante a gravidez e mortalidade infantil . . . . . . . . . 141

8.1. Verificando área de suporte comum pelo boxplot. . . . . . . . . . . . . . 157


8.2. Verificando área de suporte comum pelo boxplot. . . . . . . . . . . . . . 158
8.3. Diferenças absolutas na médias padronizadas. . . . . . . . . . . . . . . . 161

9.1. Verificando área de suporte comum pelo boxplot. . . . . . . . . . . . . . 172


9.2. Verificando diferenças padronizadas absolutas por método gráfico - ATE.176
9.3. Verificando diferenças padronizadas absolutas por método gráfico - ATT.179

10.1. Verificando área de suporte comum pelo boxplot. . . . . . . . . . . . . . 188


10.2. Verificando balanceamento por método gráfico de densidade kernel. . . . 194

9
Lista de Tabelas
1.1. Terapia Hormonal e Doença Coronariana . . . . . . . . . . . . . . . . . 22

2.1. Modelo de Respostas Potenciais . . . . . . . . . . . . . . . . . . . . . . . 25


2.2. Estudo hipotético - tabagismo e câncer de pulmão . . . . . . . . . . . . 28
2.3. Exemplo hipotético - tratamento e desfecho dicotômicos . . . . . . . . . 31
2.4. Exemplo hipotético - respostas fatuais . . . . . . . . . . . . . . . . . . . 34
2.5. Cálculo da Razão de Risco Associacional . . . . . . . . . . . . . . . . . . 35
2.6. Situações Ideal (Causa) e Possı́vel (Associação) . . . . . . . . . . . . . . 37

4.1. Participação no Programa de Saúde da Famı́lia e Vacinação Infantil . . 49


4.2. Participação no Programa de Saúde da Famı́lia e Pobreza . . . . . . . . 53
4.3. Pobreza e Vacinação Infantil . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.4. Programa de Saúde da Famı́lia e Vacinação Infantil de acordo com a
pobreza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

5.1. Estruturas de associação no DAG e necessidade de intervenção . . . . . 70


5.2. Pressupostos da regras gráficas de separação direcional . . . . . . . . . . 76
5.3. Regras gráficas de separação direcional . . . . . . . . . . . . . . . . . . . 77

6.1. O paradoxo de Simpson - associação marginal . . . . . . . . . . . . . . . 93


6.2. O paradoxo de Simpson - associação condicional por sexo . . . . . . . . 94
6.3. Definições de colapsibilidade . . . . . . . . . . . . . . . . . . . . . . . . . 97
6.4. Não colapsibilidade do odds ratio na ausência de confundimento . . . . 98
6.5. Razões para não colapsibilidade - diferença entre a estimativa bruta e
ajustada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
6.6. Problemas e limitações no uso da definição associacional de confundimento104
6.7. Estimação do efeito causal . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.8. Definições associacional e estrutural de confundimento . . . . . . . . . . 109
6.9. Definições associacional e estrutural de confundimento . . . . . . . . . . 115
6.10. Métodos para controle de confundimento . . . . . . . . . . . . . . . . . . 116
6.11. Taxa de sucesso da cirurgia aberta e da nefrolitotomia percutânea no
tratamento de cálculos renais . . . . . . . . . . . . . . . . . . . . . . . . 118
6.12. Coeficientes de mortalidade especı́ficos por faixa etária e geral em São
Luı́s e Porto Alegre, 2015 . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6.13. Exemplo 1- Ausência de interação . . . . . . . . . . . . . . . . . . . . . . 120
6.14. Exemplo 2. Interação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

7.1. Viés de Berkson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

11
Lista de Tabelas

7.2. Viés de colisão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126


7.3. Suplementação com ácido fólico e malformações do tubo neural . . . . . 140

8.1. Pareamento com base nas variáveis observadas . . . . . . . . . . . . . . 146


8.2. Critérios de seleção de variáveis para ajuste . . . . . . . . . . . . . . . . 149
8.3. Variáveis da coorte de Ribeirão Preto 1978/79 . . . . . . . . . . . . . . 151
8.4. Balanceamento das variáveis da coorte de Ribeirão Preto 1978/79 . . . 153
8.5. Tipos de efeito causal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
8.6. Cálculo dos pesos para tratamento binário . . . . . . . . . . . . . . . . . 157
8.7. Cálculo do escore de propensão e dos pesos para estimativa do ATE . . 159

9.1. Descrição do banco de dados lalonde . . . . . . . . . . . . . . . . . . . . 164

12
Introdução
Este livro de Introdução à Inferência Causal em Epidemiologia: uma abordagem gráfica e
contrafatual nasceu a partir da disciplina de Inferência Causal, ministrada no Programa
de Pós-Graduação de Saúde Coletiva, da Universidade Federal do Maranhão, e no
Programa de Pós-Graduação em Epidemiologia, da Escola Nacional de Saúde Pública
(ENSP), Fundação Oswaldo Cruz (FIOCRUZ), Rio de Janeiro.
Ao ministrar esta disciplina percebi a dificuldade de alguns alunos de acessar e
compreender a literatura cientı́fica a respeito do tema. Resolvi, então, aproveitar os
slides, arquivos e exercı́cios que desenvolvi na disciplina para iniciar a redação de um
livro didático, que pudesse servir de apoio à ministração deste conteúdo, de importância
cada vez mais crescente, para os cursos de Epidemiologia e Saúde Pública, a nı́vel de
pós-graduação. Ainda há poucos livros publicados, mesmo em inglês, sobre o assunto e
muitos deles são muito densos para o iniciante. Desta forma, o objetivo deste livro é,
sem perder de vista a abrangência desta área em desenvolvimento, explicar os principais
conceitos e aplicá-los em exemplos concretos de pesquisa.
A redação do livro foi um desafio, pois sua redação ocorreu ao mesmo tempo em
que lutava para compreender conceitos e aplicá-los em situações de pesquisa, nos
projetos e junto aos meus alunos. Espero que o esforço tenha valido a pena e seja
recompensado, levando a um maior aprendizado e utilização destas abordagens em
estudos epidemiológicos.
Este material é dirigido para aqueles que iniciam a compreensão da literatura sobre
inferência causal, numa perspectiva gráfica e contrafatual. Como texto introdutório
contém os fundamentos necessários para a formulação de uma questão bem definida e
focada de pesquisa (estimativa da quantidade alvo). Esta abordagem é mais explanatória
e mais indicada para responder a perguntas do tipo: um determinado tratamento cura
ou controla a doença? Tal exposição é causal? É menos indicada para perguntas mais
exploratórias do tipo: quais as causas de um determinado desfecho?
A partir de uma pergunta bem definida e articulada em termos contrafatuais, o
passo seguinte é construir uma teoria, que possa alicerçar os pressupostos causais para
que a quantidade alvo possa ser estimada. Nesta teoria, é importante a incorporação
de modelos gráficos causais, codificados em um gráfico acı́clico direcionado (DAG). A
partir do DAG, que contém embutidas equações estruturais não paramétricas, será
possı́vel verificar se a quantidade alvo de interesse é identificável a partir das variáveis
coletadas pelo pesquisador, aplicando-se, por exemplo, o critério da porta de trás de
Pearl (2009a).
Nesta abordagem é possı́vel passar da verificação de uma associação para uma
tentativa de avaliação da relação causal. A resposta a questões causais requerem
conhecimento prévio do mecanismo de geração dos dados e não podem ser respondidas
apenas a partir dos dados ou do conhecimento de sua distribuição empı́rica, utilizando-

13
Lista de Tabelas

se apenas o instrumental clássico da estatı́stica. Tal estimativa do efeito causal será


possı́vel desde que os pressupostos para sua realização sejam defensáveis (Pearl, 2009b).
Veremos que uma forma mais fácil para representar e comunicar relações causais se
dá por meio de uma combinação de equações estruturais não paramétricas e gráficos
causais. Entretanto, em estudos observacionais os pressupostos necessários para se
estimar o efeito causal não são testáveis empiricamente. Portanto, toda e qualquer
aventura de desvendamento de relações causais é sempre uma tentativa, sujeita a
erro. Sua diferença é que os pressupostos para as interpretações causais são deixados
explı́citos e discutidos exaustivamente, antes que se passe para o processo de estimação
da quantidade alvo.
A primeira parte do livro introduz o leitor para a busca difı́cil da causalidade e
reconta a história da elucidação de causalidade entre a terapia hormonal e a doença
coronariana. Prossegue descrevendo o modelo de respostas potenciais, a partir de sua
proposição por Rubin (1974). Em seguida, aborda o ensaio clı́nico randomizado como
padrão ouro para se realizar inferência causal, pois a randomização tende a assegurar
que os grupos sejam permutáveis entre si e que os padrões de resposta contrafatual
ignorados se distribuam de forma semelhante entre os tratados e os não tratados. A
partir daı́, se consideram os estudos observacionais como se fossem ensaios clı́nicos cuja
randomização foi comprometida e se descrevem quais as estratégias para remendar esta
”quebra do processo de randomização”. Como vimos, estas estratégias terão que estar
alicerçadas em sólidos pressupostos teóricos para que se avance para o passo seguinte
da pesquisa.
A segunda parte do livro trata dos diagramas causais (DAGs). Veremos que, a partir
dos DAGs é possı́vel, se a nossa teoria for completa, evitar viés de colisão e realizar
condicionamento por algumas variáveis para se controlar para o viés de confundimento.
O viés de confundimento será visto numa perspectiva estrutural, sendo impossı́vel
identificá-lo usando-se apenas critérios associacionais. O viés de colisão será retratado
como o nome estrutural do conhecido viés de seleção e serão descritas estratégias para
evitá-lo em situações de pesquisa.
A terceira parte do livro aborda a estimação do efeito causal. Iniciamos com um
resumo das principais estratégias convencionalmente usadas em epidemiologia para
este fim e descrevemos como, por que e quando elas falham. Segue discussão pormeno-
rizada sobre as limitações dos modelos de regressão paramétrica mais utilizados em
Epidemiologia. Por fim, abordamos as estratégias de condicionamento para estimação
do efeito causal mais utilizadas numa abordagem contrafatual: pareamento por escore
de propensão, ponderação pelo inverso da probabilidade de seleção e estimação g. Por
fim trataremos dos métodos duplamente robustos e da aprendizagem de máquinas
direcionada (que inclui uma biblioteca de métodos paramétricos e semiparamétricos de
estimação). Exemplos concretos de pesquisa utilizando estes métodos são apresentados
e os bancos de dados e comandos para a realização das análises podem ser baixados da
página deste livro na internet (http::).
A redação deste livro não seria possı́vel sem a colaboração de várias pessoas...
A jornada é longa. Espero que você aprecie o caminhar pelas páginas deste livro e ao
final possa utilizar os conhecimentos adquiridos para lhe ajudar a responder às suas
indagações causais em Epidemiologia numa perspectiva gráfica e contrafatual.

14
Lista de Tabelas

São Luı́s, Maranhão, 2018

Antônio Augusto Moura da Silva é professor de Epidemiologia do Programa de


Pós-Graduação em Saúde Coletiva da Universidade Federal do Maranhão (UFMA) e
pesquisador 1-B do CNPq na área de Saúde Coletiva.

15
1. Causalidade em Epidemiologia
1.1. A difı́cil busca da causalidade
Desde tempos imemoriais o homem se preocupa em desvendar causalidade. Desde
crianças nos preocupamos em atribuir relações de causa e efeito entre fenômenos
corriqueiros da vida. Percebemos que se abrirmos uma torneira a água jorra e concluı́mos
que a abertura da torneira provocou a saı́da da água. Este é um exemplo de causa
determinı́stica, ou seja, toda vez que ocorrer a causa, fatalmente ocorrerá o efeito
(a não ser, é claro, que haja falta de água na tubulação). Relações de causa e efeito
determinı́sticas são mais fáceis de desvendar e normalmente conseguimos perceber
isto pela experimentação, observando situações do dia a dia. Modelos determinı́sticos
produzem uma solução única.
Entretanto, nem todos os fenômenos obedecem a leis determinı́sticas. Outras vezes
mesmo que o fenômeno tenda a seguir leis determinı́sticas, não temos conhecimento
suficiente para entender este sistema determinı́stico. Pode também ocorrer que um
fenômeno seja provocado por várias causas, estas causas se relacionam entre si e nem
sempre a ocorrência de uma causa é suficiente ou necessária para provocar o efeito.
Há muitos anos os estatı́sticos e epidemiologistas perceberam que na área da saúde a
maioria dos efeitos são produtos de múltiplas causas. Quando há muitas causas atuando
em um fenômeno geralmente as leis determinı́sticas não mais se aplicam. Entretanto,
se percebeu que é possı́vel calcular a probabilidade de ocorrência de um evento, em
função da presença ou da atuação de uma ou de várias causas. Desta forma, modelos
probabilı́sticos ou estocásticos foram construı́dos para tentar prever a ocorrência de
um efeito, dada a ocorrência de uma determinada causa ou de várias causas atuando
em conjunto. No entanto, modelos probabilı́sticos não produzem uma solução única,
mas um intervalo de soluções. A partir da observação destas probabilidades nasceu
a estatı́stica. Foi também percebido que fenômenos com múltiplas causas tendem a
seguir a distribuição normal. Desta forma, a partir do uso do arsenal probabilı́stico é
possı́vel prever a probabilidade de ocorrência de um evento a partir de suas causas ou,
até mesmo, a partir de fatores não causais correlacionados àquele efeito.
Assim, devido a esta complexidade do mundo, não é fácil atribuir causalidade entre
dois eventos. A noção de causa não implica somente predizer eventos, mas explicar
eventos. Podemos prever a partir de correlações mas para atribuir causalidade, X
precisa explicar Y. É muito difı́cil saber se e quando X causa Y. O desenvolvimento
da matemática e da estatı́stica facilitaram este processo de atribuição de causalidade.
Entretanto, a simples observação da ocorrência de associação ou correlação entre X e
Y não é capaz de determinar causalidade. Simplesmente observar que dois fenômenos
estão associados não significa que um seja causa do outro, porque várias situações

17
1. Causalidade em Epidemiologia

não causais ou espúrias podem ocorrer. A estatı́stica nasceu identificando associações


entre eventos a partir da sua matéria prima que são os dados. Entretanto, a simples
observação empı́rica (dos dados) não é suficiente para a atribuição de causalidade.
É preciso conhecer a história por trás dos dados, ou seja, é preciso entender qual o
mecanismo de geração destes dados.
A ocorrência de associações espúrias tem enganado os homens através da história e,
por isso, até hoje a ciência luta para identificar mecanismos causais. O aforismo clássico
é bem conhecido: correlação não implica causalidade. Algumas vezes os mecanismos
causais são rapidamente percebidos, de forma intuitiva. Outras vezes é possı́vel pensar
em diversos mecanismos alternativos para explicar a ocorrência de uma determinada
associação e perceber que um destes mecanismos desafia as leis da lógica ou tem muito
baixa probabilidade de ocorrência. Vários exemplos deste fenômeno são bem ilustrativos
e estão presentes em livros de Epidemiologia e de Sociologia.
Um exemplo vem da Sociologia. É bem conhecida a associação entre vendas de
sorvete e crime. Quando as vendas de sorvete aumentam, também aumenta a taxa de
criminalidade. Então se poderia concluir que o aumento das vendas de sorvete seja a
causa da criminalidade? Como este mecanismo para explicar a geração dos dados é
ilógico, facilmente se pode perceber que esta correlação não é causal, pois aumento
de venda de sorvete não pode causar crime. Como explicar, então, a ocorrência desta
associação, qual o mecanismo que está por trás da geração destes dados? Ora, o aumento
das vendas de sorvete ocorre nos meses de verão, em que há aumento da temperatura.
O aumento da temperatura também faz com que as pessoas saiam mais de casa. Em
conclusão, há uma causa comum que provocou ao mesmo tempo o aumento da venda de
sorvetes e o aumento da taxa de criminalidade, que foi o aumento da temperatura. Logo,
os dados não contam toda a história, há processos escondidos que não são revelados
pela simples observação dos dados. Para se identificar causalidade é preciso se conhecer
os mecanismos que geram este padrão de dados e descartar associações espúrias. Há
que se propor uma teoria para explicar os padrões de associação revelados a partir
dos dados e submeter esta teoria a teste. A principal dificuldade está em como fazer
isto a partir de associações que são lógicas e que podem ter uma explicação causal
ou ser espúrias. É possı́vel separar o componente espúrio das associações e identificar
causalidade?

1.2. A história da terapia hormonal como fator de risco


ou de proteção para doença coronariana
Nas décadas de 80 e 90, estudos observacionais de coorte concluı́ram que mulheres que
tomavam terapia hormonal (TH) com estrogênios para aliviar sintomas da menopausa
apresentavam menor risco de desenvolver doença coronariana, subsequentemente. A
partir destas observações a TH passou a ser recomendada para a prevenção de doença
coronariana em mulheres, quando os hormônios femininos passaram a ser um dos
fármacos mais vendidos no mundo. Entretanto, no inı́cio deste século, ensaios clı́nicos
randomizados (ECR) concluı́ram que a TH não reduzia o risco futuro de doença

18
1.2. A história da terapia hormonal como fator de risco ou de proteção para doença coronariana

coronariana mas parecia, inclusive, aumentar o risco desta doença. Vamos recontar
esta história com maiores detalhes.
Em 1991 foram publicados resultados do seguimento de 10 anos de 48470 mulheres
do Nurse’s Health Study (NHS), que tinham idade de 30 a 63 anos (média em torno
de 53 anos). Estas mulheres estavam usando ou não terapia hormonal (TH) após
a menopausa e não tinham câncer ou doença cardiovascular no inı́cio do estudo.
Comparando-se mulheres que estavam usando TH após a menopausa com outras que
nunca a usaram e ajustando-se o modelo para idade, tabagismo, história familiar
de doença cardiovascular, ı́ndice de massa corporal, uso prévio de anticoncepcionais,
hipertensão, diabetes, colesterolemia e época de nascimento (para se controlar efeito
de coorte) foi estimado um risco relativo de 0,56 (Intervalo de confiança de 95% 0,40-
0,80) (Tabela 1.1). Portanto, a TH foi associada a uma redução de 44% do risco de
doença coronariana. Os autores concluı́ram que a ausência aparente de viés de seleção
ou confundimento sugere efeito causal e que os benefı́cios da TH superam os riscos
observados (aumento de câncer de endométrio e de mama em usuárias de TH), pois
não observaram risco aumentado de acidente vascular cerebral (Stampfer et al., 1991).
Em 1992, foi publicada uma revisão sistemática com metanálise de estudos observa-
cionais. Neste estudo, a estimativa conjunta foi de um risco relativo de 0,65 (Intervalo
de confiança de 95% 0,59-0,71) (Tabela 1.1), sugerindo que a TH está associada a uma
redução de 35% do risco de doença coronariana (Grady et al., 1992).
Entretanto, em 1998, foram publicados os resultados do HERS (Heart and Estro-
gen/Progestin Replacement Trial). Nesse estudo foram incluı́das 2763 mulheres com
doença coronariana, de 44 a 79 anos, com idade média de 67 anos. Foram randomizadas
para receber uma combinação de estrogênio e progesterona ou placebo. Ao final de 4,1
anos de seguimento, analisando-se os resultados segundo a intenção de tratar, o uso
de TH não reduziu o risco de morte por doença coronariana ou de infarto não fatal
(RR=0,99, IC 95% 0,80-1,22) (Tabela 1.1). Quando os autores analisaram os dados
segundo o número de anos após a randomização, observaram um maior risco de eventos
cardiovasculares no primeiro ano de uso da TH (RR=1,52, IC 95% 1,01-2,29), risco
este que decresceu nos anos subsequentes (Tabela 1.1). Entretanto, havia diferenças
importantes na população e no tratamento utilizado, em comparação com o NHS. As
mulheres do HERS eram mais velhas, tinham doença coronariana e tomaram uma
combinação de estrogênio e progesterona, enquanto no NHS elas eram mais jovens,
mais saudáveis e a maioria recebeu apenas estrogênio (Hulley et al., 1998).
Em seguida, em 2002, foram publicados os resultados do ensaio clı́nico controlado
denominado Women’s Health Initiative (WHI). Neste ensaio foram incluı́das 16608 mu-
lheres com idade de 50 a 79 anos, com idade média de 63 anos, que foram randomizadas
para receber uma combinação de estrogênio e progesterona ou placebo. Nesse estudo, a
maioria das mulheres era saudável, pois apenas 7,7% relataram doença coronariana
prévia. O estudo, previsto para durar 8 anos e meio, foi interrompido com 5,2 anos de
seguimento pelo aumento do risco de câncer de mama, detectado em análise interina. Os
resultados da análise por intenção de tratar mostraram um risco aumentado de morte
por doença coronariana ou infarto não fatal (RR=1,29, IC 95% 1,02-1,63) (Tabela
1.1). Os autores concluı́ram que a TH não deve ser utilizada na prevenção primária de
doença coronariana (Rossouw et al., 2002).

19
1. Causalidade em Epidemiologia

O que explicaria esta diferença entre os resultados dos estudos observacionais e


experimentais. Por que a epidemiologia muitas vezes chega a resultados contraditórios
e envia mensagens para o público que muitas vezes mudam? Como pode uma terapia
considerada protetora ser agora causa da mesma doença para a qual milhares de
prescrições foram indicadas?
Taubes publicou, em 2007, no The New York Times Magazine, uma reportagem,
perguntando se nós sabemos o que nos faz saudáveis. Criticou a epidemiologia que,
um dia recomenda com confiança que as mulheres devem tomar TH para a prevenção
primária da doença coronariana e, outro dia, reverte este conselho e o que era proteção
agora se torna danoso (Taubes, 2007).
Como reconciliar estes resultados antagônicos? Será que a epidemiologia encontrou
os seus limites (Taubes, 1995)? As ferramentas usadas pela Epidemiologia não seriam
confiáveis (Taubes, 2007)? Já não seria a hora de dar a Epidemiologia por encerrada
(Davey Smith and Ebrahim, 2001)? Afinal, os estudos observacionais são dignos de
crédito (Vandenbroucke, 2009) ou devemos confiar apenas nos resultados dos ensaios
clı́nicos, menos sujeitos a viés?
Uma das primeiras considerações diz respeito aos estudos observacionais. São as
únicas ferramentas que podemos usar quando as intervenções são danosas, mas eles são
muito vulneráveis a viés. O viés de seleção (health-user bias, viés do usuário saudável)
seria uma possibilidade para explicar este resultado contraditório dos estudos em relação
à TH (Grodstein et al., 2003). Mulheres mais saudáveis e conscientes de sua saúde, que
têm menor risco de doença cardiovascular, têm menor ı́ndice de massa corporal, são
mais educadas e ricas, fazem mais atividade fı́sica e também tendem a fazer maior uso
de TH (Taubes, 2007). Ou seja, as mulheres que usam TH não são comparáveis às que
não a usam, pois as usuárias de TH são mais saudáveis que as não usuárias e, assim,
o menor risco de doença coronariana nas usuárias de TH não seria causado pela TH
em si, mas sim pelo fato destas mulheres serem mais saudáveis. Assim, esta correlação
espúria dá uma impressão de relação causa-efeito. Sabemos que correlação não é causa.
Há, claramente, problemas na interpretação dos resultados dos estudos epidemiológicos
(Taubes, 2007).
Por outro lado, os estudos experimentais são muito caros e levam anos para produzir
resultados. Além disso, os ensaios clı́nicos tendem a recrutar pessoas mais saudáveis,
motivadas e com propensão a comparecer regularmente para as avaliações (Taubes,
2007). Assim, muitas vezes, os resultados dos ensaios têm menor generalização externa.
Entretanto, quando os pesquisadores começaram a reanalisar os dados levando em
conta o tempo decorrido desde o inı́cio da TH, percebeu-se que os estudos observacionais
e experimentais passaram a concordar entre si. Nos ensaios clı́nicos randomizados esta
análise pelo tempo já é feita naturalmente. Os resultados dos ensaios clı́nicos mostraram
que há um aumento do risco de doença coronariana nos primeiros anos após o inı́cio
da TH, risco este que diminui e desaparece com o tempo de uso. Nas análises iniciais
dos estudos observacionais o que se fez foi um contraste entre quem estava tomando
TH com quem nunca recebeu TH. Assim, como muitas usuárias já estavam usando TH
há alguns anos, já tinham passado da fase de maior risco cardiovascular, porisso foi
detectada apenas proteção nestes estudos (Vandenbroucke, 2009). A tarefa agora seria
reanalisar os dados segundo tempo de uso. Hernán et al. (2008) reanalisaram os dados

20
1.2. A história da terapia hormonal como fator de risco ou de proteção para doença coronariana

do NHS imitando um ensaio clı́nico. Ao invés de compararem quem estava tomando TH


com quem nunca recebeu TH, compararam quem iniciou uma combinação de estrógenos
e progestina com quem não iniciou a TH em cada intervalo de tempo do estudo. Além
disso, só incluı́ram mulheres que não tinham realizado histerectomia, que não tinham
tomado hormônio nos dois últimos anos, e aquelas que não tinham tido diagnóstico
prévio de doença coronariana ou câncer. Quando esta reanálise foi feita, foi também
demonstrado, a partir dos dados dos estudos observacionais, que há um aumento do
risco de doença coronariana nos primeiros anos de uso (RR=1,42, IC 95% 0,92-2,20),
risco este que desapareceu à medida em que o tempo passou. Observaram também que
o risco só parece aumentar para as mulheres que começaram a tomar hormônio com 10
ou mais anos após a menopausa (RR=1,20 IC 95% 0,78-1,84) (Tabela 1.1) (Hernán
et al., 2008). Entretanto, todas estas diferenças também podem ser explicadas pela
variabilidade amostral, visto que a unidade está incluı́da em todos os intervalos de
confiança. Nesta reanálise, pequena parte da discrepância foi também atribuı́da ao viés
da usuária sadia (Prentice et al., 2005; Hernán et al., 2008), mas a maior parte da não
concordância se deveu ao efeito diferencial da TH de acordo com o tempo após o seu
inı́cio (Vandenbroucke, 2009).

Assim, a pergunta dos ensaios clı́nicos era diferente dos estudos observacionais.
Enquanto os estudos experimentais indagaram qual o risco de doença coronariana para
mulheres que iniciam o uso de TH anos após a menopausa, os estudos observacionais
perguntaram se a TH é capaz de prevenir doença coronariana quando iniciada logo após
a menopausa (Taubes, 2007). Este aumento do risco de doença coronariana nos anos
iniciais da TH pode ser explicado pelo maior risco de trombose/isquemia associado
à TH. À medida em que o uso progride, este risco começa a ser contrabalanceado
pela redução dos lipı́dios séricos causado pela TH, quando então esta passa a ter um
papel protetor contra a doença coronariana (Hulley et al., 1998). Entretanto, uma
possibilidade explicativa plausı́vel para este possı́vel efeito protetor da TH a longo
prazo seria viés de sobrevivência, por meio do óbito de suscetı́veis no grupo que recebeu
a TH (Vandenbroucke, 2009).

Em suma, qual a lição que nos fica deste evento da história da epidemiologia? Que
resultados consistentes de vários estudos observacionais podem ser devidos a viés. A
busca da causalidade é difı́cil, mas ela não é impossı́vel tendo como base os estudos
observacionais. Obviamente a atribuição de causalidade é mais fácil por meio de ensaios
clı́nicos, pois a randomização tende a equilibrar os grupos experimental e controle em
relação a confundidores conhecidos e desconhecidos. Por outro lado, nem sempre a
ausência de randomização é a única razão explicativa da discordância entre estudos
experimentais e observacionais. Outra lição é que os desenhos observacionais e experi-
mentais se complementam e que é interessante analisar os estudos observacionais, como
se eles fossem estudos experimentais. Neste livro vamos abordar métodos analı́ticos, nos
quais vamos analisar estudos observacionais como se eles fossem estudos experimentais
fracassados (Imbens and Rubin, 2015).

21
1. Causalidade em Epidemiologia

1.2.1. Qual a evidência atual?


Em 2015, foi publicada revisão sistemática da Cochrane resumindo a evidência disponı́vel
até o momento em relação a esta pergunta. Há evidência moderada de que a terapia
hormonal seja um fator de proteção para doença coronariana quando iniciada com
menos de 10 anos após a menopausa e uma evidência forte de que não seja fator de
proteção nem de risco quando iniciada com 10 ou mais anos após a menopausa (Tabela
1.1) (Boardman et al., 2015).

Tabela 1.1.: Terapia Hormonal e Doença Coronariana


Ano Estudo/Tempo de uso Intervalo de
Confiança de 95%
Estudos observacionais
1991 NHS - Nurse’s Health Studya 0,56 (0,40-0,80)
2008 Reanálise NHS como ensaio clı́nicob
Total 0,98 (0,66-1,49)
<2 anos 1,61 (0,97-2,66)
<10 anos 0,54 (0,19-1,51)
≥10 anos 1,20 (0,78-1,84)
1992 Revisão sistemática de estudos
Observacionaisc 0,65 (0,59-0,71)
Ensaios clı́nicos
1998 Heart and Estrogen/Progestind
Replacement Study - HERS 0,99 (0,80-1,22)
HERS - Primeiro Ano 1,52 (1,01-2,29)
2002 Women’s Health Initiative - WHI
Totale 1,29 (1,02-1,63)
<2 anosf 1,68 (1,15-2,45)
2 a 5 anosf 1,25 (0,87-1,79)
≥5 anosf 0,66 (0,36-1,21)
2015 Revisão Sistemática da Cochraneg
Total 1,00 (0,78-1,29)
<10 anos 0,52 (0,29-0,96)
≥10 anos 1,07 (0,96-1,20)
Fonte:
a
Stampfer et al. (1991).
b
Hernán et al. (2008).
c
Grady et al. (1992).
d
Hulley et al. (1998).
e
Rossouw et al. (2002).
f
Prentice et al. (2005).
g
Boardman et al. (2015).

22
Parte I.

O Modelo de Respostas
Potenciais: abordagem
contrafatual

23
2. O Modelo de Respostas Potenciais
2.1. Respostas Potenciais e Efeito Causal Individual
O modelo de respostas potenciais, também denominado modelo de respostas contra-
fatuais, foi desenvolvido por Rubin (1974), a partir dos trabalhos de Neyman (1923)
e está sistematizado em livro recentemente publicado (Imbens and Rubin, 2015). O
nome resposta potencial vem do fato de que, para se estudar causalidade sem viés, o
mesmo indivı́duo deveria ser submetido a diferentes situações ou tratamentos, às quais
teriam como consequência, várias respostas potenciais. Vejamos o caso mais simples,
no qual tanto o tratamento como o desfecho são dicotômicos. Assumindo-se tratamento
dicotômico (t) e desfecho (D) também dicotômico, teremos duas respostas potenciais
associadas a cada situação de tratamento1 . Representaremos t=12 se o indivı́duo tiver
sido tratado e t=0, se a pessoa não tiver recebido o tratamento). Usaremos D=13
para representar a ocorrência do desfecho e D=0 para significar que o desfecho não
aconteceu.
Teremos então uma situação na qual o indivı́duo foi submetido ao tratamento (Dt=1 ,
leia-se D sob o tratamento, ou seja, o valor do desfecho que teria sido observado na
situação de tratamento) e outra na qual o indivı́duo não recebeu o tratamento (Dt=0 ,
leia-se D sob o não tratamento, ou seja, o valor que o desfecho teria assumido na
situação controle). Em cada uma destas situação, o desfecho pode ocorrer (Dt=1 = 1,
Dt=0 = 1) ou não (Dt=1 = 0, Dt=0 = 0). O efeito causal é, então, calculado a partir da
comparação entre estas duas respostas potenciais, ou seja, (Dt=1 − Dt=0 , se usarmos a
diferença entre as respostas potenciais). Se Dt=1 = Dt=0 , então não há efeito causal.
Se Dt=1 6= Dt=0 , então há efeito causal. Vejamos com mais detalhe estas situações na
tabela 2.1 abaixo:

Tabela 2.1.: Modelo de Respostas Potenciais


Grupo D1 D0
Tratamento (t=1) Observável como D Não observável - contrafatual
Controle (t=0) Não observável - Contrafatual Observável como D

Assim, na situação em que o indivı́duo foi submetido ao tratamento (Dt=1 ) o desfecho


pode ter ocorrido (Dt=1 = 1) ou não (Dt=1 = 0) e, neste caso, a resposta potencial é
1 utilizaremos a letra t para representar tratamento e D para representar Desfecho
2 letras minúsculas serão usadas para representar valores assumidos por variáveis aleatórias, ou seja,
realizações destas variáveis
3 letras maiúsculas serão utilizadas para representar variáveis aleatórias

25
2. O Modelo de Respostas Potenciais

fatual, ou seja, pode ser observada como D (D1 ) 4 . Não sabemos o que teria acontecido
com o indivı́duo que na realidade foi submetido ao tratamento (Dt=1 ) caso ele tivesse
sido colocado no grupo controle D0 5 . Esta situação, não observável, é contrafatual, ou
seja, é contra situações de fato ocorridas, contra o fato. Representa a resposta potencial
que poderia ter acontecido, caso o indivı́duo alocado no grupo de tratamento tivesse
sido colocado no grupo controle. Da mesma forma, na situação em que o participante
não recebeu o tratamento (Dt=0 ) o desfecho pode ter ocorrido (Dt=0 = 1) ou não
(Dt=0 = 0) e, neste caso, a resposta potencial é fatual, ou seja, pode ser observada como
D (D0 ). Não sabemos o que teria ocorrido com o indivı́duo alocado no grupo controle
(Dt=0 ) caso ele tivesse sido tratado D1 . Esta possibilidade também é contrafatual e
não pode ser observada (tabela 2.1). Assim, o problema fundamental da inferência
causal, segundo Holland é que uma das respostas potenciais nunca pode ser observada,
permanecendo ignorada, e, desta forma, nunca se pode calcular o efeito causal individual
(Holland, 1986).
Assim para se calcular o efeito causal sem viés, terı́amos que inicialmente submeter
o indı́viduo ao tratamento, observar a resposta potencial na situação em que a pessoa
foi tratada (Dt=1 ). Esta resposta potencial poderia ter sido 0, se o desfecho não tivesse
ocorrido, ou 1, se o desfecho tivesse ocorrido. Em seguida, terı́amos que voltar no
tempo, ou observar esta mesma pessoa em um universo paralelo na situação em que ela
não tenha sido submetida ao tratamento (Dt=0 ). A resposta potencial nesta situação
poderia ter sido 0 ou 1. A partir da comparação entre estas duas respostas potenciais,
poderı́amos calcular, então, o efeito causal individual.
Como é impossı́vel se voltar no tempo e, até hoje a ciência não descobriu universo
paralelo, o que fazemos na realidade, quando vamos estudar uma determinada relação
causal, é comparar grupos. Comparamos um grupo submetido ao tratamento com outro
grupo não submetido ao tratamento e comparamos as respostas fatuais médias em
cada grupo. Se os grupos forem iguais entre si, conseguiremos calcular o efeito causal
sem viés. Como não observamos as respostas contrafatuais, elas não são consideradas
quando se realiza a estimativa do efeito causal.
Vejamos, agora, um exemplo prático. A nossa hipótese de estudo é se fumar causa
câncer de pulmão. Tomemos João, nosso bonequinho branco (figura 2.1), nosso partici-
pante número 16 . João é fumante. Em nosso estudo de coorte fictı́cio acompanharemos
João por muitos anos, para observar se ele desenvolverá ou não câncer de pulmão.
Assim, João é um indivı́duo exposto ao tabagismo. Se estivéssemos realizando um ensaio
clı́nico João seria um indivı́duo escolhido para o grupo de tratamento7 . Desta forma,
como João foi exposto ou tratado, e a exposição é dicotômica, precisaremos calcular
Dt=1 , ou seja, qual o valor que o desfecho dicotômico teria, se D=1 (se João desenvolver
câncer de pulmão) ou se D=0 (se João não tiver câncer de pulmão), na situação em que
João foi tratado. O tempo se passou e João, infelizmente, após 40 anos de tabagismo,
desenvolveu câncer de pulmão. Portanto, nosso desfecho Dt=1 = 1. Infelizmente, não
4 D1 é uma versão encurtada de Dt=1
5 D0 é uma versão encurtada de Dt=0
6 o subescrito 1 é usado para identificar o participante
7 consideraremos exposição e tratamento como intercambiáveis e representaremos a exposição também

pela letra t

26
2.1. Respostas Potenciais e Efeito Causal Individual

temos como saber o que teria acontecido com João na situação contrafatual na qual ele
não tivesse sido fumante (Dt=0 ).

Figura 2.1.: Efeito causal individual - Paciente 1 - João

A primeira situação representa a resposta fatual

Agora, vamos supor que foi recentemente inventada uma máquina em que se pode
viajar no tempo. Convidamos João para pegar uma carona no túnel do tempo e ter uma
chance de viver uma nova vida. João desembarcou há exatamente 40 anos atrás, um
pouco antes do instante em que iniciou o hábito de fumar. Nesta nova vida, João não
será fumante e poderemos, então, calcular, o desfecho contrafatual Dt=0 e compará-lo
com o desfecho fatual. Após 40 anos de seguimento, João não desenvolveu câncer de
pulmão nesta sua nova vida, portanto Dt=0 = 0. Para o nosso estudo hipotético, João
contribuirá com uma linha, e será nosso participante número 1. Assim, começamos
a preencher a tabela do nosso estudo (tabela 2.2). João desenvolveu câncer quando
exposto (tratado, Dt=1 = 1 ou D1 = 1) e não desenvolveu câncer quando não exposto
(não tratado, Dt=0 = 0 ou D0 = 0). Como João foi exposto nesta vida, sua situação
fatual está listada na segunda coluna da tabela, sob D1 . Perceba que, no nosso exemplo
imaginário, não haveria situação contrafatual pois, se existisse máquina do tempo, as
duas vidas de João teriam sido, na realidade, fatuais, já que ele teria tido a oportunidade
de viver ambas as vidas.
Nosso estudo hipotético teve também três outros participantes: Raimundo, Maria
e Rosa. Raimundo na vida fatual não era fumante mas, mesmo assim, desenvolveu
câncer de pulmão. Convidamos Raimundo a viajar no túnel do tempo. Nesta nova vida
contrafatual em que Raimundo fumou, ao final de 40 anos ele não teve câncer de pulmão
(figura 2.3(a)). Como Raimundo não era fumante nesta vida, sua situação fatual está
listada na terceira coluna da tabela, sob D0 . Raimundo é o segundo participante do
nosso estudo e seus dados estão compilados na tabela 2.2.
Maria era fumante na vida real, fatual e nesta vida ela teve câncer de pulmão.
Entretanto, após viajar no tempo e viver a outra vida contrafatual, Maria, que não
fumou nesta sua outra vida, mesmo assim, também desenvolveu câncer de pulmão (figura

27
2. O Modelo de Respostas Potenciais

Tabela 2.2.: Estudo hipotético - tabagismo e câncer de pulmão

Número Participante D1 D0
1 João 1 0
2 Raimundo 0 1
3 Maria 1 1
4 Rosa 0 0

Os desfechos das situações fatuais estão destacados em negrito

2.3(b)). Ou seja, tanto quando fumou, quanto quando não fumou, Maria desenvolveu
câncer. Ou seja, tanto na vida fatual quanto na vida contrafatual Maria estava como
que ”predestinada”a ter câncer de pulmão. Os dados desta nossa terceira participante
estão mostrados na tabela 2.2.

Rosa é a nossa quarta participante. Na vida real Rosa não era fumante e não
desenvolveu câncer de pulmão. Entretanto, após viajar no tempo e viver sua outra vida
contrafatual, na qual fumou, também não desenvolveu câncer de pulmão. Parece que
Rosa é imune ao câncer de pulmão. Tanto na vida real, em que ela fumou, como na
vida contrafatual hipotética, em que ela não fumou, ela não teve câncer de pulmão
(figura 2.3(c). Os dados desta nossa quarta participante estão compilados na tabela 2.2.

Retornemos, agora à tabela 2.2. Nesta tabela vemos que para João, ocorreu efeito
causal, ou seja, o hábito de fumar foi a causa do seu câncer de pulmão. Tanto para
Maria como para Rosa, o tabagismo não influenciou no câncer de pulmão, pois, tanto
na situação de exposição quanto de não exposição Maria desenvolveu câncer e Rosa
não desenvolveu câncer. Já para Raimundo o hábito de fumar foi um fator de proteção,
pois quando ele fumou não teve câncer, mas quando não fumou desenvolveu câncer.
A grande vantagem de se comparar as duas respostas potenciais no mesmo indivı́duo
é que, como se trata da mesma pessoa, vivendo duas vidas idênticas, todo o resto é
igual: a única mudança que ocorreu na vida das pessoas foi a exposição. Desta forma,
se pudéssemos observar as duas respostas potenciais no mesmo indivı́duo, poderı́amos
calcular, sem viés, o efeito causal individual. Daı́ terı́amos a certeza se a exposição de
fato teria causado a doença.

Como não podemos calcular o efeito causal individual na prática o que teremos que
fazer é comparar apenas as respostas fatuais entre os grupos tratado e não tratado.
Ou seja, calcular o efeito causal médio. Na nossa tabela o que farı́amos seria comparar
as respostas fatuais de João e Raimundo na situação de tratamento, com as respostas
fatuais de Maria e Rosa na situação de não tratamento, ou controle (as respostas
marcadas em negrito na tabela). Se João e Raimundo forem semelhantes a Maria e Rosa
em todas as demais variáveis que poderiam interferir nesta associação, desvendarı́amos,
sem viés, o efeito causal do tratamento no desfecho.

28
2.2. Cálculo do Efeito Causal Médio

Figura 2.2.: Efeito causal individual

(a) 2 - Raimundo (b) 3 - Maria

(c) 4 - Rosa
A primeira situação representa a resposta fatual

2.2. Cálculo do Efeito Causal Médio


Para se calcular o efeito causal médio na população, sem viés, terı́amos que conhecer as
duas respostas potenciais ou, então, assumir que os grupos tratamento e controle são
iguais em relação a todas as demais variáveis que potencialmente poderiam interferir no
nosso resultado. Como na vida real só obtemos uma das respostas potenciais, a fatual e
a outra resposta potencial, a contrafatual é ignorada, não temos condições de calcular
o efeito causal médio na população, sem viés, de uma forma livre de pressupostos. Para
calcular o efeito causal médio a partir da comparação de grupos, vários pressupostos são
necessários. Veremos isto mais adiante neste capı́tulo. Agora vamos realizar um novo
estudo utilizando nossa máquina do tempo e comparar o efeito causal médio na amostra
de estudo, comparando as duas respostas potenciais fatual e contrafatual no mesmo
indivı́duo. Realizaremos o cálculo de uma medida de efeito marginal ou incondicional.
Denomina-se marginal pois todos os indivı́duos são incluı́dos no seu cálculo, pois foram
observados nas duas situações, fatual e contrafatual. A denominação marginal vem
da margem da tabela, ou seja, o total da tabela, que inclui todos os participantes. O
sinônimo incondicional indica que não se estabeleceu nenhuma condição para a inclusão
no cálculo, o que significa que todos serão utilizados no cálculo da medida. A fórmula
para o seu cálculo, assumindo-se qualquer tipo de resposta, contı́nua, dicotômica ou

29
2. O Modelo de Respostas Potenciais

outra, está disposta na equação 2.1. Nesta fórmula temos o contador i, que indica a
quantidade de participantes do estudo. Na primeira parte da equação o efeito causal
médio está escrito em termos de média das diferenças dos efeitos causais individuais
(E[Dit=1 − Dit=0 ])8 . Na segunda parte da equação este mesmo efeito está explicitado
como diferença entre as médias dos efeitos causais individuais (E[Dit=1 ] − E[Dit=0 ]).
Como a média das diferenças é igual à diferença entre as médias, os dois cálculos podem
ser realizados de forma intercambiante, como veremos mais abaixo.

Efeito Causal Médio na População

E[Dit=1 − Dit=0 ] = E[Dit=1 ] − E[Dit=0 ] (2.1)

Efeito Causal Médio na População (resposta dicotômica)


Diferença de Risco Causal (DRC)

P r[Dit=1 = 1] − P r[Dit=0 = 1] (2.2)


Como, no nosso exemplo, usaremos tratamento e desfecho de forma dicotômica, a
fórmula 2.1 pode ser reescrita em termos de probabilidades. A fórmula para se calcular
o efeito causal médio na população no caso de uma resposta dicotômica consta na
equação 2.2.
Vamos, agora, calcular o efeito causal médio em outra situação hipotética, realizado
com 60 participantes. Inicialmente o tratamento foi administrado a 40 participantes e
não o foi aos 20 restantes. Após a finalização do tempo de seguimento, cada sujeito
desenvolveu ou não o desfecho, e isto foi anotado em nossa planilha. Em seguida,
convidamos os 60 participantes a viajar na nossa máquina do tempo. Nesta segunda
situação invertemos a administração do tratamento. Assim, os 20 que não tinham
sido tratados foram tratados na sua vida contrafatual, enquanto os 40 que tinham
sido tratados participaram agora do grupo controle na sua outra vida. Os dados do
nosso estudo hipotético se encontram registrados no arquivo tabaco.dta, reproduzido
abaixo em formato tabular condensado 2.3. Note que as respostas fatuais, reais estão
destacadas em negrito. Perceba que tivemos 20 pessoas que nesta vida foram expostas
e desenvolveram a doença, mas que na outra vida não foram expostos e não tiveram
a doença (D1 = 1 e D0 = 0). Por outro lado, 5 sujeitos expostos nesta vida e não
expostos na outra desenvolveram a doença em ambas as situações potenciais (D1 = 1
e D0 = 1). Além disso, outras 20 pessoas na vida fatual foram expostas mas não
adoeceram, enquanto na vida contrafatual não foram expostas mas adoeceram (D1 = 0
e D0 = 1). E, para completar, 15 participantes não adoeceram em ambas as situações
fatual e contrafatual (D1 = 0 e D0 = 0).
Para calcular o efeito causal médio, é necessário primeiro calcular a probabilidade de
ocorrência do desfecho na situação de exposição P r[Dt=1 1 = 1] e a probabilidade de
ocorrência do desfecho na situação de não exposição P r[Dt=0 = 1]. Depois, para se
obter a diferença de risco causal basta diminuir uma probabilidade da outra. E, para
8 Na fórmula, E significa o valor médio esperado de uma experiência, se ela for repetida inúmeras
vezes, ou Esperança. Se todos os eventos tiverem a mesma probabilidade de ocorrência, o valor
esperado é a média aritmética

30
2.2. Cálculo do Efeito Causal Médio

Tabela 2.3.: Exemplo hipotético - tratamento e desfecho dicotômicos

D1 D0 n
1 0 20
1 1 5
0 1 20
0 0 15
Total 60

Os desfechos das situações fatuais estão destacados em negrito

se calcular a razão de risco causal, teremos de dividir uma probabilidade pela outra.
Assim:

Probabilidade do desfecho se exposto = P r[Dt=1 = 1] = 25/60 = 0,417


Probabilidade do desfecho se não exposto = P r[Dt=0 = 1] = 25/60=0,417

Cálculo do efeito causal médio:

Diferença de risco causal = 0,417 - 0,417 = 0


Concluı́mos que o tratamento não teve efeito causal no desfecho. Para efeitos práticos
e para simplificar o entendimento, estamos ignorando o erro aleatório. Numa situação
real, terı́amos também que calcular os intervalos de confiança em torno desta estimativa.
Poderı́amos também ter calculado o efeito causal não como diferença de risco, mas
como razão de risco, usando a equação 2.3. Neste caso, o resultado seria 0,417/0,417 =
1, ou seja, a exposição não teria aumentado a probabilidade de ocorrência do desfecho.

Efeito Causal Médio na População (resposta dicotômica)


Razão de Risco Causal (RRC)

P r[Dit=1 = 1]/P r[Dit=0 = 1] (2.3)

2.2.1. Cálculo no Stata


Os cálculos do efeito causal médio foram também realizados no Stata e estão reprodu-
zidos abaixo. Note que primeiro calculamos as diferenças entre as respostas potenciais
individuais e depois realizamos o cálculo das médias destas diferenças. O resultado foi
0. Em seguida, fizemos o cálculo da outra forma, calculando as médias nas situações de
tratamento (0,417) e controle (0,417). Finalmente, obtivemos a diferença entre estas
médias (0), chegando ao mesmo resultado.

. use tabaco
. expand n
(46 observations created)

31
2. O Modelo de Respostas Potenciais

.
. * Cálculo das diferenças entre as respostas potenciais individuais
. gen d=d1-d0
. * Cálculo do Efeito Causal Médio (média das diferenças)
. sum d
Variable Obs Mean Std. Dev. Min Max

d 60 0 .823387 -1 1
.
. * Cálculo da média das respostas potenciais individuais
. sum d1
Variable Obs Mean Std. Dev. Min Max

d1 60 .4166667 .4971671 0 1
. gen md1=r(mean)
. sum d0
Variable Obs Mean Std. Dev. Min Max

d0 60 .4166667 .4971671 0 1
. gen md0=r(mean)
.
. * Cálculo da diferença entre as médias das respostas potenciais
. gen m=md1-md0
. sum m
Variable Obs Mean Std. Dev. Min Max

m 60 0 0 0 0
.
. * Cálculo da razão entre as médias das respostas potenciais
. gen r=md1/md0
. sum r
Variable Obs Mean Std. Dev. Min Max

r 60 1 0 1 1

2.3. Cálculo do efeito causal médio com a resposta


fatual
Como não existe máquina do tempo, vamos voltar à realidade. Como calcular o efeito
causal médio, se não observamos as respostas contrafatuais? Como vimos anteriormente,
a única solução possı́vel é comparar grupos, calcular a diferença entre as respostas
fatuais nos dois grupos e usar esta medida como uma estimativa do efeito causal.
Entretanto, ao comparar grupos, estaremos calculando uma medida de associação e
não mais uma medida de causa. Aprendemos muito bem que correlação não é causa.
Como podemos usar uma medida de correlação para medir causa? Os dados comunicam
apenas associações e se quisermos inferir causa a partir dos dados necessitaremos de
vários pressupostos. Deixemos de lado estes pressupostos por um momento e vamos
utilizar os nossos dados para calcular a medida de associação, ignorando a resposta

32
2.3. Cálculo do efeito causal médio com a resposta fatual

contrafatual, já que não podemos mesmo viajar no tempo e calcular a medida de
efeito causal. Para comparar grupos, em caso de tratamento e desfecho dicotômicos,
usaremos as fórmulas das equações 2.4, para calcular a diferença de risco associacional
(DRA), e 2.5, para obter a razão de risco associacional (RRA). Nestas fórmulas usamos
a proporção de sujeitos que desenvolvem o desfecho entre aqueles que receberam o
tratamento, ou seja, a proporção da doença entre os tratados e diminuı́mos, para obter
o DRA, ou dividimos, para calcular o RRA, esta quantidade pela proporção da doença
entre os não tratados.

Medida de Associação
Diferença de Risco Associacional (DRA)

P r[Di = 1|Ti = 1] − P r[Di = 1|Ti = 0] (2.4)

Medida de Associação
Razão de Risco Associacional (RRA)

P r[Di = 1|Ti = 1]/P r[Di = 1|Ti = 0] (2.5)


Observe que agora, estaremos comparando não mais as mesmas pessoas em dois
momentos do tempo, mas sim pessoas diferentes em dois grupos. Ou seja, não estare-
mos mais estimando um efeito marginal, mas um efeito condicional. Estamos, agora,
estabelecendo uma condição para a pessoa participar do cálculo, que é pertencer a um
determinado grupo, ou ter sido exposto ou não exposto. Porisso, quando calculamos
uma medida em um grupo, estamos condicionando para a variável de pertencimento no
grupo. Na figura 2.3 ilustramos esta situação. Estamos comparando o desfecho ocorrido
com João na situação de tratamento (t=1), pois João na realidade é fumante com o
desfecho ocorrido com Raimundo na situação de não tratamento (t=0), pois Raimundo
não é fumante (Figura 2.3). Esqueçamos nossa viagem hipotética no tempo e utilizemos
apenas os dados reais.

Figura 2.3.:

33
2. O Modelo de Respostas Potenciais

Abaixo, na tabela 2.4 mostramos os dados fatuais do nosso estudo. Para isto, tivemos
que rearrumar a tabela 2.2, pois agora não temos mais as respostas contrafatuais
para contrastá-las com as respostas fatuais. Temos apenas a resposta fatual D1 para
os tratados e a resposta fatual D0 para os não tratados. As respostas contrafatuais,
representadas na tabela com a interrogação (?) não são estimáveis. Deste processo
resultou a tabela 2.4 em formato condensado. A partir da tabela 2.4 construı́mos a
tabela 2.5, colocando a exposição nas linhas e o desfecho nas colunas, no formato
padrão com a qual nós epidemiologistas estamos mais acostumados. A partir da tabela
calculamos a medida de associação condicional (RRA, razão de risco associacional).
Usando apenas os dados fatuais, obtivemos o valor 2, o que significa que na presença
da exposição, o risco de desenvolver o desfecho é duplicado. Ou seja, há associação e
a exposição é um fator de risco para a doença. Note que o resultado da RRA (1) é
diferente da RRC (0). Portanto, por causa da nossa máquina do tempo, neste caso
temos certeza de que a RRA é uma medida viciada da RRC. Viés é, portanto, a
diferença entre a medida de associação e a medida de efeito causal.
Continuamos assumindo que não há erro aleatório. Se levarmos em conta o erro
aleatório, o Intervalo de Confiança é de 0,88 - 4,54, e aı́ a nossa conclusão seria que a
diferença entre a RRC e a RRA está dentro da margem de erro e poderı́amos considerar
as duas como iguais. Entretanto, para fins didáticos estamos usando amostras pequenas
e assumindo que não existe erro aleatório. Se a amostra fosse grande esta diferença
seria estatisticamente significante.

Tabela 2.4.: Exemplo hipotético - respostas fatuais

T D D1 D0 n
1 1 1 ? 20
1 0 0 ? 20
0 1 ? 1 5
0 0 ? 0 15
Total 60

2.4. Quadrado Latino: contrafatuais no mundo real


Há uma possibilidade de estudo real, no qual podemos estimar as quantidades fatuais e
contrafatuais neste mundo, mesmo sem a existência da máquina do tempo. Trata-se do
quadrado latino ou desenho cruzado (cross-over). Neste desenho, a exposição precisa ter
efeito efêmero e não deixar cicatriz e o desfecho também necessita ser reversı́vel. Nesta
situação podemos expor primeiro o indivı́duo a uma situação (tratamento ou placebo)
no tempo 1, registrar o desfecho, deixar passar um tempo sem tratamento, para que o
efeito da exposição desapareça (chamado perı́odo de lavagem ou livre de tratamento,
wash-out) e, em seguida, expor o mesmo sujeito à outra situação (placebo ou tratamento)
no tempo 2 e anotar o desfecho (figura 2.4). Desta forma podemos, mesmo neste mundo,

34
2.5. Causa e Associação

Tabela 2.5.: Cálculo da Razão de Risco Associacional


D=1 D=0 Total
n % n
T=1 20 50,0 20 40
T=0 5 25,0 15 20
Total 25 41,7 35 60
RRAT D = 20/40 / 5/20 = 2

RRA=Razão de Risco Associacional

comparar as duas respostas potenciais no mesmo indivı́duo, quando exposto a diferentes


situações de exposição. Neste caso, não haveria situação contrafatual, já que ambas as
respostas potenciais seriam fatuais, sendo que uma ocorre primeiro no tempo do que a
outra. Neste desenho, como foi percebido que a ordem de administração das situações
interfere no desfecho, é necessário aleatorizar a ordem da exposição. Este é o único
desenho que nos permite obter os efeitos causais individuais, sem viés, assumindo-se
que todas as demais condições, exceto a intervenção, permaneçam imutáveis no tempo.
Na figura 2.5 ilustramos o desenho cruzado, com o nosso personagem João para verificar
se a aspirina tem efeito na cefaléia. Inicialmente sorteamos a ordem de tratamento
para o nosso paciente 1, João. Sorteamos para realizar o tratamento no tempo 1 e
administrar o placebo no tempo 2. Assim, no tempo 1, quando João estiver com dor
de cabeça, representada na figura pela cabeça vermelha, administramos aspirina para
João (P r[D1t=1 ])9 . Sem seguida, observamos se a cefaléia cessa (P r[D1t=1 = 1], se a
cabeça de João ficar branca) ou persiste (P r[D1t=1 = 0], se a cabeça de João continuar
vermelha). Esperamos passar um certo perı́odo livre de tratamento. E, quando João
apresentar novamente dor de cabeça (tempo 2), prescrevemos placebo (P r[D1t=0 ]) e
vemos se a cefaléia persiste (P r[D1t=0 = 0]) ou desaparece (P r[D1t=0 = 1]). Observe
que neste desenho também é imprescindı́vel a administração de placebo para controlar
o efeito placebo10 .

2.5. Causa e Associação


Considerando tratamento e desfecho dicotômicos, para se avaliar causa, o ideal é que
cada indivı́duo seja exposto aos dois tratamentos e possamos, então, comparar as duas
respostas potenciais no mesmo indivı́duo. Nesta caso podemos calcular a RRC (Razão
de Risco Causal). Causa é o risco de desenvolver o desfecho quando se observa as
duas respostas potenciais em toda a população. Ou seja, para se estimar causa, temos
que estimar uma probabilidade não condicional ou marginal. Como vimos, o termo
9o subscrito 1 é para identificar o participante João
10 quando o paciente tem conhecimento se está recebendo o tratamento ou não, é descrito que ele
se sente melhor quando recebe o tratamento, quando acredita que o tratamento é eficaz. Este
fenômeno é denominado efeito placebo

35
2. O Modelo de Respostas Potenciais

Figura 2.4.: Desenho cruzado

Placebo Tratamento

Tempo 1 Tempo 2

Tratamento Sem Tratamento Placebo

Figura 2.5.: Desenho cruzado

marginal se refere ao total da margem da tabela. Para isto, usamos a fórmula 2.6,
que serve tanto para resposta dicotômica, como não dicotômica. No caso de resposta
dicotômica a fórmula a ser utilizada é a 2.3. Comparando-se as respostas potenciais
em cada indivı́duo (tabela 2.6), podemos inferir se o tratamento não teve efeito causal,
quando E[Dit=1 ] = E[Dit=0 ], quando T for independente de D (T ⊥ D), ou se teve efeito
causal, quando E[Dit=1 ] 6= E[Dit=0 ], quando T for dependente de D (T 6⊥ D). Desta
forma, na primeira linha, que contém os dados do participante 1, como E[D1t=1 = 1]
e E[D1t=0 = 0], o tratamento teve efeito causal no desfecho, representando risco pois,
quando o tratamento foi administrado, o efeito ocorreu e no grupo controle o desfecho
não foi observado. No segundo caso, as respostas foram iguais, sendo ambas iguais a 1,
não ocorrendo efeito causal. No terceiro participante, como E[D3t=1 = 0] e E[D3t=0 = 1],
o tratamento também teve efeito causal, mas de proteção, pois quando o tratamento
foi administrado o efeito não foi observado, mas quando ele foi executado, o sujeito
manifestou o desfecho. No quarto participante, também não houve efeito causal, pois
nas duas situações o desfecho não ocorreu (0).

36
2.5. Causa e Associação

Medida de Efeito Causal


Razão de Risco Causal (RRC)

E[Dit=1 ]/E[Dit=0 ] (2.6)

Tabela 2.6.: Situações Ideal (Causa) e Possı́vel (Associação)

Ideal - Causa
Probabilidade Marginal
i Dt=1 Dt=0 Conclusão
1 1 0 Efeito causal - risco
2 1 1 Não há efeito causal
3 0 1 Efeito causal - proteção
4 0 0 Não há efeito causal
RRC = E[Dit=1 ]/E[Dit=0 ]

Possı́vel - Associação
Probabilidade Condicional
T D
1 0
1 1
0 1
0 0
RRA = E[Di = 1|Ti = 1]/E[Di = 1|Ti = 0]

Entretanto, com exceção do desenho quadrado latino, na vida real é impossı́vel a


observação da resposta potencial contrafatual. Assim, o possı́vel é ter cada indivı́duo
exposto a apenas um tratamento e assim, observar apenas uma resposta potencial, o
desfecho fatual (tabela 2.6). Assim, a única estratégia que podemos usar é comparar
grupos de expostos e não expostos e comparar a resposta fatual nestes dois grupos
de indivı́duos. Desta forma, estaremos medindo associação, que é a comparação de
duas probabilidades condicionais em dois grupos. Medimos o risco de desenvolver o
desfecho dado que o indivı́duo foi exposto ou não ao tratamento. O resultado é a razão
de risco associacional (RRA), calculada pela fórmula 2.5, na qual dividimos o risco da
doença entre tratados pelo risco da doença entre indivı́duos não tratados. A RRA é
uma medida condicional.
Na figura 2.6 demonstramos a diferença entre causa e associação de uma maneira
mais visual. Imaginemos que o nosso estudo tem 10 participantes. Para se estudar
causa, terı́amos que observar todos os 10 indivı́duos nas duas situações de tratamento,
o que fazemos na parte esquerda da figura. Retratamos a situação de tratamento
pintando os bonecos de preto e a situação controle ilustrando os bonecos de branco.
Note que expomos todos os 10 participantes às duas situações e assim, podemos
calcular tanto E[Dit=1 ] quanto E[Dit=0 ] e comparar as duas respostas potenciais fatual

37
2. O Modelo de Respostas Potenciais

Figura 2.6.: Causa e Associação

e contrafatual em todo o grupo. Como obtivemos duas probabilidades marginais, pois


obtidas nos mesmos indivı́duos, é possı́vel calcular uma medida marginal de causa
(DRC ou RRC). Esta seria a situação ideal, obter uma medida marginal, calculada em
todos os indivı́duos.
Entretanto, na vida real, procedemos como na parte direita da figura 2.6. Dividimos
os participantes em dois grupos, tratamos uma parte, no caso 4 indivı́duos, e deixamos
de tratar os outros 6. Assim, vamos comparar dois grupos de pessoas e obter duas
probabilidades condicionais: no grupo tratado (E[Di = 1|Ti = 1]), e no grupo não
tratado (E[Di = 1|Ti = 0]. Vamos comparar apenas as respostas fatuais de diferentes
indivı́duos. Obteremos uma medida condicional de associação (DRA ou RRA).
Vimos que associação não é causa, pela possibilidade de existir viés, que vai tornar a
medida de associação (RRA) diferente da medida de efeito causal (RRC). A questão
central da inferência causal é se é possı́vel calcular uma medida de associação e
interpretá-la como uma medida de causa. Ou seja, se é possı́vel usar a RRA para
estimar a RRC, sem viés.
Dito em outras palavras, em quais condições se pode assumir que E[Dit=1 ]/E[Dit=0 ] é
igual a E[Di = 1|Ti = 1]/E[Di = 1|Ti = 0]? Em quais condições medidas de associação
podem ser usadas para estimar efeitos causais?
Vimos que o problema fundamental da inferência causal é como estimar a resposta
contrafatual, não observada, ignorada (missing). Se o grupo não tratado for um
substituto adequado para estimar a resposta contrafatual não observada no grupo de
tratamento, podemos estimar a resposta contrafatual sem viés.
Assim, para usarmos a RRA como estimativa sem viés da RRC, precisamos de
pressupostos. Dentre estes pressupostos, o mais importante é o da permutabilidade. Se
os indivı́duos tratados forem iguais aos indivı́duos não tratados, eles são permutáveis
entre si. Desta forma, poderı́amos inverter os grupos, tratando os não tratados ou
deixando de tratar os tratados e o resultado não mudaria (descartando-se o papel do

38
2.5. Causa e Associação

acaso).
Em conclusão, se pudermos assumir que estes pressupostos são verdadeiros, podere-
mos, então, usar a RRA para estimar a RRC. Veremos, nos próximos capı́tulos, quais
são estes pressupostos.

39
3. Ensaio clı́nico randomizado
3.1. Caracterı́sticas do estudo experimental
Na figura 3.1 observamos a estrutura de um ensaio clı́nico controlado randomizado. A
partir da população de interesse, o pesquisador seleciona uma amostra de voluntários
para estudo, a partir da aplicação dos critérios de inclusão e exclusão. Os participantes
serão, então, divididos em dois grupos: intervenção e controle. O grupo de intervenção
receberá o tratamento em estudo e o grupo não exposto à intervenção será o grupo
controle, ou de comparação. Normalmente, o grupo controle receberá placebo ou o
tratamento convencional.
Neste estudo, o controle do experimento está nas mãos do investigador. Entretanto,
não é o pesquisador quem decide quem vai ser tratado ou quem vai fazer parte do grupo
controle. Esta decisão é tomada de forma aleatória, por sorteio. Esta forma de escolha
aleatória dos grupos aumenta a probabilidade de que os grupos sejam formados de
forma homogênea, ou seja, o mais parecidos entre si em relação a variáveis preditoras
do tratamento. Este processo de escolha aleatória dos integrantes dos grupos tratado e
controle é denominado de randomização. O processo de randomização, por ser aleatório,
tende a balancear covariáveis observadas e não observadas, eliminando ou reduzindo
viés de confundimento (Rosenbaum, 2017).
Após a formação dos grupos por randomização, os participantes serão, então, acompa-
nhados por um perı́odo determinado, para se observar a ocorrência ou não do desfecho.
Ao final se realiza a análise de dados. No estudo experimental o pesquisador parte da
causa para o efeito. É um estudo longitudinal, de caráter prospectivo. Denomina-se
controlado, porque tem um grupo controle.
Como o estudo experimental é realizado com voluntários, e geralmente os voluntários
são pessoas diferentes das não voluntárias em relação a variavéis pré-tratamento,
neste desenho a amostra de estudo tende a diferir da população de interesse, resul-
tando, portanto, viés de seleção. Isto faz com que os dados do estudo experimental
tenham redução de sua validade externa. Entretanto, por causa da randomização é o
estudo epidemiológico que apresenta maior validade interna, pela alta probabilidade de
balanceamento das variáveis pré-tratamento nos grupos experimental e controle.
Devido ao efeito placebo, explicado no capı́tulo anterior, é fundamental usar a
estratégia de duplo cegamento. Assim, nem o participante nem o avaliador devem saber
a qual dos grupos o indivı́duo pertence, se ao tratamento ou controle, para que suas
respostas não sejam induzidas (as pessoas tendem a melhorar se acreditam na eficácia
do tratamento e o avaliador tende a ver as coisas de forma mais favorável se acha que o
tratamento funciona). Desta forma, o estudo experimental deve ser duplo-cego, exceto
quando isto for impossı́vel (por exemplo, não é possı́vel cegar o paciente na comparação

41
3. Ensaio clı́nico randomizado

Figura 3.1.: Ensaio clı́nico randomizado

entre um método cirúrgico versus um método clı́nico de tratamento, pois não se vai
anestesiar um paciente e fingir que o operou para atingir o duplo cegamento).
No estudo experimental ideal, os grupos tratamento e controle são permutáveis entre
si, pois a randomização assegura que tanto os valores observados das respostas fatuais
quanto os valores ignorados das respostas contrafatuais estejam distribuı́dos ao acaso.
Assim imaginemos que T designe os indivı́duos sorteados para o grupo de tratamento
e C os participantes selecionados para o grupo controle. Se, porventura, trocarmos
as letras e tratarmos os rotulados com a letra C e colocarmos no grupo controle os
identificados pela letra T, isto, em tese, não alteraria os resultados do nosso estudo
(mas os resultados na prática podem ser um pouco diferentes, em decorrência do acaso).
Assim, P r[Dt = 1|T = 1] = P r[Dt |T = 0] = P r[Dt = 1], leia-se o risco condicional da
resposta potencial entre os tratados é igual ao risco condicional da resposta potencial
nos não tratados que, por sua vez, são iguais ao risco marginal da resposta potencial caso
todos os indivı́duos tivessem sido tratados (Hernan and Robins, 2018). Ou seja, podemos
usar o risco fatual entre os não tratados como substituto do risco contrafatual que
teria sido observado nos tratados, se eles não tivessem sido submetidos ao tratamento.
Da mesma forma, podemos usar o risco fatual entre os tratados para estimar o risco
contrafatual entre os não tratados, caso eles tivessem recebido o tratamento. Porisso,
a randomização tem alta probabilidade de levar à igualdade entre os grupos, o que
torna os grupos permutáveis entre si. Esta probabilidade é tanto mais elevada, quanto
maior for o tamanho da amostra, pela lei dos grandes números. Porisso é sempre
imprescindı́vel calcular o tamanho mı́nimo de amostra toda vez que formos realizar um
estudo epidemiológico.

42
3.1. Caracterı́sticas do estudo experimental

A randomização é a melhor estratégia para controle de confundimento, pois só ela


tende a tornar balanceados os grupos tratamento e controle em relação a variáveis
não observadas, não coletadas no estudo e que nem pensamos que pudessem confundir
o resultado do mesmo. Podemos usar várias técnicas de controle de confundimento
(veremos estas técnicas com detalhes na terceira parte deste livro), mas estas técnicas,
se funcionarem e se todos os pressupostos para sua utilização forem atendidos, são
capazes de balancear os grupos apenas em relação às variáveis observadas e incluı́das
no ajuste (Morgan and Winship, 2015).
O estudo experimental é considerado o padrão ouro da inferência causal, pelas
caracterı́sticas acima apontadas. A randomização torna alta a probabilidade de que os
grupos estejam balanceados em relação a variáveis pré-tratamento. Entretanto, alguns
problemas podem acontecer após a randomização e reduzir a sua eficácia: não aderência
ao tratamento, perdas de seguimento e co-intervenção.
A não aderência ao tratamento faz com que pessoas escolhidas para receber o
tratamento não façam uso do mesmo e coloca o pesquisador em uma encruzilhada. Se
ele optar por excluir estas pessoas, a eficácia da randomização pode ser quebrada, pois
se estaria utilizando de restrição, ao se analisar apenas os aderentes. Se os aderentes
forem diferentes dos não aderentes em relação a variáveis preditoras do tratamento (o
que geralmente acontece) isto pode resultar em viés de seleção. Se, ao contrário, ele
utilizar a análise pela intenção de tratar e analisar os tratados que não aderiram ao
tratamento como se tivessem sido tratados, isto pode gerar falso positivo (um efeito
benéfico do tratamento que não existiria no grupo total se todos tivessem realmente
aderido ao tratamento é identificado) ou falso negativo (um possı́vel efeito benéfico
do tratamento pode não ser detectado). Apesar dos problemas relatados acima em
relação à análise pela intenção de tratar, o procedimento mais recomendado hoje é de
se utilizar esta forma de análise para se evitar a quebra da eficácia da randomização
(Moher et al., 2010).
Outro problema potencial são as perdas de seguimento. Neste caso, como o pesquisador
não acompanhou os indivı́duos até o final do estudo, não se sabe qual o desfecho ocorrido.
O que o pesquisador deve fazer neste caso: excluir os casos perdidos? Se excluir os casos
perdidos e o desfecho for diferente entre os que participaram até o final, comparados
com os que abandonaram o estudo, ocorrerá viés de seleção, que pode levar a resultados
falsos. Uma das alternativas disponı́veis é realizar a análise pelo pior cenário. O
pesquisador atribui o pior desfecho possı́vel aos tratados e o melhor desfecho possı́vel
aos não tratados. Ou seja, no grupo tratado será considerado que o tratamento não
foi eficaz e no grupo não tratado será registrado que o tratamento teria sido eficaz.
Se os dados resistirem a esta prova de força isto será uma demonstração de que os
resultados permanecem válidos, apesar das perdas sofridas no estudo (Guyatte et al.,
2015). Entretanto, por esta estratégia ser muito conservadora, ela tem sido pouco
utilizada. Outra alternativa é analisar o tempo até o desfecho ocorrido até o último
momento do seguimento de cada indivı́duo. Assim, se o estudo tiver duração de dois
anos, aqueles que que não tiveram o desfecho e permaneceram até o final contribuirão,
cada um, com 24 meses para o tempo de seguimento. Se o desfecho tiver ocorrido será
considerado o tempo até a ocorrência do desfecho. Para os perdidos, entre os quais o
desfecho ainda não ocorreu, será contabilizado o tempo até a perda de seguimento. A

43
3. Ensaio clı́nico randomizado

segunda alternativa é a mais interessante e a mais utilizada nos ensaios clı́nicos, mas a
estratégia ideal é reduzir ao máximo as perdas de seguimento.
A co-intervenção também pode confundir os resultados de um estudo experimental.
Se a co-intervenção for aplicada mais em um grupo do que em outro, ela tem o potencial
de misturar os seus efeitos com o efeito da intervenção em estudo. A co-intervenção é
um exemplo de um desbalanço potencial que pode ocorrer nos grupos de intervenção
e controle em uma variável pós-tratamento, após a randomização. Co-intervenções
precisam ser padronizadas e administradas da mesmo forma a ambos os grupos ou
evitadas (Moher et al., 2010).
No ensaio clı́nico randomizado deve haver apenas uma única versão do tratamento
sendo administrada. Se houver mais de uma versão do tratamento, será impossı́vel
individualizar um único efeito do tratamento. Neste caso, não podemos dar uma inter-
pretação causal a uma medida que é uma mistura de efeitos de diferentes tratamentos
(Morgan and Winship, 2015; Hernan and Robins, 2018). Retornaremos a este ponto
quando discutirmos, no próximo capı́tulo 4, os pressupostos para inferência causal.
Assim, em estudos experimentais, a randomização tende a produzir grupos balancea-
dos em relação a variáveis pré-tratamento observadas e não observadas. Normalmente,
em todo ensaio clı́nico é publicada a tabela 1, comparando as variáveis pré-tratamento
entre os grupos, para que seja verificada, empiricamente a eficácia da randomização.
Neste caso não faz sentido realizar teste estatı́stico para verificar diferenças entre
os grupos e reportar o valor de P. Já sabemos que qualquer diferença observada foi
produzida pelo acaso, pois a escolha dos grupos foi feita por meio da randomização,
que é um procedimento aleatório (Moher et al., 2010).
Nos ensaios clı́nicos ideais, com aderência completa e sem perdas de seguimento,
nos quais foi verificado não haver, empiricamente, diferenças entre os grupos, pode-se
assumir o pressuposto da permutabilidade entre os grupos. Neste caso, diremos que a
variável de tratamento é independente das respostas potenciais (T ⊥ D1 , D0 ) (Morgan
and Winship, 2015). Dito em outras palavras, não há confundimento por variável
omitida. Nenhuma variável pré-tratamento é capaz alterar as respostas potenciais.
Como os grupos são iguais em todas as variáveis, não existe variável que influencie
ao mesmo tempo o tratamento e o desfecho e que seja capaz de provocar viés de
confundimento.
Se há permutabilidade, então P r[D = 1|T = 1] = P r[Dt=1 = 1], ou seja, o risco
observado do desfecho entre os tratados, uma medida condicional, é igual ao risco
do desfecho se todos os indivı́duos tivessem sido tratados, uma medida marginal. Da
mesma forma, P r[D = 1|T = 0] = P r[Dt=0 = 1], leia-se, o risco observado do desfecho
entre os não tratados, uma medida condicional, é igual ao risco do desfecho se todos
os indivı́duos não tivessem sido submetidos ao tratamento, uma medida marginal.
Assim, o risco relativo associacional (RRA) é igual ao risco relativo causal (RRC). Ou
P r[D = 1|T = 1]/P r[D = 1|T = 0] = P r[Dt=1 = 1]/P r[Dt=0 = 1] . Ou seja, podemos
interpretar uma medida de associação como uma medida de efeito causal (Hernan and
Robins, 2018).
Entretanto, o estudo experimental só pode ser utilizado para testar intervenções
potencialmente benéficas. Não é ético submeter seres humanos a intervenções poten-
cialmente maléficas. Além disso, outras vezes não é factı́vel se realizar ensaio clı́nico

44
3.2. Conclusão

controlado por variadas razões (Rosenbaum, 2017). Se, por exemplo, pretendemos
saber se a participação em programa de transferência de renda, como o Bolsa Famı́lia,
tem efeito no percentual de vacinação não poderı́amos aleatorizar o tratamento, por
isto ser inviável do ponto de vista polı́tico. Hoje, em virtude de outros benefı́cios já
demonstrados pelo programas, também não seria ético realizar um ensaio clı́nico para
testar esta hipótese.

3.2. Conclusão
Assim, se podemos no ensaio clı́nico controlado randomizado ideal interpretar uma
medida de associação como de causa se houver permutabilidade entre os grupos e a
versão do tratamento for única, o que fazer no caso de estudos observacionais, nos
quais os grupos estão desbalanceados em relação a variáveis preditoras do tratamento?
Simplesmente teremos que calcular uma medida de associação e deixar as considerações
causais à mercê da intuição e do bom senso? Ou haverá outra alternativa?

45
4. Estudos observacionais
4.1. Caracterı́sticas dos estudos observacionais
Nos estudos observacionais a alocação dos indivı́duos para os grupos tratamento e
controle está fora do controle do investigador. Os indivı́duos são selecionados, geralmente
por processos sociais, ou se autoselecionam e, assim, terminam em um dos grupos de
estudo. Nestes estudos não há randomização e, portanto, existe um grande potencial
para viés de confundimento. Isto torna a interpretação causal dos estudos observacionais
muito difı́cil.
O mecanismo de alocação que engendra a formação dos grupos geralmente leva a
diferenças sistemática entre os grupos de tratamento (ou de expostos) e o controle (de
não expostos). Assim, não há balanceamento entre os grupos e desta forma, a RRA
não é igual à RRC. Ou seja, a princı́pio não podemos usar uma medida de associação
como estimativa de uma medida de causa em estudos observacionais.
O grande problema nos estudos observacionais é que há diferenças nas caracterı́sticas
pré-tratamento ou pré-exposição, o que leva a viés. A grande pergunta é como rebalancer
os grupos nos estudos observacionais? Como criar contrafatuais adequados na ausência
de randomização?
Se pudermos conceber os estudos observacionais como estudos experimentais imper-
feitos e compreender como se dá o processo de alocação nos grupos, podemos tentar
remover diferenças sistemáticas existentes entre os grupos. Esta estratégia foi proposta
por Imbens and Rubin (2015). Vamos entender melhor como ela funciona com um
exemplo prático.
Queremos saber se participar do programa de saúde na famı́lia (PSF) causa maiores
percentuais de vacinação em crianças. Como a realização de um estudo experimental
randomizado é inviável, pois o PSF já está implantado há vários anos, além de ter
benefı́cios já testados, temos que realizar um estudo observacional para responder a
esta pergunta. Vamos imaginar que tenhamos realizado um estudo de coorte para
responder a esta pergunta. A estrutura de um estudo de coorte está demonstrada na
figura 4.1. Neste estudo, a partir de uma população alvo o pesquisador seleciona uma
amostra para estudo. Esta amostra também é composta por voluntários, pois apenas os
que aceitarem participar terão dados coletados. Em seguida, o pesquisador observa os
grupos tal como eles já se encontram formados na realidade: expostos e não expostos.
Depois acompanha os indivı́duos por um determinado perı́odo de tempo e registra a
ocorrência ou não do efeito. Assim, o estudo de coorte, tal como o ensaio clı́nico, parte
da causa para o efeito, sendo um estudo longitudinal prospectivo. O grupo controle são
os indivı́duos não expostos. A diferença entre o ensaio clı́nico e o estudo de coorte é
o controle da administração do tratamento pelo pesquisador e a randomização, que

47
4. Estudos observacionais

ocorrem apenas no primeiro estudo.

Figura 4.1.: Estudo de coorte

No inı́cio do nosso estudo de coorte identificamos um grupo de expostos ou tratados,


que recebiam visita domiciliar de um agente de saúde do PSF, e um grupo controle
ou não tratado, que não participava do programa. No inı́cio do segundo ano de vida,
inspecionamos as carteiras de vacinação das crianças e criamos uma variável dicotômica,
à qual atribuı́mos o valor 1 se a criança não tivesse tomado todas as vacinas do
calendário básico de vacinação até completar 1 ano de idade (vacinação incompleta),
ou 0 se o esquema básico estivesse completo.
Os dados dos grupos de tratamento e controle estão apresentados na tabela ??.
Na tabela verificamos que o percentual de vacinação incompleta foi maior nos que
participam do PSF (40%), comparados aos não participantes (20%). Calculamos a
razão de risco associacional (RRA), que foi igual a 2. Ou seja, o risco de ter vacinação
incompleta foi duas vezes maior para os que participam do PSF, comparados aos que
não participam do PSF. Como se trata de um estudo observacional, não podemos
interpretar esta medida de associação como uma medida de causa, pois o estudo não foi
randomizado. Em um estudo observacional, como vimos, para se dar uma interpretação
causal a uma medida de associação teremos que assumir vários pressupostos não
testáveis empiricamente. Vamos, a seguir, conhecer quais são estes pressupostos.

4.2. Pressupostos para identificação do efeito causal


Antes que possamos dar uma interpretação causal a uma medida de associação, é
preciso verificar se o efeito causal é identificável. Ele será identificável, se pudermos

48
4.2. Pressupostos para identificação do efeito causal

Tabela 4.1.: Participação no Programa de Saúde da Famı́lia e Vacinação Infantil

Total
Vacinação Infantil
D=1 Incompleta % Incompleta D=0 Completa Total
T=1 40 40 60 100
T=0 20 20 80 100
Total 60 30 140 200
RRAT D = 40/20 = 2,00 (1,26 - 3,17)
RRA = Razão de Risco Associacional
T=1 Participação no Programa de Saúde da Famı́lia
T=0 Grupo controle

assumir como razoáveis 3 pressupostos: intervenções bem definidas (consistência),


permutabilidade e positividade.

4.2.1. Intervenções bem definidas


Quando realizamos um estudo experimental, seguimos um protocolo de intervenção,
onde são delineadas todas as ações que fazem parte do pacote de ações. Desta forma,
a intervenção é aplicada de forma padronizada a todos os sujeitos do estudo, que
recebem uma intervenção bem definida e única. Para se estimar o efeito causal este
mesmo critério se aplica ao estudo observacional. Apesar da ”intervenção”não ser
aplicada no estudo observacional pelo pesquisador, e ser chamada, na maioria das vezes,
de exposição, ela deve ter sido padronizada e aplicada da mesma forma a todos os
participantes.
Vimos, que Rubin nos sugeriu que devemos imaginar o estudo observacional como
um estudo experimental fracassado, no qual houve quebra da randomização (Imbens
and Rubin, 2015). Assim, na abordagem proposta por ele, temos que hipotetizar que
no estudo observacional houve uma ”intervenção”. No nosso exemplo, o PSF é uma
intervenção de saúde. Assim, temos que verificar se há uma única forma de intervenção
no PSF e se esta intervenção é aplicada de forma padronizada e igual a todas as
famı́lias participantes. Assim, em teoria, cada famı́lia deve receber uma visita mensal
do agente de saúde, e esta visita deve conter um ”pacote”de ações, que é sempre
aplicado da mesma forma a todos os participantes. Esta ação, para crianças menores
de um ano incluiria o incentivo ao aleitamento materno, a orientação em relação às
vacinas do calendário básico do primeiro ano de vida, orientações em caso de doenças,
como infecção respiratória aguda ou diarreias e a monitorização do crescimento e
desenvolvimento. Além disso, o tempo despendido com cada famı́lia também teria que
ser semelhante. Se pudermos assumir que esta ”intervenção”no mundo real é aplicada
de forma mais ou menos homogênea a todos, podemos assumir que este pressuposto é
razoável neste caso. Isto, é claro, vai depender da realidade de cada local.
Este pressuposto é denominado por Rubin pela sigla em inglês SUTVA (stable unit

49
4. Estudos observacionais

treatment value assumption), ou seja, a suposição de que o valor de cada unidade de


tratamento é estável ou fixo (estabilidade do efeito causal). Porisso este pressuposto
também é denominado de consistência (Hernan and Robins, 2018). Neste pressuposto
também está incluı́da a ausência de contaminação. As respostas potenciais de um parti-
cipante não podem ter sido afetadas pelo tratamento recebido por outro participante.
Este pressuposto seria violado neste exemplo se famı́lias participantes do PSF ensinem
ações aprendidas no programa a outras famı́lias não participantes da intervenção.

Para Holland (1986) não se estuda causa, sem manipulação. Para este autor, só
efeitos causais que possam ser hipoteticamente manipulados devem ser considerados.
Assim, para Holland, não faz sentido se estudar o efeito causal do nı́vel socioeconômico,
já que não podemos ”manipulá-lo”, por meio de uma intervenção. Além disso, terı́amos
que considerar se nı́vel socioeconômico é uma ”intervenção”fixa e aplicada de forma
idêntica a todos. Assim, exposições como nı́vel socioeconômico não seriam manipuláveis
e, portanto, não poderiam ser consideradas para identificação do efeito causal ??.
Esta perspectiva é muito restritiva. Hernan and Robins (2018) considera esta variável
(nı́vel socioeconômico) imprecisa para se calcular efeito causal, mas pondera que, na
realidade a maioria das exposições (”intervenções”) em estudos observacionais são
inerentemente vagas. De qualquer modo, o uso de questões causais mais bem definidas
ajudam o pesquisador na interpretação da sua estimativa alvo. Efeitos causais definidos
de forma imprecisa têm quase nenhuma interpretação causal. Para Pearl, é possı́vel
”manipular”estudos observacionais por meio de uma ”intervenção cirúrgica”feita no
gráfico. Veremos esta estratégia no capı́tulo 5.

Devemos formular questões contrafatuais bem definidas, baseados em pressupostos


realistas baseados em sólida teoria. As perguntas causais devem apresentar estados
contrafatuais claros, estreitos e especı́ficos (Morgan and Winship, 2015). A pergunta
se a aspirina reduz a mortalidade é muito ampla, pois não inclui a dosagem, via de
administração e número de tomadas por dia. Uma pergunta mais estreita seria tomar por
via oral 100 mg de aspirina uma vez ao dia. Outra pergunta muito ampla é se a atividade
fı́sica é capaz de aumentar a longevidade, pois não se define a duração, intensidade,
frequência e tipo da atividade fı́sica. Uma pergunta mais especı́fica seria praticar
atividade fı́sica intensa (corrida) 3 vezes na semana com duração de 30 minutos por vez.
Vimos, com estes exemplos, que nem sempre é fácil criar ”intervenções”especı́ficas a
partir de estudos observacionais. Desta forma, nos estudos observacionais é quase sempre
problemático assumir o pressuposto da consistência. Na presença de estados causais
(”intervenções”) mal definidos a interpretabilidade do efeito causal fica prejudicada.

(Rehkopf et al., 2016)

Como é difı́cil na vida real que haja apenas uma única versão do tratamento, há uma
versão mais branda deste pressuposto que é assumir a irrelevância das diferentes versões
do tratamento (VanderWeele, 2009). Neste pressuposto mais realista, se reconhece que
o tratamento tem diferentes versões, mas estas diferenças não têm relevância para se
medir o efeito causal.

50
4.2. Pressupostos para identificação do efeito causal

4.2.2. Permutabilidade
O pressuposto da permutabilidade significa que não há variável confundidora omitida.
No estudo experimental este pressuposto é razoável se a randomização tiver sido
eficaz. Não se pode testar este pressuposto em relação às variáveis não observadas,
mas sabemos, por teoria, que a randomização, desde que o tamanho da amostra seja
grande, tem o potencial de equilibrar também variáveis desconhecidas entre os grupos.
Permutabilidade significa que o risco contrafatual entre os não tratados (probabilidade
condicional) é igual ao risco que seria observado se todos não tivessem sido tratados
(probabilidade marginal). Da mesma forma, o risco contrafatual entre os tratados
(probabilidade condicional) é igual ao risco que seria observado se todos tivessem sido
tratados (probabilidade marginal). Havendo permutabilidade associação é igual a causa.
Neste pressuposto, aplicado aos estudos observacionais, se assume que a a probabili-
dade condicional de receber o tratamento (mecanismo de alocação) depende apenas das
variáveis mensuradas no estudo e que nenhum confundidor foi omitido. Isto equivale a
dizer que o tratamento é independente das respostas potenciais em cada nı́vel de C, ou
seja, (D1 , D0 )perpT |C. C pode ser apenas uma variável ou um conjunto de variáveis
confundidoras. Se, em cada nı́vel da variável confundidora as respostas potenciais forem
independentes do tratamento é, então, possı́vel se calcular o efeito causal estratificado
em cada nı́vel do tratamento e, em seguida, ponderar estas estimativas pela distri-
buição do confundidor na amostra geral. Veremos, mais abaixo, como realizar este
procedimento, denominado padronização.
Se a probabilidade de receber o tratamento depende apenas de C, então os tratados
são permutáveis com os não tratados em cada nı́vel de C. Ou seja, nos subgrupos de C
as demais variáveis estão igualmente distribuı́das nos grupos de tratamento e controle.
Neste caso, apesar de não se poder mais assumir permutabilidade marginal, como no
estudo experimental, é possı́vel pressupor que há permutabilidade condicional. Mas
para tanto precisamos também assumir que C é o único preditor que está desigualmente
distribuı́do nos grupos tratado e não tratado.
Este pressuposto não é verificável empiricamente, ou seja, não é revelado pelos dados.
Depende do conhecimento teórico prévio. Se a questão do estudo ainda não tiver sido
muito estudada o efeito causal pode não ser identificável, por não se conhecer ainda
bem a estrutura de confundimento que cerca o problema.

4.2.3. Positividade
Pelo pressuposto da positividade não há categoria(s) nos subgrupos de C com proba-
bilidade 0 ou 1 de receber o tratamento ou controle. Este pressuposto exige que haja
sobreposição entre os grupos, denominada zona de suporte comum, para que contra-
fatuais adequados possam ser calculados. Dito em outras palavras, há participantes
em todos os nı́veis de tratamento para cada grupo de C. Ou seja, a probabilidade
de encontrar pessoas no grupo de tratamento ou no grupo controle em cada nı́vel da
variável confundidora é maior do que zero e menor do que 1: 0 < P r(T = t|C = c) < 1
. Este pressuposto pode ser empiricamente verificável. No caso de variáveis categóricas,
ela se cumpre quando não há caselas vazias na tabela multidimensional T x D x C. Se

51
4. Estudos observacionais

houver caselas vazias ou com poucas observações o risco contrafatual naquele grupo não
poderá ser estimado ou será estimado de forma muito imprecisa. Assim, o pressuposto
da positividade tende a ser violado em amostras pequenas.

4.3. Exemplo - aplicação dos pressupostos em estudo


observacional
Voltemos agora ao nosso exemplo. Vamos examinar a estrutura do problema e verificar
se o efeito causal é identificável. Para isto vamos usar o método gráfico, que será mais
detalhadamente explicado no próximo capı́tulo 5.
Sabemos que a participação no PSF é maior para famı́lias pobres, pois este programa
é desenvolvido nas periferias urbanas ou áreas rurais e voltado para população de baixa
renda. Vamos assumir, também, que há maior probabilidade de que uma criança de
baixa renda tenha o calendário básico de vacinação incompleto, em comparação a uma
criança de média ou alta renda. Assumiremos também que a única variável que está
distribuı́da desigualmente nos grupos que participam ou não no PSF é a pobreza. O
nosso diagrama causal, que codifica o nosso conhecimento teórico sobre o problema,
está demonstrado na figura 4.2.

Figura 4.2.: Gráfico causal - PSF e Vacinação infantil

Vacinação Incompleta
+

Pobreza
?

+
PSF

PSF = Programa de Saúde da Famı́lia

Na tabela 4.2 apresentamos a distribuição do percentual de pobreza segundo par-


ticipação no PSF. Vemos que entre os participantes, 90% são pobres, enquanto que
apenas 30% dos não participantes são pobres. Ou seja, o risco de participar do PSF é 3
vezes maior para quem é pobre, comparado a quem não se encaixou na definição de
pobreza. A distribuição da variável pobreza não está equilibrada nos grupos tratamento
e controle. Portanto, não podemos assumir que há permutabilidade marginal.
Na tabela 4.3 mostramos a distribuição do percentual de pobreza de acordo com os
percentuais de vacinação incompleta. O risco de uma criança pobre estar com a sua
vacinação básica no primeiro ano de vida incompleto é 5 vezes maior, comparada a
uma criança fora da faixa de pobreza, pois 44,2% dos pobres estavam com a vacinação

52
4.3. Exemplo - aplicação dos pressupostos em estudo observacional

Tabela 4.2.: Participação no Programa de Saúde da Famı́lia e Pobreza

Total
Pobreza
C=1 Sim % Pobres C=0 Não Total
T=1 90 90 10 100
T=0 30 30 70 100
Total 80 60 120 200
RRAT C = 90/30 = 3,00 (2,21 - 4,08)
RRA = Razão de Risco Associacional
T=1 Participação no Programa de Saúde da Famı́lia
T=0 Grupo controle

incompleta e 8,8% dos não pobres não tinham completo o esquema de vacinação básica.
Assim, concluı́mos que C (pobreza) é uma causa comum de T e D.

Tabela 4.3.: Pobreza e Vacinação Infantil

Total
Vacinação Infantil
D=1 Incompleta % Incompleta D=0 Completa Total
C=1 52 44,2 67 120
C=0 7 8,8 73 80
Total 60 30 140 200
RRACD = 44,2/8,8 = 5,05 (2,42 - 10,53)
RRA = Razão de Risco Associacional
C=1 Pobres
C=0 Não Pobres

Se não podemos assumir permutabilidade marginal, podemos assumir permutabilidade


condicional? É razoável pressupor que a única variável que está desbalanceada nos
grupos de tratamento e controle é a taxa de pobreza? Provavelmente não. Devem haver
outras variáveis não observadas que estejam também tornando estes grupos (tratamento
e controle) não comparáveis. Entretanto, para efeitos didáticos, vamos assumir que
a variável taxa de pobreza é a única que está desigualmente distribuı́da entre os que
participam ou não do PSF. Desta forma, podemos assumir permutabilidade condicional.
Vejamos, na tabela 4.4, a associação entre participação no PSF e vacinação infantil
de acordo com a pobreza. Dentre os pobres (C=1), aqueles que participam do PSF têm
taxas de vacinação incompleta mais baixas (42%) do que aqueles que não participam
(50%). Por outro lado, dentre os não pobres, a situação se inverte: os participantes têm
maiores percentuais de vacinação incompleta (20%), comparados aos não participantes
(7%). Podemos verificar, nesta tabela, o pressuposto da positividade. Vemos que todas

53
4. Estudos observacionais

as caselas estão preenchidas. Entretanto, algumas caselas possuem poucas observações,


o que reduz a precisão das estimativas e aumenta a largura dos intervalos de confiança,
no estrato dos não pobres.

Tabela 4.4.: Programa de Saúde da Famı́lia e Vacinação Infantil de acordo com a


pobreza
C=1 (Pobres)
Vacinação Infantil
D=1 Incompleta % Incompleta D=0 Completa Total
T=1 38 42 52 90
T=0 15 50 15 30
Total 53 44 67 120
RRT D|C=1 = 42/50 = 0,84 (0,55 - 1,30)

C=0 (Não Pobres)


Vacinação Infantil
D=1 Incompleta % Incompleta D=0 Completa Total
T=1 2 20 8 10
T=0 5 7 65 70
Total 7 9 73 80
RRT D|C=0 = 20/7 = 2,80 (0,62 - 12,55)

Vimos que, se pudermos assumir que os três pressupostos sejam verdadeiros em um


estudo observacional, consistência, positividade e permutabilidade condicional, podemos
usar o procedimento de padronização e obter uma medida condicional, o risco relativo
associacional ponderado por estrato da variável C. A esta medida podemos dar uma
interpretação causal. Vamos realizar estes cálculos, usando a fórmula não paramétrica
de ajuste 4.1 para obter o RR médio ponderado por estrato (Pearl et al., 2016).
X
P (D = d|do(T = t)) = P (D = d|T = t, C = c)P (C = c) (4.1)
c

Razão de Risco Ponderada= [P(D=1 | do(T=1) / P(D=1 | do(T=0)]

P (D = 1 | do(T = 1) = [P (D = 1 | T = 1, C = 1)xP (C = 1)] + [P (D = 1 | T = 1, C = 0)xP (C = 0)]


[38/90x120/200] + [2/10x80/200] = [0, 422x0, 60] + [0, 20x0, 40] = 0, 253 + 0, 08 = 0, 333

P (D = 1 | do(T = 0) = [P (D = 1 | T = 0, C = 1)xP (C = 1)] + [P (D = 1 | T = 0, C = 0)xP (C = 0)]


[15/30x120/200] + [5/70x80/200] = [0, 50x0, 60] + [0, 0714x0, 40] = 0, 30 + 0, 02857 = 0, 328

Razão de Risco Ponderada = 0,333 / 0,328 = 1,02

A razão de risco ponderada foi 1, indicando que não há efeito causal do PSF na
vacinação infantil.

54
4.4. Conclusão

4.4. Conclusão
Na presença de pressupostos realistas e defensáveis, é possı́vel estimar valores contrafatu-
ais médios observáveis para grupos especı́ficos de indivı́duos e aplicando procedimentos
estatı́sticos paramétricos, semiparamétricos ou não paramétricos será possı́vel dar a
esta diferença de risco médio ou razão de risco uma interpretação causal. Neste caso
diremos que o mecanismo de alocação é ignorável (Morgan and Winship, 2015) ou que
não há confundimento por outra variável omitida.
A grande questão que resta é até que ponto C é o única variável ou conjunto de
variáveis que se encontra(m) desbalanceada(s) nos grupos de tratamento (expostos) e
controle (não expostos). Como selecionar as variáveis que provocam diferenças entre os
grupos? Como assegurar que o mecanismo de alocação possa ser considerado ignorável?
Teremos que lançar mão de sólida teoria e de pressupostos realistas e defensáveis para
atingir este objetivo. Porém, muitas vezes, não conhecemos o mecanismo de geração de
dados nos estudos observacionais e não será possı́vel identificar o efeito causal. Se a
interpretação causal não for possı́vel ainda podemos utilizar os dados coletados a partir
de estudos observacionais para predizer o evento com base nas variáveis observadas
(Hernan and Robins, 2018).

55
Parte II.

Abordagem Gráfica

57
5. Gráficos Acı́clicos Direcionados
(DAGs)
Os gráficos acı́clicos direcionados ou dirigidos, também chamados diagramas causais, são
utilizados para se realizar inferência causal. A sigla inglesa DAG (que significa directed
acyclic graph) é muito utilizada e está mais ou menos incorporada na linguagem do dia
a dia, de modo que seria estranho utilizar a sigla em português GAD. Assim, neste livro,
utilizaremos a sigla em inglês DAG, da mesma forma que nos referimos à sı́ndrome
da imunodeficiência adquirida como aids, ao invés de sida. Estes gráficos são acı́clicos,
pois não são permitidas circularidades (feed-back loops), refletindo o fato de que o
futuro não pode interferir no passado. Este caráter não cı́clico reflete o fato de que uma
variável não pode interferir nela mesma. Estes diagramas são direcionados, assumindo-se
que a causalidade flui em apenas uma direção, em um dado momento no tempo. No
DAG também está incorporada uma perspectiva temporal na noção de causalidade,
assumindo-se que o tempo flui da esquerda para a direita. Desta forma, influências
simultâneas recı́procas entre duas variáveis não são permitidas. Assim, se desejamos
considerar influências bidirecionais da renda na escolaridade, e da escolaridade na renda,
temos que admitir que a renda no tempo zero influencia a escolaridade no tempo um
que, por sua vez, influencia a renda no momento dois (R0 → E1 → R2).
A teoria por trás dos DAG, foi formalizada e sintetizada matematicamente por
Judea Pearl, a partir da contribuição de vários outros autores, e está publicada, com
todos os detalhes técnicos, no seu livro Causality (Pearl, 2009a). Outro livro que
contribuiu bastante para a consolidação desta teoria foi escrito por Spirtes, Glymour
and Scheines (Spirtes et al., 2000). Esta teoria, que surgiu nas disciplinas de ciência da
computação e inteligência artificial, consiste em uma teoria unificada de viés, visualizada
estruturalmente em formato gráfico. Neste capı́tulo vamos resumir algumas de suas
caracterı́sticas. Várias introduções técnicas a respeito estão publicadas (Hernan and
Robins, 2018; Elwert, 2013; Cortes et al., 2016; Morgan and Winship, 2015; Glymour
and Greenland, 2008). Uma excelente revisão em português, bem explicativa, contendo
um exemplo, foi recentemente publicada (Cortes et al., 2016). Há excelentes exemplos
de uso de DAGs para a construção de uma teoria a respeito de problemas causais
complexos (Fleischer and Diez Roux, 2008; Shrier and Platt, 2008). Existem boas
revisões do uso de DAG na pesquisa epidemiológica (Greenland et al., 1999; Glymour
and Greenland, 2008; Hernan and Robins, 2018).
O DAG é uma ferramenta visual simples, no qual são codificados conhecimentos
qualitativos especializados, ou seja, os pressupostos acerca da estrutura causal de
um problema. Estes pressupostos são alicerçados na pesquisa empı́rica e na teoria.
A partir da observação do desenho formalizado no DAG, assumindo-se que a nossa

59
5. Gráficos Acı́clicos Direcionados (DAGs)

teoria é correta, é possı́vel se identificar viés de confundimento e evitar viés de colisão


(seleção). A partir do DAG será verificado se é possı́vel se identificar o efeito causal. Esta
abordagem é apropriada para se responder a uma pergunta especı́fica de causalidade, se
T (tratamento) causa D (desfecho), como, por exemplo, se o recebimento de renda pelo
programa bolsa famı́lia causa aumento na cobertura da vacinação infantil. Entretanto,
não é aplicável a perguntas do tipo quais as causas de D, como, por exemplo, quais as
causas da obesidade. Desta forma, é possı́vel codificar o conhecimento acumulado e
organizar um DAG, e nele verificar se é possı́vel se responder a uma pergunta especı́fica,
com uma causa e apenas um efeito, sendo necessário se realizar um recorte na realidade,
geralmente complexa. Desenhar um DAG é importante para se evitar erros comuns
em inferência causal, pois o gráfico nos ajuda a identificar quais variáveis devem ser
incluı́das no ajuste e quais variáveis, se incluı́das, podem sabotar uma interpretação
causal.
A teoria por trás do DAG está integrada a um modelo contrafatual subjacente, baseado
na teoria das respostas potenciais de Rubin (Imbens and Rubin, 2015). No DAG estão
embutidas representações de modelos de equações estruturais não paramétricos. A
facilidade do desenho gráfico simplifica o pensamento a respeito de sistemas causais, e
evita a derivação do sistema de dependências e independências causais entre as variáveis
a partir da notação matemática.
A partir do DAG é possı́vel, usando-se regras de separação gráfica, comparar as
relações (pressupostos) causais codificadas no diagrama com associações estatı́sticas
deduzı́veis pelo gráfico, e tentar separar causa de associação. A partir das independências
preditas pelo diagrama, é possı́vel se verificar a compatibilidade da estrutural causal,
construı́da com base na teoria prévia, com os dados empı́ricos (Glymour and Greenland,
2008).

5.1. Causa e Associação


Para um melhor entendimento das seções subsequentes, é importante, neste ponto,
distinguir causa de associação. Causa será aqui considerada a partir da definição
contrafatual. O tratamento causa o desfecho se, para pelo menos uma unidade da
população, uma intervenção na variável T (tratamento) resulta em mudança na variável
D (desfecho). Por outro lado, associação se refere à diferença observada no valor de
D (desfecho) em diferentes subgrupos de T (tratamento) (Imbens and Rubin, 2015;
Glymour and Greenland, 2008). Observe que a noção de causa pressupõe a necessidade
de uma intervenção sobre a realidade, manipulando-se o tratamento, enquanto que a
associação expressa apenas uma observação da realidade, baseada na diferença dos
valores do desfecho nos subgrupos de tratamento. A diferença entre causa na abordagem
contrafatual e associação encontra-se mais detalhadamente explicada no capı́tulo 1.
Quando duas variáveis não estão associadas elas são estatisticamente independentes.
A distribuição de D não muda nos diferentes subgrupos de T. O conhecimento do
valor de T nada acrescenta a respeito do valor de D. Se o tratamento não interfere na
doença, T e D serão marginal ou incondicionalmente independentes. O conhecimento
da exposição não permite antecipar a ocorrência do desfecho. Isto está demonstrado na

60
5.2. Notação

equação 5.1. Formalmente, a probabilidade de D=d dado que T=t é igual à probabili-
dade de D=d. Ou seja, a probabilidade de, na população, observar valores da variável
D iguais a d, nos subgrupos de T=t continua igual à probabilidade de encontrar valores
de D=d (d e t podem assumir n valores, para simplificar vamos assumir que D possa
ser igual a 1=doentes e 0=sadios e T possa ser igual a 1=tratados e 0=não tratados).
Quer o indivı́duo tenha sido tratado ou não, conhecer o grupo de tratamento (tratado
ou não tratado) ao qual ele pertence não modifica a probabilidade do desfecho, ou seja,
T e D são marginalmente independentes. A barra vertical — denota ”condicional a
determinada variável”. Esta barra sempre se refere a uma probabilidade condicional,
obtida em um subgrupo ou estrato de uma determinada variável, ou seja condicional a
ela. Quando T e D são independentes, a distribuição de D condicional a T=t é sempre
igual à distribuição marginal ou não condicional de D, ou seja, exatamente igual à
obtida na população total antes do condicionamento.

Independência Marginal ou Incondicional

P r(D = d|T = t) = P r(D = d) (5.1)


Por outro lado, quando duas variáveis estão associadas, elas são estatisticamente
dependentes. A distribuição de D difere nos subgrupos de T. Dessa forma, o conheci-
mento de T indica algo referente ao valor de D. Se o tratamento afeta a doença, T e D
serão dependentes. Conhecer em qual grupo o indivı́duo se encontra permite antecipar
algo a respeito do desfecho. Esta situação está detalhada na equação 5.2.

Dependência

P r(D = d|T = t) 6= P r(D = d) (5.2)


Vejamos agora a notação utilizada e alguns conceitos fundamentais a respeito do
DAG. Depois explicaremos as fontes de associação estatı́stica encontradas no DAG.

5.2. Notação
O DAG tem três elementos: nó, seta e ausência de seta. No DAG cada nó representa
uma variável aleatória. Na figura 5.1 temos 10 nós, ou seja, dez variáveis estão ali
representadas. Cada seta, que é sempre unidirecionada, assume um efeito causal direto,
ou, simplesmente, que não se quer assumir que não haja relação de causalidade entre
duas variáveis. A ausência de seta entre duas variáveis é um pressuposto forte, de
que não há efeito causal direto. Cada seta no DAG indica que uma variável causa
outra, mas não distingue efeito de dano de efeito protetor. Assim, quando no DAG
assumimos que o tratamento1 T causa o desfecho D, T tanto pode reduzir o valor ou
1 naabordagem contrafatual, o estudo observacional é entendido como um experimento fracassado.
Assim, neste livro, utilizaremos, de forma intercambiante, os termos tratamento e exposição para
nos referirmos à variável explanatória.

61
5. Gráficos Acı́clicos Direcionados (DAGs)

diminuir a probabilidade de ocorrência de D(efeito protetor) quanto aumentar o valor


ou incrementar a probabilidade de ocorrência de D (efeito de dano). É importante
ressaltar que todas as setas colocadas no DAG representam relações causais.
Assim, correlações entre variáveis que não sejam causais (correlações espúrias) não
são representadas. Cabe aqui ressaltar uma diferença fundamental entre o DAG e o
diagrama de caminhos, usado em modelos de equações estruturais. No diagrama de
caminhos as setas representam apenas correlações (que podem tanto ser causais, como
não causais ou espúrias) (Kline, 2016).

Figura 5.1.: DAG - Gráfico acı́clico direcionado.

O DAG demonstrado na figura 5.1 foi desenhado no programa DAGitty (de domı́nio
público, disponı́vel na página http://www.dagitty.net/) (Textor et al., 2011). Neste
programa, a variável de exposição, ou tratamento (T), é representada por um botão de
play, enquanto a variável resposta, ou desfecho (D), é representada por um botão de
stop. Denominamos caminho uma sequência de setas que apontam em qualquer direção
entre duas variáveis, enquanto caminho causal é um caminho que sai de uma variável
com a seta apontando para outra variável. Assim, há dois caminhos diretos entre B e
D: um caminho causal de B para D (no sentido da seta, B → D), e um caminho não
causal de D para B (no sentido oposto ao da seta, B ← D). Há dois caminhos causais
de T para D, um direto (T → D), e outro indireto (T → M → D), por intermédio
do mediador M. De D para T há quatro caminhos não causais D ← T, D ← M ←
T, D ← G ← H → T e D ← A → E ← C → D. Resumindo, entre D e T há seis
caminhos, dois causais e quatro não causais. Os caminhos não causais são também
denominados caminhos espúrios, pois eles transmitem correlações não causais. Nestes
caminhos não causais, as associações fluem somente no sentido contrário ao da seta, ou
nos dois sentidos (tanto na mesma direção, quanto no sentido contrário ao da seta). Os
caminhos causais, por sua vez, transmitem correlações causais, que fluem sempre na
mesma direção da seta.
Denomina-se variável colisora, uma variável que tenha duas setas apontando para
ela. Na figura 1.1, E é uma variável colisora, já que duas setas (uma vindo de C e

62
5.2. Notação

outra vindo de A) apontam para E. O nome colisor vem da situação na qual duas setas
”colidem”em um nó.
Em um DAG existem pais, crianças, descendentes e ancestrais, tal qual em uma
famı́lia. Assim, T é pai de M e D. D é filho de T, M, G, A e B. A variável C é ancestral
de T, E, M e D. Por outro lado, D é descendente de todas as variáveis do gráfico, menos
de E.
No DAG temos dois tipos de caminhos: pela porta da frente (frontdoor path) e pela
porta de trás (backdoor path). No caminho pela porta da frente, a seta parte da variável
em questão para outra variável qualquer, enquanto no caminho pela porta dos fundos,
a seta chega na variável em questão, a partir de outra variável qualquer. Assim, vamos
analisar quais os caminhos que chegam e partem da variável T (tratamento). Todos
os caminhos que partem de T são caminhos pela porta da frente, enquanto que todos
os caminhos que chegam em T são caminhos pela porta dos fundos. Deste modo, em
relação à variável T, há dois caminhos pela porta da frente: T → D e T → M → D
e três caminhos pela porta de trás, chegando de F, C e H. Caminhos pela porta da
frente podem ser causais ou não causais, enquanto caminhos pela porta de trás são
sempre caminhos não causais, que podem transmitir associações espúrias2 .
O DAG é bastante útil para nos ajudar a realizar inferência causal, pois é possı́vel
se identificar caminhos pela porta da frente (causais e não causais) e caminhos pela
porta de trás (não causais). Uma das grandes dificuldades para se realizar inferência
causal é que os dados transmitem associações, tanto causais como não causais. Quando
desejamos estudar causa, estamos apenas interessados em isolar associações causais e
descartar associações espúrias. Quando estimamos associação entre duas variáveis, há
uma mistura de componentes causais e espúrios. Ficou famoso em estatı́stica o célebre
aforismo de que detectar uma associação não significa detectar uma relação causal.
A grande pergunta para se realizar inferência causal é se é possı́vel separar causa de
associação. Durante muitos anos o objetivo da estatı́stica foi estimar associações a
partir dos dados, deixando as considerações causais para uma etapa posterior, baseada
no raciocı́nio. Será que é possı́vel se separar associação de causa? Será que é possı́vel
retirar o componente espúrio da associação e medir causa? Para Judea Pearl isto não
só é possı́vel como é desejável (Pearl, 2009a). Entretanto, para podermos fazer isto
é necessário termos uma sólida teoria, que possa embasar o conhecimento prévio a
respeito de uma pergunta cientı́fica. Com base no conhecimento prévio, codificamos
estas informações qualitativas em um DAG e, a partir dele, isolamos o componente
espúrio da associação e medimos causa. Entretanto, para que a estimativa resultante
reflita mesmo causa, a nossa teoria e os nossos pressupostos precisam estar corretos.
Entretanto, nunca podemos saber se os nossos pressupostos estão corretos, pois eles
não são inteiramente testáveis. Assim, todo processo de realizar inferência causal é um
processo de tentativa e erro e todas as estimativas sempre são falsificáveis e sujeitas a
nova verificação empı́rica. Veremos, a seguir, como identificar o componente espúrio da
associação em um DAG e nos aproximarmos da medida da causa.

2 veremos,a seguir, que os caminhos pela porta de trás só transmitem associações espúrias se não
estiverem bloqueados.

63
5. Gráficos Acı́clicos Direcionados (DAGs)

5.3. Estruturas de associação


Três estruturas ou fontes de associação são encontradas quando vamos investigar
causalidade: cadeia, garfo e garfo invertido. É importante detectar estas estruturas
graficamente pois, para cada uma delas, teremos uma decisão a tomar (intervir ou não
intervir no sistema) para se identificar o efeito causal. Veremos, a seguir, cada uma
destas estruturas e qual decisão precisaremos tomar na presença de cada uma delas.

• Cadeia
• Garfo
• Garfo invertido

5.3.1. Cadeia
A estrutura de cadeia que indica mediação. No exemplo da figura 5.2, a variável de
tratamento (T) tem efeito causal no desfecho (D), por intermédio da variável mediadora
(M). Nesta estrutura, a associação marginal3 identifica o efeito causal de T em D. Se
condicionarmos (ajustarmos)4 por M, criaremos viés. Vamos supor que T e D sejam
variáveis dicotômicas, e que indivı́duos expostos ao tratamento T=1 tenham maior
probabilidade de desenvolver o desfecho D=1. Se ajustarmos pelo mediador M, todo o
efeito causal de T em D desaparece, pois o único caminho causal de T para D passa
por M. A associação condicional5 em M bloqueia o fluxo de associação causal, que
flui pela porta da frente, e faz sumir o efeito causal, enquanto a associação marginal
identifica, sem viés, o efeito causal de T em D. Desta forma, diante de uma estrutura
de cadeia, indicadora de mediação, não há nenhuma intervenção a fazer no gráfico, ou
seja, não é necessário realizar ajuste estatı́stico. Isto vai ao encontro do que já se sabia
da epidemiologia clássica, que não se deve ajustar para mediador, quando se deseja
estimar o efeito total de uma variável em outra (Rothman et al., 2008; Gordis, 2014).
Se ajustarmos para um mediador criaremos viés de sobrecontrole (Elwert, 2013).

Figura 5.2.: Estrutura de cadeia representando mediação

T M D

T=tratamento; D=desfecho; M=mediador

Vejamos agora um exemplo simples de uma estrutura simplificada de cadeia em um


DAG. No DAG da figura 5.3 há 4 nós, representando quatro variáveis e 4 setas, exibindo
3 associação marginal ou não condicional é a associação entre duas variáveis sem ajuste para variáveis
de confundimento, ou seja, a associação bruta.
4 em epidemiologia o termo ajuste é mais utilizado do que condicionamento.
5 associação condicional é a associação entre duas variáveis com ajuste para variáveis de confundimento,

ou seja, a associação ajustada.

64
5.3. Estruturas de associação

quatro efeitos causais. A variável de exposição é violência na gravidez, representada


pelo botão de play e a variável desfecho é nascimento pré-termo, representada pelo
botão de stop. Assumimos as seguintes relações de dependência entre as variáveis:
violência na gravidez tem um efeito causal direto no nascimento pré-termo e também
um efeito causal indireto no nascimento pré-termo, por meio de uma estrutura de
cadeia: a violência na gravidez gera stress, que altera os nı́veis séricos de cortisol que,
por sua vez, leva a nascimento pré-termo. Neste DAG, por simplificação didática, não
incluı́mos confundidores. Para se identificar o efeito causal total da violência na gravidez
no nascimento pré-termo não ajustarı́amos para nenhuma das variáveis da cadeia. Se
o ajuste para stress fosse realizado, pelo menos parte do efeito total da violência na
gravidez no nascimento pré-termo desapareceria, e estarı́amos subestimando o efeito
da violência durante a gravidez no nascimento pré-termo. O uso do DAG nos ajuda
a visualizar de forma bem clara estas relações de dependência, identificar potenciais
ajustes necessários e descartar ajustes desnecessários e prejudiciais para a identificação
do efeito causal.

Figura 5.3.: Cadeia - mediação

5.3.2. Garfo

Figura 5.4.: Estrutura de garfo representando causa comum - viés de confundimento

T=tratamento; D=desfecho; C=confundidor

A estrutura de garfo indica viés de confundimento. No DAG da figura 5.4, a existência


da causa comum C, do tratamento T e do desfecho D, faz com que T e D se associem
marginalmente, independentemente da existência ou não de efeito causal de T em D.

65
5. Gráficos Acı́clicos Direcionados (DAGs)

Desta forma, mesmo que não haja efeito causal de T em D, T e D estarão marginalmente
associados, em virtude da causa comum C que, neste caso, cria uma associação espúria
entre T e D. Assim, para bloquear o fluxo de associação espúria entre T e D, em
virtude desta causa comum C, é necessário se realizar uma intervenção no sistema,
condicionando para C. A associação marginal entre T e D está contaminada pelo viés de
confundimento, e só a associação condicional é capaz de identificar o efeito causal de T
em D. Vimos que a associação flui nos dois sentidos, independentemente da direção da
seta, enquanto a causa só flui na direção da seta. Assim, o efeito causal entre T e D flui
pela porta da frente, no sentido T → D, enquanto a associação espúria flui pela porta
dos fundos, no sentido T ← C → D. A associação espúria flui sem respeitar a direção
da seta, enquanto a causa flui sempre respeitando a direção da seta. Assim, o viés
de confundimento, em uma definição gráfica, estrutural, é definido como a existência
de uma causa comum do tratamento T e do desfecho M. Se houver caminho aberto
pela porta dos fundos, o fluxo de associação espúria de T para D via C enviesa a
estimativa do efeito causal. Desta forma, para se identificar o efeito causal na estrutura
de garfo é necessário condicionar, ou seja, ajustar para a causa comum C. A associação
condicional fecha a porta dos fundos que estava aberta e bloqueia o fluxo de associação
retrógrado entre T e D, deixando livre apenas o fluxo anterógrado da associação causal,
pela porta da frente. Na figura 5.5, ilustramos o condicionamento para C (um quadrado
desenhado em volta de C indica condicionamento), que é necessário para remover o
viés de confundimento em uma estrutura de garfo.

Figura 5.5.: Estrutura de garfo ilustrando condicionamento para causa comum, ne-
cessário para remover viés de confundimento

T=tratamento; D=desfecho; C=confundidor


O quadrado desenhado em volta de C indica condicionamento

Vejamos agora um exemplo simples para ilustrar o conceito da estrutura de garfo, que
representa viés de confundimento. Imaginemos que desejamos realizar um estudo para
avaliar a qualidade do atendimento prestado em Unidades de Tratamento Intensivo.
Um dos indicadores desta avaliação seria a taxa de mortalidade nas UTIs. Assim,
desejamos saber se há efeito causal do desempenho operacional (estrutura e processos
de trabalho) no resultado (mortalidade). Ao se comparar várias UTIs, observamos
que há grande variação na taxa de mortalidade entre as unidades, sugerindo que a

66
5.3. Estruturas de associação

Figura 5.6.: Garfo - confundimento

variável UTI esteja associada com a taxa de mortalidade. Entretanto, há uma causa
comum, que é a gravidade do paciente, que causa internação na UTI e também causa
mortalidade. O nosso conhecimento das relações de dependência entre estas variáveis
estão expressos no DAG da figura 5.6. Assim, para identificarmos o efeito causal da
UTI na mortalidade, precisamos fechar o fluxo de associação, que está passando pelo
caminho aberto pela porta de trás, que parte da variável de exposição UTI, viaja
no sentido contrário da seta pela gravidade do paciente6 e daı́ se transmite para a
mortalidade. Desta forma, para identificarmos o efeito causal da variável UTI na taxa
de mortalidade, precisamos ajustar (condicionar) para a variável gravidade do paciente.
Desta forma, numa estrutura de garfo, apenas a associação condicional entre a exposição
e o desfecho estima o efeito causal, enquanto a associação marginal está enviesada pelo
confundimento.

5.3.3. Garfo Invertido


A estrutura de garfo invertido representa efeito comum. No DAG da figura 5.7, a
variável colisora C é um efeito comum, tanto do tratamento, quanto do desfecho. Na
estrutura de garfo invertido, que reflete efeito comum, a associação marginal (não
ajustada) identifica o efeito causal de T em D. Se ajustarmos para o colisor C será
aberto um fluxo espúrio de associação, de T para D, que estava fechado pelo colisor, e
será induzido viés de colisão (Figura 5.8). Ou seja, a associação condicional a C cria
uma falsa associação entre T e D, se T e D forem marginalmente independentes. O
viés de colisão é uma outra denominação do viés de seleção, tal como conhecido em
epidemiologia (Rothman et al., 2008; Gordis, 2014), que é causado pela maneira como
se seleciona os indivı́duos para o estudo, ou por perdas após a seleção.
Na figura 5.9, demonstramos um exemplo clássico de viés de colisão. Sabemos que
as variáveis desempenho esportivo e notas altas na escola não estão associadas na
população de estudantes pré-universitários. Dito de outra maneira, ter bom desempenho
esportivo não causa notas altas na escola. Sabemos, também, que as universidades
6 vimos anteriormente que o fluxo de associação espúria não respeita o sentido da seta, enquanto o
fluxo de associação causal se transmite sempre no sentido da seta. A seta no DAG significa que
pressupomos haver efeito causal entre duas variáveis a partir da nossa teoria.

67
5. Gráficos Acı́clicos Direcionados (DAGs)

Figura 5.7.: Estrutura de garfo invertido representando efeito comum com colisor

T=tratamento; D=desfecho; C=colisor

Figura 5.8.: Estrutura de garfo invertido representando viés de colisão

T=tratamento; D=desfecho; C=colisor


O quadrado desenhado em volta de C indica condicionamento
A linha interrompida conectando T e D indica associação espúria,
induzida por condicionamento indevido por um colisor

costumam oferecer bolsas de estudo para alunos com bom desempenho esportivo ou
com altas notas na escola. Entretanto, se selecionarmos para a nossa pesquisa apenas os
candidatos que obtiveram bolsas de estudo na universidade, estarı́amos condicionando
para um efeito comum (colisor). Neste subgrupo selecionado de alunos agraciados
com bolsa de estudo, observarı́amos uma associação negativa entre bom desempenho
esportivo e notas altas na escola. Assim, se entrevistássemos um determinado aluno e ele
nos informasse que não tem bom desempenho esportivo, automaticamente deduzirı́amos
que ele deveria ter tido notas altas na escola. Apesar de bom desempenho esportivo e
notas altas na escola não estarem marginalmente associados na população geral, ao
condicionarmos para uma variável colisora, abre-se um fluxo espúrio de associação
entre desempenho esportivo e notas altas na escola, fluxo este que estava fechado pelo
colisor. O conhecimento do efeito comum (seleção apenas no subgrupo dos agraciados
com bolsa de estudo) nos facilita saber a causa do recebimento da bolsa de estudo.
Assim, dentre os alunos que recebem bolsa, quem tem bom desempenho esportivo não

68
5.3. Estruturas de associação

deve ter tido notas altas na escola e vice-versa, criando uma associação condicional
negativa entre estas variáveis e induzindo viés, chamado viés de colisão (seleção).

Figura 5.9.: Estrutura de garfo invertido representando viés de colisão

Desempenho esportivo

Bolsa de estudo

Notas altas na escola

O quadrado desenhado em volta de Bolsa de estudo


indica condicionamento.
A linha interrompida conectando Desempenho esportivo
e Notas altas na escola indica associação espúria,
induzida por condicionamento indevido por um colisor.

Assim, quando existir uma variável colisora no caminho, este se encontra fechado e
não transmite associação espúria. Entretanto, se condicionarmos (ajustarmos) para o
colisor este caminho se abrirá e criaremos uma associação espúria entre variáveis que,
antes do ajuste, eram marginalmente independentes. Condicionar por uma variável
colisora, que reflete efeito comum, implicaria permitir que o futuro interferira no
passado. Note que, neste exemplo, este fluxo espúrio de associação sai pela porta da
frente, da variável tratamento em direção à variável colisora, mas depois retorna pela
porta dos fundos, que parte da variável colisora em direção à variável que mede o
desfecho. Entretanto, este fluxo espúrio de associação só transitará se realizarmos,
inadequadamente, ajuste para o colisor.
Na figura 5.10 está representada outra estrutura de garfo invertido, demonstrando
efeito com colisor C e descendente de colisor DC. O colisor C é um efeito comum, tanto
do tratamento T, quanto do desfecho D. O colisor C é causa de DC, que é descendente
do colisor. Da mesma forma que em uma estrutura de garfo invertido, que representa
efeito comum, não se condiciona para um colisor, também não se deve condicionar
para um descendente de colisor. O condicionamento por um descendente do colisor
também abre o fluxo de associação entre T e D que se encontrava fechado pelo colisor.
Provavelmente neste caso, quando ajustamos para o descendente do colisor, o viés de
colisão induzido será de menor magnitude do que quando ajustamos para o próprio
colisor, a depender da magnitude da correlação entre o colisor e o seu descendente.
Quanto maior esta correlação entre o colisor C e seu descendente DC, maior será o viés
de colisão.

69
5. Gráficos Acı́clicos Direcionados (DAGs)

Figura 5.10.: Estrutura de garfo invertido representando efeito comum com colisor e
descendente de colisor

C DC

T=tratamento; D=desfecho; C=colisor; DC=descendente do colisor

5.4. Intervenções necessárias e danosas nas estruturas


de associação

Tabela 5.1.: Estruturas de associação no DAG e necessidade de intervenção

Estrutura Significado Viés Intervenção


Cadeia Mediação Nenhuma Nenhuma
Garfo Causa comum Confundimento Condicionar, se houver
caminho aberto pela
porta de trás
Garfo invertido Efeito comum Nenhumb Nenhuma
a
Se for realizado ajuste para mediador que estiver no caminho causal entre a
exposição e o desfecho será criado viés de sobrecontrole.
b
Na presença de efeito comum, se ajustarmos para um colisor ou descendente de
colisor será criado viés de colisão (seleção).

Na tabela 5.1, demonstramos as estruturas de associação no DAG, seu significado, se


há transmissão de viés e se há necessidade de intervenção.
Em resumo, a estrutura de cadeia demonstra a presença de mediação. Nesta estrutura,
não há nenhuma intervenção a fazer. A associação marginal identifica o efeito causal
de T em D.
A estrutura de garfo demonstra a presença de uma causa comum. Nesta estrutura,
na qual está presente um confundidor, há intervenção a fazer. A associação marginal
não identifica o efeito causal de T em D. Será necessário condicionar para a causa
comum, se houver caminho aberto pela porta dos fundos. Neste caso, só a associação
condicional identificará o efeito causal de T em D.
A estrutura de garfo invertido demonstra a presença de efeito comum. Nesta estrutura,

70
5.5. DAG como um sistema de equações estruturais não paramétricas

na qual está presente um colisor ou descendente de colisor, não há nenhuma intervenção
a fazer. A associação marginal identifica o efeito causal de T em D. Entretanto, se
inadvertidamente for realizado condicionamento pelo colisor ou pelo descendente de
colisor, será criado viés de colisão, o que sabotará a interpretação causal.
O caminho causal é sempre um caminho dirigido, ou seja, as setas fluem sempre
no sentido do exposição para o desfecho, e sempre incluem uma estrutura de cadeia,
com ou sem mediadores: T → D ou T → M → D. Caminhos não causais são sempre
não dirigidos e incluem estruturas de garfo T ← CONFUNDIDOR → D ou de garfo
invertido T → COLISOR ← D. Caminhos que contém colisores (garfo invertido)
encontram-se bloqueados e não transmitem viés, enquanto caminhos que não contém
colisores (garfo) encontram-se abertos e transmitem viés, sendo, por isso, denominados
caminhos enviesados.

5.5. DAG como um sistema de equações estruturais não


paramétricas
Tomemos a estrutura de cadeia representada na figura 5.2. Vimos que uma das formas
de se representar o sistema de relações de dependências e independências causais entre
variáveis é por meio de um DAG. Outra forma de se representar este mesmo sistema é
por meio de um conjunto de equações estruturais não paramétricas. Na figura 5.11,
representamos a estrutura de cadeia da figura 5.2, incluindo os termos de erro (aqui
denominados U7 ) que, por simplificação, são normalmente omitidos no DAG. Quando o
DAG é representado com os termos de erro, dizemos que o DAG está sob magnificação.
Cada relação de dependência causal pode ser descrita por uma equação não paramétrica,
na qual não se fazem pressupostos a respeito da distribuição ou da forma funcional das
relações entre as variáveis.

Figura 5.11.: DAG sob magnificação representando estrutura de cadeia com os termos
de erro

UT UM UD

T M D

T = fT (UT ) (5.3)
7 variáveis
não mensuradas são usualmente representadas no DAG pela letra U, do inglês unknown.
Os termos de erro, como também não são mensurados, são também usualmente representados pela
letra U.

71
5. Gráficos Acı́clicos Direcionados (DAGs)

M = fM (T, UM ) (5.4)

D = fD (M, UD ) (5.5)

Assim, na equação 5.3, a variável T é descrita por meio de uma função não especificada
fT , com apenas um argumento, UT , que é o termo de erro, já que nenhuma outra
variável possui relação de dependência com T. Na equação 5.4, a variável M é descrita
por meio de uma função não especificada fM , com dois argumentos, T e UM . Da mesma
forma, na equação 5.5, a variável D é descrita por meio de uma função não especificada
fD , também com dois argumentos, M e UD . Assim, a variável desfecho D é uma função
não especificada de uma variável observada, o mediador M, e do seu termo de erro não
observado, UD , os quais transmitem seus efeitos causais em D, por meio da função fD .
Observe que cada seta hipotetizada no DAG representa um argumento da função não
restrita de cada equação. Assim, esta função não restrita pode ser depois definida como
linear, quadrática, incluir interações ou qualquer outra função não linear.
Com isto demonstramos que o DAG é equivalente a um sistema de equações não
paramétricas. Assim, todo DAG tem embutido este sistema de equações, que não
apresenta qualquer restrição em relação à distribuição das variáveis ou à forma funcional
da relação entre as variáveis no sistema. A única restrição são as relações de dependências
e independências causais, codificadas no diagrama por meio de setas. Assim, no DAG
sob magnificação da figura 5.11, não foi assumida relação de dependência causal direta
entre T e D, de forma que há uma restrição colocada no diagrama: todo o efeito causal
de T em D é indireto e transmitido via M. Não há efeito causal direto de T em D.
Outro ponto importante a destacar é que no DAG, por se tratar de um sistema não
paramétrico, no qual a função que liga as variáveis não está explicitada, potenciais
interações poderão também ser incluı́das nesta função. Assim, não há necessidade de se
incluir no DAG interações entre variáveis, pois elas são implicitamente permitidas pela
falta de restrições colocadas na função (Morgan and Winship, 2015). A especificação
das interações será feita posteriormente, no momento da estimação do efeito causal.

5.6. Separação direcional


Vimos que o DAG é um diagrama utilizado para se desenhar as relações de dependência
e independência entre as variáveis em um sistema. O DAG é, por natureza, uma
ferramenta populacional, ou seja, para todos os efeitos não há a questão de que uma
associação possa ter acontecido ao acaso. Desta forma, não precisamos nos preocupar
com erros padrão ou intervalos de confiança. Assim, quando desenhamos uma seta e
atribuı́mos uma relação de dependência causal, assumimos que isto seja válido para a
população de interesse.
Quando observamos associação entre duas variáveis, este fenômeno pode ter várias
explicações: acaso, viés de aferição (mensuração), viés de confundimento, viés de seleção

72
5.6. Separação direcional

(colisão) ou efeito causal. Uma das tarefas da epidemiologia é separar cada uma destas
explicações e verificar se a associação observada pode ser devida a um efeito causal.
De acordo com o pressuposto causal de Markov, descartando-se o acaso, to-
das as associações não condicionais (marginais) surgem de relações causais
ancestrais. Este pressuposto afirma que uma determinada variável V é independente
de qualquer outra variável no DAG, se condicionarmos por todas as suas causas diretas
(ancestrais ou pais), exceto os seus efeitos (descendentes). Isto é a mesma coisa que
afirmar que, descartando-se os efeitos de V, toda a informação probabilı́stica acerca
de V pode ser obtida a partir das suas causas diretas. Ou, dito de outra forma, uma
determinada variável V é independente dos seus não descendentes após ajuste para os
seus ancestrais.
Assumindo-se que o pressuposto causal de Markov será verdadeiro, são duas as fontes
que geram associações marginais entre a exposição e o desfecho8 : efeito causal, viés
de confundimento ou uma mistura das duas situações (Glymour and Greenland, 2008;
Pearl et al., 2016). Por outro lado, uma associação condicional entre a exposição e o
desfecho pode ser criada, como vimos anteriormente, se ajustarmos, inadvertidamente,
para um colisor ou descendente de colisor, produzindo-se viés de colisão. O pressuposto
causal de Markov afirma que uma associação marginal não pode ser produzida por
efeitos da variável em questão, mas apenas por suas causas.
Viés, numa definição gráfica, é entendido como uma associação estrutural entre o
tratamento e o desfecho que não se deve a um efeito causal. Assim, em um DAG é
possı́vel, se o nosso conhecimento a respeito de uma problema for verdadeiro e completo,
identificar viés de confundimento e evitar viés de colisão, como resumido na tabela
5.1. Viés de confundimento, numa definição estrutural, é aquele que surge quando há
uma causa comum do tratamento e do desfecho, e existe caminho aberto pela porta
dos fundos, que sai da variável de tratamento para a variável desfecho. O viés de
colisão surge quando se realiza um condicionamento para um colisor ou descendente
de colisor, abrindo-se, então, um caminho pela porta da frente ou de trás, que se
encontrava fechado pelo colisor. Assim, o viés de confundimento surge a partir dos
dados, mas o viés de colisão pode ser causado por uma intervenção do pesquisador, ao
condicionar, inadvertidamente, por um efeito comum9 . Desta forma, é importante se
desenhar um DAG com o nosso problema, codificado enquanto um sistema de relações
de dependência e independência causal entre variáveis, representado por meio de um
sistema de equações estruturais não paramétricas. No DAG será, então, possı́vel verificar
se o efeito causal é identificável, a partir das variáveis observadas e dos pressupostos
contidos no diagrama. Ou seja, desenhamos o DAG para verificar se é possı́vel se
identificar o efeito causal. Caso positivo, usamos o DAG para selecionar um conjunto
mı́nimo de variáveis de ajuste para confundimento, que feche todos os caminhos abertos
pela porta de trás entre a exposição e o desfecho e que não abra caminhos que já
estejam fechados por colisores. Também é importante que não seja realizado ajuste
para variável(is) mediadora(s) ou para outras variáveis descendentes do tratamento10 .
8 excluindo-se o acaso e viés de aferição, que não são relações causais ancestrais
9O viés de colisão também pode ser causado por perdas de seguimento. Neste caso o viés de colisão
não depende de uma intervenção no sistema feita pelo pesquisador
10 porque não se deve ajustar para descendentes do tratamento será explicado com pormenores na

73
5. Gráficos Acı́clicos Direcionados (DAGs)

Para se identificar o efeito causal é necessário controlar para todas as causas comuns
e assumir que não haja alguma causa comum que tenha sido omitida no DAG. Este é
um pressuposto muito forte e vários crı́ticos desta abordagem apontam que é impossı́vel
se incluir todas as causas comuns do tratamento e do desfecho em um DAG porque,
quase sempre, o nosso conhecimento a respeito de um problema é imperfeito. Assim,
o sistema codificado em um DAG será mais válido quanto mais completo for o nosso
conhecimento a respeito de uma questão. Um dos motivos apontados para o fato dos
DAGs ainda serem pouco utilizados na pesquisa epidemiológica é o grau de incerteza
sobre os processos causais que produzem os dados (Cortes et al., 2016).
Quando adicionamos uma variável (nó) em um DAG, não está especificada a forma
como esta variável será mensurada ou de qual tipo de variável se trata (nominal, ordinal,
binária, discreta, contı́nua). Da mesma forma, não definimos qual a distribuição das
variáveis (se normal, Poisson, exponencial, hipergeométrica ou outra). Como vimos
anteriormente, também não é definida a função de dependência entre as variáveis: se
linear ou qualquer outra. No DAG se define uma função não restrita, que pode assumir
qualquer forma funcional. O DAG codifica uma informação que é apenas qualitativa.
Portanto, o DAG não serve para estimação, mas é importante, como dito acima, para
verificar se é possı́vel se identificar o efeito causal a partir dos dados observados e
derivar as implicações testáveis do modelo causal.
Uma vez construı́do o DAG, assumindo-se que os pressupostos nele contidos sejam
verdadeiros, e que seja possı́vel se identificar o efeito causal com base nas variáveis obser-
vadas, como identificar um conjunto mı́nimo de variáveis de ajuste para confundimento?
Como derivar as implicações testáveis do modelo causal?
A grande questão é que é mais fácil se identificar as estruturas de associação mais
simples, cadeia, garfo e garfo invertido, em diagramas simplificados. O problema é
que, na maioria das vezes, os problemas que estudamos na vida real são complexos.
Dessa forma, quando desenhamos um DAG estas estruturas se misturam e aı́ fica
complicado selecionar um conjunto mı́nimo de variáveis de ajuste para confundimento.
Como proceder então?

5.6.1. Separação direcional incondicional


Neste ponto entra o conceito de separação direcional (d-separation). A partir da
aplicação de regras gráficas, é possı́vel identificar se duas variáveis estão direcionalmente
separadas (d-separated) ou direcionalmente conectadas (d-connected). Duas variáveis
estão direcionalmente separadas se todos os caminhos entre elas estiverem
bloqueados. Duas variáveis estão direcionalmente conectadas quando há
pelo menos um caminho aberto entre elas. Se duas variáveis estão direcionalmente
separadas elas são independentes, caso contrário, ou seja, se estão direcionalmente
conectadas, são, muito provavelmente, dependentes (Pearl et al., 2016). Estas regras
gráficas de separação direcional permitem deduzir independências entre variáveis
implicadas pelo diagrama, conforme explicitado a seguir.
Se houver qualquer caminho conectando duas variáveis, e este caminho não estiver
seção sobre o critério da porta de trás.

74
5.6. Separação direcional

bloqueado por um colisor, estas variáveis estão direcionalmente conectadas. Pela regra
da fidelidade fraca, weak faithfullness, se o gráfico estiver correto, estas duas variáveis
devem, provavelmente, estar marginalmente associadas. Se adotarmos a regra da fide-
lidade, faithfullness, dirı́amos que variáveis direcionalmente conectadas estão
marginalmente associadas. Geralmente é prudente adotar a regra da fidelidade
fraca, pois há alguns casos raros nos quais exceções à regra da fidelidade acontecem.
Por exemplo, se o fumo tem efeito negativo na saúde e na prática de atividade fı́sica, e
a prática de atividade fı́sica tem efeito positivo na saúde, o fumo tanto direta como
indiretamente tem efeitos negativos na saúde. Dizemos que a população é fiel ao gráfico
que gerou estas relações. Mas, por outro lado, se o fumo tivesse efeito positivo na
prática de atividade fı́sica, terı́amos um efeito direto negativo e um efeito indireto
positivo do fumo na saúde, que poderiam se cancelar e no final o fumo não teria efeito
na saúde (Figura 5.12). Neste caso a população seria infiel ao gráfico que gerou esta
distribuição. De acordo com Scheines, assumir que a população é fiel é admitir que
quaisquer independências que ocorram entre variáveis em um DAG são consequência
do pressuposto causal de Markov e não do acaso (Scheines, 1997). A regra da fidelidade
descarta cancelamento perfeito de efeitos positivos e negativos.

Figura 5.12.: Exceção à regra da fidelidade - efeitos direto e indireto do fumo na saúde
se cancelariam

Fumo
+

- Atividade fı́sica

+
Saúde

Fonte: (Scheines, 1997).

Por outro lado, se todos os caminhos entre duas variáveis estiverem bloqueados por
colisores, elas estão direcionalmente separadas. Neste caso, pelo pressuposto causal
de Markov, elas são marginalmente independentes. Um resumo dos pressupostos das
regras gráficas de separação direcional está ilustrado na tabela 5.2.

5.6.2. Separação direcional condicional


Duas variáveis também poderão ser direcionalmente conectadas por intervenção do
pesquisador, ao se condicionador por colisor ou descendente de colisor. Duas variáveis
poderão também ser direcionalmente separadas por intervenção do pesquisador, ao se
condicionar pela variável mediadora na estrutura de cadeia, ou pela causa comum na
estrutura de garfo.

75
5. Gráficos Acı́clicos Direcionados (DAGs)

Tabela 5.2.: Pressupostos da regras gráficas de separação direcional

Pressuposto Consequência
Pressuposto causal Uma determinada variável V é independente de quaisquer
de Markov outras variáveis (seus não descendentes), se condicionar-
mos por todas as suas causas diretas (ancestrais), exceto
os seus efeitos (descendentes)

Fidelidade Variáveis direcionalmente conectadas estão marginal-


mente associadas

Fidelidade fraca Variáveis direcionalmente conectadas devem, provavel-


mente, estar marginalmente associadas

Na tabela 5.3 estão listadas as cinco regras gráficas de separação direcional, que são
derivadas das três estruturas simples de associação descritas na tabela 5.1 (Hernan, 2002).
Para simplificar, vamos assumir que existe apenas um caminho entre duas variáveis. As
duas primeiras regras são de separação incondicional. A regra número 1 afirma que, sem
ajuste, um caminho está aberto se nele não houver colisor. A consequência desta regra é
que as variáveis estão direcionalmente conectadas, produzindo provavelmente associação
marginal entre elas, adotando-se a regra da fidelidade fraca11 . A regra número 2 diz
que um caminho está bloqueado se duas setas colidem em um nó. A consequência
desta regra é que, se o colisor bloqueia o caminho, as variáveis estão direcionalmente
separadas e, consequentemente, são marginalmente independentes.
As regras 3, 4 e 5 refletem separação condicional. A regra número 3 afirma que
qualquer caminho que tenha sido ajustado para um não colisor está bloqueado (isto
acontece quando se ajusta para a variável do meio em estrutura de cadeia ou para a causa
comum em estrutura de garfo). A consequência desta regra é que as variáveis foram
direcionalmente separadas por meio de ajuste, realizado por intervenção do pesquisador
no sistema, ficando, assim, condicionalmente independentes. A regra número 4 diz que o
ajuste para colisor abre o caminho (isto acontece quando se ajusta para o efeito comum
em estruturas de garfo invertido). Assim, a sua consequência é que as variáveis foram
conectadas pela intervenção do pesquisador e ficaram associadas condicionalmente. A
regra número 5, derivada da regra número 4, diz que o ajuste para descendente do
colisor também abre o caminho (isto acontece quando se ajusta para um descendente
do efeito comum em estruturas de garfo invertido). Assim, a sua consequência é que
as variáveis também foram conectadas pela intervenção do pesquisador, sendo criada
associação condicional entre elas. É bom ressaltar que todas estas consequências se
aplicam em expectativa, se a estrutura causal representada pelo DAG estiver correta.
Em resumo, um caminho entre duas variáveis estará bloqueado por um conjunto de
variáveis V se:
11 assumindo-se faithfullness (fidelidade), que é um pressuposto forte, dirı́amos que se duas variáveis
estão direcionalmente conectadas, elas também estão estatisticamente associadas

76
5.6. Separação direcional

Tabela 5.3.: Regras gráficas de separação direcional

Número Regra Consequência


SEPARAÇÃO INCONDICIONAL
1 Na ausência de ajuste, um caminho Variáveis direcionalmente conec-
está aberto se não houver colisor tadas - Associação marginal

2 Na ausência de ajuste, um caminho Variáveis direcionalmente separa-


está bloqueado se duas setas colidem das - Independência marginal
em um nó

SEPARAÇÃO CONDICIONAL
3 Qualquer caminho que tenha sido Variáveis direcionalmente sepa-
ajustado para um não colisor está radas por intervenção - Inde-
bloqueado pendência condicional

4 Ajuste para colisor abre o caminho Variáveis direcionalmente conec-


tadas por intervenção - Asso-
ciação condicional

5 Ajuste para descendente do colisor Variáveis direcionalmente conec-


abre o caminho tadas por intervenção - Asso-
ciação condicional

1. O caminho contém uma cadeia A → B → C ou um garfo A ← B → C, e o nó


do meio (B) esteja em V (ou seja, foi feito ajuste pela variável do meio B);
2. O caminho contém um colisor A → B ← C, e B não está em V e nenhum
descendente de B está em V.

Em conclusão, se duas variáveis estão direcionalmente conectadas ou separadas


em um DAG vai depender de dois fatores: da estrutura do mecanismo de geração
de dados codificadas no diagrama causal e também das ações de condicionamento
(intervenções ou ajustes) realizadas no sistema pelo pesquisador. Vimos que a única
fonte de associação marginal entre variáveis é a existência de caminhos abertos en-
tre elas provocados por estruturas de cadeia ou de garfo (pois estruturas de garfo
invertido contém colisores e caminhos que contém colisores se encontram fechados por
definição). Na ausência de caminhos abertos entre elas, duas variáveis são
marginalmente independentes.
Condicionar significa filtrar por uma condição, incorporar alguma informação da
variável na análise. Pressupõe que tenha sido realizada uma estratificação perfeita
por uma ou mais variáveis. Assim, se condicionarmos por uma variável, estimaremos
o efeito causal nos subgrupos ou nas categorias daquela variável. São estratégias

77
5. Gráficos Acı́clicos Direcionados (DAGs)

de condicionamento: restrição, pareamento, estratificação, subclassicação, regressão


ponderada e ajuste em modelo estatı́stico de regressão. Quando há perdas ou recusas,
isto também equivale a uma estratégia de condicionamento, já que será estudado
apenas um subconjunto do todo, ou seja, também se estará filtrando por uma condição,
participação no estudo, ainda que involuntariamente (Elwert, 2013).
Na figura 5.13 vemos uma situação em que A e D estão ligados pelo caminho A
→ B ← C → D. Vemos que estas variáveis estão direcionalmente separadas, pois o
caminho está bloqueado pelo colisor B. Em consequência, A e D são marginalmente
independentes.

Figura 5.13.: Separação Direcional entre A e D pelo colisor B

A C D

No diagrama estão codificadas as seguintes independências marginais e condicionais:


A ⊥ D, leia-se A é marginalmente independente de D
A ⊥ C, leia-se A é marginalmente independente de C
B ⊥ D | C, leia-se B é independente de D, condicional a C

Na figura 5.14 está representada uma conexão direcional entre A e D. Apesar do


caminho A → B ← C → D conter o colisor B, o ajuste para este colisor abriu este
caminho (o quadrado em volta de B significa que foi realizado ajuste para esta variável)
e, com esta intervenção, agora A e D não mais estão direcionalmente separados. Neste
exemplo ilustramos uma situação em que a conexão direcional é induzida por uma
ação realizada pelo pesquisador, ao condicionar por um colisor, que estava bloqueando
o único caminho, A → B ← C → D, existente entre A e D. Como consequência,
assumindo-se fidelidade fraca, A e D agora ficaram, provavelmente, condicionalmente
associados.

Figura 5.14.: Conexão Direcional entre A e D por meio de condicionamento pelo colisor
B

A C D

O quadrado desenhado em volta de B indica condicionamento

Na figura 5.15 há dois caminhos entre A e D. O caminho A → B ← C → D está


fechado pelo colisor B. O outro caminho, A ← E → C → D contém a causa comum E,

78
5.6. Separação direcional

que simultaneamente age em A e em C. Em virtude desta causa comum E, o fluxo de


associação entre A e D está aberto neste caminho. Por meio do fluxo deste caminho, A
e D estão, portanto, direcionalmente conectados. Como consequência, assumindo-se
fidelidade fraca, A e D são, provavelmente, marginalmente associados. No diagrama
estão codificadas as seguintes independências condicionais:
A ⊥ C | E, leia-se A é independente de C, condicional a E
A ⊥ D | E, leia-se A é independente de D, condicional a E
A ⊥ D | C, leia-se A é independente de D, condicional a C
B ⊥ D | C, leia-se B é independente de D, condicional a C
D ⊥ E | C, leia-se D é independente de E, condicional a C
B ⊥ E | A, C, leia-se B é independente de E, condicional a A e C

Figura 5.15.: Conexão Direcional entre A e D por meio da causa comum E (de A e C)

A C D

Na figura 5.16 há também dois caminhos entre A e D. O caminho A → B ← C


→ D está fechado pelo colisor B. O outro caminho, A ← E → C → D contém a
causa comum E, que simultaneamente age em A e em C. Entretanto, neste DAG, foi
realizado ajuste para a causa comum E e, desta forma, o fluxo de associação que fluı́a
livremente de A para D foi fechado. Assim, como os dois caminhos que ligam A e D
estão fechados, o primeiro por um colisor e o segundo por intervenção a partir de ajuste,
A e D estão, agora, direcionamente separados. Consequentemente, agora, A e D são,
condicionalmente, independentes.

Figura 5.16.: Separação Direcional entre A e D por meio do colisor B e de condiciona-


mento por E

A C D

O quadrado desenhado em volta de E indica condicionamento

79
5. Gráficos Acı́clicos Direcionados (DAGs)

5.7. O critério da porta de trás


O conceito de separação direcional ajuda, mas não resolve totalmente a situação quando
se trata da estimação do efeito causal. Para que se possa estimá-lo, a exposição e o
desfecho precisam estar direcionalmente conectados, mas não pode ser de qualquer
forma nem por todos os caminhos. Na realidade, para se estimar o efeito causal,
sem viés, é necessário que todos caminhos causais entre as variáveis de
tratamento (exposição) e desfecho estejam abertos, e que todos caminhos
não causais estejam fechados.
Pearl desenvolveu o critério da porta de trás (backdoor criterion) para determinar
se o condicionamento por um determinado conjunto de variáveis, que denominaremos
de V, será capaz de identificar o efeito causal do tratamento T no desfecho D (Pearl,
2009a; Pearl et al., 2016). O objetivo do condicionamento é bloquear todos os caminhos
abertos pela porta de trás, que estejam gerando associações espúrias, e não bloquear,
inadvertidamente, caminhos pela porta da frente que transmitam causa.
Pelo critério da porta dos fundos, o efeito causal entre o tratamento T e o desfecho
D será identificado, condicionando-se por um determinado conjunto V de variáveis, se:

(a) nenhum elemento do conjunto de ajuste V for descendente do tratamento T;


(b) o conjunto de ajuste V bloqueia todos os caminhos pela porta de trás entre o
tratamento T e o desfecho D.

Assim, o objetivo é identificar um conjunto mı́nimo de variáveis de ajuste que:

1. bloqueie todos os caminhos abertos pela porta de trás entre a exposição e o


desfecho que não contenham colisores;
2. mantenha fechados (não abra inadvertidamente) caminhos pela porta de trás entre
a exposição e o desfecho que contenham colisores ou descendentes de colisores;
3. não contenha mediadores situados entre a exposição e o desfecho, ou descendentes
de mediadores ou quaisquer outros descendentes do tratamento T;

A aplicação deste critério move a pesquisa de uma simples medida de associação


para uma medida de causa, se os pressupostos para inferência causal forem satisfeitos e
a estrutura causal representada pelo DAG esteja correta. O critério da porta de trás
foi desenvolvido para facilitar, na prática, a aplicação destas regras em um sistema
causal de relações, a partir do DAG. O objetivo da aplicação destas regras é identificar
um conjunto mı́nimo de variáveis de ajuste para confundimento, evitar viés de colisão
e evitar a inclusão de mediadores neste conjunto de ajuste. A inclusão de variáveis
desnecessárias, além de ter um risco de provocar viés de colisão, também contribui para
a redução da precisão das estimativas.12
Por definição, todos os caminhos causais saem pela porta da frente, enquanto os
caminhos não causais saem pela porta da frente ou chegam pela porta de trás. Note
12 existem outros critérios gráficos para verificar se é possı́vel se identificar o efeito causal, além do
critério da porta de trás. Dentre outros, o critério de ajuste (Shpitser et al., 2010) e o critério dos
pais do tratamento (Pearl et al., 2016) são dignos de nota.

80
5.8. Identificando o conjunto mı́nimo de variáveis de ajuste para confundimento no DAG

que, pelo critério da porta de trás, o analista só precisa se preocupar com os caminhos
que chegam por esta porta, que começam na seta dirigida para o tratamento T, sendo,
exatamente, porisso que esse critério é assim denominado. Por que o pesquisador não
precisa se preocupar com os caminhos pela porta da frente? Porque, por esta porta
saem caminhos causais, que precisam ser deixados abertos, e também caminhos não
causais, que, ou já se encontram bloqueados por colisores, ou não estão conectados com
o desfecho. Vamos demonstrar estes pontos, de forma bem detalhada, a seguir.
Porque não se dever realizar ajuste para nenhum descendente do trata-
mento T? Porque este ajuste pode ser desnecessário, ou porque ele pode sabotar
uma interpretação causal. Se neste ajuste se incluir um mediador se vai fazer
desaparecer total ou parcialmente o efeito causal. Se se deseja estimar o efeito
total do tratamento no desfecho, não se pode realizar condicionamento por mediadores,
pois o mediador está situado no caminho causal entre T e D. Se este condicionamento
for realizado, o efeito estimado resultante será o efeito direto, ou seja, a parcela da
associação que não se deve ao efeito de mediação. Assim, a parcela do efeito mediado
não será estimada. Entretanto, se se pretende estimar o efeito direto, o ajuste para
mediadores pode ser realizado.
Entretanto, por outro lado, se se incluir neste ajuste um colisor ou descen-
dente de colisor, se vai abrir um caminho não causal pela porta da frente,
já fechado por um colisor (Elwert, 2013). Na figura 5.17 vemos cada uma destas
situações. Inicialmente não devemos ajustar para DT2 , pois esta variável é mediadora,
situada no caminho causal entre T e D. Se ajustarmos para esta variável removeremos
todo o efeito causal de T em D. Se ajustarmos para DT3 , criaremos viés de colisão, pois
DT3 é descendente do colisor DT2 . Esta consequência nefasta é um pouco mais difı́cil
de ser percebida. Para que isto fique mais fácil de ser visualizado, magnificamos o DAG,
mostrando o termo de erro eDT2 , da variável DT2 . Com esta magnificação, vemos que
a variável DT2 é uma variável colisora no caminho T → DT2 ← eDT2 , pois ela tem
duas setas apontadas para ela, uma que parte de T e outra que parte do seu termo
de erro eDT2 . Da mesma forma, se ajustarmos para DT4 ou DT5 , criaremos viés de
colisão, pois DT4 é um colisor no caminho T → DT4 ← X → D e DT5 é descendente
deste colisor. Para finalizar, o ajuste para DT1 é desnecessário mas, se tal ajuste fosse
realizado, não prejudicaria a identificação do efeito causal.

5.8. Identificando o conjunto mı́nimo de variáveis de


ajuste para confundimento no DAG
Retornemos agora ao DAG da figura 5.1. Vamos agora selecionar, neste DAG, qual o
conjunto mı́nimo de variáveis de ajuste para confundimento, para que se possa proceder
à identificação do efeito causal.
A primeira coisa que devemos procurar é se existe algum caminho pela porta de trás
entre a exposição e o desfecho. Podemos observar que há dois caminhos: T ← H → G
→ D e T ← C → E ← A→ D. No primeiro caminho T ← H → G → D não há colisor
e, portanto, este caminho está aberto. Para fechar este caminho é necessário o ajuste

81
5. Gráficos Acı́clicos Direcionados (DAGs)

Figura 5.17.: DAG ilustrando porque não se deve ajustar para descendentes do
tratamento

DT5

DT4
DT3

T DT2 D

DT1 eDT2

Fonte: diagrama adaptado de (Elwert, 2013).

para H (que é causa comum da exposição e do desfecho, ou seja, confundidor) ou para


G (que é descendente do confundidor). Veja que, se bloquearmos o caminho aberto em
qualquer um dos seus pontos (em H ou em G), bloqueamos o fluxo de associação espúria
retrógrado, que flui pela porta dos fundos entre T e D. A transmissão da associação
em um DAG pode ser comparada ao fluxo de água passando por uma tubulação. Se
desejarmos interromper o fluxo de água em uma tubulação, podemos interromper este
fluxo em qualquer ponto do cano, que ele cessará. A mesma coisa também ocorre com
o fluxo de associação em um DAG. Este ponto conceitual é interessante porque, mesmo
se não tivéssemos medido o confundidor H, se tivéssemos mensurado seu descendente
G, o efeito causal poderia ser identificado, realizando-se ajuste para G.
Agora vejamos o segundo caminho T ← C → E ← A→ D. Podemos observar que
este caminho está fechado pelo colisor E. Portanto, nenhuma intervenção precisa ser
feita neste caminho. Para finalizar, então, o conjunto mı́nimo de variáveis de ajuste para
confundimento neste DAG é H ou G. Perceba, também, que não precisamos realizar
nenhum ajuste para F (que é causa somente da exposição) ou para B (que é causa
somente do desfecho). Ajustes para F e B são desnecessários. Ajuste para E é danoso,
pois criaria viés de colisão. Ajuste para A ou C também seriam danosos, pois o caminho
em que eles estão já se encontra fechado pelo colisor E e, se realizássemos o ajuste,

82
5.9. DAG incluindo variáveis não mensuradas

abrirı́amos este caminho e criarı́amos viés de colisão. Ajuste para M também sabotaria
uma identificação causal, porque estarı́amos retirando do sistema parte do fluxo de
associação causal entre T e D, que flui pela porta da frente. Se ajustarmos para M e H,
ou M e G estaremos estimando apenas o efeito causal direto, pois terı́amos removido
do sistema o efeito causal indireto, que flui pelo mediador M. Condicionar por uma
variável no caminho causal entre a exposição e o desfecho causa viés de sobrecontrole
(Elwert, 2013).
É interessante ressaltar que a prática mais comum na epidemiologia atual, de ajustar
por muitas variáveis ao mesmo tempo, pode ser danosa e falhar na tentativa de remover
confundimento, criando viés de sobrecontrole ou de colisão (Elwert, 2013).

5.9. DAG incluindo variáveis não mensuradas


Como no DAG codificamos apenas informações qualitativas e os dados não estão
incluı́dos no diagrama, nele se pode incluir também variáveis não mensuradas, com o
objetivo de verificar se é necessário realizar ajuste para elas. Uma das mais interessantes
conclusões a que podemos chegar, com a ajuda de um DAG, é que se pode descobrir que
não é necessário se realizar ajuste para uma variável não mensurada. Isto pode ocorrer
por vários motivos: a variável pode não ser uma causa comum no modelo teórico, pode
ser uma causa comum em um caminho que já está bloqueado por um colisor, ou pode
ser uma causa comum em um caminho que pode ser bloqueado por meio de ajuste por
um ascendente ou descendente daquela causa comum, contido neste mesmo caminho.
Cada uma destas situações está ilustrada no diagrama causal da figura 5.18, que contém
a variável não observada U.

Figura 5.18.: DAG.

Inicialmente precisamos identificar todos os caminhos pela porta de trás que começam
no tratamento T e terminam no desfecho D. São cinco caminhos, listados abaixo:

83
5. Gráficos Acı́clicos Direcionados (DAGs)

(1) T ← E → F←D
(2) T ← E → C→A→D
(3) T ← E → C←U→A→D
(4) T ← B ← U→A→D
(5) T ← B ← U→C→A→D

Em seguida, precisamos verificar se há algum caminho que esteja bloqueado por um
colisor. Perceba que os caminhos 1 e 3 estão fechados por colisores. O colisor F está
fechando o caminho 1 e o colisor C está fechando o caminho 3. Mostramos novamente
os caminhos, identificando agora, em negrito, os colisores em cada caminho:

(1) T ← E → F←D
(2) T ← E → C→A→D
(3) T ← E → C←U→A→D
(4) T ← B ← U→A→D
(5) T ← B ← U→C→A→D

Há portanto, 3 caminhos pela porta de trás entre a exposição e o desfecho que não
se encontram fechados por colisores: os caminhos 2, 4 e 5. O objetivo agora é encontrar
uma única variável que não seja colisora e que esteja em todos estes caminhos. Assim,
se condicionarmos por esta variável não colisora, o efeito causal é identificável. Observe
que a variável comum a todos estes caminhos é A. Desta forma, se condicionarmos por
A, conseguiremos identificar o efeito causal de T em D. Outra opção seria ajustarmos
por B e E. A variável B fecha os dois últimos caminhos (4 e 5) pela porta dos fundos que
estão abertos, enquanto a variável E fecha o caminho pela porta de trás número 2, que
também está aberto. A partir da aplicação do critério da porta de trás percebemos que
o efeito causal pode ser identificado, às vezes, por múltiplas alternativas de conjuntos
mı́nimos de ajuste. Assim, resta a pergunta: qual conjunto mı́nimo de variáveis de
ajuste escolher? Recomendamos usar de parcimônia, ou seja, selecionar o conjunto com
o menor número de variáveis possı́vel. Outra estratégia é escolher o conjunto mı́nimo de
variáveis de ajuste para confundimento que contenha variáveis mais bem mensuradas,
para se reduzir viés de aferição.
Assim demonstramos que, mesmo colocando uma variável não mensurada no DAG, a
variável U, podemos neste caso ajustar para B ou A (descendentes de U) e conseguiremos
fechar os dois caminhos pela porta de trás que contém U e que ainda não estavam
fechados por um colisor. Se U fosse uma variável observada, terı́amos mais duas opções
mı́nimas de ajuste U e E, ou U e C. Se ajustamos para U, abrimos o caminho 3
(que estava fechado, pois C é um colisor neste caminho) e fechamos os caminhos 4
e 5. Restam abertos os caminhos 2, que estava originalmente aberto, e 3 (que foi
aberto quando ajustamos para U, pois este caminho estava bloqueado pelo colisor C).
Precisamos, então, encontrar variáveis comuns a estes 2 caminhos abertos, para que
possamos fechá-los. Estas variáveis são C ou E. Outra opção poderia também ser A,
mas aı́, ajustar para U e A, já não seria ajuste mı́nimo pois, se ajustarmos apenas por

84
5.10. Identificação e estimação

A já estaremos bloqueando todos os caminhos abertos por não colisores e mantendo
fechados os caminhos bloqueados por colisores.
É importante observar que colisor não é uma propriedade da variável, mas sim do
caminho no qual uma determinada variável se encontra. Assim, veja que C é um colisor
no caminho 3, mas não é colisor no caminho 2.
Há casos em que desenhamos o DAG para descobrir que não é possı́vel identificar o
efeito causal por meio de ajuste por covariáveis, porque uma variável não mensurada
U é necessária para bloquear um dos caminhos abertos pela porta de trás, entre a
exposição e o desfecho (Figura 5.19. Assim, uma vez que isto foi detectado, a solução
seria incluir esta variável em novos estudos e poder, assim, identificar o efeito causal.
Outra alternativa seria utilizar outros métodos para estimação do efeito causal. Uma
revisão destes outros métodos como, por exemplo, o uso de variável instrumental ou de
isolamento de mecanismo pode ser encontrado em Morgan and Winship (2015).

Figura 5.19.: DAG ilustrando situação na qual o efeito causal não é identificável por
meio de ajuste por covariáveis

5.10. Identificação e estimação


Os dados transmitem associações. Entretanto, nós pesquisadores queremos estudar as
causas dos eventos. Isto é difı́cil porque a associação é uma mistura de componentes
causais e não causais. Vimos, anteriormente, que é possı́vel derivar causa a partir
dos dados, se conhecermos a história por trás dos dados, isto é, como eles foram
gerados, desde que os pressupostos teóricos para inferência causal sejam satisfeitos. A
identificação do efeito causal, na qual utilizamos o DAG como uma ferramenta, é um
processo de verificação de se é possı́vel separar causa de associação.
Estimação, por outro lado, é o processo de cálculo do efeito causal, geralmente
realizado em modelos estatı́sticos. É importante ressaltar que o DAG serve apenas para
verificar se é possı́vel identificar o efeito causal, a partir dos pressupostos nele contidos.
Se isto for possı́vel, numa segunda etapa, realizaremos a estimação a partir dos dados.
Se o conjunto de variáveis de ajuste V satisfizer o critério da porta de trás, então o
efeito causal de T em D poderá ser obtido, de forma não paramétrica, utilizando-se a
fórmula de ajuste abaixo:

85
5. Gráficos Acı́clicos Direcionados (DAGs)

X
P (D = d|do(T = t)) = P (D = d|T = t, V = v)P (V = v) (5.6)
v

Na prática, temos dificuldade de usar estimadores não paramétricos, porque traba-


lhamos com amostras pequenas ou porque muitas variáveis são necessárias no ajuste
para viés (Elwert, 2013). Desta forma, usualmente são utilizados modelos paramétricos
restritivos ou semi-paramétricos menos restritivos no processo de estimação (van der
Laan and Rose, 2011; Petersen and van der Laan, 2014). É importante ressaltar que o
DAG, como não contém dados, não serve para estimação, sendo importante distinguir o
DAG de um modelo de regressão. Mas o conjunto das relações causais entre as variáveis
contidos em um DAG pode, em um segundo momento, ser relacionado aos dados e a
distribuições de probabilidade, no processo de estimação, para cálculo do efeito causal.
Se a nossa teoria for verdadeira e verdadeiros forem também os nossos pressupostos,
poderemos dar uma interpretação causal à nossa medida estimada de efeito (figura
5.20).
A forma de condicionamento mais utilizada em epidemiologia é o ajuste em modelos
estatı́sticos de regressão. Este ajuste geralmente produz um condicionamento imperfeito,
que geralmente não bloqueia totalmente os caminhos abertos pela porta dos fundos,
deixando sempre fluir alguma associação residual espúria entre o tratamento e o desfecho
(Elwert, 2013). Além disso, muitos estimadores paramétricos assumem linearidade nas
relações entre as variáveis e ausência de interações, o que geralmente não corresponde à
realidade (Morgan and Winship, 2015).

Figura 5.20.: Identificação e Estimação

Teoria Dados

DAG

Identificação Estimação Interpretação do efeito causal

5.11. Desenhando o DAG no programa DAGitty


Em DAGs complexos, o processo de identificação é complicado e muito trabalhoso.
Identificar todos os caminhos pela porta de trás, verificar quais caminhos contém
colisores, quais caminhos estão abertos, e escolher o conjunto mı́nimo de variáveis de
ajuste para confundimento, que feche todos os caminhos abertos pela porta dos fundos,
consome tempo e é passı́vel de erro. Um algoritmo gráfico manual, que facilita este
processo, está bem descrito em outros trabalhos (Cortes et al., 2016; Shrier and Platt,
2008). Entretanto, não recomendamos este procedimento, porque é laborioso. É mais
prático, fácil, rápido e menos sujeito a erro, utilizar programas que automatizem este

86
5.11. Desenhando o DAG no programa DAGitty

processo de identificação do conjunto mı́nimo de ajuste para confundimento. Existem


vários programas desenvolvidos com este objetivo.
Vamos agora demonstrar como desenhar um DAG e verificar suas implicações
testáveis no programa DAGitty (de domı́nio público, disponı́vel na página http:
//www.dagitty.net/)(Textor et al., 2011). O programa pode ser baixado e executado
no computador ou manuseado on line diretamente no navegador.

Figura 5.21.: Programa DAGitty

Vemos, na figura 5.21, um DAG já desenhado. No DAGitty, todas as variáveis são
representadas por cı́rculos. A variável de exposição ou tratamento (T) é representada
por um botão de play, enquanto a variável resposta ou desfecho (D) é representada por
um botão de stop. O programa usa várias cores para classificar as variáveis e os caminhos.
Todos os caminhos causais aparecem em verde e os caminhos que produzem viés são
marcados em vermelho. Outros caminhos são desenhados em preto. As causas comuns
são destacadas em vermelho. As demais legendas podem ser identificadas na parte
esquerda da figura. No canto superior direito, o programa identifica o(s) conjunto(s)
mı́nimos de ajuste para estimar o efeito total de T em D. Na parte da direita, no centro,
são mostradas as implicações testáveis (independências condicionais). Logo abaixo das
implicações testáveis aparece o código utilizado para gerar o diagrama causal. Este
código pode ser copiado para um programa de processamento de texto, salvo, e depois
colado nesta mesma caixa, caso você queira redesenhar o DAG, sem precisar executar
todos os passos novamente. Quando você colar o novo código, aparecerá nesta caixa a
mensagem Update DAG. Clicando nesta opção, o programa desenhará, novamente, o
DAG.

87
5. Gráficos Acı́clicos Direcionados (DAGs)

Vejamos, rapidamente, como desenhar um diagrama simples no DAGitty. Escolha,


no menu Model, a opção New Model. Aparecerá uma janela solicitando o nome da
variável de exposição: digite Tratamento e tecle em OK. Em seguida, aparecerá outra
janela, solicitando o nome da variável desfecho: digite Desfecho e tecle em OK. Note
que o programa desenha, automaticamente, uma seta do tratamento para o desfecho.
Arraste as duas variáveis para uma melhor posição na tela. Vamos agora incluir uma
variável colisora. Dê um duplo clique no local onde deseja incluir a variável. Surgirá
uma janela, solicitando o nome da nova variável: digite Colisor e tecle em OK. Usando
o mesmo procedimento, inclua duas novas variáveis, A e B, na posição mostrada na
figura 5.22. Agora desenhe as setas conectando as demais variáveis. Para desenhar uma
seta, dê um duplo clique na variável de origem e, a seguir, um duplo clique na variável
de destino. Quando terminar de desenhar o DAG, observe, na janela no canto superior
direito, que nenhum ajuste é necessário para se estimar o efeito total do tratamento no
desfecho. Você acabou de desenhar um exemplo de estrutura de associação de garfo
invertido, onde o colisor é um efeito comum de A e B. Se for realizado ajuste para o
colisor, o caminho pela porta de trás, que está fechado pelo colisor, será aberto. Este
tipo de viés é também chamado de viés M (Greenland, 2003), pois o gráfico a ele
associado tem a forma de um M.
Se quiser saber como apagar ou renomear uma variável, apagar uma seta e outros
comandos úteis, consulte no menu a opção How to....

Figura 5.22.: Estrutura de garfo invertido mostrando Colisor no caminho pela porta
dos fundos entre o tratamento e o desfecho

Nesta estrutura, se for feito ajuste pelo colisor será criado viés de colisão. Este viés é
também chamado de viés M, porque o desenho tem a forma desta letra.

88
5.12. Exercı́cios

5.12. Exercı́cios
1. No DAG da figura 5.1 identifique o pai e o filho de G e os ancestrais e descendentes
de H.

2. No DAG da figura 5.1 identifique as variáveis que possuem mais de um filho.

3. No DAG da figura 5.1 identifique estruturas de cadeia, garfo e garfo invertido.

4. Represente o DAG da figura 5.4 sob magnificação.

5. Escreva o sistema de equações estruturais não paramétricas embutidas no DAG


da figura 5.4.

6. Verifique no DAG da figura 5.23 se A e E estão direcionalmente separados ou


direcionalmente conectados.

7. Verifique no DAG da figura 5.23 se A e C estão direcionalmente separados ou


direcionalmente conectados.

8. Identifique as independências marginais e/ou condicionais codificadas no DAG


da figura 5.23

9. Verifique no DAG da figura 5.24 se A e E estão direcionalmente separados ou


direcionalmente conectados.

10. Identifique as independências marginais e/ou condicionais codificadas no DAG


da figura 5.24

11. Identifique, no DAG da figura 5.25, se existem caminhos pela porta de trás entre a
exposição e o desfecho. Se existirem, descreva quais são estes caminhos, incluindo
a direção de todas as setas.

12. Se existirem caminhos abertos pela porta de trás entre a exposição e o desfecho
no DAG da figura 5.25, descreva quais são estes caminhos, incluindo a direção de
todas as setas.

13. Se existirem caminhos fechados pela porta de trás entre a exposição e o desfecho
no DAG da figura 5.25, descreva quais são estes caminhos, incluindo a direção
de todas as setas. Identifique qual(is) colisor(es) está(ão) bloqueando este(s)
caminho(s).

14. Qual o(s) conjunto(s) mı́nimo(s) de variável(is) de ajuste para confundimento


necessário(s) para identificar o efeito causal no DAG da figura 5.25?

15. Identifique, no DAG da figura 5.26, se existem caminhos pela porta de trás entre a
exposição e o desfecho. Se existirem, descreva quais são estes caminhos, incluindo
a direção de todas as setas.

89
5. Gráficos Acı́clicos Direcionados (DAGs)

16. Se existirem caminhos abertos pela porta de trás entre a exposição e o desfecho
no DAG da figura 5.26, descreva quais são estes caminhos, incluindo a direção de
todas as setas.

17. Se existirem caminhos fechados pela porta de trás entre a exposição e o desfecho
no DAG da figura 5.26, descreva quais são estes caminhos, incluindo a direção
de todas as setas. Identifique qual(is) colisor(es) está(ão) bloqueando este(s)
caminho(s).
18. Qual o(s) conjunto(s) mı́nimo(s) de variável(is) de ajuste para confundimento
necessário(s) para identificar o efeito causal no DAG da figura 5.26?

Figura 5.23.: DAG.

B D

A E

Figura 5.24.: DAG.

B D

A E

90
5.12. Exercı́cios

Figura 5.25.: DAG.

Figura 5.26.: DAG.

91
6. Viés de confundimento: do conceito
associacional ao conceito estrutural
6.1. O paradoxo de Simpson
Em 1951, Simpson publicou um artigo no qual apresenta um paradoxo com base em
dados fictı́cios, mas que ocorre bastante na realidade (Simpson, 1951). Um tratamento
foi aplicado para uma determinada doença e não foi associado à melhora clı́nica,
quando se analisou toda a amostra do estudo. Ou seja, o tratamento não foi associado
marginalmente à recuperação do paciente (OR - Odds Ratio ou RC - Razão de
Chances=1) (Tabela 6.1). Entretanto, quando os dados foram analisados separadamente
por sexo, paradoxalmente, em ambos os sexos, o tratamento foi associado a uma menor
taxa de recuperação, tanto no sexo feminino, como no masculino (OR=0,83) (Tabela
6.2). Quando foi analisada a associação condicional, por meio de estratificação pelo
sexo, foi observado um paradoxo. Como poderia um tratamento não ter efeito na
população como um todo mas, ao mesmo tempo, prejudicar a recuperação de homens e
mulheres? Este fenômeno foi denominado paradoxo de Simpson. Este exemplo, não é
apenas paradoxal, mas também não faz sentido lógico, considerando que esta situação
é irreal, impossı́vel de ocorrer na realidade. Não é plausı́vel que um tratamento possa
ser maléfico a cada sexo e, ao mesmo tempo, não ter efeito quando juntamos homens
com mulheres. Quando nos depararmos com tal paradoxo em uma situação de pesquisa,
devemos preferir a medida marginal ou condicional de associação? Para respondermos
a esta pergunta é preciso saber o que explica a ocorrência do paradoxo de Simpson.

Tabela 6.1.: O paradoxo de Simpson - associação marginal


D=1 D=0 Total
n % n
T=1 20 50 20 40
T=0 6 50 6 12
Total 26 50 26 52
RRT D = 20/40 / 6/12 = 1
ORT D = 20 x 6 / 20 x 6 = 1

RR=Razão de Risco
OR=Odds ratio
Fonte: adaptada de (Hernan et al., 2011)

93
6. Viés de confundimento: do conceito associacional ao conceito estrutural

Tabela 6.2.: O paradoxo de Simpson - associação condicional por sexo


C=1 Masculino C=0 Feminino
D=1 D=0 Total D=1 D=0 Total
n % n n % n
T=1 5 39 8 13 T=1 15 56 12 27
T=0 3 43 4 7 T=0 3 60 2 5
Total 8 40 12 20 Total 18 56 14 32
RRT D|C=1 = 5/13 / 3/7 = 0,90 RRT D|C=0 = 15/27 / 3/5 = 0,93
ORT D|C=1 = 5 x 4 / 8 x 3 = 0,83 ORT D|C=0 = 15 x 2 / 12 x 3 = 0,83

RR=Razão de Risco
OR=Odds ratio
Fonte: adaptada de (Hernan et al., 2011)

Hernan discute o paradoxo de Simpson com o uso de DAGs (Hernan et al., 2011).
Este paradoxo poderia tanto representar viés de colisão, como ocorrer numa situação de
confundimento. Vimos, no capı́tulo 5, que os dados comunicam apenas associações. Neste
caso, queremos interpretar, em termos causais, uma medida de associação. Para isto,
vamos necessitar de conhecimento teórico prévio, para realizarmos inferência causal
com dados observacionais. Não é possı́vel interpretar causalmente uma associação
apenas com base nos dados. Precisamos conhecer a história por trás dos dados, ou
seja, necessitamos usar o que sabemos para identificar e explicar a natureza desta
situação paradoxal. No DAG da figura 6.1, o paradoxo de Simpson é interpretado como
viés de colisão. Na realidade não existe associação marginal entre o tratamento e a
recuperação. Mas, no momento em que condicionamos para sexo, abre-se um caminho
que estava fechado pelo colisor, e surge uma associação negativa entre tratamento e
desfecho: os tratados têm menores percentuais de recuperação do que os não tratados.
Entre homens, o percentual de recuperação foi de 39% para os tratados e de 43%
para os não tratados. Já entre a mulheres, dentre as tratadas, 56% se recuperaram,
enquanto este percentual foi de 60% para as do grupo controle (Tabela 6.2). Neste
DAG estarı́amos codificando o nosso conhecimento. Entretanto, é impossı́vel que a
recuperação e o tratamento interfiram no sexo do indivı́duo, pois o sexo das pessoas foi
determinado por outros fatores, muito antes delas receberam o tratamento e terem ou
não se recuperado da doença. Com base no nosso conhecimento, descartamos, então, a
hipótese de viés de colisão.
Vejamos agora a hipótese de confundimento. No DAG da figura 6.2, o paradoxo de
Simpson é interpretado como viés de confundimento. A nossa hipótese, baseada no
conhecimento prévio, é de que o sexo interfere no recebimento do tratamento e também
na recuperação do indivı́duo. Ou seja, o sexo é uma causa comum do tratamento e do
desfecho recuperação. No DAG há um caminho causal, que sai pela porta da frente,
fluindo do tratamento para a recuperação (Tratamento → Recuperação), e um
caminho não causal, que flui pela porta de trás, partindo do tratamento, voltando no
sentido contrário ao da seta para o sexo, e indo no sentido da seta para a recuperação

94
6.1. O paradoxo de Simpson

Figura 6.1.: DAG interpretando o paradoxo de Simpson como viés de colisão

Recuperação

Sexo

Tratamento

O quadrado desenhado em volta da variável Sexo


indica condicionamento.
A linha interrompida conectando Tratamento
e Recuperação indica associação espúria,
induzida por condicionamento indevido por um colisor.

(Tratamento ← Sexo → Recuperação). Vimos, no capı́tulo 5, que um caminho não


causal pela porta de trás, se não estiver fechado por um colisor, encontra-se aberto. Se
o caminho pela porta dos fundos estiver aberto, associação não espúria flui pela porta
de trás e enviesa a estimativa marginal do efeito causal do tratamento na recuperação.
Quando há caminho aberto pela porta dos fundos, a associação marginal entre o
tratamento e a recuperação é formada por dois componentes: um componente causal,
que transmite o efeito causal, e um componente não causal, que transmite associação
espúria. Apenas bloqueando o caminho pela porta de trás é que interrompemos o fluxo
de associação espúria e impedimos que o viés contamine nossa estimativa de efeito
causal. Este bloqueio pode ser feito por meio de condicionamento pelo sexo. Uma das
formas de se realizar este condicionamento é por meio do cálculo da estimativa do
efeito causal nos estratos da causa comum, neste caso o sexo. Ou seja, calculando-se a
estimativa condicional pelo sexo. Outra forma de se realizar este condicionamento é
por meio de ajuste em modelos estatı́sticos de regressão.
Vamos agora utilizar os dados para ver se eles são compatı́veis com as nossas hipóteses.
O percentual de tratamento teve variação segundo o sexo? O percentual de recuperação
também variou de acordo com o sexo, ou seja, os homens se recuperaram mais ou
menos do que as mulheres? Vemos que, dentre os homens, 13/20 (65%) foram tratados,
enquanto 27/32 (84%) das mulheres receberam o tratamento. Concluı́mos que os homens
tiveram menor probabilidade de receber o tratamento que as mulheres. Portanto, os
dados não estão balanceados em relação ao sexo, pois os homens receberam menos o
tratamento do que as mulheres. Por outro lado, também verificamos que 5/8 (63%)
dos homens e 15/18 (83%) das mulheres se recuperaram da doença. Desta forma,
concluı́mos que os homens tiveram menor percentual de recuperação do que as mulheres.
Como o DAG é uma ferramenta populacional, mesmo diante de uma amostra pequena,
não estamos considerando erro de amostragem neste exemplo. Estamos assumindo

95
6. Viés de confundimento: do conceito associacional ao conceito estrutural

que qualquer diferença observada nos percentuais dentre os sexos seja real e não obra
do acaso. Assim, consideramos que o DAG da figura 6.2 é compatı́vel com o nosso
conhecimento prévio. Desta forma, chegamos à conclusão de que o paradoxo de Simpson
é devido ao viés de confundimento e os resultados da associação condicional (OR nos
estratos, T D|C ) é que devem ser interpretados. O OR marginal (ORT D ), calculado
incluindo toda a amostra, não deve ser utilizado, pois é uma estimativa viciada. Apenas
com base nos dados não poderı́amos extrair qualquer conclusão, pois as associações
encontradas (sexo com tratamento e sexo com recuperação) são compatı́veis tanto com
a hipótese do sexo causar estas variáveis, quanto com estas duas variáveis causarem o
sexo. Assim, tanto a associação marginal quanto a condicional do tratamento com a
recuperação seriam possı́veis de ser interpretadas, tendo em conta os dados. Apenas
com base nos nossos pressupostos, isto é, no nosso conhecimento prévio, é possı́vel tirar
um conclusão e, dar aos dados uma interpretação causal.

Figura 6.2.: DAG interpretando o paradoxo de Simpson como viés de confundimento

Tratamento

Sexo

Recuperação

6.1.1. Colapsibilidade da Medida de Associação


Outra possı́vel explicação para o paradoxo de Simpson é a não colapsibilidade da
medida de associação. Uma medida de associação é considerada não colapsável quando
as estimativas obtidas em cada um dos estratos diferem da medida obtida quando se
combinam os estratos. Portanto, a estimativa dos estratos não é colapsável, combinável
em uma única medida que reflita, fielmente, os valores dos estratos. Isto acontece
quando, mesmo que as medidas de associação dos dois estratos sejam iguais ou bem
semelhantes, a medida de associação combinada falha em produzir um valor igual aos
valores observados nos estratos (Jewell, 2004). Se uma medida for colapsável, esta pode
ser colapsável de forma estrita ou não estrita.
Uma medida de associação entre T (tratamento) e D (desfecho) é estritamente
colapsável sobre C (variável de estratificação) se esta for constante nos estratos de
C e se este valor constante for igual ao valor obtido na tabela marginal (Greenland
and Morgenstern, 2001). Por outro lado, uma medida pode ser colapsável, de forma
não estrita, se o seu valor marginal puder ser expresso como uma média ponderada
de seus valores condicionais, isto é, nos estratos de C, mesmo quando os seus valores
condicionais diferirem nesses estratos. Assim, uma medida é considerada não
colapsável quando o seu valor marginal não for igual à média ponderada de

96
6.1. O paradoxo de Simpson

seus valores condicionais (Hernan et al., 2011). Um resumo destas definições de


colapsibilidade estrita, colapsibilidade não estrita e não colapsibilidade está demonstrado
na tabela 6.3.

Tabela 6.3.: Definições de colapsibilidade


Colapsibilidade Definição
Estrita MAT D|C=1 = MAT D|C=0 e MAT D = MAT D|C
Não estrita MAT D|C=1 6= MAT D|C=0 e MAT D = MAT D|C
Não colapsável MAT D 6= MAT D|C
MA = Medida de Associação

No exemplo da tabela 6.2, considerando-se o odds ratio, o valor da medida de


associação da variável de estratificação (sexo) é igual nos dois estratos (ORT D|C=1 =0,83
e ORT D|C=0 =0,83). Isto indica que não há interação multiplicativa1 entre sexo e
tratamento na ocorrência do desfecho recuperação. A ausência de interação é uma
pré-condição para que uma medida de associação seja estritamente colapsável. Se o
efeito do tratamento nos dois estratos do sexo, masculino e feminino, for diferente, não
faz sentido se calcular uma medida única do efeito. Nesta primeira situação, quando há
ocorrência de interação, a medida de associação não é estritamente colapsável.
Em havendo igualdade do efeito nos estratos, uma medida de associação é estritamente
colapsável se o valor da associação condicional (obtida nos estratos) for igual ao valor
da associação marginal (incluindo todas as unidades estudadas). Dito em outras
palavras, uma medida de associação é colapsável quando o valor da medida
de associação bruta for igual ao valor da medida de associação ajustada para
a variável C. O viés de confundimento é uma das razões que fazem com que uma medida
de associação não seja colapsável. No exemplo das tabelas 6.1 e 6.2 o odds ratio não é
colapsável, pois o seu valor condicional, calculado nos estratos do sexo (ORT D|C =0,83),
é diferente do valor marginal, obtido incluindo-se ambos os sexos (ORT D =1). Ou seja,
T e D são marginalmente independentes (T ⊥ D), mas condicionalmente dependentes
dado C (T 6⊥ D | C).
Peculiaridades matemáticas também provocam não colapsibilidade de al-
gumas medidas de associação e podem gerar situações semelhantes às demonstradas
na situação exemplificada no paradoxo de Simpson. Para demonstrar tal questão com
clareza, vamos recorrer a um exemplo com dados simulados de um ensaio clı́nico
randomizado.
Na tabela 6.4 não há confundimento, pois os grupos estão balanceados em relação
à variável de tratamento: igual quantidade de indivı́duos foi tratada (n=200, 50%)
em cada estrato de C. A diferença de risco é estritamente colapsável: seu valor nos
estratos de C é igual ao seu valor na amostra combinada (DRT D|C =DRT D =0,50). A
razão de risco, entretanto, não é estritamente colapsável, pois seu valor condicional
varia nos estratos de C (RRT D|C=1 =6,00 e RRT D|C=0 =2,25) e difere do seu valor
marginal (RRT D =3,00). O odds ratio também não é colapsável: apesar do seu valor
1 uma revisão dos conceitos de interação aditiva e multiplicativa pode ser encontrada em (Jewell,
2004), capı́tulo 10.

97
6. Viés de confundimento: do conceito associacional ao conceito estrutural

Tabela 6.4.: Não colapsibilidade do odds ratio na ausência de confundimento


C=1 C=0
D=1 D=0 Total D=1 D=0 Total
T=1 120 80 200 T=1 180 20 200
T=0 20 180 200 T=0 80 120 200
Total 140 260 400 Total 260 140 400
DRT D|C=1 = 0,50 DRT D|C=0 = 0,50
RRT D|C=1 = 6,00 RRT D|C=0 = 2,25
ORT D|C=1 = 13,50 ORT D|C=0 = 13,50

Total
D=1 D=0 Total
T=1 300 100 400
T=0 100 300 400
Total 400 400 800
DRT D = 0,50
RRT D = 3,00
ORT D = 9,00

DR=Diferença de Risco
RR=Razão de Risco
OR=Odds ratio

ser o mesmo nos estratos de C (ORT D|C=1 =ORT D|C=0 =13,50), este valor é diferente
do odds ratio marginal (ORT D =9,00). Desta forma, concluı́mos que a colapsibilidade
depende da escolha da medida de associação. Usando-se os mesmos dados, pode se
obter colapsibilidade com uma medida e não com outra.
Vimos que a razão de risco não é estritamente colapsável, pois seus valores diferem
nos estratos de C. Vamos agora verificar se a razão de risco pode ser colapsável de
forma não estrita, ou seja, se o seu valor marginal é igual à média ponderada de seus
valores condicionais. Para este cálculo vamos usar o estimador não paramétrico, a partir
da fórmula 6.1 abaixo :
X
P (D = d|do(T = t)) = P (D = d|T = t, C = c)P (C = c) (6.1)
c

Razão de Risco Ponderada= [P(D=1 | do(T=1) / P(D=1 | do(T=0)]

P (D = 1 | do(T = 1) = [P (D = 1 | T = 1, C = 1)xP (C = 1)] + [P (D = 1 | T = 1, C = 0)xP (C = 0)]


[120/200x400/800] + [180/200x400/800] = [0, 60x0, 50] + [0, 90x0, 50] = 0, 30 + 0, 45 = 0, 75

P (D = 1 | do(T = 0) = [P (D = 1 | T = 0, C = 1)xP (C = 1)] + [P (D = 1 | T = 0, C = 0)xP (C = 0)]


[20/200x400/800] + [80/200x400/800] = [0, 10x0, 50] + [0, 40x0, 50] = 0, 05 + 0, 20 = 0, 25

98
6.1. O paradoxo de Simpson

Razão de Risco Ponderada = 0,75 / 0,25 = 3

Concluı́mos, portanto, que, apesar dos valores da razão de risco diferirem nos estratos
(RRT D|C=1 =6,00 6= RRT D|C=0 =2,25), devido a uma interação multiplicativa, a razão
de risco marginal (RRT D =3,00) é igual à soma ponderada de seus valores condicionais
nos estratos (RRT D|C =3,00). Assim, apesar da razão de risco não ser estritamente
colapsável, ela é colapsável de forma não estrita.
Vejamos agora se o odds ratio é colapsável de forma não estrita. Para isto vamos
usar o estimador ponderado de Mantel-Haenszel, de acordo com a fórmula 6.2 abaixo,
onde K é o número de estratos.
PK
ˆ (ai di /ni )
ORM H = Pi=1
K
(6.2)
i=1 (bi ci /ni )

(120x180/400)+(180x120/400) (21600/400)+(21600/400) 54+54 54


(80x20/400)+(20x80/400) = (1600/400)+(1600/400) = 4+4 = 4 = 13, 5

Podemos, então, concluir que a estimativa bruta ou marginal do OR (ORT D =9,00) não
é igual à média ponderada dos valores do OR condicionais dos estratos (ORM H =13,50).
Ou seja, o OR é uma medida não colapsável, mesmo sem viés de confundimento, a
partir de dados obtidos de um ensaio clı́nico randomizado, perfeitamente balanceado.
A não colapsibilidade do OR é um fenômeno por meio do qual o OR bruto ou marginal,
não pode ser expresso como uma média ponderada das estimativas do OR especı́ficos
dos estratos, mesmo na ausência de confundimento. Esta caracterı́stica do odds ratio é
uma peculiaridade matemática, não uma indicação de viés (Hernan et al., 2011). O
odds ratio tem uma tendência a se afastar de 1, tanto para cima quanto para baixo
e, desta forma, se descolar do valor da razão de risco (no exemplo da tabela 6.4 o
OR=9,00 é maior do que o RR=3,00) . Entretanto, o OR tende a se aproximar da razão
de risco quando a doença for rara (Rothman et al., 2008). Assim, quando a doença
é comum o odds ratio tende a superestimar a razão de risco. Quando a doença for
rara, as diferenças entre o OR marginal, bruto, (ORT D ) e o OR ponderado, ajustado,
(ORM H ) são pequenas (Jewell, 2004) e, neste caso, podemos assumir que o OR também
será uma medida colapsável.
Este exemplo mostra que pode haver não colapsibilidade mesmo na ausência de
viés de confundimento, o que nos leva a concluir que viés de confundimento não é
sinônimo de colapsibilidade. Confundimento pode ocorrer tanto na presença quanto
na ausência de colapsibilidade, bem como colapsibilidade pode ser identificada com
ou sem confundimento (Greenland and Morgenstern, 2001). Portanto, colapsibilidade
e confundimento são conceitos distintos. Apenas pelo conceito da colapsibilidade,
que é puramente baseado nos dados, não se faz distinção se C causa T e D (o que
significaria viés de confundimento), ou se T e D causam C (o que representaria que
C seria um colisor). Para se interpretar uma situação de não colapsibilidade como de
confundimento é necessário conhecer a história por trás dos dados. Não colapsibilidade
pode representar confundimento ou viés de colisão. Pode também ser um reflexo de
viés de aferição, representar mediação, ser obra do acaso ou, no caso do odds ratio e de
outras medidas de associação (como a razão de taxas e a diferença de taxas (Greenland,

99
6. Viés de confundimento: do conceito associacional ao conceito estrutural

Tabela 6.5.: Razões para não colapsibilidade - diferença entre a estimativa bruta e
ajustada

Peculiaridade matemática do odds ratio quando a doença for rara


Particularidade da razão de taxas ou da diferença de taxas
Viés de confundimento
Viés de colisão
Viés de aferição
Mediação
Acaso
Viés de confundimento ou de colisão por outra variável omitida

1996), simplesmente significar uma peculiaridade matemática. Pode também se dever


a confundimento ou viés de seleção (colisão) por outra variável omitida e, portanto,
não controlada (Greenland and Robins, 2009). Os motivos de não colapsibilidade das
medidas de associação estão sumarizadas na tabela 6.5. Vale lembrar que só faz sentido
investigar não colapsibilidade na ausência de interação.
Para concluir, usando-se medidas de associação colapsáveis (diferença de risco ou
razão de risco), a não colapsibilidade pode ser interpretada como indicativa de viés
de confundimento, a partir do uso do nosso conhecimento teórico, quando assumimos
que C é uma causa comum de T e de D. Quando usamos o OR, se a doença for rara,
também podemos interpretar a não colapsibilidade do OR como evidência de viés de
confundimento, se também assumirmos uma estrutura de garfo (C é causa comum
de T e de D). No entanto, colapsibilidade não pode ser interpretada como ausência
de confundimento, pois há situações em que há confundimento mesmo na presença
de colapsibilidade (Greenland and Morgenstern, 2001). Apesar disso, na maioria dos
casos em que há colapsibilidade o confundimento está ausente, sendo raros os casos
de confundimento com colapsibilidade (Greenland and Morgenstern, 2001). Isto talvez
explique o fato de que, em grande parte da literatura epidemiológica, não colapsibilidade
é considerada sinônimo de confundimento.

6.1.2. Exercı́cio resolvido - o paradoxo de Simpson


Assim, como interpretamos o exemplo da tabela 6.1, do paradoxo de Simpson? Para
nos ajudar nesta decisão vamos calcular a estimativa ponderada da razão de risco e o
OR ajustado de Mantel-Haenszel. Para isto, baixe o arquivo simpson.dta da página
da internet e utilize os seguintes comandos no Stata:

. use simpson

. expand n
(44 observations created)

. cs d t, by(c)

100
6.1. O paradoxo de Simpson

c RR [95% Conf. Interval] M-H Weight

0 .9259259 .4197179 2.042655 2.53125


1 .8974359 .2994789 2.689309 1.95

Crude 1 .5246084 1.906184


M-H combined .9135286 .4754405 1.755287

Test of homogeneity (M-H) chi2(1) = 0.002 Pr>chi2 = 0.9633

. cc d t, by(c)
c OR [95% Conf. Interval] M-H Weight

0 .8333333 .0607084 8.611738 1.125 (exact)


1 .8333333 .0914952 8.328274 1.2 (exact)

Crude 1 .2241313 4.461623 (exact)


M-H combined .8333333 .2167209 3.204326

Test of homogeneity (M-H) chi2(1) = 0.00 Pr>chi2 = 1.0000


Test that combined OR = 1:
Mantel-Haenszel chi2(1) = 0.07
Pr>chi2 = 0.7949

Em relação à razão de risco, como se trata de uma medida colapsável, podemos


interpretar a diferença entre o RR marginal (RRT D =1) e o RR ponderado a partir
das médias dos estratos (RRT D|C =0,91) como sugestiva de viés de confundimento.
No caso do OR, como se trata de uma medida não colapsável, precisamos verificar o
pressuposto da doença rara, para que possamos usar a diferença entre as estimativas
bruta (ORT D =1) e ajustada (ORM H =0,83) como indicativa de confundimento. Vemos,
na tabela 6.1, que o desfecho é frequente, pois 50% dos pacientes se recuperaram. Assim,
neste exemplo, a diferença entre as estimativas bruta e ajustada do OR também pode
refletir, analisando-se apenas os dados, a não colapsibilidade do odds ratio.
Note que foi também calculado o teste de homogeneidade das estimativas condicionais
dos estratos nos dois casos. O p valor >0,05 para as duas situações sugere que não
há evidência de interação2 . Na ausência de interação podemos interpretar diferenças
entre as estimativas bruta e ajustada das medidas de associação como evidência de
confundimento, se assumirmos que C é causa comum de T e de D.
Como usamos também o RR, que é uma medida colapsável, para verificar diferença
entre as estimativas bruta e ajustada, verificando que há observações em todas as
caselas da tabela (pressuposto da positividade) (Greenland and Morgenstern, 2001) e
assumindo-se que:

• C é causa comum de T e D;

• o acaso é improvável como explicação, apesar do pequeno tamanho da amostra;

• o viés de aferição também é improvável;


2 umarevisão dos testes de homogeneidade para detectar evidência de interação pode ser encontrada
em (Jewell, 2004), capı́tulo 10.

101
6. Viés de confundimento: do conceito associacional ao conceito estrutural

• C não é mediador (variável intermediária) entre T e D;


• não há confundimento por outra causa comum omitida;
• há apenas uma única versão do tratamento e o tratamento de um indivı́duo
não interferiu no desfecho de outro indivı́duo (pressuposto SUTVA, stable unit
treatment value assumption) (Morgan and Winship, 2015);

Uma interpretação deste exemplo do paradoxo de Simpson seria:


• A diferença entre as estimativas bruta e ajustada do RR sugere a presença de
viés de confundimento.
• O tratamento reduziu o percentual de recuperação em 9% (1-0,91), (RRT D =1,
RRT D|C =0,91).
• Em relação ao odds ratio, parte da diferença de 17% entre as estimativas bruta
(ORT D =1) e ajustada (ORM H =0,83) reflete viés de confundimento (9%, derivada
a partir da estimativa da diferença entre a RR bruta e ajustada) e parte indica
não colapsibilidade desta medida de associação (17%-9%=8%, calculada a partir
das diferenças entre as estimativas da RR e do OR).
Vimos assim que, para se fazer uma interpretação causal de uma medida de associação
são necessários vários pressupostos. Muitos destes pressupostos não são testáveis
empiricamente. Apenas com base nos dados, não é possı́vel interpretar o paradoxo de
Simpson.

6.2. Definição associacional de confundimento


Em grande parte da literatura epidemiológica da segunda metade do século XX, o con-
fundimento é geralmente considerado com base nos dados, definição que denominamos
aqui de associacional ou estatı́stica de confundimento, pois está baseada em associações
para identificação do provável fator de confusão. Inicialmente é verificado se o potencial
confundidor está associado com a exposição. Depois se observa se está associado com a
doença entre os não expostos. Em seguida, se usa o critério de mudança na estimativa
ajustada, em relação à estimativa bruta. Se houver diferença, então há confundimento
(Kleinbaum et al., 1982). Uma diferença ≥10% tem sido considerada, arbitrariamente,
para decidir se a variável é, então, um possı́vel confundidor (Greenland, 1989).
Esta definição equipara o conceito de confundimento com o de colapsibilidade
(Greenland and Robins, 1986; Greenland and Morgenstern, 2001). O confundidor é,
então, considerado como a variável que, uma vez controlada, modifica a estimativa de
associação (Kleinbaum et al., 1982). Por este conceito tradicional, todas as variáveis
que passarem por este critério, sendo, assim, identificadas como confundidoras, devem
ser incluı́das no ajuste.
Refinamentos deste critério utilizam também teoria causal neste processo de identi-
ficação, por exemplo, quando se exclui a possibilidade do confundidor ser uma variável
interveniente ou mediadora da relação causal. Desta forma, o critério utilizado para

102
6.2. Definição associacional de confundimento

detecção de confundimento passa a incluir uma mistura de relações causais (teoria) com
associações baseadas nos dados. Entretanto, o critério da mudança da estimativa (bruta
versus ajustada) permanece como a principal referência na identificação do confundidor,
ou seja, o critério utilizado continua sendo, predominantemente, empı́rico, mesmo após
estes refinamentos (Kleinbaum et al., 1982).
Assim, de acordo com a definição associacional, são três as propriedades necessárias,
mas não suficientes, para se caracterizar um confundidor (supondo-se ausência de
interação entre exposição e confundidor): 1) a variável de confusão deve estar associada
com a exposição na população (em toda a coorte, no estudo de coorte, e nos controles,
no estudo caso-controle) ; 2) o fator de confusão deve ser um fator de risco para a
doença entre os não expostos e 3) o confundidor não pode ser um mediador entre a
exposição e a doença (Kleinbaum et al., 1982). Algumas variações nestas propriedades
existem: (Rothman et al., 2008) acrescenta à terceira condição que o confundidor não
pode ser afetado pela exposição ou pela doença (Rothman et al., 2008). (Szklo and
Nieto, 2014) acrescenta à segunda condição que o confundidor deve ser causa da doença.
Apesar de na maioria das vezes estes critérios funcionarem bem, há alguns casos
em que o critério associacional falha e pode provocar, ao invés de evitar, viés. Assim,
demonstraremos com exemplos, que o critério de identificação de confundidor baseado
em associações estatı́sticas é insuficiente e, portanto, obsoleto. O uso isolado deste
critério pode levar a ajuste inadequado para confundimento, ao se incluir uma variável
desnecessária no ajuste, abrindo portas já fechadas por colisores, provocando, assim,
viés de colisão, e sabotar a interpretação causal da medida de associação calculada.
Vimos, na análise do paradoxo de Simpson, que critérios de associação baseados nos
dados são insuficientes para identificar confundimento, pois este se trata de um conceito
causal.
Um dos problemas com o uso desta definição é que, o que aparece como uma
associação ou independência entre o potencial confundidor com a exposição ou com o
efeito, pode representar confundimento ou viés de colisão por outra variável, que não foi
levada em conta no ajuste. Ou seja, no uso dos critérios indicativos para identificação de
confundimento, se empregam associações marginais (bivariadas), que podem, também,
estar viciadas, devido a outras variáveis não incluı́das no ajuste (Greenland and Robins,
2009). Além disso, várias outras razões, além do confundimento, podem provocar uma
mudança da estimativa bruta para a ajustada (Greenland and Robins, 2009), como foi
demonstrado na seção anterior (vide tabela 6.5).
Quando o critério da mudança da estimativa bruta para a ajustada é utilizado, as
estimativas condicionais são produzidas, ajustando-se, geralmente, para um confundidor
por vez. Assim, este critério não tem bom desempenho para se lidar com situações de
confundimento múltiplo (Greenland et al., 1999).
Outro problema com este critério é que é sempre necessário que seja realizada
avaliação de potenciais interações entre a exposição (E) e o eventual confundidor (C).
Na presença de modificação de efeito (identificada por meio de interação em modelo
estatı́stico ou por meio de análise estratificada), a diferença entre a estimativa bruta e
a estimativa ajustada não faz sentido ser interpretada. Como há interação, o efeito se
modifica a depender das categorias de exposição e do confundidor (Miettinen and Cook,
1981). A prática frequente de se usar modelos paramétricos multivariáveis, nos quais se

103
6. Viés de confundimento: do conceito associacional ao conceito estrutural

avalia apenas confundimento, ignorando-se teste de interações é danosa neste sentido.


Outra limitação do uso do critério de mudança da estimativa é que uma associação
estatisticamente significante pode ser um falso-positivo, quando a associação reflete
apenas o acaso (Miettinen and Cook, 1981). Este critério também depende da medida
de associação que é utilizada: mudança na estimativa pode ocorrer com o uso do OR e
não ser observado com o RR (Greenland and Morgenstern, 2001; Miettinen and Cook,
1981).
Pearl (2001) considera que o critério associacional não é necessário nem suficiente
para detecção de confundimento. Alguns confundidores podem não estar associados
com X ou com Y, e alguns não confundidores podem estar associados tanto com X,
quanto com Y. Os principais problemas e limitações no uso da definição associacional
de confundimento estão ilustradas na tabela 6.6.

Tabela 6.6.: Problemas e limitações no uso da definição associacional de confundimento

1) A mudança da estimativa bruta para a ajustada é dependente da medida de


associação utilizada
2) A mudança da estimativa bruta para a ajustada pode representar confun-
dimento por outra variável omitida, que interfira nas associações bivariadas
marginais entre C e E, e C e D
3) Associações significantes entre o confundidor com a exposição e o desfecho
podem ser apenas fruto do acaso
4) A mudança da estimativa bruta para a ajustada pode representar viés de
colisão, se a variável de ajuste for um colisor
5) A mudança da estimativa bruta para a ajustada pode ocorrer por erro de
mensuração
6) Não faz sentido interpretar diferença entre a estimativa bruta e ajustada na
presença de interação entre E e C

Outros critérios populares usados para identificar confundimento também podem


levar a viés, tanto por omissão de confundidores importantes, como por inclusão de
variáveis desnecessárias e danosas no ajuste. Os métodos automáticos de seleção de
confundidores, stepwise, ainda são muito usados, apesar de sua baixa performance na
identificação de confundidores (Greenland, 1989), com a ideia de que os confundidores
mais importantes serão identificados, mesmo que algumas variáveis selecionadas não
sejam confundidoras (Hernan, 2002). Os métodos de seleção stepwise de confundidores
estão baseados nos dados e nos testes de significância. Possuem baixa sensibilidade
para identificar reais confundidores, mesmo com o aumento do p-valor para retenção de
variáveis no modelo, por exemplo, para ≥0,20 (Mickey and Greenland, 1989). Isto pode
se dever ao fato de que, na seleção de variáveis só são levadas em conta associações entre
os potenciais confundidores e o desfecho, ignorando-se associações entre os possı́veis
confundidores com a exposição. Ademais, não é incomum que critérios stepwise de
seleção de confundidores produzam resultados absurdos e implausı́veis (Greenland,
1989). O uso de métodos stepwise de seleção de variáveis de confundimento não estão

104
6.3. Definição contrafatual de confundimento

mais indicados pois, comumente, criam viés de colisão. Além disso, como geralmente
são usados modelos paramétricos nos métodos de seleção stepwise, que dependem de
pressupostos frequentemente irrealistas em relação à forma funcional e distribuição das
variáveis, as estimativas derivadas destes modelos estão, comumente, erradas (Morgan
and Winship, 2015; Greenland et al., 1999). Outro problema é a frequente não inclusão
de termos de interação entre variáveis nestes modelos, o que pode gerar erros na
identificação de reais confundidores.
Se os critérios mais comumente usados para identificar potenciais confundidores
falham, qual a alternativa? A alternativa é utilizar o conhecimento prévio a respeito
do problema, pois o confundimento é um conceito causal. Partindo-se de um DAG
para representar as relações entre as variáveis selecionaremos um conjunto mı́nimo de
variáveis de ajuste para confundimento, a partir da aplicação de critérios gráficos como,
por exemplo, do critério da porta de trás, conforme explicado no capı́tulo 5.

6.3. Definição contrafatual de confundimento


Confundimento é um viés que surge quando se chega a uma conclusão falsa a respeito
do efeito causal entre a exposição (tratamento) e o desfecho. Este viés aparece quando
a associação estatı́stica difere da relação causal. Esta conclusão falsa se deve a uma
associação não causal que surge entre o tratamento T e o desfecho D devido a uma
terceira variável C. O efeito deste outro fator C está misturado, confundido com o
efeito do tratamento. Os grupos de tratamento e controle estão desbalanceados em
relação a este fator C e, portanto, não são mais permutáveis entre si. Esta falta de
permutabilidade entre os grupos de tratamento e controle é devido a este fator C ser
uma causa comum, tanto do tratamento, quanto do desfecho. Por isto, a associação
deixa de ser causal, devido a um desbalanceamento entre os grupos tratamento e
controle.
O confundimento, numa definição estrutural, é o viés que surge quando a exposição
e o desfecho possuem uma causa comum e existe pelo menos um caminho aberto pela
porta de trás entre a exposição e o desfecho. A existência de caminho aberto pela
porta de trás significa que há pelo menos uma causa comum não controlada, que
provoca associação espúria e quebra da permutalidade entre os grupos. Desta forma,
confundidores são variáveis que quando estratificadas ou incluı́das no ajuste eliminarão
ou diminuirão o componente espúrio da associação entre T e D (Hernan, 2002).
VanderWeele and Shpitser (2013) definem confundidor como uma ”covariável pré-
exposição C para a qual existe um conjunto de outras covariáveis X, de tal modo que
o efeito da exposição no desfecho não esteja confundido condicionalmente a (X, C),
mas de tal forma que para nenhum subconjunto de (X , C) o efeito da exposição no
desfecho não esteja confundido dado o subconjunto”. Assim, confundidor é uma variável
C que compõe o conjunto mı́nimo de ajuste suficiente para eliminar confundimento,
identificado, por exemplo, pelo critério da porta de trás. Este conjunto mı́nimo de
ajuste pode incluir apenas esta variável C, ou também outra(s) variável(is) necessária(s)
para bloquear todos os caminhos abertos pela porta dos fundos entre T e D. Por esta
definição, nem sempre o confundidor é uma causa comum de T e D, pois pode ser um

105
6. Viés de confundimento: do conceito associacional ao conceito estrutural

descendente de uma causa comum que bloqueia o caminho aberto pela porta de trás.
O confundimento resulta em várias consequências, que distorcem a avaliação do
efeito causal. Estas consequências dependem da intensidade e da direção das associações
entre o confundidor C e o tratamento T, e também entre o confundidor C e o desfecho
D. O confundimento pode gerar uma associação falso positiva ou superestimar o
efeito do tratamento. Pode causar uma associação falso negativa ou substimar o efeito
do tratamento. Pode, ainda, em casos mais raros, inverter a direção da associação,
transformando um verdadeiro fator de risco em um falso fator de proteção ou vice-versa.
Na definição contrafatual o confundimento surge porque comparamos grupos, ao invés
de compararmos os mesmos indivı́duos em dois momentos no tempo. Assim, se estamos
interessados em saber se a infecção pelo vı́rus Zika causa microcefalia, idealmente
gostarı́amos de comparar as mesmas mulheres em dois momentos: quando infectadas e
quando não infectadas pelo vı́rus, para verificar se, em cada um destes momentos, o feto
vai desenvolver microcefalia. Para fazermos isso terı́amos que acompanhar mulheres
infectadas e verificar se os seus fetos vão desenvolver microcefalia (Pr[D1 ], significando
probabilidade da doença quando não exposto). Em seguida, precisarı́amos voltar no
tempo e observar, novamente, estas mesmas mulheres numa situação em que não
tenham sido infectadas pelo vı́rus Zika e observar se os seus fetos desenvolveriam
microcefalia (Pr[D0 ], probabilidade da doença quando não exposto). Ou seja, para se
calcular o efeito causal precisarı́amos realizar um contraste dos desfechos potenciais da
mesma pessoa, quando submetida a diferentes tratamentos, em momentos diferentes
do tempo (Pr[D1 ] - Pr[D0 ]). Entretanto, na vida real só conseguiremos verificar uma
destas duas respostas potenciais, a resposta fatual. A outra resposta potencial é sempre
contrafatual, não observável. Assim, não conseguiremos calcular diretamente o efeito
causal.
O que fazemos na prática é estimar uma associação, comparando-se a probabilidade
de desenvolvimento de microcefalia em um grupo de mulheres que tenha sido infectado
pelo vı́rus (Pr[D=1|T=1], probabilidade da doença condicional a pertencer ao grupo
de expostos) com a probabilidade da doença em outro grupo de mulheres que não foi
infectado pelo vı́rus (Pr[D=1|T=0], probabilidade da doença condicional a pertencer ao
grupo de não expostos). Se a taxa de microcefalia no grupo de mulheres não infectadas
for igual à taxa de microcefalia que teria sido observada no grupo de mulheres infectadas,
caso elas não tivessem sido infectadas, os grupos são permutáveis, (Pr[D=1|T=0 =
Pr[D0 ]) e não ocorre viés. Entretanto, se houver causa comum do tratamento e do
desfecho, que provoque falta de permutabilidade entre os grupos de mulheres infectadas
e não infectadas, a nossa estimativa de associação (Pr[D=1|T=1 - Pr[D=1|T=0]) será
diferente da estimativa de efeito causal (Pr[D1 ] - Pr[D0 ], impossı́vel de ser calculada,
pois terı́amos que comparar a resposta potencial fatual com a resposta potencial
contrafatual no mesmo grupo). Esta diferença entre a medida de associação, obtida a
partir da comparação de duas respostas fatuais observadas em dois grupos, e a medida
de causa, ideal, que compararia a taxa do desfecho fatual com a taxa do desfecho
contrafatual no mesmo grupo, provoca confundimento (Rothman et al., 2008). Um
potencial confundidor desta associação seria o nı́vel socioeconômico: mulheres mais
pobres tendem a residir em bairros cuja taxa de infecção pelo Aedes é mais elevada,
tendo, portanto, maiores riscos de serem infectadas pelo vı́rus Zika. Por outro lado,

106
6.3. Definição contrafatual de confundimento

mulheres mais pobres também apresentam maior risco de contrair outras infecções
causadoras de microcefalia (toxoplasmose ou citomegalovı́rus, por exemplo).
Na tabela 6.7, demonstramos esta situação de maneira mais clara. Vamos denominar
a população de mulheres infectadas, que usaremos como grupo exposto, de população
tratada A e a população de mulheres não infectadas, que usaremos como grupo controle,
de população não tratada B. No grupo A, observamos apenas a resposta potencial
fatual na presença do tratamento Pr[DA1 ] e no grupo B a resposta fatual na ausência do
tratamento Pr[DB0 ]. Não observamos as respostas contrafatuais Pr[DA0 ], probabilidade
da doença entre os tratados caso não tivessem recebido o tratamento, e Pr[DB1 ],
probabilidade da doença entre os não tratados, caso tivessem sido tratados. Ou seja,
não sabemos o que teria acontecido com o grupo infectado A, caso ele não tivesse sido
infectado, Pr[DA0 ]. Também não temos informação sobre o grupo não infectado B, caso
ele tivesse sido infectado, Pr[DB1 ]. Assim, não podemos calcular o efeito causal em
nenhum dos dois grupos.
O que fazemos na prática? Tomamos a resposta fatual no grupo não tratado B,
Pr[DB0 ], para estimar a resposta contrafatual no grupo tratado A, Pr[DA0 ], caso ele
não tivesse sido infectado. Assim, para calcular o efeito causal teremos que assumir
como pressuposto que a resposta potencial fatual observada no grupo não exposto B,
Pr[DB0 ], seja igual à resposta contrafatual não observada no grupo exposto A, Pr[DA0 ],
ou seja, que Pr[DB0 ] = Pr[DA0 ]. Ou seja, os indivı́duos não tratados observados no
grupo B são iguais aos indivı́duos tratados do grupo A, caso eles não tivessem sido
expostos (Greenland et al., 1999; Jewell, 2004). Isto é assumir que os indivı́duos dos
dois grupos são permutáveis entre si, e que tanto faz se pessoas do grupo A ou do
grupo B tivessem sido tratadas, isto não interferiria nas suas respostas potenciais. Se A
e B são permutáveis, a exposição ou o tratamento ao qual o indivı́duo foi submetido
não interfere nas respostas potenciais (T ⊥ RP, onde RP são as respostas potenciais).
Desta forma, confundimento também pode ser definido como a dependência entre a
exposição e as respostas potenciais (T 6⊥ RP).

Tabela 6.7.: Estimação do efeito causal


Tratamento População Tratada A População Não Tra- Pressuposto
tada B
T=1 Pr[DA1 ] Pr[DB1 ]
T=0 Pr[DA0 ] Pr[DB0 ]
Efeito Pr[DA1 ]-Pr[DA0 ] Pr[DB1 ]-Pr[DB0 ]
Causal
Associação Pr[DA1 ]-Pr[DB0 ] Pr[DB0 ]=Pr[DA0 ]
Respostas fatuais destacadas em negrito

Quando desejamos saber se a exposição causa o desfecho a melhor forma de se


investigar isto seria por meio de um estudo experimental randomizado. A partir de
sorteio aleatório, um grupo de indivı́duos seria exposto à intervenção, e um outro grupo,
também sorteado, não seria exposto e funcionaria como grupo controle. Como a inter-
venção foi randomizada, há alta probabilidade, mais alta quanto maior for o tamanho

107
6. Viés de confundimento: do conceito associacional ao conceito estrutural

dos grupos, de que as variáveis pré-tratamento, que podem causar confundimento,


tanto as observadas, quanto as não observadas, estejam balanceadas nos dois grupos.
Desta forma, associação seria igual a causa. A associação é uma medida condicional de
efeito, obtida comparando-se grupos, contrastando-se a probabilidade de ocorrência do
desfecho, dado que ocorreu a exposição, com a probabilidade de ocorrência do desfecho,
dado que não ocorreu a exposição (Equação 6.3). O efeito causal é uma medida marginal
de efeito, obtida a partir da comparação da probabilidade de ocorrência do desfecho
no mesmo grupo: quando o grupo foi exposto (fatual) com o que teria ocorrido caso o
mesmo grupo não tivesse sido exposto (contrafatual) ou vice-versa (quando também o
grupo não foi exposto (fatual) com o que teria ocorrido caso o mesmo grupo tivesse sido
exposto (contrafatual) (Equação 6.4). Se o grupo não exposto for um bom substituto
para representar o que teria ocorrido com o grupo exposto, caso ele não tivesse sido
exposto, a medida de associação será igual à medida de causa. No estudo randomizado
sem perdas ou falta de aderência, com grande tamanho amostral, é alta a probabilidade
disto ocorrer. Entretanto, mesmo neste caso, podem ainda restar diferenças aleatórias
entre os grupos de tratamento e controle.
Associação é o que vemos, observamos em condições estáticas. Causa é o resultado
de uma intervenção, que muda as condições iniciais, a partir de uma manipulação por
forças externas (Pearl, 2001).

Medida de associação (condicional, em dois grupos)


P r[D = 1|T = 1] − P r[D = 1|T = 0] (6.3)
Medida de efeito causal(marginal, em um grupo)
P r[DT =1 = 1] − P r[DT =0 = 1] (6.4)
Entretanto, nos estudos observacionais, como não há permutabilidade marginal entre
os grupos devido à causa ou causas comum(ns) a medida de associação condicional
difere da medida de efeito causal marginal, o que provoca confundimento. Assim,
confundimento não é a diferença entre uma medida de associação marginal entre T
e D, como, por exemplo, a razão de risco bruta (RRT D = Pr[D=1 | T=1] / Pr[D=1
| T=0]) e uma medida de associação entre T e D, condicional a C (confundidor,
RRT D|C = Pr[D=1 | T=1, C] / Pr[D=1 | T=0, C]) ou a V (conjunto de variáveis
confundidoras, RRT D|S = Pr[D=1 | T=1, V] / Pr[D=1 | T=0, V])), como a razão de
risco ponderada a partir das médias dos estratos. Confundimento não é sinônimo de
colapsibilidade da medida de associação. Confundimento é a diferença entre a medida de
efeito, RRT D marginal causal = Pr[DT =1 =1] / Pr[DT =0 =1], e a medida de associação
RRT D marginal= Pr[D=1 | T=1] / Pr[D=1 | T=0] (Jewell, 2004). Entretanto, pela
impossibilidade de se estimar a resposta contrafatual no grupo exposto, caso ele não
tivesse sido exposto, no cálculo do RRT D marginal causal = Pr[DT =1 =1] / Pr[DT =0 =1],
assumindo-se permutabilidade entre os grupos, substituı́mos Pr[DT =0 =1] por Pr[D=1 |
T=0] e calculamos, de fato, RRT D = Pr[DT =1 =1] / Pr[D=1 | T=0] (Tabela 6.8).
Vamos, agora demonstrar dois exemplos, contrastando os critérios associacional e
gráfico de identificação de confundimento. Veremos que, na maioria das situações os dois

108
6.3. Definição contrafatual de confundimento

Tabela 6.8.: Definições associacional e estrutural de confundimento


Definição Associacional
Em que se baseia Não colapsibilidade da medida de associação
Fórmula RRT D 6= RRT D|C
Pr[D=1 | T=1] / Pr[D=1 | T=0]) 6= Pr[D=1 | T=1, C] / Pr[D=1 | T=0, C]
Definição Estrutural
Em que se baseia Falta de permutabilidade marginal entre tratados e não tratados
Fórmula RRT D marginal causal 6= RRT D
Pr[DT =1 =1] / Pr[D=1 | T=0] 6= Pr[D=1 | T=1] / Pr[D=1 | T=0]

critérios concordam, mas há situações em que eles discordam e, se utilizarmos somente
o critério associacional, acabarı́amos realizando ajuste para colisor, provocando, assim,
viés de colisão.
Na figura 6.3 está representado o confundimento numa perspectiva associacional.
Note que no diagrama não usamos setas direcionadas, para destacar que estamos
lidando apenas com associações estatı́sticas. A pergunta é se café causa infarto. A
questão é se o fumo seria um confundidor desta associação. O fumo cumpre os três
requisitos necessários para identificar um confundidor: está associado com a doença
entre os não expostos (os que não bebem café), com a doença na população de origem
dos casos (em toda a coorte) e não é uma variável descendente da exposição ou do
desfecho, não sendo, portanto, um mediador da relação causal entre T e D. Em vários
estudos, há diferença entre a estimativa marginal e a condicional ao fumo do RRT D .
Portanto, pelo critério associacional o fumo é um fator de confusão da relação causal
entre café e infarto.

Figura 6.3.: Viés de confundimento numa perspectiva associacional

C - Fumo

T - Café D - Infarto

Na figura 6.4 está representada a mesma estrutura de confundimento, retratada com


critérios associacionais na 6.3, agora numa perspectiva estrutural. Representamos o nosso
conhecimento acumulado, em termos de relações causais e, agora, cada seta direcionada
representa um caminho causal. Deduzimos que, no processo que gerou os dados, o fumo
é causa de infarto. Apesar de fumo e café estarem associados marginalmente, assumimos
que ambos foram causados por determinados fatores sociais e de personalidade não
observados, que denominamos C. Estes fatores sociais e de personalidade são, portanto,

109
6. Viés de confundimento: do conceito associacional ao conceito estrutural

causa comum dos hábitos de fumar e de beber café. Tanto o fumo - DC quanto o café -
T são descendentes do confundidor C. Notamos que há um caminho aberto pela porta
de trás T ← C → DC → D. Usando-se o critério da porta de trás, vemos que este
caminho pode ser bloqueado condicionando-se por C ou DC. Como normalmente C não
é medido, a solução seria condicionar para DC. Neste diagrama, por motivos diferentes,
o conceito associacional acerta também. No entanto, o verdadeiro confundidor, a causa
comum de T e D seria C e não o fumo.

Figura 6.4.: Viés de confundimento numa perspectiva estrutural

DC - Fumo

C - Fatores sociais e de personalidade D - Infarto

T - Café

6.4. Viés M
Apresentamos, na figura 6.5, um exemplo quando a definição tradicional ou associacional
de confundimento falha (Elwert, 2013; Greenland et al., 1999; Hernan and Robins,
2018). Usando-se o critério associacional, o colisor seria identificado como potencial
confundidor: está associado com T e com D e não é descendente de T ou de D. Entretanto,
como vimos no capı́tulo 5, quando um caminho contém um colisor, este caminho está
bloqueado e nenhuma intervenção no sistema precisa ser feita pelo pesquisador. Se
condicionarmos para o Colisor, será aberto um fluxo de associação pela porta de trás
que enviesará nossa estimativa de efeito causal. Devido ao formato do gráfico este tipo
de viés de colisão é denominado de viés M. Este é um dos exemplos que ilustra o fato
de que o confundimento é um conceito causal e que só poderá ser desvelado com base
numa combinação de pressupostos teóricos acerca do mecanismo de geração de dados,
codificados em um DAG e de avaliação empı́rica a partir dos dados.

6.5. Estruturas comuns de confundimento


Vamos ilustrar agora as estruturas mais comuns de confundimento encontradas em
DAGs e qual a ação necessária do pesquisador para recuperar a permutabilidade diante
destas estruturas. Já vimos que a utilização de critérios de identificação de propriedades
de confundidores individualmente não funcionam bem muitas vezes, pois quando o
confundimento é múltiplo, é difı́cil desvelar as relações entre as variáveis em associações
bivariadas entre C e T, e entre C e D. Desta forma, uma visão destas relações entre
variáveis, a partir do nosso conhecimento prévio, é fundamental para se verificar a

110
6.5. Estruturas comuns de confundimento

Figura 6.5.: DAG - Viés M - Colisor no caminho pela porta dos fundos

A B

Colisor

T D

ocorrência de uma causa comum e se há caminho aberto pela porta de trás, que precise
ser bloqueado por meio de uma intervenção do pesquisador no sistema.

Na figura 6.6 vemos uma estrutura simples de garfo, representando causa comum,
onde C é causa comum direta, tanto de T quanto de D. Há um caminho aberto pela
porta dos fundos T ← C → D. Nesta estrutura, condicionamento para C desvela o
efeito causal.

Na figura 6.7 vemos uma estrutura de garfo com mediação, onde C é causa comum
direta de D, e indireta de T, por meio de A. Há um caminho aberto pela porta dos
fundos T ← A ← C → D, sendo necessário bloqueá-lo para que o efeito causal seja
identificado. Nesta estrutura, condicionamento para A ou C (ajuste mı́nimo suficiente)
ou para A e C seriam recomendados para identificação, sem viés, do efeito causal.

Na figura 6.8 temos também uma estrutura de garfo com mediação. Nesta estrutura,
C é causa comum direta de T, e indireta de D, mediada por B. O caminho pela porta
dos fundos T ← C → B → D está aberto. Nesta estrutura, condicionamento para B ou
C (ajuste mı́nimo suficiente) ou para B e C seriam necessários para identificação, sem
viés, do efeito causal.

Finalmente, na figura 6.9 vemos uma estrutura de garfo com mediação, onde C é
causa comum indireta, tanto de D, por meio de B, quanto de T, por meio de A. O
caminho não causal aberto pela porta dos fundos T ← A ← C → B → D precisa ser
fechado. Nesta estrutura, condicionamento para A, B ou C (ajuste mı́nimo suficiente)
ou para A e B, A e C, B e C ou A, B e C seriam indicados para identificação do
efeito causal. Note que, usando-se analogia com o fluxo da água em uma tubulação, a
interrupção do fluxo de associação pode ser realizado em qualquer ponto do sistema,
para que o fluxo de associação não espúrio, que flui pela porta de trás, seja fechado.
A forma de se atingir a identificação do efeito causal é bloquear todos os fluxos de
associação espúrios que fluem pela porta de trás, em caminhos não bloqueados por
colisores, deixando aberto os fluxos causais de associação entre T e D, que fluem pela
porta da frente.

111
6. Viés de confundimento: do conceito associacional ao conceito estrutural

Figura 6.6.: DAG - Viés de confundimento - C como causa comum direta de T e D

Figura 6.7.: DAG - Viés de confundimento - C como causa comum indireta de T via A
e direta de D

A C

T D

6.6. Exemplo de viés de confundimento com


intervenção no DAG por meio do operador .do
Na figura 6.10 vemos um exemplo de viés de confundimento. Queremos saber se
caracterı́sticas do atendimento em duas UTIs A e B causam mortalidade. Se a internação
na UTI pudesse ter sido randomizada, provavelmente os grupos que teriam internado na
UTI A ou B seriam comparáveis entre si. Entretanto, sabemos que a internação na UTI
é primariamente determinada pela gravidade do paciente. Assim, uma determinada
UTI pode receber maior proporção de pacientes graves do que outra e, por isto, ter
maior mortalidade. Neste caso o excesso de óbitos não seria devido a caracterı́sticas do
atendimento na UTI. Por outro lado, também sabemos que a gravidade do paciente
aumenta as chances de morte. Estamos diante de uma causa comum: a gravidade do
paciente provoca a internação na UTI e também aumenta o risco de morte. Assim,
pacientes graves estão desigualmente distribuı́dos nos grupos que internaram na UTI A
ou B: no grupo que internou na UTI A, por exemplo, há um excesso de pacientes graves,
o que faz com que os grupos não sejam permutáveis entre si e provoca confundimento.
Dito em outras palavras, os pacientes internados na UTI não são semelhantes aos
internados na UTI B e, portanto, não são permutáveis entre si. Na UTI A há uma
maior proporção de pacientes graves do que na UTI B. Assim, a comparação marginal
entre internados nas duas UTIs provocará uma conclusão errada acerca do efeito causal:
pacientes internados na UTI A morrem mais, mas a causa da morte pode não ser as

112
6.7. Conclusão

Figura 6.8.: DAG - Viés de confundimento - C como causa comum direta de T indireta
de D via B

C B

T D

Figura 6.9.: DAG - Viés de confundimento - C como causa comum indireta de T via A
e indireta de D via B

A B

T D

caracterı́sticas da atenção prestada no hospital, mas a gravidade do paciente. Assim,


para estimar, sem viés, o efeito causal das caracterı́sticas do atendimento da UTI
na mortalidade, em um estudo observacional, precisamos fazer uma intervenção no
gráfico, para tentar ”isolar”o efeito da UTI do efeito da gravidade do paciente. Esta
intervenção ”cirúrgica”no gráfico é representada, nos trabalhos de Judea Pearl, pelo
operador do(.) (Pearl et al., 2016). Esta intervenção ”simulada”é feita apagando-se
a seta que sai do confundidor, gravidade do paciente, para o tratamento, internação
na UTI. Ao apagar a seta, criamos dois gráficos mutilados, simulando intervenções:
um com o tratamento (T=0) e outro com o tratamento (T=1). O operador do indica
intervenção do pesquisador no gráfico. Veremos, no capı́tulo XX, como estimar o efeito
causal a partir desta ”intervenção simulada”no gráfico.

6.7. Conclusão
Na figura 6.9 resumimos as definições associacional e estrutural de confundimento.
Vimos que, muitas vezes, as duas definições chegam à mesma conclusão. Entretanto,
quando elas discordam é a definição estrutural que sempre acerta. Assim, vimos que
realizar inferência causal a partir de dados observacionais requer pressupostos causais
derivados do conhecimento prévio. Derivar a necessidade de ajuste a partir de associações

113
6. Viés de confundimento: do conceito associacional ao conceito estrutural

Figura 6.10.: Viés de confundimento

T D

T=UTI; D=mortalidade; C=gravidade

Figura 6.11.: Gráfico mutilado demonstrando o operador do(.) para os dois valores do
tratamento T

C C

do(T=0) T D do(T=1) T D

T=UTI; D=mortalidade; C=gravidade


O quadrado desenhado em volta de T indica
que foi realizada intervenção nesta variável

detectadas nos dados empı́ricos pode levar a erros. Portanto, é impossı́vel decidir sobre
a ajuste com base em critérios puramente associacionais. A análise causal requer uma
mistura de dados e pressupostos, mas toda inferência causal é sempre condicional a
estes pressupostos (Pearl, 2001). Dito em outras palavras, só é possı́vel decidir qual o
conjunto mı́nimo de ajuste a partir de um entendimento teórico da estrutura causal
subjacente .
De acordo com Morgan and Winship (2015) é preciso mudar a perspectiva de análise
dos confundidores para o critério da porta dos fundos. A estrutura de confundimento
geralmente não é simples, pois, na maioria dos casos não existe apenas um confundidor
para que as regras de identificação possam funcionar, mesmo com os reparos mencionados
(Rothman 2008). Nos gráficos, as variáveis tem vários caminhos que as conectam e estes
caminhos são compostos por uma variedade de cadeias, garfos e colisores (Pearl 2016).
Assim, somente com a aplicação do critério da porta de trás, assumindo-se que não há
confundidor omitido (pressuposto quase sempre irrealista), será possı́vel se identificar
um conjunto mı́nimo de ajuste para confundimento e identificar o efeito causal.

114
6.8. Métodos de ajuste para confundimento

Tabela 6.9.: Definições associacional e estrutural de confundimento


Associacional Estrutural
Confundidor está associado com a ex- Confundidor é causa comum
posição
Confundidor é fator de risco para o des- Há caminho aberto pela porta de trás
fecho
Confundidor não é descendente do tra-
tamento ou da doença
Há diferença entre a medida de asso-
ciação marginal e condicional

A partir da construção do DAG e da aplicação do critério da porta de trás, podemos


detectar três situações de identificabilidade do efeito causal. Pode não haver causa
comum. Neste caso não há confundimento. O efeito causal pode ser identificado a partir
do cálculo do RRT D . Esta situação equivale a um ensaio clı́nico randomizado sem
falhas. Na segunda situação há causa()s comum(ns) e, a partir das variáveis observadas
V é possı́vel bloquear todos os caminhos abertos pela porta de trás. Por meio de
condicionamento para estas variáveis V (RRT D|V ) será possı́vel também identificar
o efeito causal. Entretanto, se há causa(s) comum(ns) mas, a partir das variáveis
observadas, não é possı́vel bloquear todos os caminhos abertos pela porta dos fundos o
efeito causal não é identificável.
Mesmo nas situações de identificabilidade listadas acima, restam questões abertas.
Como determinar que o ajuste foi suficiente? Como garantir que todos os confundidores
foram identificados e que não há confundimento por variável omitida?
Em resumo, o grande problema é que geralmente nosso conhecimento é insuficiente
para desenhar um DAG que possa ser usado para determinar qual o conjunto mı́nimo
de variáveis de ajuste que possam produzir permutabilidade condicional. É muito difı́cil
saber todos os fatores que influenciam as decisões de tratamento.
Assim, todo processo de ajuste para confundimento é uma tentativa. É quase inevitável
que reste algum confundimento residual. As regras baseadas em um único confundidor
só funcionam em casos mais simples, o critério da porta de trás funcionará em alguns
casos, mas em muitos casos a medida de associação será diferente da medida de causa
e, apesar de todas as tentativas, persistirá o viés. Nestes casos, outros métodos de
identificação do efeito causal, que não utilizam condicionamento para variáveis podem
ser utilizados (variável instrumental, uso de mecanismos, delineamento de regressão
descontı́nua - regression descontinuity design) (Morgan and Winship, 2015).

6.8. Métodos de ajuste para confundimento


O método de ajuste ideal para confundimento é a randomização, mas esta só é viável
em estudos experimentais, que só podem ser realizados quando a exposição e/ou o
tratamento sejam benéficos, por motivos éticos (Gordis, 2014).

115
6. Viés de confundimento: do conceito associacional ao conceito estrutural

Para se avaliar o efeito de exposições causadoras de doenças temos que lançar mão
de estudos observacionais, nos quais, na maioria das vezes, não há permutabilidade
entre os grupos. Precisamos, então, usar o nosso conhecimento prévio para identificar
um conjunto mı́nimo de variáveis de ajuste para confundimento e usar métodos capazes
de minimizar este viés.
Os procedimentos de controle de confundimento podem ser divididos em métodos
baseados em estratificação e métodos generalizados (Hernan and Robins, 2018). Os
métodos baseados em estratificação são os mais usados e abrangem estratificação,
restrição, regressão e pareamento. Os métodos generalizados incluem a padronização,
a fórmula G-paramétrica, ponderação pelo inverso da probabilidade de seleção em
modelos estruturais marginais e estimação G em modelos estruturais aninhados. Nos
próximos capı́tulos veremos, em detalhes e com exemplos práticos, o uso de alguns destes
métodos. Na tabela ?? abaixo apresentamos um resumo destes métodos, dividindo-os
em não paramétricos e paramétricos ou semi-paramétricos.

Tabela 6.10.: Métodos para controle de confundimento

Baseados em estratificação Generalizados


Não paramétricos Paramétricos ou Não Paramétricos ou
semiparamétricos paramétricos semiparamétricos
Estratificação Regressão Padronização Fórmula G pa-
ramétrica
Restrição Modelos estru-
turais marginais
(Ponderação
pelo inverso da
probabilidade de
seleção)
Pareamento Modelos estrutu-
rais aninhados
(Estimação G)
Escore de propensãoa
a
O escore de propensão pode ser estimado de forma não paramétrica, paramétrica ou
semiparamétrica.

6.9. Exercı́cios
1. Charig et al. (1986) compararam a taxa histórica de sucesso na remoção de cálculos
renais da cirurgia aberta versus a nefrolitotomia percutânea. Observaram que a
cirurgia aberta foi bem sucedida em 78% dos casos, enquanto a nefrolitotomia
percutânea teve uma taxa de sucesso mais elevada, de 83%. Entretanto, quando
observaram os resultados estratificando pelo tamanho dos cálculos renais, para os

116
6.9. Exercı́cios

cálculos menores que 2 cm, a taxa de sucesso da cirurgia aberta (93%) foi maior
do que a da nefrolitotomia (87%). Da mesma forma, para cálculos maiores ou
iguais a 2 cm, a cirurgia aberta também foi mais bem sucedida (73%) do que
a nefrolitotomia (69%). Como você explicaria que no conjunto a nefrolitotomia
apresentou maior taxa de sucesso, mas separadamente para cálculos maiores e
menores o resultado foi revertido e o sucesso da cirurgia aberta foi superior? Na
sua resposta, desconsidere a probabilidade de erro aleatório.

2. Construa um DAG para organizar o conhecimento teórico a respeito do problema


descrito por Charig et al. (1986).

3. Na tabela 6.11 estão mostrados os dados do estudo de Charig et al. (1986). Usando
o arquivo charig.dta, e os comandos utilizados no exemplo resolvido do paradoxo
de Simpson 6.1.2, calcule a razão de risco em cada estrato e a razão de risco bruta
e ajustada. Alternativamente você pode realizar os cálculos no programa OpenEpi
(de domı́nio público, disponı́vel na página http://www.openepi.com). Clique no
menu à esquerda em Cálculos, Tabela 2 x 2. Depois clique em Entrar dados
e digite os dados para o estrato 1 (C=1). Em seguida clique no botão Adicionar
Estrato e digite os dados para o estrato 2 (C=0). Finalmente clique no botão
Calcular.

4. Há interação, ou seja, a razão de risco foi diferente nos estratos com cálculos
menores e maiores? Leve também em conta na sua resposta o resultado do teste
de heterogeneidade.

5. Há confundimento? Há causa comum? Há caminho aberto pela porta de trás no
DAG que você desenhou?

6. Usando o critério da não colapsibilidade para avaliar a presença de confundimento,


há diferença entre a razão de risco bruta e ajustada?

7. Em conclusão, qual dos procedimentos cirúrgicos teve maior taxa de sucesso? Em


quais critérios você baseou a sua resposta?

8. Na tabela 6.12 estão apresentados os coeficientes de mortalidade especı́ficos por


faixa etária e geral nas cidades de São Luı́s e Porto Alegre. Qual das duas cidades
apresentou maior coeficiente de mortalidade geral?

9. Se poderia concluir, com base no coeficiente de mortalidade geral, que uma cidade
tem maior risco de mortalidade do que a outra? Por quê?

10. Inspecionando os coeficientes de mortalidade especı́ficos por faixa etária, a sua


conclusão continuaria a mesma ou mudaria? Por quê?

11. Construa um DAG para organizar o conhecimento teórico a respeito do problema


retratado na tabela 6.12.

12. Há confundimento por idade?

117
6. Viés de confundimento: do conceito associacional ao conceito estrutural

13. Com base no DAG, você escolheria os coeficientes especı́ficos de mortalidade por
faixa etária ou o coeficiente de mortalidade geral para embasar a sua conclusão?

14. Qual das duas cidades, São Luı́s ou Porto Alegre, apresenta maior risco de
mortalidade?

Tabela 6.11.: Taxa de sucesso da cirurgia aberta e da nefrolitotomia percutânea no


tratamento de cálculos renais
C=1 (<2 cm)
D=1 % Sucesso D=0 Total
T=1 234 87 36 270
T=0 81 93 6 87
Total 315 88 42 357

C=0 (≥2 cm)


D=1 % Sucesso D=0 Total
T=1 55 69 25 80
T=0 192 73 71 263
Total 247 72 96 343

Total
D=1 % Sucesso D=0 Total
T=1 289 83 61 350
T=0 273 78 77 350
Total 562 80 138 700
T=1 Nefrolitotomia percutânea
T=0 Cirurgia aberta
Fonte: Charig et al. (1986)

118
6.10. Apêndice - Interação e modificação de efeito

Tabela 6.12.: Coeficientes de mortalidade especı́ficos por faixa etária e geral em São
Luı́s e Porto Alegre, 2015
São Luı́s Porto Alegre

Coeficiente de mortalidade

Coeficiente de mortalidade

mortalidade em São Luı́s


Razão do excesso de
População residente

População residente
Número de óbitos

Número de óbitos
Faixa etária

por mil

por mil
0a4 328 85.023 3,86 211 85.004 2,48 1,55
5a9 25 87.255 0,29 19 86.585 0,22 1,31
10 a 14 36 91.791 0,39 40 101.110 0,40 0,99
15 a 19 206 88.450 2,33 169 103.528 1,63 1,43
20 a 29 527 206.505 2,55 401 223.411 1,79 1,42
30 a 39 475 197.950 2,40 500 255.554 1,96 1,23
40 a 49 502 137.303 3,66 662 178.861 3,70 0,99
50 a 59 647 94.333 6,86 1.313 187.645 7,00 0,98
60 a 69 835 51.017 16,37 1.873 136.345 13,74 1,19
70 a 79 1.033 22.864 45,18 2.302 74.591 30,86 1,46
≥80 1.520 11.402 133,31 3.819 44.232 86,34 1,54
Total 6.141 1.073.893 5,72 11.328 1.476.866 7,67 0,75

6.10. Apêndice - Interação e modificação de efeito


Dizemos que há interação entre dois fatores quando o efeito conjunto destes dois fatores
difere dos efeitos individuais de cada fator. Assim, a interação pode ser detectada
inspecionando-se a medida de associação em cada um dos estratos de uma terceira
variável C e verificar se a razão de risco em cada um dos estratos é igual ou diferente da
razão de risco na amostra total não estratificada. No exemplo da tabela 6.13, podemos
verificar que a razão de risco em cada um dos estratos (C=1 ou C=0) é igual a 2. Vemos
também que a razão de risco na amostra total (estimativa marginal ou não condicional)
também é igual a 2. Neste caso, então, não há interação.
A situação é diferente na tabela 6.14. O risco no estrato C=1 é igual a 0,50, enquanto
o risco no estrato C=0 é igual a 2. Portanto os riscos são diferentes em cada estrato,
confirmando a presença de interação. O risco na amostra total é 1,14. Entretanto, na
presença de interação, não faz sentido interpretar o risco total, pois na presença de
C o tratamento exerce um efeito protetor, enquanto na ausência de C o tratamento é
maléfico. Se considerarmos que na amostra total o tratamento é maléfico, não estarı́amos
percebendo o fato de que na presença de C o tratamento reduz a ocorrência do desfecho,

119
6. Viés de confundimento: do conceito associacional ao conceito estrutural

Tabela 6.13.: Exemplo 1- Ausência de interação


C=1 C=0
D=1 D=0 Total D=1 D=0 Total
T=1 16 64 80 T=1 24 96 120
T=0 8 72 80 T=0 12 108 120
Total 24 136 160 Total 36 204 240
RRT D|C=1 = 2,00 RRT D|C=0 = 2,00

Total
D=1 D=0 Total
T=1 40 160 200
T=0 20 180 200
Total 60 340 400
RRT D = 2,00
RR=Razão de Risco

e que apenas na ausência de C o tratamento é maléfico3 .

Tabela 6.14.: Exemplo 2. Interação


C=1 C=0
D=1 D=0 Total D=1 D=0 Total
T=1 8 72 80 T=1 24 96 120
T=0 16 64 80 T=0 12 108 120
Total 24 136 160 Total 36 204 240
RRT D|C=1 = 0,50 RRT D|C=0 = 2,00

Total
D=1 D=0 Total
T=1 32 168 200
T=0 28 172 200
Total 60 340 400
RRT D = 1,14
RR=Razão de Risco

3 Para simplificar a questão, estamos considerando apenas a estimativa pontual, ignorando a pos-
sibilidade de que a razão de risco possa ser maior ou menor do que 1 apenas por acaso. Não
estamos prevendo a possibilidade de erro aleatório. Numa situação real, estas conclusões têm que
ser baseadas também na observação dos intervalos de confiança.

120
7. Viés de colisão
7.1. Viés de Berkson
Berkson, em 1946, publicou um artigo para tentar responder a uma pergunta da época: a
colecistite, inflamação da vesı́cula biliar, causa diabetes? A partir de dados provenientes
de estudos com pacientes internados em hospitais, se notou uma associação entre as
duas condições. Alguns cirurgiões começaram, inclusive, a indicar a retirada da vesı́cula
como tratamento para o diabetes. Apesar de Berkson ter analisado dados hipotéticos,
as tabelas apresentadas no seu artigo mimetizam o que vinha sendo observado com
base em dados reais (Berkson, 1946).
No seu artigo, Berkson ilustra um desenho de estudo caso-controle. Os casos são
pacientes diabéticos e os controles são pacientes com erros de refração, que procuraram
o hospital para atendimento. Pacientes com erros de refração foram escolhidos para
compor o grupo controle pois, a princı́pio, esta condição não se relaciona com o diabetes.
A colecistite ocorreu mais frequentemente no grupo de pacientes com diabetes (8,6%)
do que no grupo de pessoas com erros de refração (4,7%). O odds ratio foi de 1,89.
Portanto, os dados sugerem que a colecistite está associada com o diabetes (Tabela 7.1,
parte superior).
Vejamos agora o que ocorreria se toda a população tivesse sido estudada, ao invés
apenas quem procurou assistência hospitalar. Na parte inferior da tabela 7.1, vemos que
o percentual de diabéticos que apresentavam colecistite na população geral (3,0%) foi
idêntico ao percentual de pacientes com erros de refração que tinha colecistite (3,0%).
O odds ratio foi de 1,00, indicando que não há associação entre colecistite e diabetes a
nı́vel populacional. Berkson também demonstrou não haver associação entre colecistite e
diabetes ao examinar os dados apenas das pessoas que não tinham procurado o hospital
(OR=1,00, parte central da tabela 7.1). Assim, como explicamos que, ao considerar
apenas os pacientes que procuraram o hospital, encontramos associação entre colecistite
e diabetes e, quando analisamos toda a população, esta associação desaparece?
A resposta está nas diferentes probabilidades de ir ao hospital para as diferentes
doenças e combinações de doenças. A probabilidade de procurar o hospital depende de
fatores como nı́vel socioeconômico, existência de serviço de diagnóstico e tratamento
para a doença, reputação do hospital, dentre outros fatores. Além disso, se o indivı́duo
tiver mais de uma doença, a probabilidade de hospitalização é maior do que se a pessoa
tiver apenas uma doença. No exemplo de Berkson, a probabilidade de hospitalização
foi maior para os pacientes que tinham diabetes e colecistite (626/3000 x 100 =
20,9%) do que para aqueles que apresentavam apenas diabetes e não tinham colecistite
(6693/97000 x 100 = 6,9%). A probabilidade de procurar o hospital entre os controles
também foi maior para os que tinham colecistite e erros de refração (9504/29700

121
7. Viés de colisão

x 100 = 32,0%) do que para aqueles que apresentavam apenas erros de refração
(192060/960300 x 100 = 20,0%). Dessa forma, tanto a colecistite quando o diabetes
aumentam as probabilidades de hospitalização e esta probabilidade é maior quando as
duas condições estão combinadas, do que quando estas ocorrem separadamente. Isto
cria uma associação entre colecistite e diabetes entre as pessoas hospitalizadas. Esta
associação não se deve, então, a um efeito causal da colecistite no diabetes, mas é devido
a diferentes probabilidades de hospitalização. Como foram incluı́das apenas pessoas
que procuraram o hospital no estudo, a forma como os indivı́duos foram selecionados
gerou viés. Por isto, tradicionalmente, o viés de Berkson é considerado uma forma de
viés de seleção (Pearce and Richiardi, 2014; Westreich, 2012).

Tabela 7.1.: Viés de Berkson


Hospitalizados (H=1)
Casos (D=1) Controles (D=0) Total
Colecistite (T=1) 626 9504 10130
% Colecistite 8,6 4,7 4,8
Sem colecistite (T=0) 6693 192060 198753
Total 7319 201564 208883
RRT D|H=1 = 1,89

Não hospitalizados (H=0)


Casos (D=1) Controles (D=0) Total
Colecistite (T=1) 2374 20196 22570
% Colecistite 2,6 2,6 2,6
Sem colecistite (T=0) 90307 768240 858547
Total 92681 788436 881117
RRT D|H=0 = 1,00

População Geral (H)


Casos (D=1) Controles (D=0) Total
Colecistite (T=1) 3000 29700 32700
% Colecistite 3,0 3,0 3,0
Sem colecistite (T=0) 97000 960300 1057300
Total 100000 990000 1090000
RRT D = 1,00
Fonte: Berkson (1946)

Vejamos agora, como representar esta situação em um DAG. Tanto a colecistite


quanto o diabetes aumentam as probabilidades de hospitalização. Representamos esta
situação com setas partindo da colecistite e do diabetes para a hospitalização. Mesmo
que colecistite e diabetes não estejam associados na população geral, como é o caso no
exemplo de Berkson, ao se condicionar indevidamente por um colisor (Hospitalização
= 1), surge uma associação espúria entre colecistite e diabetes. No DAG existem dois

122
7.2. Conceito

caminhos pela porta da frente, um potencialmente causal, ligando Colecistite e Diabetes


(Colecistite → Diabetes) e outro espúrio, não causal, que foi aberto a partir da restrição
por um colisor (Colecistite → Hospitalização ← Diabetes). Como vimos no capı́tulo 5,
viés de colisão é sinônimo de viés de seleção (Hernan et al., 2004).

Figura 7.1.: DAG ilustrando o viés de Berkson como viés de colisão

Diabetes

Hospitalização (H=1)

Colecistite

O quadrado desenhado em volta da variável Hospitalização indica condicionamento.


A linha interrompida conectando Colecistite e Diabetes indica associação espúria,
induzida por condicionamento indevido por um colisor

7.2. Conceito
Viés de seleção é o viés causado pela forma como os indivı́duos são selecionados
para análise. A partir de uma determinada população alvo, apenas uma amostra desta
população é selecionada ou se auto-seleciona para estudo e esta parcela selecionada difere
em vários aspectos da população alvo, o que gera viés (Rothman et al., 2008; Hernan and
Robins, 2018). É sinônimo de viés de colisão que, numa definição estrutural, significa
condicionamento indevido por um efeito comum do tratamento e do desfecho. Este viés
ocorre também quando o condicionamento indevido for feito por um descendente do
colisor e também quando a variável colisora for um efeito comum de uma causa do
tratamento e de uma causa do desfecho. Assim, viés de colisão surge toda vez que se
realizar um condicionamento indevido para um colisor ou descendente do colisor que
seja efeito comum de duas variáveis: uma sendo o tratamento ou causa do tratamento
e a outra sendo o desfecho ou causa do desfecho (Hernan et al., 2004; Hernan and
Robins, 2018). A consequência é que a associação entre o tratamento e o desfecho entre
os selecionados para análise difere da associação que seria observada entre todos os
elegı́veis para o estudo (RRAT D|C 6= RRCT D , onde RRA=Risco Relativo Associacional,
RRC=Risco Relativo Causal). Como a associação entre os selecionados difere da que
seria observada entre os elegı́veis, isto provoca falta de permutabilidade entre os tratados
e os não tratados no grupo selecionado para estudo (Hernan and Robins, 2018).
Um exemplo de viés de colisão/seleção pode ser demonstrado ao se estudar efeitos
de fatores perinatais, que podem provocar desfechos fetais adversos intra-útero, apenas
entre nascidos vivos. Por exemplo, desejamos saber se a suplementação com ácido fólico
é capaz de prevenir malformação cardı́aca. O ideal é que estudemos esta hipótese em
todas as gestações, incluindo aquelas terminadas em abortos, natimortos ou nascidos

123
7. Viés de colisão

vivos. Se estudarmos esta associação apenas em nascidos vivos, estaremos condicionando


via restrição, selecionando uma parte da população para estudo. Vejamos, no DAG da
figura 7.2, uma representação desta situação.

Figura 7.2.: DAG ilustrando o viés de colisão quando estudamos efeito de fatores
perinatais nos desfechos fetais adversos apenas em nascidos vivos

Malfomações Cardı́acas

Nascido vivo (C=1)

Suplementação com Ácido Fólico

O quadrado desenhado em volta da variável Nascido vivo indica condicionamento. A


linha interrompida conectando Suplementação com Ácido fólico e Malformações
Cardı́acas indica associação espúria, induzida por condicionamento indevido por um
colisor. Fonte: adaptado de Hernan and Robins (2018)

Sabemos que a suplementação com ácido fólico previne malformações do tubo neural,
o que reduz a probabilidade da gestação terminar em abortamento ou natimorto. Assim,
a suplementação com ácido fólico aumenta a probabilidade da gestação terminar em
nascido vivo, pois reduz abortamento e natimortalidade devidas a malformações do
tubo neural, daı́ a seta partindo da suplementação para nascido vivo. Por outro lado,
um feto com malformação cardı́aca tem menor probabilidade de nascer vivo do que ter
a gestação terminada em aborto ou natimorto. Por isso colocamos uma seta partindo
da malformação cardı́aca para nascido vivo. Vamos supor que a suplementação com
ácido fólico não esteja associada com redução do risco de malformação cardı́aca na
população geral de gestações (que possam ter resultado em abortos, natimortos ou
nascidos vivos). Neste caso, condicionar por nascido vivo pode gerar uma falsa associação
entre suplementação com ácido fólico e malformação cardı́aca nesta subpopulação. Ao
condicionarmos pela sobrevivência, estudando apenas nascidos vivos, estaremos abrindo
um caminho espúrio, não causal, entre Suplementação com ácido fólico → Nascido vivo
← Malformação cardı́aca, que estava fechado pelo colisor. Este é um exemplo de viés
de colisão pela porta da frente (Hernan and Robins, 2018).

7.3. Algumas causas de viés de colisão


O viés de colisão pode ser causado por vários motivos: perda diferencial de seguimento,
não resposta, uso de voluntários, estudo de doenças relacionadas ao trabalho apenas
em trabalhadores sadios, ajuste indevido por um colisor na análise estatı́stica, dentre
outras causas.

124
7.4. Exemplo numérico de viés de colisão - Dieta e risco de câncer não relacionado com a dieta

Quando há perda diferencial de seguimento em um estudo de coorte ou em um ensaio


clı́nico após a randomização, os não perdidos passam a não ser mais permutáveis com
os perdidos. Assim, a análise apenas dos dados dos acompanhados provoca viés de
colisão, pois, via restrição, esta será feita apenas em um dos estratos do estudo (o dos
acompanhados), que difere em uma ou mais variáveis do estrato dos não acompanhados.
Quando há não resposta a alguma variável do estudo por alguns participantes,
normalmente se tende a realizar a análise apenas incluindo as pessoas com dados
completos. Esta estratégia pode levar a viés de colisão, especialmente se o percentual
de dados perdidos for alto e houver diferenças nas outras variáveis entre aqueles com
informação incompleta e completa. Procedimentos de imputação múltipla de dados
estão indicados na tentativa de se reduzir esta causa de viés de colisão (Leite, 2017;
Enders, 2010).
Em estudos de saúde do trabalhador, é comum se estudar a doença apenas naqueles
que estão trabalhando. Se a doença for causa de absenteı́smo ou afastamento do trabalho,
os que continuam sadios e trabalham podem não ser permutáveis com aqueles que se
afastaram do trabalho, por causa da doença, em algumas das variáveis importantes
para o estudo. Este viés é denominado viés do trabalhador sadio.
O viés de colisão também pode surgir quando se inclui apenas voluntários em um
estudo (autoseleção), a partir de uma amostra de conveniência. Se os voluntários
não forem permutáveis com os não voluntários ocorrerá viés de seleção. Este viés é
denominado viés de voluntariado. É importante ressaltar que o uso de voluntários em
um ensaio clı́nico randomizado dificilmente provoca viés de colisão, pois a randomização
ocorre após a seleção dos indivı́duos para o estudo. Se a randomização conseguir
equilibrar os fatores prognósticos (variáveis pré-tratamento) nos grupos experimental e
controle, a ocorrência tanto de viés de confundimento, quanto de colisão, é improvável.
Entretanto, no ensaio clı́nico randomizado perdas de seguimento ou não resposta após
a randomização podem levar a viés de colisão.

7.4. Exemplo numérico de viés de colisão - Dieta e risco


de câncer não relacionado com a dieta

Hernan (2002) apresenta dados hipotéticos de um estudo para avaliar se fazer dieta
causa câncer não relacionado com a dieta. A variável de tratamento é estar fazendo
dieta e a variável desfecho é diagnóstico recente de câncer não relacionado com a dieta.
Vemos, na parte de baixo da tabela 7.2, que fazer dieta não causa câncer não relacionado
com a dieta (RRT D = 0,92 (0,71-1,21). Entretanto, se estudarmos esta associação
apenas entre aqueles que perderam peso recentemente, chegarı́amos à conclusão de que
fazer dieta é um fator de proteção para a ocorrência de câncer não relacionado com a
dieta (RRT D|C=1 = 0,79 (0,66-0,93). Como explicar este achado? Afinal de contas fazer
dieta protege ou não o indivı́duo de desenvolver câncer não relacionado com a dieta?

125
7. Viés de colisão

Tabela 7.2.: Viés de colisão


Perda recente de peso (C=1)
D=1 % Dieta D=0 Total
Dieta (T=1) 55 69% 25 80
Dieta (T=0) 70 88% 10 80
Total 125 78% 35 160
RRT D|C=1 = 0,79 (0,66-0,93)

Sem perda recente de peso (C=0)


D=1 % Dieta D=0 Total
Dieta (T=1) 45 38% 75 120
Dieta (T=0) 130 41% 190 320
Total 175 40% 265 440
RRT D|C=0 = 0,92 (0,71-1,21)

Total
D=1 % Dieta D=0 Total
Dieta (T=1) 100 50% 100 200
Dieta (T=0) 200 50% 200 400
Total 300 50% 300 600
RRT D = 1,00 (0,84-1,19)
Fonte: adaptado de Hernan (2002), com base em dados hipotéticos

Para ilustrar o exemplo numérico, vamos calcular as estimativa das razões de risco
bruta, nos estratos de C e combinada no Stata. Para isto, baixe o arquivo dieta.dta
da página da internet e utilize os seguintes comandos no Stata:

. use dieta
. expand n
(592 observations created)
. cs d t, by(c)
c RR [95% Conf. Interval] M-H Weight

0 .9230769 .7072926 1.204694 35.45455


1 .7857143 .6632972 .9307245 35

Crude 1 .843886 1.184994


M-H combined .8548387 .727778 1.004083

Test of homogeneity (M-H) chi2(1) = 1.272 Pr>chi2 = 0.2595

Note que não houve colapsibilidade da medida de associação (razão de risco). A


estimativa bruta (RRT D = 1,00) foi diferente da estimativa combinada (RRT D|C
= 0,85), o que poderia ser interpretado como viés de confundimento. O teste de
homogeneidade do RR sugere que as medidas não diferem nos estratos, ou seja, que
não há interação significante (p=0,2595).

126
7.4. Exemplo numérico de viés de colisão - Dieta e risco de câncer não relacionado com a dieta

Para responder a esta questão, é necessário que utilizemos, além dos dados, o nosso
conhecimento a respeito do problema. A princı́pio nos parece estranho que fazer dieta
possa proteger contra o risco de câncer não relacionado com a dieta. Esta associação nos
parece pouco plausı́vel de ser causal. O nosso conhecimento a respeito deste problema
está codificado no DAG da figura 7.3. Ora, tanto ter câncer não relacionado à dieta
como fazer dieta podem causar perda recente de peso. Assim, a perda recente de
peso é um efeito comum do câncer não relacionado com a dieta e de fazer dieta. Se
condicionarmos para o colisor, via restrição, estaremos abrindo um caminho pela porta
da frente que parte da Dieta no sentido da seta para Perda recente de peso e daı́, no
sentido contrário ao da seta, segue da variável Perda recente de peso para o desfecho
Câncer não relacionado com a dieta (Dieta → Perda Recente de Peso ← Câncer não
relacionado com a dieta). Vimos, no capı́tulo 5, que um caminho que contém um colisor
está fechado por definição e nele não passa associação espúria. Ao abrirmos este caminho
por meio de ajuste para o colisor, criamos uma associação espúria entre fazer Dieta e
Câncer não Relacionado com a Dieta. Se um indivı́duo que não fez dieta tiver perda
recente de peso, isto aumenta a probabilidade dele ter Câncer não relacionado com a
dieta. Da mesma forma, se um indivı́duo tiver perda de peso recente e soubermos que
ele foi diagnosticado com câncer, isto reduz a probabilidade dele ter feito dieta. Ou
seja, se, por meio de restrição, analisarmos a associação entre fazer dieta e câncer não
relacionado com a dieta apenas entre os que tiveram perda recente de peso, estaremos
gerando uma falsa associação negativa entre fazer dieta e câncer não relacionado com a
dieta. O conhecimento do efeito comum das duas variáveis, via restrição, nos permite
deduzir algo a respeito do passado. Por isso nunca devemos condicionar para um colisor.

Figura 7.3.: DAG ilustrando viés de colisão quando condicionamos para perda de peso
em estudo sobre efeito da dieta em câncer não relacionado com a dieta

Câncer não relacionado à dieta

Perda recente de peso (C=1)

Dieta

O quadrado desenhado em volta da variável Perda recente de peso indica


condicionamento. A linha interrompida conectando Dieta e Câncer não relacionado à
dieta indica associação espúria, induzida por condicionamento indevido por um colisor.
Fonte: adaptado de Hernan (2002)

Usaremos então, a razão de risco bruta para interpretar os dados deste estudo,
concluindo que não há associação entre dieta e câncer não relacionado com a dieta.
A não colapsibilidade da medida de associação seria causada por viés de colisão, se
fosse realizado condicionamento indevido para o colisor perda recente de peso. Este

127
7. Viés de colisão

exemplo ilustra que o viés de colisão também causa não colapsibilidade da medida de
associação, tal como o viés de confundimento. Sendo assim, a não colapsibilidade só
pode ser interpretada com base no nosso conhecimento prévio, conhecendo-se a história
por trás dos dados, ou seja, o mecanismo de geração de dados (Pearl et al., 2016).

7.5. Exemplos de algumas estruturas de viés de colisão


Vejamos, agora, exemplos de algumas estruturas com colisores nas quais o condiciona-
mento pelo colisor pode provocar viés de colisão. Vejamos inicialmente viés de colisão
que pode ser causado pela porta da frente, ao se condicionar por um colisor que esteja
situado em um caminho não causal entre T e D.

7.5.1. Viés de colisão pela porta da frente


1. Condicionamento por variável diretamente afetada pela exposição e pela doença.
Quando o condicionamento é feito por uma variável diretamente afetada pela
exposição e pela doença, como demonstrado na figura 7.4, o viés criado é de
maior intensidade. Este é o exemplo clássico de viés de colisão. Neste caso, a
associação espúria surge de um caminho aberto pela porta da frente, a partir de
condicionamento por um colisor (Exposição → Colisor ← Doença).
Como veremos em seguida, vários outros tipos de viés de colisão podem também
ser encontrados, ao se condicionar por um colisor e existirem relações indiretas
entre a exposição e a doença com o colisor. Este viés também pode ocorrer
quando houver causa comum da exposição e do colisor, e também causa comum
da doença e do colisor. Viés de colisão também pode surgir quando se realiza
condicionamento por um descendente do colisor.

Figura 7.4.: Viés de colisão pela porta da frente - condicionamento por variável direta-
mente afetada pela exposição e pela doença

Exposição

Colisor

Doença

2. Condicionamento por descendente de colisor (variável afetada pela exposição e


pela doença)

128
7.5. Exemplos de algumas estruturas de viés de colisão

Neste caso (figura 7.5), quando condicionamos por uma variável descendente de
um colisor da exposição e da doença, o viés tende a ser de menor intensidade
(Hernan, 2002).

Figura 7.5.: Viés de colisão pela porta da frente - condicionamento por descendente de
colisor

Exposição

Colisor Descendente do Colisor

Doença

3. Condicionamento por variável afetada pela exposição e por uma causa da doença
Nesta forma, conforme ilustrado na figura 7.6, o colisor é afetado diretamente
pela exposição e por uma causa da doença. Esta causa da doença é causa comum
da própria doença e do colisor. A associação espúria surge de um caminho aberto
pela porta da frente, a partir de condicionamento por um colisor (Exposição →
Colisor ← Causa da Doença → Doença). Como a associação entre a doença e
exposição é direta, mas a associação entre a doença e o colisor não é direta, mas
ocorre devido a uma causa comum da doença e do colisor, este viés também tende
a ser magnitude intermediária.

Figura 7.6.: Viés de colisão pela porta da frente - condicionamento por variável afetada
pela exposição e por uma causa da doença

Exposição

Doença Colisor

Causa da Doença

4. Condicionamento por variável afetada por uma consequência da exposição e pela


doença

129
7. Viés de colisão

Neste caso o viés também tende a ser de magnitude intermediária. Como demons-
trado na figura 7.7, a associação entre a doença e o colisor é direta, mas a relação
entre a exposição e o colisor é indireta, mediada pelo descendente da exposição.
A associação espúria surge de um caminho aberto pela porta da frente, a partir
de condicionamento por um colisor (Exposição → Consequência da Exposição →
Colisor ← Doença).

Figura 7.7.: Viés de colisão pela porta da frente - condicionamento por variável afetada
por uma consequência da exposição e pela doença

Exposição Consequência da Exposição

Doença Colisor

5. Condicionamento por variável afetada pela exposição e por uma consequência da


doença
Como ilustrado na figura 7.8, a associação entre a exposição e o colisor é direta,
mas a relação entre a doença e o colisor é indireta, mediada por um descendente
da doença. Neste exemplo, o viés também é de magnitude intermediária. A
associação espúria surge de um caminho aberto pela porta da frente, a partir
de condicionamento por um colisor (Exposição → Colisor ← Consequência da
Doença ← Doença).

Figura 7.8.: Viés de colisão pela porta da frente - condicionamento por variável afetada
por uma consequência da exposição e pela doença

Exposição

Doença Consequência da Doença Colisor

6. Condicionamento por uma variável que é simultaneamente mediadora entre T e


D, e colisora de T e de uma causa comum dela mesma e de D
Este tipo de viés de colisão é um pouco mais complexo (Figura 7.9). Neste caso,
a variável colisora é simultaneamente mediadora da associação entre T e D. A
colisão ocorre porque esta variável é causada pela exposição e por uma causa

130
7.5. Exemplos de algumas estruturas de viés de colisão

comum dela mesma e da doença. A associação espúria surge de um caminho aberto


pela porta da frente, a partir de condicionamento por um colisor (Exposição →
Colisor ← Causa comum do Colisor e da Doença ← Doença). Se ajustarmos
indevidamente para o colisor/mediador estaremos sabotando duplamente uma
interpretação causal: ao ajustarmos para o mediador estarı́amos estimando apenas
o efeito direto de T em D e, ao condicionarmos para o colisor, estarı́amos criando
uma associação espúria entre T e D. No final estarı́amos estimando, de forma
espúria, apenas o ”efeito direto”de T em D1 .

Figura 7.9.: Viés de colisão pela porta da frente - condicionamento por variável inter-
mediária afetada pelo tratamento (mediador), que também é colisora do
mediador e do desfecho

Colisor/Mediador D

Causa comum do Colisor/Mediador e D

7.5.2. Viés de colisão pela porta dos fundos

Vejamos, agora, alguns exemplos de viés de colisão pela porta dos fundos.

1. Condicionamento por variável afetada pela doença e por uma causa da exposição

Neste caso, a associação entre a doença e o colisor é direta, mas a associação


entre a exposição e o colisor ocorre devido a uma causa comum da exposição e
do colisor (Figura 7.10). Neste caso a associação espúria surge de um caminho
aberto pela porta de trás, a partir de condicionamento por um colisor (Exposição
← Causa da Exposição → Colisor ← Doença). Este tipo de viés de colisão tende
a ser de magnitude intermediária.

1 colocamos efeito direto entre aspas porque, de fato, nem o efeito direto de T em D estaria sendo
estimado, mas sim uma medida de associação que não teria interpretação causal, nem mesmo como
efeito direto de T em D.

131
7. Viés de colisão

Figura 7.10.: Viés de colisão pela porta de trás - condicionamento por variável afetada
pela doença e por uma causa da exposição

Causa da Exposição

Exposição Doença Colisor

2. Condicionamento por variável não afetada pela exposição ou pela doença, mas
afetada por causas da exposição e da doença, situada em caminho pela porta dos
fundos
Este exemplo de viés de colisão é denominado viés M (Figura 7.11). Este viés
tende a ser de pequena intensidade (Wei et al., 2012), pois as associações tanto
entre a exposição e o colisor, como entre a doença e o colisor são devidas a causas
comuns da exposição e do colisor, e da doença e do colisor. A associação espúria
surge de um caminho aberto pela porta de trás, a partir de condicionamento por
um colisor (Exposição ← Causa da Exposição → Colisor ← Causa da Doença →
Doença).

Figura 7.11.: Viés M - Colisor no caminho pela porta dos fundos - condicionamento por
variável afetada por uma causa da exposição e por uma causa da doença

Causa da Exposição Causa da Doença

Colisor

Exposição Doença

7.6. Intensidade do viés de colisão


O viés de colisão depende da força da associação entre o colisor com a exposição e o
desfecho. É de maior intensidade quando ambas as associações entre a exposição e o
desfecho com o colisor forem diretas. Se apenas uma destas associações for direta e a
outra indireta ou devida a causas comuns, o viés é de intensidade intermediária. Se
ambas as associações forem indiretas ou devidas a uma causa comum, o viés tende a

132
7.7. Viés de colisão provocado por perdas de seguimento

ser de pequena intensidade (Greenland, 2003). Assim, o viés M, que é sempre devido a
causas comuns do colisor e da exposição(variáveis pré-tratamento ou pré-exposição), e
do colisor e do desfecho, é sempre de baixa intensidade.
Assim, a magnitude do viés de colisão depende da parcela da associação mediada, da
intensidade e direção das associações entre o colisor e a exposição e entre o colisor e a
doença, e também da presença de intermediários nestes caminhos.

7.7. Viés de colisão provocado por perdas de


seguimento
Vejamos, abaixo, um exemplo aplicado do viés M (Figura 7.12), ou seja, de viés de
colisão, causado por perda de seguimento. Quando há perda de seguimento, isto equivale
ao pesquisador fazer uma restrição forçada, continuando no estudo apenas aqueles
que continuaram a participar até o final do mesmo. Dito de outro modo, apenas o
estrato dos participantes (P=1) ficaram no estudo, enquanto os que desistiram do
estudo (P=0), não tiveram os dados coletados.

Figura 7.12.: Viés M - Colisor no caminho pela porta dos fundos - condicionamento
por variável afetada por uma causa da exposição e por uma consequência
de uma causa da doença

CE - Efeitos Colaterais CD - CD4 baixo

COL - Participação no estudo CCD - Sintomas

T - Uso de antiretroviral D - Mortalidade

T - tratamento D - doença COL - colisor CD - causa da doença CCD - consequência


da causa da doença CE - causa da exposição
Fonte: adaptado de Hernan and Robins (2018)

A questão deset exemplo é se o uso de antiretroviral diminui a mortalidade por


HIV/aids. Vamos assumir que, no DAG da figura 7.12, adaptado de Hernan and Robins

133
7. Viés de colisão

(2018), não há confundimento por variável omitida, ou seja, o nosso conhecimento da
realidade é completo e expresso neste diagrama causal. Vamos também pressupor que
não há viés de aferição ou erro aleatório.
A ocorrência de efeitos colaterais dos medicamentos pode fazer com que o paciente
interrompa o uso da medicação (daı́ a seta CE - Efeitos colaterais → T - Uso de
antiretroviral). Por outro lado, a ocorrência de efeitos colaterais também pode fazer
com que o paciente desista do estudo e não mais participe do mesmo (CE - Efeitos
colaterais → COL - Participação no estudo). CD4 baixo, que reflete imunosupressão,
provoca sintomas e, por sua vez, é causa de mortalidade (CD - CD4 baixo → CCD -
Sintomas, CD - CD4 baixo → D - Mortalidade). Pacientes com sintomas graves podem
também não participar mais do estudo (CCD - Sintomas → COL - Participação no
estudo).
De qualquer forma, viés de colisão causado por restrição devido à não participação
no estudo de uma parte da amostra leva à quebra da permutabilidade entre os grupos.
Os grupos que participaram do estudo até o final não são mais permutáveis entre si,
pois diferem daqueles que deixaram de participar em relação a uma ou mais variáveis
preditoras do tratamento.

7.8. Exemplo de viés de colisão pela porta da frente -


variável intermediária afetada pelo tratamento

É bem conhecido na literatura médica o chamado ”paradoxo da obesidade”. Indivı́duos


obesos têm maior sobrevida do que os não obesos quando diagnosticados com uma
doença. Assim, diabéticos obesos apresentam menor mortalidade do que diabéticos
não obesos. Esta situação é paradoxal, pois a obesidade tem sido associada a maior
mortalidade em estudos populacionais.
Tem sido comum, em estudos que tenham por objetivo estimar os riscos de mortalidade
associados à obesidade, condicionar para doença. Assim, por exemplo, para investigar se
a obesidade aumenta o risco de óbito, é habitual, por exemplo, se ajustar para diabetes,
no intuito de se estimar o risco de mortalidade associado à obesidade, independentemente
do diabetes. Em estudos clı́nicos este condicionamento ocorre por meio de restrição, ao
se estudar apenas diabéticos. Preston and Stokes (2014) demonstraram que condicionar
por uma variável intermediária afetada pelo tratamento produz viés de colisão.
Na figura 7.13, está codificado o nosso conhecimento sobre o tema, de forma sim-
plificada, em um DAG, assumindo-se que não há causas comuns omitidas, viés de
aferição ou erro aleatório. Neste diagrama, a obesidade causa mortalidade diretamente
ou indiretamente por meio do diabetes. O hábito de fumar reduz o peso corporal e,
portanto, reduz o risco de obesidade, além de causar diabetes e maior mortalidade.

134
7.8. Exemplo de viés de colisão pela porta da frente - variável intermediária afetada pelo tratamento

Figura 7.13.: Viés de colisão pela porta da frente - variável intermediária afetada pelo
tratamento

Obesidade

Diabetes Mortalidade

Fumo
Fonte: adaptado de Preston and Stokes (2014)

Abaixo listamos todos os caminhos presentes neste DAG:

1. Pela Porta de trás

Caminhos não causais


(1) Obesidade ← Fumo → Mortalidade
(2) Obesidade ← Fumo → Diabetes → Mortalidade

2. Pela Porta da frente:

Caminhos causais
(3) Obesidade → Mortalidade
(4) Obesidade → Diabetes → Mortalidade —— Mediador

Caminhos não causais


(5) Obesidade → Diabetes ← Fumo → Mortalidade —— Colisor

Assim, de acordo com o conhecimento codificado neste DAG, para quais variáveis seria
necessário se realizar condicionamento/ajuste para se estimar o risco de mortalidade
associado à obesidade? Usando-se o critério da porta de trás, vemos que o único caminho
não causal pela porta da frente já está bloqueado por um colisor, Diabetes (caminho
5). Os caminhos causais pela porta da frente precisam ser deixados abertos (caminhos
3, direto e 4, com o mediador Diabetes). Pela porta de trás há dois caminhos abertos,
mas um deles contém um mediador, Diabetes e não podemos ajustar para um mediador
(caminho 2). Assim, precisamos encontrar uma variável que não seja mediadora ou
colisora e que feche ambos os caminhos pela porta de trás (caminhos 1 e 2), para que se
estime, sem viés, o efeito causal da obesidade na mortalidade. Ajustando-se para fumo,

135
7. Viés de colisão

bloquearemos estes dois caminhos pela porta dos fundos. Observe que neste exemplo,
Diabetes é simultaneamente um Colisor e um Mediador, portanto há dois motivos para
não se ajustar para Diabetes.
A partir deste DAG, usando o conhecimento empı́rico acumulado, Preston and Stokes
(2014) investigaram este viés de colisão. Um problema frequente quando se estuda o
risco de mortalidade associado à obesidade é a causalidade reversa. Indivı́duos doentes
podem ter perda de peso e maior risco de mortalidade. A doença pode ter provocado a
perda de peso e alterado o estado do indivı́duo de obeso para não obeso. Doença mais
grave pode levar a óbito, produzindo viés de sobrevivência, pois só os sobreviventes
participam do estudo. Estes fatores explicam porque há inversão do risco de óbito em
indivı́duos obesos com diabetes, que parece ser produzido, pelo menor parcialmente, por
viés de colisão. Os diabéticos mais graves ou morreram ou perderam peso. Isto poderia
explica este aparente ”paradoxo da obesidade”. Os diabéticos obesos sobreviventes
aparentemente ”morrem menos”porque alguns de seus pares obesos mais graves já
morreram ou perderam peso e passaram para o grupo dos não obesos e terão maior
mortalidade neste grupo, enviesando a associação. Este exemplo demonstra o perigo
de se extrapolar conclusões obtidas a partir de dados de um estudo clı́nico para a
população geral. O viés de colisão é suficiente para fazer uma exposição maléfica parecer
protetora (Banack and Kaufman, 2015).
Este exemplo também serve para ilustrar a necessidade de extrema cautela ao se
ajustar para variáveis pós-tratamento, tanto em ensaios clı́nicos, como em estudos
observacionais (Greenland, 2003). Para se analisar o efeito total do tratamento este
tipo de ajuste (para variável pós-tratamento) nunca deve ser realizado. Para se estimar
o efeito direto, ele pode ser realizado, desde que também seja feito ajuste para causas
comuns da variável pós-tratamento e do desfecho, além do ajuste para causas comuns
da exposição e da doença (Greenland, 2003). Voltaremos a esta questão de ajuste para
obtenção do efeito direto no capı́tulo ??.

7.9. Variável simultaneamente colisora e confundidora


No diagrama abaixo (Figura 7.14), denominado de bow-tie (gravata borboleta), há
uma variável que é simultaneamente uma causa comum e um colisor em um caminho
pela porta de trás entre T e D. Neste caso, se CT e CD tiverem sido mensurados no
estudo, poderia ser feito ajuste para CC e CT, ou para CC e CD. Ajustando-se para
CC, fecharı́amos o caminho pela porta de trás (T ← CC → D), mas abrirı́amos outro
caminho pela porta de trás (T ← CT → CC ← CD → D). Porisso terı́amos que fechar
este segundo caminho aberto, por meio de ajuste adicional para CT ou CD. O problema
surgirá se não tivermos medido CT nem CD, e tivermos medido apenas CC. O que
farı́amos nesta situação? Se não ajustarmos para CC, estarı́amos evitando viés de colisão,
mas a causa comum permaneceria não controlada, daı́ resultando viés de confundimento.
Se ajustarmos para CC, realizarı́amos ajuste para causa comum, controlando o viés de
confundimento, mas criarı́amos viés de colisão. Neste caso, como o viés M é de pequena
magnitude, em relação à maior intensidade do viés de confundimento, a recomendação
é ajustar para CC (Greenland, 2003).

136
7.10. Diferenças e semelhanças entre viés de confundimento e viés de colisão

Figura 7.14.: Estrutura Gravata-Borboleta - Colisor/Confundidor no caminho pela


porta dos fundos

CT - Causa do Tratamento CD - Causa da Doença

CC - Colisor/Confundidor

T - Exposição D - Doença

7.10. Diferenças e semelhanças entre viés de


confundimento e viés de colisão
O viés de confundimento sempre ocorre devido a causas comuns. Por outro lado, o viés
de colisão é causado por condicionamento indevido por um efeito comum da exposição
ou de uma causa da exposição e do desfecho ou causa do desfecho (Hernan, 2002).
Como vimos no capı́tulo 5, o viés de confundimento é representado no DAG por uma
estrutura de garfo, enquanto o viés de colisão é representando por uma estrutura
de garfo invertido, na qual foi realizado condicionamento por um colisor. O viés de
confundimento está presente nos dados, enquanto o viés de colisão é provocado por
uma ação do pesquisador (condicionamento indevido) ou por uma restrição causada
por perdas de seguimento, não resposta ou autoseleção. Dito em outras palavras, o viés
de colisão é causado por restrição ou por ajuste para um efeito comum.
Tanto o viés de confundimento quanto o viés de colisão produzem não colapsibilidade
da medida de associação, quando a estimativa bruta do risco relativo difere da ajustada
(Greenland, 2003; Jewell, 2004). O resultado final destes dois vieses é uma perda da
permutabilidade entre os grupos (Hernan et al., 2004).
Sendo assim, é impossı́vel distinguir viés de confundimento ou viés de colisão apenas
com base nos dados. É, portanto, essencial, conhecer o mecanismo de geração de dados
e construir um DAG a partir deste conhecimento, para que se possa distinguir estes
dois tipos de vieses e tomar as ações adequadas com vistas a estimar, sem viés, o efeito
causal. A partir do DAG escolhemos quais variáveis deverão ser utilizadas no ajuste.
A decisão de incluir ou não qualquer covariável na análise deve ser feita de acordo
com a pergunta de pesquisa e deve estar baseada no conhecimento prévio (Banack
and Kaufman, 2015). Na presença de viés de confundimento, devemos ajustar para a

137
7. Viés de colisão

causa comum causadora do confundimento. Na presença de viés de colisão, as soluções


necessárias estão apontadas na próxima seção.

7.11. Ajuste para viés de seleção


Na ocorrência de viés de colisão, causado tanto por perda de seguimento, não resposta,
autoseleção ou por ajuste indevido por um colisor, o que se pode fazer para tentar
eliminá-lo ou reduzi-lo?
Há várias formas para isto. No caso de ajuste indevido por um colisor a solução é
fácil: basta não condicionar pelo colisor. Nunca se deve realizar ajuste para variáveis
afetadas pela exposição ou pela doença. Também não se deve realizar ajuste se houve
caminho pela porta de trás, que já esteja fechado por um colisor, para se evitar viés
do tipo M (Greenland, 2003). No viés M, o colisor se comporta como um confundidor
clássico e, se usarmos as regras convencionais para identificação de confundidor, iremos
tratar um colisor como um confundidor. E, pior ainda, detectaremos não colapsibilidade
da medida de associação, o que confirmaria a nossa suspeita de estarmos diante de um
confundidor. Assim, não terı́amos dúvida e incluirı́amos o colisor no ajuste, sabotando
nossa pesquisa. Porisso é fundamental usar o conhecimento adquirido, tanto para
identificação de confundidor como de colisor, com a ajuda de ferramenta gráfica (DAG)
e do critério da porta de trás.
Para as outras situações, nas quais o pesquisador está trabalhando com uma suba-
mostra, ou seja, já houve restrição a partir de uma população, há outras possibilidades.
Uma delas é tentar fechar o caminho aberto pelo colisor por meio de outra variável que
esteja neste caminho. Outra forma é usar ponderação pelo inverso da probabilidade de
seleção. Estes métodos serão abordados no capı́tulo ??.

7.12. Exercı́cios
1. Na tabela 7.3 são apresentados os dados de um estudo para avaliar o possı́vel efeito
da suplementação periconcepcional de ácido fólico na prevenção de malformações
do tubo neural (Hernan, 2002). Trata-se de um estudo caso controle, no qual
os casos são produtos da gestação, incluindo abortos, natimortos e nascidos
vivos com malformação do tubo neural (D=1) e os controles são produtos da
gestação com outras malformações congênitas (D=0). O tratamento (T=1) foi a
suplementação periconcepcional com ácido fólico. Os dados são apresentados para
toda a população e estratificados para C (C=1, incluindo abortos e natimortos, e
C=0, abrangendo apenas os nascidos vivos). Responda às perguntas seguintes
assumindo que não há erro de mensuração, que não há confundimento por outra
variável omitida e que o odds ratio é colapsável, pois a doença é rara.

2. Construa um DAG para organizar o conhecimento teórico a respeito do problema


descrito por Hernan (2002).

138
7.12. Exercı́cios

3. Usando o arquivo neural.dta, e os comandos utilizados no exemplo resolvido do pa-


radoxo de Simpson (seção 6.1.2), calcule o odds ratio em cada estrato e o odds ratio
bruto e ajustado. Alternativamente você pode realizar os cálculos no programa
OpenEpi (de domı́nio público, disponı́vel na página http://www.openepi.com).
Clique no menu à esquerda em Cálculos, Tabela 2 x 2. Depois clique em
Entrar dados e digite os dados para o estrato 1 (C=1). Em seguida clique no
botão Adicionar Estrato e digite os dados para o estrato 2 (C=0). Finalmente
clique no botão Calcular.

4. Há interação, ou seja, a razão de risco foi diferente nos estratos? Leve também
em conta na sua resposta o resultado do teste de heterogeneidade.

5. Há confundimento? Há causa comum? Há caminho aberto pela porta de trás no
DAG que você desenhou?

6. Usando o critério da não colapsibilidade para avaliar a possı́vel presença de


confundimento, há diferença entre o odds ratio bruto e ajustado?

7. Há permutabilidade entre tratados e não tratados?

8. Em conclusão, a suplementação de ácido fólico foi eficaz em reduzir malformações


do tubo neural? Em qual(is) critério(s) você baseou a sua resposta?

9. Para responder a esta questão você utilizou o odds ratio bruto ou o ajustado?
Por quê?

139
7. Viés de colisão

Tabela 7.3.: Suplementação com ácido fólico e malformações do tubo neural


Total
D=1 D=0 Total
T=1 43 239 282
% Ácido Fólico 18,1 25,3 23,9
T=0 194 704 898
Total 237 943 1180

C=1 Aborto/Natimorto
D=1 D=0 Total
T=1 19 8 27
% Ácido Fólico 16,0 14,8 15,6
T=0 100 46 146
Total 119 54 173

C=0 Nascidos Vivos


D=1 D=0 Total
T=1 24 231 255
% Ácido Fólico 20,3 26,0 26,1
T=0 94 658 752
Total 118 889 1007
D=1 Casos - malformações do tubo neural
D=0 Controles - outras malformações congênitas
T=1 Suplementação com ácido fólico
T=0 Não suplementação com ácido fólico
Fonte: Hernan (2002)

10. Hernandez-Diaz et al. (2006) analisaram o chamado ”paradoxo do peso ao nascer”.


Usando dados dos nascimentos e óbitos relacionados, dos Estados Unidos, em
1991, descreveram que a razão da taxa de mortalidade dos fumantes, comparados
aos não fumantes foi 1,55 (Intervalo de confiança - IC - de 95% 1,50-1,59) na
população geral, ou seja, filhos de mães fumantes tiveram maior risco de óbito do
que filhos de mães não fumantes. Esta mesma razão foi 0,79 (IC 95% 0,76-0,82)
entre os nascidos com baixo peso e 1,80 (IC 95% 1,72-1,88) para os nascidos sem
baixo peso ao nascer. Ou seja, entre os nascidos com baixo peso, a mortalidade foi
revertida e os filhos de fumantes agora apresentaram menor mortalidade do que os
filhos de mães não fumantes. Entre os nascidos sem baixo peso ocorreu o mesmo
que na população geral: filhos de fumantes tiveram maior taxa de mortalidade
do que filhos de mães não fumantes. Como você explicaria este paradoxo: como
pode o fumo ser danoso na população geral e, ao mesmo tempo, ser um fator
de proteção para mortalidade entre os nascidos com baixo peso ao nascer? Leve
em consideração, na sua resposta, que foi sugerido, na literatura, que o efeito do

140
7.12. Exercı́cios

fumo materno durante a gravidez poderia ser modificado pelo peso ao nascer, de
maneira que o fumo seria benéfico para crianças com baixo peso ao nascer.
11. Assumindo-se que todas as variáveis foram medidas sem erro, que não há causas
comuns não incluı́das e baseado no DAG da figura 7.15 abaixo, como você
explicaria o paradoxo do peso ao nascer?
12. Há confundimento? Há causa comum? Há caminho aberto pela porta de trás no
DAG?

13. O risco relativo ajustado para o peso ao nascer foi 1,09 (IC 95% 1,05 - 1,12). Há
colapsibilidade da medida de associação?
14. Você usaria o risco relativo marginal (não ajustado) ou os riscos relativos condici-
onais, obtidos nos estratos para responder a esta questão?
15. Há permutabilidade entre tratados (fumantes) e não tratados (não fumantes) na
população geral?
16. Há permutabilidade entre tratados e não tratados no estrato de baixo peso ao
nascer?
17. Para analisar se a mortalidade infantil é maior entre crianças de mães fumantes,
comparadas a crianças de mães não fumantes, deveria ser realizado ajuste para o
peso ao nascer? Por quê?

Figura 7.15.: Fumo materno durante a gravidez e mortalidade infantil

Fumo materno

Baixo peso ao nascer Mortalidade

Malformações fetais

141
Parte III.

Estimação do Efeito Causal

143
8. Métodos de análise com escore de
propensão
8.1. Escore de propensão
Os métodos de análise com escore de propensão foram desenvolvidos a partir do artigo
seminal de Rosenbaum and Rubin (1983) para reduzir viés de seleção na estimativa do
efeito causal do tratamento. Seu uso nos estudos observacionais ocorre na tentativa
de compensar a ausência de randomização, com o objetivo de equilibrar os grupos de
tratamento e controle. Rosenbaum and Rubin (1983) demonstraram que o escore de
propensão é suficiente para balancear a variável de exposição (ou de tratamento) em
relação às variáveis observadas.
Uma das técnicas mais utilizadas com o escore de propensão é o pareamento. Quando
pareamos por uma variável é mais fácil encontrar um par. Se desejamos parear pelo
sexo, por exemplo, é fácil encontrar pares homens e mulheres no banco de dados. Porém,
em estudos que envolvem muitas variáveis é difı́cil se encontrar um par para todos. Se
o pareamento for, por exemplo, por sexo, nı́vel socioeconômico, tabagismo e obesidade,
poderemos ter dificuldade, por exemplo, para encontrar pessoas em determinadas
combinações de categorias destas variáveis. Se cada variável tiver apenas 2 nı́veis, será
uma tabela 2 x 2 x 2 x 2, ou seja uma tabela com 16 caselas e precisaremos encontrar
pares em cada uma destas caselas nos grupos de tratamento e controle.
Na tabela 8.1 ilustramos a realização do pareamento pelas variáveis observadas,
utilizando dados fictı́cios. A pergunta do estudo é se a participação no programa de
saúde da famı́lia reduz o percentual de crianças com esquema vacinal básico incompleto
no primeiro ano de vida. Como variáveis de confundimento observadas, temos renda
familiar per capita, medida em salários mı́nimos, e escolaridade materna, mensurada
em anos de estudo. De um total de 10 famı́lias estudadas, 5 recebiam visitas regulares
de um agente de saúde do PSF (codificado como 1) e 5 não participavam do programa
(codificado como 0). Iniciemos com a observação 1. A renda familiar é de 0,25 salário
mı́nimo per capita e a mãe estudou até o segundo ano do ensino fundamental. Qual
o melhor par controle para esta observação? Qual a criança que não participou do
PSF cuja famı́lia tem os valores mais próximos de renda e escolaridade? Observando a
tabela, vemos que a observação com valores mais próximos é a criança 8. Desta forma
1 e 8 serão pareados na nossa análise. Procedendo da mesma forma, formamos os pares
2 - 6, 3 - 7, 4 - 8 e 5 - 8. Note que o nosso pareamento permite reposição. Então a
observação 8 será par para três casos: 1, 4 e 5. Teremos que descartar as observações
controle 9 e 10, pois elas não se parecem com nenhuma criança do grupo exposto ao
tratamento (participação no PSF). Este exemplo simples já nos serve para ilustrar

145
8. Métodos de análise com escore de propensão

as dificuldades de se realizar o pareamento com base nas variáveis observadas. Neste


caso, são apenas duas variáveis observadas contı́nuas e já tivemos que descartar dois
controles, porque não tinham semelhança com nenhum dos tratados.

Tabela 8.1.: Pareamento com base nas variáveis observadas

Número PSFa Rendab Escolaridadec Par Escored


1 1 0,25 2 8 0,90
2 1 1 4 6 0,43
3 1 0,75 6 7 0,53
4 1 0,50 2 8 0,81
5 1 0,50 8 8 0,63
6 0 1 3 2 0,46
7 0 0,75 7 3 0,49
8 0 0,50 5 1, 4, 5 0,73
9 0 2 10 ? 0,02
10 0 3 15 ? 0,01
a
PSF = Participação no Programa de Saúde da Famı́lia
b
Renda familiar per capita em salários mı́nimos
c
Escolaridade materna em anos de estudo
d
Escore de propensão

Para atenuar esta dificuldade, de se realizar o pareamento na presença de muitas


variáveis observadas, foi criado o escore de propensão. Trata-se de um escore único,
obtido a partir da soma das relações entre as variáveis e o tratamento. Em um estudo
multidimensional, envolvendo muitas variáveis observadas, é gerada uma única variável,
denominada escore de propensão. Desta forma, se diminui a dimensionalidade, porque
todas as variáveis são transformadas em um escore único e fica mais fácil se encontrar
um par para todos (Rosenbaum and Rubin, 1983; Morgan and Winship, 2015; Guo
and Fraser, 2015).
O escore de propensão é a probabilidade condicional de recebimento do tratamento em
função das variáveis preditoras observadas, ou seja, das caracterı́sticas pré-tratamento
(Rosenbaum and Rubin, 1983). Seu cálculo é feito de acordo com a fórmula 8.1, onde
p é o conjunto de variáveis preditoras. No nosso exemplo, seria a probabilidade de
participação no PSF em função da renda familiar per capita e da escolaridade materna.

e(p) = P r[t = 1|p] (8.1)


Seu cálculo é mais comumente realizado em modelo logı́stico (Leite, 2017), no qual
a variável resposta é o tratamento, codificado em T=1 se o indivı́duo foi tratado e
T=0 se a pessoa não tiver sido tratada. As variáveis preditoras podem ser categóricas
ou contı́nuas. Para prever a probabilidade de tratamento (participação no PSF) a
partir das variáveis preditoras renda familiar per capita e escolaridade materna basta
rodar um modelo logı́stico com PSF como variável resposta e renda e escolaridade

146
8.1. Escore de propensão

como variáveis preditoras neste modelo. Ao final basta resolver a equação do modelo
logı́stico e calcular a probabilidade de tratamento. Esta probabilidade de tratamento
é o escore de propensão. Note que a regressão logı́stica é, neste caso, utilizada com
finalidade preditiva e não explicativa ou causal. Neste passo da modelagem, como
usamos um modelo preditivo, não teremos o problema de viés de confundimento, pois
uma variável de confusão, porque está associada ao tratamento, é uma boa preditora
da probabilidade do indivı́duo ser tratado.
Realizamos este cálculo e colocamos os resultados na última coluna da tabela 8.1.
Com base no escore de propensão vamos escolher, agora, os pares controles para as
nossas observações tratadas, ou seja, as que participaram do PSF. O escore de propensão
da criança 1 foi 0,90. O escore mais próximo deste no grupo controle é o da criança
8 (0,73). Assim pareamos a criança 1 com a criança 8. Continuando com o mesmo
procedimento formamos os pares 2 (0,43) com 6 (0,46), 3 (0,53) com 7 (0,49), 4 (0,81)
com 8 (0,73) e 5 (0,63) com 8 (0,73). Descartamos, portanto, as crianças 9 e 10. Note
que os pares formados foram os mesmos de quando realizamos o pareamento com
base nas variáveis observadas. Utilizando-se amostras pequenas e com poucas variáveis
preditoras, isto é fácil de ocorrer. Entretanto, agora podemos observar melhor se o
pareamento foi bom ou ruim. Para isto basta obter as diferenças entre os escores de
propensão de cada par. Quanto menor for esta diferença, mais próximos estão os valores
do par e, portanto, melhor o pareamento. Para o primeiro par (1 e 8) a diferença foi
0,90 - 0,73 = 0,17. E para os demais pares: 2 e 6 (0,03), 3 e 7 (0,04), 4 e 8 (0,08)
e 5 e 8 (0,10). Como há algumas diferenças grandes, o balanceamento das variáveis
não foi atingido neste caso. Este exemplo, com uma amostra muito pequena (n=10),
serve para demonstrar, de forma didática como se realiza o pareamento com o escore
de propensão. É muito difı́cil se obter balanceamento de variáveis com amostras tão
pequenas. É também óbvio que para responder a esta pergunta, de forma adequada,
precisaremos de mais observações. Veremos como avaliar de forma mais detalhada o
balanceamento das variáveis nos grupos tratado e controle mais adiante, com outro
exemplo, baseado em amostra maior.
De qualquer forma, este exemplo ilustra também que, muitas vezes, não vamos
encontrar controles adequados para cada observação e também seremos obrigados a
descartar algumas observações controles que sejam muito diferentes das tratados, como
foi o caso das crianças 9 e 10. Este procedimento de exclusão, se por um lado aumenta
a validade interna do estudo, porque se formam grupos mais comparáveis entre si, por
outro lado reduz a generalização externa dos achados para a população como um todo.
Assim, é importante que seja verificado se há zona de suporte comum, ou seja, se há
controles adequados para cada tratado. Muitas vezes, para se atingir um pareamento
mais adequado é comum se restringir a escolha de controles a uma zona mais restrita de
semelhança. Poderı́amos, por exemplo, aceitar pareamento apenas até uma determinada
diferença entre os pares, digamos 0,10. Neste caso, o par 1 - 8 não seria formado e
terı́amos que descartar a observação tratada 1. Isto aumentaria a validade interna do
estudo, mas reduziria a zona de suporte comum e, portanto, a validade externa dos
resultados.
Além do pareamento, há várias outras técnicas utilizadas com o escore de propensão
como a ponderação e a estratificação (Leite, 2017).

147
8. Métodos de análise com escore de propensão

8.2. Quais variáveis incluir no ajuste?


Antes de se inicar a análise a grande pergunta é: quais variáveis incluir no ajuste? Devo
selecionar as variáveis pela significância ou pela teoria? Ou usando os dois critérios?
A este respeito, não há consenso absoluto na literatura. Leite (2017) recomenda que
as variáveis sejam incluı́das com base na teoria. Segundo este autor, apenas verdadeiros
confundidores e variáveis apenas preditoras do desfecho devem ser incluı́dos no ajuste.
Como vimos no capı́tulo 5, confundidores são causa comum do tratamento e do desfecho.
A inclusão de verdadeiros confundidores reduz ao mesmo tempo viés e variância do
efeito do tratamento (Brookhart et al., 2006; Cuong, 2013).
A justificativa para incluir no ajuste variáveis que são apenas preditoras do desfecho
se deve à redução da variância na estimativa do efeito do tratamento obtida com a sua
inclusão (Brookhart et al., 2006; Cuong, 2013). Por outro lado, a inclusão de variáveis
que são apenas preditoras do tratamento não leva à redução de viés, mas causa aumento
da variância na estimativa do efeito do tratamento (Brookhart et al., 2006; Cuong,
2013). Já vimos, também no capı́tulo 5 que não devemos incluir mediadores no ajuste
pois, com a sua inclusão, se remove total ou parcialmente o efeito do tratamento.
Não é consenso na literatura a inclusão de variáveis que são apenas preditoras do
desfecho no ajuste. Para Rubin (2007), para se garantir que a seleção de variáveis
não seja dirigida pelos dados, não se deve realizar a análise do desfecho antes de se
escolher as variáveis de ajuste e calcular o escore de propensão. Isto garante maior
objetividade na escolha das variáveis e na implementação dos métodos baseados no
escore de propensão. A cegueira do pesquisador em relação às variáveis associadas
com o desfecho mimetiza o que acontece no estudo experimental, quando só se toma
conhecimento do desfecho muito tempo depois da implementação do tratamento. Assim,
a inclusão de preditores do desfecho é uma tı́pica questão de busca de equilı́brio entre
viés e variância. Há uma tendência de, ao se reduzir viés, se aumentar a variabilidade
na estimativa do efeito do tratamento e vice-versa. Deste modo, a inclusão de variáveis
que são apenas preditoras do desfecho tende a reduzir a variância da estimativa do
efeito do tratamento mas tende, por outro lado, a aumentar viés, pela ausência de
cegamento do pesquisador, tal como sugerido por Rubin (2007). Para este autor os
métodos baseados em escore de propensão foram desenhados para eliminar viés, não
para aumentar a precisão na estimativa do efeito do tratamento (Rubin, 2007).
Assim, somente variáveis pré-tratamento devem ser incluı́das no ajuste e o ajuste não
pode incluir variáveis afetadas pelo tratamento ou mediadoras. Desta forma, seguindo
(Rubin, 2007), não recomendamos a inclusão de variáveis apenas preditoras do desfecho
no ajuste, pois esta estratégia, que tem por objetivo reduzir a variância, pode acabar,
inadvertidamente, introduzindo viés na estimativa do efeito do tratamento.
Vimos, também no capı́tulo 5 como se dá a seleção de variáveis para inclusão no
ajuste, com a ajuda de métodos gráficos. Por este método, a seleção de variáveis se
dá por meio da aplicação do critério da porta de trás. Se o conhecimento a respeito
das relações entre as variáveis for completo, consideramos este método superior aos
acima mencionados para escolha das variáveis para ajuste. A importância deste critério
se dá pelo fato de que a ênfase na escolha do ajuste se desloca da variável para o
caminho. Uma variável pode ser confundidora em um caminho e ser colisora em outro.

148
8.3. Passos na análise com escore de propensão

Por meio de um DAG é possı́vel identificar caminhos abertos pela porta de trás e
escolher variáveis que não sejam colisoras e que bloqueie estes caminhos abertos pela
porta dos fundos (Pearl, 2009a).
Outra estratégia importante é escolher para ajuste variáveis que contenham menor
erro de mensuração, ou seja, que sejam bem medidas e que tenham boa confiabilidade
(Leite, 2017).
Os critérios de seleção de variáveis para ajuste estão resumidos na tabela 8.2.

Tabela 8.2.: Critérios de seleção de variáveis para ajuste

Variável Consequência para estimativa do efeito do trata-


mento
Verdadeiros confundidores Reduzem viés e variância
Preditores do desfecho Reduzem variância, mas podem aumentar viés
Preditores do tratamento Aumentam a variância e não reduzem viés
Mediadores Desaparecimento total ou parcial do efeito
Descendentes do tratamento Aumentam viés pela abertura de caminhos pela
porta da frente, provocando viés de colisão
Colisor Provoca viés
Critério da porta de trás Reduz viés, sendo mais adequado porque se fixa
nos caminhos e não nas variáveis. Uma variável
pode ser confundidora em um caminho e colisora
em outro

8.3. Passos na análise com escore de propensão


Seguimos os seguintes passos na realização de uma análise com escore de propensão
(Olmos and Govindasamy, 2015)

• Análise ajustada em modelos de regressão convencional


• Verificação do balanceamento antes da implementação do escore de propensão
• Estimação do escore de propensão
• Ponderação, pareamento ou estratificação com escore de propensão
• Verificação do balanceamento após a implementação do escore de propensão
• Cálculo do efeito causal em modelos ponderados, estratificados ou com pareamento
pelo escore de propensão

Veremos cada um destes passos a seguir. Inicialmente vamos descrever a pergunta,


o banco de dados e as variáveis que usaremos no exemplo. Vamos usar os dados da
coorte de nascimentos de Ribeirão Preto de 1978/79.

149
8. Métodos de análise com escore de propensão

A pergunta é se nascimento cesáreo causa obesidade na vida adulta jovem. Esta


hipótese nasceu de alguns estudos que detectaram que o parto cesárea estava associado a
maiores taxas de obesidade ao longo da vida. Uma das explicações para esta associação,
se ela for causal, é que o parto cesáreo, ao impedir que o bebê entre em contato com
a flora vaginal materna, altera a microbiota intestinal, aumentando a proporção de
bactérias do filo Firmicute e reduzindo a proporção de bactérias dos filos Bacteroidetes
e Actinobacteria (no qual se encontra o gênero Bifidobacterium (Rutayisire et al., 2016).
A longo prazo, esta alteração da microbiota levaria à obesidade (Goldani et al., 2011).
Os dados dos estudo foram coletados em dois momentos: ao nascimento e na vida
adulta jovem, dos 23 aos 25 anos de idade. Veja na tabela 8.3 a lista das variáveis, suas
categorias e a codificação utilizada. A variável tratamento é tipo de parto e a variável
resposta é o ı́ndice de massa corporal, mensurado em quilogramas por metro quadrado
(kg/m2 ). As demais variáveis serão consideradas como preditoras do tratamento.
O banco de dados contém 1904 observações completas, a partir de 2063 adultos jovens
participantes da terceira fase do estudo de coorte de Ribeirão Preto de 1978/79 (7% dos
casos tinham valores ignorados para uma ou mais das variáveis e foram descartadas).
Destes, 591 eram tratados (nasceram de parto cesárea) e 1313 não foram tratatos
(nasceram de parto vaginal). Na vida adulta, 226 (11,87% desenvolveram obesidade,
medida pelo ı́ndice de massa corporal maior ou igual a 30 kg/m2 .

8.3.1. Análise em modelos de regressão convencional


A análise não ajustada em modelo de regressão linear, tendo o ı́ndice de massa corporal
como variável dependente e o tipo de parto como variável explanatória, resultou no
coeficiente 1,11 (Intervalo de confiança 95% 0,64 - 1,58), p<0,001. Na análise ajustada
para todas as variáveis potencialmente confundidoras obteve-se o coeficiente 1,28
(Intervalo de confiança 95% 0,80 - 1,75), p<0,001. O resultados nos sugerem que as
pessoas nascidas de parto cesáreo apresentam ı́ndice de massa corporal na vida adulta
1,28 kg/m2 maior do que os nascidos de parto vaginal.
O problema com os modelos de regressão convencional é a grande quantidade de
pressupostos que precisamos levar em conta. Na quase totalidade das vezes, estes
pressupostos são irrealistas. Neste caso, primeiro temos que supor que todas as relações
entre os preditores e o desfecho são lineares e, no modelo testado, também pressupomos
que não haja interações entre o tratamento e os preditores. Isso além de todos os demais
pressupostos que precisam ser verificados em modelos de regressão linear (distribuição
normal, homocedasticidade, independência entre os preditores e o erro, distribuição
normal dos resı́duos e resı́duos pequenos). Outra desvantagem é que não temos como
testar balanceamento após o ajuste para verificar se, após a análise, os grupos tratamento
e controle são permutáveis entre si, pelo menos em relação às variáveis observadas.

8.3.2. Verificar balanceamento entre os grupos


Inicialmente vamos verificar o balanceamento entre os grupos tratado e controle, ou
seja, verificar se as variáveis pré-tratamento (preditoras do tratamento) estão igual
ou desigualmente distribuı́das entre os nascidos por cesárea ou por parto vaginal.

150
8.3. Passos na análise com escore de propensão

Tabela 8.3.: Variáveis da coorte de Ribeirão Preto 1978/79

Variável Nome Codificação


Índice de Massa Corporal imc contı́nuo (13,5 a 51,3)
Idade da mãe idmae contı́nua (14 a 48)
Paridade parid contı́nua (1 a 12)
Escolaridade materna escmae 1=0
(anos de estudo) 2=1a4
3=5a8
4 = 9 a 11
5 = 12 ou mais
Ocupação do chefe ocup 1 = não qualificado/desempregado
de famı́lia 2 = qualificado/semiqualificado
3 = não manual
Situação conjugal materna sconj 1 = sem companheiro
2 = união consensual
3 = casada
Trabalho materno trabmat 0 = não
fora do lar 1 = sim
Categoria de internação catint 0 = pública
1 = privada
Fumo materno fumomat 0 = não
1 = sim
Baixo peso ao nascer bpeso 0 = não
1 = sim
Nascimento pré-termo premat 0 = não
1 = sim
Sexo sexo 0 = feminino
1 = masculino
Obesidade obeso 0 = não
1 = sim
Tipo de parto tiparto 0 = vaginal
1 = cesárea

Podemos usar os métodos usuais, usando o teste t de Student para verificar diferenças
na média de variáveis contı́nuas e o teste do qui-quadrado para verificar diferenças
entre proporções, no caso de variáveis categóricas. Entretanto, testes estatı́sticos para
avaliar balanceamento entre os grupos não são recomendados pois o balanceamento de
covariáveis é uma propriedade da amostra, enquanto os testes de hipótese se referem
à população (Ho et al., 2007; Leite, 2017). Outro problema é que o p valor depende
do tamanho da amostra. Com amostras grandes há uma tendência de se identificar
como significantes diferenças triviais entre os grupos. Em amostras pequenas há maior
probabilidade de falso negativo, ou seja, de não se detectar diferenças importantes (Leite,

151
8. Métodos de análise com escore de propensão

2017). Por causa disto, outros métodos foram propostos para se verificar balanceamento.
O mais recomendado é verificar se há diferença padronizada absoluta nas médias
entre os grupos tratado e controle. Se a diferença padronizada absoluta entre as médias
for menor do que 0,10 desvio padrão considera-se que não há diferença entre os grupos,
ou seja, eles estão balanceados (Austin, 2011). Podemos usar também um ponto de
corte menos rigoroso, considerando que não há diferença quando esta diferença for
menor do que 0,25 desvio padrão (Stuart, 2010). Recomendamos o uso do critério mais
rigoroso (<0,10). A diferença padronizada absoluta nas médias entre os grupos tratado
e controle é obtida pela fórmula 8.2, onde x̄ é a média aritmética, s é o desvio padrão,
o subscrito t representa o grupo tratado e o c denota o grupo controle.
x̄ − x̄c
p t (8.2)
(s2t + s2c )/2)

Outro método muito usado é comparar toda a distribuição das variáveis nos dois
grupos (tratado e controle), por meio do teste de Kolmogorov-Smirnov. Se o valor de P
deste teste for ≥ 0,05, há equilı́brio entre os grupos. Da mesma forma, como nos demais
testes, este critério pode levar a falso positivo ou a falso negativo, como já comentamos
acima.
A razão de variância também tem sido usada para verificar balanceamento entre os
grupos. Por este critério, os grupos são considerados balanceados se a razão de variância
estiver no intervalo 0,8 - 1,2 (Leite, 2017).
Na saı́da abaixo, obtida por meio do pacote twang no R, vemos uma listagem das
estatı́sticas de balanceamento antes da implementação do escore de propensão. Na
primeira coluna constam os nomes das variáveis. As variáveis categóricas com mais de
dois nı́veis (ocup, escmae e sconj) foram fatoradas, para que sejam analisadas como
categóricas e não como contı́nuas. Porisso aparecem com os nomes ocupf, escmaef e
sconjf, pois o f indica que foram fatoradas. Após o f estão identificadas por um número
cada categoria. Assim, ocupf1 corresponde à ocupação manual não qualificada ou a
desemprego. Nas colunas subsequentes estão apresentadas a média do grupo tratado
(tx.mn), o desvio padrão do grupo tratado (tx.sd), a média do grupo controle (ct.mn),
o desvio padrão do grupo controle (ct.sd), a diferença padronizada absoluta entre as
médias do grupo tratado e controle (std.eff.sz), o resultado da estatı́stica utilizada para
comparar os tratados com os controles (stat, sendo teste t de Student para variáveis
contı́nuas e teste do qui-quadrado para variáveis categóricas), o resultado do p valor da
estatı́stica (p), o valor do teste de Kolmogorov-Smirmov (ks) e o p valor do teste de
Kolmogorov-Smirmov (ks.pval).
$unw
t x . mn t x . sd c t . mn c t . sd s t d . e f f . sz stat p ks ks . pval
idmae 27.257 5.809 25.401 5.703 0.320 6.491 0.000 0.140 0.000
parid 2.242 1.487 2.359 1.749 −0.070 −1.499 0 . 1 3 4 0 . 0 3 4 0.709
catint 0.113 0.317 0.059 0.236 0.203 3.700 0.000 0.054 0.178
ocupf : 1 0.140 0.347 0.235 0.424 −0.271 1 6 . 4 4 0 0 . 0 0 0 0 . 0 9 4 0.000
ocupf : 2 0.648 0.478 0.631 0.483 0.037 NA NA 0 . 0 1 7 0.000
ocupf : 3 0.212 0.408 0.135 0.342 0.188 NA NA 0 . 0 7 7 0.000
escmaef : 1 0.012 0.108 0.038 0.191 −0.243 6.885 0.000 0.026 0.000
escmaef : 2 0.387 0.487 0.463 0.499 −0.155 NA NA 0 . 0 7 6 0.000

152
8.3. Passos na análise com escore de propensão

escmaef : 3 0.294 0.456 0.274 0.446 0.044 NA NA 0.020 0.000


escmaef : 4 0.184 0.388 0.147 0.354 0.097 NA NA 0.037 0.000
escmaef : 5 0.122 0.327 0.078 0.268 0.135 NA NA 0.044 0.000
sconjf :1 0.039 0.193 0.058 0.234 −0.098 2.697 0.068 0.019 0.068
sconjf :2 0.056 0.230 0.074 0.262 −0.079 NA NA 0.018 0.068
sconjf :3 0.905 0.293 0.868 0.338 0.126 NA NA 0.037 0.068
bpeso 0.064 0.245 0.062 0.241 0.011 0.216 0.829 0.003 1.000
premat 0.059 0.236 0.073 0.260 −0.055 −1.150 0 . 2 5 0 0.014 1.000
trabmat 0.237 0.426 0.181 0.385 0.139 2.717 0.007 0.056 0.153
fumomat 0.247 0.432 0.260 0.439 −0.031 −0.625 0 . 5 3 2 0.013 1.000
sexo 0.475 0.500 0.479 0.500 −0.007 −0.145 0 . 8 8 5 0.004 1.000

Observe que há várias diferenças padronizadas absolutas nas médias maiores do que
0,10, que é o ponto de corte mais rı́gido (idade materna, categoria de internação, para
duas das três categorias de ocupação, para três das cinco categorias de escolaridade
materna, para uma categoria de situação conjugal e para trabalho materno). As demais
variáveis podem ser consideradas balanceadas entre os grupos tratamento e controle
por este critério. As variáveis com p valores não significantes nas estatı́sticas também
poderiam ser consideradas balanceadas (paridade, baixo peso ao nascer, nascimento
pré-termo, fumo materno durante a gravidez e sexo do recém-nascido). Pelo teste
de Kolmogorov-Smirnov também poderiam ser consideradas balanceadas as variáveis
categoria de internação e trabalho materno.
Na tabela 8.4 ilustramos os resultados dos testes para verificar balanceamento: t de
Student para variáveis contı́nuas e qui-quadrado para variáveis categóricas.

Tabela 8.4.: Balanceamento das variáveis da coorte de Ribeirão Preto 1978/79

Variável Vaginal Cesárea P valor


Idade 25,4 27,3 <0,001
Paridade 2,36 2,24 0,159
Hospital Privado 5,9% 11,3% <0,001
Escolaridade materna ≥ 12 anos 7,8% 12,2% <0,001
Ocupação não manual 21,2% 13,5% <0,001
Casada 90,5% 86,8% 0,067
Fumo materno na gravidez 24,7% 26,1% 0,534
Trabalho materno fora do lar 23,7% 18,1% 0,005
Baixo peso ao nascer 6,4% 6,2% 0,828
Nascimento pré-termo 5,9% 7,3% 0,268
Sexo masculino 47,6% 47,9% 0,885

Como os testes não são indicados para verificar balanceamento, vamos utilizar o
resultado da diferença padronizada absoluta nas médias para detectar quais variáveis
não estão balanceadas nos grupos tratamento e controle. Desta forma, concluı́mos
que as variáveis idade materna, categoria de internação, ocupação do chefe de famı́lia,
escolaridade materna, situação conjugal materna e trabalho materno fora do lar não
estão balanceadas.

153
8. Métodos de análise com escore de propensão

8.3.3. Estimação do escore de propensão


O próximo passo na análise é estimar o escore de propensão. Como vimos, o escore
de propensão é a probabilidade de receber o tratamento, no caso de nascer por parto
cesárea, em função das variáveis preditoras do tratamento. Normalmente esta estimativa
é realizada por meio de regressão logı́stica, mas este método tem alguns problemas. O
modelo pode estar mal especificado. A má especificação pode ser causada pela não
inclusão de termos polinomiais, no caso de relações não lineares entre os preditores
contı́nuos e a probabilidade do tratamento. Porisso é importante sempre que se teste
a não linearidade do logito para preditores contı́nuos, pois o modelo de regressão
logı́stica é muito sensı́vel à forma funcional da relação entre os preditores contı́nuos e a
probabilidade do tratamento. Isto pode ser testado por meio de um gráfico de dispersão,
colocando-se no eixo X a variável contı́nua e no eixo Y a probabilidade de ocorrência
do tratamento, ou seja, o próprio escore de propensão. Se no gráfico não se distinguir
uma reta, pode-se, então, adicionar ao modelo termos quadráticos e cúbicos, para se
dar conta de relações não lineares.
A má especificação também pode ocorrer pela falta de teste para interações entre os
preditores. Para a correta especificação do modelo é importante que se teste para estas
interações e que as interações significantes sejam incluı́das no modelo preditivo final.
Todos estes problemas podem levar ao não balanceamento.
Como este processo de inclusão de termos polinomiais e de interação é interativo e
trabalhoso, métodos automatizados para estimativa do escore de propensão usando
aprendizagem de máquinas foram propostos. A vantagem destes métodos é que se
tende a conseguir, de forma bastante rápida, modelos mais bem especificados do que os
obtidos por regressão logı́stica. O método de aprendizagem de máquinas mais utilizado
para estimativa do escore de propensão é o GBM (abreviatura de generalized boosted
modeling, modelagem ampliada generalizada). Este método é baseado em árvores de
decisão e, por meio de algoritmos iterativos, seleciona automaticamente covariáveis,
termos polinomiais e de interação a serem incluı́dos na modelagem, para que se obtenha
o melhor balanceamento possı́vel entre os grupos de tratamento e controle.
Há outros métodos propostos para cálculo do escore de propensão. O leitor interessado
poderá consultar Leite (2017); Guo and Fraser (2015).

8.3.4. Ponderação pelo escore de propensão


Uma vez calculado o escore de propensão, por regressão logı́stica ou por modelagem
ampliada generalizada, o próximo passo é obter os pesos e estimar o efeito causal em
modelo ponderado pelo escore de propensão. No método de ponderação pelo escore de
propensão, também denominado, ponderação pelo inverso da probabilidade de seleção,
a estimativa é feita em duas etapas.
Na primeira etapa se usa um modelo preditivo, por meio do qual se estima o escore
de propensão, ou seja, a probabilidade de ter nascido de parto cesáreo, em função
das variáveis preditoras do tipo de parto. Na segunda etapa se utiliza um modelo
explicativo, incluindo-se apenas o tratamento e o desfecho, ou seja o tipo de parto e o
ı́ndice de massa corporal. Neste modelo explicativo é estimada a diferença, em kg/m2 ,

154
8.3. Passos na análise com escore de propensão

do ı́ndice de massa corporal entre nascidos de parto cesáreo e normal, ponderando-se


pelas diferentes probabilidades de recebimento do tratamento.
Na primeira etapa, inicialmente se calcula a probabilidade de tratamento para cada
indivı́duo, ou seja, se estima o escore de propensão, como fizemos na seção anterior.
Em seguida, é necessário se calcular os pesos que serão usados na ponderação no
modelo explicativo. Desta forma, os indivı́duos que tiverem maior probabilidade de
serem selecionados para receber o tratamento terão um peso menor. Por outro lado,
os participantes que tiverem menor probabilidade de receber o tratamento terão um
peso maior. O objetivo final é balancear os grupos de tratamento e controle, de forma
que, ao final, eles se tornem permutáveis, condicionalmente às variáveis incluı́das na
primeira etapa, ou seja, no modelo preditivo.
Este método de ponderação pelo escore de propensão também é denominado de
modelo estrutural marginal (Hernan and Robins, 2018). É chamado de estrutural,
porque é baseado na estimativa de respostas contrafatuais. Usamos as observações
do grupo controle, ponderadas pelo escore de propensão, para reequilibrar os grupos,
como estimativa da resposta contrafatual no grupo tratado, caso ele não tivesse sido
tratado. Usamos também as observações do grupo tratado, ponderadas pelo escore de
propensão, para estimar a resposta contrafatual no grupo controle, caso este grupo
tivesse sido tratado. O modelo é denominado marginal, pois não se inclui variável de
ajuste no modelo, ou seja, este modelo é não condicional. Como o modelo é saturado
por só incluir o desfecho e uma variável explanatória (o tratamento), por definição este
modelo tem ajuste perfeito (Hernan and Robins, 2018).
Como estes pesos são calculados? Bem, isto depende do tipo de efeito causal que se
deseja estimar. Há 3 tipos de efeito causal que podem ser estimados (tabela 8.5). Por
meio do ATE (Efeito médio do tratamento), a eficácia relativa média do tratamento em
toda a população é estimada. Quando se calcula o ATT (Efeito médio do tratamento
entre os tratados), esta eficácia média do tratamento é calculada apenas nos tratados.
Neste caso se estima o que teria acontecido com os controles, caso eles tivessem sido
tratados. Quando se calcula o ATC (Efeito médio do tratamento entre os tratados), se
estima a eficácia média do tratamento entre os controles.

Tabela 8.5.: Tipos de efeito causal

Abreviatura Efeito Causal Fórmula O que é estimado?


ATE Efeito médio do E(D1 − D0 ) Eficácia relativa média
tratamento do tratamento na po-
pulação
ATT Efeito médio do E(D1 − D0 |T = 1) Eficácia relativa média
tratamento en- do tratamento nos tra-
tre os tratados tados
ATC Efeito médio do E(D1 − D0 |T = 0) Eficácia relativa média
tratamento en- do tratamento nos con-
tre os controles troles

155
8. Métodos de análise com escore de propensão

Qual estimativa de efeito causal usar? Isto vai depender dos objetivos, ou seja, da
pergunta do estudo. Se queremos extrapolar os resultados para toda a população,
é necessário o cálculo do ATE. Se estamos avaliando programas de intervenção não
randomizados, queremos saber o que aconteceria com os controles caso eles também
tivessem sido tratados. Neste caso podemos calcular o ATT.
Entretanto, nem sempre o pesquisador poderá calcular qualquer uma dessas três
medidas de efeito causal. Para que o ATE possa ser calculado é necessário que haja zona
de suporte comum, tanto para tratados quanto para não tratados. Neste caso, teremos
que encontrar controles adequados para todos os tratados, que sejam semelhantes
em termos do escore de propensão, e também encontrar tratados adequados para os
controles. Para o cálculo do ATT basta que haja zona de suporte comum para os
tratados, ou seja, há necessidade de encontrar contrastes adequados apenas para os
tratados.
A melhor forma de visualizar se há zona de suporte comum é por meio de um boxplot
do escore de propensão, plotado separadamente para tratados e controles. Se todos os
tratados tiverem controles adequados e todos os controles tiverem tratados adequados o
ATE pode ser estimado. Caso contrário, apenas o ATT ou ATC poderão ser estimados.
No estudo experimental randomizado o ATE é igual ao ATT, que por sua vez é igual
ao ATC.
Na figura 8.1 vemos o boxplot do escore de propensão nos dois grupos do estudo
(parto vaginal e cesáreo). Há uma boa zona de suporte comum, pois os dois boxplots
estão quase paralelos. Entretanto, nota-se que há uma tendência dos indivı́duos do grupo
de tratamento (nascidos por cesariana, codificados como 1) terem maiores valores do
escore de propensão do que os do grupo controle (nascidos de parto normal, codificados
como zero). Note que a mediana é maior no grupo tratado. Neste caso, como há suporte
comum, pode ser realizada a estimativa do ATE.
Veja, agora, na figura 8.2, obtida de outro banco de dados, que os tratados (codificados
como 1) possuem pouca zona de suporte comum com os não tratados (codificados
como 0). Praticamente toda a distribuição dos tratados está fora da distribuição dos
não tratados. Observe que no grupo tratado a maioria dos escores de propensão estão
acima de 0,4, enquanto no grupo controle os escores predominam na faixa inferior a
0,2. Neste caso o ATE não pode ser estimado, sendo a alternativa estimar o ATT.
Neste caso, ao usar o procedimento de ponderação pelo inverso da probabilidade de
seleção, teremos que dar maior peso aos tratados com escore de propensão baixo e maior
peso aos não tratados com escore de propensão alto, para compensar e, assim, poder
formar contrastes contrafatuais adequados na ausência de randomização. Usaremos
este exemplo no próximo capı́tulo, quando isto será mais bem explicado.
Na tabela 8.7 estão calculados o escore de propensão, por meio de regressão logı́stica e
o peso para estimativa do ATE, usando-se as fórmulas da tabela 8.6, a partir do banco de
dados fictı́cio, criado para responder à pergunta se a participação no programa de saúde
da famı́lia causa reduz o percentual de crianças com esquema vacinal básico incompleto
no primeiro ano de vida. Observe que às observações mais raras são atribuı́dos pesos
maiores e às observações mais comuns pesos menores para se atingir o balanceamento
dos grupos. Assim, no grupo controle são mais comuns crianças de famı́lias com baixa
renda e escolaridade, como, por exemplo, as observações 1 e 4. A estes casos foram

156
8.3. Passos na análise com escore de propensão

0.6
Escore de propensão

0.4
0.2

0 1

Tipo de parto

Figura 8.1.: Verificando área de suporte comum pelo boxplot.

Tabela 8.6.: Cálculo dos pesos para tratamento binário

Efeito Causal Grupo Peso


Efeito médio do trata- Tratamento 1/P r[T = 1|P ]
mento (ATE)
Controle 1/(1 − P r[T = 1|P ])
Efeito médio do trata- Tratamento 1
mento entre os tratados
(ATT)
Controle P r[T = 1|P ]/(1 − P r[T = 1|P ])

atribuı́dos pesos baixos. No grupo de participantes do PSF, por outro lado, são mais
raras crianças com maior renda e escolaridade, como a criança 2. Note que esta criança
recebeu um peso maior (2,35) para compensar. Já no grupo controle são mais comuns
crianças de maior renda e escolaridade, que receberam pesos baixos, e menos comuns

157
8. Métodos de análise com escore de propensão

0.8
0.6
Escore de propensao

0.4
0.2
0.0

0 1

Programa de Retreinamento Profissional

Figura 8.2.: Verificando área de suporte comum pelo boxplot.

crianças de menor renda e escolaridade, que receberam pesos mais elevados para
compensar. A atribuição de pesos diferenciados é uma estratégia para reequilibrar os
grupos e atingir a permutabilidade. Se o equilı́brio for atingido pode-se, então, estimar
o efeito causal sem viés em relação às variáveis observadas e incluı́das no modelo
preditivo.

8.3.5. Verificação do balanceamento após a implementação do


escore de propensão
Uma vez calculados os escores de propensão e atribuı́dos os pesos para cálculo do ATE
ou ATT, é fundamental, antes do cálculo do efeito causal, verificar se o balanceamento
foi atingido em relação às variáveis observadas. A melhor forma de se avaliar isto é por
meio da diferença padronizada absoluta nas médias e da razão de variâncias. Como
vimos, para que se considere que o balanceamento adequado foi atingido, a diferença
padronizada absoluta nas médias idealmente deve ser <0,10 e a razão de variâncias
deve estar entre 0,8 e 1,2.

158
8.3. Passos na análise com escore de propensão

Tabela 8.7.: Cálculo do escore de propensão e dos pesos para estimativa do ATE

Número PSFa Rendab Escolaridadec Escored Peso


1 1 0,25 2 0,90 1,11
2 1 1 4 0,43 2,35
3 1 0,75 6 0,53 1,89
4 1 0,50 2 0,81 1,23
5 1 0,50 8 0,63 1,58
6 0 1 3 0,46 1,87
7 0 0,75 7 0,49 1,96
8 0 0,50 5 0,73 3,72
9 0 2 10 0,02 1.02
10 0 3 15 0,01 1,00
a
PSF = Participação no Programa de Saúde da Famı́lia
b
Renda familiar per capita em salários mı́nimos
c
Escolaridade materna em anos de estudo
d
Escore de propensão

Observe, abaixo, a avaliação do balanceamento obtida no Stata após a realização


da ponderação pelo inverso da probabilidade de seleção por meio do comando teffects.
Note que todas as diferenças absolutas nas médias padronizadas idealmente são <0,10
e todas as razões de variâncias estão no intervalo entre 0,8 e 1,2. Desta forma, pelo
menos em relação às variáveis observadas, pode-se afirmar que o balanceamento foi
atingido.

Covariate balance summary


Raw Weighted

Number of obs = 1,904 1,904.0


Treated obs = 591 952.4
Control obs = 1,313 951.6

Standardized differences Variance ratio


Raw Weighted Raw Weighted

catint .1928387 -.0031279 1.800543 .9899896


trabmat .1370162 -.0014911 1.219209 .9977647

escmae
1a4 -.1532383 .0055268 .9554554 1.001324
5a8 .0448425 -.0060748 1.044838 .9940105
9a11 .1007613 -.0054168 1.200763 .9898137
12+ .1476059 -.0000941 1.494564 .9997353

ocup
qualsemi .0362967 .0108872 .980052 .9937518
nmanual .2036214 -.0085443 1.43121 .9840537

159
8. Métodos de análise com escore de propensão

sconj
uniaocons -.0732544 .0180009 .7712619 1.061799
casada .1169 -.0113744 .7504987 1.026569

idmae .3225247 -.0078283 1.037367 .9415375


parid -.0719253 -.011124 .7226207 .9273329
bpeso .0107241 .0045579 1.040332 1.016417
premat -.0558805 -.0219809 .8228868 .9255912
fumomat -.0308547 .0001705 .9665551 1.000191
sexo -.0071836 -.0038842 1.000277 .9996545

Usando o pacote twang do R, estimamos o escore de propensão por meio de GBM.


Veja, abaixo, a listagem das estatı́sticas de balanceamento antes e após a implementação
do escore de propensão. Note que todas as diferenças padronizadas absolutas nas médias
foram inferiores a 0,10 e todas as estatı́sticas (teste t de Student para variáveis contı́nuas,
qui-quadrado para variáveis categóricas e o teste de Kolmogorov-Smirnov) foram não
significantes, indicando que o balanceamento foi atingido em relação as variáveis
observadas.
$unw
t x . mn t x . sd c t . mn c t . sd s t d . e f f . sz stat p ks ks . pval
catint 0.113 0.317 0.059 0.236 0.203 3.700 0.000 0.054 0.178
trabmat 0.237 0.426 0.181 0.385 0.139 2.717 0.007 0.056 0.153
escmaef : 1 0.012 0.108 0.038 0.191 −0.243 6.885 0.000 0.026 0.000
escmaef : 2 0.387 0.487 0.463 0.499 −0.155 NA NA 0.076 0.000
escmaef : 3 0.294 0.456 0.274 0.446 0.044 NA NA 0.020 0.000
escmaef : 4 0.184 0.388 0.147 0.354 0.097 NA NA 0.037 0.000
escmaef : 5 0.122 0.327 0.078 0.268 0.135 NA NA 0.044 0.000
ocupf : 1 0.140 0.347 0.235 0.424 −0.271 16.440 0.000 0.094 0.000
ocupf : 2 0.648 0.478 0.631 0.483 0.037 NA NA 0.017 0.000
ocupf : 3 0.212 0.408 0.135 0.342 0.188 NA NA 0.077 0.000
sconjf :1 0.039 0.193 0.058 0.234 −0.098 2.697 0.068 0.019 0.068
sconjf :2 0.056 0.230 0.074 0.262 −0.079 NA NA 0.018 0.068
sconjf :3 0.905 0.293 0.868 0.338 0.126 NA NA 0.037 0.068
idmae 27.257 5.809 25.401 5.703 0.320 6.491 0.000 0.140 0.000
parid 2.242 1.487 2.359 1.749 −0.070 −1.499 0.134 0.034 0.709
bpeso 0.064 0.245 0.062 0.241 0.011 0.216 0.829 0.003 1.000
premat 0.059 0.236 0.073 0.260 −0.055 −1.150 0.250 0.014 1.000
fumomat 0.247 0.432 0.260 0.439 −0.031 −0.625 0.532 0.013 1.000
sexo 0.475 0.500 0.479 0.500 −0.007 −0.145 0.885 0.004 1.000

$ e s . mean .ATE
t x . mn t x . sd c t . mn c t . sd s t d . e f f . sz stat p ks ks . pval
catint 0.079 0.270 0.074 0.262 0.018 0.374 0.709 0.005 1.000
trabmat 0.199 0.400 0.195 0.396 0.010 0.195 0.845 0.004 1.000
escmaef : 1 0.019 0.136 0.031 0.173 −0.087 0.516 0.711 0.012 0.711
escmaef : 2 0.435 0.496 0.442 0.497 −0.012 NA NA 0.006 0.711
escmaef : 3 0.287 0.452 0.278 0.448 0.019 NA NA 0.009 0.711
escmaef : 4 0.163 0.370 0.158 0.365 0.013 NA NA 0.005 0.711
escmaef : 5 0.095 0.294 0.091 0.288 0.014 NA NA 0.004 0.711
ocupf : 1 0.190 0.392 0.207 0.405 −0.044 0.347 0.703 0.017 0.703
ocupf : 2 0.648 0.478 0.638 0.481 0.021 NA NA 0.010 0.703
ocupf : 3 0.162 0.369 0.155 0.362 0.019 NA NA 0.007 0.703
sconjf :1 0.047 0.211 0.052 0.223 −0.028 0.242 0.785 0.006 0.785
sconjf :2 0.061 0.239 0.067 0.250 −0.026 NA NA 0.006 0.785
sconjf :3 0.892 0.310 0.880 0.325 0.039 NA NA 0.012 0.785
idmae 25.855 5.520 25.822 5.706 0.006 0.111 0.911 0.014 1.000
parid 2.199 1.501 2.306 1.666 −0.067 −1.296 0.195 0.019 0.999
bpeso 0.056 0.230 0.061 0.239 −0.020 −0.394 0.694 0.005 1.000
premat 0.055 0.228 0.068 0.251 −0.053 −1.034 0.301 0.013 1.000
fumomat 0.248 0.432 0.254 0.435 −0.013 −0.254 0.799 0.006 1.000

160
8.3. Passos na análise com escore de propensão

es.mean.ATE

0.3
Absolute standard difference

0.2

0.1

0.0

Unweighted Weighted

Figura 8.3.: Diferenças absolutas na médias padronizadas.

sexo 0.481 0.500 0.480 0.500 0.001 0.022 0.982 0.001 1.000

Na figura 8.3, obtida no R, fica mais fácil de visualizar que todas as diferenças
padronizadas absolutas nas médias se encontram abaixo de 0,10. Note, ainda, que as
diferenças absolutas nas médias padronizadas diminuı́ram, comparando-se as estimativas
não ponderadas com as ponderadas.

8.3.6. Cálculo do efeito causal em modelo ponderado pelo escore


de propensão
Uma vez verificado o balanceamento podemos prosseguir agora para a estimativa
do efeito causal (ATE) em modelo de regressão linear, ponderado pelo inverso da
probabilidade de seleção (ou de tratamento). Quando estimamos o escore de propensão
por regressão logı́stica, a estimativa obtida foi 1,29 (Intervalo de Confiança de 95% 0,77
- 1,82), com p <0,001, sugerindo que dentre os nascidos com parto cesárea o ı́ndice
de massa corporal é 1,29 kg/m2 do que entre os nascidos de parto vaginal. Quando
usamos GBM a estimativa foi bastante próxima, 1,25, com p <0,001.

161
8. Métodos de análise com escore de propensão

8.4. Correção para efeito do desenho e/ou para perdas


de seguimento
Usando-se ponderação pelo inverso da probabilidade de seleção é também possı́vel
levar-se em conta o delineamento complexo de amostragem e corrigir para o efeito de
desenho. Se as probabilidades de seleção para cada participante não forem as mesmas,
é possı́vel se incluir o peso referente ao processo desigual de seleção dos indivı́duos.
Em vários programas estatı́sticos também é possı́vel levar-se em conta o efeito de
conglomerado (cluster) e a estratificação utilizada quando da escolha da amostra.
Além disso, se houver perdas de seguimento e for possı́vel se recuperar as probabili-
dades de participação no estudo, é possı́vel se realizar ponderação também por perdas
de seguimento, corrigindo-se ou atenuando-se o viés de seleção. Assim, bastar calcular,
por exemplo, em um modelo logı́stico, as probabilidades de cada indivı́duo participar
no seguimento e, depois disso, calcular o inverso desta probabilidade de seleção, que
corresponderá ao peso que o participante terá na análise. Desta forma o peso para
corrigir o viés de seleção será dado pela fórmula 8.3, onde P=participação no estudo , T
= tratamento e P = demais variáveis preditoras da participação (Hernan and Robins,
2018).
1
P esoP art = (8.3)
P r[P art = 1|T, P ]

E, no final, basta multiplicar o peso calculado a partir do escore de propensão, pelo


peso referente à probabilidade de participação no estudo. Este peso final, P esoF inal =
P esoEP ∗ P esoP art será, então, usado na ponderação, quando se estará corrigindo ou
atenuando, simultaneamente, para viés de confundimento e para viés de seleção. O
primeiro peso, P esoEP , é o inverso da probabilidade de tratamento, em função das
variáveis preditoras do tratamento, que corresponde ao escore de propensão. Por meio
deste peso é feito o ajuste para a distribuição desigual de algumas caracterı́sticas dos
sujeitos nos grupos de tratamento e controle. Assim, a amostra ponderada representa
uma pseudo-população na qual tratados e não tratados passam a possuir distribuições
similares em relação às variáveis observadas (Leite, 2017). O segundo peso P esoP art é
o inverso da probabilidade de participação no estudo em função das variáveis preditoras
da participação, sendo que, geralmente, o tratamento também é preditor da participação
no estudo. Este peso amostral ajusta para viés de seleção devido à superamostragem de
indivı́duos com determinadas caracterı́sticas por efeito deliberado do desenho ou por
perdas de seguimento, de tal forma que a amostra ponderada passa a ser semelhante à
população de origem (Leite, 2017).

162
9. Exemplo de análise com escore de
propensão em Epidemiologia no R
Para rodar este exemplo prático é necessária a instalação do R, R Studio e dos seguintes
pacotes:
# I n s t a l a n d o o s p a c o t e s n e c e s s á r i o s
i n s t a l l . packages ( ” survey ” )
i n s t a l l . p a c k a g e s ( ” twang ” )
i n s t a l l . packages ( ” descr ” )
i n s t a l l . p a c k a g e s ( ” MatchIt ” )
i n s t a l l . p a c k a g e s ( ” Matching ” )
i n s t a l l . p a c k a g e s ( ” rbounds ” )

9.1. Estimativa do efeito causal por meio de escore de


propensão
Neste exemplo, vamos realizar a estimativa do efeito de um programa de retreinamento
profissional no rendimento dos indivı́duos. Os dados são do National Supported Work
Project, publicados por Dehejia e Wahba (1999). Na tabela 9.1 constam as variáveis
que utilizaremos neste exercı́cio.
Os comandos que se seguem realizam a análise no R.

9.1.1. Ponderação com escore de propensão


1. Para abrir o arquivo precisamos primeiro carregar o pacote twang. Em seguida abra
o arquivo lalonde e peça a listagem das primeiras 15 e das últimas 15 observações.
Em seguida, carregue o pacote ou biblioteca descr e obtenha a frequência da
variável treat. Observe que há 185 casos que receberam o retreinamento e 429
não treinados, que servirão como controles.
# Carregando p a c o t e twang
> l i b r a r y ( twang )

# Abrindo banco de dados − l a l o n d e


# Obtendo l i s t a g e m da s o b s e r v a ç õ e s
> data ( l a l o n d e )

> head ( l a l o n d e , n=15)


t r e a t a g e educ b l a c k h i s p a n m a r r i e d n o d e g r e e r e 7 4 r e 7 5 re78
1 1 37 11 1 0 1 1 0 0 9930.0460
2 1 22 9 0 1 0 1 0 0 3595.8940
3 1 30 12 1 0 0 0 0 0 24909.4500
4 1 27 11 1 0 0 1 0 0 7506.1460
5 1 33 8 1 0 0 1 0 0 289.7899

163
9. Exemplo de análise com escore de propensão em Epidemiologia no R

Tabela 9.1.: Descrição do banco de dados lalonde

Variável Descrição Codificação


treat Participação no programa de treinamento 0 = não
1= sim
age Idade em anos 17 a 55
educ Escolaridade em anos de estudo 0 a 18
black Cor da pele preta 0 = não
1= sim
hispan Hispânico 0 = não
1= sim
married Casado 0 = não
1= sim
nodegree Sem diploma universitário 0 = não
1= sim
re74 Rendimento anual em 1974 0 a 35040.07
re75 Rendimento anual em 1975 0 a 25142.24
re78 Rendimento anual em 1978 0 a 60307.93

6 1 22 9 1 0 0 1 0 0 4056.4940
7 1 23 12 1 0 0 0 0 0 0.0000
8 1 32 11 1 0 0 1 0 0 8472.1580
9 1 22 16 1 0 0 0 0 0 2164.0220
10 1 33 12 0 0 1 0 0 0 12418.0700
11 1 19 9 1 0 0 1 0 0 8173.9080
12 1 21 13 1 0 0 0 0 0 17094.6400
13 1 18 8 1 0 0 1 0 0 0.0000
14 1 27 10 1 0 1 1 0 0 18739.9300
15 1 17 7 1 0 0 1 0 0 3023.8790

> t a i l ( l a l o n d e , n=15)
t r e a t a g e educ b l a c k h i s p a n m a r r i e d n o d e g r e e r e 7 4 r e 7 5 re78
600 0 43 6 0 0 1 1 0 0 0.0000
601 0 34 12 1 0 0 0 0 0 0.0000
602 0 16 8 0 1 0 1 0 0 12242.9600
603 0 27 12 0 0 1 0 0 0 1533.8800
604 0 51 4 1 0 0 1 0 0 0.0000
605 0 39 2 1 0 1 1 0 0 964.9555
606 0 55 8 0 0 1 1 0 0 0.0000
607 0 16 9 0 0 0 1 0 0 5551.8190
608 0 27 10 1 0 0 1 0 0 7543.7940
609 0 25 14 0 0 0 0 0 0 0.0000
610 0 18 11 0 0 0 1 0 0 10150.5000
611 0 24 1 0 1 1 1 0 0 19464.6100
612 0 21 18 0 0 0 0 0 0 0.0000
613 0 32 5 1 0 1 1 0 0 187.6713
614 0 16 9 0 0 0 1 0 0 1495.4590

# Carregando b i b l i o t e c a descr
> library ( descr )

# Obtendo a d i s t r i b u i ç ã o de f r e q u ê n c i a s da v a r i á v e l t r a t a m e n t o
> freq ( lalonde $ treat )
lalonde $ treat

164
9.1. Estimativa do efeito causal por meio de escore de propensão

F r e q uê n c i a P e r c e n t u a l
0 260 58.43
1 185 41.57
Total 445 100.00

2. Após a abertura do arquivo, vamos primeiro calcular as estimativas de associação


em modelos de regressão simples (não ajustado) e múltipla (ajustado). A variável
explanatória é treat, codificada como 1 quando o indivı́duo participou do programa
de retreinamento profissional e 0 em caso contrário. A variável desfecho é a renda
em 1978, quatro anos após o inı́cio do programa de retreinamento. Compare as
duas estimativas do efeito médio do tratamento (ATE). Observe que a estimativa
não ajustada não foi significante (p=0,334), enquanto a estimativa ajustada foi de
um aumento de US$ 1,548, p<0,048 no grupo tratado, que frequentou o programa
de retreinamento profissional, comparado com o grupo controle, que participou
do programa.
# Estimando a s s o c i a ç ã o em modelo de r e g r e s s ã o não a j u s t a d o
> r e g <− lm ( r e 7 8 ˜ t r e a t , d a t a=l a l o n d e )
> summary ( r e g )

Call :
lm ( f o r m u l a = r e 7 8 ˜ t r e a t , d a t a = l a l o n d e )

Residuals :
Min 1Q Median 3Q Max
−6984 −6349 −2048 4100 53959

Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( >| t | )
( Intercept ) 6984.2 360.7 19.362 <2e −16 ∗∗∗
treat −635.0 657.1 −0.966 0.334
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1

R e s i d u a l s t a n d a r d e r r o r : 7471 on 612 d e g r e e s o f f r e e d o m
M u l t i p l e R−s q u a r e d : 0.001524 , A d j u s t e d R−s q u a r e d : −0.0001079
F− s t a t i s t i c : 0 . 9 3 3 8 on 1 and 612 DF, p−v a l u e : 0 . 3 3 4 2

# Estimando a s s o c i a ç ã o em modelo de r e g r e s s ã o a j u s t a d o
> r e g <− lm ( r e 7 8 ˜ t r e a t + a g e + educ + b l a c k + h i s p a n + n o d e g r e e +
m a r r i e d + r e 7 4 + r e 7 5 , d a t a=l a l o n d e )
> summary ( r e g )

Call :
lm ( f o r m u l a = r e 7 8 ˜ t r e a t + a g e + educ + b l a c k + h i s p a n + n o d e g r e e +
married + re74 + re75 , data = l a l o n d e )

Residuals :
Min 1Q Median 3Q Max
−13595 −4894 −1662 3929 54570

Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( >| t | )
( Intercept ) 6 . 6 5 1 e+01 2 . 4 3 7 e+03 0.027 0.9782
treat 1 . 5 4 8 e+03 7 . 8 1 3 e+02 1.982 0.0480 ∗
age 1 . 2 9 8 e+01 3 . 2 4 9 e+01 0.399 0.6897
educ 4 . 0 3 9 e+02 1 . 5 8 9 e+02 2.542 0.0113 ∗
black −1.241 e+03 7 . 6 8 8 e+02 −1.614 0.1071
hispan 4 . 9 8 9 e+02 9 . 4 1 9 e+02 0.530 0.5966
nodegree 2 . 5 9 8 e+02 8 . 4 7 4 e+02 0.307 0.7593
married 4 . 0 6 6 e+02 6 . 9 5 5 e+02 0.585 0.5590

165
9. Exemplo de análise com escore de propensão em Epidemiologia no R

re74 2 . 9 6 4 e −01 5 . 8 2 7 e −02 5 . 0 8 6 4 . 8 9 e −07 ∗∗∗


re75 2 . 3 1 5 e −01 1 . 0 4 6 e −01 2.213 0.0273 ∗
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1

R e s i d u a l s t a n d a r d e r r o r : 6948 on 604 d e g r e e s o f f r e e d o m
M u l t i p l e R−s q u a r e d : 0.1478 , A d j u s t e d R−s q u a r e d : 0.1351
F− s t a t i s t i c : 1 1 . 6 4 on 9 and 604 DF, p−v a l u e : < 2 . 2 e −16

3. Agora vamos verificar o balanceamento das variáveis antes da implementação do


escore de propensão. Faremos teste t de Student para variáveis contı́nuas e teste
do qui-quadrado para variáveis categóricas. Observe que as variáveis idade, renda
em 1974, renda em 1975, não possuir diploma universitário, percentual de pretos,
percentual de hispânicos e ser casado(a) não se encontram balanceadas entre os
grupos (todos os p valores são significantes). Apenas a variável escolaridade está
balanceada entre os grupos tratamento e controle (p valor não significante).
# Checando b a l a n c e a m e n t o e n t r e o s g r u p o s a n t e s da i m p l e m e n t a ç ã o do
e s c o r e de p r o p e n s ã o
# v a r i á v e l c o n tı́ n u a − t e s t t de S t u d e n t

> t . t e s t ( a g e ˜ t r e a t , d a t a=l a l o n d e , v a r . e q u a l=TRUE)

Two Sample t−t e s t

data : a g e by t r e a t
t = 2 . 5 5 9 , d f = 6 1 2 , p−v a l u e = 0 . 0 1 0 7 4
alternative hypothesis : true d i f f e r e n c e i n means i s n o t e q u a l t o 0
95 p e r c e n t c o n f i d e n c e i n t e r v a l :
0.5149437 3.9132300
sample e s t i m a t e s :
mean i n group 0 mean i n group 1
28.03030 25.81622

> t . t e s t ( educ ˜ t r e a t , d a t a=l a l o n d e , v a r . e q u a l=TRUE)

Two Sample t−t e s t

data : educ by t r e a t
t = −0. 47 77 5 , d f = 6 1 2 , p−v a l u e = 0 . 6 3 3
a l t e r n a t i v e h y p o t h e s i s : t r u e d i f f e r e n c e i n means i s n o t e q u a l t o 0
95 p e r c e n t c o n f i d e n c e i n t e r v a l :
−0.5648015 0.3437720
sample e s t i m a t e s :
mean i n group 0 mean i n group 1
10.23543 10.34595

> t . t e s t ( r e 7 4 ˜ t r e a t , d a t a=l a l o n d e , v a r . e q u a l=TRUE)

Two Sample t−t e s t

data : r e 7 4 by t r e a t
t = 6 . 3 8 1 5 , d f = 6 1 2 , p−v a l u e = 3 . 4 6 5 e −10
a l t e r n a t i v e h y p o t h e s i s : t r u e d i f f e r e n c e i n means i s n o t e q u a l t o 0
95 p e r c e n t c o n f i d e n c e i n t e r v a l :
2439.282 4608.044
sample e s t i m a t e s :
mean i n group 0 mean i n group 1
5619.237 2095.574

166
9.1. Estimativa do efeito causal por meio de escore de propensão

> t . t e s t ( r e 7 5 ˜ t r e a t , d a t a=l a l o n d e , v a r . e q u a l=TRUE)

Two Sample t−t e s t

data : r e 7 5 by t r e a t
t = 3 . 2 4 8 6 , d f = 6 1 2 , p−v a l u e = 0 . 0 0 1 2 2 3
a l t e r n a t i v e h y p o t h e s i s : t r u e d i f f e r e n c e i n means i s n o t e q u a l t o 0
95 p e r c e n t c o n f i d e n c e i n t e r v a l :
369.5384 1499.3199
sample e s t i m a t e s :
mean i n group 0 mean i n group 1
2466.484 1532.055

# v a r i á v e l c a t e g ó r i c a − t e s t e do qui−quadrado

> c r o s s t a b ( l a l o n d e $ t r e a t , l a l o n d e $ n o d e g r e e , prop . r=TRUE, c h i s q=TRUE,


p l o t = F)
Conte údo d as c é l u l a s
|−−−−−−−−−−−−−−−−−−−−−−−−−|
| Contagem |
| P e r c e n t u a l por l i n h a |
|−−−−−−−−−−−−−−−−−−−−−−−−−|

======================================
lalonde $ nodegree
lalonde $ treat 0 1 Total
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
0 173 256 429
40.3% 59.7% 69.9%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
1 54 131 185
29.2% 70.8% 30.1%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Total 227 387 614
======================================

E s t a tı́ s t i c a s p a r a t o d o s o s f a t o r e s da t a b e l a

P e a r s o n ’ s Chi−s q u a r e d t e s t
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 6 . 8 8 0 3 2 3 g. l . = 1 p = 0.00871

P e a r s o n ’ s Chi−s q u a r e d t e s t w i t h Y at e s ’ c o n t i n u i t y c o r r e c t i o n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 6 . 4 1 0 6 8 2 g. l . = 1 p = 0.0113
F r e q uê n c i a e s p e r a d a mı́nima : 6 8 . 3 9 5 7 7

> c r o s s t a b ( l a l o n d e $ t r e a t , l a l o n d e $ m a r r i e d , prop . r=TRUE, c h i s q=TRUE, plot


= F)
Conte údo d as c é l u l a s
|−−−−−−−−−−−−−−−−−−−−−−−−−|
| Contagem |
| P e r c e n t u a l por l i n h a |
|−−−−−−−−−−−−−−−−−−−−−−−−−|

======================================
l a l o n d e $ married
lalonde $ treat 0 1 Total
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
0 209 220 429
48.7% 51.3% 69.9%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
1 150 35 185
81.1% 18.9% 30.1%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Total 359 255 614

167
9. Exemplo de análise com escore de propensão em Epidemiologia no R

======================================

E s t a tı́ s t i c a s p a r a t o d o s o s f a t o r e s da t a b e l a

P e a r s o n ’ s Chi−s q u a r e d t e s t
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 5 5 . 7 5 2 4 4 g. l . = 1 p = 8 . 2 2 e −14

P e a r s o n ’ s Chi−s q u a r e d t e s t w i t h Y a te s ’ c o n t i n u i t y c o r r e c t i o n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 5 4 . 4 2 7 6 4 g. l . = 1 p = 1 . 6 1 e −13
F r e q uê n c i a e s p e r a d a mı́nima : 7 6 . 8 3 2 2 5

> c r o s s t a b ( l a l o n d e $ t r e a t , l a l o n d e $ b l a c k , prop . r=TRUE, c h i s q=TRUE, plot =


F)
Conte údo das c é l u l a s
|−−−−−−−−−−−−−−−−−−−−−−−−−|
| Contagem |
| P e r c e n t u a l por l i n h a |
|−−−−−−−−−−−−−−−−−−−−−−−−−|

======================================
lalonde $ black
lalonde $ treat 0 1 Total
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
0 342 87 429
79.7% 20.3% 69.9%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
1 29 156 185
15.7% 84.3% 30.1%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Total 371 243 614
======================================

E s t a tı́ s t i c a s p a r a t o d o s o s f a t o r e s da t a b e l a

P e a r s o n ’ s Chi−s q u a r e d t e s t
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 2 2 1 . 7 0 8 5 g. l . = 1 p <2e −16

P e a r s o n ’ s Chi−s q u a r e d t e s t w i t h Y a te s ’ c o n t i n u i t y c o r r e c t i o n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 2 1 9 . 0 3 8 4 g. l . = 1 p <2e −16
F r e q uê n c i a e s p e r a d a mı́nima : 7 3 . 2 1 6 6 1

> c r o s s t a b ( l a l o n d e $ t r e a t , l a l o n d e $ h i s p a n , prop . r=TRUE, c h i s q=TRUE, plot


= F)
Conte údo d as c é l u l a s
|−−−−−−−−−−−−−−−−−−−−−−−−−|
| Contagem |
| P e r c e n t u a l por l i n h a |
|−−−−−−−−−−−−−−−−−−−−−−−−−|

======================================
lalonde $ hispan
lalonde $ treat 0 1 Total
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
0 368 61 429
85.8% 14.2% 69.9%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
1 174 11 185
94.1% 5.9% 30.1%
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Total 542 72 614
======================================

168
9.1. Estimativa do efeito causal por meio de escore de propensão

E s t a tı́ s t i c a s p a r a t o d o s o s f a t o r e s da t a b e l a

P e a r s o n ’ s Chi−s q u a r e d t e s t
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 8 . 5 4 6 9 1 4 g. l . = 1 p = 0.00346

P e a r s o n ’ s Chi−s q u a r e d t e s t w i t h Y at e s ’ c o n t i n u i t y c o r r e c t i o n
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
Qui2 = 7 . 7 6 6 3 5 9 g. l . = 1 p = 0.00532
F r e q uê n c i a e s p e r a d a mı́nima : 2 1 . 6 9 3 8 1

4. Podemos também fazer o teste em modelo de regressão linear, colocando a variável


contı́nua como resposta e o tratamento como variável explanatória. Veja um
exemplo abaixo com a variável contı́nua renda em 1974.
# v a r i á v e l c o n tı́ n u a − r e g r e s s ã o l i n e a r com o t r a t a m e n t o como v a r i á v e l
e x p l a n a t ó r i a e a v a r i á v e l c o n tı́ n u a ( r e n d a em 1 9 7 4 ) como r e s p o s t a
> r e g <− lm ( r e 7 4 ˜ t r e a t , d a t a=l a l o n d e )
> summary ( r e g )

Call :
lm ( f o r m u l a = r e 7 4 ˜ t r e a t , d a t a = l a l o n d e )

Residuals :
Min 1Q Median 3Q Max
−5619 −4970 −2096 2674 32944

Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( >| t | )
( Intercept ) 5619.2 303.1 1 8 . 5 4 0 < 2 e −16 ∗∗∗
treat −3523.7 552.2 −6.381 3 . 4 6 e −10 ∗∗∗
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1

R e s i d u a l s t a n d a r d e r r o r : 6278 on 612 d e g r e e s o f f r e e d o m
M u l t i p l e R−s q u a r e d : 0.06239 , A d j u s t e d R−s q u a r e d : 0.06086
F− s t a t i s t i c : 4 0 . 7 2 on 1 and 612 DF, p−v a l u e : 3 . 4 6 5 e −10

5. Podemos também fazer o teste em modelo de regressão logı́stica, colocando a


variável categórica como resposta e o tratamento como variável explanatória. Veja
um exemplo abaixo com a variável categórica sem diploma universitário.
# v a r i á v e l c a t e g ó r i c a − r e g r e s s ã o l o gı́ s t i c a com o t r a t a m e n t o como
v a r i á v e l e x p l a n a t ó r i a e a v a r i á v e l c a t e g ó r i c a ( sem d i s p l o m a
u n i v e r s i t á r i o ) como r e s p o s t a
> r e g <− glm ( n o d e g r e e ˜ t r e a t , f a m i l y=b i n o m i a l ( ) , d a t a=l a l o n d e )
> summary ( r e g )

Call :
glm ( f o r m u l a = n o d e g r e e ˜ t r e a t , f a m i l y = binomial ( ) , data = l a l o n d e )

Deviance R e s i d u a l s :
Min 1Q Median 3Q Max
−1.5693 −1.3477 0.8308 1.0162 1.0162

Coefficients :
E s t i m a t e Std . E r r o r z v a l u e Pr ( >| z | )
( Intercept ) 0.39189 0.09842 3 . 9 8 2 6 . 8 4 e −05 ∗∗∗
treat 0.49433 0.18931 2.611 0 . 0 0 9 0 2 ∗∗
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1

169
9. Exemplo de análise com escore de propensão em Epidemiologia no R

( D i s p e r s i o n p a r a m e t e r f o r b i n o m i a l f a m i l y t a k e n t o be 1 )

Null deviance : 809.01 on 613 d e g r e e s o f freedom


Residual deviance : 801.98 on 612 d e g r e e s o f freedom
AIC : 8 0 5 . 9 8

Number o f F i s h e r S c o r i n g iterations : 4

6. Vamos agora calcular o escore de propensão para cada indivı́duo, que nada mais
é do que a probabilidade de participação no programa predita pelo modelo. Para
realizar isto, vamos rodar um modelo logı́stico, tendo como desfecho a participação
no treinamento (treat) e como variáveis preditoras: idade, escolaridade, cor da
pele preta, hispânico, casado, sem diploma universitário, renda em 74 e renda em
75.
# E s t i m a ç ã o do e s c o r e de p r o p e n s ã o p o r r e g r e s s ã o l o gı́ s t i c a
> p s l o g<− glm ( t r e a t ˜ a g e + educ + b l a c k + h i s p a n + n o d e g r e e + m a r r i e d +
re74 + re75 ,
+ f a m i l y=b i n o m i a l ( ) , d a t a=l a l o n d e )
> summary ( p s l o g )

Call :
glm ( f o r m u l a = t r e a t ˜ a g e + educ + b l a c k + h i s p a n + n o d e g r e e +
married + re74 + re75 , f a m i l y = binomial ( ) , data = l a l o n d e )

Deviance R e s i d u a l s :
Min 1Q Median 3Q Max
−1.7645 −0.4736 −0.2862 0.7508 2.7169

Coefficients :
E s t i m a t e Std . E r r o r z v a l u e Pr ( >| z | )
( I n t e r c e p t ) −4.729 e+00 1 . 0 1 7 e+00 −4.649 3 . 3 3 e −06 ∗∗∗
age 1 . 5 7 8 e −02 1 . 3 5 8 e −02 1.162 0.24521
educ 1 . 6 1 3 e −01 6 . 5 1 3 e −02 2.477 0.01325 ∗
black 3 . 0 6 5 e+00 2 . 8 6 5 e −01 1 0 . 6 9 9 < 2 e −16 ∗∗∗
hispan 9 . 8 3 6 e −01 4 . 2 5 7 e −01 2.311 0.02084 ∗
nodegree 7 . 0 7 3 e −01 3 . 3 7 7 e −01 2.095 0.03620 ∗
married −8.321 e −01 2 . 9 0 3 e −01 −2.866 0 . 0 0 4 1 5 ∗∗
re74 −7.178 e −05 2 . 8 7 5 e −05 −2.497 0.01253 ∗
re75 5 . 3 4 5 e −05 4 . 6 3 5 e −05 1.153 0.24884
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1

( D i s p e r s i o n p a r a m e t e r f o r b i n o m i a l f a m i l y t a k e n t o be 1 )

Null deviance : 751.49 on 613 d e g r e e s o f freedom


Residual deviance : 487.84 on 605 d e g r e e s o f freedom
AIC : 5 0 5 . 8 4

Number o f F i s h e r S c o r i n g iterations : 5

7. Em seguida vamos gravar o escore de propensão no banco de dados.


# I n c l u i n d o o e s c o r e de p r o p e n s ã o no banco de dados
> l a l o n d e \ $ p s l o g <− p r e d i c t ( p s l o g , t y p e=” r e s p o n s e ” )

Agora peça uma listagem das primeiras observações (tratados) e verifique que o
escore de propensão (pslog) foi calculado e adicionado ao banco de dados.
# Obtendo l i s t a g e m d a s 10 p r i m e i r a s o b s e r v a ç õ e s
> head ( l a l o n d e , n =10)
t r e a t age educ b l a c k h i s p a n married n o d e g r e e re74 re75 re78 pslog

170
9.1. Estimativa do efeito causal por meio de escore de propensão

1 1 37 11 1 0 1 1 0 0 9930.0460 0.63876993
2 1 22 9 0 1 0 1 0 0 3595.8940 0.22463424
3 1 30 12 1 0 0 0 0 0 24909.4500 0.67824388
4 1 27 11 1 0 0 1 0 0 7506.1460 0.77632408
5 1 33 8 1 0 0 1 0 0 289.7899 0.70163874
6 1 22 9 1 0 0 1 0 0 4056.4940 0.69906990
7 1 23 12 1 0 0 0 0 0 0.0000 0.65368426
8 1 32 11 1 0 0 1 0 0 8472.1580 0.78972311
9 1 22 16 1 0 0 0 0 0 2164.0220 0.77983825
10 1 33 12 0 0 1 0 0 0 12418.0700 0.04292461

Agora peça uma listagem das últimas observações (não tratados)


# Obtendo l i s t a g e m d a s 10 ú l t i m a s o b s e r v a ç õ e s
> t a i l ( l a l o n d e , n =10)
t r e a t age educ b l a c k h i s p a n married n o d e g r e e re74 re75 re78 pslog
605 0 39 2 1 0 1 1 0 0 964.9555 0.29939542
606 0 55 8 0 0 1 1 0 0 0.0000 0.06325293
607 0 16 9 0 0 0 1 0 0 5551.8190 0.08971192
608 0 27 10 1 0 0 1 0 0 7543.7940 0.74707356
609 0 25 14 0 0 0 0 0 0 0.0000 0.11145877
610 0 18 11 0 0 0 1 0 0 10150.5000 0.12314388
611 0 24 1 0 1 1 1 0 0 19464.6100 0.03456038
612 0 21 18 0 0 0 0 0 0 0.0000 0.18335100
613 0 32 5 1 0 1 1 0 0 187.6713 0.38303231
614 0 16 9 0 0 0 1 0 0 1495.4590 0.08971192

8. Antes de se realizar qualquer estimativa, é importante avaliar se existe área de


suporte comum entre os tratados e seus potenciais controles. Vamos verificar a
área de suporte comum, desenhando um boxplot da distribuição do escore de
propensão, separadamente nos grupos tratamento e controle. Como você pode
observar na figura 9.1 (este exemplo foi também mostrado no capı́tulo 8), há pouca
zona de suporte comum. No grupo tratado, a maioria dos escores de propensão
estão acima de 0,4, enquanto no grupo controle os escores predominam na faixa
inferior a 0,2. Como vimos, neste caso seria mais adequado estimar o ATT (Efeito
médio do tratamento nos tratados).
# V e r i f i c a n d o á r e a de s u p o r t e comum p e l o b o x p l o t
> b o x p l o t ( p s l o g ˜ t r e a t , d a t a=l a l o n d e , y l a b=” E s c o r e de p r o p e n s a o ” , x l a b=
” Programa de R e t r e i n a m e n t o P r o f i s s i o n a l ” )

9. Apesar do efeito médio do tratamento (ATE) não ser a melhor estimativa, vamos
realizar o seu cálculo para demonstração. Inicialmente, calcularemos os pesos
para estimar o ATE em modelo estrutural marginal, com ponderação pelo inverso
da probabilidade de tratamento, utilizando as fórmulas da tabela 8.6. Em seguida,
vamos obter uma listagem das primeiras 10 observações para verificar que o peso
(peso.ATE) foi incorporado ao banco de dados.
# Ponderação com e s c o r e de p r o p e n s ã o
# C a l c u l a n d o o s p e s o s usando ATE − E f e i t o médio do t r a t a m e n t o
# p a r a o grupo de t r a t a m e n t o = 1 / ps
# p a r a o grupo c o n t r o l e= 1(1− ps )
> l a l o n d e $ p e s o .ATE <− i f e l s e ( l a l o n d e $ t r e a t == 1 , 1 / l a l o n d e $ p s l o g , 1 /(1−
lalonde $ pslog ) )

# V e r i f i c a n d o se o peso foi incorporado ao banco de dados


> head ( l a l o n d e , n =10)
t r e a t age educ b l a c k hispan married nodegree re74 re75 re78 pslog peso
. ATE
1 1 37 11 1 0 1 1 0 0 9930.0460 0.63876993
1.565509
2 1 22 9 0 1 0 1 0 0 3595.8940 0.22463424
4.451681
3 1 30 12 1 0 0 0 0 0 24909.4500 0.67824388
1.474396

171
9. Exemplo de análise com escore de propensão em Epidemiologia no R

0.8
0.6
Escore de propensao

0.4
0.2
0.0

0 1

Programa de Retreinamento Profissional

Figura 9.1.: Verificando área de suporte comum pelo boxplot.

4 1 27 11 1 0 0 1 0 0 7506.1460 0.77632408
1.288122
5 1 33 8 1 0 0 1 0 0 289.7899 0.70163874
1.425235
6 1 22 9 1 0 0 1 0 0 4056.4940 0.69906990
1.430472
7 1 23 12 1 0 0 0 0 0 0.0000 0.65368426
1.529791
8 1 32 11 1 0 0 1 0 0 8472.1580 0.78972311
1.266267
9 1 22 16 1 0 0 0 0 0 2164.0220 0.77983825
1.282317
10 1 33 12 0 0 1 0 0 0 12418.0700 0.04292461
23.296656
>

10. Para checar o balanceamento após a ponderação com o escore de propensão,


vamos estimar um modelo de regressão linear ponderado pelo escore de propensão,
colocando a variável contı́nua como resposta e o tratamento como variável expla-
natória. Para isto vamos precisar usar o pacote survey, que calcula estimativa
robusta da variância, utilizando o método de Taylor. Veja que, para a variável
contı́nua (renda em 1974) não foi obtido balanceamento, pois o valor de P continua
significante (P=0,040).

172
9.1. Estimativa do efeito causal por meio de escore de propensão

# Checando b a l a n c e a m e n t o a p ó s a p o n d e r a ç ã o com e s c o r e de p r o p e n s ã o

# Carregando o p a c o t e s u r v e y p a r a o b t e r e s t i m a t i v a r o b u s t a da v a r i â n c i a
> l i b r a r y ( survey )

# v a r i á v e l c o n tı́ n u a − r e g r e s s ã o l i n e a r ponderada com o t r a t a m e n t o como


v a r i á v e l e x p l a n a t ó r i a e a v a r i á v e l c o n tı́ n u a ( r e n d a em 1 9 7 4 ) como
resposta
> d e s i g n . p s l o g <− s v y d e s i g n ( i d s=˜ 1 , w e i g h t s=˜ p e s o . ATE, d a t a=l a l o n d e )
> glm <− svyglm ( r e 7 4 ˜ t r e a t , d e s i g n=d e s i g n . p s l o g )
> summary ( glm )

Call :
svyglm ( f o r m u l a = r e 7 4 ˜ t r e a t , design = design . pslog )

Survey d e s i g n :
s v y d e s i g n ( i d s = ˜ 1 , w e i g h t s = ˜ p e s o . ATE, d a t a = l a l o n d e )

Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( >| t | )
( Intercept ) 4552.7 309.6 14.705 <2e −16 ∗∗∗
treat −1620.6 786.0 −2.062 0.0396 ∗
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1

( D i s p e r s i o n p a r a m e t e r f o r g a u s s i a n f a m i l y t a k e n t o be 3 6 5 0 6 4 3 7 )

Number o f F i s h e r S c o r i n g iterations : 2

11. E para variável categórica, vamos estimar modelo de regressão logı́stica ponderado
pelo escore de propensão, colocando a variável categórica como resposta e o
tratamento como variável explanatória. Observe que para a variável não possuir
diploma universitário, o balanceamento foi obtido, pois o valor de P deixou de ser
significante (P=0,452). Faça, agora, o teste para as demais variáveis (contı́nuas e
categóricas) e anote para quais variáveis o balanceamento não foi obtido.
# v a r i á v e l c a t e g ó r i c a − r e g r e s s ã o l i n e a r ponderada com o t r a t a m e n t o como
v a r i á v e l e x p l a n a t ó r i a e a v a r i á v e l c a t e g ó r i c a ( sem d ip lo m a
u n i v e r s i t á r i o ) como r e s p o s t a
> glm <− svyglm ( n o d e g r e e ˜ t r e a t , f a m i l y=b i n o m i a l , d e s i g n=d e s i g n . p s l o g )
Warning message :
I n e v a l ( expr , e n v i r , e n c l o s ) : non−i n t e g e r #s u c c e s s e s i n a b i n o m i a l glm !
> summary ( glm )

Call :
svyglm ( f o r m u l a = n o d e g r e e ˜ t r e a t , family = binomial , design = design .
pslog )

Survey d e s i g n :
s v y d e s i g n ( i d s = ˜ 1 , w e i g h t s = ˜ p e s o . ATE, d a t a = l a l o n d e )

Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( >| t | )
( Intercept ) 0.5106 0.1112 4 . 5 9 3 5 . 3 1 e −06 ∗∗∗
treat −0.2278 0.3024 −0.753 0.452
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1

( D i s p e r s i o n p a r a m e t e r f o r b i n o m i a l f a m i l y t a k e n t o be 1 . 0 0 1 6 3 1 )

Number o f F i s h e r S c o r i n g iterations : 4

173
9. Exemplo de análise com escore de propensão em Epidemiologia no R

12. Como os testes estatı́sticos não são o método mais adequado para verificar
balanceamento, vamos usar o pacote twang, que realiza o cálculo das diferenças
padronizadas absolutas nas médias das variáveis preditoras do tratamento entre
os grupos tratado e controle. Diferença padronizada absoluta nas médias < 0,10
indica balanceamento. Observe que as estimativas das diferenças padronizadas
absolutas entre as médias dos grupos tratamento e controle após o balanceamento
para a maioria das variáveis continua acima de 0,10. Se usarmos um critério menos
rigoroso, <0,25, concluirı́amos que apenas a variável renda em 1974 não estaria
balanceada entre os grupos. Esta falta de balanceamento se deve, provavelmente,
à pouca zona de suporte comum existente entre os grupos. A alternativa, neste
caso, seria estimar o ATT ou tentar outro método para estimativa do escore
de propensão. Pode ser que o balanceamento não tenha sido atingido por má
especificação do modelo logı́stico, ou seja, a não inclusão de termos polinomiais,
no caso de relações não lineares, e o não teste para interações entre os preditores.
# Usando r o t i n a do p a c o t e twang p a r a v e r i f i c a r b a l a n c e a m e n t o
# D i f e r e n ç a s p a d r o n i z a d a s a b s o l u t a s e n t r e a s médias
> b a l . p s l o g <− dx . wts ( x = l a l o n d e \ $ p e s o . ATE, d a t a=l a l o n d e , v a r s=c ( ” a g e ” ,
” educ ” , ” b l a c k ” , ” h i s p a n ” , ” n o d e g r e e ” ,
+ ” m a r r i e d ” , ” r e 7 4 ” , ” r e 7 5 ” ) , t r e a t . v a r=” t r e a t ” , e s t i m a n d = ”
ATE” )
> bal . pslog

type n . t r e a t n . c t r l ess . treat ess . ctrl max . e s mean . e s max . k s mean . k s iter
1 unw 185 429 185.00000 429.0000 1.3085999 0.4432341 0.6404460 0.2702451 NA
2 185 429 58.32666 329.0078 0.2658351 0.1441768 0.3121388 0.1170512 NA

> b a l <− b a l . t a b l e ( b a l . p s l o g )
> bal

\ $unw
t x . mn tx . sd c t . mn c t . sd std . e f f . sz stat p ks ks . pval
age 25.816 7.155 28.030 10.787 −0.224 −2.994 0.003 0.158 0.003
educ 10.346 2.011 10.235 2.855 0.042 0.547 0.584 0.111 0.074
black 0.843 0.365 0.203 0.403 1.309 19.371 0.000 0.640 0.000
hispan 0.059 0.237 0.142 0.350 −0.257 −3.413 0.001 0.083 0.317
nodegree 0.708 0.456 0.597 0.491 0.231 2.716 0.007 0.111 0.074
married 0.189 0.393 0.513 0.500 −0.656 −8.607 0.000 0.324 0.000
re74 2095.574 4886.620 5619.237 6788.751 −0.544 −7.254 0.000 0.447 0.000
re75 1532.055 3219.251 2466.484 3291.996 −0.284 −3.282 0.001 0.288 0.000

[[2]]
t x . mn tx . sd c t . mn c t . sd std . e f f . sz stat p ks ks . pval
age 25.566 6.525 27.100 10.803 −0.169 −1.709 0.088 0.191 0.046
educ 10.606 2.051 10.286 2.742 0.131 1.032 0.303 0.077 0.908
black 0.448 0.499 0.398 0.490 0.101 0.746 0.456 0.050 0.999
hispan 0.122 0.328 0.117 0.322 0.014 0.115 0.909 0.005 1.000
nodegree 0.570 0.496 0.625 0.485 −0.112 −0.743 0.458 0.055 0.996
married 0.315 0.466 0.409 0.492 −0.196 −1.207 0.228 0.094 0.732
re74 2932.185 5709.424 4552.736 6337.089 −0.266 −2.062 0.040 0.312 0.000
re75 1658.065 3072.886 2172.039 3160.142 −0.164 −1.492 0.136 0.153 0.179

13. Mesmo sem ter obtido o balanceamento entre as variáveis, vamos calcular o efeito
médio do tratamento (ATE) em modelo de regressão linear ponderado pelo escore
de propensão, no pacote survey, com estimativa robusta da variância. Veja que
a estimativa ajustada para o efeito do tratamento foi de US$224,70, com p=0,805,
portanto não significante.
# Efeito causal
# R e g r e s s ã o l i n e a r i n c l u i n d o d e s f e c h o e a p e n a s o t r a t a m e n t o como
v a r i a v e l e x p l a n a t ó r i a
# com p o n d e r a c ã o p e l o e s c o r e de p r o p e n s ã o

174
9.1. Estimativa do efeito causal por meio de escore de propensão

# p a c o t e s u r v e y − e s t i m a t i v a r o b u s t a da v a r i â n c i a
> d e s i g n . p s l o g <− s v y d e s i g n ( i d s=˜ 1 , w e i g h t s=˜ p e s o . ATE, d a t a=l a l o n d e )
> glm <− svyglm ( r e 7 8 ˜ t r e a t , d e s i g n=d e s i g n . p s l o g )
> summary ( glm )

Call :
svyglm ( f o r m u l a = r e 7 8 ˜ t r e a t , design = design . pslog )

Survey d e s i g n :
s v y d e s i g n ( i d s = ˜ 1 , w e i g h t s = ˜ p e s o . ATE, d a t a = l a l o n d e )

Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( >| t | )
( Intercept ) 6422.8 365.3 17.584 <2e −16 ∗∗∗
treat 224.7 910.2 0.247 0.805
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1

( D i s p e r s i o n p a r a m e t e r f o r g a u s s i a n f a m i l y t a k e n t o be 5 0 9 9 2 1 8 7 )

Number o f F i s h e r S c o r i n g iterations : 2

14. Em seguida, vamos utilizar GBM (Generalized Boosted Model) para calcular o
ATE no pacote twang, para testar se o não balanceamento dos grupos tratamento
e controle possa ter sido devido à má especificação do modelo logı́stico.
# GBM
# e s t i m a t i v a do e s c o r e de p r o p e n s a o − ATE
set . seed (1)
psgbmate <− ps ( t r e a t ˜ a g e + educ + b l a c k + h i s p a n + n o d e g r e e + m a r r i e d
+ re74 + re75 , data = l a l o n d e ,
perm . t e s t . i t e r s =0 , e s t i m a n d = ”ATE” , s t o p . method=(” e s .
mean” ) , v e r b o s e=”F” )

15. Utilize os seguintes comandos para verificar balanceamento. Observe que, agora,
apenas para as variáveis percentual de hispânicos e não possuir diploma uni-
versitário foi obtido balanceamento, pois as diferenças padronizadas absolutas
entre as médias dos grupos tratamento e controle ficaram <0,10. Para as demais
variáveis não obtivemos o balanceamento. Este resultado sugere que o não ba-
lanceamento em relação às variáveis observadas não se deveu a problemas na
especificação do modelo logı́stico, mas sim à falta de uma zona de suporte comum.
# v e r i f i c a n d o balanceamento
> b a l <− b a l . t a b l e ( psgbmate )
> bal

$unw
t x . mn tx . sd c t . mn c t . sd std . e f f . sz stat p ks ks . pval
age 25.816 7.155 28.030 10.787 −0.224 −2.994 0.003 0.158 0.003
educ 10.346 2.011 10.235 2.855 0.042 0.547 0.584 0.111 0.074
black 0.843 0.365 0.203 0.403 1.309 19.371 0.000 0.640 0.000
hispan 0.059 0.237 0.142 0.350 −0.257 −3.413 0.001 0.083 0.317
nodegree 0.708 0.456 0.597 0.491 0.231 2.716 0.007 0.111 0.074
married 0.189 0.393 0.513 0.500 −0.656 −8.607 0.000 0.324 0.000
re74 2095.574 4886.620 5619.237 6788.751 −0.544 −7.254 0.000 0.447 0.000
re75 1532.055 3219.251 2466.484 3291.996 −0.284 −3.282 0.001 0.288 0.000

$ e s . mean . ATE
t x . mn tx . sd c t . mn c t . sd std . e f f . sz stat p ks ks . pval
age 25.145 7.104 27.438 10.167 −0.249 −2.936 0.003 0.138 0.168
educ 10.587 2.012 10.295 2.700 0.118 1.132 0.258 0.090 0.655
black 0.649 0.479 0.345 0.476 0.609 4.099 0.000 0.304 0.000
hispan 0.126 0.332 0.120 0.325 0.017 0.114 0.909 0.005 1.000
nodegree 0.621 0.487 0.607 0.489 0.027 0.200 0.842 0.013 1.000
married 0.283 0.452 0.440 0.497 −0.322 −2.272 0.023 0.157 0.081
re74 2761.677 5137.961 4702.171 6467.311 −0.319 −2.854 0.004 0.204 0.009
re75 1698.704 3284.007 2169.352 3182.606 −0.146 −1.330 0.184 0.161 0.068

175
9. Exemplo de análise com escore de propensão em Epidemiologia no R

> p l o t ( psgbmate , p l o t s =3)

Verifique as diferenças padronizadas absolutas para a estimativa do ATE plotadas


no gráfico da figura 9.2.

es.mean.ATE

1.0
Absolute standard difference

0.5

0.0

Unweighted Weighted

Figura 9.2.: Verificando diferenças padronizadas absolutas por método gráfico - ATE.

16. Em seguida vamos extrair os pesos a serem incluı́dos na ponderação, usando as


fórmulas da tabela 8.6.
# extraindo os pesos
> l a l o n d e $ wate <− g e t . w e i g h t s ( psgbmate , s t o p . method=” e s . mean” )
> d e s i g n . p s a t e <− s v y d e s i g n ( i d s=˜ 1 , w e i g h t s=˜ wate , d a t a=l a l o n d e )

# o b t e n d o l i s t a g e m do b a n c o de d a d o s
> head ( l a l o n d e , n =10)
t r e a t age educ b l a c k h i s p a n married nodegree re74 re75 re78 wate
1 1 37 11 1 0 1 1 0 0 9930.0460 2.108394
2 1 22 9 0 1 0 1 0 0 3595.8940 1.377677
3 1 30 12 1 0 0 0 0 0 24909.4500 1.075554
4 1 27 11 1 0 0 1 0 0 7506.1460 1.051143
5 1 33 8 1 0 0 1 0 0 289.7899 1.045883
6 1 22 9 1 0 0 1 0 0 4056.4940 1.040317
7 1 23 12 1 0 0 0 0 0 0.0000 1.067911
8 1 32 11 1 0 0 1 0 0 8472.1580 1.056780
9 1 22 16 1 0 0 0 0 0 2164.0220 1.676679
10 1 33 12 0 0 1 0 0 0 12418.0700 4.593865

176
9.1. Estimativa do efeito causal por meio de escore de propensão

> t a i l ( l a l o n d e , n =10)
t r e a t age educ b l a c k hispan married nodegree re74 re75 re78 wate
605 0 39 2 1 0 1 1 0 0 964.9555 1.485184
606 0 55 8 0 0 1 1 0 0 0.0000 1.013105
607 0 16 9 0 0 0 1 0 0 5551.8190 1.015311
608 0 27 10 1 0 0 1 0 0 7543.7940 20.798188
609 0 25 14 0 0 0 0 0 0 0.0000 1.346533
610 0 18 11 0 0 0 1 0 0 10150.5000 1.174878
611 0 24 1 0 1 1 1 0 0 19464.6100 1.106458
612 0 21 18 0 0 0 0 0 0 0.0000 1.072995
613 0 32 5 1 0 1 1 0 0 187.6713 3.164705
614 0 16 9 0 0 0 1 0 0 1495.4590 1.015311

17. Mesmo sem termos obtido balanceamento, vamos calcular o ATE em modelo de
regressão linear ponderado pelo escore de propensão. A estimativa foi US$491,90,
com p=0,516, portanto igual no grupo tratado em comparação ao grupo controle,
também não significante.
# E f e i t o c a u s a l − GBM
# R e g r e s s ã o l i n e a r i n c l u i n d o d e s f e c h o e a p e n a s o t r a t a m e n t o como
v a r i á v e l e x p l a n a t ó r i a
# com p o n d e r a ç ã o p e l o e s c o r e de p r o p e n s ã o
> glm1 <− svyglm ( r e 7 8 ˜ t r e a t , d e s i g n=d e s i g n . p s a t e )
> summary ( glm1 )

Call :
svyglm ( f o r m u l a = r e 7 8 ˜ t r e a t , design = design . psate )

Survey d e s i g n :
s v y d e s i g n ( i d s = ˜ 1 , w e i g h t s = ˜ wate , d a t a = l a l o n d e )

Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( >| t | )
( Intercept ) 6703.7 368.1 18.209 <2e −16 ∗∗∗
treat −491.9 757.3 −0.649 0.516
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1

( D i s p e r s i o n p a r a m e t e r f o r g a u s s i a n f a m i l y t a k e n t o be 5 0 2 0 1 9 3 1 )

Number o f F i s h e r S c o r i n g iterations : 2

18. Finalmente, vamos utilizar GBM (Generalized Boosted Model) para calcular o
ATT no pacote twang, para testar se o não balanceamento dos grupos tratamento
e controle possa ter sido devido à falta de zona de suporte comum.
# GBM
# e s t i m a t i v a do e s c o r e de p r o p e n s a o − ATT
> set . seed (1)
> psgbmatt <− ps ( t r e a t ˜ a g e + educ + b l a c k + h i s p a n + n o d e g r e e +
married + re74 + re75 , data = l a l o n d e ,
+ perm . t e s t . i t e r s =0 , e s t i m a n d = ”ATT” , s t o p . method=(” e s .
mean” ) , v e r b o s e=”F” )

19. Utilize os seguintes comandos para verificar balanceamento. Observe que, agora,
apenas para as variáveis renda em 1974 e renda em 1975 não foi obtido balance-
amento, pois as diferenças padronizadas absolutas entre as médias dos grupos
tratamento e controle ficaram >0,10. Se adotarmos um ponto de corte menos rigo-
roso, concluı́mos que o balanceamento foi obtido em relação a todas as variáveis
observadas. Este resultado sugere que o não balanceamento em relação às variáveis
observadas na estimativa do ATE não se deveu a problemas na especificação do

177
9. Exemplo de análise com escore de propensão em Epidemiologia no R

modelo logı́stico, mas sim à falta de uma zona de suporte comum. Usando-se
apenas os tratados, o balanceamento consideramos que o balanceamento foi obtido
e podemos, então, dar prosseguimento à análise e interpretação do ATT.
# v e r i f i c a n d o balanceamento
> b a l <− b a l . t a b l e ( psgbmatt )
> bal

$unw
t x . mn tx . sd c t . mn c t . sd std . e f f . sz stat p ks ks . pval
age 25.816 7.155 28.030 10.787 −0.309 −2.994 0.003 0.158 0.003
educ 10.346 2.011 10.235 2.855 0.055 0.547 0.584 0.111 0.074
black 0.843 0.365 0.203 0.403 1.757 19.371 0.000 0.640 0.000
hispan 0.059 0.237 0.142 0.350 −0.349 −3.413 0.001 0.083 0.317
nodegree 0.708 0.456 0.597 0.491 0.244 2.716 0.007 0.111 0.074
married 0.189 0.393 0.513 0.500 −0.824 −8.607 0.000 0.324 0.000
re74 2095.574 4886.620 5619.237 6788.751 −0.721 −7.254 0.000 0.447 0.000
re75 1532.055 3219.251 2466.484 3291.996 −0.290 −3.282 0.001 0.288 0.000

$ e s . mean .ATT
t x . mn tx . sd c t . mn c t . sd std . e f f . sz stat p ks ks . pval
age 25.816 7.155 25.472 7.295 0.048 0.352 0.725 0.092 0.992
educ 10.346 2.011 10.447 2.040 −0.050 −0.346 0.729 0.064 1.000
black 0.843 0.365 0.829 0.377 0.040 0.300 0.764 0.014 1.000
hispan 0.059 0.237 0.045 0.207 0.062 0.666 0.506 0.015 1.000
nodegree 0.708 0.456 0.664 0.473 0.097 0.478 0.633 0.044 1.000
married 0.189 0.393 0.189 0.392 0.001 0.006 0.995 0.000 1.000
re74 2095.574 4886.620 1510.258 3744.029 0.120 1.119 0.264 0.070 1.000
re75 1532.055 3219.251 1074.077 2464.235 0.142 1.276 0.202 0.102 0.976

> p l o t ( psgbmatt , p l o t s =3)

Verifique as diferenças padronizadas absolutas para a estimativa do ATT plotadas


no gráfico da figura 9.3.
20. Em seguida vamos extrair os pesos a serem incluı́dos na ponderação, usando as
fórmulas da tabela 8.6.
# extraindo os pesos
> l a l o n d e $ watt <− g e t . w e i g h t s ( psgbmatt , s t o p . method=” e s . mean” )
> d e s i g n . p s a t t <− s v y d e s i g n ( i d s=˜ 1 , w e i g h t s=˜ watt , d a t a=l a l o n d e )

# o b t e n d o l i s t a g e m do b a n c o de d a d o s
> head ( l a l o n d e , n =10)
t r e a t age educ b l a c k h i s p a n married n o d e g r e e r e 7 4 r e 7 5 re78 wate watt
1 1 37 11 1 0 1 1 0 0 9930.0460 2.108394 1
2 1 22 9 0 1 0 1 0 0 3595.8940 1.377677 1
3 1 30 12 1 0 0 0 0 0 24909.4500 1.075554 1
4 1 27 11 1 0 0 1 0 0 7506.1460 1.051143 1
5 1 33 8 1 0 0 1 0 0 289.7899 1.045883 1
6 1 22 9 1 0 0 1 0 0 4056.4940 1.040317 1
7 1 23 12 1 0 0 0 0 0 0.0000 1.067911 1
8 1 32 11 1 0 0 1 0 0 8472.1580 1.056780 1
9 1 22 16 1 0 0 0 0 0 2164.0220 1.676679 1
10 1 33 12 0 0 1 0 0 0 12418.0700 4.593865 1
> t a i l ( l a l o n d e , n =10)
t r e a t age educ b l a c k h i s p a n married n o d e g r e e r e 7 4 r e 7 5 re78 wate
watt
605 0 39 2 1 0 1 1 0 0 964.9555 1.485184
0.42964533
606 0 55 8 0 0 1 1 0 0 0.0000 1.013105
0.01075173
607 0 16 9 0 0 0 1 0 0 5551.8190 1.015311
0.01311116
608 0 27 10 1 0 0 1 0 0 7543.7940 20.798188
22.39606172
609 0 25 14 0 0 0 0 0 0 0.0000 1.346533
0.32141652
610 0 18 11 0 0 0 1 0 0 10150.5000 1.174878
0.16604204
611 0 24 1 0 1 1 1 0 0 19464.6100 1.106458
0.07992029
612 0 21 18 0 0 0 0 0 0 0.0000 1.072995
0.06439535
613 0 32 5 1 0 1 1 0 0 187.6713 3.164705
2.10541066
614 0 16 9 0 0 0 1 0 0 1495.4590 1.015311
0.01311116

178
9.1. Estimativa do efeito causal por meio de escore de propensão

es.mean.ATT

1.5
Absolute standard difference

1.0

0.5

0.0

Unweighted Weighted

Figura 9.3.: Verificando diferenças padronizadas absolutas por método gráfico - ATT.

21. Vamos, para concluir este exercı́cio, calcular o ATT em modelo de regressão
linear ponderado pelo escore de propensão. A estimativa obtida, US$461,00,
foi igual no grupo tratado em comparação ao grupo controle, com p=0,632.
Concluı́mos, então, que o programa de retreinamento não aumentou a renda dos
indivı́duos. Esta conclusão é válida se os pressupostos para inferência causal forem
verdadeiros: permutabilidade, positividade e única versão do tratamento (SUTVA,
stable unit treatment value assumption). Considerando que o tratamento foi
administrado de forma padronizada e que não houve contaminação, consideramos
que o pressuposto SUTVA é razoável. Usando-se o ATT supõe-se que foi possı́vel
obter contrastes contrafatuais adequados na ausência de randomização para os
tratados. O pressuposto da positividade é bem razoável neste exemplo. Obtivemos
permutabilidade em relação às variáveis observadas. Resta a possibilidade de
confundimento por variável omitida. Esta nossa estimativa do efeito causal é
válida, desde que sejam válidos os nossos pressupostos, que foram explicitados.
É interessante neste exemplo que o modelo de regressão convencional, ajustado
para as variáveis de confundimento sugeriu associação entre o programa de

179
9. Exemplo de análise com escore de propensão em Epidemiologia no R

retreinamento profissional e o aumento da renda. Entretanto, nas estimativas


obtidas em modelos ponderados pelo inverso da probabilidade de tratamento,
este efeito não foi significante.
# E f e i t o c a u s a l − GBM
# R e g r e s s ã o l i n e a r i n c l u i n d o d e s f e c h o e a p e n a s o t r a t a m e n t o como
v a r i á v e l e x p l a n a t ó r i a
# com p o n d e r a ç ã o p e l o e s c o r e de p r o p e n s ã o
> glm1 <− svyglm ( r e 7 8 ˜ t r e a t , d e s i g n=d e s i g n . p s a t t )
> summary ( glm1 )

Call :
svyglm ( f o r m u l a = r e 7 8 ˜ t r e a t , design = design . psatt )

Survey d e s i g n :
s v y d e s i g n ( i d s = ˜ 1 , w e i g h t s = ˜ watt , d a t a = l a l o n d e )

Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( >| t | )
( Intercept ) 5888.2 767.9 7 . 6 6 8 6 . 9 1 e −14 ∗∗∗
treat 461.0 960.7 0.480 0.632
−−−
S i g n i f . codes : 0 ’ ∗∗∗ ’ 0 . 0 0 1 ’ ∗∗ ’ 0 . 0 1 ’ ∗ ’ 0 . 0 5 ’ . ’ 0 . 1 ’ ’ 1

( D i s p e r s i o n p a r a m e t e r f o r g a u s s i a n f a m i l y t a k e n t o be 5 0 1 9 2 2 8 3 )

Number o f F i s h e r S c o r i n g iterations : 2

180
10. Exemplo de análise com escore de
propensão em Epidemiologia no
Stata
10.1. Estimativa do efeito causal por meio de escore de
propensão
Neste exemplo, vamos realizar a estimativa do efeito de um programa de retreinamento
profissional no rendimento dos indivı́duos. Os dados são do National Supported Work
Project, publicados por Dehejia e Wahba (1999). Na tabela 9.1 constam as variáveis
que utilizaremos neste exercı́cio.
Os comandos que se seguem realizam a análise no Stata.

10.1.1. Ponderação com escore de propensão


1. Inicialmente, abra o arquivo lalonde.dta e peça a listagem de algumas variáveis
das primeiras 5 e das últimas 5 observações. Em seguida, obtenha a frequência
da variável treat. Observe que há 185 casos que receberam o retreinamento e
429 não treinados, que servirão como controles.

. * Abrindo banco de dados - lalonde


. use lalonde
.
. * Obtendo listagem das 5 primeiras e das 5 últimas observações
. list treat age educ black hispan married nodegree re78 in 1/5

treat age educ black hispan married nodegree re78

1. 1 37 11 1 0 1 1 9930.046
2. 1 22 9 0 1 0 1 3595.894
3. 1 30 12 1 0 0 0 24909.45
4. 1 27 11 1 0 0 1 7506.146
5. 1 33 8 1 0 0 1 289.7899

. list treat age educ black hispan married nodegree re78 in 610/614

treat age educ black hispan married nodegree re78

610. 0 18 11 0 0 0 1 10150.5
611. 0 24 1 0 1 1 1 19464.61
612. 0 21 18 0 0 0 0 0

181
10. Exemplo de análise com escore de propensão em Epidemiologia no Stata

613. 0 32 5 1 0 1 1 187.6713
614. 0 16 9 0 0 0 1 1495.459

.
. * Obtendo a distribuição de frequências da variável tratamento
. tab treat
treat Freq. Percent Cum.

0 429 69.87 69.87


1 185 30.13 100.00

Total 614 100.00

2. Após a abertura do arquivo, vamos primeiro calcular as estimativas de associação


em modelos de regressão simples (não ajustado) e múltipla (ajustado). A variável
explanatória é treat, codificada como 1 quando o indivı́duo participou do programa
de retreinamento profissional e 0 em caso contrário. A variável desfecho é a renda
em 1978, quatro anos após o inı́cio do programa de retreinamento. Compare as
duas estimativas do efeito médio do tratamento (ATE). Observe que a estimativa
não ajustada não foi significante (p=0,334), enquanto a estimativa ajustada
foi de um aumento de US$ 1,548, p<0,048 no grupo tratado, que frequentou o
programa de retreinamento profissional, comparado com o grupo controle, que
não participou do programa.

. * Estimando associação em modelo de regressão não ajustado


. regress re78 treat
Source SS df MS Number of obs = 614
F(1, 612) = 0.93
Model 52124746.2 1 52124746.2 Prob > F = 0.3342
Residual 3.4161e+10 612 55817843.2 R-squared = 0.0015
Adj R-squared = -0.0001
Total 3.4213e+10 613 55811818.6 Root MSE = 7471.1

re78 Coef. Std. Err. t P>|t| [95% Conf. Interval]

treat -635.0262 657.1374 -0.97 0.334 -1925.544 655.4917


_cons 6984.17 360.7097 19.36 0.000 6275.791 7692.549

.
. * Estimando associação em modelo de regressão ajustado
. regress re78 treat age educ black hispan nodegree married re74 re75
Source SS df MS Number of obs = 614
F(9, 604) = 11.64
Model 5.0554e+09 9 561713774 Prob > F = 0.0000
Residual 2.9157e+10 604 48273544.4 R-squared = 0.1478
Adj R-squared = 0.1351
Total 3.4213e+10 613 55811818.6 Root MSE = 6947.9

re78 Coef. Std. Err. t P>|t| [95% Conf. Interval]

treat 1548.244 781.2793 1.98 0.048 13.88991 3082.598


age 12.97763 32.48891 0.40 0.690 -50.82731 76.78257
educ 403.9412 158.9062 2.54 0.011 91.86538 716.0171

182
10.1. Estimativa do efeito causal por meio de escore de propensão

black -1240.644 768.7644 -1.61 0.107 -2750.42 269.1318


hispan 498.8969 941.9425 0.53 0.597 -1350.983 2348.777
nodegree 259.8174 847.4421 0.31 0.759 -1404.474 1924.108
married 406.6208 695.4723 0.58 0.559 -959.2168 1772.458
re74 .2963774 .0582726 5.09 0.000 .1819359 .410819
re75 .2315259 .1046199 2.21 0.027 .026063 .4369888
_cons 66.51452 2436.746 0.03 0.978 -4719.009 4852.038

3. Agora vamos verificar o balanceamento das variáveis antes da implementação do


escore de propensão. Faremos teste t de Student para variáveis contı́nuas e teste
do qui-quadrado para variáveis categóricas. Observe que as variáveis idade, renda
em 1974, renda em 1975, não possuir diploma universitário, percentual de pretos,
percentual de hispânicos e ser casado(a) não se encontram balanceadas entre os
grupos (todos os p valores são significantes). Apenas a variável escolaridade está
balanceada entre os grupos tratamento e controle (p valor não significante).
. * Checando balanceamento entre os grupos antes da implementação
. * do escore de propensão
. * variável contı́nua - test t de Student

. ttest age, by(treat)


Two-sample t test with equal variances

Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]

0 429 28.0303 .5207845 10.78665 27.00669 29.05392


1 185 25.81622 .5260475 7.155019 24.77836 26.85408

combined 614 27.36319 .3987723 9.881187 26.58007 28.14632

diff 2.214087 .8652112 .5149437 3.91323

diff = mean(0) - mean(1) t = 2.5590


Ho: diff = 0 degrees of freedom = 612
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
Pr(T < t) = 0.9946 Pr(|T| > |t|) = 0.0107 Pr(T > t) = 0.0054

. ttest educ, by(treat)


Two-sample t test with equal variances

Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]

0 429 10.23543 .1378522 2.855238 9.96448 10.50638


1 185 10.34595 .1478259 2.01065 10.05429 10.6376

combined 614 10.26873 .1060706 2.628325 10.06042 10.47704

diff -.1105147 .2313248 -.5648015 .343772

diff = mean(0) - mean(1) t = -0.4777


Ho: diff = 0 degrees of freedom = 612
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0

183
10. Exemplo de análise com escore de propensão em Epidemiologia no Stata

Pr(T < t) = 0.3165 Pr(|T| > |t|) = 0.6330 Pr(T > t) = 0.6835

. ttest re74, by(treat)


Two-sample t test with equal variances

Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]

0 429 5619.237 327.764 6788.751 4975.009 6263.464


1 185 2095.574 359.2715 4886.62 1386.752 2804.395

combined 614 4557.547 261.4294 6477.964 4044.141 5070.952

diff 3523.663 552.1715 2439.282 4608.044

diff = mean(0) - mean(1) t = 6.3815


Ho: diff = 0 degrees of freedom = 612
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
Pr(T < t) = 1.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 0.0000

. ttest re75, by(treat)


Two-sample t test with equal variances

Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]

0 429 2466.484 158.9391 3291.996 2154.086 2778.883


1 185 1532.055 236.684 3219.251 1065.092 1999.019

combined 614 2184.938 133.0028 3295.679 1923.742 2446.135

diff 934.4291 287.6449 369.5384 1499.32

diff = mean(0) - mean(1) t = 3.2486


Ho: diff = 0 degrees of freedom = 612
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
Pr(T < t) = 0.9994 Pr(|T| > |t|) = 0.0012 Pr(T > t) = 0.0006

. * variável categórica - teste do qui-quadrado


. tab treat nodegree, row chi2

Key

frequency
row percentage

nodegree
treat 0 1 Total

0 173 256 429


40.33 59.67 100.00

1 54 131 185
29.19 70.81 100.00

Total 227 387 614

184
10.1. Estimativa do efeito causal por meio de escore de propensão

36.97 63.03 100.00


Pearson chi2(1) = 6.8803 Pr = 0.009

. tab treat married, row chi2

Key

frequency
row percentage

married
treat 0 1 Total

0 209 220 429


48.72 51.28 100.00

1 150 35 185
81.08 18.92 100.00

Total 359 255 614


58.47 41.53 100.00
Pearson chi2(1) = 55.7524 Pr = 0.000

. tab treat black, row chi2

Key

frequency
row percentage

black
treat 0 1 Total

0 342 87 429
79.72 20.28 100.00

1 29 156 185
15.68 84.32 100.00

Total 371 243 614


60.42 39.58 100.00
Pearson chi2(1) = 221.7085 Pr = 0.000

. tab treat hispan, row chi2

Key

frequency
row percentage

hispan
treat 0 1 Total

185
10. Exemplo de análise com escore de propensão em Epidemiologia no Stata

0 368 61 429
85.78 14.22 100.00

1 174 11 185
94.05 5.95 100.00

Total 542 72 614


88.27 11.73 100.00
Pearson chi2(1) = 8.5469 Pr = 0.003

4. Podemos também fazer o teste em modelo de regressão linear, colocando a variável


contı́nua como resposta e o tratamento como variável explanatória. Veja um
exemplo abaixo com a variável contı́nua renda em 1974.
. * variável contı́nua - regressão linear com o tratamento
. * como variável explanatória
. * e a variável contı́nua (renda em 1974) como resposta
. regress re74 treat
Source SS df MS Number of obs = 614
F(1, 612) = 40.72
Model 1.6049e+09 1 1.6049e+09 Prob > F = 0.0000
Residual 2.4119e+10 612 39410198.6 R-squared = 0.0624
Adj R-squared = 0.0609
Total 2.5724e+10 613 41964023.8 Root MSE = 6277.8

re74 Coef. Std. Err. t P>|t| [95% Conf. Interval]

treat -3523.663 552.1715 -6.38 0.000 -4608.044 -2439.282


_cons 5619.237 303.0928 18.54 0.000 5024.008 6214.465

5. Podemos também fazer o teste em modelo de regressão logı́stica, colocando a


variável categórica como resposta e o tratamento como variável explanatória. Veja
um exemplo abaixo com a variável categórica sem diploma universitário.
. * variável categórica - regressão logı́stica com o tratamento como
. * variável explanatória
. * e a variável categórica (sem diploma universitário) como resposta
. logistic nodegree treat
Logistic regression Number of obs = 614
LR chi2(1) = 7.03
Prob > chi2 = 0.0080
Log likelihood = -400.98999 Pseudo R2 = 0.0087

nodegree Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]

treat 1.639395 .3103558 2.61 0.009 1.131206 2.375886


_cons 1.479769 .1456396 3.98 0.000 1.220164 1.794608

6. Vamos agora calcular o escore de propensão para cada indivı́duo, que nada mais
é do que a probabilidade de participação no programa predita pelo modelo. Para
realizar isto, vamos rodar um modelo logı́stico, tendo como desfecho a participação
no treinamento (treat) e como variáveis preditoras: idade, escolaridade, cor da

186
10.1. Estimativa do efeito causal por meio de escore de propensão

pele preta, hispânico, casado, sem diploma universitário, renda em 74 e renda em


75.

. * Estimação do escore de propensão por regressão logı́stica


. logistic treat age educ black hispan nodegree married re74 re75
Logistic regression Number of obs = 614
LR chi2(8) = 263.65
Prob > chi2 = 0.0000
Log likelihood = -243.92197 Pseudo R2 = 0.3508

treat Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]

age 1.015902 .013793 1.16 0.245 .989225 1.043299


educ 1.175046 .0765265 2.48 0.013 1.034234 1.335028
black 21.44235 6.143794 10.70 0.000 12.22871 37.59792
hispan 2.674155 1.138292 2.31 0.021 1.161076 6.159032
nodegree 2.028501 .6849603 2.09 0.036 1.046529 3.931868
married .4351288 .1263306 -2.87 0.004 .246314 .7686815
re74 .9999282 .0000287 -2.50 0.013 .9998719 .9999846
re75 1.000053 .0000464 1.15 0.249 .9999626 1.000144
_cons .0088384 .0089893 -4.65 0.000 .001204 .0648791

7. Em seguida vamos gravar o escore de propensão no banco de dados.

. * Incluindo o escore de propensão no banco de dados


. predict pslog
(option pr assumed; Pr(treat))

Agora peça uma listagem das 10 primeiras observações (tratados) e verifique que
o escore de propensão (pslog) foi calculado e adicionado ao banco de dados.

. * Obtendo listagem das 10 primeiras observações


. list treat age educ re78 pslog in 1/10

treat age educ re78 pslog

1. 1 37 11 9930.046 .6387699
2. 1 22 9 3595.894 .2246342
3. 1 30 12 24909.45 .6782439
4. 1 27 11 7506.146 .7763241
5. 1 33 8 289.7899 .7016388

6. 1 22 9 4056.494 .6990699
7. 1 23 12 0 .6536843
8. 1 32 11 8472.158 .7897231
9. 1 22 16 2164.022 .7798383
10. 1 33 12 12418.07 .0429246

Agora peça uma listagem das 10 últimas observações (não tratados).

. list treat age educ re78 pslog in 605/614

treat age educ re78 pslog

187
10. Exemplo de análise com escore de propensão em Epidemiologia no Stata

605. 0 39 2 964.9555 .2993954


606. 0 55 8 0 .0632529
607. 0 16 9 5551.819 .0897119
608. 0 27 10 7543.794 .7470736
609. 0 25 14 0 .1114588

610. 0 18 11 10150.5 .1231439


611. 0 24 1 19464.61 .0345604
612. 0 21 18 0 .183351
613. 0 32 5 187.6713 .3830323
614. 0 16 9 1495.459 .0897119

8. Antes de se realizar qualquer estimativa, é importante avaliar se existe área de


suporte comum entre os tratados e seus potenciais controles. Vamos verificar a
área de suporte comum, desenhando um boxplot da distribuição do escore de
propensão, separadamente nos grupos tratamento e controle. Como você pode
observar na figura 10.1 (este exemplo foi também mostrado no capı́tulo 8), há
pouca zona de suporte comum. No grupo tratado, a maioria dos escores de
propensão estão acima de 0,4, enquanto no grupo controle os escores predominam
na faixa inferior a 0,2. Como vimos, neste caso seria mais adequado estimar o
ATT (Efeito médio do tratamento nos tratados).
. * Verificando área de suporte comum pelo boxplot
. graph box pslog, ytitle(Escore de propensão) by(treat)

0 1
.8
.6
Escore de propensão
.4
.2
0
-.2

Graphs by treat

Figura 10.1.: Verificando área de suporte comum pelo boxplot.

9. Apesar do efeito médio do tratamento (ATE) não ser a melhor estimativa, vamos
realizar o seu cálculo para demonstração. Inicialmente, calcularemos os pesos
para estimar o ATE em modelo estrutural marginal, com ponderação pelo inverso
da probabilidade de tratamento, utilizando as fórmulas da tabela 8.6. Em seguida,

188
10.1. Estimativa do efeito causal por meio de escore de propensão

vamos obter uma listagem das primeiras 10 observações para verificar que o peso
(wa) foi incorporado ao banco de dados.

. * Ponderacao com escore de propensao


. * calculando os pesos usando ATE - Efeito medio do tratamento
. * para o grupo de tratamento = 1/ps
. * para o grupo controle= 1(1-ps)
. gen wa=1/pslog if treat==1
(429 missing values generated)
. replace wa=1/(1-pslog) if treat==0
(429 real changes made)
.
. * Verificando se o peso foi incorporado ao banco de dados
. list treat age educ re78 pslog wa in 1/10

treat age educ re78 pslog wa

1. 1 37 11 9930.046 .6387699 1.565509


2. 1 22 9 3595.894 .2246342 4.451681
3. 1 30 12 24909.45 .6782439 1.474396
4. 1 27 11 7506.146 .7763241 1.288122
5. 1 33 8 289.7899 .7016388 1.425235

6. 1 22 9 4056.494 .6990699 1.430472


7. 1 23 12 0 .6536843 1.529791
8. 1 32 11 8472.158 .7897231 1.266267
9. 1 22 16 2164.022 .7798383 1.282317
10. 1 33 12 12418.07 .0429246 23.29666

10. Para checar o balanceamento após a ponderação com o escore de propensão,


vamos estimar um modelo de regressão linear ponderado pelo escore de propensão,
colocando a variável contı́nua como resposta e o tratamento como variável ex-
planatória. Veja que, para a variável contı́nua (renda em 1974) não foi obtido
balanceamento, pois o valor de P continua significante (P=0,040).

. * Checando balanceamento após a ponderação com escore de propensão


. * variável contı́nua - regressão linear ponderada com o tratamento como
. * variável explanatória e a variável continua como desfecho
. regress re74 treat [pweight=wa]
(sum of wgt is 1.1696e+03)
Linear regression Number of obs = 614
F(1, 612) = 4.24
Prob > F = 0.0398
R-squared = 0.0176
Root MSE = 6047

Robust
re74 Coef. Std. Err. t P>|t| [95% Conf. Interval]

treat -1620.552 786.6203 -2.06 0.040 -3165.354 -75.74923


_cons 4552.736 309.8639 14.69 0.000 3944.211 5161.262

189
10. Exemplo de análise com escore de propensão em Epidemiologia no Stata

11. E para variável categórica, vamos estimar modelo de regressão logı́stica ponderado
pelo escore de propensão, colocando a variável categórica como resposta e o
tratamento como variável explanatória. Observe que para a variável não possuir
diploma universitário, o balanceamento foi obtido, pois o valor de P deixou de ser
significante (P=0,451). Faça, agora, o teste para as demais variáveis (contı́nuas e
categóricas) e anote para quais variáveis o balanceamento não foi obtido.

. * variável categórica binária- regressão logı́stica ponderada com o tratamento


. * como variável explanatória
. * e a variável categórica (sem diploma universitário) como resposta
. logistic nodegree treat [pweight=wa]
Logistic regression Number of obs = 614
Wald chi2(1) = 0.57
Prob > chi2 = 0.4513
Log pseudolikelihood = -785.80561 Pseudo R2 = 0.0023

Robust
nodegree Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]

treat .7962906 .2407911 -0.75 0.451 .4402262 1.440347


_cons 1.666337 .1852614 4.59 0.000 1.340069 2.072041

12. Mesmo sem ter obtido o balanceamento entre as variáveis, vamos calcular o efeito
médio do tratamento (ATE) em modelo de regressão linear ponderado pelo escore
de propensão. Veja que a estimativa ajustada para o efeito do tratamento foi de
US$224,70, com p=0,805, portanto não significante.

. * Efeito causal
. * Regressão linear incluindo desfecho e apenas o tratamento como
. * variável explanatória com ponderacão pelo escore de propensão
. regress re78 treat [pweight=wa]
(sum of wgt is 1.1696e+03)
Linear regression Number of obs = 614
F(1, 612) = 0.06
Prob > F = 0.8053
R-squared = 0.0002
Root MSE = 7146.7

Robust
re78 Coef. Std. Err. t P>|t| [95% Conf. Interval]

treat 224.6763 910.9625 0.25 0.805 -1564.315 2013.668


_cons 6422.839 365.5556 17.57 0.000 5704.943 7140.735

13. Vamos, agora, realizar a a ponderação pelo inverso da probabilidade de tratamento


no Stata usando um único comando, o teffects que realiza, de forma automática,
todos os passos: ajuste do modelo preditivo, cálculo do escore de propensão e
dos pesos e, em seguida, ajuste do modelo explicativo ponderado. Note que o
resultado foi o mesmo obtido anteriormente, com a vantagem de que o processo é
mais rápido. O comando teffects também está disponı́vel no menu Statistics, na

190
10.1. Estimativa do efeito causal por meio de escore de propensão

aba Treatment Effects.


. * Usando teffects - estimando ATE
. teffects ipw (re78) (treat age educ black hispan nodegree married re74 re75)
Iteration 0: EE criterion = 8.192e-26
Iteration 1: EE criterion = 7.907e-26 (backed up)
Treatment-effects estimation Number of obs = 614
Estimator : inverse-probability weights
Outcome model : weighted mean
Treatment model: logit

Robust
re78 Coef. Std. Err. z P>|z| [95% Conf. Interval]

ATE
treat
(1 vs 0) 224.6763 876.1932 0.26 0.798 -1492.631 1941.983

POmean
treat
0 6422.839 353.3568 18.18 0.000 5730.272 7115.406

14. Como os testes estatı́sticos não são o método mais adequado para verificar
balanceamento, vamos usar o comando tebalance summ, que, após o teffects,
realiza o cálculo das diferenças padronizadas absolutas nas médias das variáveis
preditoras do tratamento entre os grupos tratado e controle e das razões de
variância. Diferença padronizada absoluta nas médias < 0,10 e razão de variâncias
entre 0,80 e 1,20 indicam balanceamento. Observe que as estimativas das diferenças
padronizadas absolutas entre as médias dos grupos tratamento e controle após o
balanceamento para a maioria das variáveis continua acima de 0,10. Se usarmos
um critério menos rigoroso, <0,25, concluirı́amos que apenas a variável renda em
1974 não estaria balanceada entre os grupos. As razões de variância das variáveis
idade e escolaridade se encontram abaixo de 0,80, sugerindo não balanceamento
para estas variáveis. Esta falta de balanceamento se deve, provavelmente, à
pouca zona de suporte comum existente entre os grupos. A alternativa, neste
caso, seria estimar o ATT ou tentar outro método para estimativa do escore de
propensão (GBM, modelagem ampliada generalizada, por exemplo). Pode ser
que o balanceamento não tenha sido atingido por má especificação do modelo
logı́stico, ou seja, a não inclusão de termos polinomiais, no caso de relações não
lineares, e o não teste para interações entre os preditores. No capı́tulo 9 realizamos
estimativa do escore de propensão por GBM e concluı́mos que o balanceamento
não melhorou com este método, o que sugere que o não balanceamento se deva
à falta de uma zona de suporte comum. Assim, com a estimativa do ATE não
obtivemos um bom balanceamento, mesmo com GBM.
. * Checando balanceamento apos a ponderacao com escore de propensao
. tebalance summ
Covariate balance summary

191
10. Exemplo de análise com escore de propensão em Epidemiologia no Stata

Raw Weighted

Number of obs = 614 614.0


Treated obs = 185 290.6
Control obs = 429 323.4

Standardized differences Variance ratio


Raw Weighted Raw Weighted

age -.2419036 -.1718535 .4399955 .363823


educ .0447551 .1321896 .4958934 .5579332
black 1.667719 .1010261 .8201414 1.032512
hispan -.2769396 .0143612 .4599131 1.03472
nodegree .2350482 -.1115614 .8615699 1.045929
married -.719492 -.1970169 .6158881 .8923596
re74 -.5957516 -.2687467 .5181285 .8094992
re75 -.2870021 -.1649499 .956293 .9429552

15. Em seguida, vamos estimar o efeito causal médio entre os tratados (ATT) por
meio do comando teffects. A única mudança em relação ao comando usado
anteriormente é a inclusão da opção atet, pois o padrão (default) deste comando
é a estimativa do ATE.
. * Usando teffects - estimando ATT
. teffects ipw (re78) (treat age educ black hispan nodegree married re74 re75)
, atet
Iteration 0: EE criterion = 3.071e-23
Iteration 1: EE criterion = 8.124e-27
Treatment-effects estimation Number of obs = 614
Estimator : inverse-probability weights
Outcome model : weighted mean
Treatment model: logit

Robust
re78 Coef. Std. Err. z P>|z| [95% Conf. Interval]

ATET
treat
(1 vs 0) 1214.071 798.1546 1.52 0.128 -350.2831 2778.426

POmean
treat
0 5135.072 583.7629 8.80 0.000 3990.918 6279.227

16. Finalmente, vamos usar o comando tebalance summ, após o teffects, para
verificar balanceamento. Observe que, desta vez, todas as diferenças padronizadas
absolutas entre as médias dos grupos tratamento e controle são menores do que
0,10, embora algumas razões de variâncias sejam <0,80 ou >1,20. Isto indica que
o ATT é uma estimativa melhor do que o ATE.
A estimativa obtida, US$1214,00, foi igual no grupo tratado em comparação ao
grupo controle, com p=0,128. Concluı́mos, então, que o programa de retreinamento

192
10.1. Estimativa do efeito causal por meio de escore de propensão

não aumentou a renda dos indivı́duos. Esta conclusão é válida se os pressupostos


para inferência causal forem verdadeiros: permutabilidade, positividade e versão
única do tratamento (SUTVA, stable unit treatment value assumption). Conside-
rando que o tratamento foi administrado de forma padronizada e que não houve
contaminação, consideramos que o pressuposto SUTVA é razoável. Usando-se
o ATT supõe-se que foi possı́vel obter contrastes contrafatuais adequados na
ausência de randomização para os tratados. O pressuposto da positividade é
bem razoável neste exemplo. Obtivemos permutabilidade em relação às variáveis
observadas. Resta a possibilidade de confundimento por variável omitida. Esta
nossa estimativa do efeito causal é válida, desde que sejam válidos os nossos
pressupostos, que foram explicitados.
É interessante neste exemplo que o modelo de regressão convencional, ajustado
para as variáveis de confundimento sugeriu associação entre o programa de
retreinamento profissional e o aumento da renda. Entretanto, nas estimativas
obtidas em modelos ponderados pelo inverso da probabilidade de tratamento,
este efeito não foi significante.
. * Checando balanceamento após a ponderação com escore de propensão
. tebalance summ
Covariate balance summary
Raw Weighted

Number of obs = 614 614.0


Treated obs = 185 305.4
Control obs = 429 308.6

Standardized differences Variance ratio


Raw Weighted Raw Weighted

age -.2419036 .0944384 .4399955 .4599028


educ .0447551 -.0254442 .4958934 .6667641
black 1.667719 -.0061589 .8201414 1.011825
hispan -.2769396 .0007062 .4599131 1.002677
nodegree .2350482 .0400984 .8615699 .965795
married -.719492 .0483847 .6158881 1.084247
re74 -.5957516 -.0022908 .5181285 1.326828
re75 -.2870021 .0119291 .956293 1.400369

17. Podemos também verificar o balanceamento por método gráfico, usando o comando
tebalance density, para plotar gráficos de densidade kernel, para cada variável
quantitativa, separadamente para os grupos tratamento e controle. Se houver
sobreposição das distribuições, concluı́mos que a variável está balanceada, como é
o caso para a variável escolaridade (figura 10.2).
. tebalance density educ

193
10. Exemplo de análise com escore de propensão em Epidemiologia no Stata

Balance plot
Raw Weighted
.3
.2
Density
.1
0

0 5 10 15 20 0 5 10 15 20
educ
control treated

Figura 10.2.: Verificando balanceamento por método gráfico de densidade kernel.

194
Referências Bibliográficas
P C Austin. An Introduction to Propensity Score Methods for Re-
ducing the Effects of Confounding in Observational Studies. Mul-
tivariate Behav Res, 46(3):399–424, 2011. doi: 10.1080/00273171.2011.
568786. URL http://www.ncbi.nlm.nih.gov/pubmed/21818162http://www.
ncbi.nlm.nih.gov/pmc/articles/PMC3144483/pdf/hmbr46-399.pdf.
H R Banack and J S Kaufman. From bad to worse: collider stratification amplifies
confounding bias in the obesity paradox. Eur J Epidemiol, 30(10):1111–1114, 2015.
doi: 10.1007/s10654-015-0069-7. URL https://www.ncbi.nlm.nih.gov/pubmed/
26187718.
J Berkson. Limitations of the application of fourfold table analysis to hospital data. Bio-
metrics, 2(3):47–53, 1946. URL http://www.ncbi.nlm.nih.gov/pubmed/21001024.
H M Boardman, L Hartley, A Eisinga, C Main, M Roque i Figuls, X Bonfill
Cosp, R Gabriel Sanchez, and B Knight. Hormone therapy for preventing
cardiovascular disease in post-menopausal women. Cochrane Database Syst
Rev, (3):CD002229, 2015. doi: 10.1002/14651858.CD002229.pub4. URL
https://www.ncbi.nlm.nih.gov/pubmed/25754617http://onlinelibrary.
wiley.com/store/10.1002/14651858.CD002229.pub4/asset/CD002229.pdf?v=
1{&}t=iypv7m09{&}s=dcf431e2d97c5b5ba38053afb232d430b17f41a4.
M A Brookhart, S Schneeweiss, K J Rothman, R J Glynn, J Avorn,
and T Sturmer. Variable selection for propensity score models. Am
J Epidemiol, 163(12):1149–1156, 2006. doi: 10.1093/aje/kwj149. URL
https://www.ncbi.nlm.nih.gov/pubmed/16624967http://oup.silverchair-
cdn.com/oup/backfile/Content{_}public/Journal/aje/163/12/10.
1093/aje/kwj149/2/kwj149.pdf?Expires=1485355879{&}Signature=L1h-
WjNrHg79UpBtbzN1zFHHQAWpXmXo1mFEMF{˜}VMRHNJOaU8g4VtplIc2mQh3c4cIOC9Hl.
C R Charig, D R Webb, S R Payne, and J E Wickham. Comparison of treatment
of renal calculi by open surgery, percutaneous nephrolithotomy, and extracorporeal
shockwave lithotripsy. British medical journal (Clinical research ed.), 292(6524):
879–82, 1986. ISSN 0267-0623. doi: 10.1136/bmj.292.6524.879. URL https://www.
ncbi.nlm.nih.gov/pmc/articles/PMC1339981/pdf/bmjcred00227-0031.pdf.
T R Cortes, E Faerstein, and C J Struchiner. [Use of causal diagrams in Epidemiology:
application to a situation with confounding]. Cadernos de Saude Publica, 32(8):
e00103115, 2016. doi: 10.1590/0102-311X00103115. URL http://www.scielo.br/
pdf/csp/v32n8/1678-4464-csp-32-08-e00103115.pdf.

195
Referências Bibliográficas

Nguyen Viet Cuong. Which covariates should be controlled in propensity score mat-
ching? Evidence from a simulation study. Statistica Neerlandica, 67(2):169–180, 2013.
ISSN 00390402. doi: 10.1111/stan.12000.
G Davey Smith and S Ebrahim. Epidemiology–is it time to call it a day? Int J Epidemiol,
30(1):1–11, 2001. URL https://www.ncbi.nlm.nih.gov/pubmed/11171840.
F Elwert. Graphical causal models. In S L Morgan, editor, Handbook of causal analysis
for social research, chapter 13, pages 245–274. Springer, New York, 2013. ISBN 978-
94-007-6094-3. URL http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.
1.1.364.7505{&}rep=rep1{&}type=pdf.
Craig K. Enders. Applied missing data analysis. Methodology in the social sciences,
page 377, 2010. ISSN 1098-6596. doi: 10.1017/CBO9781107415324.004. URL https:
//ezp.lib.unimelb.edu.au/login?url=https://search.ebscohost.com/login.
aspx?direct=true{&}db=cat00006a{&}AN=melb.b3527645{&}site=eds-live.
N L Fleischer and A V Diez Roux. Using directed acyclic graphs to guide analyses
of neighbourhood health effects: an introduction. J Epidemiol Community Health,
62(9):842–846, 2008. doi: 10.1136/jech.2007.067371. URL http://jech.bmj.com/
content/62/9/842.full.pdf.
M M Glymour and S Greenland. Causal diagrams. In K J Rothman, S Greenland, and
T L Lash, editors, Modern Epidemiology, chapter 12, pages 183–209. Wolters Kluwer:
Lipincott Williams & Wilkins, Philadelphia, 3rd edition, 2008. ISBN 978-1451190052.
H. A. Goldani, H Bettiol, M A Barbieri, A. A. Silva, M Agranonik, M B
Morais, and M Z Goldani. Cesarean delivery is associated with an in-
creased risk of obesity in adulthood in a Brazilian birth cohort study.
American Journal of Clinical Nutrition, 93(6):1344–1347, 2011. ISSN
0002-9165. doi: 10.3945/ajcn.110.010033. URL http://www.scopus.com/
inward/record.url?eid=2-s2.0-79956303990{&}partnerID=MN8TOARShttp:
//www.ajcn.org/cgi/doi/10.3945/ajcn.110.010033.
L Gordis. Epidemiology. Elsevier Saunders, Philadelphia, 5th edition, 2014. ISBN
978-1-4557-3733-8.
D. Grady, S. M. Rubin, D. B. Petitti, C. S. Fox, D. Black, B. Ettinger, V. L. Ernster,
and S. R. Cummings. Hormone therapy to prevent disease and prolong life in
postmenopausal women. Annals of Internal Medicine, 117(12):1016–1037, 1992.
ISSN 00034819. doi: 10.1016/0020-7292(93)90679-Q.
S Greenland. Modeling and variable selection in epidemiologic analysis. Am J Public
Health, 79(3):340–349, 1989. URL https://www.ncbi.nlm.nih.gov/pmc/articles/
PMC1349563/pdf/amjph00229-0086.pdf.
S Greenland. Absence of confounding does not correspond to collapsibility of the rate
ratio or rate difference. Epidemiology, 7(5):498–501, 1996. URL https://www.ncbi.
nlm.nih.gov/pubmed/8862980.

196
Referências Bibliográficas

S Greenland and H Morgenstern. Confounding in health research. Annu


Rev Public Health, 22:189–212, 2001. doi: 10.1146/annurev.publhealth.22.
1.189. URL https://www.ncbi.nlm.nih.gov/pubmed/11274518http://www.
annualreviews.org/doi/pdf/10.1146/annurev.publhealth.22.1.189.
S Greenland and J M Robins. Identifiability, exchangeability, and epidemiological
confounding. Int J Epidemiol, 15(3):413–419, 1986. URL http://citeseerx.ist.
psu.edu/viewdoc/download?doi=10.1.1.157.6445{&}rep=rep1{&}type=pdf.
S Greenland and J M Robins. Identifiability, exchangeability and confounding revisited.
Epidemiol Perspect Innov, 6:4, 2009. doi: 10.1186/1742-5573-6-4. URL https:
//www.ncbi.nlm.nih.gov/pmc/articles/PMC2745408/pdf/1742-5573-6-4.pdf.
Sander Greenland. Quantifying Biases in Causal Models: Classical Confounding vs
Collider-Stratification Bias. Epidemiology, 14(3):300–306, may 2003. ISSN 1044-3983.
doi: 10.1097/01.EDE.0000042804.12056.6C. URL https://www.ncbi.nlm.nih.gov/
pubmed/12859030.
Sander Greenland, Judea Pearl, and James M Robins. Causal diagrams for epidemiologic
research. Epidemiology (Cambridge, Mass.), 10(1):37–48, jan 1999. ISSN 1044-3983.
doi: 10.1097/00001648-199901000-00008. URL https://cdn1.sph.harvard.edu/
wp-content/uploads/sites/343/2013/03/causaldia.pdf.
Francine Grodstein, Thomas B. Clarkson, and JoAnn E. Manson. Understan-
ding the Divergent Data on Postmenopausal Hormone Therapy. New England
Journal of Medicine, 348(7):645–650, feb 2003. ISSN 0028-4793. doi: 10.1056/
NEJMsb022365. URL http://www.ncbi.nlm.nih.gov/pubmed/12584376http://
www.nejm.org/doi/abs/10.1056/NEJMsb022365.
S Guo and M W Fraser. Propensity score analysis: statistical methods and applications.
Sage, Los Angeles, 2nd edition, 2015.
Gordon Guyatte, Drummond Rennie, Maureen Meade, and Deborah Cook. User’s
guide to the medical literature: essentials of evidence-based clinical practice. McGraw
Hill, New York, 3rd edition, sep 2015. ISBN 9780071808729.
M A Hernan. Causal Knowledge as a Prerequisite for Confounding Evaluation: An
Application to Birth Defects Epidemiology. American Journal of Epidemiology,
155(2):176–184, jan 2002. ISSN 00029262. doi: 10.1093/aje/155.2.176. URL http:
//aje.oxfordjournals.org/content/155/2/176.full.pdf.
M A Hernan and J M Robins. Causal Inference. Chapman & Hall/CRC, forthco-
ming, Boca Raton, 2018. URL https://www.hsph.harvard.edu/miguel-hernan/
causal-inference-book/.
M A Hernan, S Hernandez-Diaz, and J M Robins. A structural approach to selection
bias. Epidemiology, 15(5):615–625, 2004. URL http://www.ncbi.nlm.nih.gov/
pubmed/15308962http://graphics.tx.ovid.com/ovftpdfs/FPDDNCJCMAIDBI00/
fs047/ovft/live/gv024/00001648/00001648-200409000-00020.pdf.

197
Referências Bibliográficas

M A Hernan, D Clayton, and N Keiding. The Simpson’s paradox unraveled. Int J


Epidemiol, 40(3):780–785, 2011. doi: 10.1093/ije/dyr041. URL https://www.ncbi.
nlm.nih.gov/pubmed/21454324.

Miguel A. Hernán, Alvaro Alonso, Roger Logan, Francine Grodstein, Karin B. Michels,
Walter C. Willett, Joann E. Manson, and James M. Robins. Observational studies
analyzed like randomized experiments: An application to postmenopausal hormone
therapy and coronary heart disease. Epidemiology, 19(6):766–779, 2008. ISSN
10443983. doi: 10.1097/EDE.0b013e3181875e61.

S Hernandez-Diaz, E F Schisterman, and M A Hernan. The birth weight ”pa-


radox”uncovered? Am J Epidemiol, 164(11):1115–1120, 2006. doi: 10.1093/
aje/kwj275. URL http://www.ncbi.nlm.nih.gov/pubmed/16931543http://aje.
oxfordjournals.org/content/164/11/1115.full.pdf.

D E Ho, K Imai, G King, and E A Stuart. Matching as Nonparametric Preprocessing for


Reducing Model Dependence in Parametric Causal Inference. Political Analysis, 15:
199–236, 2007. URL http://gking.harvard.edu/files/abs/matchp-abs.shtml.

P W Holland. Statistics and causal inference. J Am Stat Assoc, 81(396):945–960, 1986.

Stephen Hulley, Deborah Grady, Trudy Bush, Curt Furberg, David Herrington, Betty
Riggs, Eric Vittinghoff, and Heart and Estrogen/progestin Replacement Study
(HERS) Research Group. Randomized Trial of Estrogen Plus Progestin for Secondary
Prevention of Coronary Heart Disease in Postmenopausal Women. JAMA, 280
(7):605, 1998. ISSN 0098-7484. doi: 10.1001/jama.280.7.605. URL http://jama.
jamanetwork.com/article.aspx?doi=10.1001/jama.280.7.605.

G W Imbens and D B Rubin. Causal Inference for Statistics, Social, and Biomedical
Sciences: an Introduction. Cambridge University Press, Cambridge, 2015. ISBN
978-0-521-88588-1.

Nicholas P. Jewell. Statistics for epidemiology. Chapman & Hall/CRC, Boca Raton,
2004. ISBN 9781584884330. URL https://www.crcpress.com/Statistics-for-
Epidemiology/Jewell/p/book/9781584884330.

David Kleinbaum, Lawrence Kupper, and Hal Morgenstern. Epidemiology: principles


and quantitative methods. John Wiley & Sons, New York, 1982. ISBN 0-471-28985-
X. URL http://www.wiley.com/WileyCDA/WileyTitle/productCd-047128985X.
html.

R B Kline. Principles and practice of structural equation modeling, volume Guilford.


Guilford, New York, 4th edition, 2016. ISBN 978-1-4625-2334-4.

Walter. Leite. Practical propensity score methods using R. Sage, Thousand Oaks, 2017.
ISBN 9781452288888. URL https://us.sagepub.com/en-us/sam/practical-
propensity-score-methods-using-r/book241054.

198
Referências Bibliográficas

R M Mickey and S Greenland. The impact of confounder selection criteria on effect


estimation. Am J Epidemiol, 129(1):125–137, 1989. URL https://www.ncbi.nlm.
nih.gov/pubmed/2910056.

O S Miettinen and E F Cook. Confounding: essence and detection. Am J Epidemiol,


114(4):593–603, 1981. URL https://www.ncbi.nlm.nih.gov/pubmed/7304589.

David Moher, Sally Hopewell, Kenneth F. Schulz, Victor Montori, Peter C. Gøtzsche,
P. J. Devereaux, Diana Elbourne, Matthias Egger, and Douglas G. Altman. CON-
SORT 2010 explanation and elaboration: updated guidelines for reporting parallel
group randomised trials. BMJ (Clinical research ed.), 340:c869, 2010. ISSN 14685833.
doi: 10.1136/bmj.c869.

S L Morgan and C Winship. Counterfactuals and causal inference: methods and


principles for social research. Cambridge University Press, Cambridge, 2nd edition,
2015. ISBN 1107694167.

J Neyman. Sur les applications de la thar des probabilities aux experiences Agaricales:
Essay des principle. Excerpts reprinted (1990) in English (D. Dabrowska and T.
Speed, translators) . Statistical Science,, 5:463–472, 1923.

A Olmos and P Govindasamy. A practical guide for using propensity score weighting
in R. Practical Assessment Research & Evaluation, 20(13):1–8, 2015.

Neil Pearce and Lorenzo Richiardi. Commentary: Three worlds collide: Berkson’s bias,
selection bias and collider bias. International Journal of Epidemiology, 43(2):521–524,
2014. ISSN 14643685. doi: 10.1093/ije/dyu025.

J Pearl. Causal Inference in the Health Sciences: A Conceptual Intro-


duction. Health Services & Outcomes Research Methodology, 2:189–220,
2001. URL http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.15.
8830{&}rep=rep1{&}type=pdf.

J Pearl. Causality: models, reasoning and inference. Cambridge University Press,


Cambridge, 2nd edition, 2009a. ISBN 978-0-521-89560-6.

Judea Pearl. Causal inference in statistics: An overview. Statistics Surveys, 3:96–146,


2009b. ISSN 1935-7516. doi: 10.1214/09-SS057. URL http://projecteuclid.org/
euclid.ssu/1255440554.

Judea Pearl, Madelyn Glymour, and Nicholas P. Jewell. Causal inference in statistics:
a primer. John Wiley & Sons, Chichester, UK, 2016. ISBN 1119186846. URL
http://www.wiley.com/WileyCDA/WileyTitle/productCd-1119186846.html.

M L Petersen and M J van der Laan. Causal models and learning from data: integrating
causal modeling and statistical estimation. Epidemiology, 25(3):418–426, 2014. doi:
10.1097/EDE.0000000000000078. URL http://www.ncbi.nlm.nih.gov/pubmed/
24713881.

199
Referências Bibliográficas

Ross L. Prentice, Robert Langer, Marcia L. Stefanick, Barbara V. Howard, Mary


Pettinger, Garnet Anderson, David Barad, J. David Curb, Jane Kotchen, Lewis
Kuller, Marian Limacher, Jean Wactawski-Wende, and Women’s Health Initiative
Investigators. Combined Postmenopausal Hormone Therapy and Cardiovascular
Disease: Toward Resolving the Discrepancy between Observational Studies and
the Women’s Health Initiative Clinical Trial. American Journal of Epidemiology,
162(5):404–414, sep 2005. ISSN 1476-6256. doi: 10.1093/aje/kwi223. URL http:
//www.ncbi.nlm.nih.gov/pubmed/16033876http://academic.oup.com/aje/
article/162/5/404/82544/Combined-Postmenopausal-Hormone-Therapy-and.

S H Preston and A Stokes. Obesity paradox: conditioning on disease


enhances biases in estimating the mortality risks of obesity. Epidemi-
ology, 25(3):454–461, 2014. doi: 10.1097/EDE.0000000000000075. URL
http://www.ncbi.nlm.nih.gov/pubmed/24608666http://www.ncbi.nlm.nih.
gov/pmc/articles/PMC3984024/pdf/ede-25-454.pdf.

David H. Rehkopf, M. Maria Glymour, and Theresa L. Osypuk. The Consistency


Assumption for Causal Inference in Social Epidemiology: When a Rose Is Not a Rose.
Current Epidemiology Reports, 3(1):63–71, 2016. ISSN 2196-2995. doi: 10.1007/s40471-
016-0069-5. URL http://link.springer.com/10.1007/s40471-016-0069-5.

P R Rosenbaum and D B Rubin. The Central Role of the Propensity Score in


Observational Studies for Causal Effects. Biometrika, 70(1):41–55, 1983. doi: DOI10.
1093/biomet/70.1.41. URL http://biomet.oxfordjournals.org/content/70/1/
41.full.pdf.

Paul R. Rosenbaum. Observation and experiment : an introduction to causal inference.


Harvard University Press, Cambridge/MA, 2017. ISBN 9780674975576. URL
http://www.hup.harvard.edu/catalog.php?isbn=9780674975576.

JE Rossouw, GL Anderson, RL Prentice, and Women’s Health Initiative Investigators.


Risks and Benefits of Estrogen Plus Progestin in Healthy Postmenopausal Women.
The Jornal of the American Medical Association, 288(3):321–333, 2002.

K J Rothman, S Greenland, and T L Lash. Modern Epidemiology. Wolters Kluwer:


Lipincott Williams & Wilkins, Philadelphia, 3rd edition, 2008. ISBN 978-1451190052.

D B Rubin. Estimating Causal Effects of Treatments in Randomized and Nonrandomized


Studies. Journal of Educational Psychology, 66(5):688–701, 1974. doi: Doi10.1037/
H0037350. URL http://psycnet.apa.org/journals/edu/66/5/688.pdf.

D B Rubin. The design versus the analysis of observational studies for causal effects:
parallels with the design of randomized trials. Stat Med, 26(1):20–36, 2007. doi:
10.1002/sim.2739. URL https://www.ncbi.nlm.nih.gov/pubmed/17072897http:
//onlinelibrary.wiley.com/store/10.1002/sim.2739/asset/2739{_}ftp.
pdf?v=1{&}t=iy7bouh7{&}s=1bf6c4d9839b1ab3a69d5004e70f90496628a8f3.

200
Referências Bibliográficas

Erigene Rutayisire, Kun Huang, Yehao Liu, and Fangbiao Tao. The mode of delivery
affects the diversity and colonization pattern of the gut microbiota during the first
year of infants’ life: A systematic review. BMC Gastroenterology, 16(1):1–12, 2016.
ISSN 1471230X. doi: 10.1186/s12876-016-0498-0. URL http://dx.doi.org/10.
1186/s12876-016-0498-0.
R Scheines. An Introduction to Causal Inference. 1997. URL https://pdfs.
semanticscholar.org/ba18/30ac5ba38d9d19daad4fc0065785ecc36cca.pdf.
Ilya Shpitser, Tyler J VanderWeele, and James M Robins. On the validity of covariate
adjustment for estimating causal effects. In Proceedings of the Twenty Sixth Con-
ference on Uncertainty in Artificial Intelligence $(UAI-10)$, pages 527–536, 2010.
ISBN 978-0-9749039-6-5.
I Shrier and R W Platt. Reducing bias through directed acyclic graphs. BMC Med Res
Methodol, 8:70, 2008. doi: 10.1186/1471-2288-8-70. URL http://www.ncbi.nlm.
nih.gov/pmc/articles/PMC2601045/pdf/1471-2288-8-70.pdf.
E H Simpson. The Interpretation of Interaction in Contingency Ta-
bles. Journal of the Royal Statistical Society. Series B, 13(2):
238–241, 1951. URL http://www.epidemiology.ch/history/PDFbg/
SimpsonEH1951theinterpretationofinteraction.pdf.
P Spirtes, C Glymour, and R Scheines. Causation, prediction and search. MIT Press,
Cambridge/MA, 2nd edition, 2000. ISBN 9780262527927.
Meir J. Stampfer, Graham A. Colditz, Walter C. Willett, JoAnn E. Manson, Bernard
Rosner, Frank E. Speizer, and Charles H. Hennekens. Postmenopausal Estrogen
Therapy and Cardiovascular Disease. New England Journal of Medicine, 325(11):
756–762, sep 1991. ISSN 0028-4793. doi: 10.1056/NEJM199109123251102. URL
http://www.nejm.org/doi/abs/10.1056/NEJM199109123251102.
E A Stuart. Matching methods for causal inference: A review and a look
forward. Stat Sci, 25(1):1–21, 2010. doi: 10.1214/09-STS313. URL
http://www.ncbi.nlm.nih.gov/pubmed/20871802http://www.ncbi.nlm.nih.
gov/pmc/articles/PMC2943670/pdf/nihms200640.pdf.
Moyses Szklo and F Javier Nieto. Epidemiology: beyond the basics. Jones & Bartlett
Learning, Burlington,MA, 3rd edition, 2014. ISBN 9781449604691. doi: 10.1016/j.
ijmedinf.2010.04.003.
G Taubes. Epidemiology faces its limits. Science (New York, N.Y.), 269(5221):164–9,
jul 1995. ISSN 0036-8075. URL http://www.ncbi.nlm.nih.gov/pubmed/7618077.
G Taubes. Do we really know what makes us healthy?, 2007.
J Textor, J Hardt, and S Knuppel. DAGitty: a graphical tool for analyzing causal
diagrams. Epidemiology, 22(5):745, 2011. doi: 10.1097/EDE.0b013e318225c2be. URL
http://www.ncbi.nlm.nih.gov/pubmed/21811114.

201
Referências Bibliográficas

Mark J van der Laan and Sherri Rose. Targeted Learning. Springer Series in Statistics.
Springer New York, New York, NY, 2011. ISBN 978-1-4419-9781-4. doi: 10.1007/978-
1-4419-9782-1. URL http://link.springer.com/10.1007/978-1-4419-9782-1.

Jan P. Vandenbroucke. The HRT controversy: observational studies and RCTs fall in
line. The Lancet, 373(9671):1233–1235, 2009. ISSN 01406736. doi: 10.1016/S0140-
6736(09)60708-X.
Tyler J. VanderWeele. Concerning the consistency assumption in causal inference. Epide-
miology, 20(6):880–883, 2009. ISSN 10443983. doi: 10.1097/EDE.0b013e3181bd5638.

Tyler J VanderWeele and Ilya Shpitser. On the definition of a confounder. The Annals
of Statistics, 41(1):196–220, feb 2013. ISSN 0090-5364. doi: 10.1214/12-AOS1058.
URL http://projecteuclid.org/euclid.aos/1364302740.
Liu Wei, M. Alan Brookhart, Sebastian Schneeweiss, Xiaojuan Mi, and Soko Setoguchi.
Implications of M bias in epidemiologic studies: A simulation study. American Journal
of Epidemiology, 176(10):938–948, 2012. ISSN 00029262. doi: 10.1093/aje/kws165.
Daniel Westreich. Berkson’s Bias, Selection Bias, and Missing Data. Epi-
demiology, 23(1):159–164, 2012. ISSN 1044-3983. doi: 10.1097/EDE.
0b013e31823b6296. URL http://content.wkhealth.com/linkback/openurl?
sid=WKPTLP:landingpage{&}an=00001648-201201000-00024.

202

Você também pode gostar