Listar Aula4

1 AULA 4 - TABELA DE CONTINGÊNCIA E MEDIDAS DE
ASSOCIAÇÃO
1.1 Tabela de contingência
Este exemplo se refere a um ensaio clínico aleatório em que um grupo de pacientes
com diabetes foi tratado com uma droga e o outro grupo recebeu placebo (Áragon e
Enanoria 1 , 2009). O desfecho foi óbito (sim e não). A tabela que representa esses resul-
tados está abaixo (Tabela 1).
Tabela 1: Tabela de contingência de ensaio clínico.
Mortes Sobreviventes
Medicamento 30 174
Placebo 21 184
Esses dados foram organizados nessa tabela de contigência a partir de uma base de
dados brutos. Vamos, primeiramente, importar essa base e, posteriormente, extrair as
informações necessárias para montar a Tabela 1.
• Importar base de dados da Internet (Áragon e Enanoria 1 , 2009)
>ud <- read.table(“http://www.medepi.net/data/ugdp.txt”, header = TRUE, sep
= “,”)
• Visualizar base de dados
> ud
Status Treatment Agegrp
1 Death Tolbutamide <55
2 Death Tolbutamide <55
...
408 Survivor Placebo 55+
409 Survivor Placebo 55+

Essa base de dados, que é um objeto nomeado por ud, contém três colunas com
variáveis qualitativas nominais. A primeira coluna é o desfecho, ou seja, óbito (Death
= sim, Survivor = não). A segunda coluna é a exposição ao tratamento (Tolbutamide
= sim, Placebo = não). E, a terceira coluna é a faixa etária. Neste exemplo, vamos
trabalhar com tabela de contingência simples, ou seja, sem estratificação por idade.
Portanto, o interesse é saber se os pacientes que foram à óbito estão associados ao
tratamento com Tobultamide para todas as idades. Para tanto, faz-se necessário saber
as seguintes informações para montar a tabela de contingência a partir da base de dados
brutos:
• 1 - Pacientes que morreram e tomaram o medicamento (30)
2 - Pacientes que sobreviveram e tomaram o medicamento (174)
3 - Pacientes que morreram e tomaram o placebo (21)
4 - Pacientes que sobreviveram e tomaram o placebo (184)
Para extrair a distribuição de frequência de uma variável qualitativa, deve-se utilizar
a função table() com o operador de indexação $. Por exemplo:
• > table(ud$Status)
Death Survivor
51 358
Para obter a tabela de contingência, entretanto, deve-se conhecer a distribuição de
frequência em Status condicionada à exposição ao tratamento. Por exemplo:
• > table(ud$Status[ud$Treatment=="Placebo"])
Death Survivor
21 184
• > table(ud$Status[ud$Treatment=="Tolbutamide"])
Death Survivor
30 174
2
Para montar a tabela de contingência, faz-se necessário conhecer o objeto do R
conhecido como matriz. A matriz é uma coleção de elementos organizados em um objeto
de dados de duas dimensões. Elementos de matriz podem ser numéricos, categóricos ou
lógicos. Tabelas de contingência em epidemiologia são representadas no R como matrizes
numéricas com a função matrix(). Por exemplo, uma tabela de contigência 2x2 pode
ser representada por uma matriz de 2 linhas e 2 colunas. Primeiramente, cria-se um
vetor com os valores das caselas e, posteriormente, monta-se uma matriz 2x2 com esse
vetor, sendo que o preenchimento ocorre pela linha utilizando o argumento byrow =
TRUE.
• Montar as caselas
>casela <- c(“a”, “b”, “c”, “d”)
• Montar a tabela de contingência
>tabconti <- matrix(casela, 2, 2, byrow = TRUE)
>tabconti
[,1] [,2]
[1,] “a” “b”
[2,] “c” “d”

Agora, vamos aplicar esse conhecimento para montar a tabela de contingência de
interesse (Tabela 1). Primeiro, criamos o vetor e a matriz. Segundo, nomeamos as linhas
e colunas.
• Criar a matriz
>casela <- c(30, 174, 21, 184)
>tab.ud <- matrix(casela, 2, 2, byrow = TRUE)
>tab.ud
[,1] [,2]
[1,] 30 174
[2,] 21 184
3
• Nomear a matriz
>rownames(tab.ud) <- c(“Medicamento”, “Placebo”)
>colnames(tab.ud) <- c(“Mortes”, “Sobreviventes”)
• Eis que surge a tabela de contingência
>tab.ud
Medicamento 30 174
Placebo 21 184
1.2 Medidas de ocorrência e de associação
Em epidemiologia, as medidas de ocorrência e de associação mais utilizadas estão
na Tabela 2.
Tabela 2: Medidas de ocorrência e de associação.
Tipo Medidas Descrição

Medidas de Incidência Número de casos novos
ocorrência Prevalência Número de casos existentes
Taxa de incidência Casos novos por
pessoa-tempo sob risco
Risco Probabilidade de se tornar
um caso
Odds Chance de se tornar um caso
Medidas de Razão de taxas Razão entre
associação duas taxas
Risco relativo Razão entre
dois riscos
odds ratio Razão entre
duas chances
4
Na Tabela 2, todos os exemplos são razões. Então, o que é uma razão? Uma razão
é a comparação de dois números (r 1 , r 2 ):
r1
r1 : r2 =
r2
Um tipo de razão é a proporção, que pode ser utilizada como uma medida de ocorrên-
cia (Tabela 2). Proporção pode ser utilizada para estimar o risco em que o numerador
é um subconjunto do denominador. Exemplo: de n pessoas que foram operadas, x
apresentaram sintomas de infecção hospitalar:
x
R=
n
onde x é um subconjunto de n.
Como exemplo de medida de associação (Tabela 2), chance (odds) é uma razão de
duas probabilidades em um evento binário.
P R x/n x
Chance = = = =
1−P 1−R 1 − x/n n−x
Considerando a seguinte tabela de contingência:
• >tab.ud
Medicamento 30 174
Placebo 21 184
• Qual é o risco de morte para os dois grupos?
• Qual é a chance de morte para os dois grupos?
5
• Risco de morte aos que tomaram o medicamento:
> 30/(30+174)
[1] 0.1470588
• Risco de morte aos que tomaram o placebo:
> 21/(21+184)
[1] 0.1024390
• Chance de morte aos que tomaram o medicamento:
>(30/(30+174)) / (1 - (30/(30+174)))
[1] 0.1724138
• Chance de morte aos que tomaram o placebo:
> (21/(21+184)) / (1 - (21/(21+184)))
[1] 0.1141304
Assim, podemos preencher com essas medidas de ocorrência a Tabela 3.
Tabela 3: Medidas de ocorrência de morte em ud.
Medidas de ocorrência Medicamento Placebo

riscos 0.1470588 0.1024390
chances 0.1724138 0.1141304
Podemos calcular as medidas de associação de interesse, por exemplo, o risco relativo
e a razão de chances de morte com placebo como baseline (Tabela 4).
• > (30/(30+174)) / (21/(21+184))
[1] 1.435574
• > ((30/(30+174)) / (1 - (30/(30+174)))) /((21/(21+184)) / (1 - (21/(21+184))))
[1] 1.510673
6
Tabela 4: Medidas de associação com morte em ud.
Medidas de associação Medicamento / Placebo

risco relativo 1.4355742
razão de chances 1.510673
Diante disso, qual seria a interpretação? Será que o medicamento é um fator de
risco (> 1)? Para responder a essa pergunta, podemos calcular o teste exato de Fisher
ou o teste de X 2 para determinar se a medida de associação é significativa, ou seja,
diferente de 1 (Agresti 2 , 1990). Nesse caso, a hipótese nula é a independência entre as
duas variáveis (linhas e colunas).
• > fisher.test(tab.ud)
Fisher’s Exact Test for Count Data
data: tab.ud
p-value = 0.1813
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.8013768 2.8872863
sample estimates:
odds ratio
1.509142
• > chisq.test(tab.ud)
Pearson’s Chi-squared test with Yates’ continuity correction
data: tab.ud
X-squared = 1.4787, df = 1, p-value = 0.2240
7
No output do teste exato de Fisher é indicado o intervalo de confiança de 95%
(0.8013768 - 2.8872863) o qual mostra que a razão de chances pode ser igual 1. Além
disso, os dois testes apontaram para o mesmo resultado, ou seja, aceita-se a hipótese
nula de independência entre linhas e colunas (Tabela 5).
Tabela 5: Testes de independência

entre linhas e colunas.
Teste de associação valor de p

Fisher 0.181
X2 0.224
Confirma-se, portanto, que não há associação entre mortes e exposição ao trata-
mento com Tolbutamide. Entretanto, faltou calcular o intervalo de confiança para a
estimativa do risco relativo. Nesse caso, podemos utilizar o R como um ambiente de
programação flexível no qual podemos criar nossas próprias funções. Por exemplo, fun-
ções para calcular as estimativas pontuais das medidas de associação e seus respectivos
intervalos de confiança.
1.3 Intervalos de confiança
O exemplo a ser trabalhado para entender funções se refere aquele ensaio clínico
aleatório em que um grupo de pacientes com diabetes foi tratado com uma droga e o
outro grupo recebeu placebo (Áragon e Enanoria 1 , 2009). O desfecho foi óbito (sim e
não). A tabela que representa esses resultados está abaixo:
Medicamento 30 174
Placebo 21 184
8
A estimativa do risco relativo (RR) é feita calculando a proporção de pessoas sob
x1
risco que adquiriram a doença N1 dividida pela proporção de pessoas que não estão sob
x0 x1
risco e adquiriram a doença N0 . A proporção N1 é conhecida por risco nos expostos
x0
(R1 ) e a proporção N0 é o risco nos não-expostos (R0 ).
R1 x1 /N1
RR = =
R0 x0 /N0
Pode-se calcular o intervalo de confiança para a estimativa do risco relativo (Áragon
e Enanoria 1 , 2009). O intervalo de confiança permite mostrar a variabilidade em torno
dessa estimativa pontual. Para tanto, deve-se conhecer o método de elaboração de
um intervalo de confiança baseado na aproximação da distribuição normal. Para uma
estimativa, por exemplo o RR, o intervalo de confiança é construído em acordo com a
seguinte fórmula:
RRinf , RRsup = RR ± Z ∗ EP (RR)
onde EP (RR) é o erro padrão da estimativa amostral e ±Z são os quantis da curva de
densidade probabilística de uma distribuição normal padronizada.
O erro padrão EP (RR) é uma medida de desvio padrão das estimativas de risco
relativo, teoreticamente, obtidas em repetidas amostras da população. Ele pode ser
obtido por meio da seguinte fórmula:
s
1 1 1 1
EP [log(RR)] = − + −
x1 N1 x0 N0
onde x1 + x0 é total de pessoas acometidas pela doença e N1 + N0 é o total de pessoas
na amostra. A raiz quadrada transforma o erro padrão para a escala loge do RR, que é
uma aproximação da distribuição normal.
9
Para um intervalo de confiança de 95%, P (−Z ≤ z ≤ +Z) = 0.95, tem-se que
P (z ≤ −1.96) = P (z ≥ 1.96) é igual a 0.025. No R, por exemplo, pode-se obter o
quantil q para uma determinada probabilidade p, em que p = P (Z ≤ q), utilizando a
função qnorm():
• > nivel.conf <- 0.90
> qnorm((1 + nivel.conf)/2)
[1] 1.644854
• > nivel.conf <- 0.95
> qnorm((1 + nivel.conf)/2)
[1] 1.959964
Pode-se calcular os limites inferior ICinf e superior ICsup do intervalo de confiança
do RR utilizando as seguintes fórmulas:
ICinf = exp(log(RR) − z1−α ∗ EP logRR)
ICsup = exp(log(RR) + z1−α ∗ EP logRR)
onde a transformação exponencial exp é feita para re-escalonar o intervalo de confiança
na escala original do RR.
Após essa breve revisão teórica, podemos criar uma função no R para calcular o
intervalo de confiança. Vamos criar a função de nome rr que possui dois argumentos,
primeiro, a tabela de contingência (x), segundo, o nível de confiança (nivel.conf ). Essa
função poderá ser aplicada para qualquer tabela de contingência 2x2 e, também, para
outro nível de confiança.
• > rr <- function(x, nivel.conf){
10
Os argumentos possuem nome, por exemplo, x que é o nome genérico para o objeto
de interesse, nesse caso, a tabela de contingência. O operador { indica que a função
deve ser explicitada a partir desse ponto. Para tanto, devem-se declarar as variáveis,
por exemplo, x1 que é o número de expostos e doentes.
• > x1 <- x[1,1]
> n1 <- sum(x[1,])
> x0 <- x[2,1]
> n0 <- sum(x[2,])
Calculam-se os riscos entre expostos R1 e entre não-expostos R0 para obter a esti-
mativa do risco relativo (RR). A estimativa do RR é transformada para a escala loge
para aproximar da distribuição normal.
• > r1 <- x1/n1
> r0 <- x0/n0
> RR <- r1/r0;
> logRR <- log(RR)

q
1 1 1 1
O erro padrão é calculado com a equação EP [log(RR)] = x1 − N1 + x0 − N0
explicitada na linguagem R.
• EPlogRR <- sqrt(1/x1 - 1/n1 + 1/x0 - 1/n0)
O percentil crítico z é determinado para o nível de confiança escolhido.
• z <- qnorm(0.5*(1 + nivel.conf))
Calculam-se os intervalos de confiança inferior ICinf e superior ICsup .
• ICI <- exp(logRR - z*EPlogRR)
ICS <- exp(logRR + z*EPlogRR)
11
Os resultados, ou seja, o output da função, podem ser mostrados por meio da função
return() que deve retornar uma lista de objetos, utilizando a função list(). Esse objetos
podem ser, por exemplo, a tabela de contingência, os riscos, o risco relativo, o intervalo
de confiança e o nível de confiança. A função termina com o operador }.
• return(list(x = x, riscos = c(r1 = r1, r0 = r0), risco.relativo = RR,
int.conf = c(ICI, ICS), nivel.conf = nivel.conf) )
A função rr pode ser aplicada com a tabela de contingência tab.ud, escolhendo o
nível de significância de 0.95.
• >rr(tab.ud, 0.95)
$x
Medicamento 30 21
Placebo 174 184

$riscos
r1 r0
0.1470588 0.1024390
$risco.relativo
[1] 1.435574
$int.conf
[1] 0.851022 2.421645
$nivel.conf
[1] 0.95
Confirma-se, definitivamente, que para esse ensaio clínico a exposição ao medica-
mento não está associada ao desfecho, ou seja, ao óbito (RR = 1.44; IC95% = 0.85,
2.42).
12
1.4 Exercícios da Aula 4
1 A síndrome respiratória aguda grave (SARS) se espalhou rapidamente pelo mundo,

em grande parte porque as pessoas infectadas com o vírus viajaram em aeronaves para
cidades distantes. Muitas pessoas infectadas viajaram em aviões comerciais, mas o
risco de transmissão era desconhecido. Em 15 de março de 2003, um Boeing 737-300
carregando 120 pessoas (112 passageiros, seis assistentes de vôo e 2 pilotos) voou durante
três horas de Hong Kong para Pequim. Um dos passageiros era um homem sintomático
de 72 anos de idade (Olsen e col. 3 , 2003).
Em epidemiologia, podemos calcular a taxa de incidência (r) a partir de novos casos
(x) divididos por pessoas-tempo (PT), assumindo que x tende a uma distribuição Poisson
e PT tem um valor fixo.
• Estimativa
x
r=
PT
As fórmulas abaixo servem para calcular o intervalo de confiança por meio de uma
aproximação da distribuição Normal.
• Intervalo de confiança r
x
EP (r) =
PT2
ri = r − z1−α ∗ EP (r)
rs = r + z1−α ∗ EP (r)
Considerando o cálculo do risco de SARS no Boeing 737-300 em 2003 (Olsen e col. 3 ,

2003), utilize a Figura 1 para responder as seguintes questões:
• Qual é o risco de adquirir sintomas de SARS considerando somente os pacientes
da classe econômica sob risco?
• Calcule o intervalo de confiança de 90% da estimativa pontual.
13
Figura 1:TheRisco de SARS journal
new england col. 3 , (2003).
em Olsenof emedicine
10
11
12
13
14
15
16
17
18
19
20
21
22
1
2
3
4
5
6
7
8
9
DE F
ABC
No illness (person interviewed) Index patient
No illness (person not interviewed) Crew member
Probable case of SARS Empty seat
Figure 2. Schematic Diagram of the Boeing 737-300 Aircraft on Flight 2 from Hong Kong to Beijing.
Two flight attendants and two Chinese officials also reportedly had illness that met the WHO criteria for a probable case
of SARS. The flight attendants are shown here as members of the crew. The seat locations of the two Chinese officials are
unknown, and they are not included in the diagram.
2 flight;
Emborathreeseja
werepossível
confirmedfazer
to be seropositive,
os cálculosand semthe flight through
precisar our interviews
elaborar with theimagine
uma função, ill passen-
one of the three was also positive on RT-PCR. gers. One ill person, who was part of a tour that trav-
uma situação-problema em que seja necessário aplicar o mesmo procedimento várias
Interviews of passengers were conducted a me- eled together, had an onset of illness eight days after
vezes,
dian por
of 11exemplo,
days (range,calcular o risco
6 to 11) after e o intervalo
the flight. de an
Of the flight, confiança emmight
interval that diversas bases
have been de
attribut-
dados. Nesse caso, é necessário elaborar uma função para otimizar esse procedimento.
the 166 persons interviewed (67 percent), 1 report- able to secondary spread from another member of
Portanto, vamos
ed fever and primeiramente
respiratory symptoms butelaborar uma
never had a função para calcular o risco e o intervalo
the tour group.
de chest
confiança e posteriormente
radiograph obtained and wasaplicá-la comasos dados
not reported de SARS.that
The observation Ostheresultados
passengersdevem
who becameser
having a probable case of SARS (Table 1).
coincidentes com aqueles previamente calculados. He has infected were clustered in the few rows directly in
since fully recovered without hospitalization. Rou- front of or behind the ill passenger, rather than be-
tine surveillance did not result in the detection of any ing randomly distributed throughout the aircraft, is
additional cases among the remaining 33 percent of consistent with the pattern described in other cases
the passengers and crew members. in which a respiratory pathogen was transmitted on
board an aircraft13 and lends further plausibility to
di s cu ssi o n the theory that transmission occurred during the
flight. The risk to passengers was greatest if they
We believe that the most plausible explanation for were seated in the same row as the index patient or
the development of SARS in the passengers and crew within three rows in front of him. The greater con-
members on Flight 2 is that they were infected while centration of persons who became infected in front
on board the aircraft, although other explanations of the index patient than behind him may point to
are possible. As might be expected of a flight carry- the role of coughing in transmission, causing a com-
ing patients with SARS, Flight 2 was traveling from bination of aerosol and small-droplet spread.
a SARS-affected area (Hong Kong) to a destination Large-droplet spread is often believed to occur
that would later be identified as a SARS-affected area within 36 in. of a patient,14 and this cutoff has been
(Beijing). Therefore, it is possible that the passen- used to define exposure to SARS in other investiga-
gers in whom SARS developed were infected before tions.15 However, the distance covered by three
or after the flight. However, the clustering of the economy-class rows on a Boeing 737-300 is 2.3 m
dates of onset of illness around four days after the (90 in.). On this aircraft, 90 percent of the persons
flight is in keeping with the expected incubation pe- who became ill were seated more than 36 in. away
14
riod for SARS11,12 and points to the day of the flight from the index patient, so airborne, small-particle,
as a likely time of transmission. Furthermore, we or other remote transmission may be more straight-
identified no alternative exposures before or after forward explanations for the observed distribution
2420 n engl j med 349;25 www.nejm.org december 18 , 2003
The New England Journal of Medicine

Downloaded from www.nejm.org on October 4, 2010. For personal use only. No other uses without permission.
Referências
[1] Aragón TJ, Enanoria WT. Applied Epidemiology Using R [livro na in-
ternet]. Berkeley; 2009 [acesso em outubro 2010]. Disponível em:
http://www.medepi.com/docs/epir.pdf.
[2] Agresti A. Categorical data analysis. New York: Wiley; 1990.
[3] Olsen SJ, Chang HL, Cheung TYY, Tang AF, Fisk TL, e col. Transmission of the
Severe Acute Respiratory Syndrome on Aircraft. New England Journal of Medicine.
2003;349:2416-2422.
15

Listar Aula4

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Listar Aula4

Enviado por

Direitos autorais:

Formatos disponíveis

1 AULA 4 - TABELA DE CONTINGÊNCIA E MEDIDAS DE

1.1 Tabela de contingência

Este exemplo se refere a um ensaio clínico aleatório em que um grupo de pacientes

tados está abaixo (Tabela 1).

Tabela 1: Tabela de contingência de ensaio clínico.

dados brutos. Vamos, primeiramente, importar essa base e, posteriormente, extrair as

informações necessárias para montar a Tabela 1.

• Importar base de dados da Internet (Áragon e Enanoria 1 , 2009)

>ud <- read.table(“http://www.medepi.net/data/ugdp.txt”, header = TRUE, sep

• Visualizar base de dados

1 Death Tolbutamide <55

2 Death Tolbutamide <55

408 Survivor Placebo 55+

409 Survivor Placebo 55+

variáveis qualitativas nominais. A primeira coluna é o desfecho, ou seja, óbito (Death

= sim, Survivor = não). A segunda coluna é a exposição ao tratamento (Tolbutamide

Portanto, o interesse é saber se os pacientes que foram à óbito estão associados ao

as seguintes informações para montar a tabela de contingência a partir da base de dados

• 1 - Pacientes que morreram e tomaram o medicamento (30)

2 - Pacientes que sobreviveram e tomaram o medicamento (174)

3 - Pacientes que morreram e tomaram o placebo (21)

4 - Pacientes que sobreviveram e tomaram o placebo (184)

Para extrair a distribuição de frequência de uma variável qualitativa, deve-se utilizar

a função table() com o operador de indexação $. Por exemplo:

frequência em Status condicionada à exposição ao tratamento. Por exemplo:

conhecido como matriz. A matriz é uma coleção de elementos organizados em um objeto

de dados de duas dimensões. Elementos de matriz podem ser numéricos, categóricos ou

lógicos. Tabelas de contingência em epidemiologia são representadas no R como matrizes

ser representada por uma matriz de 2 linhas e 2 colunas. Primeiramente, cria-se um

>casela <- c(“a”, “b”, “c”, “d”)

• Montar a tabela de contingência

>tabconti <- matrix(casela, 2, 2, byrow = TRUE)

[1,] “a” “b”

[2,] “c” “d”

>casela <- c(30, 174, 21, 184)

>tab.ud <- matrix(casela, 2, 2, byrow = TRUE)

>rownames(tab.ud) <- c(“Medicamento”, “Placebo”)

>colnames(tab.ud) <- c(“Mortes”, “Sobreviventes”)

• Eis que surge a tabela de contingência

1.2 Medidas de ocorrência e de associação

Em epidemiologia, as medidas de ocorrência e de associação mais utilizadas estão

Tabela 2: Medidas de ocorrência e de associação.

Tipo Medidas Descrição

é a comparação de dois números (r 1 , r 2 ):

é um subconjunto do denominador. Exemplo: de n pessoas que foram operadas, x

apresentaram sintomas de infecção hospitalar:

duas probabilidades em um evento binário.

Considerando a seguinte tabela de contingência:

• Qual é a chance de morte para os dois grupos?

• Risco de morte aos que tomaram o placebo:

• Chance de morte aos que tomaram o medicamento:

• Chance de morte aos que tomaram o placebo:

> (21/(21+184)) / (1 - (21/(21+184)))

Assim, podemos preencher com essas medidas de ocorrência a Tabela 3.

Tabela 3: Medidas de ocorrência de morte em ud.

Medidas de ocorrência Medicamento Placebo

Podemos calcular as medidas de associação de interesse, por exemplo, o risco relativo

e a razão de chances de morte com placebo como baseline (Tabela 4).

• > (30/(30+174)) / (21/(21+184))

• > ((30/(30+174)) / (1 - (30/(30+174)))) /((21/(21+184)) / (1 - (21/(21+184))))

Medidas de associação Medicamento / Placebo

Diante disso, qual seria a interpretação? Será que o medicamento é um fator de

ou o teste de X 2 para determinar se a medida de associação é significativa, ou seja,