Você está na página 1de 8

31

Universidade de So Paulo
Faculdade de Sade Pblica
VOLUME 32
NMERO 1
FEVEREIRO 1998
Revista de Sade Pblica
J O U R N A L O F P U B L I C H E A L T H
Copyright Faculdade de Sade Pblica da USP. Proibida a reproduo mesmo que parcial sem a devida autorizao do Editor Cientfico.
Proibida a utilizao de matrias para fins comerciais. All rights reserved.
Moraes, Suzana Alves de, Metodologia caso-controle em epidemiologia de doenas cardiovasculares. II -
Anlise de dados. Rev. Sade Pblica, 32 (1): 82-8, 1998.
p. 82-8
Metodologia caso-controle em epidemiologia
de doenas cardiovasculares.
II - Anlise de dados
Case-control design in cardiovascular disease epidemiology.
II - Analysis of data
Suzana Alves de Moraes e Jos Maria Pacheco de Souza
Departamento de Enfermagem Materno-Infantil e Sade Pblica da Escola de Enfermagem
de Ribeiro Preto da Universidade de So Paulo. Ribeiro Preto, SP - Brasil (S.A.M.),
Departamento de Epidemiologia da Faculdade de Sade Pblica da Universidade de So
Paulo. So Paulo, SP - Brasil (J.M.P.S.)
Atualizao Current Comments
82
Atualizao Current Comments
Correspondncia para/Correspondence to: Suzana Alves de Moraes - Av. Santa Luzia, 440/81 Sumar - 14025-090 Ribeiro Preto, SP - Brasil. E-
mail: samoraes@usp.br
Edio subvencionada pela FAPESP (Processo n 97/09815-2).
Recebido em 30.10.1996. Reapresentado em 30.6.1997. Aprovado em 19.8.1997.
Metodologia caso-controle em epidemiologia
de doenas cardiovasculares. II - Anlise de dados
Case-control design in cardiovascular disease epidemiology.
II - Analysis of data
Suzana Alves de Moraes e Jos Maria Pacheco de Souza
Departamento de Enfermagem Materno-Infantil e Sade Pblica da Escola de Enfermagem de
Ribeiro Preto da Universidade de So Paulo. Ribeiro Preto, SP - Brasil (S.A.M.), Departamento de
Epidemiologia da Faculdade de Sade Pblica da Universidade de So Paulo. So Paulo, SP - Brasil
(J.M.P.S.)
Resumo
A larga difuso, nos ltimos anos, de softwares estatsticos indicados para anli-
ses multivariadas, aliada facilidade de seu manuseio, poder conduzir os usu-
rios obteno de estimativas enganosas caso no se conheam os pressupostos
tericos necessrios para o emprego destas tcnicas. Com o propsito de se des-
tacar alguns desses pressupostos, apresentam-se as etapas executadas para a an-
lise dos dados de um estudo caso-controle, conduzido no Municpio de So Pau-
lo, entre maro de 1993 e fevereiro de 1994, cujo objetivo foi testar a associao
do diabetes mellitus com a doena isqumica do corao aps o ajustamento para
possveis variveis de confuso e/ou modificadoras de efeito. Para uma melhor
visualizao didtica desses pressupostos metodolgicos so destacadas quatro
etapas fundamentais durante a fase de anlise dos dados: a) construo do banco de
dados; b) clculo do poder estatstico; c) categorizao e codificao das variveis
e d) a escolha do modelo de regresso logstica multivariada.
Estudos de casos e controles. Diabetes mellitus. Isquemia miocrdica.
Abstract
The widespread distribution of statistical software recommended for multivariate
analysis as well as the ease in handling it can lead the users into adopting wrong
measures if they do not pay attention to the theoretical principles behind those
methods. With a view to bringing out some of these principles some steps for the
data analysis of a case-control study undertaken in the city of S. Paulo-Brazil
from March, 1993 to February, 1994 in order to test the association between
diabetes mellitus and ischaemic heart disease after adjusting for potential con-
founders and/or modifiers of effect are presented. Methodologic issues are em-
phasized in the development of four steps: a) the data bank structure; b) the cal-
culation of statistical power; c) the definition of variables strata and codification
and d) the choice of the logistic regression method.
Case-control studies. Diabetes mellitus. Myocardial ischemia.
Rev. Sade Pblica, 32 (1): 82-8, 1998
INTRODUO
Entre as tcnicas estatsticas disponveis para a
anlise de dados provenientes de estudos caso-con-
trole, destaca-se a regresso logstica multivariada,
recomendada quando a varivel resposta um even-
to binrio, ou seja, os indivduos da amostra so clas-
sificados como casos ou controles.
9
A possibilidade de clculo de medidas de associa-
o (odds ratios) ajustadas simultaneamente para o
efeito de mltiplas variveis de confuso e/ou modi-
ficadoras de efeito, sem perda de poder estatstico,
coloca em destaque as vantagens da regresso logs-
tica multivariada sobre tcnicas tradicionais como a
anlise estratificada.
Entretanto, a larga difuso de softwares estatsti-
cos de fcil manuseio tem conduzido ao uso, por
vezes indiscriminado, dessas tcnicas sem que se-
jam levados em considerao os pressupostos reco-
mendados para a sua utilizao
5
.
Com o objetivo de destacar alguns desses pres-
supostos, ao se optar pela tcnica estatstica de re-
gresso logstica, os autores apresentam, no presen-
te trabalho, algumas etapas executadas para a anli-
se dos dados de um estudo caso-controle, conduzido
no Municpio de So Paulo, entre 1993 e 1994, onde
a varivel resposta foi representada pela doena is-
qumica do corao (DIC)
14
.
CONSTRUO DOS BANCOS DE
DADOS PARA O ESTUDO
O estudo teve por objetivo testar a associao
do diabetes mellitus com a doena isqumica do
corao, procedendo-se a ajustamentos para poss-
veis variveis de confuso e/ou modificadoras de
efeito.
Ao todo, foram entrevistados 900 indivduos:
300 casos, 300 controles de vizinhana e 300 con-
troles hospitalares. Os registros que contiveram
perdas de informaes foram excludos. Aps a ex-
cluso desses registros, a amostra remanescente foi
composta por 833 indivduos: 280 casos e 553 con-
troles. Foram compostos dois bancos de dados para
que os casos pudessem ser comparados com dois
diferentes conjuntos de controles. Na composio
A 266 casos foram comparados com 266 contro-
les de vizinhana e na composio B 280 casos
foram comparados com 268 controles hospitalares.
Cada banco de dados, representado por um deter-
minado tipo de composio, est apresentado no
Tabela 1. A escolha de mais de um grupo-controle
tem sido recomendada com o propsito de se obter
medidas de efeito (odds ratios) em diferentes
composies de controles servindo estas medidas
de efeito para avaliar a existncia de possveis v-
cios de seleo como o vis ou falcia de
Berkson
6, 10,16
.
Os bancos de dados foram estruturados no pro-
grama FOXPRO vs.2.0 para microcomputador
7
.
Tabela 1 - Caracterizao dos bancos de dados do estudo.
Table 1 - Characterization of the data banks of the study.
Composio Elementos
N N
Total
Casos Controles
Casos e
A controles de 266 266 532
vizinhana
Casos e
B controles 280 268 548
hospitalares
CLCULO DO PODER ESTATSTICO
O poder estatstico para cada uma das composi-
es foi calculado, levando-se em considerao o
nmero de controles por caso e o modelo logstico
utilizado, e tendo-se em vista a deteco de odds
ratios 2,0 em nvel de 5% monocaudal de signifi-
cncia. A escolha de um teste monocaudal justifica-
se, neste caso, visto que todo o conhecimento a priori
acerca dos mecanismos fisiopatolgicos do diabetes
mellitus apontam-no como um fator de risco para a
doena isqumica do corao e no como um fator
de proteo.
Os valores obtidos para o poder estatstico foram
calculados segundo os modelos propostos por Schles-
selman
18
, considerando-se a prevalncia de diabetes
(exposio principal), como sendo 10%. Tais valo-
res, em cada composio, encontram-se no Tabela 2
onde tambm so apresentadas as frmulas utiliza-
das para o clculo.
CATEGORIZAO E CODIFICAO
DAS VARIVEIS
Varivel Dependente
A varivel dependente (evento-resposta) foi re-
presentada pela doena isqumica do corao (DIC).
Aos casos foi atribudo o cdigo 1. Aos controles
foi atribudo o cdigo 0.
Rev. Sade Pblica, 32 (1), 1998 83
Metodologia caso-controle. II - Anlise de dados
Moraes, S. A. & Souza, J. M. P.
84 Rev. Sade Pblica, 32 (1), 1998
Metodologia caso-controle. II - Anlise de dados
Moraes, S. A. & Souza, J. M. P.
Tabela 2 - Valores de poder estatstico* em cada composio do estudo.
Table 2 - Values of statistical power in each study composition.
Composio Tipo de N Controles Poder Frmula
anlise por caso estatstico
A Condicional 1::1 81% Z
Z

2
+ m P
1
2


_
,
2



1
]
1
P ( 1P)
m=n pares discordantes
P =R/1+R
R =odds ratio que se quer detectar no estudo
1
B No condicional 0,96::1 86% Z =[n (p
1
p
0
)
2
(1 + ) p

q]
0,5
Z
c
n =n de casos do estudo
p
1
=proporo de exposio entre os casos
p
0
=proporo de exposio entre os controles
c =relao: controles/casos
p

=(p
1
+cp
0
) (1 +c)

q =1

p
* O poder estatstico expresso como 1 =P (Z Z )
Variveis Independentes (Variveis de Exposio)
Variveis Dicotmicas (expostos x no expostos)
Elenco: sexo; histria de diabetes mellitus (vari-
vel principal); antecedentes familiares de cardio-
patia; histria de hipercolesterolemia e histria de
hipertenso arterial sistmica. A categoria de refe-
rncia para a varivel sexo foi representada pelos in-
divduos do sexo feminino. As respectivas categori-
as de referncia para as demais variveis dicotmicas
foram representadas pelos no expostos.
Variveis com mais de Duas Categorias
Elenco: idade; hbito de fumar e histrico do
ndice de massa corporal. A varivel idade foi clas-
sificada em 4 categorias, com intervalos de 10 anos:
30 a 39; 40 a 49; 50 a 59e 60 a 69 anos. A
primeira categoria foi considerada a de referncia.
O hbito de fumar foi classificado em trs categori-
as: no fumantes (categoria de referncia) ex-
fumantes e fumantes.
Durante a entrevista foram tomadas medidas re-
lativas ao peso e altura para o clculo do ndice de
massa corporal atual (peso/altura
2
). Os indivduos
foram tambm questionados sobre seu peso, 10 anos
antes da data da entrevista, servindo essa informa-
o para o clculo do ndice de massa corporal no
passado. Os ndices de massa corporal (IMC) foram
primeiramente classificados em 3 categorias: nor-
mal (IMC < 25); sobrepeso (IMC: 25 A 29,9) e
obeso (IMC 30), segundo os critrios recomen-
dados por Bray
2
. A partir desta classificao foi cri-
ada a varivel BEV, codificada em 4 nveis e
indicativa da evoluo do ndice de massa corporal
no decorrer dos 10 anos que antecederam a entrevista.
Os indivduos com IMC normal h 10 anos,
atualmente se constituram na categoria de referncia
nvel 1. Os obesos ou com sobrepeso no passado e
IMC normal, no presente, representaram o nvel
2
.
Os que apresentaram IMC normal no passado e
estiveram obesos ou com sobrepeso, no presente,
compuseram o nvel 3. Os indivduos obesos ou
com sobrepeso nos dois momentos representaram o
nvel 4 de exposio.
TCNICAS ESTATSTICAS DE ANLISE
DOS DADOS: A REGRESSO LOGSTICA
MULTIVARIADA
Seleo do Modelo
A regresso logstica multivariada foi a tcnica
de eleio para a anlise dos dados, em virtude de se
adequar necessidade de controle de mltiplas vari-
veis de confuso, de servir para a identificao de
fatores modificadores de efeito e de se ter utilizado,
como resposta, um evento binrio, a doena isqu-
mica do corao (DIC).
9
Rev. Sade Pblica, 32 (1), 1998 85
Metodologia caso-controle. II - Anlise de dados
Moraes, S. A. & Souza, J. M. P.
A existncia ou no de relao dose-resposta en-
tre as variveis independentes com mais de duas
categorias e a varivel resposta foi testada indi-
retamente, atravs da observao dos respectivos
logits (logartmos dos odds ratios ou coefici-
entes de regresso) ou das respectivas medidas de
efeito (odds ratios). Para tanto, optou-se por trans-
formar todas as variveis com mais de duas cate-
gorias em variveis do tipo indicadora dummy, o
que tambm se prestou obteno de odds ratios
especficos para determinadas categorias de expo-
sio, de interesse para o estudo. Pode-se citar, como
exemplo, o caso de variveis como o hbito de fu-
mar, em que a transformao em categorias indica-
doras permitiu visualizar a no linearidade dos res-
pectivos logits, o que no teria sido possvel caso
fosse mantida a codificao inicial, em categorias
ordinais. As variveis com mais de duas categorias
foram inicialmente codificadas na forma ordinal:
0,1, 2, 3..., conforme os nveis de exposio. Com
tal forma de categorizao obter-se-ia, atravs do
modelo logstico, um coeficiente mdio de regres-
so, para tais categorias, tendo-se ainda que efetu-
ar um clculo (e
bx
i
) para obteno dos odds ratios
em cada nvel de exposio da varivel. Ao optar-
se pela forma dummy de categorizao, criou-se,
na verdade, a possibilidade de obteno direta de
um coeficiente de regresso especfico para cada
categoria de exposio pois, com tal transforma-
o, cada estrato foi tratado como se fosse uma nova
varivel. O nmero de variveis dummy corres-
pondeu ao nmero de categorias ordinais de cada
varivel menos um
9
. Na Tabela 3 encontra-se um
exemplo do processo de formao de variveis
dummy.
A criao das duas variveis dummy para h-
bito de fumar permitiu a obteno de odds ratios
especficos para cada categoria de exposio que fo-
ram comparados com a categoria de referncia (no
fumantes) cujo odds ratio =1.
No estudo caso-controle, objeto destas conside-
raes
14
, havia interesse em se comparar as medidas
de efeito correspondentes a categorias especficas de
algumas variveis, nas duas composies do banco
de dados. Embora a transformao em variveis
indicadoras possa ter sacrificado o ajuste dos mode-
los, pde-se, atravs deste procedimento, garantir a
informao subjacente em categorias especficas de
algumas variveis, alm de se tornar possvel a
comparabilidade das medidas de efeito nas duas com-
posies do estudo.
No Tabela 4 so apresentados, a ttulo de ilustra-
o, os coeficientes de regresso () e os respectivos
odds ratios ajustados, equivalentes s categorias de
exposio da varivel hbito de fumar, nas composi-
es A(casos + controles de vizinhana) e B(casos
+ controles hospitalares). A obteno de odds ratios
especficos para cada categoria de fumo permitiu no
apenas a comparao das respectivas magnitudes em
cada composio, como tambm entre as duas com-
posies do estudo. A observao de odds ratios de
maior magnitude para a categoria de ex-fumantes que
para a de fumantes , em relao aos no fumantes, foi
indicativa da presena de casos prevalentes no estu-
do, com possveis modificaes do hbito de fumar
aps um diagnstico prvio da doena.
Considera-se oportuno salientar que mesmo uti-
lizando-se a forma indicadora (dummy) para a
codificao de variveis com mais de duas catego-
rias, a relao entre o nmero de casos e o nmero
de variveis independentes foi mantida em todas as
Tabela 4 - Odds Ratios ajustados de cada uma das categorias da varivel hbito de fumar nas duas composies do estudo.
Table 4 - Adjusted Odds Ratios of each of the categories of the smoking habit variable in each of the study compositions.
Varivel Composio A Composio B
(casos +controles de vizinhana) (casos +controles hospitalares)
Hb. fumar Coeficiente ( )* Odds Ratio Ajustado* Coeficiente ( ) Odds Ratio Ajustado
No fumante 0 1 0 1
Ex-fumante 1,0355 2,82 0,8343 2,30
Fumante 0,2975 1,35 0,7395 2,09
*A transformao em categorias dummy permitiu o clculo de coeficientes de regresso () e odds ratios especficos para cada uma das categorias de exposio
da varivel hbito de fumar.
Tabela 3 - Codificao de 2 variveis dummy* a partir das
3 categorias ordinais da varivel hbito de fumar.
Table 3 - Codification of 2 dummy variables on the basis of
3 ordinal categories of the smoking habit variable.
Varivel
Categorias Variveis
ordinais dummy (D)
Hb. fumar (D1) (D2)
No fumante 0 0 0
Ex-fumante 1 1 0
Fumante 2 0 1
* O programa MULTLR
10
oferece uma opo para a formao automtica de
variveis dummy.
86 Rev. Sade Pblica, 32 (1), 1998
Metodologia caso-controle. II - Anlise de dados
Moraes, S. A. & Souza, J. M. P.
composies do estudo como sendo > 10/1. A rela-
o mnima de 10 eventos resposta para cada vari-
vel independente tem sido recomendada com o pro-
psito de se evitarem distores nas medidas de efeito
provenientes de um superajustamento
5
.
Seleo das Variveis
A escolha inicial do elenco das possveis vari-
veis de confuso esteve fundamentada, em princpio,
pelo seu reconhecimento em estudos epidemiolgi-
cos anteriores, sendo procuradas, tanto quanto poss-
vel, as bases biolgicas que explicassem suas associ-
aes com a varivel resposta e com as demais vari-
veis de confuso, evitando-se, assim, a incluso de
variveis intervenientes. Miettinen
13
cita que a con-
siderao de determinada varivel como de confuso
no deve estar baseada apenas em procedimentos
mecanicistas, como mudanas nas estimativas de efei-
to, decorrentes do controle para tal varivel, devendo
tal seleo, antes de tudo, estar baseada no entendi-
mento de suas relaes com as demais variveis, o
que s poderia advir do conhecimento a priori.
Greenland
8
recomenda que para maximizar a
validade de estimativas baseadas em modelos, o pes-
quisador deveria usar conjuntamente os prprios da-
dos e as informaes prvias, de forma a poder criti-
camente avaliar as pressuposies epidemiolgicas
e estatsticas inerentes a estes modelos.
Aps tais consideraes, que nortearam a esco-
lha do elenco inicial de possveis variveis de con-
fuso, os procedimentos estatsticos adotados para a
incluso ou excluso definitiva de variveis nos mo-
delos foram aqueles recomendados por Hosmer e
Lemeshow
9
:
a) Para cada composio foram inicialmente rea-
lizadas anlises brutas (univariadas), obtendo-
se os valores p (testes de Wald) correspon-
dentes aos nveis de significncia dos coefici-
entes de regresso. O critrio adotado para a
seleo das variveis que deveriam compor os
modelos multivariados, a partir das anlises
brutas, foi a obteno de valores p para os
testes de Wald 0,25.
b)O modelo inicial foi composto pelas variveis
que apresentaram valor p 0,25 nos testes de
Wald e tambm pelos termos de interao (ter-
mos produto), obtidos pelas combinaes de
interesse entre a varivel principal (diabetes
mellitus) e as demais variveis.
c) A estatstica utilizada para a excluso definiti-
va de variveis, a partir dos modelos multiva-
riados, foi a razo de verossimilhana (RV),
utilizando-se nveis de significncia 0,05, por
ser a RV menos conservadora que o teste de
Wald, que algumas vezes pode falhar em re-
jeitar Ho
9,11
. Isto significa que os coeficientes
de regresso ( ) de algumas variveis podem
apresentar valores p descritivos nos testes de
Wald > 0,05 ( no significantes) sinalizando
para a possibilidade de excluso dessas vari-
veis dos modelos, enquanto tal excluso no
ser permitida quando utilizado o teste da ra-
zo de verossimilhana. Esta constatao in-
dica que a estatstica de Wald se constitui num
bom teste durante a triagem inicial das vari-
veis (anlises univariadas), servindo para apon-
tar, nesta etapa, quais as variveis que devero
compor os modelos multivariados. Uma vez
composto o elenco de variveis para os mode-
los multivariados, o critrio de excluso a par-
tir de ento dever estar baseado no valor ob-
tido para a razo de verossimilhana.
Considera-se oportuno destacar a importncia de
se realizar inicialmente os testes de interao (mode-
lo inicial), antes da excluso, a priori , de algumas
variveis, pois, segundo Hosmer e Lemeshow
9
, algu-
mas delas, consideradas no significantes para com-
por os modelos multivariados, podem apresentar
interao ao serem combinadas com outras variveis
do estudo. Esta situao encontra suporte, sobretudo,
em situaes onde a interao plausvel do ponto de
vista biolgico. Por outro lado destaca-se que a modi-
ficao de efeito (interao) foi testada por modelos
estatsticos multiplicativos que no permitem conclu-
ses sobre interaes biolgicas de natureza aditiva e
que poderiam existir entre tais variveis
19
.
A anlise de regresso logstica multivariada, em
cada composio, foi, portanto, realizada em trs eta-
pas, aps as anlises univariadas: 1) modelo inicial,
contendo os termos de interao; 2) modelo sem os
termos de interao e 3) modelo final. O software
estatstico utilizado foi o MULTLR
4
.
Para informaes mais detalhadas acerca dos re-
sultados do estudo recomenda-se consultar Moraes
e Souza
14, 15
.
Avaliao de Multicolinearidade
Diversos autores tm chamado a ateno para a
distoro das medidas de efeito quando as vari-
veis independentes mantm entre si uma relao li-
near (multicolinearidade)
1,5,9,11,12
. Kleinbaum-
Kupper-Muller
11
, a propsito de modelos de regres-
Rev. Sade Pblica, 32 (1), 1998 87
Metodologia caso-controle. II - Anlise de dados
Moraes, S. A. & Souza, J. M. P.
o respectivo caso. Esta situao, segundo o autor,
difere do emparelhamento fino, como quando
consideradas variveis como parentesco ou vi-
zinhana que restrigem a indivduos especficos
a aptido para compor os pares com os respectivos
casos. Sob esta tica, poder-se-ia dizer que na com-
posio A (casos + controles de vizinhana) pro-
cedeu-se a um emparelhamento fino entre casos
e controles.
O emparelhamento por sexo e faixa etria foi pro-
cedido, no desenho do estudo, para efeito de agrupa-
mento (obteno de equilbrio, entre casos e contro-
les, para sexo e faixa etria). A varivel matchingde
interesse foi a vizinhana, sendo recomendado,
apenas sob estas condies, o emprego da anlise de
regresso logstica condicional
10,18
.
Com base nestes pressupostos, procedeu-se
anlise de regresso logstica condicional para a com-
posio A e anlise no condicional para a com-
posio B.
Por outro lado, o emprego inadvertido da anlise
no condicional de dados submetidos a um empare-
lhamento fino pode gerar medidas de efeito supe-
restimadas sobretudo quando o nmero de controles
por caso pequeno
3
.
Tabela 5 - Odds Ratios ajustados da varivel diabetes,
segundo os modelos no condicional e condicional de
regresso logstica multivariada para os dados da
composio A.
Table 5 - Adjusted Odds Ratios of the diabetes variable, by
nonconditional and conditional models of multivarite
logistic regression for the data of composition A.
Varivel
Anlise Anlise
no condicional condicional
Diabetes mellitus OR IC (95%) OR IC (95%)
No diabticos 1 1
Diabticos 2,61 1,18-5,77 1,25 0,51-3,07
OR=Odds Ratio
IC =Intervalo de Confiana
A ttulo de ilustrao, na Tabela 5 esto apresen-
tadas as medidas de efeito ajustadas da varivel dia-
betes, obtidas por anlise no condicional e condici-
onal dos dados relativos composio A (casos +
controles de vizinhana). Torna-se oportuno desta-
car que o uso inapropriado da anlise no condicio-
nal para uma composio onde os casos e os contro-
les foram submetidos a um emparelhamento fino
poderia conduzir concluso de que o diabetes um
fator de risco independente para a doena isqumica
do corao, o que foi claramente refutado a partir
dos resultados da anlise condicional.
so mltipla, destacam que as estimativas dos coe-
ficientes de regresso em tais modelos so equiva-
lentes a:
q
j
= c
j
1
1 r
2
(X
1
, X
1
)









1
]
1
1
1
1
1
1
1
q
j
= coeficiente de regresso
c
j
= constante calculada a partir dos dados
r = valor da correlao
X = variveis independentes
Sob a condio de multicolinearidade, r
2
= 1, don-
de a estimativa q
j
do coeficiente de regresso de tal
varivel seria indeterminada (denominador = 0). Em-
bora o clculo apresentado acima seja relativo a es-
timativas de coeficientes em anlise de regresso
mltipla, Hosmer e Lemeshow
9
apontam a existn-
cia de clculos similares para modelos de regresso
logstica, destacando que, nesses modelos, o empre-
go de testes para multicolinearidade apenas seriam
indicados quando a degradao dos modelos ficasse
evidente, o que poderia ser detectado a partir da ob-
servao de valores aberrantes de e, principal-
mente, na grande variabilidade dos respectivos er-
ros-padro. Concato e col.
5
reconhecem, por outro
lado, que, em algumas situaes, as variveis podem
passar por tais testes, mesmo na presena de multi-
colinearidade.
No estudo caso-controle, ao qual se referem es-
tas consideraes, no foram realizados testes es-
tatsticos para multicolinearidade. Entretanto, a ob-
servao das estimativas obtidas para os coeficien-
tes de regresso, respectivos erros-padro e inter-
valos de confiana no foram indicativos da exis-
tncia de multicolinearidade entre as variveis in-
dependentes
14
.
Regresso Logstica Condicional e
No Condicional
Os casos do estudo foram emparelhados por sexo
e faixa etria com dois tipos de controles: de vizi-
nhana e hospitalares. A composio A, confor-
me citado anteriormente, foi constituda pelos ca-
sos e respectivos controles de vizinhana e a com-
posio B pelos casos e controles hospitalares. O
emparelhamento por sexo e faixa etria (empare-
lhamento por freqncia) considerado, segundo
Schlesselman
18
, um emparelhamento grosseiro,
visto que qualquer controle desde que do mesmo
sexo e faixa etria, est apto a compor um par com
88 Rev. Sade Pblica, 32 (1), 1998
Metodologia caso-controle. II - Anlise de dados
Moraes, S. A. & Souza, J. M. P.
CONSIDERAES FINAIS
Pretendeu-se enfatizar a importncia de se levar
em conta os pressupostos metodolgicos recomen-
dados para o emprego da regresso logstica multi-
variada. No tendo por objetivo uma exposio de-
talhada das tcnicas estatsticas relacionadas aos
mtodos multivariados, insistiu-se em chamar a aten-
o dos potenciais usurios de softwares estatsticos
para o fato de que a relativa simplicidade quanto ao
manuseio desses programas poder conduzir a esti-
mativas enganosas, caso no se conheam os princ-
pios metodolgicos relacionados eleio e condu-
o adequada dessas tcnicas.
Alm de recomendaes relacionadas correta
conduo da fase de delineamento de estudos caso-
controle
16,17,20
, o emprego adequado de tcnicas esta-
tsticas para a anlise dos dados de importncia
fundamental para que se possa garantir a validade
das estimativas.
AGRADECIMENTOS
Aos relatores, pelas sugestes e comentrios que
muito contriburam para a verso final do presente
trabalho.
REFERNCIAS
1. ARMITAGE, P. & BERRY, G. Statistical methods in
medical research. Oxford, Blackwell Scientific Publications,
1987.
2. BRAY, G.A. Obesity: basic considerations and clinical
approaches. Dis. mon., 35:454-537, 1989.
3. BRESLOW, N.E. & DAY, N.E. Statistical methods in cancer
research. Lion, Interation Agengy of Research on Cancer,
1980. v. 1. (IARC Scientific Publication, 32).
4. CAMPOS-FILHO, N. & FRANCO, E.L. MULTLR-A
microcomputer program for multiple logistic regression by
unconditional and conditional maximum likelihood methods.
Am. J. Epidemiol., 129:439-44, 1989.
5. CONCATO, J.; FEINSTEIN, A.R.; HOLFORD, T.R. The
risk of determining risk with multivariable models. Ann.
Intern. Med., 118:201-10, 1993.
6. FLANDERS, W.D.; BOYLE, C.A.; BORING, J.R. Bias
associated with differential hospitalization rates in incident
case-controls studies. J. Clin. Epidemiol., 42:395-401, 1989.
7. FOX HOLDINGS INC. FOXPRO vs 2.0. C/S. Pat. Pend.
American Edition, USA,1991.
8. GREENLAND, S. Modeling and variable selection in
epidemiologic analysis. Am. J. Public Health, 79:340-9,
1989.
9. HOSMER, D.W. & LEMESHOW, S. Applied logistic
regression, New York, John Wiley and Sons, 1989.
10. KLEINBAUM, D.G.; KUPPER, L.L.; MORGENSTERN,
H. Epidemiologic research: principles and quantitative
methods. London, Lifetime Learning, 1982.
11. KLEINBAUM, D.G.; KUPPER L.L.; MLLER, K.E.
Applied regression analysis and other multivariable
methods. Boston. PWS-KENT Publishing Company, 1988.
12. MC GEE, D.; REED D.; YANO, K. The results of logistic
analysis when the variables are highly correlated: an
empirical example using diet and CHD incidence. J. Chron.
Dis., 37:713-9, 1984.
13. MIETTINEN, O.S. & COOK, E.F. Confouding: essence and
detection. Am. J. Epidemiol., 114:593-603, 1981.
14. MORAES, S.A. & SOUZA, J.M.P. Diabetes mellitus e
doena isqumica do corao: um estudo tipo caso-controle.
Rev. Sade Pblica, 30:364-71, 1996.
15. MORAES, S.A. & SOUZA, J.M.P. Efeito dose-resposta de
fatores de risco para a doena isqumica do corao. Rev.
Sade Pblica, 30:471-8, 1996.
16. MORAES, S.A. & SOUZA, J.M.P. Metodologia caso-
controle em epidemiologia de doenas cardiovasculares. I-
Delineamento. Rev. Med. Ribeiro Preto, 29:460-7, 1996.
17. ROTHMAN, K.J. Modern epidemiology. Boston, Little
Brown and Company, 1986.
18. SCHLESSELMAN, J.J. Case control studies-design,
conduct and analysis. New York, Oxford, University Press,
1982.
19. SIEMIATYCKI, J. & THOMAS, D.C. Biological models
and statistical interactions: un example from multistage
carcinogenesis. Int. J. Epidemiol., 10:383-7, 1981.
20. WACHOLDER, S.; MCLAUGHLIN, J.K.; SILVERMAN,
D.T.; MANDEL, J.S. Selection of controls in case-control
studies. I-Principles. Am. J. Epidemiol., 135:1019-28, 1992.