Você está na página 1de 2

Por dentro da estatística

O uso de métodos estatísticos vem crescendo vigorosamente em pesquisas da área médica. Com frequência, médicos e
profissionais da Saúde são expostos a informações provenientes de análises de dados, nem sempre claras e de fácil
interpretação. Esta seção visa familiarizar pesquisadores com conceitos e termos estatísticos comumente presentes em artigos
científicos. Com ênfase na discussão conceitual em detrimento a fórmulas matemáticas, o objetivo é esclarecer algumas dúvidas
frequentes e contribuir com o desenvolvimento do senso crítico na hora de analisar, descrever e interpretar dados.
Ângela Tavares Paes
Editora da seção

Análise univariada e multivariada de atenção cuja variação ou frequência queremos enten-


der. Pode ser, por exemplo, a ocorrência de algum even-
Ângela Tavares Paes* to de interesse (aparecimento de uma doença, compli-
* Doutora em Estatística do Centro de Pesquisa Clínica do Instituto Israelita de Ensino e Pesquisa cações, rejeição) ou medida quantitativa (por exemplo,
Albert Einstein – IIEPAE, São Paulo (SP), Brasil. tempo de resposta a um tratamento ou qualquer mensu-
ração relacionada ao fenômeno que se deseja estudar).
Os estudos da área da saúde, que têm como objetivo As variáveis, que podem estar associadas ou mesmo que
identificar fatores associados a determinado desfecho podem influenciar a variável resposta, são conhecidas
(resposta) de interesse, frequentemente realizam “aná- como variáveis explicativas. Existem vários termos para
lises univariadas” seguidas por uma “multivariada”. variáveis explicativas: fatores de risco, fatores de exposi-
Apesar de estarem presente em muitos trabalhos cientí- ção, fatores associados, variáveis independentes.
ficos, a maioria dos pesquisadores e profissionais ainda Na área da saúde, quando o interesse é avaliar a in-
tem dúvidas a respeito destas duas abordagens. fluência de um conjunto de fatores sobre doenças, even-
O termo “multivariada”, quando empregado em arti- tos ou outras características de interesse, os métodos
gos médicos, a princípio causa certo estranhamento para estatísticos mais utilizados são os modelos de regressão,
os estatísticos ou para aqueles com formação teórica em os quais estabelecem uma equação entre a resposta
Estatística. No meio estatístico, a “análise multivariada” de interesse (variável dependente) e os fatores que se
é mais conhecida como uma série de técnicas que visa deseja investigar (variáveis independentes). Quando
analisar conjuntamente grupos de variáveis (matema- existe apenas uma variável independente, a regressão é
ticamente expressos como vetores) em diferentes con- simples e quando há mais de uma variável independen-
textos: inferências sobre vetores de médias (MANOVA, te, ela é múltipla. Como normalmente existem muitas
regressão linear multivariada), análises de estruturas de variáveis independentes, fica difícil analisá-las de uma
covariância (componentes principais, análise fatorial, só vez. Por esta razão, é comum dividir a análise em
correlação canônica), técnicas de classificação e agrupa- duas etapas: univariada e multivariada.
mentos (análise discriminante e de cluster)(1). Na análise univariada, investiga-se isoladamente a re-
A “análise multivariada” mencionada no parágrafo lação entre cada variável explicativa e a variável resposta,
anterior pouco tem a ver com aquela que se encontra na sem levar em conta as demais. Também pode ser entendi-
literatura médica. Usualmente, o termo é utilizado para da como uma análise bivariada, pois investiga a associação
se referir a modelos de regressão múltipla que buscam entre uma variável explicativa e uma resposta. Na prática,
explicar uma variável resposta com base em um conjun- existe um grande número de variáveis explicativas, portan-
to de variáveis explicativas. Nos modelos estatísticos, to, a análise univariada pode servir como critério de sele-
denomina-se “variável resposta” ou “dependente” como ção das variáveis que entrarão em um modelo final. Como
aquela em que se está interessado em analisar. É o foco se trata de uma etapa inicial e não-definitiva da análise de

einstein: Educ Contin Saúde. 2010;8(1 Pt 2): 1-2


2

dados, podemos ser menos rigorosos e adotar níveis de sig- “Odds Ratio não-ajustado” e “Odds Ratio ajustado” para
nificância maiores que o usual (por exemplo, 0,15 ou 0,20) denominar a estimativas produzidas pelos modelos uni e
para não correr o risco de desprezar variáveis importantes. multivariado. Quando a resposta é quantitativa contínua,
Dessa forma, as variáveis mais associadas ao desfecho de muitos estudos utilizam regressão linear simples e múlti-
interesse são selecionadas para a etapa seguinte. pla, assumindo distribuição normal. Quando o interesse é
Escolhidas as variáveis “candidatas” ao modelo fi- analisar não só o evento, como também o tempo até sua
nal com base na análise univariada, o passo seguinte é ocorrência, os modelos mais utilizados são os modelos de
incluí-las em uma análise multivariada. Esta consiste em riscos proporcionais de Cox. Vale observar que os métodos
avaliar simultaneamente (em um único modelo) o efeito citados são os mais comuns, mas existe uma diversidade de
das variáveis selecionadas sobre a resposta. Neste caso, modelos (testes) estatísticos que podem ser considerados,
pode-se entender que a influência de cada variável expli- principalmente nas análises univariadas.
cativa é “controlada” pelo efeito das demais. Como, em Atualmente, com as facilidades computacionais, as
geral, existem associações entre as variáveis explicativas, “análises multivariadas” têm se tornado cada vez mais
é comum que variáveis “estatisticamente significativas” populares. Entretanto, devemos alertar os pesquisadores
na univariada percam a importância na multivariada. quanto a limitações e erros na interpretação das estimati-
Isso pode acontecer, pois quando analisamos o fator vas. Por exemplo, o termo “fator preditor independente”
isoladamente não estamos levando em conta outras ca- é frequentemente utilizado para se referir a variáveis ex-
racterísticas que podem estar relacionadas a este fator. plicativas com p<0,05 na análise multivariada. Intuitiva-
Por exemplo, em um grupo de pacientes em que a dia- mente, entende-se que, se um fator é um “preditor inde-
betes é mais prevalente no gênero feminino, é possível pendente”, significa que o efeito deste fator sempre existe,
que se encontre significância estatística na univariada, independentemente das demais variáveis. Porém, se hou-
sugerindo que a chance do evento de interesse é maior ver algum efeito de interação, o efeito deste fator pode
se a paciente for do sexo feminino. No entanto, quando mudar e deixar de ser importante para certa configuração
esta variável é analisada em conjunto com outros fatores de outros fatores analisados. O fato de incluir diversas va-
(inclusive diabetes), ela pode deixar de ser significativa, riáveis em um mesmo modelo, não significa que o proble-
pois a significância encontrada na univariada era atribu- ma esteja resolvido e que o resultado é definitivo. Devido
ída não ao gênero em si, mas à diabetes que, neste caso, a uma série de particularidades inerentes aos fenômenos
em particular, era mais frequente entre as mulheres. biológicos, os modelos multivariados que consideram so-
Uma variável pode ser não-significativa na univariada mente os efeitos principais (sem as interações) assumem
e passar a ser significativa na multivariada? Embora seja suposições muito fortes, mas nem sempre válidas. Ignorar
menos comum, isso é possível, principalmente quando possíveis interações entre variáveis pode levar a interpre-
houver interação entre os fatores. A existência de inte- tações equivocadas. Outra limitação é que raramente os
ração significa que o efeito de um fator sobre a resposta usuários se preocupam com a qualidade de ajuste dos mo-
depende de outro fator. Por exemplo, o efeito da diabe- delos. Principalmente quando o número de pacientes é
tes sobre uma doença cardiovascular pode ser maior no pequeno, é comum encontrar estimativas pouco precisas,
gênero masculino do que no feminino. Nesse caso, não evidenciadas por amplos intervalos de confiança, o que
faz sentido obter uma estimativa de risco para a variável pode comprometer a inferência (generalização) dos re-
diabetes considerando o grupo total, pois é preciso dife- sultados. Em resumo, não adianta apenas “rodar” o pro-
renciar os riscos para os dois gêneros. Nos modelos com grama estatístico e produzir uma “análise multivariada”,
interação, a interpretação correta é bem mais delicada e é preciso analisar criteriosamente os modelos e verificar
envolve cálculos que não saem diretamente da saída dos se as suposições assumidas estão satisfeitas.
programas estatísticos. Convém observar que, apesar de A proposta neste texto não é, de forma alguma, de-
sua importância, o conceito de interação é ainda pouco sencorajar usuários a realizar “análises multivariadas”,
conhecido, mesmo entre pesquisadores mais familiariza- mas sim salientar que o que parece a solução de todos
dos com análises uni e multivariada. os problemas pode ser apenas a “pontinha do iceberg”.
Que métodos estatísticos são utilizados nas análises
univariada e multivariada? A identificação do tipo de va-
riável resposta é que irá determinar o modelo estatístico REFERÊNCIAS
mais apropriado. No caso de resposta dicotômica (variável
1. Johnson RA, Wichern DW. Applied multivariate statistical analysis. 4a ed.
que assume apenas dois valores, por exemplo, óbito - sim New Jersey: USA: Prentice Hall; 1998. 
ou não), é comum utilizar modelos de regressão logísti- 2. Hosmer DW, Lemeshow S. Applied Logistic Regression. New York: John Wiley
ca simples (univariada) e múltipla (multivariada)(2). Neste & Sons; 1989.
caso, os resultados são expressos em termos de razões de 3. Neter J, Wasserman W, Kutner MH. Applied linear statistical models. 3a ed.
chances (Odds Ratio). Alguns estudos utilizam os termos USA: Irwin; 1990.

einstein: Educ Contin Saúde. 2010;8(1 Pt 2): 1-2

Você também pode gostar