Você está na página 1de 32

FACULDADE DE MEDICINA

APOSTILA DO CURSO – VERSÃO 1.2018

ANÁLISE DE DADOS COM EPI INFO 7

Prof. Dr. Hugo D. Hoffmann Santos


E-mail: hugo.epidemio@gmail.com
(65) 99271-6851
Sumário
EMENTA................................................................................................................................... 3
CARGA HORÁRIA .................................................................................................................... 3
OBJETIVOS .............................................................................................................................. 3
O EPI INFO ............................................................................................................................... 4
SUAS FERRAMENTAS ............................................................................................................ 5
CREATE FORMS ...................................................................................................................... 6
INICIANDO UM NOVO PROJETO .......................................................................................... 6
CRIANDO UM FORMULÁRIO ............................................................................................... 7
UTILIZANDO O CHECK CODE .............................................................................................. 8
EXERCÍCIOS DE FIXAÇÃO n.º 1 .......................................................................................... 10
VISUAL DASHBOARD ........................................................................................................... 11
IMPORTANDO BANCO DE DADOS EM EXCEL ................................................................... 11
REALIZANDO ESTATÍSTICA DESCRITIVA ......................................................................... 13
SUMARIZAÇÃO DE VARIÁVEIS CATEGÓRICAS................................................................ 14
SUMARIZAÇÃO DE VARIÁVEIS CONTÍNUAS/DISCRETAS ............................................... 15
ANÁLISE ESTATÍSTICA DE VARIÁVEIS CATEGÓRICAS ................................................... 16
ANÁLISE ESTATÍSTICA DE VARIÁVEIS CONTÍNUAS/DISCRETAS .................................. 19
USANDO FILTROS ............................................................................................................. 20
EXERCÍCIOS DE FIXAÇÃO n.º 2.......................................................................................... 22
ANALYZE DATA CLASSIC ..................................................................................................... 24
IMPORTANDO BANCO DE DADOS EM EXCEL ................................................................... 24
REGRESSÃO LOGÍSTICA ................................................................................................... 25
REGRESSÃO DE COX......................................................................................................... 27

2
EMENTA

Apresentação das ferramentas disponíveis no Epi Info 7. Criação de formulário


para entrada de dados através do Create Forms. Campos para entrada de dados:
tipos e propriedades. Interação entre campos através de comandos digitados no
Check Code. Entrada e armazenamento de dados pelo Enter Data. Análise de
dados pelo Visual Dashboard: importação de banco de dados, tabelas de
frequência simples e estratificada, cálculo de médias, gráficos, filtros geral e
específico, teste de hipóteses para variáveis (qui-quadrado simples e
estratificado) categóricas e contínuas (test t e ANOVA). Interpretação do p-valor e
das medidas de associação odds ratio e risco relativo e do intervalo de confiança a
95%. Análise de dados com o Analyze Data Classic: leitura de um banco de dados,
estatística descritiva e inferencial, regressão logística, regressão de Cox e curva
de Kaplan-Meier.

CARGA HORÁRIA

ATIVIDADE CARGA HORÁRIA


Aula presencial 10,5 horas
Exercícios extraclasse 4,5 horas
Total 15,0 horas

OBJETIVOS

1. Apresentar o software Epi Info 7, suas ferramentas e principais funções;


2. Criar um questionário para receber e armazenar dados de pesquisas;
3. Importar banco de dados e realizar sua estatística descritiva;
4. Realizar teste de hipóteses e a interpretação dos resultados;
5. Ajustar variáveis em um modelo de análise multivariada.

3
O EPI INFO

É um pacote composto de uma série de ferramentas gratuitas criado


especificamente para o uso de profissionais de saúde pública como um auxílio na
condução de investigações de surtos e epidemias, gerenciamento de banco de
dados de vigilância em saúde e análises estatística s de dados em saúde.

Figura 1. Tela inicial do Epi Info 7

Este programa permite que médicos, epidemiologistas e outros profissionais de


saúde possam construir rapidamente um questionário, personalizar os dados que
serão digitados, inserir informações individuais dos pacientes e analisar
estatisticamente esses dados.

O Epi Info 7 está disponível para download gratuito no site do Centers for Disease
Control and Prevention (CDC) neste link: http://www.cdc.gov/epiinfo.

4
SUAS FERRAMENTAS

Conforme visto na figura 1, o Epi Info 7 possui 6 ferramentas, são elas: create forms,
enter data, create maps, statcalc, analyze data classic e visual dashboard.
Vejamos abaixo a função de cada uma:

Ferramenta Função
Esta opção abrirá uma nova janela onde você poderá criar um
formulário para armazenar as informações da sua pesquisa.
Existem várias opções de campos de entrada de dados para
cada tipo de variável requerida.
Deve ser utilizada após você ter criado um formulário e já
houverem dados disponíveis para digitação. Aqui você pode
também consultar todos os registros já salvos e fazer
qualquer modificação.
Permite visualizar em um mapa dados de coordenadas
geográficas (latitude e longitude), bastante utilizado quando
os dados foram coletados em locais diferentes e se deseja
avaliar um padrão na distribuição geográfica dos casos de
uma doença.
Trata-se de uma calculadora epidemiológica que pode ser
utilizada a qualquer momento. É onde você pode fazer o
cálculo do tamanho de amostra de um estudo ou descobrir o
p-valor dos dados de uma tabela 2x2.
Esta é a ferramenta de análise estatística de dados mais
completa, onde você pode gerar tabelas e gráficos, calcular
médias e realizar os modelos de regressão linear, logística e
Cox, incluindo a curva de Kaplan-Meier.
Possui um visual mais intuitivo para análise de dados que a
ferramenta “classic” e, portanto, ótimo para os que estão
iniciando o uso do Epi Info 7, mas não gera a curva de Kaplan-
Meier e a regressão de Cox.

Na tela inicial do Epi Info 7 (figura 1) existe este ícone localizado no canto
superior direito. Ao clicar ali você encontrará outras informações sobre o
aplicativo e também o item options onde você pode mudar o idioma para português
e fazer outros ajustes.

O CDC disponibiliza em inglês um manual completo do Epi Info 7 com 369 páginas
detalhando todas as suas funcionalidades. Ele pode ser encontrado neste link:
https://www.cdc.gov/epiinfo/support/userguide.html

5
CREATE FORMS
INICIANDO UM NOVO PROJETO

Acesse: Epi Info 7 → Create Forms → New Project

Figura 2. Criando um novo formulário

1) Coloque o nome do formulário sem espaço e caracteres especiais.


2) Clique em Browse e selecione o local onde você deseja que o banco de
dados seja salvo.
3) Campo destinado a adicionar alguma descrição da pesquisa incluindo
informações que seriam pertinentes de serem lembradas quando o banco
for utilizado por outra pessoa.
4) Utilize o mesmo nome do campo 1.

O Epi Info 7 criará no destino determinado no campo 2 uma pasta com dois
arquivos, um de extensão PRJ (formulário) e outro MDB (banco de dados) que
devem permanecer sempre na mesma pasta.

6
CRIANDO UM FORMULÁRIO

Crie o formulário abaixo com os mesmos campos utilizados:

Figura 3. Modelo de formulário no Create Forms

A digitação de dados neste formulário, realizada posteriormente no Enter Data,


seguirá a ordem de criação dos campos, independentemente de sua organização
na tela. Por isso, é importante que se planeje de forma lógica a sequência dos
campos, pois isso otimizará o tempo gasto na entrada de dados.

7
UTILIZANDO O CHECK CODE

Essa opção permite personalizar interações entre os campos inseridos.

Figura 4. Barra de ferramentas do Create Forms.

Abrirá a tela abaixo do Check Code:

Figura 5. Tela do Check Code.

COMANDO 1: Calcular tempo de internação (em dias) com base na data da saída e
data da internação:

1. Na área 1. Choose Field Block of Action clique no + à frente de [Page 1].


2. Clique no + à frente de DatadaSaida e clique duas vezes sobre after.
3. Irá aparecer automaticamente os comandos que estão na tela da figura 5.

8
4. Onde está //add code here iremos digitar:
TempodeInternacao=DatadaSaida-DatadaInternacao.
5. Dê um enter e escreva GOTO Diabetes para pular o campo que será
preenchido automaticamente pelo cálculo do passo 4.

Este comando deve estar dessa forma ao final:

Figura 6. Comando para calcular intervalo de tempo.

Caso queira que o intervalo de tempo calculado seja mostrado em anos, a fórmula
deverá ser acrescida de /365.25, ou seja: TempodeInternacao=(DatadaSaida-
DatadaInternacao)/365.25.

COMANDO 2: Condicionar a interpretação da gasometria com base no valor do pH.

Figura 7. Comando para condicionar a resposta de uma variável de acordo com a resposta de outra variável.

Se a fórmula for digitada com algum erro isso será mostrado no campo Messages
ao se clicar em Validate Check Code. Não se esqueça de salvar antes de sair.

9
EXERCÍCIOS DE FIXAÇÃO n.º 1

1) Qual é o módulo mais completo de análise de dados do Epi Info 7, ou seja,


aquele que possui maiores recursos para uma análise estatística?

a) Create Forms
b) Statcalc
c) Classic
d) Visual Dashboard

2) Quais são as extensões dos arquivos de banco de dados e o formulário


criado no Epi Info 7, respectivamente?

a) XLS e MDB
b) MDB e PRJ
c) PRJ e XLS
d) PDF e PPT

3) Qual das opções de campo podemos utilizar para a variável sexo.

a) Yes/No
b) Text
c) Checkbox
d) Legal Values

4) Em seu banco de dados há duas variáveis: uma contínua denominada “IMC”


e outra categórica denominada “Resultado”. Você deseja que apareça
automaticamente em “Resultado” a resposta “Obesidade Grau III” após
digitar em “IMC” valores > 40. Qual comando deveria ser digitado no Check
Code?

a) IF IMC > 40 THEN RESULTADO=”OBESIDADE GRAU III”


b) IF RESULTADO > 40 THEN IMC=”OBESIDADE GRAU III”
c) IF RESULTADO =”OBESIDADE GRAU III” THEN IMC>40
d) IF IMC > 40 THEN RESULTADO=”OBESIDADE GRAU II” GABARITO

10
VISUAL DASHBOARD
IMPORTANDO BANCO DE DADOS EM EXCEL

Para realizar as próximas atividades baixe o arquivo SDE.xls clicando


neste link: https://www.dropbox.com/s/30xskf0y6713fp3/SDE.xls?dl=0

Figura 8. Banco de dados SDE.xls

Este banco contém parte dos dados de um estudo transversal (pesquisa de


iniciação científica) realizado com 1132 estudantes universitários da área da saúde
matriculados no UNIVAG Centro Universitário que avaliou a prevalência de
sonolência diurna excessiva (SDE) entre agosto de 2016 e julho de 2017. A tabela
abaixo apresenta o dicionário das variáveis utilizadas:

VARIÁVEL DESCRIÇÃO TIPO RESPOSTA


medicina Curso Categórica 1 = Medicina
0 = Outros cursos
da saúde
idade Idade Contínua Numérica
periodo Horário do Curso Categórica 0 = Integral
1 = Matutino
2 = Norturno
sexo Sexo Categórica 0 = Feminino
1 = Masculino
exercicio Número de Atividade Física Semanal Discreta Numérica
celular Utiliza celular momento antes de Categórica 0 = Não
dormir 1 = Sim
madrugada Estuda de madrugada Categórica 0 = Não
1 = Sim
estimulant Faz uso de estimulantes para estudar a Categórica 0 = Não
noite 1 = Sim
scoremeq Escore obtido da aplicação do Discreta Numérica
instrumento diagnóstico

11
Morningness–eveningness
Questionnaire (MEQ) que avalia o
cronótipo
cronotipo Interpretação da variável “scoremeq” Categórica 1 = Matutino
2 = Intermediário
3 = Vespertino
scoreep Escore obtido da aplicação daEscala de Discreta Numérica
Sonolência de Epworth (ESE) que
avalia SDE
sde Interpretação da variável “scoreep” Categórica 0 = Não
1 = Sim

Acesse: Epi Info 7 → Visual Dashboard → Set a data source now (figura 9)

Figura 9. Tela de importação do Visual Dashboard.

Escolha o formato .xls em Database Type (outras extensões de arquivos também


podem ser utilizadas) e depois clique em Browse para selecionar o arquivo onde
está salvo (figura 10).

Figura 10. Tela de seleção do arquivo a ser importado para o Epi Info 7.

12
Deixe a caixa de seleção marcada em First row contains header information caso
em sua planilha a primeira linha contenha o nome das variáveis do seu banco de
dados.

A mensagem Processing Finished aponta para uma importação realizada com


sucesso (figura 11). O número de pacientes aparecerá no canto direito superior da
tela como Records.

Figura 11. Tela inicial do Visual Dashboard após importação de banco de dados.

REALIZANDO ESTATÍSTICA DESCRITIVA

Clique com o botão direito na parte em branco do Visual Dashboard e as opções da


figura 12 irão aparecer em sua tela. A tabela abaixo apresenta as opções utilizadas
de acordo com a natureza da variável do banco de dados:

VARIÁVEL ESTATÍSTICA DESCRITIVA


Categórica Frequência Absoluta (n) e Relativa (%)
Contínua/Discreta Médias, Medianas, Desvio Padrão, Moda

13
Figura 12. Tela de opções de análise de dados no Visual Dashboard do Epi Info 7.

SUMARIZAÇÃO DE VARIÁVEIS CATEGÓRICAS

A tabela de frequência da variável desfecho sde (figura 13) nos informa que a
prevalência de sonolência diurna excessiva foi igual a 56,27% e esteve presente em
637 estudantes. O Epi Info 7 lista suas variáveis por ordem alfabética, por isso
muito provavelmente elas não estarão na mesma ordem que foram dispostas na
planilha do Excel.

Figura 13. Opção "frequency" da variável SDE no Visual Dashboard.

A informação da coluna Cum. Percent (percentual cumulativo) é útil quando a


variável possui três ou mais categorias. As colunas Wilson 95% LCL e UCL

14
informam, respectivamente, os valores inferiores e superiores do intervalo de
confiança a 95% (IC95%) do percentual da mesma linha.

Uma estratégia para refinar a estatística descritiva de variáveis categóricas é


produzir uma tabela de frequência estratificada (figura 14).

1. Gere uma tabela de frequência seguindo os passos da figura 12;


2. Em frequency of selecione a variável sde;
3. Clique na aba esquerda Grouping and Sorting e em Stratify by selecione
medicina;
4. Clique em Ok.

Figura 14. Tabela de frequência estratificada.

Dessa forma, a tabela de frequência produzida foi estratificada pela variável


medicina. Isso é bastante útil quando queremos ter uma ideia inicial se a
prevalência de SDE apresentou percentuais parecidos em grupos diferentes.

SUMARIZAÇÃO DE VARIÁVEIS CONTÍNUAS/DISCRETAS

1. Da lista de opções presentes na figura 12 clique em means;


2. Em means of selecione a variável numérica scoreep;
3. Clique em Ok.

15
Figura 15. Cálculo de medidas de tendência central e dispersão.

Desta forma, observamos que o escore médio da Escala de Sonolência de Epworth


(ESE) foi igual a 11,05, com desvio padrão igual a 3,9, mediana igual a 11 e moda igual
a 13. Podemos também estratificar esses dados (figura 16).

Figura 16. Estatística descritiva estratificada de variável contínua.

Observamos que o escore médio da ESE foi maior entre os alunos de medicina do
que entre os alunos de outros cursos da área da saúde, embora, ainda não
saibamos se essa diferença é estatisticamente significante ou não porque fizemos
apenas a estatística descritiva desses dados.

ANÁLISE ESTATÍSTICA DE VARIÁVEIS CATEGÓRICAS

1. Da lista de opções presentes na figura 12 clique em M x N / 2 x 2 table;


2. Em Exposure selecione a variável categórica explicativa medicina;
3. Em Outcome selecione a variável categórica desfecho sde;
4. Clique em Ok.

Detalhe importante: o desfecho sempre deve aparecer na coluna e a variável de


exposição na linha da tabela e a presença do desfecho e a presença da exposição

16
(respostas = 1) devem sempre estar posicionadas na coluna à esquerda e na
primeira linha, respectivamente (figura 17).

Figura 17. Análise estatística de variáveis categóricas

Dica: A figura 19 apresenta um algoritmo para interpretação dos resultados da


análise estatística de tabelas 2x2 no Visual Dashboard do Epi Info 7.

Os dados da figura 17 nos informam que a prevalência de SDE foi estatisticamente


semelhante entre estudantes do curso de medicina e estudantes de outros cursos
da área da saúde por causa do p-valor > 0,05.

Figura 18. Análise estatística de variável categórica com diferença estatística entre os grupos.

Observamos agora que houve diferença estatística na prevalência de SDE entre os


estudantes que disseram usar o celular momentos antes de dormir e os
estudantes que disseram não fazer uso do celular momentos antes de dormir
(p=0,003).

O “Risk Ratio” foi igual a 1,33 com IC95%=1,07-1,65, o que significa que a prevalência
de SDE foi 33% maior entre os estudantes que utilizaram celular momentos antes
de dormir quando comparado com aqueles estudantes que não tem esse hábito. A
captação do brilho da tela do smartphone inibe a secreção de melatonina pela
glândula pineal, causando sonolência diurna excessiva.

17
Figura 19. Algoritmo para interpretação de análise estatística de variáveis categóricas no Visual Dashboard do Epi Info 7.
ANÁLISE ESTATÍSTICA DE VARIÁVEIS CONTÍNUAS/DISCRETAS

Detalhe importante: antes de escolher o teste para avaliar variáveis numéricas é


necessário verificar se a sua distribuição é normal (paramétrica) ou não (não
paramétrica). O teste estatístico adequado é escolhido com base nessa
distribuição (tabela abaixo), mas o Epi Info 7 não realiza o teste de normalidade.

NECESSIDADE TESTE PARAMÉTRICO TESTE NÃO PARAMÉTRICO


Comparar 2 médias não pareadas de Teste t para duas médias Teste U de Mann-Whitney
uma variável com 2 grupos independentes
Comparar 2 médias pareadas de uma Teste t para duas médias Teste de Wilcoxon para
variável com 2 grupos dependentes amostras dependentes
Comparar 2 médias não pareadas de ANOVA um fator Teste de Kruskal-Wallis
uma variável com 3 ou mais grupos

1. Da lista de opções presentes na figura 12 clique em means;


2. Em means of selecione a variável contínua scoreep;
3. Em Cross-tabulate by selecione a variável categórica medicina;
4. Clique em Ok.

Figura 20. Comparação de duas médias pelo test t no Visual Dashboard do Epi Info 7.
Na figura 20 comparamos os escores médios da ESE entre os estudantes de
medicina e de outros cursos da área da saúde por meio de um test t para amostras
independentes. Já havíamos visto essas médias na figura 16, mas agora
realizamos um teste de hipóteses, cujo p-valor = 0,03 nos permite rejeitar a
hipótese nula que afirma “as médias são semelhantes estatisticamente”.

Concluímos, então, que os alunos do curso de medicina (Média=11,34; DP=3,82)


apresentaram escore médio da Escala de Sonolência de Epworth
estatisticamente maior que os alunos dos outros cursos da área da saúde
(Média=10,84; DP=3,95).

USANDO FILTROS

Quando se tem bancos de dados com grande quantidade de registros é possível


que se produza artigos ou resumos para apresentação em congressos com a
análise estatística apenas de uma parte desses dados. Nestes casos, o Epi Info 7
apresenta dois recursos interessantes: o filtro geral e o filtro específico.

Acesse: Epi Info 7 → Visual Dashboard → (figura 21)

Figura 21. Tela de filtro geral do Epi Info 7.

1. Para analisarmos os dados apenas dos estudantes do curso de medicina


selecione em Field Name a variável medicina;
2. Em Operator selecione is equal to;

20
3. Em Value digite o número 1;
4. Clique em Add Filter.

Caso o filtro tenha ocorrido com sucesso em Records aparecerá apenas os


registros referentes ao grupo selecionado e a mensagem abaixo aparecerá na
parte superior da tela do Visual Dashboard (figura 22).

Figura 22. Mensagem confirmando a aplicação do filtro geral.

Agora, quando fizer a estatística descritiva e os testes de hipóteses os resultados


serão apenas relativos ao grupo selecionado. Ou seja, qualquer análise adicionada
na tela do Visual Dashboard respeitará o filtro geral informado.

Para remover o filtro geral, clique novamente no ícone do filtro, no campo Data
Filters clique em cima de The value of [medicina] is equal to 1 e depois clique em
Remove Selected.

Sem nenhum filtro geral, gere uma tabela de frequência da variável cronotipo.
Lembre-se que 1 significa o cronótipo matutino, 2 intermediário e 3 vespertino.
Siga os passos abaixo para utilizar a opção de filtro específico:

1. Clique no ícone dessa tabela;


2. Clique em Data Filters;
3. Em The value of Field Name selecione a variável celular;
4. Em Operator selecione a opção is equal to;
5. Em Value digite 1;
6. Clique em Add Condition;
7. Clique em Ok.

A tabela agora nos mostra que entre os estudantes de medicina e dos demais
cursos da área da saúde o cronótipo mais prevalente (57,90%; n=590) foi o
intermediário. É possível que esses estudantes estejam migrando de um cronótipo

21
matutino (pessoas que dormem mais cedo) para um cronótipo vespertino
(pessoas que dormem mais tarde), mas apenas um estudo de coorte poderia
observar essa mudança ao longo do tempo.

EXERCÍCIOS DE FIXAÇÃO n.º 2

1) A tabela 2x2 abaixo avaliou a seguinte hipótese nula: “utilizar celular


momentos antes de dormir não interfere na prevalência do cronótipo
vespertino [resposta = 3] entre estudantes de cursos da área da saúde”.
Essa hipótese foi avaliada pelo teste Qui-quadrado de Mantel-Haenszel e
pela razão de prevalência (risk ratio). Marque a opção com a interpretação
correta:

a) Com o p-valor igual a 39,99 não rejeitamos a hipótese nula e concluimos


que a prevalência do cronótipo vespertino foi estatisticamente
semelhante entre alunos que fizeram ou não uso de celular antes de
dormir.
b) A prevalência do cronótipo vespertino foi 314% maior entre os
estudantes que fizeram uso de celular antes de dormir do que entre os
estudantes que não fizeram uso de celular antes de dormir.
c) O cronótipo vespertino foi 41 vezes maior entre os que fizeram uso de
celular antes de dormir do que entre os estudantes que não fizeram uso
de celular antes de dormir.
d) O intervalo de confiança a 95% não nos permite inferir se o valor de p foi
< 0,05 e a hipótese nula pode ser rejeitada.

P.S.: De acordo com o Morningness–Eveningness Questionnaire (MEQ) o


início do sono em pessoas com cronótipo vespertino ocorre entre 00:45h
e 03:00h e, por isso, seu despertar seria entre 08:30h e 11:30h.

22
2) O teste Qui-quadrado de Mantel-Haenszel é utilizado para avaliar a
associação entre:

a) duas variáveis categóricas.


b) duas variáveis contínuas.
c) uma variável contínua e uma categórica.
d) uma variável categórica e uma contínua.

3) Após clicar em means of e selecionar a variável contínua para realizar o


test t no Visual Dashboard, em qual das opções abaixo devo colocar a
variável categórica que desejo comparar as médias?

a) Exposure
b) Weight
c) Stratify by
d) Cross-tabulate by

4) Analise o resultado do teste t abaixo e marque a interpretação correta da


estatística encontrada. Masculino = 1; Feminino = 0.

GABARITO

a) O sexo feminino apresentou escore médio estatisticamente maior que o


sexo masculino.
b) O sexo masculino apresentou escore médio estatisticamente maior que
o sexo feminino.
c) O sexo masculino apresentou escore médio estatisticamente
semelhante ao sexo feminino.
d) O p-valor não nos permite rejeitar nem a hipótese nula e nem a hipótese
alternativa.

23
ANALYZE DATA CLASSIC
IMPORTANDO BANCO DE DADOS EM EXCEL

Acesse: Epi Info 7 → Classic → Read → Recent Data Sources → SDE [sde.xls]

1 2

Figura 23. Tela inicial do Analyze Data Classic do Epi Info 7.

1) Lista de comandos disponíveis.


2) Tela onde aparecerão os resultados das análises.
3) Espaço para digitar comandos manuais e programar uma rotina.
4) Mensagem confirmando a importação do banco de dados.

O grupo de comandos Statistics apresenta todas as opções que encontramos no


Visual Dashboard. Neste momento, utilizaremos algumas das mais importantes
opções de análise multivariada presentes no grupo Advanced Statistics.

24
REGRESSÃO LOGÍSTICA
O objetivo de uma análise multivariada é, como o próprio nome sugere, avaliar em
conjunto o efeito de múltiplas variáveis sobre um mesmo desfecho. Esse método é
útil para controlar o viés de confundimento de um estudo.

Acesse: Epi Info 7 → Classic → Advanced Statistics → Logistic Regression (figura 24)

1. Em Outcome Variable selecione sde;


2. Em Other Variables selecione celular;
3. Em Other Variables selecione sexo;
4. Em Other Variables selecione madrugada;
5. Em Other Variables selecione medicina;
6. Em Other Variables selecione cronotipo;
7. Clique em Ok.

Figura 24. Tela de seleção das variáveis para ajuste de análise multivariada através de regressão logística.

Dica: As variáveis (desfecho e explicativas) devem ser dicotômicas (sim/não) e as


variáveis com três ou mais categorias devem ser transformadas em dummy
variable, basta clicar sobre a variável e clicar em make dummy (aparecerá entre
parêntesis).

O Epi Info 7 apresenta sublinhada aquelas variáveis que incluímos no modelo


multivariado e tiveram p-valor < 0,05 (figura 25), como o uso de celular antes de
dormir e o sexo feminino.

25
Figura 25. Output do Analyze Data Classic de um modelo de regressão logística.

Ao observamos a Odds Ratio da variável celular, concluímos que a prevalência de


sonolência diurna excessiva (sde) em estudantes de cursos da área da saúde foi
64,5% maior (1,645-1x100) entre os que fizeram uso de celular momentos antes de
dormir quando comparado com os estudantes de cursos da área da saúde que não
fizeram uso de celular momentos antes de dormir.

Detalhe importante: A medida de associação de uma análise bivariada é


denominada bruta e a mesma medida de associação proveniente de uma análise
multivariada é denominada ajustada, justamente por ter recebido a influência da
ação de outras variáveis associadas ou não com o desfecho.

Ao consultarmos o dicionário das variáveis deste banco de dados (p. 11) vamos
perceber que sexo = 1 é masculino e sexo = 0 é feminino. Logo, a prevalência de sde
foi 29% menor (1-0,71x100) entre os homens do que entre as mulheres.

26
REGRESSÃO DE COX
O modelo de riscos proporcionais de Cox é uma regressão multivariada aplicada
na análise de sobrevida, inferindo risco relativo de várias exposições e um
desfecho sendo o intervalo de tempo até a ocorrência de um evento.

Para realizar as próximas atividades baixe o arquivo Candidemia.xls clicando


neste link: https://www.dropbox.com/s/tvpaw06xqr61ce4/Candidemia.xls?dl=0

Este banco de dados (figura 26) foi construído para avaliar a sobrevida em 90 dias
de pacientes internados em UTI adulto e neonatal de um hospital de Cuiabá entre
os anos 2014-2016 e fatores preditores para o óbito.

Figura 26. Banco de dados "sobrevida.xls"

VARIÁVEL DESCRIÇÃO TIPO RESPOSTA


sexo Sexo Categórica 1 = Masculino
0 = Feminino
uti UTI de origem Categórica 1 = UTI Adulto
0 = UTI Neonatal
dtinter Data de Internação
dtsaida Data da Saída
tempo Tempo entre internação e saída Discreta
obito Óbito Categórica 1 = Sim
0 = Não
idade Idade Contínua
candidemia Infecção de corrente sanguínea Categórica 1 = Sim
por leveduras do gênero Candida 0 = Não
carbap Antibioticoterapia com Categórica 1 = Sim
carbapenêmicos (imipenem, 0 = Não
meropenem)
glicop Antibioticoterapia com Categórica 1 = Sim
glicopeptídeos (vancomicina) 0 = Não
vm Ventilação Mecânica Categórica 1 = Sim
0 = Não
np Nutrição Parenteral Categórica 1 = Sim
0 = Não
cvc Cateter Venoso Central Categórica 1 = Sim
0 = Não

27
Acesse: Epi Info 7 → Classic → Advanced Statistics → Cox Proportional Hazards
(figura 27)

Figura 27. Ajuste de análise multivariada por meio da regressão de Cox.

Após ajustar a regressão de Cox conforme ilustrado acima, teremos o seguinte


output com o resultado da análise de dados (figura 28):

Figura 28. Resultado da regressão de Cox.

Internação em UTI adulto (p=0,0002) e uso de ventilação mecânica (p=0,0001)


foram fatores preditores independentes para o óbito nesta população. Pacientes

28
internados em UTI adulto tiveram risco de óbito 149% maior (2,49-1x100) do que os
pacientes de UTI neonatal. Uso de suporte ventilatório aumentou o risco de óbito
em 222% (3,22-1x100).

CURVA DE KAPLAN-MEIER
Acesse: Epi Info 7 → Classic → Advanced Statistics → Kaplan-Meier Survival (figura
29)

Figura 29. Tela de configuração para estimar as funções de sobrevida pelo método de Kaplan-Meier.

Figura 30. Curva de Kaplan-Meier com resultado do teste de log-rank.

29
O gráfico (figura 30) apresenta a curva de Kaplan-Meier, que estima a
probabilidade de sobreviver ao longo do tempo de seguimento deste grupo de
pacientes. Por exemplo, a linha laranja nos informa que após 20 dias de internação
a probabilidade de sobrevida entre pacientes da UTI neonatal foi > 90%, enquanto
que na UTI adulto < 75%.

Para termos evidência mais concreta que a sobrevida entre os grupos seja
estatisticamente diferente, o Epi Info 7 realiza o teste de Log-rank, cujo valor de
p<0,05 nos permite rejeitar a hipótese nula de que “as funções de sobrevida são
semelhantes entre os grupos”. Sendo assim, podemos afirmar que pacientes de
UTI adulto apresentaram sobrevida mais baixa que pacientes de UTI neonatal.

EXERCÍCIOS DE FIXAÇÃO n.º 3

1) Quando quisermos realizar uma regressão logística no Analyze Data


Classic devemos procurar essa opção de análise de dados em:

a) Data
b) Variables
c) Statistics
d) Advanced Statistics

2) Para uma regressão logística a variável desfecho deve ser do tipo:

a) Contínua
b) Dicotômica
c) Dummy
d) Discreta

3) No ajuste de uma análise multivariada, em qual opção devemos clicar


quando uma variável explicativa possuir três ou mais categorias?

a) Make Dummy
b) Other Variables
c) Outcome Variables
d) Confidence Limits

30
4) Você realizou uma pesquisa para avaliar os fatores associados ao óbito em
pacientes internados em uma UTI e analisou os dados por meio de uma
regressão logística. Marque a alternativa que apresenta a interpretação
correta dos dados abaixo:

a) O óbito foi 22,8% maior entre pacientes do sexo masculino.


b) A ventilação mecânica [vm] aumentou o risco de óbito em 724%.
c) Nutrição parenteral [np] reduziu o risco de óbito em 57,9%.
d) O óbito foi 62,4% maior entre aqueles que fizeram uso de cateter [cvc].

GABARITO

31
AVALIAÇÃO FINAL

1) Baixe o banco de dados Avaliacao.xls →


https://www.dropbox.com/s/mwb6ve3o4mup32t/Avaliacao.xls?dl=0
2) Acesse este formulário: https://goo.gl/forms/SjkhT4SqY90E5AI03
3) Analise os dados para responder às perguntas.

Regras:

I. O rendimento mínimo necessário para obtenção do certificado de


conclusão do curso é de 60%.
II. O formulário estará aberto para recebimento de respostas por até 7 dias
após o término do curso e será permitido apenas 1 envio por aluno.
III. O aluno que não enviar as respostas dentro do prazo estabelecido será
considerado como desistente do curso.

Dicionário de Variáveis [Avaliacao.xls]

Fonte: Sistema de Internação Hospitalar (SIH): Mato Grosso – Abril/2018

VARIÁVEL DESCRIÇÃO TIPO RESPOSTA


sexo Sexo Categórica 1 = Masculino
0 = Feminino
tempo Tempo entre internação e saída Discreta
diagnostico CID-10 do motivo da internação Categórica Código CID
insufcardiaca Insuficiência Cardíaca (CID-10 Categórica 1 = Sim
I500, I501 e I509) 0 = Não
idade Idade Discreta
fxetaria Faixa Etária Categórica 1 = 18 a 30 anos
2 = 31 a 40 anos
3 = 41 a 59 anos
4 = 60 ou mais
obito Óbito Categórica 1 = Sim
0 = Não
raca Raça/cor Categórica 1 = Branco
2 = Negro
3 = Pardo
4 = Outras

32

Você também pode gostar