Você está na página 1de 22

Estudo de Caso 2

Jony Arrais
Atividade
§ Deseja-se entender quais fatores são importantes para explicar o tempo
de sobrevida em dias de pacientes internados sob determinadas
condições.

§ 54 pacientes.

§ Variáveis: nível de coagulação do sangue, índice do prognóstico, teste de


enzima, teste de função hepática, idade (em anos completos), sexo do
indivíduo e consumo de álcool dos pacientes.
Atividade
§ Importe o arquivo Tempo vida.xlsx.

§ Faça o tratamento das variáveis qualitativas (sexo e alcool).

§ Existem dados faltantes na base?

§ Faça uma análise exploratória das variáveis no banco. Algum valor


estranho para os dados observados?

§ Avalie a existência de relação entre as variáveis.


Atividade
§ Ajuste um primeiro modelo de regressão linear múltipla para o tempo de vida dos
pacientes considerando como variáveis explicativas todas as variáveis existentes na
base.

§ Avalie a suposição de homocedasticidade dos resíduos (graficamente e por meio de


um teste de hipóteses).

§ Avalie a suposição de normalidade dos resíduos (graficamente e por meio de um


teste de hipóteses).

§ Caso algum pressuposto tenha falhado, faça uma transformação logarítmica na


variável resposta para aplicar o modelo de regressão linear múltiplo.
Atividade
§ No modelo com a variável transformada, verifique as suposições de
normalidade e homocedasticidade.
§ Verifique a presença de multicolineariedade.
§ Qual a interpretação dos coeficientes?
§ Usando o seu modelo final faça uma previsão para o tempo de vida se
uma mulher, com coagulação de 5.8, índice de prognóstico 63, teste de
enzima de 79, teste de função hepática de 2.7, com 45 anos e grande
consumo de álcool.
Análise de dados faltantes

Podemos perceber, pela figura que todas


as variáveis possuem dados completos.
Análise de dados faltantes
Na diagonal principal
temos um gráfico que
representa o
comportamento de
cada variável

Fora da diagonal principal temos análises que refletem a existência de relação entre as
variáveis duas a duas.
Ajustando o modelo
com y = tempo
Verificando homocedasticidade

• Teste de Breush-Pagan.
• P-valor = 0,1215 > nível de significância = 0,05, logo não rejeitamos H0.
• Conclusão: erros homocedásticos.

No gráfico, desejamos que os pontos estão


espalhados de forma aleatória em torno
da reta y = 0.
Verificando normalidade

• Teste de Shapiro-Wilk.
• P-valor = 0,0005594 < nível de significância = 0,05, logo rejeitamos H0.
• Conclusão: erros não normais.

No gráfico, desejamos que os pontos estão


próximo a reta. Ponto 5 muito distante da
reta!
Ajustando o modelo
com y = log(tempo)
Verificando homocedasticidade

• Teste de Breush-Pagan.
• P-valor = 0,77 > nível de significância = 0,05, logo não rejeitamos H0.
• Conclusão: erros homocedásticos.

No gráfico, desejamos que os pontos estão


espalhados de forma aleatória em torno
da reta y = 0.
Verificando normalidade

• Teste de Shapiro-Wilk.
• P-valor = 0,4204 < nível de significância = 0,05, logo não rejeitamos H0.
• Conclusão: erros normais.

No gráfico, desejamos que os pontos estão


próximo a reta.
Seleção de variáveis - AIC

• Coagulação
• Índice de prognóstico.
• Enzima.
• Idade.
• Sexo.
• Álcool.
Ajustando o modelo com
as variáveis explicativas
escolhidas pelo AIC
Verificando homocedasticidade

• Teste de Breush-Pagan.
• P-valor = 0,6372 > nível de significância = 0,05, logo não rejeitamos H0.
• Conclusão: erros homocedásticos.

No gráfico, desejamos que os pontos estão


espalhados de forma aleatória em torno
da reta y = 0.
Verificando normalidade

• Teste de Shapiro-Wilk.
• P-valor = 0,4382 < nível de significância = 0,05, logo não rejeitamos H0.
• Conclusão: erros normais.

No gráfico, desejamos que os pontos estão


próximo a reta.
Multicolineariedade
§ VIF < 5 para todas as variáveis, logo não temos problemas de multicolineariedade.
Interpretação
§ Intercepto e os efeitos das variáveis nível de coagulação, índice de
prognóstico, enzima, idade e álcool são estatisticamente significativos.
§ O aumento de 1 unidade de nível de coagulação, aumenta em
aproximadamente 0,07 no log do tempo de sobrevida do paciente,
considerando as demais variáveis iguais.
§ O aumento de 1 unidade de índice de prognóstico, aumenta em
aproximadamente 0,01 no log do tempo de sobrevida do paciente,
considerando as demais variáveis iguais.
§ O aumento de 1 unidades de enzima, aumenta em aproximadamente
0,01 no log do tempo de sobrevida dos paciente, considerando as demais
variáveis iguais.
Interpretação
§ Pacientes com consumo de álcool grave tem um aumento de 0,38 no log
do tempo de sobrevida quando comparado com pacientes com nenhum
consumo de álcool, considerando as demais variáveis iguais.

§ Um paciente do sexo masculino, que não consome álcool, com 0 anos de


idade, com 0 de enzima, com 0 de índice de prognóstico e 0 de
coagulação possui em média 4 log dias de sobrevida.
Interpretação
§ O aumento de 1 unidade de nível de coagulação, aumenta em
aproximadamente 1,07 dias o tempo de sobrevida do paciente,
considerando as demais variáveis iguais.
§ O aumento de 1 unidade de índice de prognóstico, aumenta em
aproximadamente 1,01 dias o tempo de sobrevida do paciente,
considerando as demais variáveis iguais.
§ O aumento de 1 unidades de enzima, aumenta em aproximadamente
1,01 dias o tempo de sobrevida dos paciente, considerando as demais
variáveis iguais.
Interpretação
§ Pacientes com consumo de álcool grave tem um aumento de 1,06 dias no
tempo de sobrevida quando comparado com pacientes com nenhum
consumo de álcool, considerando as demais variáveis iguais.

§ Um paciente do sexo masculino, que não consome álcool, com 0 anos de


idade, com 0 de enzima, com 0 de índice de prognóstico e 0 de
coagulação possui em média 56,67 dias de sobrevida.

Você também pode gostar