Escolar Documentos
Profissional Documentos
Cultura Documentos
net/publication/315735094
CITATIONS READS
0 20,959
1 author:
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
LEVEL OF PHYSICAL ACTIVITY AND GLYCEMIC VARIABILITY IN CHILDREN AND ADOLESCENTS WITH DIABETES MELLITUS TYPE 1. View project
All content following this page was uploaded by Eduardo Federighi Baisi Chagas on 01 April 2017.
MATERIAL DIDÁTICO
CURSO DE ESTATÍSTICA APLICADA PARA INICIANTES
MÓDULO 4
ESTATÍSTICA ANALÍTICA III
Regressão no SPSS
MARÍLIA
2016
Estatística Aplicada para Iniciantes – Módulo 4 – Estatística Analítica III
SUMÁRIO
1. Regressão
2. Regressão Linear Simples
3. Regressão Linear Múltipla
4. Regressão Logística Binária
Estatística Aplicada para Iniciantes – Módulo 4 – Estatística Analítica III
1. REGRESSÃO
A correlação pode ser uma ferramenta útil, porém ela não informa sobre o
poder preditivo de uma ou mais variáveis. Por outro lado, a REGRESSÃO permite
ajustar um modelo preditivo, ou seja, construir um modelo matemático para prever os
valores da variável dependente (VD) a partir de uma ou mais variáveis independentes
(VI). O conceito de regressão é baseado na equação genérica:
Yi = (b0+bi *Xi) + ei
modelo, mas como estamos tratando de uma regressão simples temos apenas uma
variável independente não sendo necessário considerar está informação apresentada no
quadro Variables Entered/Removed.
Diagnóstico de Outliers
Os resíduos normais ou não padronizados são mensurados na mesma
unidade de medida da variável de saída (Y) e são difíceis de serem detectados, a não ser
quando estes são particularmente grandes.
Por outro lado, os resíduos padronizados que são resíduos divididos por uma
estimativa do seu desvio-padrão (escore-z) permitem a identificação mais clara de
valores atípicos. Algumas regras gerais são padronizadas para está interpretação:
- (1) Valores de escore-z > que 3,29 são preocupantes, porque raramente eles ocorrem
ao acaso;
- (2) Se mais de 1% da amostra padronizada apresenta resíduos padronizados com
valores absolutos maiores de 2,58, existem evidências de que o nível de erro dentro do
modelo é inaceitável;
- (3) Se mais de 5% dos casos tem resíduos padronizados com um valor absoluto maior
que 1,96 (pode utilizar 2), também há evidências de que o modelo é frágil.
Casos influentes
Além de procurar casos atípicos, também é possível buscar casos que
influenciam o modelo, e permite avaliar a estabilidade do modelo.
Uma estatística utilizada para avaliar casos influentes é o valor previsto
ajustado, que compara o valor previsto do modelo com o caso e o valor previsto
ajustado sem o caso. Se a retirada do caso influente produz valores previsto semelhantes
do modelo inicial é indicativo que o modelo é estável. A diferença entre o valor previsto
original e o valor previsto ajustado é conhecido como DFFit. Uma estatística que avalia
o efeito de um único caso no modelo como um todo é a Distância de Cook, onde
valores maiores que 1 indica influência significativa.
Embora existam outras formas de avaliar a influencia de casos no modelo eles
não é uma forma de justificar a remoção de dados para simplesmente produzir um valor
Estatística Aplicada para Iniciantes – Módulo 4 – Estatística Analítica III
de B significativo. Lembre ainda que um valor atípico ou caso influente possa de fato
representar o padrão biológico presente na população e sua retirada leva a um modelo
não real. Além disso, a variável previsora ou o conjunto de variáveis previsoras podem
não ser capazes de prever adequadamente da variável de saída (Y).
categorias atribuir o código “0”. Quando isto é feito a variável criada é chamada de
variável Dummy, pois, o código “0” representa mais de uma categoria de resposta se
caracterizando com uma variável fictícia.
No SPSS é possível transformar uma variável categórica com mais de duas
categorias em uma variável Dummy. Considerando a planilha do SPSS Regressão
Logística, a variável estado nutricional (EST_NUT) possui 3 categorias de resposta,
sendo, 0=eutrófico; 1=sobrepeso; 2=obeso. Supondo que o propósito seja criar 3
variáveis Dummy: Eutrófico (0=não eutrófico; 1= eutrófico); Sobrepeso (0=não
sobrepeso; 1= sobrepeso); Obeso (0=não obeso; 1=obeso).
Clicar em Transform<Recode into Different Variables. No item Numeric
Variable -> Output Variable inserir a variável EST_NUT que será transformada. Em
Name nomear a nova variávei Dummy, e em Label descrever a nova variável. Feito isto
clicar em Change. Em seguida clicar em Old and New Values para atribuir os novos
códigos.
O SPSS irá criar uma nova variável chamada de Eutrófico. Caso queira fazer o
mesmo para as outras categorias de resposta deverá realizar o mesmo procedimento para
cada uma delas.
Vimos nos resultados que alguns previsores têm B com valor negativo e
Exp(B) menor que 1 indicando que quando estes previsores aumentar a probabilidade
do desfecho ocorrer diminui. Assim podemos realizar a análise novamente retirando
estes previsores. Além disso, também é possível inserir previsores de modo a analisar
sua interação. Para isso após clicar em Analyze<Regression<Binary Logistic, na lista
de variáveis da caixa de dialogo que abrir selecionar duas variáveis e a opção “>a*b>
será ativada para inserir a interação no item Covariates. No Bloco “0” é possível
verificar no quadro Variabeles not in the Equation em Overall Statistics que nenhuma
variável previsor é significativamente diferente de ZERO, ou seja, se a adição de uma
ou mais destas variáveis no modelo não irá afetar o seu poder de previsão.
Estatística Aplicada para Iniciantes – Módulo 4 – Estatística Analítica III
BIBLIOGRAFIA