Você está na página 1de 15

Prova 1 Anlise Multivariada

I)

Verificao de Adequabilidade da Base de Dados:

Tratamento de outlier univariado:


1. Analyze;
2. Descriptive Statistic;
3. Descriptives (assinale save stantardized value) ok
4. Selecione as variveis que sero analisadas e as
transfira para Variable(s);
5. Save standardized values as variables
6. OK
7. Ver -3<Z escore>3.

Tratamento de outlier multivariado:


1. Analyze;
2. Regression;
3. Linear (selecione a varivel dependente e a
transfira para [Dependent], procedendo de forma
anloga para variveis independents);
4. Save Mahalanobis Distance;
5. Assinale Mahalanobis em Distance;
6. OK

Identificao de outlier univariado:


1.

Data/Select Cases;

2.

Selecione a opo [if condition is satisfied...];

3.

Na caixa relativa ao texto da frmula, insira a


desigualdade ZTVACABO>3. Clique [ ok]. Faa
procedimento anlogo para destacar os outliers
das outras variveis padronizadas.

Identificao de outlier multivariado:


1. Clique em [Data/Select Cases];
2. [if condition is satisfied...];

3. Na caixa relativa ao texto da frmula, insira a


desigualdade MAH_15. Clique [ ok].
4. Trao cruzado no case que atende;
5. O que no atende [Edit] e [Clear].

Missing Data:
Imputao por regresso:
1. [Analyze];
2. [Missing Value Analyze];
3. Selecione as variveis com dados perdidos e transfira para
caixa [Quantitative Variables]. Selecione [Regression].
Clique [ok];
4. Os possveis valores se encontram na tabela 3 do output.

Pressupostos a serem atendidos:


Normalidade das variveis:
Grfico de probabilidade:
1. Analyze;
2. Descriptive Statisitcs;
3. P-P Plots;
4. Variables, indicar a varivel a ser testada;
5. Teste Distribuition, indicar o modelo de probabilidade a ser
testado (PP-Plot).
6. Deixar todas as marcaes default
7. OK.

Teste de normalidade:
K-S (amostra gde); S W (amostra pequena).
1. Selecione [Analyze]; [Descriptive Statistics]; [Explore];
2. Escolha as variveis que sero transferidas para
Dependent list. Clique [Plots]; selecione [Normality plots

with tests]; e assinale [Histogram]. Clique [Continue] e


[OK].
3. Ver os valores de p (SIG) no SPSS maiores que 0.05, pois
Ho: h normalidade.

Homogeneidade das Varincias:


Teste Boxs M para testar a homogeneidade de mais de
uma varivel.
Teste Boxs M:
Clique em [Analyze]; [General Linear Model] e
[Multivareate];
Transfira [Atributo1], [Atributo 2], [Atributo 3] e
[Atributo 4] para a caixa [Dependent Variables]. Transfira
[Grupos] para caixa [ Fixed Factor];
Clique [Options]. Assinale [Homogeneity tests] e
clique [Continue].
Sig (valor-p) >0,01- nvel de significncia adotado.

Ver se o teste de Levene corrobora, isto no


viola a hiptese, ele no pode ser significante
a 5% (P SIG > 0.05).

Colinearidade e multicolinearidade:
Multicolinearidade:
1. Clique [Analyze]; [Correlate]; [Bivariate...];
2. Em Bivariate Correlations, mova as variveis de anlise
para caixa [Variables];

assinale

em [Correlation

Coefficients], [Pearson] e marque [Flag significant


correlations], que est abaixo da caixa Teste of Significant.
Clique [OK].
3. Matriz de correlao de Pearson
Variveis quantitativas

Anlise da confiabilidade Interna da Base de dados:


Confiabilidade alfa de cronbach (alfa 0 a 1) existncia de
constructos latentes:
1.
2.
3.
4.

ANALYZE
SCALE
REABILITY ANALYSIS
Selecionar as variaveis a serem verificados a confiabilidade
das respostas
5. Manter o modelo sugerido Alfa
6. OK

1 Pedir um teste de normalidade:


K-S (amostra gde); S W (amostra pequena).
4. Selecione [Analyze]; [Descriptive Statistics]; [Explore];
5. Escolha as variveis que sero transferidas para
Dependent list. Clique [Plots]; selecione [Normality plots
with tests]; e assinale [Histogram]. Clique [Continue] e
[OK]
6. Ver os valores de p (SIG) no SPSS maiores que 0.05, pois
Ho: h normalidade.
Em seguida:
1 )ANALYZE;
2 )DESCRITIVE STATISTICS;
3 )EXPLORE;
4 )Escolha as variveis que sero transferidas para Dependent list.
Clique [Plots]; selecione [Normality plots with tests]; e assinale
[Histogram]. Clique [Continue] e [OK;]

5)ANALYZE;
6 )REGRESSION;
7)LINEAR;
8)Em LINEAR REGRESSION, indicar a varivel dependente e as

variveis independentes. Marcar em METHOD: ENTER. Em


STATISTICS: Em REGRESSION COEFFICIENTS, marcar ESTIMATES,
CONFIDENCE INTERVALS, R-SQUARE CHANGE e DESCREPTIVES. Em
RESIDUAL, marcar DURBIN- WATSONCONTINUE;
9 )OK
Na tabela Model Summary:
Ver Durbin-Watson.
D 0 resduos positivamente autocorrelacionados.
D 2 resduos no so autocorrelacionados (erros
independentes, pressuposto)
D 4 resduos negativamente autocorrelacionados.
Teste da Existncia de Regresso
ANOVA
O valor-p=0,000 < 0,05; o que implica que a varivel
explicada/influenciada pelas variveis includas no modelo.
Poder de Explicao do Modelo: O coeficiente de
determinao ou explicao do modelo R2
Estimao dos Parmetros do Modelo
Tabela coeficientes a
Esta tabela d-nos os valores dos coeficientes estimados e a
sua respectiva significncia. Ver B e SIG para discutir.

1) Test Normality (para os dados);


2) Verificao da Independncia dos Erros (Teste
de Durbin-Watson) (para os dados) s o valor
de Durbin-Watson se estpa prx. de 2 ;
3) Teste da Existncia de Regresso (ANOVA b)
SIG;
4) Poder de Explicao do Modelo - Model
summary b (R2 square e Durbin-Watson);
5) Estimao dos Parmetros do Modelo
Coefficientsa (B e SIG)

MANOVA:

1)ANALYZE
2)GENERAL LINEAR MODEL
3 )MULTIVARIATE
4)Transfira as variveis dependentes (explicadas) para a
caixa DEPENDENT VARIABLES
5)Transfira as variveis independentes (explicativas) para a
caixa FIXED FACTOR
6)Clique

em

STATISTICS,

OPTIONS.
ESTIMATES

Assinale
OF

DESCRIPTIVE
EFFECT

SIZE,

PARAMETER ESTIMATES e HOMOGENEITY. Clique


CONTINUE.
7)Clique em POST HOC... Transfira a varivel independente
para a caixa POST HOC TESTS e, em EQUAL VARIANCE
ASSUMED, assinale a opo TUKEY. Clique CONTINUE.
Clique OK.
Tabela 1: Tamanho dos Grupos Between subject factors (maior que 30 de boassa);
Tabela 2: Teste de Igualdade da Matriz de Varinciacovarincia (Teste Boxs M com p > 0,01);
Tabela 3: Teste de Igualdade de Varincias
Univariados (Teste de Levene: se for sig a varincia
igual);
Tabela 4: Teste de Diferena de Mdias (Multivariate
test b) MANOVA MACRO ver o 4 ndices;
Tabela 5: Teste de Diferena de Mdias (Test of
Between subjects efects) MANOVA MICRO;
Tabela 6: Teste de Comparao Mltipla (Teste de
Tukey);

PCA Anlise dos componentes principais:


Teste de Esfericidade de Bartlett. 0,3 a 0,7 = correlao razovel, passando 9,0
problemas de colinearidade
Teste KMO
KMO

Anlise de componentes
principais
Ina cei t vel

< 0,50
0,5 0,60

0,6 0,70

Ra zo vel

0,7 0,80

Mdi a

0,8 0,90

Boa

0,9 1,00

Mui to boa
ou Admi r vel

1.
2.
3.
4.
5.

6.
7.

8.

9.
10.

ANALYZE
DATA REDUCTION
FACTOR
VARIABLES: indicar as variveis da anlise.Se estiverem em
escala diferentes, sugere-se que as padronize antes.
DESCRIPTIVES: Em STATISTICS, MARCAR INITIAL SOLUTION.
Em CORRELATION MATRIZ, marcar COEFFICIENTS e KMO E
BARTLETTS TEST OF SPHERICITYCONTINUE
METHOD: marcar PRINCIPAL COMPONENTS
EXTRACTION. Em METHOD, marcar CORRELATION MATRIX.
Em ANALYZE, marcar CORRELATION MATRIZ.EM EXTRACT.
Marcar EIGENVALUES OVER se desejar que a rodada fornea
todos as componetes principais possiveis de serem geradas
ou marcar NUMBER OF FACTOR se desejar que a rodada
fornea um nmero especfico de componentes principais. Em
DISPLAY, marcar UNROTATED FACTOR SOLUTION e SCREE
PLOT CONTINUE
ROTATION. Em METHOD, marcar VARIMAX. Em DISPLAY,
marcar
ROTATION
SOLUTION
e
LOADING
PLOT(S)CONTINUE
SCORES.Marcar a opo SAVED AS VARIABLES. Em METHOD,
marcar REGRESSIONCONTINUE
OPTIONS: deixar as marcaes default

11. OK

Observao: Ao marcar em DISPLAY a opo LOADING PLOT(S), se estar


indicando ao programa que gere o grfico de fatores ou de componentes
principais, ou simplesmente grfico de variveis.
Tabela 1: Matriz de Correlaes (Correlation Matrix)
Tabela 2: Teste de Esfericidade de Bartlett (Teste KMO)
Tabela 3: Comunalidades
Tabela 4: Total de Varincia Explicada
Grfico 2: scree plot (autovalores)
Tabela 5: Matriz de Componentes
Tabela 6: Matriz Rotada de Componentes
Grfico 3: Grfico das Variveis

Anlise Fatorial:
1.
2.
3.
4.
5.

6.
7.

8.

9.
10.
11.

ANALYZE
DATA REDUCTION
FACTOR
VARIABLES: indicar as variveis da anlise.Se estiverem em
escala diferentes, sugere-se que as padronize antes.
DESCRIPTIVES: Em STATISTICS, MARCAR INITIAL SOLUTION.
Em CORRELATION MATRIZ, marcar COEFFICIENTS e KMO E
BARTLETTS TEST OF SPHERICITYCONTINUE
METHOD: marcar PRINCIPAL COMPONENTS
EXTRACTION. Em METHOD, marcar CORRELATION MATRIX.
Em ANALYZE, marcar CORRELATION MATRIZ.EM EXTRACT.
Marcar EIGENVALUES OVER se desejar que a rodada fornea
todos os fatores gerados ou marcar NUMBER OF FACTOR se
desejar que a rodada fornea um nmero especfico de
fatores. Em DISPLAY, marcar UNROTATED FACTOR SOLUTION
e SCREE PLOT CONTINUE
ROTATION. Em METHOD, marcar VARIMAX. Em DISPLAY,
marcar
ROTATION
SOLUTION
e
LOADING
PLOT(S)CONTINUE
SCORES.Marcar a opo SAVED AS VARIABLES. Em METHOD,
marcar REGRESSIONCONTINUE
OPTIONS: deixar as marcaes default
OK

Observao: Ao marcar em DISPLAY a opo LOADING PLOT(S),se


estar indicando ao programa que gere o grfico de fatores ou de
componentes principais, ou simplesmente grfico de variveis.
Tabela 1: Matriz de Correlaes
Tabela 2: Teste de Esfericidade de Bartlett
(KMO e Bartlett)
Tabela 3: Comunalidades
Tabela 4: Total de Varincia Explicada
Grfico 2: Scree Plot
Tabela 5: Matriz de Fatores
Tabela 6: Matriz Rotada de Fatores

Cluster:

Cluster hierrquico Sequncia de Passos no SPSS

1.

ANALYZE;

2.

CLASSIFY;

3.

HIERARCHICAL CLUSTERS;

4.

Transferir as variveis de clusterizao para a caixa VARIABLE(S);

5.

Em PLOT, marcar DENDROGRAM;

6.

Em METHOD, marcar em CLUSTER METHOD a opo WARDS METHOD e,


em MEASURE, a opo "SQUARED EUCLIDEAN DISTANCE";

7.

CONTINUE;

8.

OK.

Observaes:

Com AGGLOMERATION SCHEDOLE, faz-se, com STAGE X


COEFFICIENTS, o GRFICO DOS COEFICIENTES DE FUSO,
no Excel;

Com VERTICAL ICICLE e DENDROGRAM tm-se a


informao do nmero de clusters latentes na base de dados.
Aps esta anlise e constatao, parte-se com o nmero de
clusters detectados, para a Anlise de Cluster Nohierrquico K-Means com o objetivo da classificao dos
objetos nos clusters gerados e outras estatsticas.

12-Sequncia da Anlise de Cluster No-Hierrquico

1) PADRONIZAO DAS VARIVEIS:


A seqncia para esta anlise de dados :
1.
2.
3.
4.
5.

DESCRIPTIVE STATISTICS;
DESCRIPTIVE;
Indicar as variveis a serem padronizadas;
Marcar SAVE STANDARDIZED VALUES AS VARIABLES;
OK

2)CLASSIFICAO OU CONGLOMERAO
A seqncia para esta anlise de dados :
1.
2.
3.
4.
5.
6.
7.
8.
9.

ANALYZE;
CLASSIFY;
K-MEANS CLUSTER;
VARIABLES: indicar as variveis de cluster;
NUMBER OF CLUSTER: indicar os nmeros de cluster desejado para
a conglomerao;
ITERATIVE: deixar os valores default;
SAVE: marcar CLUSTER MENBERSHIPCONTINUE;
OPTIONS : marcar INITIAL CLUSTER CENTER e CLUSTER
INFORMATION FOR EACH CASECONTINUE;
OK

3)GRFICOS DOS CLUSTERS (SCATER-PLOT)


A seqncia para esta anlise de dados
1.
2.
3.
4.
5.
6.
7.
8.

GRAPHS;
LEGACY DIALOGS;
SCATTER/DOT;
SIMPLE SCATTER;
DEFINE;
Y AXIS: indicar a varivel da ordenada;
X AXIS: indicar a varivel da abscissa;
SET MARKERS BY: indicar a varivel criada pela anlise de clusters
aps a rodada. Esta varivel classifica cada observao da base nos
clusters criados;
9. LABEL CASES BY: indicar a varivel que identifica cada case;
10. OPTIONS: marcar DISPLAY CHART WITH CASE LABELSCONTINUE;
11. OK

Para identificar os constituintes de cada cluster visualmente,


pode-se construir, alternativamente ao grfico de disperso de
cluster, um grfico de barras, seguindo os passos a seguir no SPSS:
1.

GRAPHS;

2.

LEGACY DIALOGS;

3.

BAR;

4.

STACKED: Em CATEGARY AXIS: inserir a varivel QCL_1(Cluster


number of case) criada pela anlise e inserida na base de dados. Em
DEFINE STACKS BY: inserir a varivel que identifica os cases;

OK

quadrado da distncia euclidiana e os seguintes mtodos:

Primeiro, um mtodo hierrquicomtodo aglomerativo


mtodo da varincia mtodo de ward para obter o
nmero de clusters e os formadores de cada um deles;
Depois, um mtodo no hierrquico para perfilar e ratificar os
clusters: particionamento otimizador.

Anlise de cluster hierrquico:


Tabela 1: Calendrio de Agregao (Aglomerattion Schedule)
Grfico 1: Grfico dos coeficientes de fuso (Exell)
Tabela 2: Diagrama Icicle (vertical icicle)
Grfico 2: Dendograma

Anlise de cluster no-hierrquico:


Tabela 1: Centrides (Final Clusters Center)
Tabela 2: Nmero de Casos em Cada Cluster (Number of
cases in each cluster)
Grfico 3: Grfico dos Objetos Identificados

Two Step Cluster:


Sequncia de Passos da Two Step Cluster

Para realizar a Two Step Cluster no SPSS, necessrio seguir a


seguinte sequncia de passos:

1.

ANALYZE;

2.

CLASSIFY;

3.

TWOSTEP CLUSTERS;

4.

Em CATEGORIAL VARIABLES, inserir as variveis qualitativas do modelo.


Em CONTINUOS VARIABLES, inserir as variveis quantitativas do
modelo;

5.

Em NUMBER OF CLUSTERS, se especificaro o nmero de clusters a se


criar. Se o analista desconhecer o nmero de clusters ideal a segmentar a
base de dados, assinar a opo DETERMINE AUTOMATICALLY. O
default gerar at 15 agrupamentos.

6.

Em PLOTS, assinalar as opes: WITHIN CLUSTERS PERCENTAGE


CHART, CLUSTERS PIE CHART. Em

VARIABLE IMPORTANCE PLOT,

assinalar RANK VARIABLES, em seguida marcar as alternativas RANK


VARIABLESBY

CLUSTER

ou

BY

VARIABLE,

MEASURECHI-SQUARE OR t-TEST OF SIGNIFICANCE

IMPORTNCE
e

CONFIDECE

LEVEL.
7.

CONTINUE;

8.

OK.

Para identificar os constituintes de cada cluster visualmente,


pode-se construir um grfico de barras seguindo os passos a seguir
no SPSS 15.00:
1.

GRAPHS;

2.

LEGACY DIALOGS;

3.

BAR;

4.

STACKED: Em CATEGARY AXIS: inserir a varivel two step


cluster criada pela anlise e inserida na base de dados. Em
DEFINE STACKS BY: inserir a varivel que identifica os cases.

Tabela 1: Distribuio dos Clusters


Grfico 1: Tamanho dos Clusters
Grfico 2: Importncia Relativa das Categorias nos Clusters
(Barra qualitativas e boxplot - quantitativas )
Grfico 3: Testes de Significncia (linha azul)

Anlise discriminante:
Para realizar a anlise discriminante no SPSS15.0, proceda
aos passos abaixo:

1.
2.
3.
4.

5.

6.
7.

8.

9.

10.

ANALYSE
CLASSIFY
DISCRIMINANT
GROUPING VARIABLE: indicar a varivel dependente da
pesquisa ou a varivel que forma os grupos.Cada observao
da base deve ser indicado o grupo a qual pertence.
DEFINE RANGE: indicar o intervalo de valores assumido pela
varivel dependente ou a numerao que discrimina os
grupos na base.Exemplo: se existem dois grupos
discriminantes: MIN: 1 e MAX: 2.
INDEPENDENTS: indicar as variveis independentes ou
prognosticadoras
Deixar marcada a opo ENTER INDEPENDENTS TOGETHER,
que implica em realizar a Anlise Discriminante Direta ou
STEPBACK.
STATISTICS: Em DESCRIPTIVES, marcar a opo MEANS. Em
FUNCTION COEFFICIENTS, marcar as opes FISHERS(se o
estudo envolver a anlise discriminante mltipla) e
UNSTANDARDIZED. Em MATRICES, marcar a opo WITHINGROUPS CORRELATION. CONTINUE
CLASSIFY. Em PRIOR PROBABILITIES, marcar ALL GROUPS
EQUAL. Em DISPLAY, marcar CASEWISE RESULTS, SUMMARY
TABLE
e
LEAVE-ONE-OUT-CLASSIFICATION. Em USE
COVARIANCE MATRIZ , marcar WITHIN-GROUPS. Em PLOTS,
marcar COMBINED-GROUPS CONTINUE
OK

Se a anlise discriminante for mltipla (com mais de dois grupos), a funo


FUNCTION COEFFICIENTS (FISHERS) importante para discriminao dos objetos
aos grupos.
Tabela 1: Resumo dos Resultados (Analisys Cases Processing Summary)
Tabela 2: Teste de Existncia de Multicolinearidade (Matriz de Correlaes) Pooled within
- groups matrices
Tabela 3: Poder de Explicao do Modelo Gerado - Tabelas dos Autovalores
(Eingenvalues)
Tabela 4: Teste de Significncia da Funo Discriminante ( de Wilks)
Tabela 5: Funo Discriminante Estimada - Tabela dos Coeficientes (Pesos) No
Padronizados (Brutos) (Canonical Discriminant Function Coefficients)
Tabela 6: Funo Discriminante Estimada - Tabela dos Coeficientes (Pesos) Padronizados:
Avaliao da Importncia das Variveis Explicativas em Termos Relativos (Standarized
Canonical Discriminant Function Coefficient)
Tabela 7: Tabelas das Correlaes Cannicas - Matriz Estruturante do Espao de Anlise
(Structure Matrix)
Tabela 8: Funo Classificao - Designao aos Grupos:
1o)Calcule o escore discriminante do cliente a ser classificado;
2o)Clculo dos centroides (tabela Functions at group centroid)

3o)Clculo do escore de corte: O escore de corte deve ser calculado pela


frmula:
a)Se o tamanho dos grupos forem iguais:
CGA + CGB
EC =
2
b)Se o tamanho dos grupos forem diferentes:
n ACGA + n B CGB
EC =
nA + nB
Onde: EC= escore de corte; n A e n B = tamanho dos grupos A e B , respectivamente
CGA e CGB= centrides respectivamente dos grupos A

4o)Classificao: Se FD > 0 ou

Se FD 0;

Tabela 9: Avaliao da Confiabilidade e Validade da Funo


Discriminante

Poder

Preditivo

da

Funo

(Designao aos Grupos classification results)

Discriminante

Você também pode gostar