Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTATÍSTICA II
SPSS
2016/2017
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
Estatística I - Revisões
Estatísticas sumárias
ANALYZE
DESCRIPTIVE STATISTICS
► FREQUENCIES
Dá-nos distribuições de frequências para todos os tipos de dados (não
agrupados) e ainda opções para estatísticas adicionais, gráficos de barras e
histogramas.
|1|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
Statistics
idade
N Valid 10
Missing 0
Mean 24,90
Median 22,00
Mode 22
Std. Deviation 6,773
Variance 45,878
Skewness 1,334
Std. Error of Skewness ,687
Kurtosis 1,635
Std. Error of Kurtosis 1,334
Range 22
Minimum 18
Maximum 40
25 19,75
Percentiles 50 22,00
75 30,00
|2|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
► DESCRIPTIVES
Os resultados são:
► EXPLORE
Além das várias medidas descritivas é ainda possivel calcular um intervalo de
confiança para a média. Se selecionar Plots pode ainda pedir o stem-and-leaf, o box-
and-whisker e o histograma.
|3|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
Descriptives
2,00 1. 89
5,00 2. 02226
2,00 3. 00
1,00 4. 0
Stem width: 10
Each leaf: 1 case(s)
|4|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
qual o caso outlier/extremo (no nosso exemplo não existem outliers de qualquer
espécie).
► CROSSTABS
Symmetric Measures
|5|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
Análise de Associações
ANALYZE
DESCRIPTIVE STATISTICS
CROSSTABS
Symmetric Measures
|6|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
ANALYZE
CORRELATE
BIVARIATE
Correlations
importância
atribuída ao
IDADE sol e praia
IDADE Pearson Correlation 1 -,643*
Sig. (2-tailed) , ,045
N 10 10
importância atribuída Pearson Correlation -,643* 1
ao sol e praia Sig. (2-tailed) ,045 ,
N 10 10
*. Correlation is significant at the 0.05 level (2-tailed).
|7|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
Estatística II - Inferência
ANALYZE
DESCRIPTIVE STATISTICS
EXPLORE
Descriptives
Statistic Std. Error
idade Mean 29,90 1,133
95% Confidence Interval for Lower Bound 27,58
Mean Upper Bound 32,22
5% Trimmed Mean 30,07
Median 31,50
Variance 38,507
Std. Deviation 6,205
Minimum 19
Maximum 38
Range 19
Interquartile Range 12
Skewness -,564 ,427
Kurtosis -1,045 ,833
|8|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
Pode pois afirmar-se, com uma confiança de 95%, que a totalidade dos alunos que
frequentam a disciplina de Análise de Mercado do mestrado em Marketing Digital,
apresentam uma idade média entre os 28 e os 32 anos.
H0: μ = 14
H1: μ < 14 (pois =12.7)
COMPARE MEANS
ONE-SAMPLE t-test
One-Sample Statistics
One-Sample Test
Test Value = 14
O One-Sample Test executado pelo SPSS é sempre um teste bilateral, logo, nos casos
em que pretendemos um teste unilateral, teremos que dividir a significância observada
por 2. Neste caso: = 0.0195. Para concluir quanto à rejeição, ou não, da
|9|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
hipótese nula só temos que comparar este valor com o nível de significância usado no
ensaio (a=0.05). O que conclui?
● Suponha agora que o docente considera que a “média da classificação final” obtida
pelos alunos na disciplina é de 13 valores. No entanto, após calcular a média final da
classificação dos 30 alunos, o docente verificou que esta se situava nos 14 valores. Será
que, face a este valor amostral, o docente poderá concluir que a classificação média
final obtida pelos alunos na disciplina é superior a 13 valores?
One-Sample Statistics
One-Sample Test
Test Value = 13
95% Confidence Interval of the
Difference
[Ficheiro: Descritivas-1.sav]
|10|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
ANALYZE
COMPARE MEANS
PAIRED-SAMPLES T TEST
ANALYZE
COMPARE MEANS
INDEPENDENT-SAMPLES T TEST
´
|11|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
ANOVA
Pressupostos:
|12|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
[Ficheiro: Dados-ANOVA1.sav]
ANALYZE
DESCRIPTIVE STATISTICS
EXPLORE
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
nacionalidade Statistic df Sig. Statistic df Sig.
importância da gastronomia na ingleses ,188 5 ,200* ,944 5 ,696
escolha do destino Algarve alemães ,186 6 ,200* ,960 6 ,818
espanhóis ,251 6 ,200* ,901 6 ,383
a. Lilliefors Significance Correction
*. This is a lower bound of the true significance.
ANALYZE
COMPARE MEANS
ONE-WAY ANOVA
|13|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
1,827 2 14 ,197
ANOVA
importância da gastronomia na escolha do destino Algarve
ANALYZE
DESCRIPTIVE STATISTICS
EXPLORE
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
nacionalidade Statistic df Sig. Statistic df Sig.
impvida_noc ingleses ,231 5 ,200* ,881 5 ,314
alemães ,293 6 ,117 ,822 6 ,091
espanhóis ,293 6 ,117 ,822 6 ,091
a. Lilliefors Significance Correction
*. This is a lower bound of the true significance.
ANALYZE
|14|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
COMPARE MEANS
ONE-WAY ANOVA
ANOVA
impvida_noc
Sum of Squares df Mean Square F Sig.
Between Groups 20,298 2 10,149 15,009 ,000
Within Groups 9,467 14 ,676
Total 29,765 16
Uma vez que se rejeita a hipótese nula de igualdade das médias, ter-se-á que averiguar
agora quais as amostras que apresentam diferenças estatisticamente significativas.
Para o efeito, em Post Hoc (menu ANOVA), deverá selecionar os testes de Tukey
(amostras de igual dimensão) e Scheffé (amostras de dimensão diferente):
Multiple Comparisons
Dependent Variable:impvida_noc
Mean Difference 95% Confidence Interval
(I) nacionalidade (J) nacionalidade (I-J) Std. Error Sig. Lower Bound Upper Bound
Tukey HSD ingleses alemães 2,533* ,498 ,000 1,23 3,84
espanhóis ,533 ,498 ,547 -,77 1,84
alemães ingleses -2,533* ,498 ,000 -3,84 -1,23
espanhóis -2,000* ,475 ,002 -3,24 -,76
espanhóis ingleses -,533 ,498 ,547 -1,84 ,77
alemães 2,000* ,475 ,002 ,76 3,24
Scheffe ingleses alemães 2,533* ,498 ,001 1,17 3,89
espanhóis ,533 ,498 ,576 -,83 1,89
alemães ingleses -2,533* ,498 ,001 -3,89 -1,17
espanhóis -2,000* ,475 ,003 -3,30 -,70
espanhóis ingleses -,533 ,498 ,576 -1,89 ,83
alemães 2,000* ,475 ,003 ,70 3,30
*. The mean difference is significant at the 0.05 level.
|15|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
N Mean
ingleses 5 4,20
alemães 6 1,67
espanhóis 6 3,67
Total 17 3,12
APLICAÇÃO:
Tests of Normality
Maq Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
1 ,250 5 ,200* ,922 5 ,542
2 ,291 5 ,193 ,910 5 ,465
Prod 3 ,174 5 ,200* ,972 5 ,886
4 ,208 5 ,200* ,929 5 ,593
5 ,300 5 ,161 ,864 5 ,245
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction
ANOVA
Prod
Sum of Squares df Mean Square F Sig.
Between Groups 658,160 4 164,540 1,747 ,179
Within Groups 1883,200 20 94,160
Total 2541,360 24
|16|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
No SPSS, o teste de Wilcoxon aparece apenas na sua versão para duas amostras
emparelhadas (2 Related Samples). Assim, para o utilizarmos com uma única amostra,
começamos por criar uma nova variável com todas as observações iguais ao valor em
teste (µ0).
Suponha que quer testar se metade dos turistas atribui uma classificação ao destino
Algarve superior a 4 (relembre que neste teste µ representa a mediana em vez da
média e que a mediana é o valor que está acima de 50% das observações e abaixo das
outras 50%).
H0: μ = 4
H1: μ ≠ 4
[Ficheiro Descritivas-1.sav]
Conforme referido acima, para usar este teste é necessário criar primeiro uma
constante com o valor em teste. Assim, crie no ficheiro uma nova variável “med” com
todos os valores = 4.
ANALYZE
NONPARAMETRIC TESTS
LEGACY DIALOGS
2 RELATED SAMPLES
Selecione as variáveis “classalg” e “med” para a caixa Test pair(s) list e selecione a
opção Wilcoxon (Clique na opção Options se pretender a análise descritiva e os
quartis).
|17|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
OUTPUT:
Ranks
N Mean Rank Sum of Ranks
med - classificação geral Negative Ranks 2a 3,00 6,00
atribuída ao algarve enquanto Positive Ranks 4b 3,75 15,00
destino turístico Ties 4c
Total 10
a. med < classificação geral atribuída ao algarve enquanto destino turístico
b. med > classificação geral atribuída ao algarve enquanto destino turístico
c. med = classificação geral atribuída ao algarve enquanto destino turístico
Test Statisticsa
med -
classificação geral
atribuída ao
algarve enquanto
destino turístico
Z -1,000b
Asymp. Sig. (2-tailed) ,317
a. Wilcoxon Signed Ranks Test
b. Based on negative ranks.
|18|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
Assumindo as seguintes variáveis como qualitativas (ordinais), vamos aplicar este teste
para averiguar se existem diferenças significativas entre a importância que os turistas
atribuem ao fator sol e praia ("Sopra"), quando escolhem o Algarve como destino de
férias (expetativa) e a avaliação que fazem deste mesmo atributo após a sua estadia
(“Clasopra”):
H0: μ1 = μ2 (µ representa a mediana em vez da média)
H1: μ1 ≠ μ2
ANALYZE
NONPARAMETRIC TESTS
LEGACY DIALOGS
2 RELATED SAMPLES
Ranks
N Mean Rank Sum of Ranks
a
classificação atribuída ao sol e Negative Ranks 2 4,00 8,00
praia - importância atribuída ao Positive Ranks 6b 4,67 28,00
sol e praia Ties 2c
Total 10
a. classificação atribuída ao sol e praia < importância atribuída ao sol e praia
b. classificação atribuída ao sol e praia > importância atribuída ao sol e praia
c. classificação atribuída ao sol e praia = importância atribuída ao sol e praia
Test Statisticsa
classificação atribuída ao sol e
praia - importância atribuída ao
sol e praia
Z -1,508b
Asymp. Sig. (2-tailed) ,132
a. Wilcoxon Signed Ranks Test
b. Based on negative ranks.
Que conclui?
|19|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
ANALYZE
NONPARAMETRIC TESTS
LEGACY DIALOGS
2 INDEPENDENT SAMPLES
OUTPUT:
Ranks
Test Statisticsa
Mann-Whitney U 10,000
Wilcoxon W 20,000
Z -,447
Asymp. Sig. (2-tailed) ,655
Exact Sig. [2*(1-tailed Sig.)] ,762b
|20|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
ANALYZE
NONPARAMETRIC TESTS
LEGACY DIALOGS
k INDEPENDENT TESTS
[Ficheiro: Dados-ANOVA1.sav]
OUTPUT:
Ranks
nacionalidade N Mean Rank
importância da gastronomia na ingleses 5 8,30
escolha do destino Algarve alemães 6 8,33
espanhóis 6 10,25
|21|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
Total 17
Test Statisticsa,b
importância da
gastronomia na
escolha do
destino Algarve
Chi-Square ,583
df 2
Asymp. Sig. ,747
a. Kruskal Wallis Test
b. Grouping Variable: nacionalidade
ANALYZE
DESCRIPTIVE STATISTICS
CROSSTABS
Rows sexo
Columns horario
Statistics Chi-square
|22|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
Chi-Square Tests
Asymp. Sig. (2- Exact Sig. (2- Exact Sig. (1-
Value df sided) sided) sided)
Pearson Chi-Square 2,010a 1 ,156
Continuity Correction b
1,077 1 ,299
Likelihood Ratio 2,027 1 ,155
Fisher's Exact Test ,257 ,150
Linear-by-Linear Association 1,943 1 ,163
N of Valid Cases 30
a. 0 cells (0,0%) have expected count less than 5. The minimum expected count is 5,13.
b. Computed only for a 2x2 table
O p-valor a considerar é 0.156, o que nos leva a concluir que a satisfação com o horário
não depende do sexo dos alunos.
|23|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
A empresa XXX pretende estudar a relação linear existente entre o volume de vendas
do produto XPTO (Y), o preço por ela praticado (X1) e o preço médio praticado pelos
concorrentes (X2). No ficheiro Dados-RLM1.sav encontra-se informação sobre o
volume de vendas do produto XPTO, o preço praticado pela empresa e o preço médio
praticado pela concorrência nos últimos 10 meses.
ANALIZE
REGRESSION
LINEAR
|24|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
O teste a aplicar é o teste F (k-1, n-k), que apresenta uma significância de 0.000 (<0.05).
Logo não podemos aceitar H0, i.e., pelo menos um dos parâmetros do modelo é
estatisticamente significante.
Coefficientsa
Model Unstandardized Standardized t Sig. Correlations
Coefficients Coefficients
B Std. Beta Zero- Partial Part
Error order
(Constant) 544,909 94,623 5,759 ,001
Preço praticado -22,442 3,719 -,665 -6,034 ,001 -,818 -,916 -,637
pela empresa (€)
1
Preço médio 6,597 1,383 ,526 4,769 ,002 ,718 ,874 ,504
praticado pela
concorrência (€)
a. Dependent Variable: Volume de vendas (milhares de euros)
que nos indica que o volume de vendas é inversamente relacionado com o preço
praticado pela empresa (X1) mas diretamente relacionado com o preço praticado pela
concorrência (X2).
Por último, é ainda este quadro que nos permite verificar se existe uma relação
significativa, na população, entre a variável dependente e cada uma das variáveis
independentes (teste de significância):
H0: β1 = 0 vs H1: β1 ≠ 0
H0: β2 = 0 vs H1: β2 ≠ 0
|25|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
● Linearidade
Esta hipótese estabelece que a relação entre a variável dependente e as variáveis
independentes é linear. A análise é feita através da observação gráfica com recurso a
diagramas de dispersão.
GRAPHS
LEGACY DIALOGS
SCATTER/DOT
SIMPLE
Conforme se observa em qualquer dos gráficos existe uma razoável associação linear
entre cada uma das variáveis independentes e a variável dependente, que é de 0,82 (
) para o “Preço médio praticado pela empresa” e de 0,72 ( ) para o
Preço médio praticado pelos concorrentes”, sendo que no 1º caso a associação é
negativa e no 2º é positiva, o que decorre da inclinação das retas e está em
conformidade com os sinais dos coeficientes de regressão.
|26|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
Tolerância<0.1
Multicolinearidade
VIF>10
Verifica-se que a tolerância para qualquer das variáveis é de 0,916, (>0.1) e assim
indicia a não multicolinearidade.
O VIF para qualquer das variáveis é 1,091, bem longe do valor limite, pelo que a
conclusão aponta para a inexistência de multicolinearidade.
Homocedasticidade
|27|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
GRAPHS
LEGACY DIALOGS
SCATTER/DOT
SIMPLE
Y Axis: ZRE_1
X Axis: PRE_1
Autocorrelação
Teste Durbin-Watson:
para valores próximos de 2, não existe autocorrelação;
para valores próximos de 0, existe autocorrelação positiva;
para valores próximos de 4, existe autocorrelação negativa.
LINEAR REGRESSION
STATISTCS
RESIDUALS
|28|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
DURBIN-WATSON
Model Summaryb
Adjusted R Std. Error of the
Model R R Square Square Estimate Durbin-Watson
1 ,960a ,922 ,900 8,35685 2,618
a. Predictors: (Constant), Preço médio praticado pela concorrência (euro), Preço
praticado pela empresa (euro)
b. Dependent Variable: Volume de vendas (milhares de euros)
Normalidade
A normalidade pode ser analisada através de gráficos do tipo Q-Q, ou através do teste
K-S (Kolmogorov-Smirnov) com a correção de Liliefors ou de Shapiro-Wilk,
respectivamente para amostras grandes e de pequena dimensão (n<30). Os comandos
são:
ANALYZE
DESCRIPTIVE STATISTICS
EXPLORE
Chamar a variável ZRE_1 para a Dependente List e em PLOTS pedir Normality plots with
Tests:
|29|
Escola Superior de Gestão Hotelaria e Turismo - Universidade do Algarve
|30|