Escolar Documentos
Profissional Documentos
Cultura Documentos
Gesto
Estatstica 2
Folhas de apoio s aulas de SPSS
Elizabeth Reis
2013/2014
_______________________________________________________________________ Estatstica 2 - 2013/2014 -
1
Questionrio
OPINIES E PREFERNCIAS EM JORNAIS SEMANRIOS
Gostaria de conhecer os seus hbitos de leitura jornalstica, e ter a sua opinio sobre alguns dos
jornais existentes no nosso mercado. Nesse sentido, pedia a sua colaborao para responder a
algumas questes!
I. Caracterizao Demogrfica
Sexo
0. F
1. M
Idade _____ Habilitaes
1.At Ensino Secundrio
2.Ensino Mdio e Superior
II. Hbitos de Leitura
A. leitor habitual de jornais?
1. Sim 0. No Terminar a entrevista.
B. Que tipo de jornais l?
1. S dirios Terminar e Agradecer a colaborao.
2. S semanrios Passar ao Grupo III.
3. Dirios e semanrios Passar questo C.
Relativamente ao jornais Dirios gostaria de lhe colocar algumas questes.
C. Quantos jornais dirios l em mdia por semana? ________
D. Quanto tempo dispende semanalmente com a leitura de jornais dirios? _____ minutos.
E. Dos jornais dirios que l qual aquele que globalmente prefere?
1. Dirio de Notcias
2. Pblico
3. Correio da Manh
4. A Capital
5. Outro Qual? _______________________________
_______________________________________________________________________ Estatstica 2 - 2013/2014 -
2
III. Preferncias de Consumo de Jornais Semanrios
Seguem-se agora algumas questes sobre jornais Semanrios.
1. Dos semanrios que l qual aquele que globalmente prefere?
1. Expresso
2. Semanrio
3. Sol
4. Outro Qual? ____________________________________
2. Aproximadamente quanto tempo dispende com a leitura do (semanrio preferido)?
_______ minutos.
3. Quando l o (semanrio preferido) costuma:
1. Dar uma vista de olhos
2. Ler algumas seces
3. Ler com ateno
4. Quantos jornais semanrios l em mdia por ms? _____.
5. Pensando no (semanrio preferido) qual a sua opinio relativamente aos seguintes
aspectos? Considere a seguinte escala de resposta:
1=Discordo, 2=Discordo, 3=No concordo nem discordo, 4=Concordo, 5=Concordo
Completamente completamente
1 2 3 4 5
a) L-se facilmente
b) Leitura agradvel
c) Assuntos/temas bem arrumados
d) Tem boa ilustrao (fotografias/desenhos)
e) A 1 pgina sugestiva
f) Formato adequado
g) Tamanho adequado (n pginas)
h) Periodicidade correcta
i) Papel de boa qualidade
j) Informao actualizada
k) Temas tratados de grande interesse
Terminar e Agradecer a colaborao.
Data ___/___/___ Hora _________ Durao da Entrevista _______ minutos
Observaes
_______________________________________________________________________________
_______________________________________________________________________________
Entrevistador: _____________________
_______________________________________________________________________ Estatstica 2 - 2013/2014 -
3
ANLISE EXPLORATRIA DE DADOS
Anlise exploratria da varivel P2: Tempo de leitura do semanrio
Analyze
Descriptive Statistics
Explore
Dependent List: P2
Display Both
Statistics
Descriptives
Confidence I nterval for Mean 95%
Plots
Boxplot:s Factor Levels Together
Descriptive: Steam-and-Leaf
Normality Plots with Tests
_______________________________________________________________________ Estatstica 2 - 2013/2014 -
4
OUTPUTS ______________________________________________________________________
Descriptives
88,70 4,512
79,75
97,65
86,56
75,00
2035,667
45,118
30
195
165
68
,708 ,241
-,455 ,478
Mean
Lower Bound
Upper Bound
95% Confidence Interval
for Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis
Tempo de leitura do
semanrio (minutos)
Statistic Std. Error
Intervalo de confiana a
95% para a mdia
populacional do tempo de
leitura do semanrio
|I
0,95
|
= |79,75; 97,65|
Quadro de medidas de
estatstica descritiva para a
varivel P
2
:
Medidas de localizao
de tendncia central:
mdia (Mean) e
mediana (Median);
Mdia aparada a 5%
(calcula-se eliminando
5% dos valores mais
baixos e 5% dos valores
mais elevados)
Medidas de disperso:
desvio padro (Std.
Deviation), varincia
(Variance), amplitude
do intervalo de variao
(Range), valores
minimo (Minimum) e
mximo (Maximum)
Medida de assimetria
(Skewness) e respectivo desvio
padro (Std. Error of
Skewness)
Coeficiente de assimetria g
1
( )( )
3 '
3 2
1
2 1 S n n
M n
g
=
com
( )
n
X X
M
n
i
i
3
1 3
=
=
e
( )
3
2
1 3 '
1
(
(
(
(
(
=
=
n
X X
S
n
i
i
g
1
= 0 distribuio simtrica
g
1
> 0 distribuio
assimtrica positiva (cauda
mais longa para o lado
direito)
g
1
< 0 distribuio
assimtrica negativa (cauda
mais longa para o lado
esquerdo)
Medida de achatamento ou curtose (Kurtosis) e
respectivo desvio padro (Std. Error of
Kurtosis)
( )
( )( )( )
( )
( )( ) 3 2
1
3
3 2 1
1
2
4 '
4 2
2
+
=
n n
n
S n n n
M n n
g
com
( )
n
X X
M
n
i
i
4
1 4
=
=
e
( )
4
2
1 4 '
1
(
(
(
(
(
=
=
n
X X
S
n
i
i
g
2
= 0 distribuio mesocrtica
g
2
> 0 distribuio leptocrtica (pontiaguda)
g
2
< 0 distribuio platicrtica (achatada)
_______________________________________________________________________ Estatstica 2 - 2013/2014 -
5
Tests of Normality
,178 100 ,000 ,916 100 ,000
Tempo de leitura do
semanrio (minutos)
Statistic df Sig. Statistic df Sig.
Kolmogorov-Smirnov
a
Shapiro-Wilk
Lilliefors Significance Correction
a.
Teste de K-S para a normalidade
populacional da varivel tempo de leitura do
semanrio (com correco de Lilliefors por se
desconhecerem os parmetros populacionais)
Hipteses
H
0
: X Normal (,o)
H
1
: X Normal (,o)
Estatstica do teste:
( ) ( ) ( ) ( ) { }
i i i i
n i
n
x S x F x S x F d =
=
; max
1
,..., 2 , 1
sendo ( ) x F a funo distribuio a testar e ( ) x S
a funo distribuio observada na amostra. A
tabela disponvel para este teste s exacta
quando a distribuio em teste contnua e
quando se concenhem os verdadeiros valores de
e o. Liliefors props uma correco s tabelas
de K-S que deve ser utilizada quando se compara
a distribuio de frequncias acumuladas das
observaes amostrais com uma distribuio
terica cujos parmetros foram estimadas a partir
da amostra.
Valor da estatstica do teste = 0,178
Graus de liberdade = 100
Nvel de significncia = 0,05
Regras de Deciso:
Se Sig (2-tailed) 0,05 Rejeitar H
0
Se Sig (2-tailed) > 0,05 No Rejeitar H
0
Deciso: 0,000 < 0,05 Rejeitar H
0
, ou seja,
rejeita-se que esta amostra tenha sido
recolhida de uma populao de leitores
cujo tempo mdio de leitura do
semanrio tem distribuio normal
Teste de Shapiro-Wilk para a normalidade
populacional da varivel tempo de leitura do
semanrio (apropriado para amostras de
pequena dimenso)
Hipteses
H
0
: X Normal (,o)
H
1
: X Normal (,o)
Estatstica do teste:
( )
= =
|
.
|
\
|
=
n
i
i
n
i
i i
X X X a W
1
2
2
1
em que X
i
so os valores da varivel ordenados
por ordem crescente e os a
i
so constantes
geradas a partir da mdia, varincia e covarincia
de n ordens com a distribuio Normal (0,1)
(valores tabelados).
Valor da estatstica do teste = 0,916
Graus de liberdade = 100
Nvel de significncia = 0,05
Deciso: 0,000 < 0,05 Rejeitar H
0
_______________________________________________________________________ Estatstica 2 - 2013/2014 -
6
Tempo de leitura do semanrio (minutos)
Tempo de leitura do semanrio (minutos) Stem-and-Leaf Plot
Frequency Stem & Leaf
9,00 3 . 000000000
12,00 4 . 555555555555
4,00 5 . 0000
19,00 6 . 0000000000000000000
8,00 7 . 55555555
,00 8 .
12,00 9 . 000000000000
6,00 10 . 555555
,00 11 .
12,00 12 . 000000000000
2,00 13 . 55
,00 14 .
6,00 15 . 000000
2,00 16 . 55
,00 17 .
6,00 18 . 000000
2,00 19 . 55
Stem width: 10
Each leaf: 1 case(s)
Grfico de caule e folhas: os
valores do caule
correspondem s dezenas
(Stem width: 10) e cada folha
representa 1 caso (Each leaf: 1
case)
6 leitores afirmam levar 180
minutos a ler o jornal
semanrio, 2 leitores levam
195 minutos,
_______________________________________________________________________ Estatstica 2 - 2013/2014 -
7
200 150 100 50 0
Observed Value
2
1
0
-1
-2
E
x
p
e
c
t
e
d
N
o
r
m
a
l
Normal Q-Q Plot of Tempo de leitura do semanrio (minutos)
200 150 100 50 0
Observed Value
0,4
0,2
0,0
-0,2
D
e
v
f
r
o
m
N
o
r
m
a
l
Detrended Normal Q-Q Plot of Tempo de leitura do semanrio (minutos)
Grfico Q-Q: representa os quantis da distribuio amostral e os correspondentes valores
esperados se as observaes seguissem uma distribuio normal estandardizada. Para o
construir seguem-se os seguintes passos:
ordenar os valores observados x
j
por ordem crescente (x
(j)
)
a cada valor ordenado (x
(j)
) associar uma probabilidade igual a n j p
j
/ ) 5 , 0 (
) (
=
calcular os quantis esperados q
(j)
para cada p
(j)
a partir da distribuio normal padro
| |
) (
2
) (
2
) (
2
1
j
Z
q
j
p q Z P
e
j
= = s
}
t
representar graficamente os pares de valores (x
(j)
, q
(j)
)
quando os valores observados seguem uma distribuio prxima da normal os pares de
valores (x
(j)
, q
(j)
) formam uma linha prxima de uma recta (Grfico Normal Q-Q) e os desvios
em relao a essa recta so aleatrios em torno de zero, sem qualquer padro definido (Grfico
Detrended Normal)
Neste exemplo claro o afastamento da distribuio obervada em relao distribuio
normal: os pares de valores (observados, esperados) no representam uma linha recta e os
desvios formam um padro que indicia uma distribuio assimtrica positiva.
_______________________________________________________________________ Estatstica 2 - 2013/2014 -
8
Tempo de leitura do semanrio (minutos)
200
150
100
50
0
Mximo
Q3 = 3 Quartil
Q1 = 1 Quartil
Minmo
Q2=Mediana
Grfico de Caixa e Bigodes:
Minimo = 30; 1 Quartil = 52,5; Mediana = 75; 3 Quartil = 120; Mximo = 195
(no existem valores extremos)
Os valores extremos podem ser:
Valores extremos moderados: valores X
i
tais que
(Q3 + 1,5 AIQ )< X
i
< (Q3 + 3 AIQ) ou
(Q1 - 1,5 AIQ) < X
i
< (Q1 - 3 AIQ)
(Identificados com o no output do SPSS)
Valores extremos severos: valores X
i
tais que
X
i
> (Q3 + 3 AIQ) ou X
i
< (Q1 - 3 AIQ)
(Identificados com * no output do SPSS)
AIQ = Amplitude
Interquatuis
_______________________________________________________________________ Estatstica 2 - 2013/2014 -
9
Anlise exploratria da varivel P2: Tempo de leitura do semanrio para os grupos feminino e masculino
Analyze
Descriptive Statistics
Explore
Dependent List: P2
Factor List: Sexo
Display Both
Statistics
Descriptives
Confidence I nterval for Mean 95%
Plots
Boxplot:s None
Normality Plots with Tests
Spread vs Level with Levene tests:
Untransformed
_______________________________________________________________________ Estatstica 2 - 2013/2014 -
10
OUTPUTS ______________________________________________________________________
Sexo
Case Processing Summary
Sexo
Cases
Valid Missing Total
N Percent N Percent N Percent
Tempo de leitura do
semanrio (minutos)
feminino
34 100,0% 0 ,0% 34 100,0%
masculino
66 100,0% 0 ,0% 66 100,0%
Descriptives
Sexo Statistic Std. Error
Tempo de leitura do
semanrio (minutos)
feminino Mean
78,53 7,278
95% Confidence Interval
for Mean
Lower Bound
63,72
Upper Bound
93,34
5% Trimmed Mean
75,59
Median
60,00
Variance
1800,802
Std. Deviation
42,436
Minimum
30
Maximum
180
Range
150
Interquartile Range
53
Skewness
,957 ,403
Kurtosis
,207 ,788
masculino Mean
93,94 5,646
95% Confidence Interval
for Mean
Lower Bound
82,66
Upper Bound
105,22
5% Trimmed Mean
92,21
Median
90,00
Variance
2104,242
Std. Deviation
45,872
Minimum
30
Maximum
195
Range
165
Interquartile Range
60
Skewness
,612 ,295
Kurtosis
-,625 ,582
_______________________________________________________________________ Estatstica 2 - 2013/2014 -
11
Tests of Normality
Sexo
Kolmogorov-Smirnov(a) Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Tempo de leitura do
semanrio (minutos)
feminino
,198 34 ,002 ,889 34 ,002
masculino
,164 66 ,000 ,926 66 ,001
a Lilliefors Significance Correction
Test of Homogeneity of Variance
Levene Statistic df1 df2 Sig.
Tempo de leitura do
semanrio (minutos)
Based on Mean
,699 1 98 ,405
Based on Median
,772 1 98 ,382
Based on Median and
with adjusted df
,772 1 92,928 ,382
Based on trimmed mean
,746 1 98 ,390
Teste de Levene para a igualdade de varincias populacionais da varivel tempo
de leitura do semanrio
Hipteses:
H
0
: o
2
1
= o
2
2
H
1
: o
2
1
o
2
2
Pressuposto: as amostras provm de populaes com distribuio normal e varincias
desconhecidas (que podem ser iguais ou diferentes); este pressuposto no se
verifica.
Deciso: Sig > (o=0,05) No Rejeitar H
0
: o
2
1
= o
2
2
, ou seja, no se rejeita que estas
amostras sejam retiradas de duas populaes com igual varincia
O output apresenta 4 testes para a homocesdasticidade:
o primeiro baseado na mdia (Based on Mean) pressupe normalidade das 2
populaes;
o segundo baseado na mediana (Based on Median) mais robusto face
violao do pressuposto de normalidade;
o terceiro baseado na mediana (Based on Median and with adjusted df)
introduz um ajustamento aos graus de liberdade;
o quarto baseado na mdia aparada (Based on trimmed mean) elimina o
efeito de eventuais valores extremos.
_______________________________________________________________________ Estatstica 2 - 2013/2014 -
12
Tempo de leitura do semanrio (minutos)
Normal Q-Q Plots
Observed Value
200 150 100 50 0
E
x
p
e
c
t
e
d
N
o
r
m
a
l
2
1
0
-1
-2
Normal Q-Q Plot of Tempo de leitura do semanrio (minutos)
for sexo= feminino
Observed Value
200 150 100 50 0
E
x
p
e
c
t
e
d
N
o
r
m
a
l
3
2
1
0
-1
-2
Normal Q-Q Plot of Tempo de leitura do semanrio (minutos)
for sexo= masculino
Detrended Normal Q-Q Plots
Observed Value
200 150 100 50 0
D
e
v
f
r
o
m
N
o
r
m
a
l
0,75
0,50
0,25
0,00
-0,25
Detrended Normal Q-Q Plot of Tempo de leitura do semanrio (minutos)
for sexo= feminino
Observed Value
200 150 100 50 0
D
e
v
f
r
o
m
N
o
r
m
a
l
0,4
0,2
0,0
-0,2
Detrended Normal Q-Q Plot of Tempo de leitura do semanrio (minutos)
for sexo= masculino
Grfico de caule e folhas:
os valores do caule
correspondem s dezenas
(Stem width: 10) e cada
folha representa 1 caso
(Each leaf: 1 case)
_______________________________________________________________________ Estatstica 2 - 2013/2014 -
13
Level
90 85 80 75 70 65 60
S
p
r
e
a
d
60
58
56
54
52
Spread vs. Level Plot of p2 by sexo
* Data transformed using P = 1
Slope = ,250
Este grfico de Disperso vs Localizao compara as
medianas (Level) dos 2 grupos com as respectivas AIQ
(Spread); o valor da inclinao (Slope) d uma indicao
do tipo de transformao a fazer aos dados para que as
varincias se tornem mais semelhantes.
Este tipo de grfico pode tambm ser construdo com os
valores das mdias (Level) dos 2 grupos e os respectivos
desvios padro (Spread)