Você está na página 1de 14

Licenciatura em

Gesto


Estatstica 2



Folhas de apoio s aulas de SPSS













Elizabeth Reis
2013/2014





_______________________________________________________________________ Estatstica 2 - 2013/2014 -
1
Questionrio

OPINIES E PREFERNCIAS EM JORNAIS SEMANRIOS

Gostaria de conhecer os seus hbitos de leitura jornalstica, e ter a sua opinio sobre alguns dos
jornais existentes no nosso mercado. Nesse sentido, pedia a sua colaborao para responder a
algumas questes!


I. Caracterizao Demogrfica

Sexo
0. F
1. M
Idade _____ Habilitaes
1.At Ensino Secundrio
2.Ensino Mdio e Superior


II. Hbitos de Leitura

A. leitor habitual de jornais?

1. Sim 0. No Terminar a entrevista.

B. Que tipo de jornais l?

1. S dirios Terminar e Agradecer a colaborao.
2. S semanrios Passar ao Grupo III.
3. Dirios e semanrios Passar questo C.


Relativamente ao jornais Dirios gostaria de lhe colocar algumas questes.

C. Quantos jornais dirios l em mdia por semana? ________

D. Quanto tempo dispende semanalmente com a leitura de jornais dirios? _____ minutos.

E. Dos jornais dirios que l qual aquele que globalmente prefere?

1. Dirio de Notcias
2. Pblico
3. Correio da Manh
4. A Capital
5. Outro Qual? _______________________________







_______________________________________________________________________ Estatstica 2 - 2013/2014 -
2

III. Preferncias de Consumo de Jornais Semanrios

Seguem-se agora algumas questes sobre jornais Semanrios.

1. Dos semanrios que l qual aquele que globalmente prefere?
1. Expresso
2. Semanrio
3. Sol
4. Outro Qual? ____________________________________

2. Aproximadamente quanto tempo dispende com a leitura do (semanrio preferido)?
_______ minutos.

3. Quando l o (semanrio preferido) costuma:
1. Dar uma vista de olhos
2. Ler algumas seces
3. Ler com ateno

4. Quantos jornais semanrios l em mdia por ms? _____.

5. Pensando no (semanrio preferido) qual a sua opinio relativamente aos seguintes
aspectos? Considere a seguinte escala de resposta:
1=Discordo, 2=Discordo, 3=No concordo nem discordo, 4=Concordo, 5=Concordo
Completamente completamente


1 2 3 4 5
a) L-se facilmente

b) Leitura agradvel

c) Assuntos/temas bem arrumados

d) Tem boa ilustrao (fotografias/desenhos)

e) A 1 pgina sugestiva

f) Formato adequado

g) Tamanho adequado (n pginas)

h) Periodicidade correcta

i) Papel de boa qualidade

j) Informao actualizada

k) Temas tratados de grande interesse


Terminar e Agradecer a colaborao.

Data ___/___/___ Hora _________ Durao da Entrevista _______ minutos
Observaes
_______________________________________________________________________________
_______________________________________________________________________________
Entrevistador: _____________________






_______________________________________________________________________ Estatstica 2 - 2013/2014 -
3

ANLISE EXPLORATRIA DE DADOS


Anlise exploratria da varivel P2: Tempo de leitura do semanrio

Analyze
Descriptive Statistics
Explore
Dependent List: P2
Display Both




Statistics
Descriptives
Confidence I nterval for Mean 95%









Plots
Boxplot:s Factor Levels Together
Descriptive: Steam-and-Leaf
Normality Plots with Tests











_______________________________________________________________________ Estatstica 2 - 2013/2014 -
4

OUTPUTS ______________________________________________________________________
Descriptives
88,70 4,512
79,75
97,65
86,56
75,00
2035,667
45,118
30
195
165
68
,708 ,241
-,455 ,478
Mean
Lower Bound
Upper Bound
95% Confidence Interval
for Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis
Tempo de leitura do
semanrio (minutos)
Statistic Std. Error

Intervalo de confiana a
95% para a mdia
populacional do tempo de
leitura do semanrio
|I
0,95
|

= |79,75; 97,65|


Quadro de medidas de
estatstica descritiva para a
varivel P
2
:
Medidas de localizao
de tendncia central:
mdia (Mean) e
mediana (Median);
Mdia aparada a 5%
(calcula-se eliminando
5% dos valores mais
baixos e 5% dos valores
mais elevados)
Medidas de disperso:
desvio padro (Std.
Deviation), varincia
(Variance), amplitude
do intervalo de variao
(Range), valores
minimo (Minimum) e
mximo (Maximum)
Medida de assimetria
(Skewness) e respectivo desvio
padro (Std. Error of
Skewness)

Coeficiente de assimetria g
1

( )( )
3 '
3 2
1
2 1 S n n
M n
g

=
com
( )
n
X X
M
n
i
i
3
1 3

=

=
e
( )
3
2
1 3 '
1
(
(
(
(
(

=

=
n
X X
S
n
i
i


g
1
= 0 distribuio simtrica
g
1
> 0 distribuio
assimtrica positiva (cauda
mais longa para o lado
direito)
g
1
< 0 distribuio
assimtrica negativa (cauda
mais longa para o lado
esquerdo)


Medida de achatamento ou curtose (Kurtosis) e
respectivo desvio padro (Std. Error of
Kurtosis)
( )
( )( )( )
( )
( )( ) 3 2
1
3
3 2 1
1
2
4 '
4 2
2


+
=
n n
n
S n n n
M n n
g
com
( )
n
X X
M
n
i
i
4
1 4

=

=
e
( )
4
2
1 4 '
1
(
(
(
(
(

=

=
n
X X
S
n
i
i

g
2
= 0 distribuio mesocrtica
g
2
> 0 distribuio leptocrtica (pontiaguda)
g
2
< 0 distribuio platicrtica (achatada)






_______________________________________________________________________ Estatstica 2 - 2013/2014 -
5
Tests of Normality
,178 100 ,000 ,916 100 ,000
Tempo de leitura do
semanrio (minutos)
Statistic df Sig. Statistic df Sig.
Kolmogorov-Smirnov
a
Shapiro-Wilk
Lilliefors Significance Correction
a.




Teste de K-S para a normalidade
populacional da varivel tempo de leitura do
semanrio (com correco de Lilliefors por se
desconhecerem os parmetros populacionais)

Hipteses
H
0
: X Normal (,o)
H
1
: X Normal (,o)

Estatstica do teste:

( ) ( ) ( ) ( ) { }
i i i i
n i
n
x S x F x S x F d =

=
; max
1
,..., 2 , 1


sendo ( ) x F a funo distribuio a testar e ( ) x S
a funo distribuio observada na amostra. A
tabela disponvel para este teste s exacta
quando a distribuio em teste contnua e
quando se concenhem os verdadeiros valores de
e o. Liliefors props uma correco s tabelas
de K-S que deve ser utilizada quando se compara
a distribuio de frequncias acumuladas das
observaes amostrais com uma distribuio
terica cujos parmetros foram estimadas a partir
da amostra.

Valor da estatstica do teste = 0,178
Graus de liberdade = 100

Nvel de significncia = 0,05

Regras de Deciso:
Se Sig (2-tailed) 0,05 Rejeitar H
0

Se Sig (2-tailed) > 0,05 No Rejeitar H
0


Deciso: 0,000 < 0,05 Rejeitar H
0
, ou seja,
rejeita-se que esta amostra tenha sido
recolhida de uma populao de leitores
cujo tempo mdio de leitura do
semanrio tem distribuio normal



Teste de Shapiro-Wilk para a normalidade
populacional da varivel tempo de leitura do
semanrio (apropriado para amostras de
pequena dimenso)

Hipteses
H
0
: X Normal (,o)
H
1
: X Normal (,o)

Estatstica do teste:
( )

= =

|
.
|

\
|
=
n
i
i
n
i
i i
X X X a W
1
2
2
1

em que X
i
so os valores da varivel ordenados
por ordem crescente e os a
i
so constantes
geradas a partir da mdia, varincia e covarincia
de n ordens com a distribuio Normal (0,1)
(valores tabelados).

Valor da estatstica do teste = 0,916
Graus de liberdade = 100

Nvel de significncia = 0,05

Deciso: 0,000 < 0,05 Rejeitar H
0








_______________________________________________________________________ Estatstica 2 - 2013/2014 -
6


Tempo de leitura do semanrio (minutos)

Tempo de leitura do semanrio (minutos) Stem-and-Leaf Plot

Frequency Stem & Leaf
9,00 3 . 000000000
12,00 4 . 555555555555
4,00 5 . 0000
19,00 6 . 0000000000000000000
8,00 7 . 55555555
,00 8 .
12,00 9 . 000000000000
6,00 10 . 555555
,00 11 .
12,00 12 . 000000000000
2,00 13 . 55
,00 14 .
6,00 15 . 000000
2,00 16 . 55
,00 17 .
6,00 18 . 000000
2,00 19 . 55

Stem width: 10
Each leaf: 1 case(s)
Grfico de caule e folhas: os
valores do caule
correspondem s dezenas
(Stem width: 10) e cada folha
representa 1 caso (Each leaf: 1
case)
6 leitores afirmam levar 180
minutos a ler o jornal
semanrio, 2 leitores levam
195 minutos,







_______________________________________________________________________ Estatstica 2 - 2013/2014 -
7

200 150 100 50 0
Observed Value
2
1
0
-1
-2
E
x
p
e
c
t
e
d

N
o
r
m
a
l
Normal Q-Q Plot of Tempo de leitura do semanrio (minutos)
200 150 100 50 0
Observed Value
0,4
0,2
0,0
-0,2
D
e
v

f
r
o
m

N
o
r
m
a
l
Detrended Normal Q-Q Plot of Tempo de leitura do semanrio (minutos)













































Grfico Q-Q: representa os quantis da distribuio amostral e os correspondentes valores
esperados se as observaes seguissem uma distribuio normal estandardizada. Para o
construir seguem-se os seguintes passos:
ordenar os valores observados x
j
por ordem crescente (x
(j)
)
a cada valor ordenado (x
(j)
) associar uma probabilidade igual a n j p
j
/ ) 5 , 0 (
) (
=
calcular os quantis esperados q
(j)
para cada p
(j)
a partir da distribuio normal padro
| |
) (
2
) (
2
) (
2
1
j
Z
q
j
p q Z P
e
j
= = s


}
t

representar graficamente os pares de valores (x
(j)
, q
(j)
)
quando os valores observados seguem uma distribuio prxima da normal os pares de
valores (x
(j)
, q
(j)
) formam uma linha prxima de uma recta (Grfico Normal Q-Q) e os desvios
em relao a essa recta so aleatrios em torno de zero, sem qualquer padro definido (Grfico
Detrended Normal)

Neste exemplo claro o afastamento da distribuio obervada em relao distribuio
normal: os pares de valores (observados, esperados) no representam uma linha recta e os
desvios formam um padro que indicia uma distribuio assimtrica positiva.







_______________________________________________________________________ Estatstica 2 - 2013/2014 -
8






Tempo de leitura do semanrio (minutos)
200
150
100
50
0





























Mximo
Q3 = 3 Quartil
Q1 = 1 Quartil
Minmo
Q2=Mediana
Grfico de Caixa e Bigodes:
Minimo = 30; 1 Quartil = 52,5; Mediana = 75; 3 Quartil = 120; Mximo = 195
(no existem valores extremos)

Os valores extremos podem ser:

Valores extremos moderados: valores X
i
tais que
(Q3 + 1,5 AIQ )< X
i
< (Q3 + 3 AIQ) ou
(Q1 - 1,5 AIQ) < X
i
< (Q1 - 3 AIQ)
(Identificados com o no output do SPSS)

Valores extremos severos: valores X
i
tais que
X
i
> (Q3 + 3 AIQ) ou X
i
< (Q1 - 3 AIQ)
(Identificados com * no output do SPSS)

AIQ = Amplitude
Interquatuis





_______________________________________________________________________ Estatstica 2 - 2013/2014 -
9




Anlise exploratria da varivel P2: Tempo de leitura do semanrio para os grupos feminino e masculino


Analyze
Descriptive Statistics
Explore
Dependent List: P2
Factor List: Sexo
Display Both




Statistics
Descriptives
Confidence I nterval for Mean 95%









Plots
Boxplot:s None
Normality Plots with Tests
Spread vs Level with Levene tests:
Untransformed










_______________________________________________________________________ Estatstica 2 - 2013/2014 -
10

OUTPUTS ______________________________________________________________________

Sexo

Case Processing Summary

Sexo
Cases
Valid Missing Total
N Percent N Percent N Percent
Tempo de leitura do
semanrio (minutos)
feminino
34 100,0% 0 ,0% 34 100,0%
masculino
66 100,0% 0 ,0% 66 100,0%

Descriptives
Sexo Statistic Std. Error
Tempo de leitura do
semanrio (minutos)
feminino Mean
78,53 7,278
95% Confidence Interval
for Mean
Lower Bound
63,72
Upper Bound
93,34
5% Trimmed Mean
75,59
Median
60,00
Variance
1800,802
Std. Deviation
42,436
Minimum
30
Maximum
180
Range
150
Interquartile Range
53
Skewness
,957 ,403
Kurtosis
,207 ,788
masculino Mean
93,94 5,646
95% Confidence Interval
for Mean
Lower Bound
82,66
Upper Bound
105,22
5% Trimmed Mean
92,21
Median
90,00
Variance
2104,242
Std. Deviation
45,872
Minimum
30
Maximum
195
Range
165
Interquartile Range
60
Skewness
,612 ,295
Kurtosis
-,625 ,582









_______________________________________________________________________ Estatstica 2 - 2013/2014 -
11
Tests of Normality

Sexo
Kolmogorov-Smirnov(a) Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Tempo de leitura do
semanrio (minutos)
feminino
,198 34 ,002 ,889 34 ,002
masculino
,164 66 ,000 ,926 66 ,001
a Lilliefors Significance Correction




Test of Homogeneity of Variance

Levene Statistic df1 df2 Sig.
Tempo de leitura do
semanrio (minutos)
Based on Mean
,699 1 98 ,405
Based on Median
,772 1 98 ,382
Based on Median and
with adjusted df
,772 1 92,928 ,382
Based on trimmed mean
,746 1 98 ,390



Teste de Levene para a igualdade de varincias populacionais da varivel tempo
de leitura do semanrio

Hipteses:
H
0
: o
2
1
= o
2
2

H
1
: o
2
1
o
2
2


Pressuposto: as amostras provm de populaes com distribuio normal e varincias
desconhecidas (que podem ser iguais ou diferentes); este pressuposto no se
verifica.

Deciso: Sig > (o=0,05) No Rejeitar H
0
: o
2
1
= o
2
2
, ou seja, no se rejeita que estas
amostras sejam retiradas de duas populaes com igual varincia

O output apresenta 4 testes para a homocesdasticidade:
o primeiro baseado na mdia (Based on Mean) pressupe normalidade das 2
populaes;
o segundo baseado na mediana (Based on Median) mais robusto face
violao do pressuposto de normalidade;
o terceiro baseado na mediana (Based on Median and with adjusted df)
introduz um ajustamento aos graus de liberdade;
o quarto baseado na mdia aparada (Based on trimmed mean) elimina o
efeito de eventuais valores extremos.







_______________________________________________________________________ Estatstica 2 - 2013/2014 -
12



Tempo de leitura do semanrio (minutos)



Normal Q-Q Plots
Observed Value
200 150 100 50 0
E
x
p
e
c
t
e
d

N
o
r
m
a
l
2
1
0
-1
-2
Normal Q-Q Plot of Tempo de leitura do semanrio (minutos)
for sexo= feminino




Observed Value
200 150 100 50 0
E
x
p
e
c
t
e
d

N
o
r
m
a
l
3
2
1
0
-1
-2
Normal Q-Q Plot of Tempo de leitura do semanrio (minutos)
for sexo= masculino



Detrended Normal Q-Q Plots

Observed Value
200 150 100 50 0
D
e
v

f
r
o
m

N
o
r
m
a
l
0,75
0,50
0,25
0,00
-0,25
Detrended Normal Q-Q Plot of Tempo de leitura do semanrio (minutos)
for sexo= feminino

Observed Value
200 150 100 50 0
D
e
v

f
r
o
m

N
o
r
m
a
l
0,4
0,2
0,0
-0,2
Detrended Normal Q-Q Plot of Tempo de leitura do semanrio (minutos)
for sexo= masculino











Grfico de caule e folhas:
os valores do caule
correspondem s dezenas
(Stem width: 10) e cada
folha representa 1 caso
(Each leaf: 1 case)





_______________________________________________________________________ Estatstica 2 - 2013/2014 -
13

Level
90 85 80 75 70 65 60
S
p
r
e
a
d
60
58
56
54
52
Spread vs. Level Plot of p2 by sexo
* Data transformed using P = 1
Slope = ,250



































Este grfico de Disperso vs Localizao compara as
medianas (Level) dos 2 grupos com as respectivas AIQ
(Spread); o valor da inclinao (Slope) d uma indicao
do tipo de transformao a fazer aos dados para que as
varincias se tornem mais semelhantes.

Este tipo de grfico pode tambm ser construdo com os
valores das mdias (Level) dos 2 grupos e os respectivos
desvios padro (Spread)

Você também pode gostar