Você está na página 1de 9

Exerccios propostos

1 - Construo de uma base de dados e gesto de dados


Construa uma base de dados no SPSS com as seguintes variveis:
Processo - n do processo do doente
Sexo sexo do doente:
1-Feminino 2 Masculino 9-sem informao (missing value)
Diasuci - n de dias que esteve na UCI
999- sem informao (missing value)
Diashosp - n de dias que esteve no hospital (incluindo os dias na UCI)
999- sem informao (missing value)
Idade idade do doente
999- sem informao (missing value)
1.1- Introduza os seguintes dados na base de dados:

processo

sexo

654276

Feminino

12

23

645453 Masculino

33

388735

Feminino

34

345243 Masculino

12

798678 Masculino

55

132654 Masculino

987345

Feminino

67

928292 Masculino

89

876678

33

449049

Feminino

11

454121

Feminino

56

201251 Masculino

25

121258 Masculino

11

201258

Feminino

21

222108 Masculino

25

958762

Feminino

32

201254 Masculino

12

25

879820

Feminino

15

78

210254

Feminino

36

120125 Masculino

12

1-

diasuci diashosp idade

inserir os dados.

1.2- Recodifique a varivel idade nas seguintes categorias:


1-<18anos 2-18-60 anos 3->60 anos 9-sem informao (missing value)
2-

Transform>Recode>Into Different Variables (idadecat)

1.3- Crie uma varivel com o n de dias que o doente esteve no hospital sem contar os dias que
esteve na UCI.
3-

Transform>Compute

(diashosp diasUCI =diassoft)

2 - Estatstica descritiva usando o SPSS


A base de dados alcool.sav contm informao sobre os hbitos tabgicos e alcoolicos de mulheres
durante a gravidez. Esta base de dados contm tambm variveis que caracterizam as mulheres e
os recm nascidos.
2.1. Classifique todas as variveis da base de dados em contnuas, categricas nominais e
categricas ordinais.
1- sernum-contnua
mage-categrica ordinal
tbalc-contnua
tealc-contnua
ncignow-categrica ordinal
ncigpreg-categrica ordinal
ncigb4-categrica ordinal
typeduc-categrica nominal
emplnow-categrica nominal
lookwrk-categrica nominal
mwt0-contnua
prevpreg-categrica nominal
mwtadm-contnua
mht-categrica ordinal
pht-contnua
gestus-contnua
gestlmp-contnua
abortion-categrica nominal
sex-categrica nominal
birthwt-contnua
chl-contnua
apgar1-contnua
apgar5-contnua
fabnorm-categrica nominal
gest-categrica ordinal

Fre
un
q
y
c

p
n
g
re
y
c
n
0la
5
ta
o
ou
m
to
n
0fa
1
o
lc
0h
5
1
l/w
o
0e
2
in
k
0e
r250ly
a
0N
3
8
4
=
n9
a
e
M
.D
td
S
4,9
,6
1
3
5
v.=
e
7
8
00
1
0T
00
2
0
3
0

H
gra
to
is
m

2.2. Descreva graficamente e com medidas de sumrio as seguintes variveis:


tealc: Total amount of alcohol/week in early pregnancy
typeduc: Educational establishment last attended
birthwt: Birth weight
Justifique a escolha das medidas de sumrio para cada uma das variveis.

Analyse>Descriptive Statistics>Frequencies
(o grfico um histograma porque a varivel contnua)

tealc distribuio no normal => mediana

re
F
nc
u
q
y

c
u
d
nm
tio
bSeollis
ta
s
le
m
h
sscholta
tla
n
nTertiad
e
eyeducation
ofo
N
0
l/sE
a
rm
aP
rm
o
n
b
u
rile
c.a
u
d
rysch
a
rye
a
d
n
co
0
5
0
1
0
5
1
0
2
0
5
2
3

du
E
tio
a
c
le
a
n
lis
b
ta
s
en
m
h
sta
tla
nd
e
e

Analyse>Descriptive Statistics>Frequencies
(o grfico de barras porque a varivel categrica)

typeduc distribuio normal => mdia

re
F
nc
u
q
y

0
02
1
0B
30
0
irth
h40t5060N
ig
e
w
n3
a
M
e
.D
td
S
6
4
=
,v.=
6
2
55
6
1
0
1
0
2
0
3
0
4
0
5
0
6

tog
is
H
m
ra

Analyse>Descriptive Statistics>Frequencies
(o grfico um histograma porque a varivel contnua)

birthwt - distribuio normal => mdia


2.3. Recodifique a varivel birthwt na varivel pesorn
pesorn: peso do recm nascido (1- menos de 2500gr, 2-2500gr ou mais)
3

- Transform>Recode>Into Different Variables (pesorn)

2.4. Descreva graficamente e com uma tabela a nova varivel criada (pesorn)

Valid

<2500
>=2500
Total

Frequency
37
452

Percent
7,6
92,4

Valid Percent
7,6
92,4

489

100,0

100,0

Cumulative
Percent
7,6
100,0

re
F
cy
n
u
q

2p
e
0s
5
dre
o
m

c
id>=250o
c
s
a
n
0<
0
1
0
2
0
3
4
0p
5
es
dre
o
m

c
cid
s
a
n
o

peso do recm nascido

2.5. Faa um histograma da varivel mwt0: Maternal weight before pregnancy.


Ser que todos os valores parecem possveis? Coloque como caso(s) omisso(s) o(s) valor(es) que no
lhe paream possveis. Volte a fazer o histograma. Que medida pensa ter sido mais afectada com
o(s) dado(s) errado(s), a mdia ou a mediana?

re
F
nc
u
q
y

rn
te
ig
e
e
tb
p
re
a
n
g
e
y
c
,M
0
0a
2
,0lw
,h
0
4
0fo
6
,0r
,n
0
8
0N
1
=
,4
0
9
8
e
M
td
S
51
n
a
v=
e
.D
41
7
,0
2
0
2
0
4
0
6
0H
8
gra
to
is
m

re
F
nc
u
q
y

,M
0
3
,5
0
4
0
rnlw
te
a
0
6
ig
e
,h
0
7
e
tb
,fo
0
8
p
re
,r
0
9
a
n
g
e
,n
0
1
y
c
,N
,.D
0
e
M
td
S
=
9
5
n
a
=
v
e
8,2
4
7
8
6
5
1
0
1
0
2
3
0
4
0
5
6H
gra
to
is
m

antes

e depois
mdia= 59,174
mediana= 57,000

mdia= 59,287
= 0,123
mediana= 57,250 = 0,250
0,250>0,123 =>mediana + afectada

3 - Intervalos de confiana usando o SPSS


A base de dados alcool.sav contm informao sobre os hbitos tabgicos e alcoolicos de mulheres
durante a gravidez. Esta base de dados contm tambm variveis que caracterizam as mulheres e
os recm nascidos.
1. Qual o peso mdio dos recm nascidos desta amostra? E qual o intervalo de confiana a 95%
para a mdia dos recm nascidos? Interprete este intervalo de confiana.
Mdia = 3263,23. IC = [3212,62; 3313,83]. Com 95% de certeza pode-se afirmar que o peso mdio dos
recm nascidos na populao encontra-se entre 3212,62 e 3313,83 gramas.

xo
e
S
fba
y
b

B
w
irth
ht
ig
e

le F
a
M
e3
le
a
m
00
1
03
5
8
3
7
8
2
5
8
2
0
2
0
50
82
4
6
1
3
1
0
4
0
3
0
0
4
0
0
5
0
2
6
1
9
5
4
6
0
0

2. Represente graficamente os intervalos de confiana a 95% para a mdia do peso dos recm
nascidos do sexo masculino e feminino. Sendo esta amostra representativa dos recm nascidos
portugueses, ser que se pode inferir que os recm nascidos do sexo masculino so mais pesados em
mdia que os recm nascidos do sexo feminino? Justifique a sua resposta.

No, uma vez que os intervalos de confiana se interceptam, isto ,


a diferena entre as mdias no estatisticamente significativa.
3. Entre que valores de peso em gramas se encontram aproximadamente 95% dos recm nascidos
desta amostra?
[mdia-2*desvio padro; mdia+2*desvio padro] =
= [3263,23-2*553,516;3263,23+2*553,516] = [2156,198;4370,262]
4 - Teste t (amostras emparelhadas) e teste de Wilcoxon
Um investigador props uma nova dieta para doentes com histria familiar de doena coronria.
Para testar a sua eficcia 51 doentes com histria familiar de doena coronria cumpriram esta
dieta durante 6 meses. Para alm da idade e do sexo dos doentes registou-se tambm na base de

dados dieta.sav o valor dos triglicerdeos antes e depois da dieta. Teste a hiptese de que a dieta
realmente eficaz:
1. Defina a hiptese nula?
Hiptese nula -> os valores de triacilglicerdeos antes e depois da dieta so iguais, i. e., x(tg4)x(tg0)=0.

2. Que teste deve usar? Justifique.


diferenas
20

Frequency

10

Std. Dev = 17,92


Mean = -5,9
N = 51,00

0
-50,0

-30,0

-40,0

-10,0

-20,0

10,0
0,0

30,0
20,0

diferenas

melhor usar o teste t para grupos relacionados.


- teste paramtrico, (t) pq a lista resultante da diferena entre as duas listas prvias uma
distribuio normal (n completamente enviezada);
- para grupos relacionados, pq nas amostras usadas os elementos amostrais so os mesmos
(do gnero: antes e depois).
3. Qual o valor mdio de triglicerdeos antes e depois da dieta nos 51 doentes estudados?
Mdia de triglicerdeos antes da dieta 139,35;
Mdia de triglicerdeos depois da dieta 133,43.
4. Qual a diferena das mdias de triglicerdeos antes e depois da dieta nos 51 doentes estudados?
diferena das mdias de triglicerdeos - 5,92.
5. Qual o intervalo de confiana a 95% para esta diferena de mdias?
IC = [0,88; 10,96].
7. Qual o valor da estatstica do teste?
t = 2,360.
6. Qual o valor de p associado estatstica do teste?
p = 0,022.
7. A diferena de mdias encontrada estatsticamente significativa? Justifique usando o valor de p.
. Como p<significncia(0,05), posso recusar a hiptese nula.
8. A diferena de mdias encontrada estatsticamente significativa? Justifique usando o intervalo
de confiana a 95% para a diferena de mdias de trigicerdeos antes e depois da dieta.
. Como o IC das amostras emparelhadas no contm 0 (IC = [0,88; 10,96]; Ho : mdia antes

mdia depois = 0) posso recusar a hiptese nula.


5 - Testes t (one sample and independente samples) e Mann-Whitney.
A base de dados alcool.sav contm informao sobre os hbitos tabgicos e alcoolicos de mulheres
durante a gravidez. Esta base de dados contm tambm variveis que caracterizam as mulheres e
os recm nascidos. Considerando esta amostra representativa da populao de mulheres
portuguesas que acabaram de ter um filho, responda s seguintes perguntas:
1. Depois de retirar o valor 4 (que se trata de um erro de recolha de dados) da varivel MWT0:
Maternal weight before pregnancy:
a) diga qual a diferena entre a mdia do peso antes da gravidez das mes que j tiverem um filho
anteriormente (Multiparas) e a mdia do peso antes da gravidez das mes que tiveram o seu
primeiro filho (Primiparas).
mdia Multparas = 60,381
mdia Primparas = 56,958
b) A diferena encontrada em a) estatsticamente significativa? Justifique indicando o valor de p e
justifique indicando o intervalo de confiana para a diferena das mdias.
Sig do teste de Levene < 0,05 => recusa-se as varincias como sendo =s; sig do teste t < 0,05
Diferena de mdias (0) no pertence a IC
=> recusa-se a a hiptese nula.
c) Teste a hiptese de que o peso mdio das mulheres portuguesas antes da gravidez de 60 kg. Ser
que pode rejeitar esta hiptese? justifique.
Mdia da amostra = 59,287. H0 : mdia na populao = 60 Kg.
p = 0,181 => no se pode rejeitar a H0.
2. Podemos afirmar que h diferenas estatsticamente significativas entre o consumo de alcool
durante a gravidez (TEALC) entre as mulheres que abortaram e as que no abortaram
(ABORTION)? Que teste usou para responder a esta pergunta e porqu?
ue
q
re
F
y
c
n

l0p
ta
o
T
r10m
t150e
n
u
o
y
c
a
n
g
h20o
flo
k250in
e
l/w
rlyN=489Std.DevM
a
e
0
01
3
n
a
4
,6
7
8
9
3
5
.=
05
1
0
2
0
3

Distribuio enviezada => teste no paramtrico - Mann-Whitney U (2 grupos


independentes)
p =0,150 > 0,05 => no h diferenas estatisticamente significativas
6 - One-way ANOVA e Kruskal Wallis H test com o SPSS.
A base de dados alcool.sav contm informao sobre os hbitos tabgicos e alcoolicos de mulheres
durante a gravidez. Esta base de dados contm tambm variveis que caracterizam as mulheres e
os recm nascidos. Considerando esta amostra representativa da populao de mulheres
portuguesas que acabaram de ter um filho, responda s seguintes perguntas:
1. Depois de retirar o valor 4 (que se trata de um erro de recolha de dados) da varivel MWT0:
Maternal weight before pregnancy:
a) diga quais so as mdias do peso antes da gravidez das mes que antes da gravidez no
fumavam, que fumavam menos de 10 cigarros por dia e que fumavam 10 ou mais cigarros por dia.
Mdia 0 = 3314,48 g
Mdia <10 = 3265,29 g

Mdia >=10 = 3196,67 g


b) Haver diferenas estatsticamente significativas entre as mdias do peso das mes antes da
gravidez nos trs grupos referidos em a)? Justifique.
Teste usado ANOVA (varivel contnua X varivel categrica)
p = 0,674 => no h diferenas estatsticamente significativas.
2. Podemos afirmar que h diferenas estatsticamente significativas no consumo de alcool durante
a gravidez (TEALC) entre as mulheres dos seguintes grupos etrios: [13-20] anos, [21-30] anos, [3135] anos e [36-55] anos?
No se trata de mdias e varivel contnua X varivel categrica => teste de Kruskall-Wallis
P = 0,315 > 0,05 => no h diferenas estatsticamente significativas.
7 - Teste do qui-quadrado com o SPSS.
A base de dados alcool.sav contm informao sobre os hbitos tabgicos e alcoolicos de mulheres
durante a gravidez. Esta base de dados contm tambm variveis que caracterizam as mulheres e
os recm nascidos. Considerando esta amostra representativa da populao de mulheres
portuguesas que acabaram de ter um filho, responda s seguintes perguntas:
1a. Obtenha uma tabela que lhe permita observar qual o consumo de tabaco no incio da gravidez
(CIGPREG), em funo do grupo etrio da me (MAGE).
Number of cigarettes smoked per day in early pregnancy * Mother's age Crosstabulation
Mother's age
13-20 Years
Number of
cigarettes smoked
per day in early
pregnancy

% within Number of cigarettes


smoked per day in early
pregnancy
% within Mother's age
1-9

>10

Total

21-30 Years

31-35 Years

36-55 Years

Count

Count

13

251

94

59

3,1%

60,2%

22,5%

14,1%

61,9%

83,1%

93,1%

95,2%

27

% within Number of cigarettes


smoked per day in early
pregnancy

11,1%

75,0%

11,1%

2,8%

% within Mother's age

19,0%

8,9%

4,0%

1,6%

Count

24

% within Number of cigarettes


smoked per day in early
pregnancy

12,1%

72,7%

9,1%

6,1%

% within Mother's age

19,0%

7,9%

3,0%

3,2%

21

302

101

62

4,3%

62,1%

20,8%

12,8%

100,0%

100,0%

100,0%

100,0%

Count
% within Number of cigarettes
smoked per day in early
pregnancy
% within Mother's age

1b. Qual a % de mes fumadoras no grupo etrio do 13 aos 20 anos? e no que no grupo etrio dos
36 aos 55 anos?

% mes fumadoras 13-20 anos = 11,6%


% mes fumadoras 36-55 anos = 4,3%
2. Podemos dizer que existe uma relao estatsticamente significativa entre o consumo de tabaco e
a idade das mes? Justifique.
S 12,5% das clulas tem um expected count (dentro das propores esperadas) < 5, logo h 87,5% >= 5,
que maior do que os 80% mnimos exigidos para fazer o teste do Qui-quadrado (no caso de serem s 4
clulas no total todas tinham de ter valores esperados > 5).
Assim fez-se o teste do Qui-quadrado, que d > 1, o que significa que h evidncias contra a H0.
Como o valor de p < 0,05, possvel afirmar que h evidncias suficientes para rejeitar a H0.
8 - Testes de hiptese - reviso
A base de dados ensino.sav contm informao sobre internamentos numa Unidade de Cuidados
Intensivos (UCI). Responda s seguintes questes:
1. Haver diferenas estatsticamente significativas no ndice de gravidade (SAPS) dos doentes
internados entre o grupo dos falecidos na UCI e o grupo dos sobreviventes (RESULTADO)?
Justifique. Diga tambm, justificando, que teste de hiptese usou.
H0 : a mdia1 e a mdia2 so iguais na populao (1=2) cuja amostra representativa (=> amostra
aleatria).
P significativo (<0,05) => estatisticamente significativo o resultado que obtive => permite extrapolar
para a populao cuja amostra representativa.
Varivel Contnua x Dicotmica e
Distribuio normal na amostra => teste t para 2 grupos independentes.
2. Haver diferenas estatsticamente significativas no tempo de internamento na UCI
(TEMPOINT) dos doentes internados entre o grupo dos falecidos na UCI e o grupo dos
sobreviventes (RESULTADO)? Justifique. Diga tambm, justificando, que teste de hiptese usou.
P > 0,05 => aceita-se H0.
Varivel Contnua x Dicotmica
Distribuio no normal => teste de Mann Whitney.
3. Haver uma associao estatsticamente significativas entre o estado de sade prvio (ESTPREV)
dos doentes internados e o resultado do internamento (RESULTADO)? Justifique. Diga tambm,
justificando, que teste de hiptese usou.
P > 0,05, logo aceita-se H0 => no h associao estatisticamente significativa entre o estado de sade
prvio dos doentes internados e o resultado do internamento.
Varivel Categrica x Categrica
Menos de 20% das clulas tem valores esperados menores que 5 => pode-se usar o teste do Quiquadrado.
4. Haver diferenas estatsticamente significativas no ndice de gravidade (SAPS) dos doentes
internados entre o grupo dos doentes que prviamente eram saudveis, o grupo dos doentes com
doena crnica no incapacitante prvia e o grupo dos doentes com doena crnica incapacitante
prvia (ESTPREV)? Justifique. Diga tambm, justificando, que teste de hiptese usou.
P > 0,05, logo aceita-se H0 => no h diferenas estatisticamente significativas no ndice de gravidade dos
doentes internados entre o grupo dos doentes que previamente eram saudveis, o grupo dos doentes com
doena crnica no incapacitante prvia e o grupo dos doentes com doena crnica incapacitante prvia.

Varivel Contnua x Categrica. => teste ANOVA? Cumpre assunes? Varincias no so iguais => no
as cumpre => teste Kruskall-Wallis.

Você também pode gostar