Você está na página 1de 85

! !

Manual de!
SPSS !

Gestão e Análise de Dados


!

Faculdade de Ciências Médicas


UNIVERSIDADE NOVA DE LISBOA
JOANA RIBEIRO ! 1
ÍNDICE

1. INICIAR O SPSS!...................................................................................................................!3!
!

2. AS JANELAS DO SPSS!......................................................................................................!4!
!
2.1. Janela Variable View!.....................................................................................................!4!

3. SUMARIZAÇÃO DE DADOS!..............................................................................................!7!
!
3.1. Tabela de Frequências!..................................................................................................!7!

4. GRÁFICOS!..........................................................................................................................!11!
4.1. Gráficos Pie!...................................................................................................................!11!
4.2. Gráficos de Barras!.......................................................................................................!13!
4.2.1. Gráfico de Barras Simples!.................................................................................!13!
4.2.2. Gráfico de Barras Agrupadas!............................................................................!15!
4.3. Histograma!....................................................................................................................!17!
!
4.4. Caixa de Bigodes (Boxplots)!......................................................................................!19!

5. MEDIDAS DESCRITIVAS!..................................................................................................!22!
5.1. Ordenar os dados!........................................................................................................!24!
5.2. Gráficos Q-Q Plot!.........................................................................................................!25!
5.3. Gráfico Detended Q-Q Plot!.........................................................................................!25!
5.4. Análise de questões de escolha múltipla!.................................................................!26!
5.4.1. Utilizar variáveis auxiliares que nos permitem recolher informação adicional
!.......................................................................................................................................!28!
!
5.4.2. Cruzamento de Variáveis - Crosstabs!..............................................................!28!

6. TESTES ESTATÍSTICOS!..................................................................................................!30!
6.1. Amostras Independentes!............................................................................................!30!
6.2. Amostras emparelhadas!.............................................................................................!38!
6.2.1. Testes t-pares!......................................................................................................!41!
6.2.2. Teste Não paramétricos para amostras emparelhadas!
Wilcoxon e Sinais!................................................................................................!43!
6.2.3. Teste de McNemar!..............................................................................................!48!
!
6.3. Teste Qui-quadrado!.....................................................................................................!50!

7. EXERCÍCIOS RESOLVIDOS!............................................................................................!56!

! 2
1. INICIAR O SPSS
!

Depois de aberto, surge a seguinte janela:

Carregar em Cancel, a não ser que queiramos abrir uma base de dados pré-feita.

! !

! 3
2.! AS JANELAS DO SPSS
Janelas principais

Data View: janela semelhante ao do Excel onde são informatizar dados.

VariableView: janela onde definimos as variáveis.!

Janelas de resultados

Output: janela onde surgem os resultados das análises realizadas.

Chart Editor: janela destinada a alterações estéticas dos gráficos.

2.1.!Janela Variable View

Cada variável é definida por:

Name: nome definido para a variável. Este campo não pode ter espaço e o
caracter inicial tem de ser uma letra.

Type: tipo da variável.

! 4
Label: destinado a descrever variáveis, sem limitações de caracteres, isto é,
podem-se usar todos os tipos e espaços.

Value: uma das definições mais importantes.

!
Exemplo

Questionário em que se analisa as idades.

NOTA

Quando existem
indivíduos que não
mencionam a sua
idade, adicionamos
o value como um
número absoluto.
!

Missing: são as não respostas.

Não há resposta:

! 5
Definir as variáveis que não têm resposta e que não pretendo que
entre no estudo:

!
!

Definir o intervalo de valores que não pertence à análise:

!
!

Columns: largura da coluna

Measure: nível de medida da variável. Quando se trata de uma variável


qualitativa utiliza-se nominal, quando se trata de uma variável
quantitativa (número) é scale.

! !

! 6
3.! SUMARIZAÇÃO DE DADOS
!

3.1.!Tabelas de Frequências

A Tabela de Frequência

!
Através da seta azul, seleccionar a variável que pretendo analisar para
variable(s). Seleccionar OK.

!
O resultado surge numa janela output.

! 7
NOTA
Tabelas e gráficos da janela output devem ser colados no Microsoft Office
Word através da tecla “colar especial” de modo a não desformatar.
!

!
Análise da Tabela de Frequência

Foi observada uma amostra de 17 pacientes, dos quais 8 eram homens


(47,1%) e os restantes mulheres (9; 52,9%). Dessa amostra verificou-se que
a maioria tem seguro de saúde 13 (76,5%).

Alterar aspectos estéticos da Tabelas de Frequência

Duplo click sobre a tabela que pretendo alterar.


Marcar, com o rato, a célula que se pretendo alterar (fica a bold).

!
!

De!seguida!seleccionar!o!destaque!que!pretendo!fazer.!

! 8
!
Antes do destaque:

!
Após o destaque:

!
Alterar a apresentação da tabela

! 9
!

! !

! 10
4.! GRÁFICOS

4.1.!Gráficos Pie

Gráficos Pie

São apropriados para variáveis nominais com 4 ou menos categorias.

Como fazer?

!
Click em define.

!
Seleccionar OK.

! 11
Alterar aspectos estéticos o gráfico

Duplo click sobre o gráfico.

Surge a janela chart editor.

Para que as percentagens de cada fatia sejam representadas no gráfico,


seleccionar o item para o qual a seta verde aponta.

!
Quando a janela do chart editor é fechada, automaticamente são adicionadas
as alterações na janela de output.

! 12
Antes: Depois:

!
4.2.!Gráficos de Barras

Utilizado para variáveis discretas.

!
!
4.2.1.! Gráfico de Barras Simples
!

! 13
!
!

Seleccionar Ok.

! 14
Alteração

Colocar barras horizontais:

!
Depois:

!
4.2.2.! Gráfico de Barras Agrupadas

! 15
Define.

!
!

!
!

! 16
Alteração

Antes: Depois:

!
4.3.!Histograma

Utilizados para variáveis quantitativas contínuas.

! 17
!
Além da representação gráfica, o histograma dá-nos a informação:

•! Dimensão amostral (N = 17)


•! Média Aritmética (Mean = 36 anos)
•! Desvio Padrão (Std. Dev = 16,602)

Seleccionar o Display Normal Curve

! 18
4.4.!Caixa de Bigodes (Boxplots)

São representações gráficas que ajudam numa análise prévia dos dados,
dando informação relevante.

Aplicável a dados quantitativos

Como fazer?

!
!

Pode-se obter pela opção simples ou clusters.

! 19
!
!

!
Análise

Verifica-se que os gráficos não apresentam aparentemente simetria em ambos


os casos e a idade das mulheres tem maior dispersão que a dos homens. Não
há outliers.

! 20
Outliers

!
!

!
•! outlier moderado no indivíduo 17
* outlier severo no indivíduo 16

! !

! 21
5.! MEDIDAS DESCRITIVAS
Análise descritivas:

•! Quantitativas – média
•! Qualitativas – moda

!
!

!
!

! 22
Statistics

!
Resultado e Análise – Exercício da Clínica XPTO

Verifica-se que a média da idades dos pacientes é 36 anos com um desvio padrão
de 16,6 anos.

A idade mínima deste grupo de pacientes é de 19 anos e a máxima é de 59 anos.

A mediana das idades é 28 anos com um IQ (intervalo interquartis) de 27 anos.

desvio#padrão 16,6
CV#(coeficiente#de#variação) = = ×100 = 47%
média 36

Devíamos utilizar então a média e o desvio de padrão.

! 23
!
Pela análise do boxpoth, verifica-se que, aparentemente, os dados não são
simétricos.

5.1.!Ordenar os dados

Data – Sort Cases

! 24
!

!
5.2.!Gráficos Q-Q Plot

!
No Q-Q-Plot os dados devem estar o mais sobrepostos possíveis à diagonal
para verificar a normalidade dos mesmos.

5.3.!Gráfico Detended Q-Q Plot

! 25
!
No gráfico Detended Q-Q Plot os dados devem distribui-se aleatoriamente
acima e abaixo da linha horizontal. Aparentemente, os dados não seguem uma
distribuição normal.

5.4.!Análise de questões de escolha múltipla

Uma questão de escolha múltipla é uma questão que admite uma ou mais
opções de resposta. Define-se como uma variável desdobrada.

Como analisar as questões de escolha múltipla?

! 26
!
Colocam-se as variáveis que fazem parte da resposta múltipla em Variablesin
Set. Depois escolhe-se a opção dicotómica ou categoria conforme a variável é
binária ou não, respectivamente. Atribui-se um nome em SetName e a
descrição em LabelName, fazendo add de seguida. Identifica-se que temos
uma variável de resposta múltipla quando temos $ antes do nome, por exemplo
p5.

Esta nova variável fica definida e quando a quisermos analisar fazemo-la


através do CustomTables.

!
!

! 27
!
!

Resultado e Análise

!
Verifica-se que a especialidade mais utilizada no hospital é a pediatria, cerca
de 47,1% dos utentes utilizam-na.

Na amostra recolhida não se observou nenhum doente a afirmar frequentar


consultas de psiquiatria.

Temos uma distribuição unimodal, sendo a pediatria a moda.

5.4.1.! Utilizar variáveis auxiliares que nos permitem recolher


informação adicional

! 28
!
!

!
!

5.4.2.! Cruzamento de Variáveis - Crosstabs

Consiste na criação de tabelas de contingência que permitem retirar


informação adicional sobre dados recolhidos.

!
!

! 29
Coloca-se a variável em linha e a outra em coluna, só se utilizam 2
variáveis de cada vez.

!
!

Resultado e Análise

!
!

1.! Nas mulheres qual a % que tem seguro de saúde? 66,7%


2.! Dos que não tem seguro de saúde qual a % de homens? 25%
3.! Do total da amostra, qual a % de mulheres com seguro de saúde?
35,3%

! 30
6.! TESTES ESTATÍSTICOS
!

!
TESTES!PARA!2!AMOSTRAS!

! Amostras!Independentes! Amostras!Emparelhadas!

! Sem!Distribuição! Com!Distribuição! Diferenças!Sem! Diferenças!Com!


Normal! Normal! Distribuição!Normal! Distribuição!Normal!
!

!
Homocedásticas!
Homocedásticas!

Diferenças!Não!
Diferenças!
Simétricas!

simétricas!
Não!

!
Teste!!!!!!!!!!!!!!!!
Mann%Whitney!

Satterthwaite!

Teste!T%pares!
Teste!!!!!!!!

Teste!Sinais!

!
T%student!

Wilcoxon!
Teste!

Teste!

6.1.!Amostras Independentes

1º Passo – Informatizar dados

No SPSS as amostras independentes são informatizadas todas na mesma


coluna e na coluna ao lado coloca-se a indicação do grupo a que pertencem.
As amostras independentes não têm que ter todas a mesma dimensão.

! 31
!
2º Passo – Estatística Descritiva

O primeiro passo é fazer o explore para que se possa ter sensibilidade com os
dados.

A diferença no explore de amostras independentes é que no factor list é colocada


a variável que identifica o grupo.

!
Além!das!estatísticas!habituais!para!uma!amostra,!quando!temos!uma!ou!mais!amostras!
o!SPSS!permite!colocar!o!teste!de!Levene!(teste!de!homocedasticidade).!

! 32
!
!

!
!

Descrever as amostras e calcular o CV para cada uma.

O comando explore com as características descritas anteriormente dão-nos o


seguinte quadro:

! 33
Intervalo!de!Confiança!

!
O que nos permite descrever exaustivamente as amostras recolhidas tal como
fazíamos anteriormente comparando-as (cv; médias; dp; medianas; mínimo;
máximo).

Por exemplo, neste exercício verifica-se através do explore que os valores da


amostra submetida à solução salina são mais altos que os valores da amostra
com vasoconstritor.

Intervalos de Confiança:

ABCDEF = 139,49; 282,18

ABCDEF = 139,49; 282,18

Além da descritiva vamos verificar as condições de aplicabilidade.

3º Passo – Condições de aplicabilidade

Além da descritiva vamos verificar:

a)! Normalidade

Solução Salina

KL : NO#PQPRO#PQ#QSROTUQ#OVWSXTYPQ#Q#ORZVçãR#OQZY[Q#OX\VXS#PYOTUYWVYçãR#PX#]QVOO##########
!
K^ : NO#PQPRO#PQ#QSROTUQ#OVWSXTYPQ#Q#ORZVçãR#OQZY[Q#[ãR#OX\VXS#PYOTUYWVYçãR#PX#]QVOO#

! 34
!

Vasocontritor

KL : NO#PQPRO#PQ#QSROTUQ#OVWSXTYPQ#QR#_QOR`R[OTUYTRU#OX\VXS#PYOTUYWVYçãR#PX#]QVOO#########
!
K^ : NO#PQPRO#PQ#QSROTUQ#OVWSXTYPQ#QR#_QOR`R[OTUYTRU#[ãR#OX\VXS#PYOTUYWVYçãR#PX#]QVOO#

!
df – degrees of freedom (graus de liberdade de dimensões amostral)

Como n < 50 em ambas as amostras utiliza-se o teste de Shapiro-Wilk.

aCDEFbFcEdefdFe = 0.742
aEFhiçãF#EDhfcD = 0.656 > 0.05

Verifica-se que o p-value vasocontritor e da solução salina são ambas


superiores a 5% (α). Assim não rejeito H0 e assumo a normalidade em
ambas as amostras. Logo, utiliza-se um teste paramétrico.

Outra forma de abordar a normalidade é através dos gráficos: Normal Q-Q


Plot e Detrended Normal Q-Q Plot.

!
!

! 35
NOTA

Se o teste da normalidade apresentar como resultado uma distribuição normal,


então posso verificar a normalidade através dos gráficos.

Se o teste da normalidade apresentar como resultado uma distribuição não


normal, não é necessário observar os gráficos.
!
!
b)! Homocedasticidade

Faz-se um único teste para cada 2 amostras.

! Exemplo

Tenho 3 amostras (3 turmas): faço 3 testes de normalidade e o teste de


!
homoscedasticidadepara T1+T2; T1+T3; T2+T3.

O teste a usar (mean ou median) baseia-se no cálculo do CV (coeficiente


de variabilidade) feito anteriormente.

CV vaso = 53,25%

CV const = 26,96%

Logo utiliza-se a média.

O teste de Levene diz-nos que p-value = 0.711 > 5% (α). Deste modo, não
rejeito H0, o que significa que existe homocedasticidade, logo o teste a
aplicar é o t-student.

TESTE T-STUDENT

Para o aplicar temos que escrever as hipóteses e as 2 condições de


aplicabilidade (normalidade e homocedasticidade) têm que dar “Não
rejeitar H0”.

KL : lE = lC
K^ : lE ≠ lC

Como realizar o SPSS?

! 36
!
!

!
!

! 37
O output resultante é:

Homocedásticas!

Não!Homocedásticas! Teste!Levine! Teste t


com!distribuição!normal!
Teste de Satterwaite

Este output dá-nos a informação de 2 testes. Na 1º linha o teste t (quando


há homocedasticidade). Na 2º linha o teste de Satterhwaite (quando não
há homocedasticidade mas há normalidade).

Os valores do teste lêm-se em Sig (2 tailed) = 0,65 (> 5%), logo não rejeito
H0, concluindo que não existem diferenças estatisticamente significativas
entre os valores médios da solução salina e do vasoconstricotor. Igual
conclusão se pode retirar através do intervalo de confiança (IC), ou seja se
este contém o valor 0 concluí-se que não existem diferenças significativas,
o que é o caso pois AB = −182,679; 6,012 que contém o zero.

! Exemplo

O intervalo de confiança tem sempre de confirmar os resultados finais, sendo por isso
!
um dado de confirmação e fortalecedor dos resultados obtidos. Nunca dão resultados
opostos.
No caso de não ter normalidade

O teste que se utiliza é o de Mann-Whitney.

KL : oL.p#EDhf = oL.p#CDEF
K^ : oL.p#EDhf ≠ oL.p#CDEF

! 38
!
!

Amostras
Pequenas (n<30)

!
Como p-value = 0,068, logo > 5%, concluo que não há evidência de
diferença significativas nos valores medianos.

6.2.!Amostras emparelhadas

Estamos perante amostras emparelhadas quando para o mesmo indivíduo


temos 2 ou mais observações para momentos temporais diferentes.

Em termos de informatização as amostras


NOTA
emparelhadas são diferentes das
independentes pois os dados de cada Quando as observações de um
indivíduo deverão ser informatizados na indivíduo não estão completas
exclui-se esse indivíduo dos
mesma linha, isto é cada linha é um
estudos.
indivíduo com as respectivas observações.

! 39
Exercício 5

Após a informatização dos dados devemos criar uma variável que representa
a diferença antes e após (dif D).

Para criar essa variável utiliza-se a opção Compute do SPSS.

! 40
Em Target Variable dá-se o nome à nova variável que vamos criar e em
Numeric Expression escreve-se a fórmula de cálculo que queremos aplicar.

O resultado é uma nova variável que servirá para aplicar o teste para amostras
emparelhadas.

!
Agora a base de dados está preparada para aplicar o teste para amostras
emparelhadas, onde se trabalha com a nova variável criada.

As hipóteses a testar são:

KL : lq = 0
K^ : lq ≠ 0

Começa-se por fazer a análise através do explore, considerando as variáveis


antes e após em separado, para verificar a análise descritiva, destacando os
principais valores.!

! 41
De seguida faz-se o mesmo para a variável diferença, mas já verificando a
normalidade para se decidir se utilizamos um teste paramétrico ou não
paramétrico.

!
Em termos de descritiva pode-se falar dos valores mínimos e máximos da
variável diferença, não nos interessa falar de médias, medianas.

Por exemplo, verifica-se que o valor mínimo da diferença antes e após a


maratona de -0,60 sendo o valor máximo desta mesma diferença de 1,90.

Vamos testar a normalidade:

KL : r#PYsXUX[çQ#OX\VX#PYOTUYWVYçãR#PX#]QVOO############
!
K^ : r#PYsXUX[çQ#[ãR#OX\VX#PYOTUYWVYçãR#PX#]QVOO####

!
Como a dimensão amostral é igual a 10 (< 50), utiliza-se o teste de Shapiro-
Wilkque diz que:

P-value (sig) = 0.646, > 0.05 (α) não rejeito H0, concluindo que a variável
diferença seguem distribuição de Gauss, logo pode-se utilizar o teste
paramétrico t-pares.

6.2.1.! Teste t-pares

É um teste paramétrico para amostras emparelhadas.

! 42
As hipóteses a testar são:

KL : lq = 0
K^ : lq ≠ 0

Para aplicar o teste faz-se:

!
!

Temos de informar o SPSS quais as variáveis que farão a nova variável


diferença (não se coloca a diferença neste passo).

O resultado do teste é:

! 43
Então verifica-se que p-value = 0.101, > 0.05 (α), logo não rejeito H0
concluindo que as diferenças encontradas não são significativas.

6.2.2.! Teste Não paramétricos para amostras emparelhadas:


Wilcoxon e Sinais

Quando temos amostras emparelhadas devemos verificar se a variável


diferença segue ou não distribuição de Gauss. Se seguir utilizamos o t-
pares, caso contrário pode-se utilizar ou Wilcoxon ou Sinais conforme a
simetria das diferenças.

Exercício 7

Estamos perante amostras emparelhadas com 2 emparelhamentos pois


o mesmo indivíduo tem mais que uma avaliação em momentos temporais
diferentes.

Depois de informatizarmos os dados e antes de fazermos qualquer


análise temos de criar a variável diferença, pois é esta variável que nos
leva a decidir qual o teste a utilizar.

! 44
Faz-se a descritiva das 2 variáveis em separado.

!
!

!
!

De seguida faz-se a descritiva, verificando também a normalidade da


variável diferença.

! 45
!
Descreve-se a descritiva sem aprofundar muito…

O que é mais relevante é a normalidade.

KL : NO#PQPRO#PQ#QSROTUQ#OVWSXTYPQ#Q#ORZVçãR#OQZY[Q#OX\VXS#PYOTUYWVYçãR#PX#]QVOO##########
!
K^ : NO#PQPRO#PQ#QSROTUQ#OVWSXTYPQ#Q#ORZVçãR#OQZY[Q#[ãR#OX\VXS#PYOTUYWVYçãR#PX#]QVOO#

Deve-se apresentar o valor do teste mas também o grafismo que vêem


validar a nossa decisão.

! 46
!
Como n < 50 utiliza-se o teste de Shapiro-Wilk que tem p = 0, < 5% logo
rejeito H0 e aceito H1, concluindo que a diferença não segue distribuição
normal, logo teremos que aplicar um teste não paramétrico.

Para decidir dos testes que deve ser utilizado temos que verificar se a
variável diferença é simétrica.

A simetria é verificada fazendo o seguinte cálculo do coeficiente de


simetria a partir da tabela das descritivas da diferença:

tuvwcvEE
-1,96 < #< -1,96
tdx.yeeF#tuvwcvEE#

! 47
No nosso exemplo temos :

z.{||
Coeficiente de Simetria = = 6.24. Como > 1.96 conclui-se que as
L.p}L
diferenças não são simétricas, logo aplica-se o teste dos Sinais. Se
fossem simétricas aplicava-se Wilcoxon.

KL : oL.p#~Ä = 0######
!
K^ : oL.p#~Ä ≠ 0######

Aqui escolhe-se Sign ou Wilcoxon conforme as diferenças não são ou


são simétricas respectivamente.

! 48
Como p-value = 0,001 (< 5%), rejeito H0 e aceito H1 concluindo que há
forte evidência de diferenças nas observações aos 5 e aos 6 anos.

6.2.3.! Teste de McNemar

É um teste não paramétrico para amostras emparelhadas aplicado a


tabelas de contingência 2x2.

O que difere em relação ao Qui-quadrado é que o Qui-quadrado pode ser


aplicado a tabelas superiores a 2x2 e o Qui-quadrado estuda a
associação entes 2 variáveis diferentes (sexo vs. altura; tosse vs.
bronquite) enquanto que o McNemar na maioria dos casos é a mesma
variável estudada.

O McNemar apenas estuda os pares discordantes, ou seja que regista


alterações, logo as hipótese a estudar neste teste são:

KL :#a~ + = aÄ (+)
K^ : a~ + ≠ aÄ (+)

Exercício 9

KL :#aq~ + = aqq (+)


K^ : aq~ + ≠ aqq (+)

Para fazer o teste de McNemar faz-se:

!
Coloca-se a variável inicial em linha e a após tratamento (ou incidência)
em coluna.

! 49
!

!
Os outputs resultantes são:

1.! A tabela de contingência

Verifica-se que das 30 parturientes observadas antes e após o


aconselhamento há 5 sem depressão cujo aconselhamento
provocou a incidência depressiva e 8 com depressão cujo
aconselhamento colmatou este problema.

! 50
2.! Teste de McNemar

Como p-value = 0.581 (> 5%), não rejeito H0, concluindo que não há
diferenças significativas antes e após o aconselhamento psicológico.

6.3.!Teste Qui-quadrado

Teste aplicado apenas em tabelas de contingência.

Com este teste pretende-se verificar a associação entre 2 variáveis.

As hipóteses a testas são:

KL : ÇãR#ℎá#QOOR`YQçãR#X[TUX#Q#_QUá_XZ#Ö#X#Ü#
K^ : Ká#QOOR`YQçãR#X[TUX#Q#_QUá_XZ#Ö#X#Ü########

Para aplicar este teste no SPSS temos de informatizar a linha e a coluna que
compõem a tabela de contingência.

Exercício 1

Observou-se uma amostra de 1319 indivíduos para testar a associação entre


ter tosse e bronquite. O que concluí?

Como pretendemos testar associação utilizamos o teste Qui-quadrado.

Hipóteses:

KL : ÇãR#ℎá#QOOR`YQçãR#X[TUX#TXU#TROOX#X#WUR[áVYTX#
!
K^ : Ká#QOOR`YQçãR#X[TUX#TXU#TROOX#X#WUR[áVYTX#########

!
!

A informatização da tabela é feita com as conjugações possíveis das nossas


variáveis.

! 51
!
!
!
!

Depois de informatizar as opções da tabela de contingência temos que informar


o programa quais os valores que estão em cada célula. Para isso criamos uma
nova coluna que é habitualmente designada por frequência. Esta variável de
frequência é de scale.

!
!

! 52
Por último temos que informar o programa que cada linha vale a frequência
respectiva, para isso faz-se:

!
!
!
!

!
!
!

!
!

! 53
Depois aplica-se o teste:

!
!

!
!

!
!

! 54
!

!
Resultado e Análise
!

! 55
!

Critério!de!Cochran!
!
O critério de Cohran é verificado na alinha a.

Como p-value (asymp. Sig. (2-sided)) = 0 < α (5%), rejeita-se H0 e aceita-se H1,
logo há evidência de forte associação entre tosse e bronquite (classificação
pelo slide 77).

! !

! 56
7.! EXERCÍCIOS RESOLVIDOS
FICHA NÚMERO 1

Exercício 1

1º Passo fazer o Explore

Foram observados 57 pacientes com o objectivo de identificar o peso dos


tumores extraídos do abdómen.

2º Passo Calcular o coeficiente de variação

àXO_YR#âQPUãR 15,865
= ×100 = 43,2%
äéPYQ 36,72

Calculou-se o cv = 43,2% o que significa que há pouca dispersão da média de


pesos dos tumores, logo a média é uma medida apropriada para análise
descritiva.

A média dos pesos dos tumores é de 36,72 onças com um desvio padrão (DP)
de 15,865 onças.

O valor mediano (mediana) do peso dos tumores é de 32 onças com intervalo


interquartil (IQ) de 22 onças.

Verifica-se também que o peso mínimo é de 12 onças e o máximo 79 onças.

! 57
3ºPasso – Descobrir a moda

Verifica-se igualmente (através da tabela de frequência) que a distribuição


destes dados é bimodal (moda = 27; 28).

Como média (36,72) > mediana (32) > moda (27,28), conclui-se que a
distribuição do peso dos tumores é assimétrica positiva.

! 58
Tal como verificado pela média, mediana e moda, o histograma indica-nos a
eventual existência de assimetria.

Também através do boxplot verificamos que os dados deverão ser assimétricos.

Verifica-se também a existência de um outlier moderado correspondente ao peso


do tumor do paciente 57 (79 onças).

! 59
4º Passo – Gráficos Q-Q Plot

!
Aparentemente, os dados não seguem uma distribuição normal.

! 60
Exercício 2

1º Passo fazer o Explore

!
2º Passo Calcular o coeficiente de variação

àXO_YR#âQPUãR 0,24385
= ×100 = 36,7%
äéPYQ 0,6630

Verifica-se que a média é de 0,6630 com um desvio padrão de 0,24385. A


mediana é de 0,6350.

Máximo 1,17 e mínimo 0,27

! 61
!
!

Tanto o histograma como o boxplot dão-nos indicação de eventual normalidade


dos dados.

!
!

! !

! 62
Exercício 3

!
!

Foram observados 30 homens de idade compreendida entre os 40 e os 49 anos


com o objectivo de identificar o peso dos seus rins.

àXO_YR#âQPUãR 47,135
= ×100 = 14,7%
äéPYQ 320,93

Calculou-se o cv = 14,7% o que significa que há pouca dispersão da média de


pesos dos rins, logo a média é o valor apropriado para a análise descritiva.

A média dos pesos dos rins é de 320,93 gramas com um desvio padrão de 47,135
gramas.

O valor mediano do peso (mediana) dos rins é de 322,50 gramas com intervalo
interquartil de 72 gramas.

Verifica-se também que o peso mínimo é de 208 gramas e o máximo 403 gramas.

! 63
!
!

Através! da! tabela! de! frequências! verificaQse! que! a! distribuição! dos! dados! é! unimodal!
(moda!=!358).!

Como!a!moda!(358)!>!mediana!(322,50)!>!média!(320,93)!concluiQse!que!a!distribuição!do!
peso!dos!rins!é!assimétrica!negativa.!

! 64
!
Tal como verificado pela média, mediana e moda, o histograma indica-nos a
eventual existência de assimetria.

!
Também através da caixa de bigodes verifica-se que os dados deverão ser
assimétricos.

Verifica-se também a não existência de outliers.

! 65
!
!

Aparentemente os dados não seguem uma distribuição normal.

! !

! 66
Exercício 6

Vinte doentes foram distribuídos aleatoriamente por dois grupos de tratamento


(10 doentes em cada grupo). Os dados correspondem à alteração sofrida pelos
iões cloro do soro depois de cada tratamento.

Tratamento A: 4.3 6.2 4.4 8.2 0.5 2.6 4.2 4.1 5.6 3.4

Tratamento B: 6.1 0.9 0.7 0.8 1.3 3.1 1.9 3.9 2.1 0.1

O que conclui?

Estatística Descritiva

Foram observados 20 doentes que foram distribuídos aleatoriamente por dois


grupos de tratamento (10 doentes tratamento A e 10 doentes tratamento B) com
objectivo de identificar as alterações sofridas pelos iões de cloro do soro depois
de cada tratamento.

qvECfF#ãDxeãF |,Lçz| qvECfF#ãDxeãF ^,}|{L


`_~ = = = 47,7% `_Ä = = 87,37%
åéxfD é,zpL åéxfD |,LèL

Calculou-se o cv para o tratamento A (47,7%) que permite concluir que a média


é o valor apropriado para a análise descritiva. Por outro lado, o cv do tratamento

! 67
B é de 87,37%, logo a mediana é o valor apropriado para a análise descritivas
no tratamento B. Comparando os cv pode-se constatar que o cv do tratamento
A é menor que a do tratamento B, o que significa que o tratamento! A possui
menor dispersão da média das alterações sofridas pelos iões de cloro do soro
após a sua administração em relação ao tratamento B.

A média da alteração sofrida pelos iões de cloro do soro depois do tratamento A


é de 4,350 com um desvio padrão de 2,0732 e do tratamento B é de 2,090 com
um desvio padrão de 1,8260.

O valor mediano (mediana) da alteração sofrida pelos iões de cloro do soro


depois do tratamento A é de 4,250 com intervalo interquartil de 2,6 e do
tratamento B é de 1,600 com intervalo interquartil de 2,5.

Verifica-se também que a alteração mínima é de 0,5 e a máxima de 8,2 no


tratamento A e 0,1 (mínimo) e 6,1 (máximo) no tratamento B.

Por outro lado, averigua-se ainda que os valores da amostra submetida ao


tratamento A são mais altos que os valores da amostra submetida ao tratamento
B.

ABêeDdDëvcdF#~ = 2,867; 5,833


ABêeDdDëvcdF#Ä = 0,784; 3,396

Constata-se que a distribuição dos dados de ambas as amostras são amodais


(sem moda).

Em relação ao tratamento A, como a mediana (4,250) < média (4,350) conclui-


se que a distribuição das alterações é assimétrica positiva.

Tal como verificado pela média e mediana, o histograma indica-nos a eventual


existência de assimetria.

! 68
Em relação ao tratamento B, como a mediana (1,600) < média (2,090) conclui-
se que a distribuição das alterações é assimétrica positiva.

!
Tal como verificado pela média e mediana, o histograma indica-os a eventual
existência de assimetria.

Por comparação dos histogramas verifica-se que, provavelmente, a distribuição


da amostra submetida ao tratamento B tem uma assimetria mais positiva que a
distribuição da amostra submetida ao tratamento A.

!
Também através da caixa de bigodes verifica-se que os dados deverão ser
assimétricos em ambas as amostras. Verifica-se também a não existência de
outliers.

! 69
!
!

!
!

Através da observação dos gráficos Q-Q plot, aparentemente, os dados não


seguem uma distribuição normal.

Verificação da Normalidade

Tratamento A
!
KL : NO#PQPRO#PQ#QSROTUQ#OVWSXTYPQ#QR#TUQTQSX[TR#r#OX\VXS#Q#PYOTUYWVYçãR#PX#]QVOO#########
!
K^ : NO#PQPRO#PQ#QSROTUQ#OVWSXTYPQ#QR#TUQTQSX[TR#r#[ãR#OX\VXS#Q#PYOTUYWVYçãR#PX#]QVOO
!
Tratamento B
!
KL : NO#PQPRO#PQ#QSROTUQ#OVWSXTYPQ#QR#TUQTQSX[TR#í#OX\VXS#Q#PYOTUYWVYçãR#PX#]QVOO#########
K^ : NO#PQPRO#PQ#QSROTUQ#OVWSXTYPQ#QR#TUQTQSX[TR#í#[ãR#OX\VXS#Q#PYOTUYWVYçãR#PX#]QVOO
!
!

Como as amostras são independentes e em ambas n < 50 utiliza-se o teste de


Shapiro-Wilk.

! 70
adeDdDëvcdF~ = 0,856
> 0,05!
adeDdDëvcdF~ = 0,157
!
Verifica-se que o p-value do tratamento A e do tratamento B são ambos
superiores a 5% (α). Assim não rejeito H0 e assumo a normalidade em ambas as
amostras. Logo, utiliza-se um teste paramétrico.

Verificação da Homocedasticidade – Teste de Levene

!
O teste a utilizar (mean ou median) baseia-se no cálculo do coeficiente de
variabilidade.

qvECfF#ãDxeãF |,Lçz|
Bì~ = = = 47,7%!!
åéxfD é,zpL

àXO_YR#âQPUãR 1,8260
BìÄ = = = 87,37%!
äéPYQ 2,090

Neste caso, pelo CVA deveria ser utilizada a média (p-value = 0,957) e pelo CVB
(p-value = 0,924) deveria ser utilizada a mediana. Independentemente de ser
utilizada o teste baseado na média ou na mediana, o teste de Levene diz-nos p-
value (0,956 ou 0,924) > 5% (α). Deste modo, não rejeito H0, o que significa que
existe homocedasticidade, logo o teste a aplicar é o t-student.

Teste t-student

KL :#l~ = lÄ
!
K^ :#l~ ≠ lÄ
!

!
Os valores do teste p-value = 0,019 (< 5%), logo rejeito H0, concluindo que
existem diferenças estatisticamente significativas entre os valores médios do
tratamento A e o tratamento B. Igual conclusão se pode retirar através do
intervalo de confiança (IC), ou seja se este não contém o valor 0 conclui-se que
existem diferenças significativas, o que é o caso pois IC = 0,4245; 4,0955 que
não contém o zero.

! !

! 71
Exercício 8

Pretende-se analisar a relação entre o modo como uma pessoa sente que é a vida
(vida) e a forma como é feliz na vida (feliz). O modo como a pessoa sente que é
a vida tem 3 categorias: 1 = Excitante; 2 = Rotineira; 3 = Aborrecida, enquanto que
a forma como é feliz tem as seguintes categorias: 1 = Muito feliz; 2 =
Moderadamente feliz; 3 = Não muito feliz. O quadro seguinte apresenta os
resultados obtidos:

! ! Feliz! !

! ! Moderadamente! Não!muito!
Muito!feliz! Total!
feliz! feliz!

Vida! Excitante! 171! 110! 71! 352!

! Rotineira! 172! 184! 116! 472!

! Aborrecida! 119! 115! 253! 477!

Total! ! 462! 409! 430! 1301!

O que conclui?

Neste exercício será aplicado o teste qui-quadrado, visto que se pretende


verificar a associação entre 2 variáveis (felicidade e vida).

Hipóteses

KL : ÇãR#ℎá#QOOR`YQçãR#X[TUX#Q#_YPQ#X#Q#sXZY`YPQPX######
!
K^ : Ká#QOOR`YQçãR#X[TUX#Q#_YPQ#X#Q#sXZY`YPQPX##############

A seguinte tabela de contingência tem uma dimensão de 3x3.

! 72
!

O critério de Cohran é verificado na alinha a.

Como p-value (asymp. Sig (2-sided)) = 0 < 5% (α), rejeita-se H0 e aceita-se H1.
Logo, há evidência de forte associação entre o modo como uma pessoa sente que
é a vida e a forma como é feliz na vida.

! !

! 73
FICHA NÚMERO 2

Exercício 2

Estamos perante 2 amostras independentes logo a informatização das mesmas no


SPSS é feita numa única coluna (os dados) e na coluna ao lado a identificação da
amostra a que pertence.

!
Descritiva dos dados

!
Cálculo do CV:

! 74
àXO_YR#âQPUãR 2.256 !
BìîFëvë = ×100 = ×100 = 30.12%
äéPYQ 74.91

àXO_YR#âQPUãR 2.111 !
Bìåihïve = ×100 = ×100 = 27.19%
äéPYQ 77.64

Como ambos os CV são menores que 50% utiliza-se a média como medida de
localização.

Por esta análise descritiva verifica-se que:

•! A temperatura de conforto das mulheres é ligeiramente superior à dos homens,


77.64 e 7.91, respectivamente (Dp = 2.111 e 2.256). A verificação se esta
diferença é significativa será feita pelo teste de hipótese adequado, de seguida.
•! Há ligeiramente maior variabilidade nas temperaturas de conforto nos homens
e nas mulheres (Dp).

De seguida vamos verificar a normalidade através do teste de Shapiro-Wilks porque


a n=11(< 50).

Para os homens:

KL : NO#PQPRO#PQ#QSROTUQ#OX\VXS#PYOTUYWVYçãR#PX#]QVOO##########
!
K^ : NO#PQPRO#PQ#QSROTUQ#[ãR#OX\VXS#PYOTUYWVYçãR#PX#]QVOO#

Para as mulheres:

KL : NO#PQPRO#PQ#QSROTUQ#OX\VXS#PYOTUYWVYçãR#PX#]QVOO##########
!
K^ : NO#PQPRO#PQ#QSROTUQ#[ãR#OX\VXS#PYOTUYWVYçãR#PX#]QVOO#

O output é:

!
Como p-value homens = 0.312 e p-value mulher = 0.16, ambos são < 5%, assim
não rejeito H0 concluindo que os dados de ambas amostras seguem a distribuição
de Gauss.

Podemos complementar a análise pelos gráficos.

! 75
!

!
Os gráficos levam-me à mesma decisão relativamente à normalidade, apesar de
não estarem perfeitos.

De seguida vamos verificar a homocedasticidades, através do teste de Levene.

KL :#ñ | î = ñ | å
!
K^ :##ñ | î ≠ ñ | å

!
Como p-value = 0.777 (> 5%) não rejeito H0, logo assumo que as variância são
iguais entre as 2 amostras.

O teste a aplicar é o teste paramétrico t-student:

KL : lî = lå
!
K^ : lî ≠ lå

! 76
!
!

Como!o!p'value!=!0.008!(<!5%)!rejeito!H0!concluindo!que!existem!diferenças!significativas!
entre!as!temperaturas!de!conforto!dos!homens!e!das!mulheres.!

! !

! 77
Exercício 4

Neste estudo utiliza-se o teste Qui-quadrado uma vez que, apesar da tabela de
contingência ser de 2x2, as variáveis são diferentes (depressão associada à falta
de intimidade).

K0:#ÇãR#ℎá#QOOR`YQçãR#X[TUX#Q#PXaUXOOãR#X#Q#sQZTQ#PX#Y[TYSYPQPX
!
K1:#Ká#QOOR`YQçãR#X[TUX#Q#PXaUXOOãR#X#Q#sQZTQ#PX#Y[TYSYPQPX########

!
!

! 78
!

Dos indivíduos com depressão a percentagem que tem falta de intimidade é de …

Como p-value = 0, rejeito H0 e aceito H1, concluindo que há associação entre a


depressão e a falta de intimidade.

! 79
Exercício 7

!
Pesagem dos dados:

Aplicar o teste:

Como estamos a estudar a mesma variável e a tabela de contingência é de 2x2,


logo concluo que utilizo o McNemar.

KL :#a~ + = aq (+)
K^ : a~ + ≠ aq (+)

! 80
!

Nesta tabela só tem interesse o estudo dos pares discordantes.

Verifica-se que das 100 doentes com cefaleias frequentes que foram
submetidos……….. (só falar dos discordantes)

!
!

Da observação do teste, p-value = 0.007 (<5%), logo aceito H0, concluindo que
existem diferenças significativas.

! 81
Exercício 8

Estamos perante 2 amostras independentes, logo a informatização das mesmas


no SPSS é feita em 2 coluna (os dados) e na coluna ao lado a identificação da
amostra a que pertence.

!
Cálculo do CV:

CVEDTA = 25.55%
CVEspectometria = 26.545

! 82
Por esta análise descritiva verifica-se que o método espectrometria atómica tem
média ligeiramente superior ao EDTA e os valores máximos e mínimos são
superiores na amostra recolhida por espectrometria atómica.

De seguida vamos verificar a normalidade da diferença através do teste de


Shapiro-Wilks.

Falar dos mínimos e máximos………………….

KL : NO#PQPRO#PQ#QSROTUQ#OX\VXS#PYOTUYWVYçãR#PX#]QVOO##########
K^ : NO#PQPRO#PQ#QSROTUQ#[ãR#OX\VXS#PYOTUYWVYçãR#PX#]QVOO#
!

O output é:

!
!

Como p-value = 0.109 (> 5%), assim não rejeito H0 concluido que os dados da
diferença entre os 2 métodos seguem distribuição de Gauss. No entanto, a análise
gráfica apresenta resultados que indicam a não normalidade.

!
!

De seguida vamos verificar se a diferenças são simétricas.

! 83
!
^.L}^
= 1.4375 como este valor está entre -1.96 e 1.96 conclui-se que as diferenças
L.çp|
encontradas são simétricas.

Logo, o teste a aplicar é o de Wilcoxon.

lq = 0
!
lq ≠ 0

! 84
Como p-value = 0.105 (> 5%) não rejeito H0 concluindo que as diferenças
encontradas nos 2 métodos não são estatisticamente significativas.

Neste exercício podíamos considerar de imediato que há normalidedade neste


caso e aplicar-se-ia o teste t-pares.

lq = 0
!
lq ≠ 0

!
!

!
!

Como! p'value! =! 0.130! (>! 5%),! não! rejeito! H0,! concluindo! que! as! diferenças!
encontradas!nos!2!métodos!não!são!estatisticamente!significativas.!

! 85

Você também pode gostar