Você está na página 1de 18

Componente de Análise de Dados

Curso de Licenciatura em Enfermagem


3.º ano [5.º semestre] – 2020/2021

MATERIAL DE APOIO AO ESTUDO

Professor Luís Manuel de Jesus Loureiro


Professor Luís Loureiro
 Dados classificados
K F
2–4 40
4–6 85
6–8 170
8 – 10 85
10 - 12 35

n 415
• Quartis (Qj) j=1; j=2 ; j=3 Qj = xi → i = J
4
Intrapolação:

• Decis (Dj) j=1; j=2; …; j=9 n i−' Fac


Dj = xi → i = J
10 Sp = li + h
F
n Sp – separatiz a calcular.
• Percentis (Pj) j=1; j=2; …; j=99 Pj = xi → i = J
100 i – Ordem da separatiz na série.
(Centis)

Professor Luís Loureiro


Localização quantílica de um valor (x) na série de dados classificados.

P: Determinar a localização percentílica (P) de um recém-nascido com 47 cm de estatura.

Estatura (cm) Fi Faci


30 - 35 14 14
35 - 40 21 35 (x)
40 - 45 32 67
J
(P)
= i  100
n
45 - 50 68 135
50 - 55 36 171
171
(x) (x − li)Fi
i =' Fac +
hi

R: J(P)=55,09 P55<47<P56

Professor Luís Loureiro


Professor Luís Loureiro
Permitem-nos conhecer a forma como os valores da variável estatística se distribuem («dispersam»)
em torno dos valores centrais.

C.S. - A 12 17 23 23 23 29 34
C.S. - B 21 22 23 23 23 24 25
A B

Ki Fi Ki Fi
12 1 21 1
17 1 22 1
23 3 23 3
29 1 24 1
34 1 25 1

Média = 23 anos; Mo = 23 anos; Md = 23 anos; AV= 22 anos Média = 23 anos; Mo = 23 anos; Md = 23 anos; AV= 4 anos

Amplitude (intervalo) de variação:


Professor Luís Loureiro
AV= xn-x1 em que xn (Máximo); x1 (Mínimo)
Só considera os extremos
Desvio: di = xi − X  di = (xi − X) = 0

Desvio Absoluto: DAi =| xi − X |  DAi = | xi − X |


2
di  (xi − X )
2 2
di (xi − X )
2 =
=
Quadrado dos Desvios:

Grupo A Grupo B

xi − x | xi − x | (xi− x) xi − x | xi − x | (xi− x)
2 2
Xi Xi
31 -17 17 289 18 -30 30 900
44 -4 4 16 24 -24 24 576
48 0 0 0 36 -12 12 144
48 0 0 0 48 0 0 0
48 0 0 0 48 0 0 0
52 +4 4 16 75 +27 27 729
65 +17 17 289 87 +39 39 1521
0 42 610 0 132 3870

 Estas medidas não têm em conta diferenças de n


Professor Luís Loureiro
xi Fi F ix i x i2 F ix i2
1 18 18 1 18
201
2 10 20 4 40 S2 = − 3,89 = 1,54
3 4 12 9 36 37
4 2 8 16 32
5 3 15 25 75 s= 201
37
− 3,89 = 1,24partos
37 73 201

n
Desvio Absoluto Médio DAM =
 F |x − X|
i i Sˆ = S
n −1
= 1,26partos
n
2
 Fi(xi − X)  Fixi2
Variância 2
S = = − X2
n n
2
 Fi(xi − X )  Fixi2 2
Desvio Padrão S = S =
2 = −X
n n

Professor Luís Loureiro


Dispersão Relativa em Relação à Média
s
- Coeficiente de Variação (CV) CV =  100
x
CV ≤ 15% Dispersão fraca - «homogénea»
15% < CV ≤ 30% Dispersão média - «heterogénea»
CV > 30% Dispersão elevada - «heterogénea acentuada»

Relação entre a média e o desvio padrão numa distribuição normal


Professor Luís Loureiro
Amplitude Interquartilica: Q = Q3 − Q1
(AIQ - Amplitude Inter-Quartis)

Amplitude Semi Interquartílica (AISQ): Q3 − Q1


AISQ =
ESIQ (Espaço Semi-Inter-Quartilico) 2
Q contém os 50% dos elementos
mais centrais.
Diagramas de «extremos e quartis».

Limite superior

 2.º Quartil (Mediana)

 1.º Quartil

Professor Luís Loureiro


Limite superior
Professor Luís Loureiro
Assimetria: desvio ou afastamento da simetria de uma
distribuição. Uma distribuição simétrica é aquela cujas
frequências de distribuem simetricamente em relação Distribuição simétrica
ao eixo central (eixo da simetria)

Figura seguinte ab é o eixo da simetria

b
Fi

a x = Mo = Md
Xi
(x - Mo = 0)

x  Mo  Md x  Mo  Md
(x - Mo  0) Professor Luís Loureiro (x - Mo  0)

Assimétrica à direita (positiva) Assimétrica à esquerda (negativa)


x − Mo Interpretação:
CP( a1) = Se CP(a1) = 0; então (x - Mo = 0)  a distribuição é simétrica
s
Se CP(a1) > 0; então (x - Mo  0)  distribuição é assimétrica positiva
Se CP(a1) < 0; então (x - Mo  0)  distribuição é assimétrica negativa

3( x − Md)
CP( a 2) = Interpretação:
s Da aplicação desta fórmula, os resultados variam no intervalo [-3; +3], sendo a
assimetria tanto maior quanto mais elevado, em termo absoluto, for esse valor.
Exemplo:

Ki Fi
0–4 10 8,88 − 6,5
x? CP(a1) = = 0,44
4–8 15 5,42
8 – 12 12 s?
12 – 16 7
Mo? Interpretação:
16 – 20 4 Distribuição com assimetria positiva com um
20 – 24 2 «grau» de 0,44 ou 44%.

n=50 Professor Luís Loureiro


nFi (x i − x)3
Coeficiente utilizado pelo SPSS baseia-se no 3.º momento:
Skewness = Sk
Sk =
(n − 1)(n − 2) s 3
Ponto médio (xi) Fi Fi (xi − x)3

19 33 -772801
30 511 -2790609
52 452 38241,24
77 271 6879677
n=1267 3354509

1267 x 3354509
Sk = = 0,462
3
(1266)(1265)x 18,39
No SPSS deve calcular-se o quociente entre esta estatística (sk) e o seu
erro padrão (std error), neste caso o std error é de 0,069, logo teremos
0,462/0,069 = 6,17.

– 1.96 0 + 1.96

Assimétrica Simétrica Assimétrica

Professor Luís Loureiro


Calculo da sk pelo SPSS
Exemplo: idade de 100 adolescentes seguidos numa consulta de um hospital pediátrico

idade

Cumulative
Frequency Percent Valid Percent Percent
Valid 10 14 14,0 14,0 14,0
11 20 20,0 20,0 34,0
12 12 12,0 12,0 46,0
13 21 21,0 21,0 67,0
14 9 9,0 9,0 76,0
15 14 14,0 14,0 90,0
16 10 10,0 10,0 100,0
Total 100 100,0 100,0

Estatísticas descritivas

Statistic Std. Error


idade Mean 12,73 ,192
Median 13,00
Variance 3,69
Std. Deviation 1,92
Minimum 10
Maximum 16
Range 6
Interquartile Range 3
Skewness ,202 ,241
Kurtosis -1,128 ,478

Cálculo do coeficiente:
sk/std error of sk = 0,202/0,241 = 0,838

Professor Luís Loureiro


Curtose (medidas de achatamento):
A observação de uma curva de frequências dá uma noção do achatamento ou afunilamento de uma distribuição, isto é, a
sua curtose. Tomando como referência a curva normal, as distribuições podem ser consideradas:

a) Leptocúrticas (perfil alongado)


b) Platicúrticas (topo achatado)
c) Mesocúrticas (perfil intermédio relativamente às anteriores)

a) b) c
 
 ( x − x ) 2 
1  i 
(Q 3 - Q1 )  
Coeficient e quartílico de achatament o (K) = 2 Coeficient e achatament o de Fisher (G2) =  N −3
P90 − P10 2
  ( x − x) 2  
 i  
(xi − x)2 4   N  
Xi (xi − x) 
Classes Fi 8 0 0
7 1 1
1–3 3 5 9 81  
1  232 
3–5 4 (9 - 7) 9 1 1
 
(K) = 2 = 0,143 8 0 0 G2 =  16  − 3 = −0,68
5–7 8 11,5 − 4,5 2
7 1 1   40  
7–9 30 10 4 16   16  
9 – 11 6 4 16   
8 9 1 1
11 – 13 4 7 1 1
Interpretação:
13 – 15 3
8 0 0
- Se G2 = 0 (Mesocúrtica)
10 4 16 - Se G2 > 0 (Leptocúrtica)
Interpretação:
1 9 81 - Se G2 < 0 (Platicúrtica)
N = 60 - Se K > 0,263 - Leptocúrtica
9 1 1
- Se K < 0,263 - Platicúrtica 8 0 0
- Se K = 0,263 - Mesocúrtica 6 4 16
Professor Luís Loureiro =40 =232
n(n + 1)F(x i − x)4 − 3s 4 (n − 1)
Coeficiente de kurtosis utilizado pelo SPSS baseia-se no 4.º momento: Kurtosis =
(n − 1)(n − 2)(n − 3) s 4

Tal como para a skewness, no SPSS deve calcular-se o quociente entre esta estatística (kurtosis) e o seu erro
padrão (std error), no exemplo das idades dos adolescentes será: -1,128/0,478= -2,36
Estatísticas descritivas
Separatrizes - SPSS
Statistic Std. Error
idade Mean 12,73 ,192 idade
Percentiles 10 10,00
Median 13,00
Variance
25 11,00
3,69
Std. Deviation 50 13,00
1,92
Minimum 75 14,00
10
Maximum 90 15,90
16
Range 6
Interquartile Range 3
Skewness ,202 ,241
Kurtosis -1,128 ,478

Xi Fi

8 1 – 1.96 + 1.96
7 1
5 1
9 1 platicúrtica; Mesocúrtica; Leptocúrtica;
8 1
7 1
10 1 Estatísticas descritivas

6 1 Statistic Std. Error


9 1 Idade Mean 8,00 ,408
7 1 Median 8,00
8 1 Variance 2,67
10 1 Std. Deviation 1,63
Minimum 5
11 1
Maximum 11
9 1
Range 6
8 1
Professor Luís Loureiro
Interquartile Range 2
6 1
Skewness ,000 ,564
Kurtosis -,458 1,091
Exercício

1. O estudo da qualidade de vida (QV) é uma variável fundamental para o conhecimento do


impacto da doença sobre as atividades de vida diária dos doentes com úlceras venosas/úlceras
varicosas (UV) crónicas.
Com o objectivo de avaliar a QV dos utentes com UV crónica, foi aplicado a versão portuguesa do
Cardiff Wound Impact Schedule (CWIS), cujos resultados da pontuação global (QVG) obtida se
apresentam na tabela seguinte (scores são expressos em percentagem de 0 a 100):

K F
0-20 9
20-40 29
40-60 32
60-80 16
1.1. Calcule: 80-100 6

a) A média
b) O desvio padrão
c) A mediana

1.2. Como classifica a simetria/assimetria da distribuição? Apresente os cálculos adequados.

1.3. De acordo com a resposta anterior, qual a medida de tendência central mais adequada para representar a
distribuição?

1.4. Qual o valor em pontos que apenas 25% da população apresenta igual ou superior?

1.5. Como classifica a distribuição quanto à sua dispersão relativa? Justifique com base em cálculos
adequados.

Você também pode gostar