Escolar Documentos
Profissional Documentos
Cultura Documentos
a Uma Dimensão
1
1.Distribuição de Frequências
Variável:
Representa determinadas características ou atributos
de uma população. A notação utilizada para as
variáveis corresponde habitualmente às letras X, Y e
Z.
Uma variável pode ser qualitativa ou quantitativa
discreta ou contínua.
Distribuição de frequências:
Conjunto de todos os valores ou modalidades de uma
variável e do correspondente número de ocorrências.
Xi ni fi Ni Fi
x1 n1 f1 N1 F1
x2 n2 f2 N2 F2
. . . .
.
. . . .
.
. . . .
.
xk nk fk Nk=n Fk=1
n 1 - -
3 6 4 5
4 2 3 3
2 4 5 4
7 3 3 6
4 5 4 3
2 2 0.10 2 0.10
3 6 0.30 8 0.40
4 6 0.30 14 0.70
5 3 0.15 17 0.85
6 2 0.10 19 0.95
7 1 0.05 20 1.00
Total 20 1 - -
Gráfico de barras
7
6
Frequência absoluta
5
4
3
2
1
0
2 3 4 5 6 7
nº de refeições
1,2
0,8
0,6
0,4
0,2
0
1 1 2 2 33 4 4 5 56 6 7 7 8
Variáveis contínuas
Quadro de Frequências:
n = 121
Regra 3: K = 7 (27=128 e 26=64)
Xmax = 198 Xmin = 122
a = (198 - 122)/7 =10,86 ≈ 11
a = 11 (por excesso)
Total 121 1
Histograma de Frequências:
Histograma de Frequências:
Se as classes tiverem amplitudes diferentes, ai, os
rectângulos têm base ai e altura igual à respectiva
densidade, ou seja, frequência (absoluta ou relativa)
dividida pela amplitude do intervalo de classe, ai .
Polígono de Frequências:
Tensão arterial
60
50
40
30
20
10
0
]111,122] ]122, 133] ]133, 144] ]144, 155] ]155, 166] ]166, 177] ]177, 188] ]188, 199] ]199,210]
1.2
0.8
0.6
0.4
0.2
0
]122, 133] ]133, 144] ]144, 155] ]155, 166] ]166, 177] ]177, 188] ]188, 199]
Tensão arterial
60
50
40
30
20
10
0
]111,122] ]122, 133] ]133, 144] ]144, 155] ]155, 166] ]166, 177] ]177, 188] ]188, 199] ]199,210]
42 35 10 12 50 72 24 28 7 3
49 53 36 18 62 68 81 31 20 43
61 40 35 21 6 11 83 50 72 44
38 30 51 49 12 45 60 32 71 49
Tipo Variáveis
de Nominais Ordinais Quantitativas
Frequências
Discretas Contínuas
Absolutas X X X X
Relativas X X X X
Acumuladas X X X
Média Aritmética:
É a medida de tendência central mais
utilizada e de mais fácil interpretação.
Notação:
Parâmetro da população - µ
Estatística referente à amostra - x
Média Aritmética
Dados desagregados (casos discreto e contínuo):
Número total n Valores que a
1
de elementos X
n Xi variável X
pode assumir
i 1
Dados agregados (caso discreto):
k
X fi X i
i 1 Frequência relativa
(simples)
Dados agregados em classes (caso contínuo):
k Ponto médio
X fiCi da classe
i 1
Ano Letivo 2023/2024 Estatística Aplicada à Saúde 41
2.Medidas de Localização
Vantagens e Desvantagens da Média Aritmética
Vantagens: a média é calculada a partir de todas as
observações (não há perca de informação).
Concluindo:
A média aritmética é uma medida de localização sensível
e pouco resistente.
Uma medida de localização mais resistente é a Mediana.
xi ni Ni
0 4 4 n = 10 (par)
1 1 5 00001 22344
2 2 7
3 1 8 Mediana = (1+2)/2 = 1,5
4 2 10
Total 10
X ( n 1) / 2 , se n é impar
X Md ( X n / 2 X ( n / 2)1 )
, se n é par
2
Mediana
Exemplo: Consideremos a variável aleatória X com os
valores {5, 2, 8, 7, 10, 4}.
1º - Ordenar por ordem crescente
{2, 4, 5, 7, 8,10}
Classes ni fi Fi
Total 30 1
0,35 0.33
0.30
0,30 X --- 0,2
Frequências relativas
0,2 2 0,2 2
0,80
M 2 M 2
0,33 0,33
0.63
0,60
M = 2 + 1,21 = 3,21
0,40 0.30
0,20 Mediana = 3.21
0.5
0,00 M
[0,2] ]2,4] ]4,6] ]6,8] ]8,10]
utilizando o histograma
das frequências relativas
Mediana absolutas
Ano Letivo 2023/2024 Estatística Aplicada à Saúde 49
2.Medidas de Localização
Mediana
0.5 - F(Me-1)
(M-1)
Mediana = L InfMe+ aMe
fM e
Classes ni fi Fi
Total 30 1
Moda
Observação que tem maior frequência.
000012234
Moda = 0
f **
Moda LInf aMo
f * f **
Classes ni fi 0.2
[0,2] 9 0.30 Moda = 2 + ×2
0.3 + 0.2
]2,4] 10 0.33
]4,6] 6 0.20
]6,8] 3 0.10 Moda = 2.8
]8,10] 2 0.07
Total 30 1
Desvantagens:
Não pode ser definida com rigor;
O seu valor exacto é muitas vezes incerto.
k
X fi X i
i 1
X ( n 1) / 2 , se n é impar
X Md ( X n / 2 X ( n / 2) 1 )
, se n é par
2
k
X fiCi
i 1
Quartis;
Decis;
Percentis.
Q1 Q2 Q3
5 6 7 7 7 8 8 8 9 10 12
Q1 Q2 = Md Q3
X k X k 1 np
, se k é int eiro
2 100
Pp
X , se k np não é int eiro
k 1 100
Idade ni fi Fi (%)
15 18 0.18 18
16 10 0.10 28
18 24 0.24 52
20 12 0.12 64
22 15 0.15 79
30 21 0.21 100
P F( P 1)
Pp LInf P aP
fP
L InfP limite inferior da classe do percentil;
aP amplitude da classe do percentil;
FP-1 frequência relativa acumulada da classe anterior à classe do percentil;
fP frequência relativa simples da classe do percentil.
ap=0.2
Intervalo Interquartis:
Diferença entre o 3º quartil e o 1º quartil (engloba
50% das observações centrais)
IQ = Q3 - Q1
Dados desagregados
1 n
n i 1
Xi X
f i Ci X
i 1 Ponto médio
da classe
n
1
V(X) = S = i
2
2 X X (amostra)
n i 1
n
(X i X )2
S '2 i 1
(corrigida)
n 1
Dados agregados
k
S fi ( X i X )2
2
i 1
Mede igualmente o
Dados agregados em classes grau de dispersão
k
S f i (C i X ) 2
2
dos valores da
i 1
variável em torno da
Ano Letivo 2023/2024 Estatística Aplicada à Saúde média. 80
3.Medidas de Dispersão
Desvio padrão: raiz quadrada da variância.
S = V(X)
Exemplo:
Aluno Nota
A 3 (3-5)²=4
B 7 (7-5)²=4
C 6 (6-5)²=1
D 5 (5-5)²=0
E 4 (4-5)²=1
s
CV = × 100
X
Média = 40,0
Desvio absoluto médio = 18,9
Variância = 480,6
Desvio padrão = 21,92
Cv = 54,8%
Caderno 1 (Ex. 9)
81,5
50,0
47,5
63,5
65,1
63,2
64,5
81,5 (81,5-63,95)²=308,0
(X i X )2
S '2 i 1
50,0 (50,0-63,95)²=194,6 n 1
47,5 (47,5-63,95)²=270,6
=925,7
63,5 (63,5-63,95)²=0,2
65,1 (65,1-63,95)²=1,3
3º Calcular a variância
63,2 (63,2-63,95)²=0,6
64,5 (64,5-63,95)²=0,3
Identificação de outliers
Candidato a outlier
Xi < Q1 ou Xi > Q3
Outlier moderado
Outlier severo
Exemplo 3 – continuação
Histograma
Severos
402 minutos
403 minutos
Distribuição Distribuição
assimétrica positiva Distribuição simétrica assimétrica negativa
Grau de assimetria:
3 (Média – Mediana)
G=
Desvio padrão
X - Mo
G1=
s
Desvio padrão
Q3 + Q1 - 2Me
G2 =
Q3 - Q1
n
n xi x
3
g1 i 1
xi x
4
n(n 1) (n-1)2
G2 i 1
3
(n-1)(n-2)(n-3) S '4 (n-2)(n-3)
Exercícios 12
23
23
30
36
b) Em relação ao BDI: 40
40
a. Calcule o percentil 80 e interprete-o. 40
40
40
X k X k 1 np
, se k é int eiro 44
2 100 44
Pp 45
X , se k np não é int eiro 45
k 1 100 45
45
48
1º Calcular k 48
50
50
K não é inteiro P80=X21 50
50
50
50
57
57
80% dos cuidadores apresentaram resultados iguais ou inferiores a 50
no inventário depressivo de Beck.
Máximo (Xmax) = 57 48
50
Mínimo (Xmin) = 12 50
50
Intervalo Interquartis (IQ) = 50
50
50
57
57
k 1 100
40
44
44
45
P50=Q2
45
45
45
48
48
50
P75=Q3 50
50
50
50
50
57
57
Calcular barreiras
Barreira Exterior Inferior (BEI):
Q1 – 3 IQ = 40 – 3x10=10
Barreira Exterior Superior (BES):
Q3 + 3 IQ = 50 + 3x10=80
Barreira Interior Inferior (BII):
Q1 – 1,5 IQ= 40 – 1,5x10=25
Barreira Interior Superior (BIS):
Q3 + 1,5 IQ = 50 + 1,5x10=65
10 25 65 80 50
50
S fi ( X i X )
2 2
45 4 1,154
48
48
i 1
48 2 0,077 50
50
50 6 0,231 50
50
57 2 0,077 50
50
26 1,000 57
57
xi ni fi (xi-x̅)² fi(xi-x̅)²
12 1 0,038 (12-42,38)²=922,94 35,50
23 2 0,077 (23-42,38)²=375,58 28,89
30 1 0,038 (30-42,38)²=153,26 5,89
36 1 0,038 (36-42,38)²=40,70 1,57
40 5 0,192 (40-42,38)²=5,66 1,09
44 2 0,077 (44-42,38)²=2,62 0,20
45 4 1,154 (45-42,38)²=6,86 1,06
48 2 0,077 (48-42,38)²=31,58 2,43
50 6 0,231 (50-42,38)²=58,06 13,40
57 2 0,077 (57-42,38)²=213,744 16,44
26 1,000 112,88 V(x)