Escolar Documentos
Profissional Documentos
Cultura Documentos
Sexo: M ou F / 0 ou 1 / 1 ou 3
Idade: qq valor fracionrio a partir de 0.
Fisio 2001
M
80
15%
60
% 40
20
0
F Privada Pblica
Variveis
Categricas Numricas
Sexo Idade
Raa Peso
Estado Civil Distncia
Gravidade de doena Salrio
Anlise Exploratria de Dados
Tipos de Variveis
ASA
Anlise Exploratria de Dados
Tabelas
Grficos
Mapas
Medidas de resumo ou Estatsticas
Apresentao tabular
F
55%
Grfico de colunas
Grfico de barras
60
normal
Tipo de parto
cesrea
40
plvico
%
frcipe 20
6
5
4
3
2
1
0
1 2 3 4 5
Tabulao de variveis:
Ordinais
Quantitativas Discretas com poucos valores
Assemelha-se construo de tabelas de variveis
categricas nominais
Respeitar a ordem natural das categorias.
Permite acrescentar outro tipo de informao bastante
til freqncia percentual acumulada.
Recm-nascidos, segundo o grau de anxia
Grau de N FP FP
Anxia acumulada
Sem Anxia 94 22,12 22,12
Moderada 157 36,94 59,06
Severa 174 40,94 100,00
Total 425 100,00
Tabulao de variveis:
Ordinais
Quantitativas Discretas com poucos valores
Assemelha-se construo de tabelas de variveis
categricas nominais
Respeitar a ordem natural das categorias.
Permite acrescentar outro tipo de informao bastante til
freqncia percentual acumulada.
Recm-nascidos, segundo o grau de anxia
Grau de N % F%
anxia acumulada
Nenhuma 55 11,82 11,82
Leve 84 18,06 29,88
Moderada 152 36,69 62,57
Severa 174 37,42 100,00
Total 465 100,00
Tabulao de variveis:
Ordinais
Quantitativas Discretas com poucos valores
Nmero de consultas de pr-natal realizadas
durante a gestao dos recm-nascidos.
Consultas de N FP FP
pr-natal acumulada
0 106 33,12 33,12
1 15 4,69 37,81
2 34 10,62 48,44
3 50 15,62 64,06
4 47 14,69 78,75
5 23 7,19 85,94
6 32 10,00 95,94
7 9 2,81 98,75
8 1 0,31 99,06
9 0 0,00 99,06
10 3 0,94 100,00
Total 320 100,00
Grfico de variveis ordinais ou quantitativas discretas
com poucos valores
Grau de anxia
semanxia
22%
severa
41%
moderada
37%
No. de recm-nascidos
120
100
80
60
40
20
0
0 1 2 3 4 5 6 7 8 9 10
No. de consultas
Tabulao de variveis quantitativas
Criao de intervalos de valores (classes).
Permite acrescentar freqncia percentual acumulada.
Histograma
30
25
Recm-nascidos (%)
20
15
10
0
600 800 1000 1200 1400 1600
peso (g)
Grficos de variveis quantitativas
Polgono
(%) 0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
300 500 700 900 1100 1300 1500 1700
Peso (g)
Grficos de variveis quantitativas
Polgono
Diferentes formatos de histogramas
truncado multimodal
Histogramas com classes de tamanhos diferentes
25%
20%
15%
%
10%
5%
0%
0 1 5 10 13 15 20 25 30 35 40 45 50 55 60 99
Idade (anos)
5.0%
4.0%
Pac/ano (%)
3.0%
2.0%
1.0%
0.0%
0 10 20 30 40 50 60 70 80 90
Idade (anos)
Medidas de resumo ou estatsticas
15,0
10,0
5,0
0,0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39
salrios mnimos
Medidas de tendncia central
n
xi
Mdia Aritmtica X=
x1 x2 ... xn = i 1
n n
0 1 2 3 4 5 6 7 8 9 10
x
Mediana
Valor xi 1,20 1,22 1,23 1,25 1,26 1,27 1,28 1,29 1,30
(metros): 1,80
X=1,31
Ordem: 1 2 3 4 5 6 7 8 9
x n x n
1
2 2
m
d 2
Medidas de tendncia central
Boxplot
C o m p r im e n to d o R N
50
Observaes Extremas
45 Q3 + 1,5 DQ = 39 + 6 = 45
Q3 = 3 Quartil = 39
40
Q2 = 2 Quartil = 38 DQ = 4
35 Q1 = 1 Quartil = 35
30
Mnimo
300
312
1171
1247
851
1036 92
817
302
246 122
151
200 593
634
957 329
50
1093
859
276
298
625
316
911
812
1056
741 365
839
833
692
743 996
125
295
745
1233
300
1227
435
45
1253
871
513
100
300
312
1171
1247
SIST2
851
92
1036
0 302
817
151 122
246
200 957
634
298
625
316
1093
50
593
329
859
276
N= 563 704 365
812
911
741
839
295
996
125
745
1233
300
435
1227
743
575
39
402
1 2 731
71
840
1248
1086
256
347
528
24
1164
964
1015
436
1027
137
884
293
680
335
558
1252
693
1235
69
364
SEXO
100
1106
1000
523
SIST2
0
N= 909 358
0 1
OB27
Salrios Mnimos
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
4.5
5.0
5.5
6.0
6.5
Rondnia
Amazonas
Par
Tocantins
Piau
percentil 80
Pernambuco
Sergipe
percentil 20
Minas Gerais
Med.
Rio de Janeiro
Paran
mediana e aos percentis 80 e 20
Mato Grosso
Distrito Federal
Medidas de disperso
Amplitude
Desvio mdio
Varincia
Desvio padro
Coeficiente de variao
Distncia interquartlica
Disperso ou variabilidade
Medidas de disperso Notas
0 1 2 3 4 5 6 7 8 9 1
0
Aluno A: 5 - 5 - 5 - 5
Aluno B: 4 - 4 - 6 - 6
Aluno C: 3 - 5 - 7 - --
Aluno D: 0 - 5 - 5 - 10
Aluno E: 0 - 0 - 10 - 10
Amplitude
x1 = 0 d1=0-5 = -5 5 25
x2 = 0 d2=0-5 = -5 5 25
x3 = 10 d3=10-5 = 5 5 25
x4 = 10 d4=10-5 = 5 5 25
( x i ) 2
n _
( xi x) 2
i
x 2
n
i 1
V ( x)
n 1 n 1
(4 5) 2 (4 5) 2 (6 5) 2 (6 5) 2 4
V B ( x) 1,33
4 1 3
C
Coeficiente de variao
O desvio padro, isoladamente, tem interpretao limitada sobre a variabilidade de
um conjunto de dados.
Medida de disperso nula sabe-se imediatamente que o conjunto de dados
composto por valores iguai.
Quando deseja-se comparar uma varivel entre grupos que apresentam valores com
ordens de grandeza distintas.
Supondo a comparao de renda entre um grupo de indivduos desprivilegiado
economicamente, com mdia de renda de 1 salrio mnimo e desvio padro de 1
salrio mnimo, com outro grupo privilegiado economicamente, cuja mdia de renda
de 30 salrios mnimos e mesmo desvio padro do primeiro grupo.
Grupo A Grupo B
Renda (salrios mnimos) 1 (1) 30 (1)
mdia (desvio padro)
Supondo uma outra situao onde deseja-se comparar duas variveis diferentes
para um grupo de indivduos
s( x)
CV ( x) _
x 100
x
Faixas de referncia
N % N % N % (%) 80
70
60
50
40
Sim 155 54,2 131 45,8 286 73,1 30
20
10
0
No 30 28,6 75 71,4 105 26,9 pr-natal sem pr-natal
Obeso* No Sim
No 871 236 1107 90
% linha 78.7% 21.3% 78.7
80
% coluna 91.4% 75.2% 87.4%
Sim 82 78 160 70
%
40
75.2% 24.8% 100.0%
30
* Obeso=sim: IMC 30 kg/m2 21.3
20
10
0
No Sim
Obeso
Normotenso Hipertenso
100
91.4
90
80 75.2
70
60
50
40
30 24.8
20
8.6
10
0
Normotenso Hipertenso
Hipertenso
No Sim
Srie histrica entre grupos
12000
N de casos
8000
4000
0
84 85 86 87 88 89 90 91 92 93 94 95 96
Homem Mulher Anos
Variveis quantitativa e categrica
40 1200
30
%
1000
20
10 800
0 600
masc fem
400
PESO
Sexo
200
N= 207 249
1 2
baixissimo muito baixo baixo
SEXO
Variveis quantitativa e categrica
Sexo Peso em g
Mdia Desvio
Padro
Masculino 1162,4 271,3
1400
1200
1000
800
600
PESO
400
20 30 40 50
COMPRIM
Duas variveis quantitativas
Diagrama de espalhamento ou scatterplot
Relao entre IMC e presso arterial sistlica adultos I.Gov.
300
200
100
SIST2
0
10 20 30 40 50
BMI
Coeficiente de correlao de Pearson
xy x y
r n
( x) 2 ( y ) 2
x
2
y
2
n n
Mapas de pontos
Polgono ou estrela