Você está na página 1de 63

Universidade de So Paulo

Faculdade de Sade Pblica


Departamento de Epidemiologia

HEP170 Estatsticas de Sade


Mdulo: Bioestatstica

Professores responsveis
Denise Pimentel Bergamaschi
Gizelton Pereira Alencar

Participaram da elaborao do material didtico


Denise Pimentel Bergamaschi
Jos Maria Pacheco de Souza

So Paulo
2014

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

ndice
Tpicos
Populao, amostra, varivel, coleta de dados, apurao de dados e apresentao tabular
Tpicos iniciais de amostragem
Apresentao tabular

Pgina
4
5
11

Apresentao grfica: diagrama de barras, diagramas de setores circulares,


diagrama linear, histograma, polgono de frequncia, ogiva de frequncias

17

acumuladas.
Representao grfica de duas variveis qualitativas

27

Representao grfica de duas variveis quantitativas

29

Escala aritmtica e escala logartmica

32

Medidas de tendncia central e de disperso

37

Correlao e regresso linear simples

47

Regresso Linear Simples reta de regresso

53

Medidas de Associao

55

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

ndice de exerccios
Exerccio
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41

pgina
9
9
9
11
12
13
14
15
15
15
22
23
24
26
27
31
34
34
35
35
35
35
36
36
36
38
39
41
45
46
46
54
54
56
57
59
62
63
63
63
63

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

Populao, amostra, varivel, coleta de dados, apurao de dados e apresentao tabular.


A palavra estatstica vem do latim status e significa estado. Inicialmente, era utilizada para compilar
dados que descreviam caractersticas de pases (Estados). Em 1662, John Graunt publicou estatsticas
de nascimentos e mortes. A partir de ento, o estudo dos eventos vitais e da ocorrncia de doenas e
bitos impulsionou o desenvolvimento da Estatstica nos campos terico e aplicado (Triola, 1999).
Atualmente, ndices e indicadores estatsticos fazem parte do dia a dia, tais como taxa de inflao,
ndice de desemprego, taxa de natalidade, taxa de crescimento populacional, ndice de poluio atmosfrica, ndice de massa corporal, entre outros.
Estatstica: uma coleo de mtodos para planejar experimentos, obter e organizar dados, resumilos, analis-los, interpret-los e deles extrair concluses (Triola, 1999).
Bioestatstica Estatstica aplicada s cincias da vida.

Nveis de mensurao
Escala nominal
Os indivduos so classificados em categorias segundo uma caracterstica.
Ex: sexo (masculino, feminino), hbito de fumar (fumante, no fumante), sobrepeso (sim, no).

No existe ordem entre as categorias e suas representaes, se numricas, so destitudas de significado numrico.
Ex:

sexo masculino=1, sexo feminino = 2.


Os valores 1 e 2 so apenas rtulos.

Escala ordinal
Os indivduos so classificados em categorias que possuem algum tipo inerente de ordem. Neste caso,
uma categoria pode ser "maior" ou "menor" do que outra.
Ex:

nvel scio-econmico (A, B, C e D; onde A representa maior poder aquisitivo);


nvel de retinol srico (alto, aceitvel, baixo, deficiente) onde alto: maior ou igual a 50,0
g/dl; aceitvel: 20,0 a 49,9 g/dl; baixo: 10,0 a 19,9 g/dl; deficiente: menor ou igual a 10,0
g/dl. Estes critrios so do Commitee on Nutrition for National Defense ICNND/USA, 1963 (in
Prado MS et al, 1995).

Embora exista ordem entre as categorias, a diferena entre categorias adjacentes no tem o mesmo
significado em toda a escala.
Escala numrica intervalar
Este nvel de mensurao possui um valor zero arbitrrio.
Ex: temperatura em graus Celsius.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

Escala numrica de razes possui zero inerente natureza da caracterstica sendo aferida.
Escala de razes discreta: o resultado numrico da mensurao um valor inteiro.
Ex:
nmero de refeies em um dia (nenhuma, uma, duas, trs, quatro, ...),
frequncia de consumo semanal de determinado alimento (1 vez, 2 vezes, 3 vezes, 4 vezes, 5
vezes, 6 vezes, 7 vezes) .
Escala de razes contnua: o resultado numrico um valor pertencente ao conjunto dos nmeros
reais R ={-; ...; 0; 0,2; 0,73; 1; 2,48;...; +}.
Ex:
idade (anos), peso (g), altura (cm),nvel de retinol srico (g/dl), circunferncia da cintura
(cm).
Comparando-se as escalas intervalar e de razes contnua
material
A
B
C

0
C
20
40
60

comprimento
A
B
C

0
F
68
104
140

cm
20
35
40

|dif0C|
|A-B|=20
|B-C|=20
|A-C|=40

polegada
50,8
88,9
101,6

|dif 0F|
|A-B|=36
|B-C|=36
|A-C|=72

|difcm|
|A-B|=15
|B-C|=5
|A-C|=20

dif0C/dif0F
0,56
0,56
0,56

|dif pol|
|A-B|=38,1
|B-C|=12,7
|A-C|=50,8

razo0C
A/B=0,50
B/C=0,67
A/C=0,33

Difcm/difpol
0,394
0,394
0,394

razo0F
A/B=0,65
B/C=0,74
A/C=0,49

Razocm
A/B=0,571
B/C=0,875
A/C=0,5

Razo0C/razo0F
0,77
0,91
0,67

Razopol
A/B=0,571
B/C=0,875
A/C=0,5

Razocm/razopol
1
1
1

De acordo com os nveis de mensurao, pode-se classificar a natureza das variveis segundo a
escala de mensurao em:

VARIVEL:

qualitativa

quantitativa

nominal
ordinal
discreta
contnua

O tipo da varivel ir indicar a melhor forma para o dado ser apresentado em tabelas e
grficos, em medidas de resumo e, a anlise estatstica mais adequada.

Coleta de dados
a observao e registro da categoria ou medida de variveis relacionadas ao objeto de estudo que
ocorrem em unidades (indivduos) de uma amostra ou populao.

Tpicos iniciais de amostragem


Populao: totalidade de elementos sob estudo. Apresentam uma ou mais caractersticas em comum.
Supor o estudo sobre a ocorrncia de sobrepeso em crianas de 7 a 12 anos no Municpio de So
Paulo.
Populao alvo todas as crianas nesta faixa etria deste municpio.
Populao de estudo crianas matriculadas em escolas.
Elementos: so unidades de anlise; podem ser pessoas, domiclios, escolas, creches, clulas ou qualquer outra unidade.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

Amostra: uma parte da populao de estudo.


Amostragem: processo para obteno de uma amostra. Tem como objetivo estimar parmetros populacionais.
Parmetro: Quantidade fixa de uma populao.
Ex: peso mdio ao nascer de crianas que nascem no municpio de So Paulo ( = 3100 g);
Proporo de crianas de 7 a 12 anos classificadas como obesas, no municpio de So Paulo
( = 12%).
Estimador: uma frmula matemtica que permite calcular um valor (estimador por ponto) ou com
um conjunto de valores (estimador por intervalo) para um parmetro.
N

X
Ex: Mdia aritmtica: X =

i =1

onde

= X 1 + X 2 + ... + X N e N = nmero de observaes.

i =1

Estimativa: Valor do estimador calculado em uma amostra. Estima o valor do parmetro.


Ex: Peso mdio ao nascer, calculado em uma amostra de 120.000 crianas nascidas no Municpio de
So Paulo no ano de 2000: mdia amostral = x = 3000 g .
Indicaes para utilizar uma amostra
Populao muito grande
Processo destrutivo de investigao
Novas terapias
Vantagens de realizar um estudo com amostragem:
Menor custo
Menor tempo para obteno dos resultados
Possibilidade de objetivos mais amplos
Dados possivelmente mais fidedignos
Desvantagens
Resultados sujeitos variabilidade
Tipos de Amostragem
Probabilstica: cada unidade amostral tem probabilidade conhecida e diferente de zero de pertencer
amostra. usada alguma forma de sorteio para a obteno da amostra.
No probabilstica: no se conhece a probabilidade de cada unidade amostral pertencer amostra.
Algumas unidades tero probabilidade zero de pertencer amostra.
Ex: amostragem intencional; por voluntrios; acesso mais fcil; por quotas.
Tipos de amostragem probabilstica:
- aleatria simples (com e sem reposio);
- sistemtica;
- com partilha proporcional ao tamanho do estrato;
- por conglomerado.
Amostragem aleatria simples (AAS)

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

o processo de amostragem onde qualquer subconjunto de n elementos diferentes de uma populao de N elementos tem mesma probabilidade de ser sorteado (NN, 1998). Tamanho da populao:
N; tamanho da amostra: n; frao global de amostragem ou probabilidade de sortear um indivduo =

n
.
N

necessrio ter um sistema de referncia que contenha todos os elementos da populao


da qual ser retirada a amostra;
Utilizao da tabela de nmeros aleatrios mecnica;
Utilizao de programas computacionais.

Amostragem sistemtica
Utiliza-se a ordenao natural dos elementos da populao (pronturios, casa, ordem de nascimento).

Intervalo de amostragem

k=

N
n

, onde N= tamanho da populao e n = tamanho da amos-

tra
Incio casual i, sorteado entre 1 e k, inclusive
Amostra sorteada composta pelos elementos: i, i+k, i+2k, ...., i+(n-1)k

OBS: necessrio ter cuidado com a periodicidade dos dados, por exemplo se for feito sorteio de dia
no ms, pode cair sempre em um domingo onde o padro de ocorrncia do evento pode ser diferente.
Exemplo: N=80; n=10;

k=

N 80
=
= 8 ; incio casual: 1 i 8
n 10

Comeo casual sorteado: i=4


Amostra composta dos elementos:
i ..............
i+k ..
i+2k .
i+3k .
i+4k .
i+5k .
i+6k .
i+7k .
i+8k ...
i+(n-1)k .

4
12
20
28
36
44
52
60
68
76

Se o intervalo de amostragem no for inteiro proceder da seguinte forma:


N= 321 ; n=154; K =

N 321
=
= 2,084
n 154

i deve ser um nmero sorteado entre 1 e 2,084


Sortear um nmero entre 1000 e 2084 e dividir o resultado por 1000
Nmero sorteado = 1941, portanto i=1,941

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

Indivduos:
i
i+k
i+2k
i+3k
.
.
.
i+(n-1)k

elemento
1
4
6
8
.
.
.
320

1,941
1,941+2,084 = 4,025
1,941+4,1680 = 6,109
1,941+6,252 = 8,193
.
.
.
1,941+318,852 = 320,793

Amostragem casual simples estratificada com partilha proporcional


A populao possui estratos com tamanhos:
N1; N2; N3, onde a soma dos estratos o tamanho da populao, ou seja

=N

A amostra deve conter os elementos da populao nas mesmas propores dos estratos. Tem-se que
os tamanhos dos estratos amostrais so n1, n2 e n3 tal que

=n

Aplicando-se a proporo:

ni N i
N
=
ni = n i
n
N
N
Exemplo:
N=500; N1=50; N2=150; N3=300 e n=40

Estrato i
1
2
3
Total

n1 = 40

Tamanho do estrato
na populao
na amostra
Ni
ni
50
4
150
12
300
24
500
40

ni N i
=
n
N
0,1
0,3
0,6

50
150
300
= 4 ; n2 = 40
= 12 ; n3 = 40
= 24
500
500
500

Amostragem por conglomerado:


O conglomerado um conjunto de elementos formando uma unidade amostral. Se a unidade amostral for indivduo e forem sorteados domiclios, ento a amostragem por conglomerado.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

Exerccio 1 -Classificar quanto a natureza, as seguintes variveis


Varivel
Condio de sade (doente, no doente)
Tipo de parto (normal, cesreo)
Nvel de colesterol srico (mg/100cc)
Tempo de um procedimento cirrgico (minutos)
Nmero de praias consideradas poludas
Custo do procedimento (reais)
Peso (g)
Estado nutricional (desnutrio, eutrofia, sobrepeso, obesidade)
Consumo de energia (Kcal)
Realizao da refeio caf da manh (sim/no)
Nmero de escolares por srie
Realizao de atividade fsica diria (sim/no)
Tempo assistindo TV/dia (< 2h, 2 a 4h, >4h)
Pores consumidas por grupo de alimentos
Percentual de gordura corporal (%)

Tipo (natureza)

Exerccio 2 -Os dados a seguir so de peso (kg) de 80 mulheres identificadas pela varivel id (identificao).
Id Peso Id peso Id Peso
Id
Peso Id Peso Id Peso
1
65
16
71
31
70
46
75
61
68
76
75
2
65
17
84
32
72
47
79
62
69
77
79
3
58
18
63
33
75
48
79
63
76
78
73
4
59
19
64
34
76
49
82
64
77
79
82
5
67
20
65
35
77
50
83
65
80
80
76
6
68
21
74
36
78
51
65
66
81
7
74
22
81
37
80
52
68
67
59
8
81
23
66
38
82
53
75
68
64
9
66
24
69
39
63
54
76
69
70
10
61
25
71
40
66
55
78
70
80
11
64
26
71
41
72
56
78
71
85
12
65
27
72
42
72
57
81
72
70
13
67
28
73
43
72
58
85
73
71
14
68
29
75
44
73
59
66
74
72
15
70
30
77
45
73
60
68
75
72
Fonte: Osborn JF. Statistical Exercises in Medical Research. John Wiley & Sons Inc., 1979. (adaptado).
a)
b)
c)
d)

Sorteie uma amostra aleatria de tamanho 20 utilizando a tabela dos nmeros equiprovveis.
Apresente os valores do peso dos indivduos sorteados.
Some os valores e divida pelo tamanho da amostra (nmero de valores).
Este valor o parmetro, o estimador ou a estimativa do peso mdio?

Exerccio 3 Utilize os dados do exerccio 2.


a) Sorteie uma amostra sistemtica de tamanho 20. Indique o intervalo de amostragem e o comeo casual sorteado. Indique o nmero de identificao de cada elemento da amostra.
b) Some os valores e divida pelo tamanho da amostra (nmero de valores).
c) Compare com o peso mdio obtido no exemplo 2. Voc esperaria o mesmo resultado? Justifique.
d) Qual dos dois valores voc diria que representa melhor o conjunto de dados? Justifique.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

Apurao de dados
Processo no qual conta-se o nmero de vezes que a varivel assumiu um determinado valor (frequncia de ocorrncia). Pode ser manual, mecnica ou eletrnica (programas estatsticos: Epi info, Stata,
Excel, SPSS, SAS, R, S-Plus).
Distribuio de frequncias - correspondncia entre categorias (valores) e frequncia de ocorrncia.
Distribuio de frequncias com dados pontuais e em intervalos de classe
Notao:
X : varivel
xi : valor observado para o indivduo i
Apresentao pontual
Ex: 9 indivduos
X: nmero de refeies dirias
x: 2, 3, 3, 1, 5, 2, 3, 2, 3
Apurao:
nmero de refeies
1
2
3
5

frequncia absoluta
1
3
4
1

X: idade (anos inteiros)


x: 5, 5, 15, 20, 20, 20, 21, 21, 22, 22
idade
frequncia
5
2
15
1
20
3
21
2
22
2
X: peso ao nascer em gramas
X: 2250, 3025, 1600, 2725, 3750, 3950, 2400, 2180, 2520
peso
frequncia
1600
1
2180
1
2250
1
2400
1
2520
1
2725
1
3025
1
3750
1
3950
1

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

10

Altura em metros
X: 1,63; 1,60; 1,59; 1,60; 1,45; 1,73; 2,05; 1,85
altura
frequncia
1,45
1
1,59
1
1,60
2
1,63
1
1,73
1
1,85
1
2,05
1

Apresentao tabular
Elementos essenciais: ttulo, corpo, cabealho e coluna indicadora.
Tabela 1 - Ttulo: o que (natureza do fato estudado)?como (variveis)?onde? quando?
Varivel
%
n

Total
Fonte
notas, chamadas
OBS: nenhuma casela (interseco entre linha e coluna) deve ficar em branco.
A tabela deve ser uniforme quanto ao nmero de casas decimais e conter os smbolos ou 0 quando
o valor numrico nulo e ... quando no se dispe do dado.
Exemplo:
Distribuio de crianas(1) segundo nveis sricos de retinol. Cansao Bahia, 1992
Nvel de retinol srico(2)
n
%

(1)

Aceitvel
89
Baixo
65
Deficiente
7
Total
161
24 72 meses; (2) aceitvel: 20,0 49,9 g/dl; baixo: 10,0
Fonte: Prado MS et al., 1995.

55,3
40,4
4,3
100
19,9 g/dl; deficiente: <10,0 g/dl

Exerccio 4
Os dados a seguir so relativos ao nmero de refeies diria de 50 indivduos.
2
3
2
1
2
6
5
1
2
2
1
2
5
6
2
2
3
2
3
4
2
3
2
3
3
3
4
3
3
1
4
3
4
4
3
3
1
6
4
4
2
4
Fonte X.
a) Apresente os dados em uma tabela.
b) Interprete a disperso dos dados.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

4
4
3
4

3
3
2
5

11

Exerccio 5
Os dados a seguir so relativos ao peso ao nascer (g) de recm nascidos com sndrome de desconforto idioptico grave. Algumas crianas foram a bito (*) e outras sobrevieram.
1050*
2500*
1890*
1760
2830
1175*
1030*
1940*
1930
1410
1230*
1100*
2200*
2015
1715
1310*
1185*
2270*
2090
1720
1500*
1225*
2440*
2600
2040
1600*
1262*
2560*
2700
2200
1720*
1295*
2730*
2950
2400
1750*
1300*
1130
2550
3160
1770*
1550*
1575
2570
3400
2275*
1820*
1680
3005
3640
Fonte: Hand DJ et al., 1994.
a) Classifique a varivel peso ao nascer em duas categorias: baixo peso (abaixo de 2500 g) e
no baixo peso (2500 g e mais) e apresente os dados em uma tabela.
b) Interprete os resultados.
Apresentao tabular de varivel quantitativa contnua
Como idade varivel quantitativa contnua, a melhor forma
intervalos de valores denominados intervalos de classe.
Ex:
x: 5, 5, 15, 20, 20, 20, 21, 21, 22, 22
idade
frequncia
5 |-- 10
2
10 |-- 15
0
15 |-- 20
1
20 |-- 25
7
Total
10

de apresent-la em tabelas utilizando

%
20
10
70
100

Intervalos de classe: conjunto de observaes contidas entre dois valores limite (limite inferior e limite
superior).
Representao:
5 | -- 10
5 -- 10
5 |-- | 10

intervalo fechado no limite inferior e aberto no limite superior (contm o valor 5 mas no contm o valor 10)
intervalo aberto nos limites inferior e superior
(no contm os valores 5 e 10)
intervalo fechado nos limites inferior e superior
(contm os valores 5 e 10)

OBS: Representar o intervalo 0 |-- | 11 meses equivalente a represent-lo como 0 |-- 12 meses.
X: peso (g)
X: 2250, 3025, 1600, 2725, 3750, 3950, 2400, 2180, 2520, 2530
Peso (g)
frequncia
%
1500|--2000
1
10
2000|--2500
3
30
2500|--3000
3
30
3000|--3500
1
10
3500|--4000
2
20
Total
10
100

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

12

X: Altura (cm)
X: 1,63; 1,60; 1,59; 1,60; 1,45; 1,73; 2,05; 1,85
Altura (cm)
1,45|--1,55
1,55|--1,65
1,65|--1,75
1,75|--1,85
1,85|--1,95
1,95|--2,05
2,05|--2,15
Total

n
1
4
1
0
1
0
1
8

%
12,5
50,0
12,5
12,5
12,5
100

Os intervalos de classe devem ser mutuamente exclusivos (um indivduo no pode ser classificado
em dois intervalos ao mesmo tempo) e exaustivos (nenhum indivduo pode ficar sem classificao).
A amplitude do intervalo o tamanho do intervalo de classe. A amplitude do intervalo e o nmero
de intervalos dependem basicamente do problema especfico e da literatura existente sobre o assunto.
O ponto mdio do intervalo calculado somando-se o limite inferior e limite superior, dividindo-se
o resultado por dois.
Exerccio 6 Os dados a seguir so de altura de uma amostra de 351 mulheres idosas selecionadas
aleatoriamente de uma comunidade para um estudo de osteoporose.
142
152
154
145
152
154
145
152
154
145
152
154
146
152
155
147
152
155
147
153
155
147
153
155
147
153
155
148
153
155
148
153
155
149
153
155
150
153
155
150
153
155
150
153
155
150
153
155
150
153
155
150
153
155
151
153
155
151
153
155
151
153
155
151
153
155
151
153
155
151
154
155
152
154
155
152
154
156
152
154
156
152
154
156
152
154
156
152
154
156
Fonte: Hand DJ et alli. A

156
156
156
156
156
156
156
156
156
156
156
156
156
156
156
157
157
157
157
157
157
157
157
157
157
157
157
157
157

157
157
157
157
157
157
158
158
158
158
158
158
158
158
158
158
158
158
158
158
158
158
158
158
158
158
158
158
158

158
158
158
158
158
158
158
158
159
159
159
159
159
159
159
159
159
159
159
159
159
159
159
159
159
160
160
160
160

160
160
160
160
160
160
160
160
160
160
160
160
160
160
160
160
160
161
161
161
161
161
161
161
161
161
161
161
161

161
161
161
161
161
161
161
161
162
162
162
162
162
162
162
162
162
162
162
162
162
162
162
162
162
162
163
163
163

163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
164
164

164
164
164
164
164
164
164
164
164
164
164
164
164
164
164
165
165
165
165
165
165
165
165
165
165
165
165
165
165

165
165
165
165
166
166
166
166
166
166
166
166
166
166
166
167
167
167
167
167
167
167
168
168
168
168
168
168
169

169
169
169
169
169
169
169
170
170
170
170
170
170
170
170
170
170
170
171
171
171
173
173
173
174
176
177
178
178

handbook of small data sets. Chapman&Hall, 1994.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

13

a) Faa uma apurao dos dados e represente-os em uma tabela.


b) Interprete os resultados.
c) Se entre as 351 mulheres no fossem conhecidas as alturas de 15 delas, como voc representaria esses valores?
Tabela de dupla entrada
Distribuio de crianas(1) segundo nveis sricos de retinol e idade. Cansao Bahia, 1992.
Faixa etria (meses)
Aceitvel
Inadequado
Total
n
%
n
%
n
%
<12
5
45,5
6
54,5
11
100
12|--24
10
43,5
13
56,5
23
100
24|--36
19
54,3
16
45,7
35
100
36|--48
21
65,6
11
34,5
32
100
48|--60
16
43,2
21
56,8
37
100
60|--73
18
78,3
5
21,7
23
100
Total
89
55,3
72
44,7
161
100
(1)
24 72 meses.
(2)
aceitvel: 20,0 49,9 g/dl; baixo: 10,0 19,9 g/dl; deficiente: <10,0 g/dl.
Fonte: Prado MS et al., 1995.
Exerccio 7
Os dados a seguir so de um estudo que investiga a relao entre nveis de -caroteno (mg/L) e hbito de fumar em gestantes.
a) Calcule as frequncias relativas. Fixando o 100% no total de fumantes e no fumantes.
b) Calcule as frequncias relativas. Fixando o 100% no total do nvel de B-caroteno (MG/L).
c) Interprete os resultados. Existe alguma indicao de existncia de associao entre as variveis? Justifique.
a)
Distribuio de gestantes segundo nveis de -caroteno (mg/L) e hbito de fumar.
Fumante
No Fumante
Total
-caroteno (mg/L)
n
%
n
%
n
%
Baixo (0 0,213)
46
74
120
Normal (0,214 1,00)
12
58
70
Total
58
132
190
Fonte: Silmara Silva. Tese de Mestrado/FSP/USP.
b)
Distribuio de gestantes segundo nveis de -caroteno (mg/L) e hbito de fumar.
Fumante
No Fumante
Total
-caroteno (mg/L)
n
%
n
%
n
%
Baixo (0 0,213)
46
74
120
Normal (0,214 1,00)
12
58
70
Total
58
132
190
Fonte: Silmara Silva. Tese de Mestrado/FSP/USP.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

14

Exerccio 8
Os dados a seguir so provenientes do grupo Western Collaborative Group Study, criado na Califrnia
em 1960-61. Foram estudados 3154 homens de meia idade para investigar a relao entre padres de
comportamento e risco de doena coronariana. Os dados apresentados so de 40 homens para os
quais foram medidos os nveis de colesterol (mg/100ml) e realizada uma categorizao segundo comportamento. O comportamento de tipo A caracterizado pela urgncia, agressividade e ambio. O de
tipo B relaxado, no competitivo e menos preocupado.
Tipo A: nvel de colesterol
233
254

291
276

312
234

250
181

246
248

197
252

268
202

224
218

239
212

239
325

246
252

224
153

212
183

188
137

250
202

148
194

169
213

Tipo B: nvel de colesterol


344
226

185
175

263
242

a) Quais variveis que esto sendo estudadas? Identifique a natureza de cada varivel.
b) Apure os dados e apresente a varivel nvel de colesterol em uma tabela bidimensional, considerando os nveis A e B.
c) Classifique a varivel nvel de colesterol em duas categorias: nvel normal (abaixo de 160
mg/100ml) e nvel elevado (160 mg/100ml e mais) e faa uma tabela bidimensional cruzando
as variveis: nvel de colesterol (normal e alto) e tipo de comportamento (A e B). Interprete
os resultados.
Exerccio 9
Os dados a seguir so relativos ao peso ao nascer (g) de recm nascidos com sndrome de desconforto idioptico grave. Algumas crianas foram a bito (*) e outras sobrevieram.
1050*
2500*
1890*
1760
2830
1175*
1030*
1940*
1930
1410
1230*
1100*
2200*
2015
1715
1310*
1185*
2270*
2090
1720
1500*
1225*
2440*
2600
2040
1600*
1262*
2560*
2700
2200
1720*
1295*
2730*
2950
2400
1750*
1300*
1130
2550
3160
1770*
1550*
1575
2570
3400
2275*
1820*
1680
3005
3640
Fonte: Hand DJ et al., 1994.
c) Classifique a varivel peso ao nascer em duas categorias: baixo peso (abaixo de 2500 g) e
no baixo peso (2500 g e mais) e faa uma tabela bidimensional cruzando as variveis: condio do recm-nascido (sobrevivente ou no sobrevivente) e peso ao nascer (baixo peso e no
baixo peso).
d) Interprete os resultados.

Exerccio 10
A tabela abaixo foi extrada do artigo Tendncia secular do peso ao nascer na cidade de So Paulo
(1976-1998) de MONTEIRO CA et al. (Rev. Sade Pblica; 2000:34 (6, supl): 26-40).
Comente os resultados apresentados.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

15

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

16

Apresentao grfica: diagrama de barras, diagramas de setores circulares, diagrama linear, histograma, polgono de frequncia, ogiva de frequncias acumuladas.
Diagrama de barras
Utilizado para representar as variveis qualitativa nominal, ordinal e quantitativa discreta.
Caractersticas: figuras geomtricas (barras) separadas e bases de mesmo tamanho. A altura das
barras proporcional s frequncias.
Varivel qualitativa
O Inqurito Brasileiro de Nutrio (IBRANUTRI) foi um estudo de pacientes maiores de 18 anos, internados em hospitais da rede pblica, conveniados, filantrpicos e universitrios de 12 estados do Brasil
e do Distrito Federal, realizado de maio a novembro de 1996 (in Soares JF, Siqueira AL. Introduo
Estatstica Mdica, COOPMED,Belo Horizonte, MG 2002). Os dados da tabela so retirados deste estudo.
Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.
Estado nutricional
n
%
Nutrido
2061
51,5
Desnutrido
1905
47,6
Sem diagnstico
34
0,9
Total
4000
100,0
Fonte: adaptado de Soares JF, Siqueira AL, 2002.
2500

Nmero

2000
1500
1000
500
0
Nutrido

Desnutrido

Sem
diagnstico

Estado nutricional

Fonte: adaptado de Soares JF, Siqueira AL, 2002.


Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.

Esta representao grfica est correta?


2100

Nmero

2050
2000
1950
1900
1850
1800
Nutrido

Desnutrido

Estado nutricional

Ateno: cuidado com a origem!


Diagrama de barras da tabela anterior, excluindo-se os registros da categoria sem diagnstico

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

17

2500
Nmero

2000
1500
1000
500
0
Nutrido

Desnutrido

Estado nutricional

Fonte: adaptado de Soares JF, Siqueira AL, 2002.


Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.
Varivel qualitativa nominal
Distribuio do consumo mdio per capita de carne vermelha (kg/ano) segundo pas.
Pas
Consumo anual
Albnia
10,1
Alemanha Oriental
11,4
ustria
8,9
Blgica
13,5
Bulgria
7,8
Checoslovquia
9,7
Dinamarca
10,6
Alemanha Ocidental
8,4
Finlndia
9,5
Frana
18,0
Grcia
10,2
Itlia
9,0
Holanda
9,5
Fonte: Hand DJ et al., 1994 (adaptado).
Pas

Pas
Noruega
Polnia
Portugal
Romnia
Espanha
Sucia
Sua
Reino Unido
Unio Sovitica
Iugoslvia
Hungria
Irlanda

Consumo anual
9,4
6,9
6,2
6,2
7,1
9,9
13,1
17,4
9,3
4,4
5,3
13,9

Pas
Iugoslvia

Irlanda

Hungria

Hungria

Rom nia

Iugoslvia

Portugal

Unio Sovitica

Polnia

Reino Unido

Espanha

Sua
Sucia

Bulgria

Espanha

Alem anha Ocidental

Romnia

ustria

Portugal

Itlia

Polnia

Unio Sovitica

Noruega

Noruega

Holanda

Holanda

Itlia

Finlndia

Grcia

Checoslovquia

Frana
Finlndia

Sucia

Alemanha Ocidental

Albnia

Dinamarca

Grcia

Checoslovquia

Dinam arca

Bulgria

Alem anha Oriental

Blgica

Sua

ustria

Blgica

Alemanha Oriental

Irlanda

Albnia

Reino Unido
0

10

12

14

16

18

20

Frana

Consum o m dio per capita (Kg/ano)

10

15

20

Consum o mdio per capita (kg/ano)

Fonte: Hand DJ et al., 1994 (adaptado).


Distribuio do consumo mdio (kg/ano) per capita de carne vermelha, segundo pas.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

18

Varivel qualitativa ordinal


Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.
Estado nutricionala
n
%
Nutrido
2061
52,0
Desnutrido moderado
1407
35,4
Desnutrido grave
498
12,6
Total
3966
100
a
excluindo-se 34 (0,9%) de pacientes sem diagnstico.
Fonte: adaptado de Soares JF, Siqueira AL, 2002.
%

60
50
40
30
20
10
0

Nutrido

Des nutrido
m oderado

Des nutrido grave

Estado nutricional

excluindo-se 34 (0,9%) de pacientes sem diagnstico.


Fonte: adaptado de Soares JF, Siqueira AL, 2002.
Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.
Varivel quantitativa discreta: nmero de bens
Foi realizada, no perodo de outubro de 1998 a outubro 1999, a pesquisa Alimentao no primeiro
ano de vida, onde se estudou uma coorte de recm-nascidos da maternidade do Hospital Universitrio (HU). Os dados a seguir so parte da caracterizao scio-econmica da amostra estudada.
Distribuio de famlias segundo nmero de bens* que possuem. Hospital Universitrio/USP, So Paulo 1999.
Nmero de bens
n
%
0
146
40,6
1
97
26,9
2
87
24,2
3
26
7,2
4
4
1,1
Total
360
100
* automvel, telefone, TV a cabo e computador
50

40
30
20
10
0
0

2
3
Nmero de bens

*automvel, telefone, TV a cabo e computador


Distribuio de famlias segundo nmero de bens*. Hospital Universitrio/USP, So Paulo 1999.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

19

Diagrama de setores circulares


Variveis: qualitativa nominal e qualitativa ordinal
Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.
Estado nutricionala
n
%
Nutrido
2061
52,0
Desnutrido moderado
1407
35,4
Desnutrido grave
498
12,6
Total
3966
100
a
excluindo-se 34 (0,9%) de pacientes sem diagnstico.
Fonte: adaptado de Soares JF, Siqueira AL, 2002.

12,6%

52,0%
35,4%

Nutrido

Desnutrido moderado

Desnutrido grave

excluindo-se 34 (0,9%) de pacientes sem diagnstico.


Fonte: adaptado de Soares JF, Siqueira AL, 2002.
Distribuio de pacientes(a) segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.
Diagrama linear

Produo de leite (milhes de toneladas).


ndia e Estados Unidos, 1966 2000.
Ano
ndia
Estados Unidos
1966
20
58
1970
23
56
1980
29
60
1990
50
70
2000
80
75
Fonte: State of the World, 2001.

Milhoes de toneladas

Produo de leite (milhes de toneladas).


ndia e Estados Unidos, 1966 2000
90

ndia

80

Estados Unidos

70
60
50
40
30
20
10
0
1960

1965

1970

1975

1980

1985

1990

1995

2000

2005

Ano

Fonte: State of the World, 2001.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

20

Histograma
Grfico adequado para representar varivel quantitativa contnua
Intervalos de classe com mesma amplitude
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo
peso ao nascer (g)
Peso(g)
No
%
1000 |-- 1500
13
26
1500 |-- 2000
15
30
2000 |-- 2500
9
18
2500 |-- 3000
9
18
3000 |-- 3500
3
6
3500 |-- 4000
1
2
Total
50
100
Fonte: van Vliet PKJ, Gupta JM. (1973).
35

30
25
20
15
10
5
0

1000

1500

2000

2500

3000

3500

4000

Peso ao nascer (g)

Fonte: van Vliet PKJ, Gupta JM. (1973)


Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo
peso ao nascer (g).
Notar que o grfico pode ser construdo considerando-se pessoas por unidade de medida (densidade)

1500
2000
2500
3000
3500
4000

No
13
15
9
9
3
1
50

nmero/g

Peso(g)
1000 |-1500 |-2000 |-2500 |-3000 |-3500 |-Total

No/amplitude
0,026
0,030
0,018
0,018
0,006
0,002

Amplitude
500
500
500
500
500
500

(No/amplitude)x10000
26
30
18
18
6
2

0,030
0,025
0,020
0,015
0,010
0,005
0
1000

1500

2000

2500

3000

3500

4000

peso ao nascer (g)

Fonte: van Vliet PKJ, Gupta JM. (1973).


Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo
peso ao nascer (g).

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

21

OBS: notar que com intervalos iguais, no necessrio fazer ajuste na altura dos retngulos dado
que as bases so de mesmo tamanho (mesma amplitude) e, portanto, com proporcionalidade assegurada.
Exerccio 11
Os dados so referentes distribuio de pacientes segundo taxa de albumina no sangue (g/dL).
Taxa de albumina (g/dL)
no
%
4,40|-4,60
6
10,0
4,60|-4,80
11
18,3
4,80|-5,00
14
23,3
5,00|-5,20
18
30,0
5,20|-5,40
8
13,3
5,40|-5,60
2
3,3
5,60|-5,80
0
5,80|-6,00
1
1,7
Total
60
100
Fonte: Soares JF, Siqueira AL. COOPMED, 2002.
a) Apresente os dados em um histograma.
b) Interprete os resultados.

Intervalos de classe com amplitudes diferentes


Distribuio de mulheres idosas segundo a altura.
Altura (cm)
no
%
140|--150
12
3,4
150|--155
52
14,8
155|--160
109
31,1
160|--170
156
44,4
170|--180
22
6,3
Total
351
100
Fonte: Hand DJ et al., 1994.
Ajuste
Altura (cm)
No
Amplitude
No/amplitude
140|--150
12
10
1,2
150|--155
52
5
10,4
155|--160
109
5
21,8
160|--170
156
10
15,6
170|--180
22
10
2,2
Total
351
Fonte: Hand DJ et al., 1994.
Distribuio de mulheres idosas segundo a altura.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

22

Cuidado: Sem fazer o ajuste, o grfico fica errado e pode levar a concluses incorretas.

50
45
40
35
30
25
20
15
10
5
0

140

150

160

170

180

Altura (cm)

Grfico correto, com o ajuste para intervalos de classe com amplitudes diferentes.
25

Mulheres/cm

20
15
10
5
0
140

145

150

155

160

165

170

175

180

altura (cm)

Fonte: Hand DJ et al., 1994.


Exerccio 12
Os dados a seguir so da altura (cm) de uma amostra de mulheres de Bangladesh.
Altura (cm)
nmero
137,0 |--140,0
71
140,0 |--143,0
137
143,0 |--145,0
154
145,0 |--147,0
199
147,0 |--150,0
279
150,0 |--153,0
221
153,0 |--155,0
94
155,0 |--157,0
51
157,0 |--160,0
37
Total
1243
Fonte: Hand DJ et al, 1994 (adaptado).
a) Represente os dados acima, graficamente em um histograma.
b) Interprete os resultados.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

23

Polgono de frequncia simples


Intervalos de classe com mesma amplitude
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo
peso ao nascer (g).
Peso(g)
No
%
1000 |-- 1500
13
26
1500 |-- 2000
15
30
2000 |-- 2500
9
18
2500 |-- 3000
9
18
3000 |-- 3500
3
6
3500 |-- 4000
1
2
Total
50
100
Fonte: Hand DJ et al., 1994.

16

Nmero

14
12
10
8
6
4
2
0
0

500 1000 1500 2000 2500 3000 3500 4000 4500


peso (g)

Fonte: Hand DJ et al., 1994.


Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo
peso ao nascer (g).
Exerccio 13
Os dados a seguir so referentes distribuio de usurias do Servio de Sade X segundo idade
(anos). Municpio de So Paulo, 2009.
Idade (anos)
n
%
15|-- 20
14
19,5
20|-- 25
24
33,3
25|-- 30
16
22,2
30|-- 35
9
12,5
35|-- 40
8
11,1
40|--45
1
1,4
Total
72
100
Fonte: Dados hipotticos.
a) Apresente a varivel em um polgono de frequncias simples.
b) Interprete os resultados.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

24

Intervalos de classe com amplitudes diferentes


Distribuio de mulheres
Altura (cm)
140|--150
150|--155
155|--160
160|--170
170|--180
Total
Fonte: Hand DJ et al., 1994.

idosas segundo a altura.


No
%
12
3,4
52
14,8
109
31,1
156
44,4
22
6,3
351
100

Ajuste
No
12
52
109
156
22
351

Altura (cm)
140|--150
150|--155
155|--160
160|--170
170|--180
Total

No/amplitude
1,2
10,4
21,8
15,6
2,2

Amplitude
10
5
5
10
10

nm er o de p ess oa s/cm

25

20

15
10

5
0
1 30

1 35

140

14 5

1 50

1 55

160

16 5

1 70

175

180

18 5

1 90

Altu ra (c m)

Fonte: Hand DJ et al., 1994.


Distribuio de mulheres idosas segundo a altura (cm).

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

25

Exerccio 14
Distribuio de homens segundo nvel de glicose no sangue (mg%).
Nvel de glicose no sangue
n
(mg%)
50|-- 100
13
100|-- 150
45
150|-- 200
28
200|-- 250
10
250|-- 300
3
300|-- 450
1
Fonte: X.
a) Apresente os dados acima graficamente utilizando o polgono de frequncias simples.
b) Interprete os resultados.
Polgono (ogiva) de frequncias acumuladas
Distribuio de mulheres idosas segundo a altura.
Altura (cm)
No
%
140|-145
1
0,29
145|-150
11
3,13
150|-155
52
14,81
155|-160
109
31,05
160|-165
106
30,20
165|-170
50
14,25
170|-175
18
5,13
175|-180
4
1,14
Total
351
100
Fonte: Hand DJ et al., 1994.

% acumulado
0,29
3,42
18,23
49,28
79,48
93,73
98,86
100

100
90
80

% Acumulada

70
60
50
40
30
20
10
0
130

140

150

160

170

180

190

Altura (cm)

Fonte: Hand DJ et al., 1994.


Distribuio acumulada de mulheres idosas segundo a altura.
Percentil
25%
50%
75%

Valor da varivel
156 cm
160 cm
164 cm

Medidas estatsticas
Q1 primeiro quartil
Q2 - segundo quartil ou mediana
Q3 terceiro quartil

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

26

Exerccio 15
Os dados a seguir so medidas de circunferncia do trax (polegadas) de 5732 soldados escoceses
apresentados pelo matemtico belga Adolphe Quetelet (17961874).
Medida (polegada)
nmero
%
% acumulada
33,0 | 34,0
3
34,0 | 35,0
19
35,0 | 36,0
81
36,0 | 37,0
189
37,0 | 38,0
409
38,0 | 39,0
753
39,0 | 40,0
1062
40,0 | 41,0
1082
41,0 | 42,0
935
42,0 | 43,0
646
43,0 | 44,0
313
44,0 | 45,0
168
45,0 | 46,0
50
46,0 | 47,0
18
47,0 | 48,0
3
48,0 | 49,0
1
Total
5732
Fonte: Daly F et al. Elements of Statistics, 1999.
a) Represente os dados em um polgono de frequncias acumuladas.
b) Utilizando o grfico, identifique o valor da circunferncia de trax que deixa 25% dos indivduos abaixo.
c) Qual o valor de circunferncia do trax que divide a distribuio em 2 partes iguais, isto ,
qual o valor da varivel que deixa 50% das observaes abaixo dele?
d) Qual a proporo de soldados com circunferncia do trax entre 40 a 42 polegadas?
e) Qual o valor de circunferncia do trax que deixa 95% dos soldados abaixo dele?
Representao grfica de duas variveis qualitativas
Os dados so de um estudo de obesidade em mulheres da zona urbana de Trinidade e Tobago,
realizado em 1985, que estuda a relao entre idade da menarca e a medida do trceps.
Distribuio de mulheres segundo idade da menarca e medida do trceps. Trinidade e Tobago,1985.
Idade da menarca

Medida do trceps
Intermediria
Grande
< 12 anos
29
36
12 anos e mais
197
150
Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.
Pequena
15
156

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

27

Investigando-se a distribuio da idade segundo medida do trceps tem-se:


250

<12

nmero

200

12 e +

150
100
50
0
Pequena

Intermediria

Grande

medida do trceps

Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.


Distribuio de mulheres segundo idade da menarca e medida do trceps. Trinidade e Tobago,1985.
Calculando-se as porcentagens, tomando-se as categorias da medida do trceps como 100%, tem-se:
Distribuio de mulheres segundo idade da menarca e medida do trceps. Trinidade e Tobago,
1985.
Idade (anos)

<12
12 e +
Total
Fonte:

Medida do trceps
Pequena
Intermediria
Grande
Total
n
%
n
%
n
%
n
%
15
8,8
29
12,8
36
19,4
80
13,7
156
91,2
197
87,2
150
80,6
503
86,3
171
100
226
100
186
100
583
100
Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.
%

100

<12

80

12 e +

60
40
20
0
Pequena

Intermediria

Grande

Medida do trceps

Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.


Distribuio de mulheres segundo idade da menarca e medida do trceps. Trinidade e Tobago,
1985.
Investigando-se a distribuio da medida do trceps segundo a idade:
250
200
150

nmero

Pequena
Intermediria
Grande

100
50
0
<12

12 e +
idade

Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.


Distribuio de mulheres segundo idade da menarca e medida do trceps. Trinidade e Tobago,
1985.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

28

Calculando-se as porcentagens tem-se:


Idade
(anos)
<12
12 e +
Total

Medida do trceps
Intermediria
n
%
29
36,2
197
39,2
226
38,8

Pequena
N
%
15
18,8
156
31,0
171
29,3
50

n
36
150
186

Grande
%
45,0
29,8
31,9

Total
n
80
503
583

%
100
100
100

%
Pequena

45

Intermediria
Grande

40
35
30
25
20
15
10
5
0
<12

12 e +
Idade da menarca

Representao grfica de duas variveis quantitativas


Histograma
Fixando-se os percentuais na condio do recm-nascido:
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo
peso ao nascer (g) e condio do recm-nascido.
Peso(g)
Sobrevivente
No sobrevivente
Total
no
%
no
%
no
%
1000 |-- 1500
2
9
11
41
13
26
1500 |-- 2000
6
26
9
33
15
30
2000 |-- 2500
5
22
4
15
9
18
2500 |-- 3000
6
26
3
11
9
18
3000 |-- 3500
3
13
0
3
6
3500 |-- 4000
1
4
0
1
2
Total
23
100
27
100
50
100
Fonte: Hand DJ et al., 1994.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

29

45
40
35
30
25
20
15
10
5
0

1000 1500 2000 2500 3000 3500 4000

Sobrevivente

1000 1500 2000 2500 3000

No sobrevivente

Condio do recm nascido

Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo


peso ao nascer (g) e condio do recm-nascidos.
Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.
Polgono de frequncias
45

40

Sobrevivente

35

No sobrev.

30
25
20
15
10
5
0
0

500

1000

1500 2000 2500 3000


peso ao nascer (g)

3500

4000

4500

Fonte: Hand DJ et al., 1994.


Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo
peso ao nascer (g) e condio do recm-nascido.
Fixando-se os percentuais no peso ao nascer:
Diagrama de barras
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo
peso ao nascer (g) e condio do recm-nascido.
Peso(g)
Sobrevivente
No sobrevivente
Total
no
%
no
%
no
%
1000 |-- 1500
2
15
11
85
13
100
1500 |-- 2000
6
40
9
60
15
100
2000 |-- 2500
5
56
4
44
9
100
2500 |-- 3000
6
67
3
33
9
100
3000 |-- 3500
3
100
0
3
100
3500 |-- 4000
1
100
0
1
100
Total
23
46
27
54
50
100
Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

30

120

Sobrevivente

100
No sobrevivente
80
60
40
20
0
1000 |--1500

1500 |--2000

2000 |--2500

2500 |--3000

3000 |--3500

3500 |--4000

peso (g)

Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.


Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo
peso ao nascer (g) e condio do recm-nascido.
100

no sobreviviente

sobrevivente

80
60
40
20
0
1000 1500 2000 2500 3000 3500 4000

peso (g)
Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo
peso ao nascer (g) e condio do recm-nascido.
Exerccio 16
Utilize os dados da tabela e apresente-os graficamente.
Distribuio de escolares de 7 a 10 anos segundo peso e sexo. Duas escolas do Municpio de So Paulo, 2005.
Peso (kg)
Sexo
Masculino
Feminino
15,0 |-- 25,0
52
68
25,0 |-- 35,0
146
132
35,0 |-- 45,0
59
53
45,0 |-- 55,0
11
18
55,0 |-- 65,0
10
2
65,0 |-- 75,0
3
1
75,0 |-- 85,0
0
0
85,0 |-- 95,0
0
1
Total
281
275
Fonte: Koga CR. Estado nutricional de escolares de 7 a 10 anos de idade: diagnstico e comparao
de mtodos. So Paulo; 2005. [Dissertao de Mestrado-Faculdade de Sade Pblica da Universidade
de So Paulo/USP].

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

31

Escala aritmtica e escala logartmica


Nmero de crianas segundo massa corporal. Escola X, 2000 e 2002.
Ano
Sobrepeso
Obesas
2000
300
100
2002
150
50
Fonte: dados hipotticos.
Grfico em escala aritmtica

350
Sobrepeso

300

Obeso

Nmero

250
200
150
100
50
0
2000

2002
Ano

Fonte: dados hipotticos


Nmero de crianas segundo massa corporal. Escola X, 2000 e 2002.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

32

Grfico em escala logartmica


Sobrepeso

Nmero

1000

Obeso

100

10

1
2000

2002
Ano

Fonte: dados hipotticos.


Nmero de crianas segundo massa corporal. Escola X, 2000 e 2002.

Grfico em escala aritmtica


Coeficiente de mortalidade pela doena X e Y (100.000 hab.). Determinada localidade,
1990- 1995.
Ano
Doena X
Doena Y
1990
123,5
28,7
1991
121,4
22,4
1992
111,9
17,7
1993
85,9
13,9
1994
77,1
14,8
1995
62,2
10,5
Fonte: dados hipotticos.

150

Doena X

Coeficiente

Doena Y

100
50
0
1990 1991 1992 1993 1994 1995

Ano

Fonte: dados hipotticos.


Coeficiente de mortalidade pela doena X e Y (100.000 hab.). Determinada localidade, 1990- 1995.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

33

Grfico em escala logartmica


1000

Doena X

Coeficiente

Doena Y
100

10
1
1990

1991

1992

1993

1994

1995

Ano

Fonte: dados hipotticos.


Coeficiente de mortalidade pela doena X e Y (100.000 hab.). Determinada localidade, 1990 - 1995.
Exerccio 17
Os dados a seguir so referentes mortalidade por cncer de esfago, segundo sexo, no municpio de
So Paulo no perodo de 1968-1998.
Coeficientes de mortalidade por cncer de esfago (por 100.000 hab.).
Municpio de So Paulo, 1968-1998.
Ano
Masculino
Feminino
1968
8,81
2,00
1973
12,38
2,61
1978
10,93
1,98
1983
9,41
2,00
1988
8,60
1,67
1993
8,33
1,27
1998
8,37
1,12
Fonte: Incidncia de cncer no Municpio de So Paulo, 1997-1998. Registro de Cncer de So Paulo.
FSP/USP.
a) Represente os coeficientes de mortalidade por cncer de esfago para o sexo masculino e feminino
em um nico grfico, utilizando escala aritmtica.
b) Represente os coeficientes de mortalidade por cncer de esfago para o sexo masculino e feminino
em um nico grfico utilizando escala logartmica.
c) Comente os grficos dos itens a e b. Qual a melhor representao para os dados?
Exerccio 18
Apresente os dados da tabela em um grfico e interprete os resultados.
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo
peso ao nascer (g). Austrlia, 1993.
Peso(g)
No
%
Baixo peso (<2500 g)
37
74,0
No baixo peso (2500 g e mais)
13
26,0
Total
50
100
Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

34

Exerccio 19
Os dados a seguir so relativos ao nmero de refeies dirias de 50 indivduos, utilizados no exerccio S1.
2
3
2
1
2
6
5
4
3
1
2
2
1
2
5
6
4
3
2
2
3
2
3
4
2
3
2
3
2
3
3
3
4
3
4
5
3
1
4
3
4
4
3
3
1
6
4
4
2
4
a)Apresente os dados em um grfico.
b)Interprete o grfico.
Exerccio 20
Represente os dados da tabela em um polgono de frequncias e interprete os resultados. Trata-se de
condenados por embriaguez em Londres, 1970.
Idade
Homens
Mulheres
Nmero
%
Nmero
%
0 |--30
185
20,5
4
9,1
30 |-- 40
207
22,9
13
29,5
40 |-- 50
260
28,8
10
22,7
50 |--60
180
19,9
7
15,9
60 |--80
71
7,9
10
22,7
total
903
100
44
100
Fonte: Hand DJ et alli. A handbook of small data sets. Chapman&Hall, 1994.
Exerccio 21
Utilize os dados da tabela e apresente-os graficamente.
Distribuio de percentual (%) de escolares segundo estatura (cm), sexo e idade.
Estatura (cm)
Sexo
Masculino
Feminino
105,0 119,9
3
16
120,0 124,9
36
31
125,0 129,9
61
74
130,0 134,9
57
41
135,0 139,9
52
43
140,0 144,9
38
30
145,0 149,9
22
26
150,0 159,9
12
14
Total
281
275
Fonte: Koga CR. Estado nutricional de escolares de 7 a 10 anos de idade: diagnstico e comparao de mtodos.
So Paulo; 2005. [Dissertao de Mestrado-Faculdade de Sade Pblica da Universidade de So Paulo/USP].

Exerccio 22
A tabela apresenta dados de classificao de pessoas segundo doena coronariana (CHD) segundo
hbito de consumo de caf para uma coorte de 1718 homens com idade 40-55 anos.
Distribuio de homens segundo presena de doena coronariana (CHD) e consumo de caf.
condio
Alto consumo de caf
Moderado consumo de
Total
( 100xcaras/ms)
caf (<100 xcaras/ms)
n
%
n
%
n
%
Com CHD
38
4,8
39
4,2
77
4,5
Sem CHD
752
95,2
889
95,8
1641
95,5
Total
790
100
928
100
1718
100

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

35

a) Apresente os dados graficamente.


b) Interprete os resultados.
Exerccio 23
Defeitos do tubo neural so m formaes congnitas que surgem durante o desenvolvimento fetal.
conhecida como spina bfida. Estes dados so de um estudo realizado no pas de Gales Reino Unido,
para investigar possvel associao entre defeito do tubo neural e dieta materna. O estudo do tipo
caso-controle: mes que tinham tido bebs com spina bfida (casos) e suas irms que no tinham tido
(controles) foram avaliadas segundo suas dietas e classificadas em boa, razovel e ruim.
Distribuio de recm-nascidos casos (acometidos de spina bfida) e controles segundo dieta da
me.
Dieta
Casos
Controles
Total
n
%
n
%
n
%
Boa
34
43
77
Razovel
110
48
158
Pobre
100
32
132
Total
244
123
367
Fonte: Hand DJ ET al., 1994.
a) Calcular percentuais tomando-se como 100% o grupo (caso, controle) e interprete os resultados.
b) Apresentar os dados em um grfico.

Exerccio 24
Apresentar a varivel comprimento ao nascer em um histograma.
Distribuio de recm-nascidos segundo comprimento ao nascer (cm). Hospital X, 2009.
Comprimento (cm)
n
%
40|--43
1
1,2
43|--46
45
55,6
46|--49
25
30,9
49|--52
4
5
52|--55
3
3,7
55|--58
1
1,2
58|--61
2
2,5
Total
81
100
Fonte: dados hipotticos.
Exerccio 25
Apresentar a varivel idade da me em um polgono de frequncias.
Distribuio de mes segundo idade (anos). Centro de Sade X, 2009.
Idade (anos)
n
%
15|-- 20
14
19,5
20|-- 25
24
33,3
25|-- 30
16
22,2
30|-- 35
9
12,5
35|-- 40
8
11,1
40|--45
1
1,4
Total
72
100
Fonte: dados hipotticos.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

36

Medidas de tendncia central e de disperso


Medidas de tendncia central
Mdia aritmtica
Notao:
X varivel
N tamanho da populao
n tamanho da amostra
Mdia populacional (parmetro, geralmente desconhecido)

Estatstica (frmula)

Mdia amostral (estimativa, valor calculado na amostra)

Mdia aritmtica o valor que indica o centro de equilbrio de uma distribuio de frequncias de uma
varivel quantitativa.
Definio: a soma dos valores de uma varivel, dividida pelo nmero de valores.
Em uma amostra aleatria simples de tamanho n, composta das observaes x1, x2, ..., xn, a mdia
aritmtica ( x ) igual a:
n

x + x 2 + ... + x n
=
x= 1
n

i =1

OBS:
s existe para variveis quantitativas e seu valor nico;

da mesma natureza da varivel considerada; e


sofre influncia dos valores aberrantes (outlier).

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

37

Exemplo:
Os dados a seguir so provenientes do grupo Western Collaborative Group Study. Grupo tipo A: pessoas caracterizadas pela urgncia, agressividade e ambio. Os participantes de tipo B so mais relaxados, no competitivos e menos preocupados.
Tipo A: nvel de colesterol
233
291
312
254
276
234

250
181

246
248

197
252

268
202

224
218

239
212

239
325

188
137

250
202

148
194

169
213

Colesterol mdio:

xA =

233 + 291 + ... + 212 + 325


= 245,05mg / 100ml
20

Tipo B: nvel de colesterol


344
185
263
226
175
242

246
252

224
153

212
183

xB =
O nvel mdio de colesterol dos homens do grupo A 245,1 mg/100ml e do tipo B _____________.
Exerccio 26
Os dados a seguir so provenientes de um estudo que avaliou o consumo alimentar de crianas de 7
a 10 anos de uma escola pblica do municpio de So Paulo no ano de 2008. Os dados apresentados
so de 15 meninos e 10 meninas para os quais foram investigados o consumo em energia (Kcal) de
um dia alimentar. Calcule a mdia aritmtica do consumo de energia para cada sexo:

Meninos
1976
1412

3234
1635

1405
2230

1410
1241

1782
1866

2167

1917

2622

1824

3912

2964

2203

1478

1151

1083

1362

1392

1637

1628

x Meninos =
Meninas
2002

x Meninas =

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

38

Mediana
o valor que ocupa a posio central de uma srie de n observaes, quando estas esto ordenadas
de forma crescente ou decrescente.
Quando nmero de observaes (n) for mpar:
a mediana o valor da varivel que ocupa o posto

n+1
2

Quando o nmero de observaes (n) for par:


a mediana a mdia aritmtica dos valores da varivel que ocupam os postos

n
2

n+2
2

OBS:
existe para varivel quantitativa e qualitativa ordinal;

da mesma natureza da varivel considerada;

torna-se inadequada quando h muitos valores repetidos;

no sofre influncia de valores aberrantes.

Ex:
Tipo A: nvel de colesterol
233
291
312
254
276
234

250
181

246
248

197
252

268
202

224
218

239
212

239
325

Ordenando-se os valores:
Tipo A: nvel de colesterol
181
202
218
197
212
224

233
234

239
239

246
248

250
252

254
268

276
291

312
325

224
153

212
183

188
137

250
202

148
194

169
213

Mediana: (239+246)/2=242,5 mg/100ml


Tipo B: nvel de colesterol
344
185
263
226
175
242

246
252

Ordenando-se os valores:

Mediana:

Exerccio 27
Com os dados do exemplo 18, calcule a quantidade mediana de energia para os meninos e para as
meninas:

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

39

Meninos

Mediana=
Meninas

Mediana=
Medidas de disperso
Valores mnimo e mximo: valores extremos da distribuio.
Amplitude de variao: a diferena entre os 2 valores extremos da distribuio.
Varincia: indica o quanto, em mdia, os quadrados dos desvios de cada observao em relao
mdia aritmtica esto afastados desta mdia.
N

(X
Populacional

Parmetro

S (2N ) =

X )2

i =1

ou

estimador :

(X
S (2N 1) =

Desvio padro: a raiz quadrada da varincia , ou seja

X )2

i =1

N 1

= 2
S = S2

Coeficiente de Variao de Pearson (CV):


o quociente entre o desvio padro e a mdia, ou seja

CV =

S
x100
X

E xe m pl o:
Tipo A: nvel de colesterol
233
291
312
254
276
234

250
181

246
248

197
252

268
202

224
218

239
212

239
325

(233 245,05) 2 + ... + (325 245,05) 2


= 1342,37(mg / 100ml ) 2
Varincia: s =
19
2

Desvio padro

s = 1342,37 = 36,64mg / 100ml

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

40

Coeficiente de Variao de Pearson

Tipo B: nvel de colesterol


344
185
263
226
175
242
Varincia:

CV =

246
252

36,64
x100 = 15%
245,05
224
153

212
183

188
137

250
202

148
194

169
213

s2 =

Desvio padro

s=

Coeficiente de Variao de Pearson CV=


Exerccio 28
Com os dados do exerccio 27, calcule a varincia, o desvio-padro e o coeficiente de variao de
Pearson.
Meninos

Meninas

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

41

Quartil
Valores da varivel que dividem a distribuio em quatro partes iguais.

25%

25%

25%

25%

Q1: deixa abaixo 25% das observaes


25%
75%
Q2: deixa abaixo 50% das observaes
50%

50%

75%

Q3: deixa abaixo 75% das observaes


25%

Q1 = x 1

( ( n +1))
4

onde x o valor da varivel e

Q3 = x

1
( (n + 1))
4

3
( ( n +1))
4

3
( ( n + 1)) so ndices que representam as posies
4

ocupadas por x.
Os dados abaixo so referentes ao peso ao nascer
desconforto respiratrio idioptico grave.
23 crianas sobreviveram e 27 foram a bito (*).
1.050*
2.500*
1.175*
1.030*
1.230*
1.100*
1.310*
1.185*
1.500*
1.225*
1.600*
1.262*
1.720*
1.295*
1.750*
1.300*
1.770*
1.550*
2.275*
1.820*

de 50 recm-nascidos que tiveram sndrome de

1.890*
1.940*
2.200*
2.270*
2.440*
2.560*
2.730*
1.130
1.575
1.680

Ordenando-se os dados, em cada grupo, obtm-se:


1.030*
1.310*
2.200*
1.050*
1.500*
2.270*
1.100*
1.550*
2.275*
1.175*
1.600*
2.440*
1.185*
1.720*
2.500*
1.225*
1.750*
2.560*
1.230*
1.770*
2.730*
1.262*
1.820*
1.130
1.295*
1.890*
1.410
1.300*
1.940*
1.575

1.760
1.930
2.015
2.090
2.600
2.700
2.950
2.550
2.570
3.005

1.680
1.715
1.720
1.760
1.930
2.015
2.040
2.090
2.200
2.400

2.830
1.410
1.715
1.720
2.040
2.200
2.400
3.160
3.400
3.640

2.550
2.570
2.600
2.700
2.830
2.950
3.005
3.160
3.400
3.640

Fonte: van Vliet PK; Gupta JM. Sodium bicabornate in idiopatic respiratory distress syndrome. Arch.

Diseases in Childhood,1973:48, 249-255.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

42

Entre os recm-nascidos que sobreviveram:

Q1 = x

= x 6 = 1720 g ; Q3 = x

1
( ( 23+1))
4

Q2 = x 1

( ( 23+1))
2

3
( ( 23+1))
4

= x18 = 2830 g

= x12 = 2200g

Entre os recm-nascidos que foram a bito

Q1 = x 1

= x7 = 1230g ; Q3 = x 3

Q2 = x 1

= x14 = 1600 g

( ( 27+1))
4
( ( 27 +1))
2

( ( 27 +1))
4

= x21 = 2200g

Se o resultado for um valor fracionrio:


Por exemplo, para n=22

Q1 = x 1

( ( 22+1))
4

= x 23 = x
(

3
(5 )
4

que do caminho entre x5=1715 e x6=1720

Q1 = 1715 +

Q3 = x 3

3
(1720 1715) = 1718,8 g
4

( ( 22+1))
4

=x

1
(17 )
4

que do caminho entre x17=2700 e x18=2830

1
Q3 = 2700 + ( 2830 2700) = 2732,5 g
4
Decil
Valores da varivel que dividem a distribuio em dez partes iguais.
Percentil
Valores da varivel que dividem a distribuio em cem partes iguais.

Entre os recm-nascidos que sobreviveram


Percentil 5:

P5 = x

5
( 23+1))
100

= x 120 = x
(

100

1
(1 )
5

que 1/5 do caminho entre x1=1130 e x2=1410

1
P5 = 1130 + (1410 1130) = 1186 g
5

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

43

Percentil 10:

P10 = x

10
(
( 23+1))
100

= x 240 = x
(

100

2 ;
(2 )
5

P10 = 1410 +

2
(1575 1410 ) = 1476 g
5

Percentil 50:

P50 = x

= x 1200 = x(12) ; P50 = 2200 g


(
)

50
( 23+1))
100

100

Percentil 75:

P75 = x

75
( 23+1))
100

= x 1800 = x(18) ; P75 = 2830g


(
)
100

Percentil 90:

P90 = x

= x 2160 = x

90
( 23+1))
100

100

3 ;
( 21 )
5

P90 = 3160 +

3
(3400 3160) = 3304 g
5

Percentil 95:

P95 = x

= x 2280 = x

95
( 23+1))
100

100

4 ;
( 22 )
5

P95 = 3400 +

4
(3640 3400 ) = 3592 g
5

Box plot e identificao de valores aberrantes (outliers)


O Box plot representa graficamente dados de forma resumida em um retngulo onde as linhas da
base e do topo so o primeiro e o terceiro quartis, respectivamente. A linha entre estas a mediana.
Linhas verticais que iniciam no meio da base e do topo do retngulo, terminam em valores
denominados adjacentes inferior e superior (Chambers et al., 1983, pag 60).
O valor adjacente superior o maior valor das observaes que menor ou igual a Q3+1,5(Q3-Q1).
O valor adjacente inferior definido como o menor valor que maior ou igual a Q1-1,5(Q3-Q1),
sendo a diferena Q3-Q1 denominada intervalo inter-quartil (IIQ).
Valores outliers (discrepantes ou aberrantes) so valores que fogem da distribuio dos dados. O
box plot alm de apresentar a disperso dos dados torna-se til tambm para identificar a ocorrncia
destes valores como sendo os que caem fora dos limites estabelecidos pelos valores adjacentes superior e inferior.
Exemplo:
Tipo A: nvel de colesterol
181
202
218
197
212
224

233
234

239
239

246
248

250
252

254
268

276
291

312
325

Tipo B: nvel de colesterol


137
153
175
148
169
183

185
188

194
202

212
213

224
226

242
246

250
252

263
344

Tipo A:
n=20;

Q1 = x 1
4

Q3 = x 3
4

( n +1)

( n +1)

= x 21 = x

= x3
4

=x
( 21)

1
4

3
15
4

= 218 +

1
(224 218) = 218 + 1,5 = 219,5
4

= 254 +

3
(268 254) = 254 + 10,5 = 264,5
4

Intervalo Inter-Quartil (IIQ): Q3-Q1 = 45.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

44

325 o valor adjacente superior. Este o maior valor da distribuio, igual ou abaixo de 332, onde
332 dado por: 264,5 + 1,5 x 45 = 332 .
181 o valor adjacente inferior. o menor valor da distribuio, igual ou acima de 152, onde 152
dado por: 219,5 1,5 x 45 = 152 .
Tipo B
n=20

Q1 = x 1
4

( n +1)

Q3 = x 3
4

( n +1)

= x 21 = x
4

= x3
4

1
= 175 + (183 175) = 175 + 2 = 177
4

1
5
4

=x
( 21)

3
15
4

3
= 242 + (246 242) = 242 + 3 = 245
4

Intervalo Inter-Quartil (IIQ): Q3-Q1 = 68


344 o valor adjacente superior. Este o maior valor da distribuio, igual ou abaixo de 347, onde
347 dado por: 245 + 1,5 x 68 = 347 .
137 o valor adjacente inferior. o menor valor da distribuio, igual ou acima de 75, onde 75
dado por: 177 1,5 x68 = 75 .
380
360
340
320
300
280
260
240
220
200
180
160
140
120

Fonte: Fonte: Hand DJ et alli. A handbook of small data sets. Chapman&Hall, 1994.
Grfico - Box plot da varivel nvel de colesterol segundo tipo de personalidade.
Exerccio 29
Os dados a seguir so de uma pesquisa que investigou as concentraes de minerais no leite materno, no perodo de 1984 a 1985. Foram coletadas amostras de leite materno de 55 mulheres que tiveram seus filhos no Hospital Maternidade Odete Valadares, em Belo Horizonte. As mes foram divididas
em perodo de lactao: colostro e leite maduro.
clcio (g/mL de leite) grupo colostro
113
181
254
311
334
145
221
256
312
344
163
225
275
313
372
163
231
296
323
375
167
241
303
325
375
437
clcio (g/mL de leite) grupo maduro
159
175
181
188
200
206
213
214
217
231
238
238
242
244
256
259
260
263
264
275
277
279
281
293
302
303
314
344
394
a) Calcule a quantidade mdia de clcio (g/mL de leite) em cada grupo.
b) Calcule a quantidade mediana de clcio (g/mL de leite) em cada grupo.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

45

c) Desenhe o box plot da concentrao de clcio (g/mL de leite) representando os dois grupos
em um s grfico.

d) Comente o grfico box plot quanto a disperso dos dados, existncia de valores aberrantes e
igualdade de medianas.
Exerccio 30
Os dados a seguir so provenientes de um estudo que avalia o crescimento de crianas de 7 a 10
anos de uma escola pblica do municpio de So Paulo no ano de 2008. Os dados apresentados so
de 16 meninos e 16 meninas para os quais foram aferidos a circunferncia do brao (CB) (cm):
Meninos
18,3
19,3
20,9
19,0
20,5
16,3
21,0
17,8
21,6
22,6
27,3
26,7
29,0
22,0
25,2
19,5
Meninas
21,5
16,1
18,6
19,9
17,9
23,7
20,0
19,4
23,5
18,0
23,0
17,9
20,3
23,1
17,8
18,2
a) Calcule a circunferncia braquial (cm) mdia e mediana para cada sexo.
b) Calcule a varincia, o desvio-padro e o coeficiente de variao de Pearson da circunferncia
braquial (cm) para cada sexo.
c) Meninos e meninas so parecidos quanto a circunferncia braquial (cm)?
d) E quanto variabilidade?
Exerccio 31
Os dados a seguir so provenientes de um estudo que avaliou o nvel de colesterol sanguneo (mg/dl)
de 100 homens.
id
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

colesterol
134
147
157
161
162
164
165
166
171
173
176
176
178
179
179
180
181
181
183
184
185
186
186
186
187

id
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50

colesterol
189
189
190
190
192
194
195
196
198
199
199
199
201
203
204
205
206
209
210
211
211
212
213
215
216

id
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75

colesterol
216
217
217
218
218
219
219
219
221
221
223
223
224
225
228
230
230
231
231
231
232
234
234
238
238

id
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100

colesterol
239
239
240
240
240
243
246
248
251
255
255
256
259
261
267
268
272
279
286
287
289
290
296
298
382

a) Desenhe o box plot do colesterol (mg/dl).


b) Comente o grfico box plot quanto a disperso dos dados, existncia de valores aberrantes e igualdade de medianas.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

46

Correlao e regresso linear simples


Anlise simultnea entre duas variveis quantitativas (associao entre duas variveis quantitativas).
Grfico de disperso: deve ser feito antes da anlise numrica dos dados.
construdo com conjuntos de pontos formados por pares de valores (x,y). Pode indicar correlao
linear positiva, negativa ou inexistncia de correlao. Tambm til para identificar existncia de
valores aberrantes.
Ex:

X: coeficiente de mortalidade por cncer gstrico


Y: consumo mdio de sal

Y
correlao positiva

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

47

Ex:

X: Esperana de vida ao nascer


Y: Coeficiente de mortalidade infantil (por 1000 nascidos vivos)

Y
correlao negativa

45

CMI (por 1000 nv)

40
35
30
25
20
15
10
5
0
66

68

70

72

74

76

Esperana de vida ao nascer

X: coeficiente de mortalidade por cncer de colo de tero


Y: consumo de sal
Y

correlao inexistente

X
Distino entre associao e causao: duas variveis podem estar associadas mas uma no ser
necessariamente a causa da outra.
Na correlao comum investigar se mudanas na magnitude de uma varivel so acompanhadas de
mudanas na magnitude da outra sem significar que uma varivel causa a outra.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

48

Coeficiente de correlao de Pearson (

), l-se rh

Mede o grau de associao entre 2 variveis X e Y.

=
Definio:

XY
X Y

, onde

XY

a covarincia de X e Y (disperso conjunta)

o desvio padro de X (disperso de X)

o desvio padro de Y (disperso de X)

Covarincia: o valor mdio do produto dos desvios de X e Y, em relao s suas respectivas mdias.

XY =

estimador (r)

Propriedades
a) 1

r=

_
_

X Yi Y

_
_

x
x
y
y
i i
_ 2
_ 2

x i x y i y

+1 ;

b) no possui dimenso, isto , no depende da unidade de medida das variveis X e Y ;


c)

XY = YX .

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

49

Grficos de disperso para diferentes valores do coeficiente de correlao (rho).

Exemplo:
Os dados a seguir so provenientes de um estudo que investiga a composio corporal e fornece o
percentual de gordura corporal (%), idade e sexo para 18 adultos com idades entre 23 e 61 anos.
a) Qual a relao entre a idade e o % de gordura? Existe alguma evidncia de que a relao
diferente entre pessoas do sexo masculino e feminino? Explore os dados graficamente.
b) Calcule o coeficiente de correlao de Pearson entre a idade e o % de gordura para homens e
mulheres. Interprete os resultados.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

50

Idade
23
23
27
27
39
41
45
49
50

% Gordura
9,5
27,9
7,8
17,8
31,4
25,9
27,4
25,2
31,1

Sexo
M
F
M
M
F
F
M
F
F

Idade
53
53
54
56
57
58
58
60
61

% Gordura
34,7
42,0
29,1
32,5
30,3
33,0
33,8
41,1
34,5

Sexo
F
F
F
F
F
F
F
F
F

M=masculino ; F= feminino
Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.
Disperso entre % de gordura e idade
70

f ff f

60

f
f

idade

50

40

30

20
5

10

15

20

25
gordura

30

35

40

45

Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.


Clculo do coeficiente de correlao de Pearson
Sexo: masculino
Idade
% gordura
(x x) ( y y)
(X)
(Y)
23
9,5
-7,5
-6,13
27
7,8
-3,5
-7,83
27
17,8
-3,5
2,18
45
27,4
14,5
11,78
30,5
15,625

Coeficiente de correlao

(idade,%gordura) masculino:

r=

( x x )( y y )

(x x)2

( y y)2

45,94
27,39
-7,61
170,74
236,45

56,25
12,25
12,25
210,25
291,00

37,52
61,23
4,73
138,65
242,13

236,45
291x 242,13

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

= 0,89

51

Sexo: feminino
Idade
(X)
23
39
41
49
50
53
53
54
56
57
58
58
60
61
50,86

% gordura
(Y)
27,9
31,4
25,9
25,2
31,1
34,7
42
29,1
32,5
30,3
33
33,8
41,1
34,5
32,32

Coeficiente de correlao

( x x ) ( y y ) ( x x )( y y )

(x x)2

( y y)2

-27,86
-11,86
-9,86
-1,86
-0,86
2,14
2,14
3,14
5,14
6,14
7,14
7,14
9,14
10,14

776,02
140,59
97,16
3,45
0,73
4,59
4,59
9,88
26,45
37,73
51,02
51,02
83,59
102,88
1389,71

19,55
0,85
41,23
50,71
1,49
5,66
93,67
10,38
0,03
4,09
0,46
2,19
77,06
4,75
312,12

-4,42
-0,92
-6,42
-7,12
-1,22
2,38
9,68
-3,22
0,18
-2,02
0,68
1,48
8,78
2,18

(idade,%gordura) feminino:

r=

123,17
10,93
63,30
13,23
1,05
5,10
20,74
-10,12
0,92
-12,42
4,85
10,56
80,26
22,10
333,64

333,64
1389,71x312,12

= 0,51 ;

Coeficiente de correlao considerando o grupo todo (homens e mulheres)


Idade
(X)
23
27
27
45
23
39
41
49
50
53
53
54
56
57
58
58
60
61

% gordura
(Y)
9,5
7,8
17,8
27,4
27,9
31,4
25,9
25,2
31,1
34,7
42
29,1
32,5
30,3
33
33,8
41,1
34,5

x = 46,33 ; y = 28,61 ;

(x x)

( y y)

( x x )( y y )

(x x)2

( y y)2

-23,33
-19,33
-19,33
-1,33
-23,33
-7,33
-5,33
2,67
3,67
6,67
6,67
7,67
9,67
10,67
11,67
11,67
13,67
14,67

-19,11
-20,81
-10,81
-1,21
-0,71
2,79
-2,71
-3,41
2,49
6,09
13,39
0,49
3,89
1,69
4,39
5,19
12,49
5,89
Soma

445,93
402,35
209,01
1,61
16,59
-20,45
14,46
-9,10
9,13
40,59
89,26
3,75
37,59
18,01
51,20
60,54
170,68
86,37
1627,53

544,44
373,78
373,78
1,78
544,44
53,78
28,44
7,11
13,44
44,44
44,44
58,78
93,44
113,78
136,11
136,11
186,78
215,11
2970,00

365,23
433,10
116,88
1,47
0,51
7,78
7,35
11,64
6,19
37,07
179,26
0,24
15,12
2,85
19,26
26,92
155,97
34,68
1421,54

Sy =

( y y)
n 1

1421,54
= 9,14% ; S X =
17

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

(x x)
n 1

2970,0
= 13,22anos
17

52

r=

1627,53
= 0,79
2970,0 x1421,54

Anlise simultnea de duas variveis quantitativas.


REGRESSO LINEAR Estimando a reta de regresso
ADMITINDO-SE Y COMO FUNO LINEAR DE X, AJUSTA-SE A MELHOR RETA AO CONJUNTO DE
DADOS.

EQUAO DE RETA:

y = a + bx

, onde

= valor ajustado (valor mdio predito).


= valor escolhido de X.

a = y bx ; a denominado intercepto; o valor predito para x=0.


b = rxy

sy
sx

; b denominado coeficiente angular (slope). Indica quantas unidades de Y

mudam para a mudana de uma unidade de X.


Utilizando-se os dados do exemplo considerando-se o grupo como um todo:
a = 28,61 b 46,33 ;
b = 0,79 x

9,14
= 0,548
13,22

Para aumento de 1 ano, o percentual de gordura aumenta 0,55%.


Substituindo-se o valor b em a, obtm-se a=3,221.
Equao ajustada

% gordura= 3,22 + 0,55 (idade)

Com base nesta equao possvel traar a reta que passa pelos pontos.
Para x = 30; y = 19,7; para x = 50, y = 30,7

50
y = 0,55x + 3,22

% gordura

40
30
20
10
0
0

20

40

60

idade (anos)

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

53

OBS: o coeficiente angular depende das unidades de medida de X e Y. Isto deve ser considerado
na deciso da importncia do coeficiente angular.
O coeficiente angular da equao de Y=f(X) diferente do coeficiente angular de X=f(Y), a menos
que os desvios padro de X e Y sejam iguais.
Usos da reta de regresso:
- Predio - utilizar X para predizer Y; quando a correlao for forte, melhor a predio;
- Correlao mede o grau de relacionamento linear entre X e Y;
- Resumir os dados cada valor de X tem um valor mdio de Y.
Exerccio 32
Em um estudo sobre o efeito dos componentes de uma dieta (X) sobre a composio lipdica (Y) foram obtidos os seguintes dados em uma amostra de 15 animais.
Componente da dieta (X)
18
21
28
35
47
33
40
41
28
21
30
46
44
38
19

a)
b)
c)
d)
e)

Composio lipdica (Y)


30
35
43
60
50
28
40
60
43
30
33
65
68
62
25

Fonte:X.
Apresente os dados em um diagrama de disperso.
Calcule o coeficiente de correlao de Pearson entre X e Y.
Calcule a reta de regresso da composio lipdica como funo do componente da dieta.
Desenhe a reta de regresso.
Interprete os coeficientes da reta de regresso.

Exerccio 33
So apresentados valores da massa do corpo sem gordura (kg) e da taxa de metabolismo (calorias)
de 10 pessoas de ambos os sexos
Pessoa
1
2
3
4
5
6
7
8
9
10

Sexo
M
M
F
F
F
F
M
F
F
M

Massa
62,0
62,9
36,1
54,6
48,5
42,0
47,4
50,6
42,0
48,7

Taxa
1792
1666
995
1425
1396
1418
1362
1502
1256
1614

Fonte: Moore et al., 2004 (adaptado)


a) Apresente os dados em um diagrama de disperso com pontos identificando os sexos. Apresente a varivel Y, taxa de metabolismo, como varivel resposta (dependente) e a varivel X,
massa do corpo sem gordura, como explicativa (independente).
b) Calcule o coeficiente de correlao entre as variveis taxa e massa.
c) Calcule os coeficientes da reta de regresso e desenhe a reta.
d) Interprete os coeficientes da reta.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

54

Medidas de Associao
ANLISE DA DISTRIBUIO DE DUAS VARIVEIS QUALITATIVAS
ESTUDO DE PREVALNCIA
So apresentados dados sobre o estado nutricional de 1226 crianas brasileiras de 2 anos de idade,
segundo sexo. Local X, Ano Y.
Estado nutricional
Masculino
Feminino
Total
Desnutridas
29
20
49
Normais
574
603
1177
Total
603
623
1226
Fonte: dados hipotticos.
Prevalncia de desnutrio:

49
= 0,040
1226

ou 4%.

Prevalncia de desnutrio segundo sexo:


Masculino:

29
= 0,05
603

ou 5,0%; Feminino:

20
= 0,032 ou 3,2%.
623

29
Razo de prevalncias: 603 = 1,5
20
623
Diferena de prevalncias: 0,05-0,032=0,018 ou 1,8%.
A prevalncia de desnutrio parece ser maior entre as crianas do sexo masculino. Os meninos apresentam uma prevalncia 50% maior do que as meninas.
A prevalncia de desnutrio entre meninos 1,5 vezes (uma vez e meia) a prevalncia de desnutrio entre meninas.
Tambm possvel dizer que a prevalncia de desnutrio entre meninos 50% maior que a prevalncia entre meninas, calculado como (1,5-1)x100.
Para a diferena de prevalncias diz que a prevalncia entre meninos excede a de meninas em 1,8%
ou que a diferena entre as prevalncias de 1,8%.
Se a razo de prevalncias for igual a 1 ou a diferenas de prevalncias for igual a 0 ento diz-se que
as variveis no esto associadas.
De forma geral
Y: varivel resposta (Ex: desnutrio)
X: varivel explicativa ou de confuso (Ex: sexo)
Varivel Y
Varivel X
Y1
X1
a
X0
c
Total
m1
p= prevalncia de Y1= m1/n
p1= prevalncia de Y1|x1= a/n1
p0= prevalncia de Y1|x0= c/n0
rp= razo de prevalncias= p1/p0;

Y0
B
D
m2

Total (%)
n1 (100
n0 (100
n (100)

dp=diferena de prevalncias= p1-p0

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

55

Exerccio 34
Distribuio de indivduos segundo presena de obesidade e consumo de chocolate.
colmo, Sucia. Ano 2009.
Consumo de chocolate
Obesidade (> 30Kg/m2)

Esto-

Sim
No
Total
Mais de 1 vez por semana
128
625
753
At 1 vez por ms
68
353
421
Total
196
978
1174
Fonte: dados adaptados de Janszky I, Mukamal KJ, Ljung R, et al. Chocolate consuption and
mortality following a first acute myocardial infarction: The Stockholm Heart Epidemiology
Program. Journal of Internal Medicine 2009; 266: 248-257.
a) Calcule a prevalncia de obesidade entre pessoas que consomem chocolate at 1 vez por
ms.
b) Calcule a prevalncia de obesidade entre pessoas que consomem chocolate mais de uma vez
por semana.
c) Calcule a razo de prevalncias.
d) Interprete a razo de prevalncias. Voc diria que a obesidade est associada ao consumo de
chocolate? Justifique.

ESTUDO DE INCIDNCIA
Distribuio de pessoas segundo hbito de fumar e morte em
Morte em 5 anos por DIC
Fumar
Sim
Sim
208
No
264
Total
472
Fonte: dados hipotticos.

5 anos por DIC. Local X. Ano Y


No
850
1467
2317

Total
1058
1731
2789

r= 472/2789= 0,17 = 17%


r1=208/1058= 0,20= 20%
r0=264/1731= 0,15=15%
rr=0,20/0,15= 1,33
ra= 0,20- 0,15= 0,05= 5%
A incidncia de mortes parece ser maior entre as pessoas que fumam. Os fumantes apresentam uma
incidncia 33% maior do que os no fumantes.
Os bitos so 1,33 vezes mais incidentes entre fumantes do que entre no fumantes.
Tambm possvel dizer que os bitos so 33% maiores entre fumantes.
Pela diferena diz-se que 5% dos bitos excedentes so devidos ao fumo.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

56

De forma geral
Y: varivel resposta
X: varivel explicativa ou de confuso
Varivel Y
Varivel X
X1
X0
Total

Y1
A
C
M1

Y0
B
D
m2

Total (%)
n1 (100
n0 (100
n (100)

r= incidncia de Y1= m1/n


r1= incidncia de Y1|x1= a/n1
r0= incidncia de Y1|x0= c/n0
ri= razo de incidncias= r1/r0
di= diferena de incidncias= r1-r0
incidncia
r1

r0

risco
r1/r0

r1-r0

ri=rr=razo de riscos=risco relativo=r1/r0


di= ra= risco atribuvel= r1-r0

Exemplo
Investigao de toxinfeco alimentar
Tomou sorvete de baunilha
Sim
No
Total

Toxiinfeco
Sim
43
3
46

No
11
18
29

Total (%)
54 (100)
21 (100)
75 (100)

Fonte:Epi Info, 2000.


r= incidncia global = taxa de ataque global= 46/75= 0,61
r1= incidncia entre quem tomou sorvete= taxa de ataque1= 43/54= 0,80
r0= incidncia entre quem no tomou sorvete= taxa de ataque0= 3/21= 0,14
rr= risco relativo=

43 3 43x 21
: =
= 5,6
54 21 3x54

Exerccio 35
Padro de amamentao de crianas segundo episdios de doenas respiratrias.
Padro
Um ou mais episdios
Nenhum episdio
Total
Mamadeira e peito
207
238
445
Somente peito
34
72
106
Total
241
310
551
Fonte: Abramson JH e Abramson ZH.
a) Calcule a incidncia de um ou mais episdios de doenas respiratrias, dado que a criana se
alimenta de mamadeira e peito.
b) Calcule a incidncia de um ou mais episdios de doenas respiratrias, dado que a criana se
alimenta somente ao seio.
c) Calcule a razo de incidncias.
d) Calcule a diferena de incidncias.
e) Discuta os resultados.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

57

Odds e probabilidade
Supor que durante um jogo de basquete um jogador acerta a cesta 2 vezes em 5 tentativas.
Chamando p ( p chapu) de probabilidade de acerto tem-se que p =
dade de erro, q =

2
= 0,4 ou 40% e a probabili5

3
= 0,6 ou 60%.
5

Considerando-se que a probabilidade de acerto ou de erro = p+q= 1; ento

q = 1 p .

Odds ratio
Define-se odds como a razo entre a probabilidade de acerto e a probabilidade de erro, ou seja,

p
.
1 p

2
p
2 x5 2
= 5 =
= = 0,67 ou 0,67:1 (0,67 acertos
No exemplo acima, o odds a favor de acerto
3
1 p
3 x5 3
5
para 1 erro).

Estudo do tipo caso-controle


Os dados a seguir so de um estudo sobre cncer de esfago e consumo de lcool. Local X. Ano Y.
Condio
Consumo mdio de lcool (g/dia)
Total
80 e +
0-79
Casos
96
104
200
Controles
109
666
775
Total
205
770
975
Fonte: Tuyns et al.,1977.
(entre expostos) odds a favor de casos entre consumidores de 80 e + g/dia:

96 109 96
:
=
= 0,88
205 205 109

(entre no expostos) odds a favor de casos entre consumidores de 0-79g/dia: 104 : 666 = 104 = 0,16
770 770 666
odds ratio:

96 104 96 x 666
:
=
= 5,6
109 666 109 x104

A fora de morbidade de cncer de esfago entre consumidores de 80 e + g/dias de bebida alcolica


5,6 a fora de morbidade entre os que consomem de 0 a 79g/dia.
Em casos especiais, o odds ratio pode ser um bom estimador do risco (quando a doena de estudo
rara).
Odds ratio utilizando-se os dados de DIC. or=(208x1467)/850x265)=1,36.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

58

De forma geral
Y: varivel resposta
X: varivel explicativa ou de confuso
Varivel Y
Varivel X
X1
X0
Total
odds a favor de Y1:
na categoria X1=
na categoria X0=

Y1
a
c
m1

Y0
B
D
m2

Total (%)
n1 (100
n0 (100
n (100)

(a/n1)(b/n1)
(c/n0)(d/n0)

ad
odds ratio: [(a/n1)(b/n1)][(c/n0)(d/n0)]= b =
c

bc

Exerccio 36
Distribuio de recm-nascidos segundo condio caso - com defeitos do tubo neural; controle recm-nascidos que no tinham defeitos do tubo neural e dieta materna. Local X. Ano Y.
Dieta
Casos
Controles
Total
N
%
n
%
n
%
Boa
34
13,9
43
35,0
77
21,0
Razovel
110
45,1
48
39,0
158
43,0
Pobre
100
41,0
32
26,0
132
36,0
Total
244
100
123
100
367
100
Fonte: X
Considere a dieta boa como categoria de referncia (basal) e calcule:
a) O odds ratio de dieta razovel em relao a dieta boa.
b) O odds ratio de dieta pobre em relao a boa.
c) Interprete os resultados.

QUI-QUADRADO DE PEARSON
DUAS VARIVEIS QUALITATIVAS
Os exemplos so retirados de BUSSAB, Wilson de O; MORETTIN, Pedro A. Estatstica bsica. 5 Ed.
So Paulo: Saraiva, 2004.
X - curso universitrio e
Y sexo do aluno
Questo: sexo do indivduo influi na escolha do curso?
Situao 1
Curso
Economia
Administrao
Total

Masculino
n
24
16
40

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

Feminino
n
36
24
60

Total
n
60
40
100

59

Curso
n
24
16
40

Economia
Administrao
Total

Masculino
proporo
0,6
0,4
1

n
36
24
60

Feminino
proporo
0,6
0,4
1

n
60
40
100

Total
proporo
0,6
0,4
1

As propores de escolha dos cursos no diferem segundo sexo do estudante

Definio de independncia:
A Ser do sexo masculino;
B Estar cursando economia.
A e B so independentes se P(A e B) = P(A) x P(B).
P(A e B) = Probabilidade (ser homem e estar cursando Economia)
P(A e B) =

P(A) =

Como

24
= 0,24
100

40
= 0,4
100

P(B) =

60
= 0,6
100

24
40 60
=
x
, ento A e B so independentes e portanto no existe associao.
100 100 100

Situao 2
Curso
Fsica
Cincias Sociais
Total

Curso
Fsica
Cincias Sociais
Total

n
100
40
140

Masculino
n
100 (a)
40 (c)
140

Masculino
proporo
0,7
0,3
1

n
20
40
60

Feminino
n
20 (b)
40 (d)
60

Feminino
proporo
0,3
0,7
1

Total
n
120
80
200

n
120
80
200

Total
proporo
0,6
0,4
1

A distribuio de alunos em cada curso, segundo sexo no a mesma, sexo e curso podem estar
associados.
Se a varivel sexo no fosse associada escolha do curso, quantos indivduos espera-se em Fsica,
entre os homens?
Aplicar a proporo marginal utilizando o raciocnio da regra de trs: 120 est para 200 assim como x
estar para 140; ou seja:

120
x
120 x140
=
e x=
200 140
200

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

60

Para os demais valores esperados observar os clculos abaixo.


Curso

Sexo

Fsica

Masculino (a)

Fsica

Feminino (b)

Cincias Sociais

Masculino (c)

Cincias Sociais

Feminino (d)

Valor Esperado sob a condio de independncia

120
x140 = 84
200
120
x60 = 36
200
80
x140 = 56
200
80
x60 = 24
200

Tabela de frequncias esperadas, sob a condio de independncia.


Curso

Masculino
n
84
56
140

Fsica
Cincias Sociais
Total

Valores observados
O

Valores esperados
E

(O-E)

100
40
20
40

84
56
36
24

16
-16
-16
16
=

Feminino
n
36
24
60

(O-E)2

Total
n
120
80
200

(O E ) 2
E

256
3,048
256
4,571
256
7,11
256
10,667
Qui-quadrado=25,397

O Qui-quadrado obtido somando-se a diferena ao quadrado entre as frequncias observadas e as


esperadas, dividido pelas frequncias esperadas.

(O E ) 2
=
E
2

Se o Qui-quadrado for igual a zero, ento no existe associao entre as variveis.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

61

Exemplo:
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo
condio de sobrevivncia e peso ao nascer (g).
Peso ao nascer
Baixo peso (<2500)
No baixo peso (2500 e mais)
Total

bito
24
3
27

Sobrevida
13
10
23

Total
37
13
50

Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.


Clculo do qui-quadrado de Pearson
(O-E)2

Valores observados
O

Valores esperados
E

(O-E)

24

19,98

4,02

16,16

0,809

7,02

-4,02

16,16

2,302

13

17,02

-4,02

16,16

0,949

10

5,98

4,02

16,16

(O E ) 2
E

2,702
Qui-quadrado=6,762

Tem-se ainda que:


A incidncia de bitos entre crianas com baixo peso 24 = 0,65 ou 65%;
37

a incidncia de bitos entre crianas sem baixo peso 3 = 0,23 ou 23%;


13
24

e a razo de incidncias igual a 37 24 x13


.
=
= 2,81
3
13

3 x37

Portanto pode-se dizer que a incidncia de bitos parece maior entre as crianas que tiveram baixo
peso ao nascer. O risco de bito entre as crianas com baixo peso ao nascer 2,8 o risco das crianas
com peso ao nascer maior ou igual a 2.500g. O qui-quadrado diferente de zero. Pode-se suspeitar
da existncia de associao entre as variveis.
Exerccio 37
A tabela abaixo apresenta dados de classificao de pessoas segundo doena isqumica coronariana
(DIC) e hbito de consumo de caf, para uma coorte de 1718 homens com idade 40-55 anos.
Distribuio de homens segundo presena de doena isqumica coronariana (DIC) e consumo de caf.
Local X. Ano y.
Condio
Consumo mdio de caf
Total
Alto ( 100 xcaras/ms)
Moderado (<100 xcaras/ms)
Com DIC
38
39
77
Sem DIC
752
889
1641
Total
790
928
1718
Fonte: X.
a) calcule a incidncia de doena isqumica coronariana entre as pessoas com alto consumo de
caf.
b) calcule a incidncia de doena isqumica coronariana entre as pessoas com consumo moderado de caf.
c) calcule a razo de incidncias.
d) calcule a diferena de incidncias.
e) Interprete os resultados.
f) Calcule o qui-quadrado de Pearson.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

62

Exerccio 38
Com base nos dados da tabela calcule:
a) a incidncia de toxinfeco, dado que o indivduo consumiu presunto cozido.
b) a incidncia de toiinfeco, dado que o indivduo no consumiu presunto cozido.
c) a razo de incidncias.
d) a diferena de incidncias.
e) discuta os resultados.
Distribuio de indivduos segundo ocorrncia de toxiinfeco e consumo de presunto cozido. Local X.
Ano Y
Presunto cozido
Sim
No
Total
RR

Toxiinfeco
sim (taxa de ataque %)
29 (0,63)
17 (0,59)
46 (0,61)
1,1

no
17
12
29

Total
46
29
75

Fonte: Epi-Info 2000.


Exerccio 39
Os dados so de um estudo sobre consumo de pimenta e cncer gstrico, realizado no Mxico. Ano Y.
Consumo de pimenta
Sim
No
Total

a)
b)
c)
d)
e)

Casos
211
9
220

Controles
607
145
752

Total
818
154
972

Fonte: X.
calcule o odds a favor de casos entre pessoas que consomem pimenta.
calcule o odds a favor de casos entre pessoas que no consomem pimenta.
calcule a razo dos odds (odds ratio).
calcule o qui-quadrado de Pearson.
Discuta os resultados sobre possvel associao entre as variveis.

Exerccio 40
A tabela abaixo apresenta o nmero de crianas classificados segundo nvel de retinol srico e sexo.
Calcule a prevalncia de nvel inadequado de retinol para crianas de cada um dos sexos. Calcule a
razo de prevalncias. Calcule o qui-quadrado. Interprete os resultados.
Distribuio de crianas segundo sexo e nvel de retinol srico. Cansao, Bahia, 1992
Sexo
Masculino
Feminino
Total

Aceitvel
50
39
89

Nvel de retinol
Inadequado
40
32
72

Total
90
71
161

Fonte: Prado MS et al. ,Revista de Sade Pblica, 29(4)295 300, 1995.


Exerccio 41
Os dados a seguir so de pesquisa que estuda a associao entre amamentao ao seio e Diabetes
Mellitus tipo I . Local X. Ano Y.
Amamentao ao seio
Casos
Controles
Total
No
35
17
52
Sim
311
329
640
Total
346
346
692
Fonte: Gimeno SGA. Consumo de leite e o Diabetes Mellitus insulino-dependente:um estudo
caso-controle. Tese de doutorado, 1996.
Com base nos dados apresentados
a) Calcule o odds ratio de casos entre expostos e no expostos.
b) Calcule e apresente o qui-quadrado de Pearson.
c) Os dados sugerem existncia de associao entre as variveis? Justifique.

FSP/USP. HEP 170 Estatsticas de Sade, Mdulo: Bioestatstica - 2014


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza

63