Você está na página 1de 87

Introduo Bioestatstica

Faculdade de Sade Pblica


Programa de Vero - 2005

Autores: Denise Pimentel Bergamaschi


Jos Maria Pacheco de Souza
Patrcia Emlia Braga

Obra protegida por direitos autorais. Proibida a reproduo total ou parcial sem a prvia
autorizao dos autores. Em caso de utilizao obrigatria a citao da fonte no texto,
com respectiva referncia bibliogrfica.
Sugesto de referncia: Bergamaschi DP, Souza JMP, Braga PE. Introduo
Bioestatstica. So Paulo, 2005. [Material de apoio Didtico de Curso de Atualizao do
Programa de Vero da Faculdade de Sade Pblica da Universidade de So Paulo]

ndice
pgina
1.

2.

3.

4.

5.

6.
7.

Elementos estatsticos para anlise exploratria de dados


1.1- Nveis de mensurao
1.2- Tpicos iniciais de amostragem
1.3- Apurao de dados
1.4- Apresentao tabular
1.5- Apresentao grfica
1.5.1 Diagrama de barras
1.5.2 Diagrama de setores circulares
1.5.3 Diagrama linear
1.5.4 - Histograma
1.5.5 Polgono de freqncia simples
1.5.6 Representao grfica de duas variveis qualitativas
1.5.7 Representao grfica de duas variveis quantitativas
1.5.8 Escalas aritmtica e logartmica
1.6- Medidas de tendncia central
1.6.1 Mdia aritmtica
1.6.2 - Mediana
1.7- Medidas de disperso
1.7.1 Valores mnimo e mximo
1.7.2 Amplitude de variao
1.7.3 - Varincia
1.7.4 Desvio padro
1.7.5 Coeficiente de Variao de Pearson
1.7.6 Quartil, percentil
1.8 Box plot (Stata)
1.9 - Noes de correlao
Medidas de associao
2.1 Razo de prevalncias
2.2 Razo de incidncias
2.3 Razo de odds (odds ratio)
2.4 Qui quadrado de Pearson
Distribuio de probabilidade
3.1- Noes de probabilidade
3.2 Distribuio Bernoulli
3.3 - Distribuio binomial
3.4 Odds e probabilidade
3.5 - Distribuio normal
3.6 - Distribuio amostral da mdia
Estimao de parmetros populacionais por ponto e por intervalo
4.1 Estimao por ponto
4.2 Estimao por intervalo Intervalo de Confiana (IC)
4.2.1 - IC para a mdia populacional com varincia populacional conhecida
4.2.2 - IC para a mdia populacional com varincia populacional desconhecida
4.2.3 - IC aproximado para a proporo populacional
Tomada de deciso
5.1- Teste de hipteses para uma proporo populacional
5.2- Teste de hipteses para uma mdia populacional
5.2.1 - Reviso de conceitos bsicos
5.2.2 - Teste de hipteses para uma mdia populacional com varincia conhecida
5.2.3 - Teste de hipteses para uma mdia populacional com varincia
desconhecida
5.3- Teste de hipteses de associao pelo qui-quadrado de Pearson

3
3
4
6
7
12
12
14
15
15
17
18
19
21
26
26
27
28
28
28
28
28
28
30
32
35
38
38
39
39
40
44
44
47
48
52
53
56
57
57
58
59
59
59
62
68
71
71
73
75

Bibliografia
Resumos dos artigos utilizados nos exerccios

79
81

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

76

Populao, amostra, varivel, coleta e apurao de dados


1- Elementos estatsticos para anlise exploratria de dados
Estatstica: uma coleo de mtodos para planejar experimentos, obter e organizar dados, resumi-los,
analis-los, interpret-los e deles extrair concluses (Triola, 1999).
Bioestatstica Estatstica aplicada s cincias da vida.

1.1 - Nveis de mensurao

Escala nominal
Os indivduos so classificados em categorias segundo uma caracterstica.
Ex: sexo (masculino, feminino),
hbito de fumar (fumante, no fumante),
sobrepeso (sim, no).
No existe ordem entre as categorias e suas representaes, se numricas, so destitudas de significado
numrico.
Ex:
sexo masculino=1, sexo feminino = 2.
Os valores 1 e 2 so apenas rtulos.
Escala ordinal
Os indivduos so classificados em categorias que possuem algum tipo inerente de ordem. Neste caso, uma
categoria pode ser "maior" ou "menor" do que outra.
Ex:
nvel scio-econmico (A, B, C e D; onde A representa maior poder aquisitivo);
nvel de retinol srico (alto, aceitvel, baixo, deficiente) onde alto: maior ou igual a 50,0 g/dl;
aceitvel: 20,0 a 49,9 g/dl, baixo: 10,0 a 19,9 g/dl e deficiente: menor ou igual a 10,0 g/dl.
Estes critrios so do Commitee on Nutrition for National Defense ICNND/USA, 1963 (in Prado MS et
al, 1995).
Embora exista ordem entre as categorias, a diferena entre categorias adjacentes no tem o mesmo
significado em toda a escala.
Escalas numricas
Escala intervalar
Este nvel de mensurao possui um valor zero arbitrrio.
Ex: temperatura em graus Celsius.
Escala de razes possui zero verdadeiro
Escala de razes discreta: o resultado numrico da mensurao um valor inteiro.
Ex:
nmero de refeies em um dia (nenhuma, uma, duas, trs, quatro, ...),
freqncia de consumo semanal de determinado alimento (1 vez, 2 vezes, 3 vezes, 4 vezes, 5 vezes,
6 vezes, 7 vezes) .
Escala de razes contnua: o resultado numrico um valor pertencente ao conjunto dos nmeros reais R
={-;...; -38; ...; -0,3;...; 0;...0,2;...0,73;...; 1;...; 2,48;...; +}.
Ex:
idade (anos), peso (g), altura (cm),nvel de retinol srico (g/dl), circunferncia da cintura (cm)
De acordo com o nvel de mensurao, os fenmenos ao serem medidos, resultam em variveis que podem
ser classificadas em qualitativas e quantitativas. Esquematicamente tem-se:
Qualitativa
nominal
VARIVEL:
ordinal
discreta
Quantitativa
contnua

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

O tipo da varivel ir indicar a melhor forma para o dado ser apresentado em tabelas e grficos, em
medidas de resumo e, a anlise estatstica mais adequada.

1.2 - Tpicos iniciais de amostragem

Coleta de dados
a observao e registro da categoria ou medida de variveis relacionadas ao objeto de estudo que
ocorrem em unidades (indivduos) de uma amostra ou populao.
Populao: totalidade de elementos sob estudo. Apresentam uma ou mais caractersticas em comum.
Na prtica, a populao de estudo nem sempre corresponde populao alvo. Por exemplo, no estudo
sobre a ocorrncia de sobrepeso em crianas de 7 a 12 anos no Municpio de So Paulo, no ano de 2003, a
populao alvo o conjunto de todas as crianas nesta faixa etria, deste municpio, neste ano. Porm,
pode ser que algumas crianas estejam ausentes no momento da entrevista (crianas que esto internadas,
que trabalham, que no permanecem no domiclio durante o dia ou esto viajando) fazendo com que a
populao de estudo represente um subconjunto da populao alvo.
Elementos: so unidades de anlise; podem ser pessoas, domiclios, escolas, creches, clulas ou qualquer
outra unidade.
Amostra: uma parte da populao de estudo.
Amostragem: processo para obteno de uma amostra. Tem como objetivo estimar parmetros
populacionais
Parmetro: Quantidade fixa de uma populao
Ex: peso mdio ao nascer de crianas que nascem no municpio de So Paulo ( = 3100 g);
proporo de crianas de 7 a 12 anos classificadas como obesas, no municpio de So Paulo ( =
12%).
Estimador: uma frmula matemtica que permite calcular um valor (estimador por ponto) ou com um
conjunto de valores (estimador por intervalo) para um parmetro.
n

Ex: Mdia aritmtica: X =


n

onde

x
i =1

x
i =1

= x1 + x2 + ... + xn

e n= nmero de observaes.

Estimativa: Valor do estimador calculado em uma amostra. Estima o valor do parmetro.


Ex: Peso mdio ao nascer, calculado em uma amostra de 120.000 crianas nascidas no Municpio de So
Paulo no ano de 2000: mdia amostral

x = 3000 g

Tipos de Amostragem
Probabilstica: cada unidade amostral tem probabilidade conhecida e diferente de zero de pertencer
amostra. usada alguma forma de sorteio para a obteno da amostra
No probabilstica: no se conhece a probabilidade de cada unidade amostral pertencer amostra. Algumas
unidades tero probabilidade zero de pertencer amostra.
Ex: amostragem intencional; por voluntrios; acesso mais fcil; por quotas.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

Tipos de amostragem probabilstica


- aleatria simples (com e sem reposio)
- sistemtica
- com partilha proporcional ao tamanho do estrato
- por conglomerado
Amostragem aleatria simples (AAS)
o processo de amostragem onde qualquer subconjunto de n elementos diferentes de uma populao de N
elementos tem mesma probabilidade de ser sorteado (Kalton G. 1983, Silva, NN, 1998). Tamanho da
populao: N; tamanho da amostra: n; frao global de amostragem ou probabilidade de sortear um
indivduo =

n
N

- necessrio ter um sistema de referncia que contenha todos os elementos da populao da qual ser
retirada a amostra.
- Utilizao da tabela de nmeros aleatrios - mecnica
- Utilizao de programas computacionais
Amostragem sistemtica
Utiliza-se a ordenao natural dos elementos da populao (pronturios, casa, ordem de nascimento).

- Intervalo de amostragem

k=

N
n

, onde N= tamanho da populao e n = tamanho da amostra

- Incio casual i, sorteado entre 1 e k, inclusive


- Amostra sorteada composta pelos elementos: i, i+k, i+2k, ...., i+(n-1)k
OBS: necessrio ter cuidado com a periodicidade dos dados, por exemplo se for feito sorteio de dia no
ms, pode cair sempre em um domingo onde o padro de ocorrncia do evento pode ser diferente.
Exemplo: N=80; n=10; k =

N 80
=
=8;
n 10

incio casual:

1 i 8

Comeo casual sorteado: i=4


Amostra composta dos elementos:

i
i+k
i+2k
.
.
.
i+(n-1)k

4
12
20
.
.
.
76

Se o intervalo de amostragem no for inteiro proceder da seguinte forma:


N= 321 ; n=154;

K=

N 321
=
= 2,084
n 154

i deve ser um nmero sorteado entre 1 e 2,084


Sortear um nmero entre 1000 e 2084 e dividir o resultado por 1000
Nmero sorteado = 1941, portanto i=1,941

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

Indivduos:

elemento
I
i+k
i+2k
I+3k
.
.
.
i+(n-1)k

1,941
1,941+2,084 = 4,025
1,941+4,1680 = 6,109
1,941+6,252 = 8,193
.
.
.
1,941+318,852 = 320,793

1
4
6
8

320

Amostragem por conglomerado


o processo no qual os elementos da populao so reunidos em grupos que constituem a unidade
amostral e, por sua vez, alguns destes so sorteados para comporem a amostra. Se o interesse residir no
sorteio de escolares, em um processo de amostragem por conglomerados, seria possvel sortear escolas
(unidade amostral) e considerar todos os alunos destas para comporem a amostra (Silva, 1998).

1.3 - Apurao de dados


Processo no qual conta-se o nmero de vezes que a varivel assumiu um determinado valor (freqncia de
ocorrncia). Pode ser manual, mecnica ou eletrnica (programas estatsticos: Epi info, Stata, Excel, SPSS,
SAS, R, S-Plus)
Distribuio de freqncias - correspondncia entre categorias (valores) e freqncia de ocorrncia.

valores pontuais
valores em intervalos de classe

Distribuio de freqncias

Notao:
X : varivel
xi : valor observado para o indivduo i
Apresentao pontual
Ex: 10 indivduos
X: nmero de refeies dirias
x: 2, 3, 3, 1, 5, 2, 3, 2, 3
Apurao:
nmero de refeies
1
2
3
5

freqncia absoluta
1
3
4
1

X: idade (anos inteiros)


x: 5, 5, 15, 20, 20, 20, 21, 21, 22, 22
idade
5
15
20
21
22

freqncia
2
1
3
2
2

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

X: peso ao nascer em gramas


X: 2250, 3025, 1600, 2725, 3750, 3950, 2400, 2180, 2520, 2530
freqncia
peso
1600
2180
2250
2400
2520
2530
2725
3025
3750
3950

1
1
1
1
1
1
1
1
1
1

Altura em metro
X: 1,63; 1,60; 1,59; 1,60; 1,45; 1,73; 2,05; 1,85
freqncia
altura
1,45
1,59
1,60
1,63
1,73
1,85
2,05

1
1
2
1
1
1
1

1.4 - Apresentao tabular


Elementos essenciais: ttulo, corpo, cabealho e coluna indicadora.
Tabela 1 - Ttulo: o que (natureza do fato estudado)?como (variveis)?onde? quando?
Varivel
%
n

Total
Fonte
notas, chamadas
OBS:

nenhuma casela (interseco entre linha e coluna) deve ficar em branco.

A tabela deve ser uniforme quanto ao nmero de casas decimais e conter os smbolos ou 0 quando o
valor numrico nulo e ... quando no se dispe do dado.
Exemplo:
Distribuio de Municpios brasileiros segundo prevalncia de bcio em escolares de 6 a 14 anos.
Inqurito Nacional, Brasil, 1994 a 1996.
Prevalncia de bcio (%)
Freqncia
%
< 5,0 (no endmico)
326
5,0 a 19,9 (leve)
83
20,0 a 29,9 (moderado)
15
4
30 (grave)
Total
428
Fonte: Corra Filho HR et al., 2002 (adaptado).

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

76,18
19,39
3,50
0,93
100

Como idade varivel quantitativa contnua, a melhor forma de apresent-la em tabelas utilizando
intervalos de valores denominados intervalos de classe.
Exemplo:
x: 5, 5, 15, 20, 20, 20, 21, 21, 22, 22
Idade
5 |-- 10
10 |-- 15
15 |-- 20
20 |-- 25
Total

freqncia
2
0
1
7
10

%
20
10
70
100

Intervalos de classe: conjunto de observaes contidas entre dois valores limite (limite inferior e limite
superior)
Representao:
5 | -- 10
5 -- 10
5 |-- | 10

intervalo fechado no limite inferior e aberto no limite superior


(contm o valor 5 mas no contm o valor 10)
intervalo aberto nos limites inferior e superior
(no contm os valores 5 e 10)
intervalo fechado nos limites inferior e superior
(contm os valores 5 e 10)

OBS: Representar o intervalo 0 |-- | 11 meses equivalente a represent-lo como 0 |-- 12 meses
X: 2250, 3025, 1600, 2725, 3750, 3950, 2400, 2180, 2520, 2530
Peso
1500|--2000
2000|--2500
2500|--3000
3000|--3500
3500|--4000
Total

freqncia
1
3
3
1
2
10

%
10
30
30
10
20
100

Considerando-se a altura (m) de 7 indivduos


X: 1,63; 1,60; 1,59; 1,60; 1,45; 1,73; 2,05; 1,85
Altura
1,45|--1,55
1,55|--1,65
1,65|--1,75
1,75|--1,85
1,85|--1,95
1,95|--2,05
2,05|--2,15
Total

freqncia
1
3
1
0
1
0
1
7

%
14,3
42,8
14,3
14,3
14,3
100

Os intervalos de classe devem ser mutuamente exclusivos (um indivduo no pode ser classificado em
dois intervalos ao mesmo tempo) e exaustivos (nenhum indivduo pode ficar sem classificao).
A amplitude do intervalo o tamanho do intervalo de classe. A amplitude do intervalo e o nmero de
intervalos dependem basicamente do problema especfico e da literatura existente sobre o assunto.
O ponto mdio do intervalo calculado somando-se o limite inferior e limite superior, dividindo-se o
resultado por dois.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

Tabela de dupla entrada ou de contingncia


Valores nacionais de dosagens de iodo salino e bcio clnico em crianas de 6 a 14 anos. Inqurito nacional,
Brasil, 1994 a 1996.
Grau de
Bcio

Suficiente
n
%
1967
97,5
50
2,5
2017
100

Zero b
I e II
Total
a

Leve

n
18293
493
18786

Iodao salinaa
Moderada
n
%
61497
95,1
3140
4,9
64637
100

%
97,4
2,6
100

Grave
n
%
15450
95,8
669
4,2
16119
100

Total
n
97207
4352
101559

%
95,7
4,3
100

suficiente 40 mg/kg; leve 20-39 mg/kg; moderada 10-19 mg/kg; grave < 10 mg/kg.
normal
Fonte: Corra Filho HR et al., 2002.
b

Exemplo: Tabela retirada do artigo Cartografia do retardo estatural em escolares do estado da Paraba.
Brasil. Carvalho AT et al. Rev Sade Pblica 2000; 34(1):3-8.

Questo 1
Classificar quanto a natureza, as seguintes variveis
Varivel
condio de sade (doente, no doente)
tipo de parto (normal, cesrio)
nvel de colesterol srico (mg/100cc)
tempo de um procedimento cirrgico (minutos)
nmero de praias consideradas poludas
custo do procedimento (reais)

Tipo (natureza)

Questo 2
Os dados a seguir so de peso (kg) de 80 mulheres identificadas pela varivel id (identificao).
Id
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Peso
65
65
58
59
67
68
74
81
66
61
64
65
67
68
70

Id
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

peso
71
84
63
64
65
74
81
66
69
71
71
72
73
75
77

Id
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45

Peso
70
72
75
76
77
78
80
82
63
66
72
72
72
73
73

Id
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60

Peso
75
79
79
82
83
65
68
75
76
78
78
81
85
66
68

Id
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75

Peso
68
69
76
77
80
81
59
64
70
80
85
70
71
72
72

Id
76
77
78
79
80

Peso
75
79
73
82
76

Fonte: Osborn JF. Statistical Exercises in Medical Research. John Wiley & Sons Inc., 1979. (adaptado)

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

Sorteie uma amostra sistemtica de tamanho 20. Indique o intervalo de amostragem e o comeo casual
sorteado. Indique o nmero de identificao de cada elemento da amostra.
Questo 3
Os dados a seguir so de altura de uma amostra de 351 mulheres idosas selecionadas aleatoriamente de
uma comunidade para um estudo de osteoporose. Faa uma apurao dos dados e represente-os em uma
tabela. Interprete os resultados.
142
145
145
145
146
147
147
147
147
148
148
149
150
150
150
150
150
150
151
151
151
151
151
151
152
152
152
152
152
152

152
152
152
152
152
152
153
153
153
153
153
153
153
153
153
153
153
153
153
153
153
153
153
154
154
154
154
154
154
154

154
154
154
154
155
155
155
155
155
155
155
155
155
155
155
155
155
155
155
155
155
155
155
155
155
156
156
156
156
156

156
156
156
156
156
156
156
156
156
156
156
156
156
156
156
157
157
157
157
157
157
157
157
157
157
157
157
157
157

157
157
157
157
157
157
158
158
158
158
158
158
158
158
158
158
158
158
158
158
158
158
158
158
158
158
158
158
158

158
158
158
158
158
158
158
158
159
159
159
159
159
159
159
159
159
159
159
159
159
159
159
159
159
160
160
160
160

160
160
160
160
160
160
160
160
160
160
160
160
160
160
160
160
160
161
161
161
161
161
161
161
161
161
161
161
161

161
161
161
161
161
161
161
161
162
162
162
162
162
162
162
162
162
162
162
162
162
162
162
162
162
162
163
163
163

163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
163
164
164

164
164
164
164
164
164
164
164
164
164
164
164
164
164
164
165
165
165
165
165
165
165
165
165
165
165
165
165
165

165
165
165
165
166
166
166
166
166
166
166
166
166
166
166
167
167
167
167
167
167
167
168
168
168
168
168
168
169

169
169
169
169
169
169
169
170
170
170
170
170
170
170
170
170
170
170
171
171
171
173
173
173
174
176
177
178
178

Fonte: Hand DJ et al., 1994.


Questo 4
Os dados a seguir so relativos ao peso ao nascer (g) de recm nascidos com sndrome de desconforto
idioptico grave. Algumas crianas foram a bito (*) e outras sobrevieram.
1050*
1175*
1230*
1310*
1500*
1600*
1720*
1750*
1770*
2275*

2500*
1030*
1100*
1185*
1225*
1262*
1295*
1300*
1550*
1820*

Fonte: Hand DJ et al., 1994.

1890*
1940*
2200*
2270*
2440*
2560*
2730*
1130
1575
1680

1760
1930
2015
2090
2600
2700
2950
2550
2570
3005

2830
1410
1715
1720
2040
2200
2400
3160
3400
3640

a) Classifique a varivel peso ao nascer em duas categorias: baixo peso (abaixo de 2500 g) e no
baixo peso (2500 g e mais) e faa uma tabela bidimensional cruzando as variveis: condio do
recm-nascido (sobrevivente ou no sobrevivente) e peso ao nascer (baixo peso e no baixo peso).
b) Interprete os resultados.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

10

Questo 5
Os dados abaixo so de um estudo de prevalncia de doena cardaca e investigao de fatores de risco
associados. Calcular os valores relativos (percentuais).
Distribuio de pacientes segundo ronco noturno e doena cardaca
Ronco noturno
Sim
No
Ocasional
Quase todas as noites
Sempre
Total

Fonte: Hand DJ et al., 1994.

N
24
35
21
30
110

Doena cardaca
No
%
N
1355
603
192
224
2374

Total
%

N
1379
638
213
254
2484

Questo 6
Com base nos dados da tabela abaixo,
a) Calcular o percentual de mes com dieta boa, razovel e pobre entre os casos de spina bfida e entre os
controles (fixando o 100% no total de casos e de controles);
b) Analise e discuta os resultados.
Distribuio de recm-nascidos casos (acometidos de spina bfida) e controles segundo dieta da me.
Dieta materna
Boa
Razovel
Pobre
Total

Fonte: Hand DJ et al., 1994.

Casos
No
34
110
100
244

Controles
No
43
48
32
123

Total
No
77
158
132
367

Questo 7
A tabela abaixo foi extrada do artigo Tendncia secular do peso ao nascer na cidade de So Paulo (19761998) de MONTEIRO CA et al. (Rev. Sade Pblica; 2000:34 (6, supl): 26-40).
Comente os resultados apresentados.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

11

Questo 8
A tabela abaixo foi extrada do artigo Infeco pelo HIV durante a gestao: Estudo-Sentinela Parturiente,
Brasil, 2002 de Souza Jnior et al. (Rev. Sade Pblica; 2004:38(6):764-72).
Comente os resultados apresentados.

1.5 - Apresentao grfica


1.5.1 - Diagrama de barras

Caractersticas: barras separadas e bases de mesmo tamanho.


Apropriados para representar as variveis: qualitativa nominal, ordinal e quantitativa discreta.
Varivel qualitativa
O Inqurito Brasileiro de Nutrio (IBRANUTRI) foi um estudo de pacientes maiores de 18 anos, internados
em hospitais da rede pblica, conveniados, filantrpicos e universitrios de 12 estados do Brasil e do Distrito
Federal, realizado de maio a novembro de 1996 (Correia, 1997). Os dados da tabela so retirados deste
estudo.
Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996
Estado nutricional
Nutrido
Desnutrido
Sem diagnstico
Total

n
2061
1905
34
4000

Fonte: adaptado de Soares JF et al., 2002.

%
51,5
47,6
0,9
100

2500

Nmero

2000
1500
1000
500
0
Nutrido

Desnutrido

Sem
diagnstico

Estado nutricional

Fonte: adaptado de Soares JF et al., 2002.

Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996


Excluindo-se os registros com informao ignorada

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

12

2500
Nmero

2000
1500
1000
500
0
Nutrido

Desnutrido

Estado nutricional
Fonte: adaptado de Soares JF et al., 2002.

Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996


A representao grfica abaixo est correta?
2100
2050
Nmero

2000
1950
1900
1850
1800
Nutrido

Desnutrido

Ateno:Estado nutricional origem!


cuidado com a
Varivel qualitativa ordinal
Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996
Estado nutricionala
n
Nutrido
2061
Desnutrido moderado
1407
Desnutrido grave
498
Total
3966
a
excluindo-se 34 (0,9%) de pacientes sem diagnstico
Fonte: adaptado de Soares JF et al, 2002.

60

%
52,0
35,5
12,5
100

50
40
30
20
10
0
Nutrido

Desnutrido moderado

Desnutrido grave

Estado nutricional
a

excluindo-se 34 (0,9%) de pacientes sem diagnstico


Fonte: adaptado de Soares JF et al., 2002.

Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.


Varivel quantitativa discreta

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

13

Foi realizada, no perodo de outubro de 1998 a outubro 1999, a pesquisa Alimentao no primeiro ano de
vida, onde estudou-se uma coorte de recm-nascidos da maternidade do Hospital Universitrio (HU). Os
dados a seguir so parte da caracterizao scio-econmica da amostra estudada.
Distribuio de famlias segundo nmero de bens* que possuem.
Nmero de bens
n
%
0
146
40,6
1
97
26,9
2
87
24,2
3
26
7,2
4
4
1,1
Total
360
100
* automvel, telefone, TV a cabo e computador

Distribuio de famlias segundo nmero de bens*


50

40
30
20
10
0
0

2
3
Nmero de bens

1.5.2 - Diagrama de setores circulares

Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.


Estado nutricionala
n
Nutrido
2061
Desnutrido moderado
1407
Desnutrido grave
498
Total
3966
a
excluindo-se 34 (0,9%) de pacientes sem diagnstico
Fonte: adaptado de Soares JF et al., 2002.

%
52,0
35,4
12,6
100

12,6%

52,0%
35,4%

Nutrido

Desnutrido moderado

Desnutrido grave

excluindo-se 34 (0,9%) de pacientes sem diagnstico


Fonte: adaptado de Soares JF et al., 2002.

Distribuio de pacientes(a) segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

14

1.5.3 - Diagrama linear

Produo de leite (milhes de toneladas).ndia e Estados Unidos, 1966 2000.


Ano
1966
1970
1980
1990
2000

ndia
20
23
29
50
80

Estados Unidos
58
56
60
70
75

Fonte: State of the World, 2001. W W Norton&Company, N.Y.


ndia
EUA

milhes de toneladas

100
80
60
40
20
0
1970

1980
1990
Ano

2000

Fonte: State of the World, 2001. W W Norton&Company, N.Y.

Produo de leite (milhes de toneladas). ndia e Estados Unidos, 1966 2000.

1.5.4 - Histograma

Adequado para representar uma varivel quantitativa contnua


Intervalos de classe com mesma amplitude
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao
nascer (g)
No
13
15
9
9
3
1
50

Peso(g)
1000 |-- 1500
1500 |-- 2000
2000 |-- 2500
2500 |-- 3000
3000 |-- 3500
3500 |-- 4000
Total
Fonte: van Vliet PKJ et al., 1973.

35

%
26
30
18
18
6
2
100

30
25
20
15
10
5
0

1000

1500

2000

2500

3000

3500

4000

Peso ao nascer (g)


Fonte: van Vliet PKJ et al., 1973.

Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao


nascer (g).

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

15

Ateno: O grfico construdo considerando-se pessoas por unidade de medida (densidade)


No
13
15
9
9
3
1
50

1500
2000
2500
3000
3500
4000

nmero/g

Peso(g)
1000 |-1500 |-2000 |-2500 |-3000 |-3500 |-Total

%
26
30
18
18
6
2
100

No/amplitude
0,026
0,030
0,018
0,018
0,006
0,002

amplitude
500
500
500
500
500
500

(No/amplitude)x10000
26
30
18
18
6
2

0,030
0,025
0,020
0,015
0,010
0,005
0
1000

1500

2000

2500

3000

3500

4000

peso ao nascer (g)

OBS: notar que com intervalos iguais, no necessrio fazer ajuste na altura dos retngulos dado que as
bases so de mesmo tamanho (mesma amplitude) e, portanto, com proporcionalidade assegurada.
Intervalos de classe com amplitudes diferentes
Distribuio de mulheres idosas segundo a altura.
No
12
52
109
156
22
351

Altura (cm)
140|--150
150|--155
155|--160
160|--170
170|--180
Total

%
3,4
14,8
31,1
44,4
6,3
100

Fonte: Hand DJ et al., 1994.

necessrio fazer o ajuste

No
12
52
109
156
22
351

Altura (cm)
140|--150
150|--155
155|--160
160|--170
170|--180
Total

No/amplitude
1,2
10,4
21,8
15,6
2,2

Amplitude
10
5
5
10
10

Distribuio de mulheres idosas segundo a altura.


25

Mulheres/cm

20
15
10

Fonte: Hand DJ et al., 1994.


5
0
140

145

150

155

160

165

170

175

180

Cuidado: Sem fazer o ajuste, o grfico fica errado e pode levar a concluses erradas!
altura (cm)

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

16

50
45
40
35
30
25
20
15
10
5
0

140

150

160

170

180

Altura (cm)

1.5.5- Polgono de freqncia simples


Intervalos de classe com mesma amplitude
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao
nascer (g).
Peso(g)
1000 |-- 1500
1500 |-- 2000
2000 |-- 2500
2500 |-- 3000
3000 |-- 3500
3500 |-- 4000
Total
Fonte: Hand DJ et al., 1994.

16

No
13
15
9
9
3
1
50

%
26
30
18
18
6
2
100

Nmero

14
12
10
8
6
4
2
0
0

500

1000 1500 2000 2500 3000 3500 4000 4500


peso (g)

Fonte: Hand DJ et al., 1994.


Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao
nascer (g).

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

17

Intervalos de classe com amplitudes diferentes


Distribuio de mulheres idosas segundo a altura.
Altura (cm)
140|--150
150|--155
155|--160
160|--170
170|--180
Total
Fonte: Hand DJ et al., 1994.

Fazendo-se o ajuste:

No
12
52
109
156
22
351

Altura (cm)
140|--150
150|--155
155|--160
160|--170
170|--180
Total

No
12
52
109
156
22
351

%
3,4
14,8
31,1
44,4
6,3
100

No/amplitude
1,2
10,4
21,8
15,6
2,2

Amplitude
10
5
5
10
10

nmero de pessoas/cm

25
20
15
10
5
0
130 135 140 145 150 155 160 165 170 175 180 185 190
Altura (cm)

Fonte: Hand DJ et al., 1994.


Distribuio de mulheres idosas segundo a altura (cm).

1.5.6 - Representao grfica de duas variveis qualitativas


Os dados so de um estudo de obesidade em mulheres, que estuda a relao entre idade da menarca e a
medida do trceps.
Idade da menarca
< 12 anos
12 anos e mais
Fonte: Hand DJ et al., 1994.

Pequeno
15
156

Medida do trceps
Intermedirio
29
197

Grande
36
150

Calculando-se as porcentagens tem-se:


Idade
(anos)
<12
12 e +
Total

Pequeno
n
15
156
171

%
18,8
31,0
29,3

Medida do trceps
Intermedirio
n
29
197
226

%
36,2
39,2
38,8

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

Grande
n
36
150
186

%
45,0
29,8
31,9

Total
n
80
503
583

%
100
100
100

18

50

%
Pequeno

45

Intermedirio

40

Grande

35
30
25
20
15
10
5
0
<12

12 e +
Idade da menarca

Distribuio de mulheres segundo idade da menarca e medida do trceps.

1.5.7 - Representao grfica de duas variveis quantitativas


Fixando-se os percentuais na condio do recm-nascido

Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao


nascer (g) e condio do recm-nascido
Peso(g)
1000 |-- 1500
1500 |-- 2000
2000 |-- 2500
2500 |-- 3000
3000 |-- 3500
3500 |-- 4000
Total
Fonte: Hand DJ et al., 1994.

45
40
35
30
25
20
15
10
5
0

Sobrevivente
No
%
2
9
6
26
5
22
6
26
3
13
1
4
23
100

No sobrevivente
No
%
11
41
9
33
4
15
3
11
0
0
27
100

No
13
15
9
9
3
1
50

Total
%
26
30
18
18
6
2
100

1000 1500 2000 2500 3000 3500 4000

1000 1500 2000 2500 3000

Sobrevivente

No sobrevivente

Condio do recm nascido

Fonte: Hand DJ et al., 1994.


Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao
nascer (g) e condio do recm-nascido.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

19

Polgono de freqncias

45

Sobrevivente

40

No sobrevivente

35
30
25
20
15
10
5
0
500

1000

1500 2000 2500 3000


peso ao nascer (g)

3500 4000

4500

Fonte: Hand DJ et al., 1994.


Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao
nascer (g) e condio do recm-nascido.

Fixando-se os percentuais no peso ao nascer:


Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao
nascer (g) e condio do recm-nascido.
Peso(g)
1000 |-1500 |-2000 |-2500 |-3000 |-3500 |-Total

1500
2000
2500
3000
3500
4000

Fonte: Hand DJ et al., 1994.


120

Sobrevivente
No
%
2
15
6
40
5
56
6
67
3
100
1
100
23
46

No sobrevivente
No
%
11
85
9
60
4
44
3
33
0
0
27
54

No
13
15
9
9
3
1
50

Total
%
100
100
100
100
100
100
100

Sobrevivente

100
No sobrevivente
80
60
40
20
0
1000 |--1500

1500 |--2000

2000 |--2500

2500 |--3000

3000 |--3500

3500 |--4000

peso (g)

Fonte: Hand DJ et al., 1994.


Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao
nascer (g) e condio do recm-nascido.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

20

Outro grfico possvel:


no sobreviviente

100

sobrevivente

80
60
40
20
0
1000 1500 2000 2500 3000 3500 4000

peso (g)
Fonte: Hand DJ et al., 1994.
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao
nascer (g) e condio do recm-nascido.

1.5.8 - Escalas aritmtica e logartmica

Nmero de crianas segundo massa corporal. Escola X, 2000 e 2002.


Ano
2000
2002

Sobrepeso
300
150

Obesas
100
50

Fonte: dados hipotticos


Grfico em escala aritmtica

Sobrepeso

400

Obesa

Nmero

300
200
100
0
2000

2002
Ano

Fonte: dados hipotticos

Nmero de crianas segundo massa corporal. Escola X, 2000 e 2002.


Grfico em escala logartmica
1000

Nmero

100

10

Sobrepeso
Obesa

1
2000

2002
Ano

Fonte: dados hipotticos

Nmero de crianas segundo massa corporal. Escola X, 2000 e 2002.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

21

Grfico em escala aritmtica


Coeficiente de mortalidade pela doena X e Y (100.000hab). Determinada localidade, 19901995.
Ano

Doena X

Doena Y

1990

123,5

28,7

1991

121,4

22,4

1992

111,9

17,7

1993

85,9

13,9

1994

77,1

14,8

1995

62,2

10,5

Fonte: Dados hipotticos

150

Doena X

Coeficiente

Doena Y

100
50
0
1990 1991 1992 1993 1994 1995

Ano
Fonte: Dados hipotticos

Coeficiente de mortalidade pela doena X e Y (100.000hab). Determinada localidade, 19901995.


Grfico em escala logartmica

1000

Doena X

Coeficiente

Doena Y
100

10

1
1990

1991

1992

1993

1994

1995

Ano
Fonte: dados hipotticos

Coeficiente de mortalidade pela doena X e Y (100.000hab). Determinada localidade, 19901995.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

22

Questo 9
Apresente os dados da tabela em um grfico apropriado.
Distribuio de crianas segundo nvel de retinol srico. Cansao, Bahia, 1992.
No
89
65
7
161

Retinol srico (g/dl)


Aceitvel (20-49)
Baixo (10-19,9)
Deficiente (<10 )
Total

%
55,3
40,4
4,3
100

Fonte: Prado MS et al, 1995.

Questo 10
Apresente os dados da tabela em:
a) um histograma.
b) um polgono de freqncias.
Distribuio de homens adultos segundo comprimento do ante-brao
Comprimento (polegadas)
16,0 |-- 16,5
16,5 |-- 17,0
17,0 |-- 17,5
17,5 |-- 18,0
18,0 |-- 18,5
18,5 |-- 19,0
19,0 |-- 19,5
19,5 |-- 20,0
20,0 |-- 20,5
20,5 |-- 21,0
21,0 |-- 21,5
Total

Fonte: Hand DJ et al., 1994.

No
4
3
12
11
21
25
23
19
10
10
2
140

%
2,9
2,1
8,6
7,9
15,0
17,9
16,4
13,6
7,1
7,1
1,4
100

Questo 11
Apresente os dados da tabela em um grfico apropriado.
Distribuio de homens segundo presena de doena coronariana (CHD) e consumo de caf
Condio

Com
CHD
Sem CHD
Total

Alto consumo de caf


(>=100xcaras/ms)
n
%
38
4,8
752
790

95,2
100

Moderado consumo de caf


(<100 xcaras/ms)
n
%
39
4,2
889
928

95,8
100

Total
n
77

%
4,5

1641
1718

95,5
100

Questo 12
Interprete os grficos dos itens a seguir
a) artigo: Diagnstico de sobrepeso em adolescentes: estudo do desempenho de diferentes critrios
para o ndice de Massa Corporal de MONTEIRO POA et al. (Rev. Sade Pblica, 2000;34(5):506-13).

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

23

b) Artigo: Mortalidade por desnutrio em idosos, regio Sudeste do Brasil, 1980-1997 de OTERO UB et al.
(Rev. Sade Pblica, 2002; 36(2):141-48).

(adaptado)
b) Artigo: Cartografia do retardo estatural em escolares do Estado da Paraba, Brasil de CARVALHO AT
et al. (Rev. Sade Pblica, 2000; 34(1):3-8).

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

24

d) Artigo: Aflatoxinas e ocratoxina A em alimentos e riscos para a sade humana de CALDAS ED et al. (Rev.
Sade Pblica, 2002; 36(3):319-23).

e) Artigo: Tendncia secular da anemia na cidade de So Paulo (1984-1996) de MONTEIRO CA et al. (Rev.
Sade Pblica, 2000; 34(6, sup):62-72).

f) Artigo: FORNES NS et al. Escores de consumo alimentar e nveis lipmicos em populao de So Paulo,
Brasil. Rev. Sade Pblica, 2002; 36(1):12-8.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

25

(adaptado)

1.6 - Medidas de tendncia central


1.6.1 - Mdia aritmtica

Notao:
X varivel
N tamanho da populao
n tamanho da amostra

mdia populacional (parmetro, geralmente desconhecido)


X

Estatstica (frmula)

x mdia amostral (estimativa, valor calculado na amostra)

Mdia aritmtica o valor que indica o centro de equilbrio de uma distribuio de freqncias de uma
varivel quantitativa.
Definio: a soma dos valores de uma varivel, dividida pelo nmero de valores.
Em uma amostra aleatria simples de tamanho n, composta das observaes x1, x2, ..., xn, a mdia
aritmtica ( x ) igual a:
n

OBS:

x + x 2 + ...+ x n
=
x= 1
n

x
i =1

s existe para variveis quantitativas e seu valor nico;


da mesma natureza da varivel considerada; e
sofre influncia dos valores aberrantes.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

26

Exemplo:
Os dados a seguir so provenientes do grupo Western Collaborative Group Study, criado na Califrnia em
1960-61. Foram estudados 3154 homens de meia idade para investigar a relao entre padres de
comportamento e risco de doena coronariana. Os dados apresentados so de 40 homens para os quais
foram medidos os nveis de colesterol (mg por 100ml) e realizada uma categorizao segundo
comportamento. O comportamento de tipo A caracterizado pela urgncia, agressividade e ambio. O de
tipo B relaxado, no competitivo e menos preocupado.
Tipo A: nvel de colesterol
233
291
312
250
246
197
268
224
239
239
254
276
234
181
248
252
202
218
212
325
Tipo B: nvel de colesterol
344
185
263
226
175
242

246
252

224
153

212
183

188
137

250
202

148
194

169
213

Colesterol mdio:

xA =

233 + 291 + ... + 212 + 325


= 245,05 mg / 100 ml
20

xB =
Se todos os homens do tipo A tivessem o mesmo nvel de colesterol, este seria 245,1 mg/100ml e do tipo B,
____________.

1.6.2 - Mediana
o valor que ocupa a posio central de uma srie de n observaes, quando estas esto ordenadas de
forma crescente ou decrescente.
Quando nmero de observaes (n) for mpar:
a mediana o valor da varivel que ocupa o posto

n+1
2

Quando o nmero de observaes (n) for par:


a mediana a mdia aritmtica dos valores da varivel que ocupam os postos

n
2

n+2
2

OBS:
existe para varivel quantitativa e qualitativa ordinal;

da mesma natureza da varivel considerada;

torna-se inadequada quando h muitos valores repetidos;

no sofre influncia de valores aberrantes;

pode ser calculada mesmo quando os dados esto agrupados em intervalos de classe e os extremos de
algum intervalo no esteja definido (a no ser que a mediana caia neste intervalo).
Exemplo:
Tipo A: nvel de colesterol
233
254

291
276

312
234

250
181

246
248

197
252

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

268
202

224
218

239
212

239
325

27

Tipo B: nvel de colesterol


344
226

185
175

263
242

246
252

224
153

212
183

188
137

250
202

148
194

169
213

Ordenando-se os valores:
Tipo A: nvel de colesterol
181
197

202
212

218
224

233
234

239
239

246
248

250
252

254
268

276
291

312
325

Mediana: (239+246)/2=242,5 mg/100ml


Tipo B: nvel de colesterol

Mediana: (

)/2=

mg/100ml

1.7 - Medidas de disperso


1.7.1 - Valores mnimo e mximo
Valores extremos da distribuio

1.7.2 - Amplitude de variao

a diferena entre os 2 valores extremos da distribuio

1.7.3 Varincia

Indica o quanto, em mdia, os quadrados dos desvios de cada observao em relao mdia aritmtica
esto afastados desta mdia.
N

Varincia populacional:

2 =

(X
i =1

X )2

N
n

Varincia amostral:

S2 =

(x
i =1

x)2

n 1

1.7.4 - Desvio padro


a raiz quadrada da varincia , ou seja

= 2
S = S2

1.7.5 - Coeficiente de Variao de Pearson (CV)


S
o quociente entre o desvio padro e a mdia, ou seja C V = x100
x

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

28

Exemplo:
Tipo A: nvel de colesterol
233
254

291
276

Varincia: S 2 =

312
234

250
181

246
248

197
252

268
202

224
218

239
212

239
325

250
202

148
194

169
213

(233 245,05) 2 + ... + (325 245,05) 2


= 1342,37(mg / 100ml ) 2
19

Desvio padro: S = 1342,37 = 36,64mg / 100ml


Coeficiente de variao:

36,64
x100 = 14,95%
245,05

Tipo B: nvel de colesterol


344
226

185
175

263
242

246
252

224
153

212
183

188
137

Varincia: S 2 =
Desvio padro S =
Coeficiente de variao:
Questo 13
So fornecidos valores de nvel de triglicrides (mg/dL) de 9 pessoas
166

158

202

162

135

82

150

86

121

Calcule, apresentando o desenvolvimento da frmula:


a) o nvel mdio de triglicrides;
b) o nvel mediano de triglicrides;
c) o desvio padro do nvel de triglicrides e
d) o coeficiente de variao do nvel de triglicrides.
Questo 14
A tabela abaixo foi extrada do artigo: Diagnstico de sobrepeso em adolescentes: estudo do desempenho
de diferentes critrios para o ndice de Massa Corporal de MONTEIRO POA et al. (Rev. Sade Pblica,
2000;.34(5):506-13).
Discuta os resultados obtidos ignorando a coluna do valor de p ( este tpico ser abordado posteriormente).

Questo 15
A tabela abaixo foi extrada do artigo: Avaliao da capacidade preditiva da circunferncia da cintura para
obesidade global e hipertenso arterial em mulheres residentes na Regio Metropolitana de Belo Horizonte,
Brasil de VELASQUEZ-MELENDEZ G et al. (Cad. Sade Pblica, 2002; 18(3): 765-771). Calcule e interprete
os coeficientes de variao de Pearson para cada uma das variveis apresentadas.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

29

1.7.6 - Quartil

Valores da varivel que dividem a distribuio em quatro partes iguais.

25%
25%
25%
25%
Q1: deixa abaixo 25% das observaes
25%
75%
Q2: deixa abaixo 50% das observaes
50%

50%

75%
Primeiro quartil:

Q1 = x

Q3: deixa abaixo 75% das observaes


25%

1
( ( n +1))
4

Q3 = x

; Terceiro quartil:

1
4

3
( ( n +1))
4

3
4

onde x o valor da varivel e ( ( n + 1)) e ( ( n + 1)) so ndices que representam as posies ocupadas
por x.

Os dados abaixo so referentes ao peso ao nascer de 50 recm-nascidos que tiveram sndrome de


desconforto respiratrio idioptico grave.
23 crianas sobreviveram e 27 foram a bito (*).
1.050*
1.175*
1.230*
1.310*
1.500*
1.600*
1.720*
1.750*
1.770*
2.275*

2.500*
1.030*
1.100*
1.185*
1.225*
1.262*
1.295*
1.300*
1.550*
1.820*

1.890*
1.940*
2.200*
2.270*
2.440*
2.560*
2.730*
1.130
1.575
1.680

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

1.760
1.930
2.015
2.090
2.600
2.700
2.950
2.550
2.570
3.005

2.830
1.410
1.715
1.720
2.040
2.200
2.400
3.160
3.400
3.640

30

Ordenando-se os dados, em cada grupo, obtm-se:


1.030*
1.050*
1.100*
1.175*
1.185*
1.225*
1.230*
1.262*
1.295*
1.300*
Fonte: van Vliet PK et al. 1973.

1.310*
1.500*
1.550*
1.600*
1.720*
1.750*
1.770*
1.820*
1.890*
1.940*

2.200*
2.270*
2.275*
2.440*
2.500*
2.560*
2.730*
1.130
1.410
1.575

1.680
1.715
1.720
1.760
1.930
2.015
2.040
2.090
2.200
2.400

2.550
2.570
2.600
2.700
2.830
2.950
3.005
3.160
3.400
3.640

Entre os recm-nascidos que sobreviveram:

Q1 = x

1
( ( 23+1))
4

Q3 = x

3
( ( 23+1))
4

Observe que

= x6 = 1720 g

= x18 = 2830 g

Q2 = x 1

= x12 = 2200g

( ( 23+1))
2

Entre os recm-nascidos que foram a bito

Q1 = x

1
( ( 27 +1))
4

Q3 = x 3

( ( 27 +1))
4

= x 7 = 1230 g

= x21 = 2200g e Q 2 = x

1
( ( 27 +1))
2

= x14 = 1600 g

No clculo dos quartis os ndices 6, 7, 12, 14, 18 e 21 so valores inteiros. Isto ir acontecer sempre que o
nmero de observaes (n) for mpar. Se n for par, o clculo do ndice resultar em um valor fracionrio.
Por exemplo, para n=22

Q1 = x 1

( ( 22 +1))
4

=x

23
)
4

=x

3
(5 )
4

que do caminho entre x5=1715 e x6=1720

3
Q1 = 1715 + (1720 1715) = 1718,8 g
4
=x 1
Q3 = x 3
( ( 22 +1))
4

(17 )
4

que do caminho entre x17=2700 e x18=2830

1
Q3 = 2700 + ( 2830 2700) = 2732,5 g
4

Percentil
Valores da varivel que dividem a distribuio em cem partes iguais.
Entre os recm-nascidos que sobreviveram
Percentil 5:

P5 = x

5
( 23+1))
100

= x 120 = x
(

100

1
(1 )
5

1
P5 = 1130 + (1410 1130) = 1186 g
5

que 1/5 do caminho entre x1=1130 e x2=1410

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

31

Percentil 10:

P10 = x

= x 240 = x

10
( 23+1))
100

Percentil 50:

P50 = x

P10 = 1410 +

2
(1575 1410 ) = 1476 g
5

100

Percentil 75:
(

2 ;
(2 )
5

= x 1200 = x(12) ; P50 = 2200 g


)
(

50
( 23+1))
100

P75 = x

100

= x 1800 = x(18) ; P75 = 2830g


(
)

75
( 23+1))
100

100

Percentil 90:

P90 = x

3 ;
( 21 )
5

3
P90 = 3160 + (3400 3160) = 3304 g
5

4 ;
( 22 )
5

4
P95 = 3400 + (3640 3400 ) = 3592 g
5

= x 2160 = x

90
( 23+1))
100

100

Percentil 95:

P95 = x

= x 2280 = x

95
( 23+1))
100

100

1.8 - Box plot e identificao de valores aberrantes (outliers)


O Box plot representa graficamente dados de forma resumida em um retngulo onde as linhas da base e do
topo so o primeiro e o terceiro quartis, respectivamente. A linha entre estas a mediana. Linhas verticais
que iniciam no meio da base e do topo do retngulo, terminam em valores denominados adjacentes inferior
e superior (Chambers et al., 1983, pag 60).
O valor adjacente superior o maior valor das observaes que menor ou igual a Q3+1,5(Q3-Q1) e o
valor adjacente inferior definido como o menor valor que maior ou igual a Q1-1,5(Q3-Q1), sendo a
diferena Q3-Q1 denominada intervalo inter-quartil (IIQ).
Valores outliers (discrepantes ou aberrantes) so valores que fogem da distribuio dos dados. O box plot
alm de apresentar a disperso dos dados torna-se til tambm para identificar a ocorrncia destes valores
como sendo os que caem fora dos limites estabelecidos pelos valores adjacentes superior e inferior.
Exemplo:
Tipo A: nvel de colesterol
181
197

202
212

218
224

233
234

239
239

246
248

250
252

254
268

276
291

312
325

Tipo B: nvel de colesterol


137
148

153
169

175
183

185
188

194
202

212
213

224
226

242
246

250
252

263
344

Tipo A:
n=20;

Q1 = x 1
4

Q3 = x 3
4

( n +1)

( n +1)

= x 21 = x

1
5
4

= x3
4

( 21)

=x

15

3
4

= 218 +

1
(224 218) = 218 + 1,5 = 219,5
4

= 254 +

3
(268 254) = 254 + 10,5 = 264,5
4

Intervalo Inter-Quartil (IIQ): Q3-Q1 = 45

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

32

325 o valor adjacente superior. Este o maior valor da distribuio, igual ou abaixo de 332, onde 332
dado por: 264,5 + 1,5 x 45 = 332 .
181 o valor adjacente inferior. o menor valor da distribuio, igual ou acima de 152, onde 152 dado
por: 219,5 1,5 x 45 = 152 .
Tipo B
n=20

Q1 = x 1
4

( n +1)

Q3 = x 3
4

( n +1)

= x 21 = x
4

= x3
4

( 21)

= 175 +

1
4

=x

15

3
4

1
(183 175) = 175 + 2 = 177
4

3
= 242 + (246 242) = 242 + 3 = 245
4

Intervalo Inter-Quartil (IIQ): Q3-Q1 = 68


344 o valor adjacente superior. Este o maior valor da distribuio, igual ou abaixo de 347, onde 347
dado por: 245 + 1,5 x 68 = 347 .
137 o valor adjacente inferior. o menor valor da distribuio, igual ou acima de 75, onde 75 dado por:
177 1,5 x68 = 75 .
colesterol
380
360
340
320
300
280
260
240
220
200
180
160
140
120
A

Grfico - Box plot da varivel nvel de colesterol segundo tipo de personalidade.


OBS: A confeco do box plot utilizando um programa estatstico para microcomputador ir utilizar o
algoritmo especfico de cada programa. Por exemplo, o STATA, verso 7, para os dados acima, calcularia o
primeiro e terceiro quartis como a mdia entre dois valores da varivel que ocupam as posies 5 e 6; 15 e
16, respectivamente. Neste caso o grfico pelo Stata identificaria os valores 325 e 344 como outliers.
Pelo Stata, verso 7, teramos:
Tipo A:
n=20; para clculo de Q1:
clculo de Q3:

Q3 =

Q1 =

x15 + x16
2

x 5 + x 6 218 + 224
=
= 221
2
2
254 + 268
=
= 261
2

Intervalo Inter-Quartil (IIQ): Q3-Q1 = 40


Valor adjacente superior: maior valor igual ou abaixo de 321 ( Q 3 + 1,5 x 40 = 321 ) =312

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

33

Valor adjacente inferior: menor valor igual ou acima de 161 ( Q1 1,5 x 40 = 161 ) = 181
Outlier: valor 325
Importante: note como Q1 e Q3 so calculados.
Tipo B

x 5 + x 6 175 + 183
=
= 179
2
2
242 + 246
=
= 244
2

n=20; para clculo de Q1: Q1 =


clculo de Q3: Q3 =

x15 + x16
2

Intervalo Inter-Quartil (IIQ): Q3-Q1 = 65


Valor adjacente superior: maior valor abaixo de 341,5 ( Q3 + 1,5 x 65 = 341,5 ) =263
Valor adjacente inferior: menor valor acima de 81,5 ( Q1 1,5 x 65 = 81,5 ) = 137
Outlier: valor 344
Box plot da varivel nvel de colesterol segundo tipo de personalidade (pelo Stata).
colesterol
380
360
340
320
300
280
260
240
220
200
180
160
140
120
A

Questo 16
Os dados a seguir so de uma pesquisa que investigou as concentraes de minerais no leite materno, no
perodo de 1984 a 1985. Foram coletadas amostras de leite materno de 55 mulheres que tiveram seus filhos
no Hospital Maternidade Odete Valadares, em Belo Horizonte. As mes foram divididas em perodo de
lactao: colostro e leite maduro.
clcio (g/mL de leite) grupo colostro
113
181
254
163
225
275
167
241
303
clcio (g/mL de leite) grupo maduro
159
175
181
238
238
242
277
279
281

311
313
325

334
372
375

145
163
437

221
231

256
296

312
323

344
375

188
244
293

200
256
302

206
259
303

213
260
314

214
263
344

217
264
394

231
275

a) Calcule a quantidade mdia de clcio (g/mL de leite) em cada grupo.


b) Calcule a quantidade mediana de clcio (g/mL de leite) em cada grupo.
c) Desenhe o box plot da concentrao de clcio (g/mL de leite) representando os dois grupos em um s
grfico.
d) Comente o grfico box plot quanto a disperso dos dados, existncia de valores aberrantes e igualdade
de medianas.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

34

Questo 17
O boxplot abaixo foi extrado do artigo: Vigilncia epidemiolgica e avaliao da assistncia s meningites de
ESCOSTEGUY CC et al. (Rev. Sade Pblica, 2004;38(5):657-63). Avalie os resultados apresentados.

1.9 -Noes de correlao

X e Y so variveis aleatrias quantitativas


Grficos de disperso
Y

correlao positiva

correlao negativa

correlao inexistente

Coeficiente de correlao de Pearson ( ): Mede o grau de associao entre 2 variveis quantitativas X e Y.


Definio:

=
onde

XY
X Y
XY a covarincia de X e Y (disperso conjunta de X e Y)
X o desvio padro de X (disperso de X)
Y o desvio padro de Y (disperso de Y)

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

35

Covarincia: o valor mdio do produto dos desvios de X e Y, em relao s suas respectivas mdias.

XY =

Yi Y

n X i Yi

( X )( Y ) =
i

_ _

X iYi n X Y

_
_

x i x y i y

r=

estimador (r)

_ 2
_ 2

x i x y i y

Propriedades
a) 1 +1
b) no possui dimenso, isto , no depende da unidade de medida das variveis X e Y
Exemplo:
Os dados a seguir so provenientes de um estudo que investiga a composio corporal e fornece o
percentual de gordura corporal (%), idade e sexo para 18 adultos com idades entre 23 e 61 anos.
a) Qual a relao entre a idade e o % de gordura? Existe alguma evidncia de que a relao
diferente entre pessoas do sexo masculino e feminino? Explore os dados graficamente.
b) Calcule o coeficiente de correlao de Pearson entre a idade e o % de gordura para homens e
mulheres. Interprete os resultados.
Idade
23
23
27
27
39
41
45
49
50

% gordura
9,5
27,9
7,8
17,8
31,4
25,9
27,4
25,2
31,1

sexo
M
F
M
M
F
F
M
F
F

Idade
53
53
54
56
57
58
58
60
61

% gordura
34,7
42,0
29,1
32,5
30,3
33,0
33,8
41,1
34,5

sexo
F
F
F
F
F
F
F
F
F

M=masculino ; F= feminino

Fonte: Hand DJ et al., 1994.

Disperso entre % de gordura e idade


70

60

f ff f
f

50

idade

m
f

40

30

m
m

20
5

10

15

20

25
gordura

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

30

35

40

45

36

Clculo do coeficiente de correlao de Pearson


Sexo: masculino
Idade

23
27
27
45
=30,5

% gordura

( y y)

(x x)

9,5
7,8
17,8
27,4

-7,5
-3,5
-3,5
14,5

-6,13
-7,83
2,18
11,78

45,94
27,39
-7,61
170,74

56,25
12,25
12,25
210,25

37,52
61,23
4,73
138,65

Total

236,45

291,00

242,13

x =15,63

Coeficiente de correlao

(idade,%gordura) masculino:

( x x )( y y ) ( y y ) 2

236,45

r=

291x 242,13

(x x)2

= 0,89

Sexo: feminino
Idade

23
39
41
49
50
53
53
54
56
57
58
58
60
61
= 50,86

% gordura

( y y ) ( x x ) ( x x )( y y )

27,9
31,4
25,9
25,2
31,1
34,7
42
29,1
32,5
30,3
33
33,8
41,1
34,5

Coeficiente de correlao

-27,86
-11,86
-9,86
-1,86
-0,86
2,14
2,14
3,14
5,14
6,14
7,14
7,14
9,14
10,14

( y y) 2

(x x)2

123,17
10,93
63,30
13,23
1,05
5,10
20,74
-10,12
0,92
-12,42
4,85
10,56
80,26
22,10

776,02
140,59
97,16
3,45
0,73
4,59
4,59
9,88
26,45
37,73
51,02
51,02
83,59
102,88

19,55
0,85
41,23
50,71
1,49
5,66
93,67
10,38
0,03
4,09
0,46
2,19
77,06
4,75

Total

32,32

-4,42
-0,92
-6,42
-7,12
-1,22
2,38
9,68
-3,22
0,18
-2,02
0,68
1,48
8,78
2,18

333,64

1389,71

312,12

(idade,%gordura) feminino:

r=

333,64
1389,71x312,12

= 0,51

Questo 18
Abaixo temos o peso (kg) e a altura (cm) de 30 meninas de 11 anos de idade atendidas na escola Heaton
Midldlel em Bradford, Inglaterra.
a) Fazer o diagrama de disperso e investigue como a relao entre as variveis.
b) Calcular o coeficiente de correlao de Pearson.
Altura
(cm)
135
146
153
154
139
131
149
137

Peso (kg)

Altura (cm)

26
33
55
50
32
25
44
31

133
149
141
164
146
149
147
152

Peso
(kg)
31
34
32
47
37
46
36
47

( x x )( y y ) = 1275 ; ( x x )

Altura
(cm)
136
154
151
155
149
141
137
135

= 1716,80 ;

Peso
(kg)
28
36
48
36
32
29
34
30

( y y)

Altura
(cm)
146
143
148
143
140
141

Peso (kg)
35
42
32
36
33
28

= 1718,17

Questo 19
Os grficos abaixo foram extrados do artigo: Excesso de peso e gordura abdominal para a sndrome
metablica em nipo-brasileiros de LERARIO DG et al. (Rev. Sade Pblica, 2002;36(1):4-11). Interprete as
figuras apresentadas no artigo.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

37

2 Medidas de associao
Anlise da distribuio conjunta de duas variveis qualitativas

2.1 Razo de prevalncias


Estudo de prevalncia: n indivduos so observados e classificados segundo duas variveis X e Y, por
exemplo X: ronco noturno (X1 sim, X0 no) e Y: presena de problema cardaco (Y1 sim, Y0 no).
Varivel Y
Varivel X

Y1 (sim)

Y0 (no)

Total (%)

X1 (sim)
X0 (no)

a
c

b
d

n1 (100)
n0 (100)

Total

m1

m2

n (100)

p= prevalncia de Y1= m1/n


p1= prevalncia de Y1|X1= a/n1
p0= prevalncia de Y1|X0= c/n0
rp= razo de prevalncias= p1/p0
dp=diferena de prevalncias= p1-p0
Exemplo:
So apresentados dados sobre o estado nutricional de 1226 crianas brasileiras de 2 anos de idade, segundo
sexo.
Estado nutricional (Y)
Masculino (X1)
Feminino (X0)
Total
(Y1) Desnutridas
29
20
49
(Y0) Normais
574
603
1177
Total
603
623
1226
Prevalncia de desnutrio:

49
= 0,040 ou 4%
1226

Prevalncia de desnutrio segundo sexo:

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

38

Masculino:

29
20
= 0,05 ou 5,0%; Feminino:
= 0,032 ou 3,2%
603
623

Razo de prevalncias:

0,05
= 1,56
0,032

Diferena de prevalncias: 0,05-0,032=0,018 ou 1,8%


A prevalncia de desnutrio parece ser maior entre as crianas do sexo masculino. Os meninos apresentam
uma prevalncia 56% maior do que as meninas.
A prevalncia de desnutrio entre meninos 1,56 vezes (uma vez e meia) a prevalncia de desnutrio
entre meninas

2.2 Razo de incidncias


Estudo de incidncia
Varivel Y
Varivel X
Y1
X1
a
X0
c
Total
m1
r= incidncia de Y1= m1/n
r1= incidncia de Y1 entre os X1= a/n1
r0= incidncia de Y1 entre os X0= c/n0
ri= razo de incidncias= r1/r0
di= diferena de incidncias= r1-r0
incidncia
r1

r0

risco
r1/r0

Y0
b
d
m2

Total
n1 (100%)
n0 (100%)
n (100%)

r1-r0

ri=rr=razo de riscos=risco relativo=r1/r0


di= ra= risco atribuvel= r1-r0
Exemplo:
Fumar
Sim
No
Total
r= 472/2789= 0,17 = 17%

Morte em 5 anos por DIC


Sim
208
264
472

No
850
1467
2317

Total
1058
1731
2789

r1=208/1058= 0,20= 20%


r0=264/1731= 0,15=15%
rr=0,20/0,15= 1,33
ra= 0,20- 0,15= 0,05= 5%
A incidncia de mortes parece ser maior entre as pessoas que fumam. Os fumantes apresentam uma
incidncia 33% maior do que os no fumantes.
A mortalidade entre fumantes 1,33 vezes a mortalidade entre no fumantes.

2.3 Razo de odds (odds ratio)


FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.
Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

39

Estudo do tipo caso-controle


Varivel Y
Varivel X
X1
X0
Total

odds a favor de Y1:


na categoria X1=
na categoria X0=

Y1
a
c
m1

Y0
b
d
m2

Total
n1 (100%)
n0 (100%)
n (100%)

(a/n1)(b/n1)
(c/n0)(d/n0)

Razo de odds ou odds ratio: [(a/n1)(b/n1)][(c/n0)(d/n0)]= (a b ) (c d ) =

b = a.d
c
b.c
d

Exemplo:
Os dados a seguir so de um estudo sobre cncer de esfago e consumo de lcool.
Condio
Casos
Controles
Total
Fonte: Tuyns et al.,1977.

Consumo mdio de lcool (g/dia)


80 e +
0-79
96
104
109
666
205
770

(entre expostos) odds a favor de casos entre consumidores de 80 e + g/dia:

Total
200
775
975

96 109 96
=
= 0,88
:
205 205 109

(entre no expostos) odds a favor de casos entre consumidores de 0-79g/dia:

odds ratio:

104 666 104


=
= 0,16
:
770 770 666

96 104 96 x666
:
=
= 5,6
109 666 109 x104

A fora de morbidade de cncer de esfago entre consumidores de 80 e + g/dias de bebida alcolica 5,6 a
fora de morbidade entre os que consomem de 0 a 79g/dia.
Odds ratio utilizando-se os dados de DIC: OR=(208x1467)/850x265)=1,36

2.4 - Qui-quadrado de Pearson


Duas variveis qualitativas:
X - curso universitrio e
Y sexo do aluno
Questo: sexo do indivduo influi na escolha do curso?

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

40

Situao 1
Curso
Economia
Administrao
Total

Curso
n
24
16
40

Economia
Administrao
Total

Masculino
n
24
16
40

Masculino
proporo
0,6
0,4
1

Feminino
n
36
24
60

n
36
24
60

Feminino
proporo
0,6
0,4
1

Total
n
60
40
100

n
60
40
100

Total
proporo
0,6
0,4
1

As propores de escolha dos cursos no diferem segundo sexo do estudante


Situao 2
Curso
Fsica
Cincias Sociais
Total

Curso
n
100
40
140

Fsica
Cincias Sociais
Total

Masculino
n
100 (a)
40 (c)
140

Masculino
Proporo
0,7
0,3
1

Feminino
n
20 (b)
40 (d)
60

n
20
40
60

Total
n
120
80
200

Feminino
proporo
0,3
0,7
1

n
120
80
200

Total
proporo
0,6
0,4
1

A distribuio de alunos em cada curso, segundo sexo no a mesma. Sexo e curso podem estar
associados.
Se a varivel sexo no fosse associada escolha do curso, quantos indivduos esperaramos em Fsica,
entre os homens?
Esperaramos : 0,6x140 ou

120
x140 = 84
200

Se a varivel sexo no fosse associada escolha do curso, quantos indivduos esperaramos em


Cincias Sociais, entre os homens?
Esperaramos: 0,4x140 ou

80
x140 = 56
200

Se a varivel sexo no fosse associada escolha do curso, quantos indivduos esperaramos em Fsica,
entre as mulhres?
Esperaramos : 0,6x60 ou

120
x60 = 36
200

Se a varivel sexo no fosse associada escolha do curso, quantos indivduos esperaramos em


Cincias Sociais, entre as mulheres?

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

41

Esperaramos: 0,4x60 ou

80
x60 = 24
200

Tabela esperada, sob a condio de independncia


Curso

Masculino
n
84
56
140

Fsica
Cincias Sociais
Total

Feminino
n
36
24
60

Valores observados
O

Valores esperados
E

(O-E)

(O-E)2

100
40
20
40

84
56
36
24

16
-16
-16
16

256
256
256
256

Total
n
120
80
200

(O E ) 2
E
3,048
4,571
7,11
10,667
Qui-quadrado=25,397

O Qui-quadrado obtido somando-se a diferena ao quadrado entre as freqncias observadas e as


esperadas, dividido pelas freqncias esperadas

(O E) 2
=
E
2

Se o Qui-quadrado for igual a zero, ento no existe associao entre as variveis. Quanto maior o valor do
Qui-quadrado, maior a chance de existir associao entre as variveis, entretanto, o Qui-quadrado no
mede fora de associao.
Exemplo:
Com o objetivo de investigar a associao entre histria de bronquite na infncia e presena de tosse diurna
ou noturna em idades mais velhas, foram estudados 1.319 adolescentes com 14 anos. Destes, 273
apresentaram histria de bronquite at os 5 anos de idade sendo que 26 apresentaram tosse diurna ou
noturna aos 14 anos.
Nmero de adolescentes segundo histria de bronquite aos 5 anos e tosse diurna ou noturna aos 14 anos
de idade. Local X, ano Y.
Bronquite
Tosse
Sim
No
Total

Sim
26
247
273

No
44
1002
1046

Total
70
1249
1319

Fonte: Holland WW et al.,1978.

Clculo do qui-quadrado de Pearson


Valores
Valores esperados
observados
E
O
26
247
44
1002

14,488
258,512
55,512
990,488

(O-E)

(O-E)2

(O E ) 2
E

11,512
-11,512
-11,512
11,512

132,526
132,526
132,526
132,526

9,147
0,513
2,387
0,134

Qui-quadrado= 12,181
Questo 20

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

42

Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo condio


de sobrevivncia e peso ao nascer (g).
Peso ao nascer
Baixo peso (<2500)
No baixo peso (2500 e mais)
Total

bito
24
3
27

Sobrevida
13
10
23

Total
37
13
50

Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.


Com base nos dados apresentados na tabela calcule:
a) a incidncia de bitos entre crianas com baixo peso,
b) a incidncia de bitos entre crianas sem baixo peso,
c) a razo de incidncias
d) a diferena de incidncias
e) o qui-quadrado do Pearson
f) interprete os resultados

Questo 21
Defeitos do tubo neural so malformaes congnitas que surgem durante o desenvolvimento fetal.
conhecida como spina bfida. Estes dados so de um estudo conduzido no pas de Gales Reino Unido, para
investigar possvel associao entre defeitos do tubo neural e dieta materna. O estudo do tipo casocontrole: mes que tinham tido bebs com defeitos do tubo neural (casos) e suas irms que no tinham tido
(controles) foram avaliadas segundo suas dietas e classificadas em boa, razovel e ruim.
Distribuio de recm-nascidos segundo condio caso - com defeitos do tubo neural;
controle recm-nascidos que no tinham defeitos do tubo neural e dieta materna.
Dieta
Boa
Razovel
Pobre
Total

Casos
n
34
110
100
244

Controles
%
13,9
45,1
41,0
100

n
43
48
32
123

Total
%
35,0
39,0
26,0
100

n
77
158
132
367

%
21,0
43,0
36,0
100

Considere a dieta boa como categoria de referncia (basal) e calcule:


a) o odds ratio de dieta razovel em relao a dieta boa;
b) o odds ratio de dieta pobre em relao a boa;
c) o qui-quadrado de Pearson e
d) interprete os resultados.
Questo 22
A tabela abaixo foi extrada do artigo: Excesso de peso e gordura abdominal para a sndrome metablica em
nipo-brasileiros de LERARIO DDG et al. (Rev de Sade Pblica, 2002; 36(1): 4-11). Analise as razes de
prevalncias obtidas no estudo.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

43

Questo 23
A tabela abaixo foi extrada do artigo: Evoluo do padro de aleitamento materno de Kummer SC et al.
(Rev de Sade Pblica, 2000; 34(2): 143-8). Analise as razes de chances obtidas no estudo. Observe os
intervalos de confiana apresentados e tire suas concluses.

3. Distribuies de probabilidade
3.1 - Noes de probabilidade
Probabilidade (probability, chance, likelihood)
uma afirmao numrica sobre a possibilidade de que algum evento ocorra.
Quantifica o grau de incerteza de eventos, variando de 0 (0%) a 1 (100%).
Um evento impossvel de ocorrer tem probabilidade 0 (zero)
Um evento certo tem probabilidade 1 (um)
Quando se joga uma moeda, no se sabe se vai sair cara. Mas sabe-se que a probabilidade de sair cara
0,5 = 50% = 1/2.
Dizer que a eficcia de uma vacina de 70% corresponde a dizer que cada indivduo vacinado tem
probabilidade 0,7 de ficar imune.
Probabilidade em espaos finitos contveis
Espao amostral (S)
o conjunto de todos os resultados possveis de um experimento.
Supor o experimento lanar uma moeda; S= {cara, coroa}
H dois pontos neste espao amostral, sendo um favorvel ao evento A={cara}.
FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.
Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

44

Definio clssica de probabilidade

P( A) =

numero de elementos de A 1
= = 0,5
numero de elementos de S
2

Exemplo: probabilidade de (ouros) em um baralho de 52 cartas

13 1
=
52 4

Probabilidade de eventos mutuamente excludentes


Diz-se que dois eventos so mutuamente excludentes (ou mutuamente exclusivos) quando no podem
ocorrer simultaneamente
Exemplo:
A = {cara} ; B= {coroa}, no lanamento de uma moeda; A e B so mutuamente exclusivos
C = {sexo feminino}; D={sexo masculino}, no nascimento de uma criana; C e D so mutuamente
exclusivos.

A probabilidade da ocorrncia de um evento A ou de um evento B :


P(A ou B) = P(A B) = P(A) + P(B) P(A B)

A probabilidade da ocorrncia simultnea de eventos mutuamente exclusivos zero.


P(cara e coroa) = P(cara coroa) = 0, no lanamento de uma moeda.
Se A e B forem mutuamente excludentes, P(A B) = 0 e
P(A ou B) = P(A B) = P(A) + P(B)
Exemplo 1:
P(Face 2 ou Face 3) no lanamento de um dado
P(2 ou 3)= P(2)+P(3)= 1/6 + 1/6 = 2/6 = 1/3.
P(Resultado mpar)= P(1 ou 3 ou 5)= P(1)+P(3)+P(5)= 3/6 = 1/2.
Regra da adio: P(A ou B) = P(A B) = P(A) + P(B) P(A B)
Probabilidade de eventos independentes
Os eventos A e B so independentes quando o resultado de um no influi no resultado do outro.
Exemplo: no lanamento simultneo de duas moedas, o resultado de uma no interfere no resultado da
outra.

A probabilidade da ocorrncia de eventos independentes o produto das probabilidades de cada


evento.
P(A e B)= P(A B) = P(A) x P(B)

P(face 2 no primeiro dado e face 3 no segundo dado), no lanamento seqencial de dois dados = P(2 e
3) = P(2)xP(3)= 1/6 x 1/6= 1/36= 0,0278= 2,78%.
Probabilidade condicional
A probabilidade condicional do evento A dado que ocorreu o evento B

P( A | B) =

P( A B)
, para P( B) 0
P( B)

L-se P(A|B) como probabilidade de A dado B.


Exemplo:
Nmero de adolescentes segundo histria de bronquite aos 5 anos e tosse diurna ou noturna aos 14 anos
de idade. Local X, ano Y.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

45

Bronquite
Tosse
Sim
No
Total

Sim
26
247
273

No
44
1002
1046

Total
70
1249
1319

Fonte: Holland, WW et al., 1978.

Sorteia-se um paciente. Qual a probabilidade dele ter tosse aos 14 anos dado que teve bronquite aos 5
anos de idade?
P(tosse|bronquite)= P(tosse e bronquite)/P(bronquite)= 26/1319 273/1319= 9,5%
Regra da multiplicao

P ( A B ) = P( A | B) xP( B)
se A e B forem independentes, P(A|B) = P(A) e como conseqncia, P ( A B ) = P ( A) xP( B )
Os eventos tosse e bronquite no so independentes porque P(tosse e bronquite) P(tosse) x P(bronquite),
pois 26/1319 (70/1319) x (273/1319), ou seja, 0,02 0,011.
Exemplo:
Considerar uma populao de homens que foram classificados segundo o hbito de fumar e doena
respiratria crnica. Nesta populao sabe-se que 5% dos homens tm doena respiratria e so no
fumantes, 15% tm doena e so fumantes, 50% no tm doena e so no fumantes e 30% no tm a
doena e so fumantes.
Fumante
Total
Problema respiratrio
No fumante

0,50 = P( F R )
0,05 = P( F R )
0,55 = P( F )

No ( R )

Sim ( R )
Total

F
0,30 = P( F R )
0,15 = P( F R )
0,45 = P( F )

0,80 = P( R )
0,20 = P( R )

Escolhe-se um homem ao acaso, qual a probabilidade dele ter doena respiratria dado que era fumante?

P( R | F ) =

P( R F ) = 0,15/0,45 = 0,33
P( F )

Os eventos no so independentes porque P ( F R ) P ( F ) xP( R )


Relao entre eventos mutuamente exclusivos e independentes:
Os eventos mutuamente exclusivos A e B satisfazem a condio que P(A e B) = 0, ento dois eventos
mutuamente exclusivos A e B so no independentes a menos que P(A)=0 ou P(B)=0. Caso contrrio, eles
so claramente dependentes pois P(A).P(B)>0 se ambos P(A)>0 e P(B)>0, portanto
P ( A B) P( A) P( B) porque P ( A B) = 0 .
Assim, dois eventos mutuamente exclusivos A e B so dependentes exceto nos casos onde P(A)=0 ou
P(B)=0.
Definio freqentista de probabilidade:
n repeties do evento A; A ocorre m vezes, ento a freqncia relativa de A =
Para n suficientemente grande,
Quando n cresce,

m
n

m
m
P ( A) ou seja, lim n = P( A)
n
n

m
tende a se estabilizar em torno de uma constante, P(A)
n

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

46

Varivel aleatria discreta


Varivel aleatria qualquer funo de nmero real, definida no espao amostral, com uma probabilidade
de ocorrncia associada.
Exemplo:
No lanamento de 1 moeda, o nmero de caras uma varivel aleatria. Se esta varivel for denominada X,
tem-se que os valores possveis para X so 0 e 1. Assim escreve-se X:0,1.
A probabilidade de cara 0,5: P(cara)= P(X=1)= 0,5= 1/2.
No lanamento de 10 moedas, X:0, 1, 2,....,10; e a probabilidade de cara = 0,5.
Sair cara (ou coroa) so eventos mutuamente exclusivos. Um particular resultado de cada lanamento exclui
a ocorrncia do outro.
possvel calcular a probabilidade da varivel assumir cada valor x, ou seja, P(X=x).
O conjunto de valores da varivel aleatria e das probabilidades obtidas define uma distribuio de
probabilidades. Se X assume valores inteiros, a varivel denominada discreta. Se X assume valores no
conjunto dos nmeros reais, a varivel denominada contnua.

3.2 - Distribuio Bernoulli


Estrutura bsica: duas possibilidades de resultado (sucesso e fracasso).
Exemplo 1:
Joga-se uma moeda uma vez. A moeda equilibrada, ou seja, os lados possuem peso igual, no
favorecendo nenhum dos lados, ao ser lanada. Tem-se como sucesso sair a face cara.
Define-se uma varivel aleatria X que assume valor 1 se ocorrer sucesso e 0 se ocorrer fracasso.
X: 0,1
Parmetro: probabilidade da varivel assumir valor 1.
Notao: ou p.
Se probabilidade de sucesso = p, a probabilidade de fracasso ser igual a q=(1-p), porque p+q=1.
Probabilidade de sair cara = P(X=1) = p(1) = p = 0,5
Probabilidade de sair coroa = P(X=0) = p(0) = q = 1-p = 0,5
Graficamente:

p(x)

0,8
0,6
0,4
0,2
0
0

p=0,5

Exemplo 2:
Uma droga cura 15% dos pacientes. Administra-se a droga a um paciente. Qual a probabilidade do paciente
ficar curado? Qual a probabilidade do paciente no ficar curado?
X: 0,1 (X ser 0 se o paciente no se curar e 1 se houver cura)

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

47

P(X=1) =p(1)=p= 0,15 ; P(X=0) =p(0)= q=0,85


p(x)

1
0,8
0,6
0,4
0,2
0

p=0,15

Os exemplos pertencem a mesma famlia de distribuies, mas tm parmetros diferentes.


A distribuio de Bernoulli pode ser escrita como P(X=1) = p(1)=p e P(X=0) =p(0) =1-p; ou, de forma mais
genrica,

p( x ) = p x (1 p)1 x , x=0,1

Isto significa que

para x=0, p(0) = P(X = 0) = p (1 p)


0

para x=1,

p(1) = P(X = 1) = p (1 p)
1

Mdia de uma varivel aleatria discreta:

1 0

11

=1 p ,

=p

= E (X) = xp( x )
x

Na distribuio de Bernoulli:

= E(X) = xp( x ) = 1p( x = 1) + 0p( x = 0) = p


x

Mdia da distribuio Bernoulli p (probabilidade de ocorrer o sucesso)


Varincia de uma varivel aleatria discreta:

2 = V ( X ) = E[(X ) 2 ] = ( x ) 2 p( x )
x

Desvio padro:

SD(X) = V(X) =

Desvio padro da distribuio Bernoulli

(0 p) 2 .p( x = 0) + (1 p) 2 .p( x = 1) = (p) 2 .(1 p) + (1 p) 2 p = (1 p)p(p + (1 p)) = p(1 p) = pq


Resumindo,
Modelo de probabilidade Bernoulli
Uma varivel aleatria discreta X que pode assumir valores 0 e 1, com funo de probabilidade dada por

p( x ) = p x (1 p)1 x

com x=0,1
segue uma distribuio Bernoulli com parmetro p , 0<p<1.
p a probabilidade de obter o resultado X=1. Isto pode ser escrito como X~Bernoulli(p) com mdia p e
desvio padro

p(1 p) .

O smbolo ~ l-se tem distribuio ou se distribui segundo.

3.3 - Distribuio binomial


Distribuio Binomial a soma de n distribuies Bernoulli

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

48

Populao: 2 categorias
Ex:
sexo (masculino, feminino),
faces de uma moeda (cara, coroa),
desfecho de um tratamento (cura, no cura)

Cara (K) probabilidade(K) = p

Lanamento de uma moeda Coroa (C) probabilidade (C) = q

p + q = 1 q = 1 - p

p = probabilidade de sucesso; q= probabilidade de fracasso


Realiza-se o experimento n vezes, onde cada ensaio independente do outro e os resultados so
mutuamente exclusivos.
X: Nmero de vezes que sai cara
A moeda lanada uma vez (n=1) X: 0,1
X
resultado
P(X=x)
0
C
P(X=0) = q
1
K
P(X=1) = p

X~Bernoulli(p)

X: 0,1,2
A moeda lanada duas vezes (n=2)
X
resultado
P(X=x)
0
C,C
P(X=0) = q.q =
1
K,C ou C,K
P(X=1) = p.q+q.p=
2
K,K
P(X=2) = p.p=

X~B(n=2, p)

X: 0,1,2,3
A moeda lanada trs vezes (n=3)
X
resultado
P(X=x)
0
C,C,C
P(X=0) = q.q.q =
1

K,C,C ou
C,K,C ou
C,C,K
K,K,C ou
K,C,K ou
C,K,K

P(X=2) = p.p.q +p.q.p +q.p.p =

K,K,K

X~B(n=3, p)

P(X=1) = p.q.q+q.p.q +q.q.p =

q2
2.p.q
p2

P(X=3) = p.p.p =

q3
3 p.q2

3 p2.q
p3

Probabilidade (X=x) calculada pelo produto de 3 fatores:


1o - nmero (combinao de n elementos combinados x a x)
2o - probabilidade de sucesso elevado a um expoente (valor de x)
3o - probabilidade de fracasso elevado a um expoente (valor de n-x)

n
n!
P( X = x) = p x q n x =
p x q n x
x
x!(n x)!

Resumindo
Modelo de probabilidade Binomial
Seja E um experimento com 2 resultados (mutuamente exclusivos): S (sucesso) e F (fracasso)
p = probabilidade de ocorrncia de S e q= probabilidade de ocorrncia de F
sendo que p+q=1.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

49

Se E for repetido n vezes, de forma independente, mantendo-se p e q, a probabilidade da varivel aleatria


X= nmero de vezes que S ocorre dada por

P( X = x ) =

n!
p x q n x
x !(n x )!

X~B(n,p) onde n e p so os parmetros da

distribuio; a mdia = m = n.p, a varincia = n.p.q e o desvio padro =

npq

Exemplo 1:
Uma suspenso contendo organismos de Leishmania preparada e quando uma determinada quantidade
inoculada em ratos, 30% deles se tornam infectados. Se 3 ratos forem inoculados independentemente, qual
a probabilidade de:
a) Nenhum rato ficar infectado?

3!

P(X=0) = (0,3) 0 (0,7) 3 =


(0,7) 3 = 1x0,343 = 0,343 = 34,3%
0
0! (3 0)!

b) Um rato ficar infectado?

3!

3 x 2 x1

P(X=1) = (0,3) 1 (0,7) 31 =


(0,3) 1 (0,7) 31 =
0,3 x0,49 = 0,441 = 44,1%
1
1! (3 1)!
1x 2 x1

c) Dois ratos ficarem infectados?

3!

3x 2 x1

P(X=2) = (0,3) 2 (0,7) 3 2 =


(0,3) 2 (0,7) 3 2 =
0,09 x0,7 = 0,189 = 18,9%
2
2!(3 2)!
2 x1x1

d) Todos os ratos ficarem infectados?

3!

3 x 2 x1

P(X=3) = (0,3) 3 (0,7) 33 =


(0,3) 3 (0,7) 0 =
0,027 x1 = 0,027 = 2,7%
3
3! (3 3)!
3 x 2 x1x1

e) Pelo menos 2 fiquem infectados?
f)

No mximo 1 fique infectado?

Exemplo 2:
Lanamento de moedas.
n= nmero de ensaios (n de lanamentos)= 10
X= varivel aleatria (n de caras)
x= resultado particular de X (0, 1, 2, ...,10)
p= probabilidade de ocorrer cara (sucesso); p=P(cara)= 0,5

n
P ( X = x ) = p x (1 p ) n x
x

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

50

Distribuio de probabilidade B(n=10; p=0,5)


X= n de caras
0
1
2
3
4
5
6
7
8
9
10

P(X=x)
0,0010
0,0098
0,0439
0,1172
0,2051
0,2461
0,2051
0,1172
0,0439
0,0098
0,0010
1

Mdia = np = 10x0,5 = 5
Varincia = npq = 2,5
Desvio padro =

0,30

npq = 10 x 0,5 x 0,5 = 2,5 = 1,58

p(X=x)

0,25

Se estivermos trabalhando com a proporo de sucessos,

0,20

X
:
n

0,15
0,10

p
= p = 0,5
n
p q pq
Varincia = nx x =
= 0,025
n n
n
npq
npq
pq
Desvio padro =
= 0,158
=
=
2
n
n
n

0,05

Mdia = nx

0,00
0

10

Exemplo 3
Um programa de incentivo amamentao exclusiva ao seio nos primeiros 3 meses est sendo executado
em um hospital universitrio. Verificou-se que a eficcia do programa era de = 60%.
Para uma amostra de 20 mes que deram luz neste hospital, a distribuio de probabilidade da varivel
aleatria nmero de mes amamentando exclusivamente ao seio a seguinte:
X= n de
amamentando
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

mes

P(X=x|p=0,6)
0,000
0,000
0,000
0,000
0,000
0,001
0,005
0,015
0,035
0,071
0,117
0,160
0,180
0,166
0,124
0,075
0,035
0,012
0,003
0,000
0,000

0,2

p(X=x)

0,18
0,16
0,14
0,12
0,1
0,08
0,06
0,04
0,02
0
0

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

10 11 12 13 14 15 16 17 18 19 20
X

51

3.4 - Odds e probabilidade


Probabilidade:
Supor o estudo de seguimento de 50 fumantes. No final do estudo observa-se que 30 pessoas
desenvolveram bronquite crnica e 20 no desenvolveram.
Denominando-se p a probabilidade de desenvolver bronquite e q a probabilidade de no desenvolver
bronquite, tem-se que p =

30
20
e q=
onde q = 1 p .

50
50

Odds:
Define-se odds a favor de bronquite como a razo entre a probabilidade de desenvolver bronquite e a
p
probabilidade de no desenvolver a doena. Portanto, odds =
1 p
Aplicando-se os dados do exemplo tem-se
30

30
p
ou simplesmente 1,5.
= 50 =
= 1,5 : 1
odds a favor de bronquite =

1 p 20 20
50
L-se o odds da seguinte forma: entre fumantes a probabilidade de desenvolver bronquite 50% maior que
a probabilidade de no desenvolver bronquite entre no fumantes ou a probabilidade de desenvolver
bronquite entre fumantes uma vez e meia a probabilidade de no desenvolver bronquite entre no
fumantes.
Probabilidade escrita como funo de Odds
Tem-se, ainda, que a probabilidade de doena pode ser escrita como odds, da seguinte forma:

odds
p=
1 + odds

30
30
30
odds
e de fato, a probabilidade de bronquite igual a p =
.

= 20 = 20 =
30 50 50
1 + odds
1+
20 20

Exemplo
Com base no exemplo da tosse e bronquite tem-se que:
o odds de uma criana ter tido bronquite na infncia 273/1046=0,261. A probabilidade de bronquite
igual a 0,261/(1+0,261)=0,207=20,7%.
ou
o odds de uma criana no ter tido bronquite na infncia 1046/273=3,8. A probabilidade de no ter tido
bronquite na infncia igual a 3,8/(1+3,8)=0,792=79,2%.
Questo 24
Considerando um estudo conduzido para comparar os efeitos adversos e a eficcia de duas drogas
antidepressivas, 18 pacientes so alocados aleatoriamente em um de trs grupos (6 pacientes em cada
grupo). Os pacientes do primeiro grupo so tratados com a droga A, os do segundo, com a droga B e os do
terceiro, com placebo. Estudos anteriores sugerem que a proporo de abandono de tratamento entre os
pacientes do grupo placebo 15%. Pressupondo-se que exista independncia entre cada realizao do
experimento, calcule:
a) a probabilidade que todos os 6 pacientes do grupo 3 iro abandonar o estudo;
b) a probabilidade que nenhum paciente do grupo 3 abandonar o estudo;
c) a probabilidade que 2 pacientes do grupo 3 abandonem o estudo;

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

52

3.5- Distribuio normal ou de Gauss


Os dados abaixo so medidas do trax (polegadas) de 5732 soldados escoceses, tomadas pelo matemtico
belga, Adolphe Quetelet (1796-1874).
medidas |
Freq.
Percent
Cum.
------------+----------------------------------33 |
3
0.05
0.05
34 |
19
0.33
0.38
35 |
81
1.41
1.80
36 |
189
3.30
5.09
37 |
409
7.14
12.23
38 |
753
13.14
25.37
39 |
1062
18.53
43.89
40 |
1082
18.88
62.77
41 |
935
16.31
79.08
42 |
646
11.27
90.35
43 |
313
5.46
95.81
44 |
168
2.93
98.74
45 |
50
0.87
99.62
46 |
18
0.31
99.93
47 |
3
0.05
99.98
48 |
1
0.02
100.00
------------+----------------------------------Total |
5732
100.00

Distribuio de medidas do trax (polegadas) de soldados escoceses


1000

Frequency

800

600

400

200

0
33

34

35

36

37

38

39

40 41
medidas

42

43

44

45

46

47

48

Fonte: Daly F et al. Elements of Statistics, 1999


Funo densidade de probabilidade da distribuio normal:
Se a varivel aleatria X normalmente distribuda com mdia

funo densidade de probabilidade de X dada por


onde

f ( x) =

e desvio padro

( x )2
2 2

(varincia

2 ),

, < x < +

: constante 3,1416
e: constante 2,718
: constante (mdia aritmtica da populao)
: constante (desvio padro populacional)

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

53

Propriedades:
campo de variao : < X < +
simtrica em torno da mdia m (ou

a mdia e a mediana so coincidentes


a rea total sob a curva igual a 1 ou 100%
a rea sob a curva pode ser entendida como medida de probabilidade

_
X = 68,2%
_
X 1,96 = 95,0%
_
X 2,58 = 99,0%

Exemplo:
Depois de tomarmos vrias amostras, decidiu-se adotar um modelo para as medidas de permetro do trax
de uma populao de homens adultos com os parmetros: mdia ( ) = 40 polegadas e desvio padro ( )
= 2 polegadas

40
43
X
Qual a probabilidade de um indivduo, sorteado desta populao, ter um permetro de trax entre 40 e 43
polegadas?
43

[
1
P (40 < X < 43) =
e
40 2 2

( x 40 ) 2
]
2x4

dx

Pode-se responder pergunta sem calcular a integral e sim utilizando o nmero de desvios padro que o
valor 43 est em torno da mdia para calcular a probabilidade por meio da tabela da distribuio Normal
reduzida N(0,1).
Normal reduzida:

Z ~ N (0;1) onde Z =
P ( 40 < X < 43) = P (

x-

40 40 X 43 40
) = P (0 < Z < 1,5)
<
<

2
2

1,5

Utilizando a tabela da curva normal reduzida, P(0<Z<1,5)=0,43319=43,3%

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

54

Com base na distribuio de X~N( =40, =2), do exerccio 34, calcular:


a) a probabilidade de um indivduo, sorteado desta populao, ter um permetro de trax maior ou igual a
43 polegadas.

40

43

P ( X > 43) = P (

1,5

43 40
) = P ( Z > 1,5)
>
2

Utilizando a tabela da curva normal reduzida, P(Z>1,5)=0,5-0,43319=0,06681= 6,7%


b) a probabilidade de um indivduo, sorteado desta populao, ter um permetro de trax entre 35 e 40
polegadas;

c) a probabilidade de um indivduo, sorteado desta populao, ter um permetro de trax menor que 35;

d) Qual o valor do permetro do trax, que deixaria 75% da populao abaixo dele?

Questo 25
Considerar a altura de 351 mulheres idosas como seguindo uma distribuio normal com mdia 160cm e
desvio padro 6 cm. Sorteia-se uma mulher; qual a probabilidade de que ela tenha
a) altura entre 160 cm e 165 cm?
b) altura maior do que 170 cm?
c) altura menor do que 150 cm?

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

55

3.6- Distribuio amostral da mdia


Apresentao do Teorema que fornece as bases tericas necessrias para inferncia estatstica e estimao.
Teorema central do limite:
X varivel aleatria com mdia

2 , ento X ~ N ( ,

e varincia

)
n

Supor a situao onde uma populao composta por 6 elementos, para os quais observou-se a
caracterstica X, cujos valores esto apresentados abaixo.
elementos
A
B
C
D
E
F

Xi
11
16
12
15
16
14

Fonte: Dixon WJ & Massey FJ, 1957.


Mdia populacional ( ) = 14
Varincia populacional ( ) = 3,667
Desvio padro populacional ( ) = 1,9149
2

Parmetros
populao
Mdia ( )

valor
14

Varincia ( )
Desvio padro ( )
2

Estimador
amostra

x = 13
s2 = 8

s = 2,828

3,67

1,91

Valor (estimativa)
Par(A,D)=(11,15)

Todas as possveis amostras de tamanho 2, determinadas pelo processo de amostragem aleatrio, com
reposio (N=6, n=2)
Amostra

Elementos que compem a


amostra

valores

Mdia( x i )

Amostra

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

A,A
A,B
A,C
A,D
A,E
A,F
B,A
B,B
B,C
B,D
B,E
B,F
C,A
C,B
C,C
C,D
C,E
C,F

(11,11)
(11,16)
(11,12)
(11,15)
(11,16)
(11,14)
(16,11)
(16,16)
(16,12)
(16,15)
(16,16)
(16,14)
(12,11)
(12,16)
(12,12)
(12,15)
(12,16)
(12,14)

11
13,.5
11,5
13
13,5
12,5
13,5
16
14
15,5
16
15
11,5
14
12
13,5
14
13

19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

Elementos que
compem a
amostra
D,A
D,B
D,C
D,D
D,E
D,F
E,A
E,B
E,C
E,D
E,E
E,F
F,A
F,B
F,C
F,D
F,E
F,F

valores

Mdia( x i )

(15,11)
(15,16)
(15,12)
(15,15)
(15,16)
(15,14)
(16,11)
(16,16)
(16,12)
(16,15)
(16,16)
(16,14)
(14,11)
(14,16)
(14,12)
(14,15)
(14,16)
(14,14)

13
15,5
13,5
15
15,5
14,5
13,5
16
14
15,5
16
15
12,5
15
13
14,5
15
14

56

Distribuio de freqncia de todas as possveis mdias:


Distribuio amostral da mdia
i

11

Mdia das mdias ( x ) =

i =1

freqncia

1
2
3
4
5
6
7
8
9
10
11
Total

xi
11
11,5
12
12,5
13
13,5
14
14,5
15
15,5
16

1
2
1
2
4
6
5
2
5
4
4
36

fi

= 14

11

2
Varincia das mdias x =

(x
i =1

x)2 fi
n

= 1,833

Desvio padro das mdias = erro padro da mdia =


Erro padro da mdia =

2
x = x

1,833 = 1,354

No exemplo, X ~ N ( = 14, = 1,915) , portanto X ~ N ( x = 14, x =

1,915
2

= 1,354)

Questo 26
Entre homens adultos sadios, a concentrao de ferro srico segue uma distribuio normal com mdia 120
microgramas para 100ml e desvio padro 15 microgramas para 100ml. Calcule a probabilidade que uma
amostra de 50 homens resulte em nvel mdio de ferro srico entre 115 e 125 microgramas por 100ml.

4. Estimao de parmetros populacionais por ponto e intervalo


4.1 Estimao por ponto
Seja X1, X2, X3, ...Xn uma amostra aleatria de tamanho n de uma distribuio normal com mdia e
varincia 2 (desvio padro ).
Os parmetros ( e 2 ) podem ser estimados com base na amostra.
Se o estimador for um nico valor, a estimao chamada de estimao por ponto.
Mdia aritmtica
Populacional
n

Parmetro

estimador :

X=

X
i =1

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

57

Varincia
n

Parmetro

2
(n)

(X
i =1

X)
ou

n
n

estimador :

2
( n 1)

(X
i =1

X)

n 1

Ateno: os estimadores so variveis aleatrias. Pelo teorema central do limite,

X ~ N ( ,

).
n

4.2 - Estimao por intervalo


Padronizando-se

mdia

P( z Z z ) = 1 ,

P(1,96

P(1,96

X ~ N ( ,

ou

),
n

seja, P( z

obtm-se

Z=

z) = 1 .

~ N (0,1) , que permite calcular

Para

= 5% ,

tem-se:

+1,96) = 0,95 , com manipulao algbrica tem-se:

X +1,96 ) = 0,95 ; P( X 1,96 X + 1,96 ) = 0,95 ,


n
n
n
n

obtendo-se P( X 1,96

X + 1,96 ) = 0,95 .
n
n

Tem-se um intervalo aleatrio centrado na mdia amostral que possui 95% de probabilidade de conter a
verdadeira mdia populacional.
Neste caso o parmetro ser estimado por um conjunto de valores provenientes de uma amostra. Quando

isto feito, X = x e o intervalo deixa de ser uma varivel aleatria.


O intervalo x 1,96

x + 1,96
n
n

contm ou no contm a verdadeira mdia. Diz-se ento que a

confiana que se deposita neste intervalo de 95% porque antes de tomada a amostra de tamanho n,
existia, associada a ele, uma probabilidade de 95% de que contivesse a mdia populacional. Por isso
chama-se intervalo de confiana para a mdia populacional
IC(95%) : ( x 1,96

) e ( x + 1,96 )
n
n

ou

x 1,96

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

58

4.2.1 - Intervalo de confiana para a mdia populacional com varincia


populacional conhecida

IC( ) = x z / 2.

x
n

4.2.2 - Intervalo de confiana para a mdia populacional com varincia


populacional desconhecida
Define-se a estatstica
_

X- X-
T= _ =
SX
SX
n

, onde T ~ tn 1 ,

n - 1: graus de liberdade

obs : quando n T ~ N (0 ; 1)
T uma varivel aleatria que segue uma distribuio t de "Student", com (n-1) graus de liberdade. Student
o pseudnimo de W. S. Gosset que, em 1908, props esta distribuio. T segue uma famlia de
distribuies, dependendo do tamanho da amostra.

Assim como Z, T simtrica em torno do zero. Quanto maior o nmero de graus de liberdade, mais a
distribuio t(n-1) vai se aproximar da distribuio normal.
_

IC( ) = xtn1, / 2.

Sx
n

4.2.3 - Intervalo de confiana aproximado para a proporo populacional


Seja X uma varivel aleatria que segue uma distribuio binomial; X~ B(n, ).
A proporo de sucessos =
Para n grande,

X
X
, estimada na amostra por p =
N
n

~ N ( = p, =

pq
).
n

Intervalo de confiana para: IC( ) = p z / 2.

pq
.
n

Onde p e q so propores estimadas na amostra.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

59

Exemplo
Em uma pesquisa sobre propriedades teratognicas de uma droga, foram observadas 85 camundongos
fmeas grvidas que no foram expostas a droga. Do total de 85 ninhadas, 12 tiveram pelo menos 1 filhote
com malformao. Apresente o intervalo de confiana de 95% para a verdadeira proporo de malformao
na populao de camundongos de onde os 85 que participaram do estudo foram provenientes.

p 1,96
IC(95%) aproximado para a proporo populacional:

IC(95%)

0,1412 1,96

0,1412 x0,8588
85

pq
12

p=
= 0,1412
n =
85

(0,067 0,2153)

Exemplo
Os dados a seguir so provenientes do grupo Western Collaborative Group Study, criado na Califrnia em
1960-61. Foram estudados 3154 homens de meia idade para investigar a relao entre padres de
comportamento e risco de doena coronariana. Os dados apresentados so de 40 homens para os quais
foram medidos os nveis de colesterol (mg por 100ml) e realizada uma categorizao segundo
comportamento. O comportamento de tipo A caracterizado pela urgncia, agressividade e ambio. O de
tipo B relaxado, no competitivo e menos preocupado.
Tipo A: nvel de colesterol
233
54

291
276

312
234

250
181

246
248

197
252

268
202

224
218

239
212

239
325

212
183

188
137

250
202

148
194

169
213

Tipo B: nvel de colesterol


344
226

185
175

263
242

246
252

224
153

Medidas(mg/100ml)
Mdia
Varincia (n-1)
Desvio padro (n-1)

Tipo A
245,05
1342,37
36,64

Tipo B
210,3
2336,747
48,33991

Com base nos valores fornecidos, calcule o intervalo de confiana para o nvel mdio populacional de
colesterol para cada um dos tipos. Compare os resultados e discuta.
IC(95%) para a mdia populacional com desvio padro populacional desconhecido:
IC(95%) Tipo A: 245,05 2,093

36,64
20

x t n1

S
n

(227,9 261,2)

IC(95%) Tipo B:

Questo 27
Em uma pesquisa sobre sade bucal na Inglaterra observou-se que de uma amostra de 262 mulheres com
idade entre 25 e 34 anos, 7,6% no tinham dentes. Calcule o intervalo de confiana de 95% para a
proporo de mulheres inglesas naquela faixa etria, que no possuem dentes.
Questo 28
So apresentadas medidas de presso arterial sistlica de uma amostra aleatria de 20 pacientes.
Construa o intervalo de confiana de 90% para a presso sistlica mdia populacional.
98
160

136
125

128
129

130
132

114
154

123
115

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

134
126

128
132

107
136

123
130

60

Valores de mdia e desvio padro das observaes:


128
Mdia ( x )
Desvio padro (Sn-1)
13,91
Questo 29
O grfico abaixo foi extrado e adaptado do artigo: Avaliao da capacidade preditiva da circunferncia da
cintura para obesidade global e hipertenso arterial em mulheres residentes na Regio Metropolitana de
Belo Horizonte, Brasil de Velasquez-Melendez G et al. (Cad. Sade Pblica, 2002; 18 (3):765-71). Analise os
resultados obtidos.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

61

5. Tomada de deciso
Teste de hipteses: um processo de tomada de deciso, com base probabilstica.
Duas abordagens: de Neyman e Pearson (clssica) e de Fisher (valor de p)
Abordagem de Neyman e Pearson (Jerzy Neyman e Egon Pearson)
A deciso tomada sobre hipteses referentes a parmetros da populao de estudo, com probabilidades
de erro de deciso fixadas a priori (antes da realizao do estudo).
No caso mais simples, tem-se duas hipteses:
Hiptese nula
H0
HA ou H1
Hiptese alternativa
Rejeita-se ou no rejeita-se H0 (aceita-se H0) com base nos resultados da amostra. Est, portanto, sujeita a
erro, devido variabilidade inerente ao processo de amostragem.
A possibilidade de cometer erro na deciso entre as hipteses medida probabilisticamente, usando-se um
modelo adequado (binomial, normal, t de Student, qui-quadrado).
Erros possveis na tomada de deciso e probabilidade a eles associada

VERDADE
estado da natureza (populao)

DECISO
(com base na amostra)
H0

H0
Correta

HA

Errada

(erro tipo I)

HA
errada

(erro tipo II)


correta

= Probabilidade (erro tipo I)


= Probabilidade de rejeitar H0 (aceitar HA) quando a verdade H0

= Nvel de significncia do teste


= Probabilidade (erro tipo II)
= Probabilidade de aceitar H0 quando a verdade HA

1-= Probabilidade de rejeitar H0 quando H0 falsa (aceitar HA quando HA a verdade)


1-= Poder do teste
Conduta: Antes do experimento, fixa-se

e trabalha-se com o menor possvel.

Exemplo:

= Proporo de pacientes com efeitos adversos, no uso de uma droga a ser lanada.
usual= Proporo de pacientes com efeitos adversos a uma droga usual.
Espera-se que a droga nova tenha menos efeitos adversos do que a droga usual. <usual, ou seja, <0,6.
O experimento para verificar isto leva a um teste de hipteses, da forma:
H0: =0,6
HA: <0,6
Podendo ser conduzido por exemplo, com 20 pacientes.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

62

Modelo estatstico - probabilstico: Distribuio binomial de probabilidades, pois, para cada paciente, o
resultado da forma, tem efeito adverso/no tem efeito adverso e o resultado de um paciente no
influencia os resultados nos outros.
Varivel aleatria: N de pacientes com efeitos adversos = K.
No de sabe qual das duas hipteses a verdadeira, mas pode-se construir a distribuio de probabilidades
de K para o caso de H0 verdadeira.
Bin(n=20; =0,6)
K

P(K=k|=0,6)

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

0,000
0,000
0,000
0,000
0,000
0,001
0,005
0,015
0,035
0,071
0,117
0,160
0,180
0,166
0,124
0,075
0,035
0,012
0,003
0,000
0,000

Para se decidir entre H0 e HA, h que se definir um conjunto de valores que levem a esta escolha. Isto
feito de forma probabilstica, definindo-se um nvel de significncia (probabilidade de rejeitar H0 mas H0
verdadeira)
Tomada de deciso:
Se, no experimento, o valor observado de K estiver entre aqueles da regio de rejeio de H0, a hiptese H0
ser rejeitada.
H0: =0,6
HA: <0,6,
= 5%
Para
K

P(K=k|=0,6
)

0
1
2

0,000
0,000
0,000

3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

0,000
0,000
0,001
0,005
0,015
0,035
0,071
0,117
0,160
0,180
0,166
0,124
0,075
0,035
0,012
0,003
0,000
0,000

rea de rejeio de H0 resultados mais


compatveis com HA

Resultados mais compatveis com H0

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

63

Realiza-se o estudo e verifica-se que 3 pacientes apresentaram efeitos adversos. QUAL A DECISO?
K

P(K=k|=0,6)

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

0,000
0,000
0,000
0,000
0,000
0,001
0,005
0,015
0,035
0,071
0,117
0,160
0,180
0,166
0,124
0,075
0,035
0,012
0,003
0,000
0,000

= 5%

Qual a deciso se, entre os 20 pacientes, 14 tiverem efeitos adversos?


K
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

P(K=k|=0,6)
0,000
0,000
0,000
0,000
0,000
0,001
0,005
0,015
0,035
0,071
0,117
0,160
0,180
0,166
0,124
0,075
0,035
0,012
0,003
0,000
0,000

= 5%

Supor agora que ser lanada uma droga que pode reduzir o peso de pessoas em uma proporo maior do
que a droga usual
Probabilidade da droga usual = usual = 0,6

H 0 : = 0,6
; Teste monocaudal a direita
H A : > 0,6

Hipteses:

Supor agora que ser lanada uma droga que pode, como efeito colateral, tanto reduzir como aumentar o
peso de pessoas em uma proporo maior do que a droga usual

H 0 : = 0,6
; Teste bicaudal
H A : 0,6

Hipteses:

Onde est ?

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

64

Supor que se deseja comparar a eficcia de uma nova droga (EN) com eficcia de uma droga antiga (EA). A
nova droga foi desenvolvida para ter maior eficcia.

H 0 : EN = E A
; Teste monocaudal a direita
H A : EN > E A

Hipteses:

Supor que a droga antiga tenha uma eficcia de 50% e que o estudo realizado com uma amostra de 10
pacientes.
X: nmero de curas
X: 0, 1, 2, 3,..., 10
X~B(n=10; p=0,5)

H 0 : E N = 0,5
H A : E N > 0,5

Hipteses:

Valor esperado de curas = np= 10x0,5 = 5 curas


Distribuio de probabilidade (sob H0): B(n=10; p=0,5) e 0,05
X (nmero de curas)
0
1
2
3
4
5
6
7
8
9
10

P(X=x)
0,001
0,010
0,044
0,117
0,205
0,246
0,205
0,117
0,044
0,010
0,001

Regio

aceitao de H0

rejeio de H0

Supor que no necessrio uma diferena entre as eficcias EN e EA menor do que 10%, ento supor
=0,6
X
0
1

p=0,5
P(X=x)
0,001
0,010

Regio

2
3
4
5
6
7
8

0,044
0,117
0,205
0,246
0,205
0,117
0,044

aceitao de
H0

9
10

0,010
0,001

H0

(1 )

rejeio de

= 0,055

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

p=0,6
0,000
0,002
0,011
0,042
0,111
0,201
0,251
0,215
0,121
0,040
0,006

Regio

0,833

(1-

0,167

65

Valores de e de 1 para o teste de H0:EN=EP=50% contra H1: EN>50%, quando n=10; 5% (a rigor
5,47%) e 1% (a rigor 1,075%) segundo diferentes valores de EN .
EN
60%
70%
80%
90%

5%

em %
83,27
61,72
32,22
7,02

1 em %

em %

16,73
38,28
67,78
92,98

1%

95,36
85,07
62,42
26,39

1 em %
4,64
14,93
37,58
73,61

Valores de e de 1 para o teste de H0: EN =EP=50% contra H1: EN =60%, quando 5% para
diferentes valores de n.
Tamanho da
amostra (n)
10
15
20
25
30
35
40

Valor de

mais prximo de 5%
5,5
5,9
5,7
5,4
4,9
4,5
4,0

Valor de

(%)

83,3
78,3
75,0
72,6
70,9
69,4
68,3

Valor de

(%)

16,7
21,7
25,0
27,4
29,1
30,6
31,7

Abordagem de Fisher (Ronald Aylmer Fisher) (clculo do valor de p valor descritivo do teste)
Fisher props um mtodo de anlise que tambm envolvia a tomada de deciso e consistia em verificar a
probabilidade de ocorrncia de um valor amostral observado ou de um valor mais extremo de uma
estatstica, sendo a probabilidade calculada com base em uma curva de probabilidade especificada.
Assim se na amostra de 10 pacientes fosse encontrada uma proporo de 65% de curas, Fisher
recomendava que se calculasse a probabilidade desta proporo ou um valor mais extremo ocorrer em uma
curva com proporo de cura conhecida (como por exemplo, 50%).
Se esta probabilidade for pequena conclui-se que possivelmente a droga cura mais do que 50% porque os
dados no mostram evidncia de pertencer a uma populao com proporo de cura igual a 50%.
Se a probabilidade do valor observado ou de um valor mais extremo pertencer curva especificada, for
grande, ento diz-se que os dados provavelmente vm de uma populao que possui como parmetro 50%
de curas.
Esta probabilidade conhecida como valor de p; ou nvel descritivo do teste e fornecido pelos pacotes
estatsticos de anlise de dados.
Valor de p= probabilidade de ocorrncia do valor observado ou de um valor mais extremo, em uma curva de
probabilidade especificada (conhecida, verdadeira).
Fisher dizia que antes de dar uma forma matemtica a um problema, propondo hipteses a serem testadas,
era necessrio um amplo conhecimento dos dados, o que poderia ser realizado com base no valor de p.
Exemplo: Em uma determinada comunidade, estudos tm apontado que a proporo de mes que
amamentam at o 30 ms de 60%. Deseja-se aumentar esta proporo e para tanto, desenvolve-se um
programa educativo com a comunidade. Deseja-se saber se, aps o trmino do programa, pode-se
considerar que a proporo de mes que amamentam at o 30 ms foi maior do que 60%.
Proposio: proporo de mes que amamentam vem de uma populao= 60%

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

66

A idia verificar se aps a campanha, a proporo observada em uma amostra compatvel com 60%
(proporo especificada na proposio). Se no for compatvel, pode-se argumentar que a populao que
representa a proposio no compatvel com os resultados.
Para tanto, realiza-se o estudo que consiste em sortear, aps uma campanha de incentivo ao aleitamento
materno, um nmero de mes que deram luz (nos ltimos 12 meses), contar quantas amamentaram at o
30 ms e calcular a proporo. Supor que foram selecionadas 10 mes e destas, 9 amamentaram at o 30
ms.
Como vamos decidir se o programa teve efeito ou se este resultado foi somente um artifcio da amostra
selecionada? Ou seja, devido ao acaso?
Para decidir calcula-se a probabilidade de pelo menos 9 mes amamentarem se elas tivessem vindo de uma
populao onde 60% das mes amamentam.
Clculo da probabilidade de ocorrer 9 ou mais mes em uma populao com 60% de amamentao.
Definio da distribuio de probabilidade:
Amamentar uma varivel dicotmica (amamenta ou no)
A probabilidade de amamentar conhecida = 0,6 ;
Amamentar exclui no amamentar (eventos mutuamente exclusivos);
O comportamento de uma me no interfere no comportamento de outra (eventos
independentes);
O tamanho da amostra conhecido, n=10;
possvel definir a varivel X: nmero de mes que amamentam, que assume os valores x: 0,1,
2, ..., 10.
Distribuio de probabilidade Binomial com parmetros n=10 e = 0,6 .
-

Clculo da probabilidade:
Observou-se que 9 mes, do total de 10, amamentaram seus filhos at o 30 ms. Se com 9 mes
amamentando conclumos que o programa foi eficiente, com 10 mes tambm seria. Portanto, calcula-se a
probabilidade de 9 ou mais mes amamentarem, se elas tivessem vindo de uma populao onde 60%
amamenta.
Pela distribuio Binomial, (n=10; = 0,6 ), obtm-se

P( X 9) = P( X = 9) + P( X = 10) = 0,040 + 0,006 = 0,046 ou 4,6%


Valor de p=4,6%
A probabilidade de observar 9 ou mais mes amamentando, se elas tivessem vindo de uma populao de
mes que 60% amamentam 4,6%.
Os resultados observados so compatveis com a proposio de que as mes vm de populao que
amamenta 60%? Em outras palavras, com base nos resultados, voc diria que existe evidncia de que estas
mes vm de uma populao onde 60% amamenta o perodo recomendado?
Se p for considerado, pelo investigador, pequeno diz-se que os dados observados mostram evidncia
favorvel campanha. A proporo de mes que amamentaram, depois da campanha mais compatvel
com a populao de mes em uma populao onde uma proporo maior do que 60% amamenta.
Se p for considerado grande, pelo investigador, diz-se que os dados no mostram evidncia desfavorvel
proposio e portanto, a campanha no surtiu efeito. A diferena observada na amostra no ocorreria na
populao.
O julgamento sobre o valor de p, se grande ou pequeno, arbitrrio e quem decide o investigador.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

67

5.1- Teste de hiptese de uma proporo populacional


Abordagem de Neyman e Pearson
Supor a situao onde um fabricante quer lanar um bolo mais doce do que est no mercado (cdigo 15).
Para tanto desenvolvido um novo produto (cdigo 23). O estudo consiste em oferecer uma fatia de cada
produto a 20 degustadores e contar quantos acham o produto novo mais doce.
O investigador fixa o nvel de significncia em 5% ( = 0,05 ).
No teste comparao de par, direcionada, o nmero K de degustadores que achou o bolo com cdigo 23
mais doce foi k= 8. Pode-se admitir que os bolos diferem quanto doura?
Se os bolos no forem diferentes quanto ao sabor, metade dos degustadores vai escolher um produto e a
outra metade vai escolher o outro.
Probabilidade de escolher o cdigo 15 = 0,5

H 0 : = 0,5

H A : > 0,5
Distribuio de probabilidade:
X: nmero de degustadores que escolhem o produto novo.
X:0, 1, 2,...,18, 19, 20
Cada degustador escolhe o produto independente do outro degustador e se for feita a escolha por um
produto (eventos independentes), o outro fica eliminado (mutuamente exclusivos). X~B(n=20; p=0,50)
X
0
1
2
3
.
.
.
13
14
15
16
17

P(X=x)

0,03696
0,01479
0,00462
0,00109

18
19
20

Regio do teste

0,00018
0,00002
0,00000

Rejeio de H0

= 0,058

Como k=8, toma-se a deciso de no rejeitar H0. Pode-se dizer que os produtos so semelhantes quanto ao
sabor adocicado, para um nvel de significncia de 5%.
Abordagem de Fisher
Proposio: Proporo de degustadores que escolhem cdigo 15=0,5
n=20
K:nmero de degustadores que escolhem cdigo 15
K:0, 1, 2, ..., 20
K~B(n=20; p=0,5)
Observou-se que 8 degustadores escolheram cdigo 23 (k=8).
Valor de p=probabilidade de ocorrer 8 ou um valor mais extremo, se os dados vierem de uma populao
que escolhe os produtos em propores iguais.
Valor de p= P(K8) = P(k=8)+P(k=9)+...+P(k=20)= 0,868 ou 86,8%.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

68

Conclui-se que os dados mostram evidncia favorvel proposio sendo possivelmente provenientes de
uma populao que escolhe igualmente os cdigos 15 e 23. O novo produto no foi considerado mais doce
que o antigo.
OBS: Como np=10 e nq=10, para o clculo de p poderia ter sido utilizada a distribuio normal.

K ~ N ( = np = 20 x0,5 = 10; = npq = 20 x0,5 x0,5 = 2,24


7,5 10
P( K 8) = P( Z
) = P( Z 1,12) = 0,5+0,36864=0,86764 ou 86,8%
2,24
Questo 30
Em um julgamento jurdico o jri tem que decidir sobre a culpa ou inocncia de um ru. Considere dois
fatos: 1) o sistema jurdico admite que toda pessoa inocente at que se prove o contrrio. 2) s vai a
julgamento pessoas sobre as quais existe dvida de sua inocncia. Fazendo uma analogia com teste de
hipteses, responda
a) Apresente as hipteses nula e alternativa sobre a culpa ou inocncia do ru;
b) O jri pode errar se decidir que o ru culpado quando na verdade ele inocente; qual o outro
erro de deciso que o jri pode cometer?
c) Qual dos dois erros o mais srio?
d) Na terminologia de teste de hiptese, qual tipo de erro (I ou II) pode-se vincular a cada uma das
decises do item b?
Questo 31
Quando um diagnstico mdico fornecido, qual dos erros geralmente mais srio: um resultado falso
positivo que diz que a pessoa tem a doena quando na verdade ela no tem ou um resultado falso negativo,
que diz que a pessoa no tem a doena quando na verdade ela tem? Imagine duas situaes: 1) a pessoa
est fazendo parte de um screening para cncer de mama. 2) a pessoa realiza o teste para detectar
anticorpos anti-HIV.
Questo 32
Com base na questo anterior
a) Apresente as hipteses nula e alternativa sobre a situao de sade do paciente;
b) Que tipo de erro (I ou II) seria cometido se o resultado do teste fosse falso positivo?
c) Que tipo de erro (I ou II) seria cometido se o resultado do teste fosse falso negativo?

Questo 33
Um estudo foi desenvolvido para investigar se aleitamento materno um fator que protege a criana contra
diabetes, em idades maiores. Considerando H0: aleitamento materno no protege contra diabetes e Ha:
aleitamento materno protege contra diabetes, responda
a) Tomando qual deciso (aceitar ou rejeitar) sobre H0 voc poderia estar cometendo o erro tipo I?
b) Tomando qual deciso (aceitar ou rejeitar) sobre H0 voc poderia estar cometendo o erro tipo II?
c) Como denominada a probabilidade de ocorrer o erro tipo I?
d) Como denominada a probabilidade de ocorrer o erro tipo II?
e) O que o poder do teste?
f) Se voc fosse fixar valores de probabilidades associadas ocorrncia dos erros tipo I e II para este
estudo, qual deles seria menor? Justifique.
Questo 34
Supor o experimento onde existe interesse em investigar se o odor de determinado alimento atrai
camundongos. O experimento consiste em colocar um animal em um corredor que no final dividido para a
direita e para a esquerda. O alimento colocado no final do corredor da esquerda, fora da viso do animal.
Entretanto, antes da realizao do experimento, decide-se eliminar a possibilidade de incluir no estudo

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

69

camundongos que tm predileo por um lado, independentemente do odor do alimento. Neste caso,
decide-se investigar inicialmente se os camundongos escolhem os lados em propores iguais.
Para tanto, realiza-se o experimento com 12 camundongos sem a colocao do alimento e verifica-se que 7
viram para a esquerda.
a) realize um teste de hipteses segundo o modelo clssico de Newman e Pearson, com nvel de
significncia =5%, para verificar se os camundongos vm de uma populao que escolhe mais um lado do
que o outro;

b) realize um teste de hipteses seguindo a proposta de Fisher, com clculo do valor descritivo do teste,
para verificar se os camundongos vm de uma populao que escolhe mais um lado do que o outro.

Questo 35
Supor, agora, o experimento para investigar se o odor de determinado alimento atrai camundongos.
Realiza-se o experimento colocando o alimento no final do corredor da esquerda, fora da viso dos
camundongos.Observa-se que de 12 camundongos, 10 viram para a esquerda.
a) realize um teste de hipteses segundo o modelo clssico de Neyman e Pearson, com nvel de significncia
=5%, para verificar se os camundongos vm de uma populao que escolhe mais o lado onde est o
alimento;

b) realize um teste de hipteses seguindo a proposta de Fisher, com clculo do valor descritivo do teste,
para verificar se os camundongos vm de uma populao que escolhe mais o lado onde est o alimento.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

70

5.2 Teste de hipteses de uma mdia populacional ( ) (com varincia


conhecida e desconhecida)
5.2.1 - Reviso de conceitos bsicos
Distribuio Normal
Medindo-se a altura de muitas mulheres (populao), obtm-se o grfico a seguir.
proporo

.35
.3
.25
.2
.15
.1
.05
0

140

145

150

155
160
Altura(cm)

165

170

175

180

Aos dados pode ser ajustada uma curva terica


proporo

.35
.3
.25
.2
.15
.1
.05
0
140

145

150

155
160
Altura (cm)

165

170

175

180

A curva ajustada aos dados uma curva terica (curva de Gauss) que representa a altura de mulheres
idosas.
X: altura, X ~ N (m = 160, = 10)
A curva tem propriedades conhecidas:
- Soma da rea sob a curva igual a 1 ou 100%;
- Pode-se calcular probabilidade trabalhando-se com a rea sob a curva;
- Sorteia-se uma mulher ao acaso; P(desta mulher ter mais de 160) = 50%;

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

71

P(esta mulher tenha mais de 180)= P ( X > 180) = P ( Z >

180 160
) = P( Z > 2) =0,5-0,47725=0,02275 ou
10

2,3%
Sortear uma mulher com altura 180 ou mais desta populao uma coisa comum?
P(esta mulher tenha mais de 170)=

P ( X > 170) = P ( Z >

170 160
) = P ( Z > 1) = 0,5-0,34134 = 0,15866 ou 15,9%
10

Sortear uma mulher com altura 170 ou mais desta populao uma coisa comum?
O limite para decidir o que comum arbitrrio. O investigador que decide, com base no problema que
est sendo estudado.
Supor agora uma outra distribuio de altura, por exemplo, entre homens.
proporo

.35
.3
.25
.2
.15
.1
.05
0
160

165

170

175
180
Altura (cm)

185

190

195

200

X: altura, X ~ N (m = 180, = 10)


P(homem tenha mais de 180)= P(X>180)=0,5 ou 50%
Supor que as pessoas da primeira curva tenham uma marca vermelha e as pessoas da segunda curva
tenham uma marca azul. Misturam-se todas as pessoas e sorteia-se uma pessoa ao acaso e ela tem altura
180.
De qual populao seria este indivduo?
Agora no estamos mais interessados em um indivduo e sim em vrios indivduos portanto, vamos trabalhar
com a altura mdia.
Supor X: altura, X ~ N (m = 160, = 20) .
Toma-se uma amostra de tamanho n=30 desta populao e calcula-se a altura mdia ( x = 170 ).
Deseja-se saber a probabilidade desta amostra vir de populao com altura mdia maior ou igual a 170.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

72

m=160

170

Pelo Teorema do Limite Central


170 160
170 160
) = P(Z X >
) = P( Z > 2,74)
20
3,6515
30
Na curva da Normal reduzida tem-se
P( X > 170) = P(

X m

>

m=0

2,74

ZX

=0,5- 0,49693 = 0,0031 ou 0,31%


Sortear uma amostra que apresenta altura mdia igual a 170 cm ou mais da populao que tem altura
mdia 160 cm uma coisa comum?
Para decidir se a amostra representa uma populao com altura mdia maior e que o resultado no devido
ao acaso, realiza-se o teste de hipteses.

5.2.2 - Teste de hipteses para uma mdia populacional com varincia


conhecida
Abordagem de Fisher:
Situao:
Estudos mostram que crianas sadias possuem peso mdio (m) ao nascer igual a 3100 gramas e desvio
padro = 610gramas .
Suspeita-se que crianas que nascem com sndrome de desconforto idioptico grave possuem peso ao
nascer abaixo do peso ao nascer da populao de crianas sadias.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

73

Proposio: Crianas com sndrome vm de uma populao com peso mdio =3100 gramas
Realiza-se um estudo em uma amostra de n=50 crianas que nasceram com esta sndrome, onde observouse peso mdio ( x ) igual a 2800 gramas.
Supondo-se que as crianas da amostra (com sndrome) vm de uma populao com mesma disperso do
peso ao nascer de crianas sadias, teste a hiptese de que crianas com sndrome idioptica grave possuem
peso mdio ao nascer igual ao peso mdio ao nascer de crianas sadias.
Distribuio de probabilidade:
Distribuio do peso mdio: segue uma distribuio normal com mdia m=3100 gramas e desvio padro

610

=
= 86,27 gramas
n
50

2800

m=3100

Clculo da probabilidade de observar um peso mdio ao nascer igual ou menor que 2800 se H0 for verdade.

P ( X < 2800) = P (

X m

<

2800 3100
300
) = P ( Z X < 3,48)
) = P(Z X <
610
86,27
50

-3,48

m=0

ZX

Pela distribuio Normal reduzida tem-se que


P( Z < 3,48) = 0,5 0,49975 = 0,00025 ou 0,025%
Os resultados no so compatveis com uma distribuio que tem peso mdio igual a 3100. Possivelmente a
amostra vem de uma populao com mdia menor que 3100. Pode-se dizer que crianas com sndrome de
desconforto idioptico grave possivelmente possuem peso ao nascer menor do que o peso mdio de
crianas sadias.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

74

5.2.3 - Teste de hipteses para uma mdia populacional com varincia


desconhecida
Abordagem de Fisher:
Supor a mesma situao anterior, s que neste caso somente a mdia populacional conhecida. O peso
mdio de crianas sadias (m) igual a 3100 gramas.
Proposio: Crianas com sndrome de desconforto idioptico grave vm de uma populao com peso mdio
=3100 gramas
Seleciona-se uma amostra de 50 crianas com a sndrome e calcula-se o peso mdio e o desvio padro do
peso, obtendo-se
n=50; x = 2800 e s=510
Distribuio de probabilidade:
Distribuio do peso mdio ao nascer de crianas sadias: como no se sabe o desvio padro populacional,
este estimado utilizando-se os dados da amostra.
Neste caso a varivel a varivel segue uma distribuio t de Student com n-1=50-1=49 graus de liberdade.
P( X < 2800) = P(

300
X m 2800 3100
<
) = P(t X <
) = P(t X < 4,159)
510
SX
72,12
50

-4,16

m=0

Pela distribuio t de Student com 49 graus de liberdade, tem-se P(t X < 4,159) < 0,05%
Os resultados no so compatveis com uma distribuio que tem peso mdio igual a 3100. Pode-se dizer
que crianas com desconforto idioptico grave provavelmente vm de uma populao com peso mdio ao
nascer menor do que o peso mdio ao nascer de crianas sadias.
Questo 36
Uma companhia de produtos alimentcios utiliza uma mquina para embalar salgadinhos cujas embalagens
especificam 454gramas. Com o propsito de verificar se a mquina est trabalhando corretamente,
selecionou-se 50 pacotes de salgadinhos, obtendo-se os seguintes valores de peso:
464
442
448
463
468

450
438
450
449
447

450
452
439
447
433

456
447
452
466
464

452
460
459
446
469

433
450
454
447
457

446
453
456
450
454

446
456
454
449
451

450
446
452
457
453

447
433
449
464
443

mdia da amostra, x =451,22 gramas e desvio padro amostral, s=8,40 gramas


Testar a hiptese de que a mquina est trabalhando corretamente. Utilizar o valor de p para tomada de
deciso
Questo 37
FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.
Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

75

O nvel mdio de protombina em populaes normais 20 mg/100ml de sangue. Em uma amostra de 40


pacientes que tinham deficincia de vitamina K foram observadas as estatsticas: nvel mdio de protombina
de 18,5mg/100ml e desvio padro 4mg/100ml. Seria razovel concluir que a verdadeira mdia de pacientes
com deficincia de vitamina K a mesma que a da populao normal? Realize um teste de hipteses
segundo a abordagem de Fisher para responder a pergunta.

5.3 - Teste de hipteses de associao pelo Qui-quadrado de Pearson (2)


O Qui-quadrado obtido somando-se a diferena ao quadrado entre as freqncias observadas e as
esperadas, dividido pelas freqncias esperadas.

(O E) 2
=
E
2

Se o Qui-quadrado for igual a zero, ento no existe associao entre as variveis. Quanto maior o valor do
Qui-quadrado, maior a chance de existir associao entre as variveis, entretanto, o Qui-quadrado no
mede fora de associao.
Distribuio Qui-quadrado ( ( n 1) ) com (n-1) graus de liberdade
2

Seja uma populao com distribuio normal N ( , ) . Se desta populao se obtiver um nmero infinito
de amostras de tamanho n, calculando-se as quantidades x e S2 em cada amostra, a varivel aleatria

(n 1) S 2

~ (2n 1) , onde (2n 1) se l "qui-quadrado com n-1 graus de liberdade" (Berqu, 1981).

A distribuio Qui quadrado assimtrica e se torna menos assimtrica a medida que os graus de liberdade
aumentam. Os valores da distribuio so sempre positivos (maior ou igual a zero). Existe uma famlia de
distribuies qui quadrado, dependendo do nmero de graus de liberdade. Para grandes amostras, a
distribuio qui quadrado tende para uma distribuio normal.

Teste de hipteses de associao pelo Qui-quadrado de Pearson (2)

H 0 : No existe associao
Estatstica do teste:

Qui quadrado =

(O E ) 2
~ (2r 1)( c1)
E

onde r e c representam o nmero de linhas e de colunas, respectivamente


Correo de continuidade:

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

76

Qui quadradocorrecao de Yates =

(| O E | 0,5) 2
~ (2r 1)( c1)
E

Limitaes:
Para n<20, utilizar o teste exato de Fisher
Para 20 n 40 , utilizar o Qui-quadrado somente se os valores esperados forem maiores ou iguais a 5
Exemplo:
Com o objetivo de investigar a associao entre histria de bronquite na infncia e presena de tosse diurna
ou noturna em idades mais velhas, foram estudados 1.319 adolescentes com 14 anos. Destes, 273
apresentaram histria de bronquite at os 5 anos de idade sendo que 26 apresentaram tosse diurna ou
noturna aos 14 anos.
Nmero de adolescentes segundo histria de bronquite aos 5 anos e tosse diurna ou
noturna aos 14 anos de idade. Local X, ano Y.
Bronquite
Tosse
Sim
No
Total
Sim
26
44
70
No
247
1002
1249
Total
273
1046
1319
Fonte: Holland, WW et al, 1978.
Valores observados
(O)

Valores esperados
(E)

26
247
44
1002
p

14,488
258,512
55,512
990,488

(O-E)

(O-E)2

(O E ) 2
E

11,512
-11,512
-11,512
11,512

132,526
132,526
132,526
132,526
Qui-quadrado=

9,147
0,513
2,387
0,134
12,181

no corrigido=0,0004829

Questo 38
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo condio
de sobrevivncia e peso ao nascer (g)
Peso ao nascer
bito
Sobrevida
Total
Baixo peso (<2500)
24
13
37
No baixo peso (2500 e mais)
3
10
13
Total
27
23
50
Fonte: Hand DJ et al., 1994.
Com base nos dados apresentados na tabela realize o teste de hiptese para investigar a existncia de
associao entre o peso do recm-nascido e a condio de sobrevivncia.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

77

Questo 39
Defeitos do tubo neural so malformaes congnitas que surgem durante o desenvolvimento fetal.
conhecida como spina bfida. Estes dados so de um estudo conduzido no pas de Gales Reino Unido, para
investigar possvel associao entre defeitos do tubo neural e dieta materna. O estudo do tipo casocontrole: mes que tinham tido bebs com defeitos do tubo neural (casos) e suas irms que no tinham tido
(controles) foram avaliadas segundo suas dietas e classificadas em boa, razovel e ruim.
Distribuio de recm-nascidos segundo condio caso - com defeitos do tubo neural; controle recmnascidos que no tinham defeitos do tubo neural e dieta materna.
Dieta
Casos
Controles
Total
n
%
n
%
n
%
Boa
34
13,9
43
35,0
77
21,0
Razovel
110
45,1
48
39,0
158
43,0
Pobre
100
41,0
32
26,0
132
36,0
Total
244
100
123
100
367
100
Com base nos dados apresentados na tabela realize o teste de hiptese para investigar existncia de
associao entre as variveis.
Questo 40
A tabela apresenta dados de classificao de pessoas segundo doena coronariana (DIC) e hbito de
consumo de caf, para uma coorte de 1718 homens com idade 40-55 anos.
Distribuio de homens segundo consumo de caf e incidncia de doena coronariana (DIC).
Consumo mdio de caf
condio
Alto (>=100 xcaras/ms)
Moderado (<100 xcaras/ms)
Com DIC
38
39
Sem DIC
752
889
total
790
928

total
77
1641
1718

Com base nos dados apresentados na tabela realize o teste de hiptese para associao entre consumo de
caf e doena coronariana.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

78

6. Bibliografia
Berqu ES; Souza JMP. e Gotlieb SLD. Bioestatstica. EPU, So Paulo, 1981.
Caldas ED, Silva SC, Oliveira JN. Aflatoxinas e ocratoxina A em alimentos e riscos para a sade humana.
Rev. Sade Pblica, 2002;36(3):319-23.
Carvalho AT, Costa MJC, Ferreira LOC, Batista Filho M et al. Cartografia do retardo estatural em escolares do
estado da Paraba. Brasil. Rev Sade Pblica 2000;34(1):3-8.
Chambers JM, Cleveland WS, Kleiner B, Tukey PA. Graphical methods for data analysis. Wadsworth &
Brooks/Cole Publishing Company, Advanced Books & Software. Pacific Grove, California, 1983.
Corra Filho HR, Vieira JBF, Silva YS, Coelho GE, Cavalcante FAC, Pereira MP. Inqurito sobre a prevalncia
de bcio endmico no Brasil em escolares de 6 a 14 anos: 1994 a 1996. Rev Panam Salud Publica
2002;12(5):317-325.
Daly F, Hand DJ, Jones MC, Lunn AD, McConway KJ. Elements of Statistics, 1999.
Dixon WJ e Massey FJ. Introduction to Statistical Analysis. 2nd edit. The Maple Press Company, York, 1957.
Escosteguy CC, Medronho RA, Madruga R et al. Vigilncia epidemiolgica e avaliao da assistncia s
meningites. Rev. Sade Pblica, 2004;38(5):657-63.
Fornes IS, Martins IS, Velasques-Melendez G et al. Escores de consumo alimentar e nveis lipmicos em
populao de So Paulo, Brasil. Rev. Sade Pblica, 2002;36(1):12-8.
Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.
Holland WW, Bailey R, Bland JM. Long-term consequences of respiratory disease in infancy. Journal of
Epidemiology and Community Health 1978;32: 256-9.
Kummer SC, Giugliani ERJ, Susien LO et al. Evoluo do padro de aleitamento materno. Rev de Sade
Pblica, 2000;34(2):143-8.
Lerario DG, Gimeno SG, Franco LJ et al. Excesso de peso e gordura abdominal para a sndrome metablica
em nipo-brasileiros. Rev. Sade Pblica, 2002;36(1):4-11.
Monteiro CA, Benicio MHDA, Ortiz LP. Tendncia secular do peso ao nascer na cidade de So Paulo (19761998) Rev. Sade Pblica; 2000:34(6, supl):26-40.
Monteiro CA, Szarfarc SC, Mondini L. Tendncia secular da anemia na cidade de So Paulo (1984-1996).
Rev. Sade Pblica, 2000; 34(6, sup):62-72.
Monteiro POA, Victora CG, Barros F et al. Diagnstico de sobrepeso em adolescentes: estudo do
desempenho de diferentes critrios para o ndice de Massa Corporal. Rev. Sade Pblica, 2000;34(5):50613.
Osborn JF. Statistical Exercises in Medical Research. John Wiley & Sons Inc., 1979.
Otero UB, Rozenfeld S, Gadelha AMJ et al. Mortalidade por desnutrio em idosos, regio Sudeste do Brasil,
1980-1997. Rev. Sade Pblica, 2002;36(2):141-8.
Prado MS, Assis AMO, Martins MC, Nazar MPA, Rezende IFB, Conceio MEP. Hipovitaminose A em crianas
de reas rurais do serto semi-rido baiano. Revista de Sade Publica, 1995;29(4):295-300.
Soares JF, Siqueira AL. Introduo Estatstica Mdica, COOPMED, 2002.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

79

Souza Jnior PRB, Szwarcwald CL, Barbosa Junior A et al. Infeco pelo HIV durante a gestao: EstudoSentinela Parturiente, Brasil, 2002. Rev. Sade Pblica, 2004:38(6):764-72.
Triola MF. Introduo Estatstica. LTC Livros Tcnicos e Cientficos Editora, 1999.
Tuyns AJ, Pequignot G, Jensen OM. Esophageal cancer in Ille-et-Vilaine in relation to levels of alcohol and
tobacco consumption. Risks are multiplying. Bull Cancer 1977;64:45-60.
van Vliet PKJ e Gupta JM. THAM v. sodium bicarbonate in idiopathic respiratory distress syndrome. Archives
in Disease in Childhood, 1973;48:249-55.
Velasquez-Melendez G, Kac G, Valente JG et al. Avaliao da capacidade preditiva da circunferncia da
cintura para obesidade global e hipertenso arterial em mulheres residentes na Regio Metropolitana de
Belo Horizonte, Brasil. Cad. Sade Pblica, 2002;18(3): 765-771.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

80

7. Resumos dos artigos citados


CALDAS, Eloisa Dutra, SILVA, Saulo Cardoso e OLIVEIRA, Joo Nascimento. Aflatoxinas e ocratoxina A
em alimentos e riscos para a sade humana. Rev. Sade Pblica, jun. 2002, vol.36, no.3, p.319-323.
OBJETIVOS: A presena de micotoxinas em alimentos tem sido correlacionada a vrias patologias
humanas, e as autoridades de sade no mundo todo tm implementado aes para diminuir a ingesto
desses compostos pela dieta. Realizou-se pesquisa para analisar os nveis de aflatoxinas e ocratoxina A de
alimentos para consumo e avaliar o potencial de risco da exposio humana a essas micotoxinas.
MTODOS: Foram analisadas 366 amostras de alimentos consumidos no Distrito Federal, no perodo de
julho de 1998 a dezembro de 2001, como amendoim e derivados, castanhas, milho, produtos de trigo e/ou
aveia, arroz e feijo. As amostras foram processadas, e as micotoxinas extradas, detectadas e quantificadas
por fluorescncia aps separao em cromatografia camada delgada. RESULTADOS: Foram detectadas
aflatoxinas em 19,6% das amostras, em amendoim cru e derivados, milho de pipoca, milho em gro e
castanha-do-par (>2 g/kg). Amendoim e derivados apresentaram maior incidncia de contaminao por
aflatoxinas (34,7%) com amostras contendo at 1.280 g/kg de AFB1+AFG1 e 1.706 g/kg de aflatoxinas
totais. Das amostras positivas, AFB1 estava presente em 98,5%, AFB2 em 93%, AFG1 em 66,7% e AFG2
em 65,4%. A ocratoxina A no foi detectada (<25 g/kg) em nenhuma amostra analisada. CONCLUSO:
Os nveis de contaminao encontrados em amendoim e derivados ultrapassaram os nveis mximos
permitidos pela legislao brasileira, podendo significar fator de risco para a populao que os consome
regularmente. A conscientizao dos produtores de alimentos e as aes de vigilncia sanitria permanentes
so essenciais para diminuir a exposio humana a esses compostos e prevenir doenas crnicas advindas
dessa exposio.
Palavras-chave: Aflatoxinas; Ocratoxinas; Anlise de alimentos; Contaminao de alimentos; Vigilncia
sanitria; Amendoim; Milho.

CARVALHO, Alice T, COSTA, Maria JC, FERREIRA, Luiz OC et al. Cartografia do retardo estatural em
escolares do Estado da Paraba, Brasil. Rev. Sade Pblica, fev. 2000, vol.34, no.1, p.3-8. ISSN 00348910.
OBJETIVO: Parte de um projeto promovido pelas Naes Unidas (FAO) e pelo Ministrio da Educao do
Brasil (Fundao de Assistncia ao Escolar) para estudar a condio nutricional de alunos de educandrios
pblicos, visa a avaliar, com um enfoque cartogrfico, a magnitude e a distribuio espacial do dficit
estatural de alunos de escolas pblicas do Estado da Paraba. MTODOS: Fez-se levantamento de carter
censitrio da estatura de 50.144 escolares com idade de 6 a 9 anos, matriculados na primeira srie do
primeiro grau de todos municpios do Estado da Paraba, considerando-se como dficit estatural os valores
classificados abaixo de -2 "scores" z do padro do National Center of Health Statistics. RESULTADOS: Em
todo o Estado, 14,5% dos escolares foram considerados casos de nanismo, com uma distribuio
heterognea para as quatro mesorregies fisiogrficas estudadas: 18,7% no Serto, 13,8% no Agreste,
11,9% na Borborema e 10,9% na Zona da Mata. Nas escolas da rea rural, 17,8% dos alunos
apresentavam dficit estatural, enquanto no meio urbano a prevalncia de nanismo foi de 11,8%.
CONCLUSES: Os dados encontrados so indicativos de um processo de interiorizao da desnutrio,
contrastando substancialmente com as descries histricas sobre a cartografia do problema na regio.
Palavras-chave: Estatura; Inquritos nutricionais; Distribuio espacial; Transtornos nutricionais; Nanismo
nutricional.
Correa Filho HR, Vieira JB, Silva YS, Coelho GE, Cavalcante Fdos A, Pereira Mda P. Endemic goiter
prevalence survey in Brazilian schoolchildren 6 to 14 years old, 1994-1996. Rev Panam Salud
Publica. 2002 Nov;12(5):317-26.
OBJECTIVE: To determine the national and state-level prevalence of endemic goiter associated with iodine
deficiency in schoolchildren between 6 and 14 years of age in Brazil, based on data from a national survey
carried out from 1994 to 1996. MATERIALS: Thyroid inspection and palpation were performed on 178,774
schoolchildren between 6 and 14 years of age, in all the states of Brazil. A subsample was selected to

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

81

measure the iodine content in their urine as well as the iodine content of the table salt used for cooking in
their homes. RESULTS: The last survey before this one was carried out in 1975. We found an 86% decrease
in the median prevalence of grade 1 and 2 grade 2 goiter, from 12% to 1%. In 21% of the municipalities,
the observed prevalence was zero. From the 16,803 urine samples collected for iodine measurement, 7,702
were matched with the corresponding clinical record (a loss of 54%). The median urinary iodine level was
14.0 micrograms/dL, and without a significant correlation with the clinical data on goiter. The median iodine
excretion level for the population in the states of Acre, Amapa, and Tocantins was equal to or below 9.0
micrograms/dL. In three municipalities, urinary iodine was below 2.5 micrograms/dL in all the samples:
Parana (in the state of Tocantins), Conceicao (Paraiba), and Nova Roma (Goias). The supplementary iodine
found in the salt collected from households (458 samples collected) was below recommended levels, with
50% of them below 20 mg/kg (20 ppm). In 7% of the samples, the level of iodine was below 10 mg/kg of
salt, even in salt-producing states such as Rio Grande do Norte. CONCLUSIONS: There is evidence goiter is
expanding to parts of Brazil that more recently have been opened up for agriculture, with children in those
areas being exposed to low levels of supplementary iodine in the salt used for cooking. We found an
increased risk of goiter in areas with deficient iodine supplementation (< 10 mg/kg) (odds ratio = 1.85;
Cornfield 95% confidence interval: 1.68-2.03).

ESCOSTEGUY, Claudia Caminha, MEDRONHO, Roberto de Andrade, MADRUGA, Roberto et al. Vigilncia
epidemiolgica e avaliao da assistncia s meningites. Rev. Sade Pblica, out. 2004, vol.38, no.5,
p.657-663. ISSN 0034-8910.
OBJETIVO: Analisar o perfil clnico-epidemiolgico dos casos de meningite internados em hospital pblico e
os fatores associados evoluo hospitalar. MTODOS: Foram analisados 694 casos confirmados,
notificados e investigados pelo servio de epidemiologia de um hospital pblico de 1986 a 2002. Os dados
foram coletados do Sistema de Informao de Agravos de Notificao (Sinan), como parte da rotina local de
vigilncia epidemiolgica. Foi realizada anlise multivariada por regresso logstica. RESULTADOS:
Etiologias mais freqentes: criptoccica (12,3%; letalidade =37,7%); meningoccica (8,7%; letalidade
=13,3%); pneumoccica (7,2%; letalidade =46%); tuberculosa (6,1%; letalidade =40,5%); estafiloccica
(5,2%; letalidade =38,9%), viral (5,5%; letalidade =7,9%); hemfilo (2,9%; letalidade =20%). 38,8% dos
casos apresentavam etiologia no especificada (letalidade =36%) e 17,3% estavam associados infeco
pelo HIV. Observou-se meningite hospitalar em 27,1% e seqelas em 9,2% dos casos com alta hospitalar.
Variveis associadas a uma maior chance de bito: etiologia (referncia viral) - tuberculose, criptococo,
estafilococo, meningococo, no especificada, outros gram negativos, cndida e pneumococo; infeco pelo
HIV; coma. A trade febre, vmitos e rigidez de nuca associou-se a uma menor chance de bito.
CONCLUSES: A elevada proporo de etiologia no especificada e letalidade alta podem refletir
problemas de processo de assistncia e/ou seleo dos casos relacionada ao perfil do hospital. A vigilncia
epidemiolgica operante no nvel hospitalar foi capaz de retro-alimentar os servios com indicadores da
assistncia, sendo pertinente o uso do Sinan neste nvel.
Palavras-chave: Meningite [epidemiologia]; Sistemas de informao; Notificao de doenas; Vigilncia
epidemiolgica; Meningite [etiologia]; Meningite [mortalidade]; Pacientes internados.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

82

Holland WW, Bailey R, Bland JM. Long-term consequences of respiratory disease in infancy.
Epidemiol Community Health. 1978 Dec;32(4):256-9.
In a study of Kent schoolchildren it has been shown that those who had a history of bronchitis under the
age of five were more likely to have reported respiratory symptoms as the age of 11 (Bland et al., 1974).
After this finding, it was necessary to test whether these differences would continue or diminish as the
children grew older. One thousand three hundred schoolchildren in four areas of Kent were studied by
physical examination and parental questionnaire at the ages of 5, 11, and 14. The relative risk of having
reported respiratory symptoms for children with a history of early bronchitis, asthma, or pneumonia,
compared with other children, was the same at the age of 14 as it was at the age of 11. These
relationships could not be explained by social class effects, and were probably not due to parental bias in
reporting.

KUMMER, Suzane C, GIUGLIANI, Elsa RJ, SUSIN, Lulie O et al. Evoluo do padro de aleitamento
materno. Rev. Sade Pblica, abr. 2000, vol.34, no.2, p.143-148. ISSN 0034-8910.
OBJETIVO: Acompanhar a evoluo da prtica do aleitamento materno na clientela de maternidade e
avaliar as aes para sua promoo. MTODOS: Foram comparadas duas coortes de crianas nascidas em
pocas diferentes em hospital de Porto Alegre, RS, quanto s prevalncias do aleitamento materno nos
primeiros seis meses de vida das crianas bem como as taxas de interrupo precoce da amamentao. Os
dois estudos foram prospectivos, envolvendo 202 crianas na coorte de 1987 e 187 na de 1994, todas
saudveis, com peso de nascimento igual ou superior a 2.500 g, tendo iniciado o aleitamento materno e
cujos pais morassem juntos. O acompanhamento foi realizado atravs de correspondncia, no estudo de
1987, e de visitas domiciliares, no estudo de 1994. RESULTADOS: As curvas de sobrevida do aleitamento
materno revelaram que o percentual de crianas amamentadas ao longo dos primeiros seis meses foi
semelhante nas duas coortes. A prevalncia do aleitamento materno exclusivo, apesar de baixa nos dois
grupos, foi superior na populao de 1994, especialmente entre as crianas cujas mes tinham maior
escolaridade. No houve diferena no ndice de interrupo precoce entre as duas coortes (36% na coorte
de 1987 e 39% na de 1994). CONCLUSES: Os resultados apontam para uma apatia do servio com
relao promoo do aleitamento materno no perodo estudado, justificando plenamente o investimento
na promoo da amamentao, especialmente nas famlias menos privilegiadas.
Palavras-chave: Aleitamento materno; Desmame; Promoo da sade; Fatores socioeconmicos;
Maternidades; Leite humano; Lactao.

LERARIO, Daniel D G, GIMENO, Suely G, FRANCO, Larcio J et al. Excesso de peso e gordura
abdominal para a sndrome metablica em nipo-brasileiros. Rev. Sade Pblica, fev. 2002, vol.36,
no.1, p.4-11. ISSN 0034-8910.
OBJETIVO: A obesidade, especialmente de distribuio abdominal, associa-se a fatores de risco
cardiovasculares como a dislipidemia, a hipertenso arterial (HA) e o diabetes mellitus (DM). A importncia
desses fatores em nipo-brasileiros foi previamente demonstrada, apesar de a obesidade no ser
caracterstica marcante dos migrantes japoneses. Realizou-se estudo com o objetivo de avaliar a prevalncia
de excesso de peso e a adiposidade central (AC) em nipo-brasileiros e suas relaes com distrbios
metablicos. MTODOS: A amostra incluiu 530 nipo-brasileiros (40-79 anos) de primeira e segunda
geraes, submetidos a medidas antropomtricas de presso arterial, perfil lipdico e teste oral de tolerncia
glicose. A prevalncia (por ponto e intervalo de confiana) de excesso de peso foi calculada pelo valor de
corte >26,4 kg/m2. O diagnstico de AC foi baseado na razo entre as circunferncias da cintura e do
quadril (RCQ), sendo que valores 0,85 e 0,95, para mulheres e homens, respectivamente, firmavam
esse diagnstico. RESULTADOS: A prevalncia de excesso de peso foi de 22,4% (IC95% 20,6-28,1), e a
de AC, de 67,0% (IC95%
63,1-70,9). Alm de maiores prevalncias de DM, HA e dislipidemia,
estratificando-se pelo ndice de massa corporal (IMC) e RCQ, indivduos com excesso de peso e adiposidade
central apresentaram pior perfil metablico: a presso arterial foi significantemente maior naqueles com
excesso de peso, sem e com AC; indivduos com AC apresentaram maiores ndices de glicemia,

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

83

triglicerdeos, colesterol total e LDL e menor HDL quando comparados aos sem excesso de peso e sem AC; a
insulinemia de jejum foi significantemente maior em indivduos com excesso de peso (sem e com AC) do
que naqueles sem excesso de peso e sem AC. CONCLUSO: A comparao de subgrupos com e sem
adiposidade central foi compatvel com a hiptese de que a deposio abdominal de gordura representa
fator de risco para doenas interligadas pela resistncia insulina, inclusive em populao de origem
oriental. A alta prevalncia de sndrome metablica nos migrantes japoneses pode ser decorrente da
deposio visceral de gordura, implicada na gnese da resistncia insulina.
Palavras-chave: Obesidade [epidemiologia]; Prevalncia; Presso arterial; Diabetes mellitus;
Hiperlipidemia; Resistncia insulina; Fatores de risco; ndice de massa corporal; Pesos e medidas
corporais; Migrao; Antropometria; Abdome; Adiposidade central.

FORNES, Nlida Schmid de, MARTINS, Ignez Salas, VELASQUEZ-MELENDEZ, Gustavo et al. Escores de
consumo alimentar e nveis lipmicos em populao de So Paulo, Brasil. Rev. Sade Pblica, fev.
2002, vol.36, no.1, p.12-18. ISSN 0034-8910.
OBJETIVO: Analisar o padro de consumo alimentar avaliado por meio de escores de consumo e relacionar
esses escores com os nveis de colesterol total e de lipoprotenas de baixa e alta densidades em populao
da rea metropolitana de So Paulo. MTODOS: Estudo transversal realizado no municpio de Cotia, So
Paulo, em amostra representativa de 1.045 adultos, foram determinados nveis de lipdeos sricos e a
ingesto de alimentos por meio da freqncia de consumo alimentar. Foram utilizados escores de padro de
consumo, estabelecendo um peso para cada categoria de consumo baseado na freqncia anual, obtendose, assim, a distribuio quintilar do escore I (alimentos considerados de risco para doenas
cardiovasculares) e escore II (alimentos protetores). Foram comparados os valores mdios das lipoprotenas
para cada um dos quintis pela anlise de varincia, e foram verificadas possveis relaes entre os escores
de consumo e as fraes de lipdeos sricos, mediante modelos de regresso linear mltipla (stepwise
forward). RESULTADOS: Observou-se aumento significativo dos nveis mdios de lipdeos, segundo quintis
de consumo do escore I para colesterol total e para lipoprotena de baixa densidade-colesterol, e constatouse um comportamento inverso e significativo dos nveis desses lipdeos sricos em relao ao escore II. O
escore I correlacionou-se positivamente e significativamente a esses lipdeos, e o escore II apresentou
correlao inversa e significativa com esses constituintes sangneos. CONCLUSES: Em estudos
populacionais, a anlise da freqncia de consumo de alimentos por meio de escores pode ser um mtodo
de escolha para avaliar qualidade de dieta e de seu potencial efeito nos nveis sricos de colesterol total e
de lipoprotenas de baixa densidade.
Palavras-chave: Consumo de alimentos; Lipdios [sangue]; Colesterol [sangue]; Lipoprotenas; Gorduras
na dieta; Hiperlipidemia; Lipoprotenas do colesterol HDL [sangue]; Lipoprotenas do colesterol LDL
[sangue]; Doenas cardiovasculares; Escores.

MONTEIRO, Carlos Augusto, BENICIO, Maria Helena D'Aquino e ORTIZ, Luiz Patricio. Tendncia secular
do peso ao nascer na cidade de So Paulo (1976-1998). Rev. Sade Pblica, dez. 2000, vol.34, no.6,
supl, p.26-40. ISSN 0034-8910.
OBJETIVO: Resgatar a tendncia secular da distribuio do peso ao nascer na cidade de So Paulo, SP,
bem como examinar suas possveis causas, com base em dados coletados por dois inquritos domiciliares
sobre condies de sade na infncia realizados em 1984/85 e em 1995/96, complementados por
informaes procedentes de levantamento de pronturios de maternidades e por informaes do Sistema
Estadual de Declaraes de Nascidos Vivos. MTODOS: Os inquritos domiciliares estudaram amostras
probabilsticas da populao infantil de So Paulo com idade inferior a cinco anos (n=1.016 em 1984/85;
n=1.280 em 1995/96). O levantamento de pronturios estudou uma amostra probabilstica dos partos
ocorridos nas maternidades da cidade no ano de 1976 (n=5.734). As declaraes de nascidos vivos referemse s coortes de crianas nascidas na cidade entre 1993 e 1998 (cerca de 200 mil crianas por ano). O
estudo da distribuio social do peso ao nascer levou em conta a renda familiar per capita e a escolaridade
materna. A estratgia analtica para estudar os determinantes da tendncia secular do peso ao nascer
empregou modelos hierrquicos de causalidade, anlises multivariadas de regresso e procedimentos
anlogos aos utilizados para calcular riscos atribuveis populacionais. RESULTADOS/CONCLUSES: A
FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.
Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

84

distribuio do peso ao nascer na cidade de So Paulo (mdia de 3.160 g com 8,9% de pesos <2.500 g)
inferior quela esperada quando so timas as condies do crescimento fetal (mdia de 3.400-3.500 g com
cerca de 4-5% de pesos <2.500 g). Essa distribuio pouco se modificou nos ltimos 22 anos (1976-1998).
Entretanto, no perodo, h evidncias de evoluo desigual do peso ao nascer segundo o nvel
socioeconmico (NSE) da populao. Nos estratos de baixo NSE, a evoluo tem sido favorvel e isso se
deve, aparentemente, ao melhor desempenho do crescimento intra-uterino, o qual poderia decorrer de
melhorias em condies econmicas, no peso e na altura das gestantes, na assistncia pr-natal e,
possivelmente, do declnio no hbito de fumar. Nos estratos de alto NSE, a evoluo do peso ao nascer tem
sido desfavorvel devido, aparentemente, ao aumento na freqncia de recm-nascidos prematuros,
tendncia provocada por fatores ainda no conhecidos.
Palavras-chave: Levantamentos epidemiolgicos; Peso ao nascer [tendncias]; Fatores socioeconmicos;
Escolaridade; Renda familiar; Prematuro; Tabagismo; Sries de tempo.

MONTEIRO, Carlos Augusto, SZARFARC, Sophia Cornbluth e MONDINI, Lenise. Tendncia secular da
anemia na infncia na cidade de So Paulo (1984-1996). Rev. Sade Pblica, dez. 2000, vol.34,
no.6, supl, p.62-72. ISSN 0034-8910.
OBJETIVO: Estimar a prevalncia e a distribuio social da anemia na infncia, estabelecer a tendncia
secular dessa enfermidade e analisar sua determinao, com base em dados coletados por dois inquritos
domiciliares realizados na cidade de So Paulo, SP, em 1984/85 e em 1995/96. MTODOS: Os inquritos
estudaram amostras probabilsticas da populao residente na cidade com idade entre zero e 59 meses
(1.016 em 1984/85 e 1.280 em 1995/96). Amostras de sangue capilar obtidas por punctura digital foram
coletadas nos dois inquritos e analisadas com relao concentrao de hemoglobina. O diagnstico da
anemia correspondeu a concentraes inferiores a 11 g/dL. O estudo da distribuio social da anemia levou
em conta tercis da renda familiar per capita em cada um dos inquritos. A estratgia analtica para estudar
os determinantes da evoluo da prevalncia da anemia na populao empregou modelos hierrquicos de
causalidade, anlises multivariadas de regresso e procedimentos anlogos aos utilizados para calcular
riscos atribuveis populacionais. RESULTADOS/CONCLUSES: Houve entre os inquritos reduo
significativa na concentrao mdia de hemoglobina (de 11,6 g/dL para 11,0 g/dL) e aumento significativo
na prevalncia de anemia (de 35,6% para 46,9%). Essa evoluo desfavorvel foi observada em ambos os
sexos, em todas as faixas etrias e em todos os estratos econmicos da populao. A evoluo tendeu a ser
ainda mais desfavorvel para o tero mais pobre das crianas da cidade, o que determinou o agravamento
das desvantagens desse estrato frente aos demais. Determinantes distais (renda familiar e escolaridade
materna) e proximais (tipo de aleitamento) da anemia evoluram favoravelmente entre os inquritos e,
assim, no puderam explicar o aumento da enfermidade. A estabilidade apurada quanto densidade de
ferro na dieta, em valores inferiores s necessidades, justifica a elevada prevalncia da enfermidade, mas
no explica seu aumento.
Palavras-chave: Anemia [epidemiologia]; Levantamentos epidemiolgicos; Inquritos nutricionais; Anemia
ferropriva; Hemoglobinas [deficincia]; Aleitamento materno; Fatores socioeconmicos; Sries de tempo;
Criana.

MONTEIRO, Paulo Orlando Alves, VICTORA, Cesar G, BARROS, Fernando C et al. Diagnstico de
sobrepeso em adolescentes: estudo do desempenho de diferentes critrios para o ndice de
Massa Corporal. Rev. Sade Pblica, out. 2000, vol.34, no.5, p.506-513. ISSN 0034-8910.
OBJETIVO: Pela simplificao da triagem para obesidade na adolescncia, avaliou-se o desempenho de
diferentes pontos de corte para o ndice de Massa Corporal (IMC) em uma coorte populacional nascida em
1982, em Pelotas, no sul do Brasil. MTODOS: Foram estudados 493 adolescentes, com idades de 15 a 16
anos, residentes na zona urbana de Pelotas, RS. A obesidade foi definida pelo percentil 85 de IMC mais o
percentil 90 das dobras cutneas tricipital e subescapular, conforme a Organizao Mundial da Sade
(OMS). Diversos pontos de corte para sobrepeso tiveram sua sensibilidade e especificidade avaliadas.
RESULTADOS: Nos meninos, o IMC 25 kg/m apresentou sensibilidade superior a 90% e 5% de falsopositivos. O critrio proposto para adolescentes brasileiros apresentou sensibilidade de 100%, mas os falso-

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

85

positivos chegaram a 23%. Nas meninas, os pontos de corte coincidiram, apresentando sensibilidade
superior a 90%, com at 13% de falso-positivos. Pontos de corte mais altos foram testados, porm pouco
melhoraram a especificidade, que foi acompanhada de reduo na sensibilidade. CONCLUSES: O
IMC 25 kg/m mostrou o melhor desempenho na deteco de obesidade, parecendo adequado para
triagem de adolescentes de ambos os sexos com 15 anos ou mais. Tem a vantagem de ser nico, de fcil
determinao e compatvel com o ponto de corte recomendado pela OMS para adultos. Dispensa o uso de
valores de IMC especficos para idade, sexo e medida de dobras cutneas, sendo, portanto, recomendvel
para uso em servios de sade.Palavras-chave: Adolescncia; Obesidade [diagnstico]; ndice de Massa
Corporal; Sensibilidade e especificidade; Dobras cutneas; Peso corporal; Sobrepeso.
Palavras-chave: Adolescncia; Obesidade [diagnstico]; ndice de Massa Corporal; Sensibilidade e
especificidade; Dobras cutneas; Peso corporal; Sobrepeso.

OTERO, Ubirani Barros, ROZENFELD, Suely, GADELHA, Angela Maria Jourdan et al. Mortalidade por
desnutrio em idosos, regio Sudeste do Brasil, 1980-1997. Rev. Sade Pblica, abr. 2002, vol.36,
no.2, p.141-148. ISSN 0034-8910.
OBJETIVO: Conhecer a freqncia da desnutrio como causa de morte na populao idosa. MTODOS:
Foram selecionados indivduos com 60 anos ou mais de ambos os sexos, dos municpios da regio Sudeste,
entre 1980 e 1997. As fontes de dados foram o registro de bitos do Sistema de Informao Sobre
Mortalidade (1980-1998) e a populao estimada pelo Centro de Desenvolvimento e Planejamento Regional
(Cedeplar). Para classificao dos bitos, empregou-se a CID-9 (260 a 263.9), para os anos de 1980 at
1995, e a CID-10 (E40 a E46), para os anos mais recentes. RESULTADOS: No Brasil, entre 1980 e 1997,
ocorreram 36.955 bitos por desnutrio em idosos. A regio Sudeste concentrou o maior nmero
23.968
(64,9%)
dentre as demais regies brasileiras. No Estado de So Paulo, ocorreram 11.067 bitos por
desnutrio em idosos, e, no Rio de Janeiro, 7.763, obtendo, esses dois estados em conjunto, os maiores
valores da regio. maior a proporo de bitos e maiores os coeficientes de mortalidade em indivduos de
70 anos ou mais do que em indivduos da faixa etria de 60 a 69 anos, independentemente do sexo.
CONCLUSO: Os resultados preliminares do estudo levantam algumas questes: o papel da desnutrio
como causa associada; a tendncia de aumento dos bitos por desnutrio na velhice; o comportamento
diferenciado entre estados da mesma regio. Anlises estatsticas do tipo sries-temporais possivelmente
conseguiriam explicar melhor os fenmenos apontados. Ser preciso aprofundar o estudo do papel da
desnutrio na populao com 60 anos ou mais para estabelecer estratgias de interveno adequadas.
Palavras-chave: Mortalidade; Idoso; Transtornos nutricionais; Atestados de bito; Causa bsica da morte;
Coeficiente de mortalidade; Distribuio espacial; Desnutrio.

PRADO, Matildes da Silva, ASSIS, Ana Marlcia Oliveira, MARTINS, Maisa Cruz et al. Hipovitaminose A em
crianas de reas rurais do semi-rido baiano. Rev. Sade Pblica, ago. 1995, vol.29, no.4, p.295-300.
ISSN 0034-8910.
Objetivou-se avaliar a distribuio e a magnitude da deficincia de vitamina A e o consumo diettico de 161
crianas de 6 a 72 meses de idade, de reas rurais do Municpio de Cansano-Bahia, Brasil. Os nveis de
retinol srico foram medidos pelo mtodo espectrofotomtrico (Bessey-Lowry modificado por Arajo e
Flores, 1978). A mdia do retinol srico distribuiuse homogeneamente entre as diferentes faixas etrias.
Nveis inadequados de retinol srico (deficiente <10,0 g/dl e baixos <20,0 g/dl) foram detectados em
44,7% das crianas, caracterizando a deficincia como problema de sade pblica. Os nveis de retinol
srico no mostraram associao estatisticamente significante com sexo e idade das crianas, contudo as
menores de 24 meses apresentaram prevalncia mais alta de nveis inadequados. A principal fonte de
vitamina A, disponvel para essas crianas, representada pelos carotenides, em especial beta-caroteno.
Foi observada maior diversificao no consumo dos alimentos de contedos moderado e baixo em vitamina
A no grupo de 24 a 72 meses de idade, sem contudo assegurar nveis adequados de retinol srico para este
grupo etrio.
Palavras-chave: Deficincia de Vitamina A [epidemiologia]; Inquritos sobre dieta; Populao rural.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

86

SOUZA JUNIOR, Paulo Roberto Borges de, SZWARCWALD, Clia Landmann, BARBOSA JUNIOR, Aristides et
al. Infeco pelo HIV durante a gestao: estudo-Sentinela Parturiente, Brasil, 2002. Rev. Sade
Pblica, dez. 2004, vol.38, no.6, p.764-772. ISSN 0034-8910.
OBJETIVO: Avaliar a cobertura efetiva da deteco da infeco pelo HIV durante a gestao, em mbito
nacional. MTODOS: A cobertura efetiva do teste de HIV na gestao foi definida como a proporo de
gestantes que teve atendimento pr-natal (pelo menos uma consulta), pedido de teste de HIV e
conhecimento do resultado antes do parto, sendo estimada por processo de amostragem, utilizando-se as
informaes coletadas no Estudo-Sentinela Parturiente, 2002. As desigualdades da cobertura efetiva foram
analisadas por: grande regio; tamanho populacional do municpio de ocorrncia do parto; e grau de
instruo da me. RESULTADOS: A cobertura efetiva do teste de HIV durante a gestao foi estimada em
52%. As enormes desigualdades socioespaciais ficaram evidenciadas na comparao entre as regies
Nordeste (24%) e Sul (72%); entre parturientes analfabetas (19%) com as que tm o ensino fundamental
completo (64%); entre as que realizaram o parto em municpios pequenos (36%) com as que o realizaram
em municpios com mais de 500 mil habitantes (66%). As recomendaes do Ministrio da Sade foram
atendidas, completamente, por somente 27% parturientes. CONCLUSES: Os resultados estabelecem a
necessidade de haver medidas voltadas para maior cobertura da deteco do HIV na gestao, e indicam
que os programas do Programa Nacional de DST e Aids e os programas de sade da mulher devem ser
intensificados, com estratgias conjuntas entre eles.
Palavras-chave: Infeces por HIV, diagnstico; Transmisso vertical de doena; Efetividade; Distribuio
espacial; Fatores socioeconmicos; Cuidado pr-natal; Vigilncia de evento sentinela.
TUYNS AJ, Pequignot G, Jensen OM. Esophageal cancer in Ille-et-Vilaine in relation to levels of
alcohol and tobacco consumption. Risks are multiplying. Bull Cancer. 1977;64(1):45-60.
A retrospective case-control study of 200 male cases of oesophageal cancer and 778 population controls has
been carried out in Ille-et-Vilanine (France). The logarithms of the relative risks of developing the disease
increase linearly with daily consumption of alcohol and tobacco independently. The combined effect of both
fit with a multiplicative model which is proposed. This model could be applicable to other situations. It
explains the sex ratio and the urban/rural differences observed in Ille-er-Vilaine. The practical implications
for public health purposes are briefly discussed.

VELASQUEZ-MELENDEZ, Gustavo, KAC, Gilberto, VALENTE, Joaquim Gonalves et al. Evaluation of waist
circumference to predict general obesity and arterial hypertension in women in Greater
Metropolitan Belo Horizonte, Brazil. Cad. Sade Pblica, May/June 2002, vol.18, no.3, p.765-771. ISSN
0102-311X.

Avaliou-se a capacidade que a Circunferncia da Cintura (CC) tem em identificar valores de IMC 25
(sobrepeso) e 30 (obesidade) a partir de nveis de ao recomendados internacionalmente. Setecentas e
noventa e uma mulheres entre 15-59 anos foram recrutadas. Foram calculadas a sensibilidade e a
especificidade no diagnstico de sobrepeso e obesidade e a sensibilidade e especificidade na predio da
hipertenso, a partir de valores de CC. As associaes foram testadas por anlise de regresso linear e
regresso logstica controlando para o efeito de fatores de confuso. A CC 80 e 88cm discriminou
corretamente 89,8% de mulheres com IMC 25 e 88,5% com IMC 30. A obesidade abdominal (CC
88cm) esteve associada significativamente com a hipertenso na anlise multivariada (OR = 2,88, IC
95%: 1,77-4,67). A hipertenso foi identificada com sensibilidade de 63,8 e 42,8% e especificidade de 68,0
e 83,3% para CC 80 e 88, respectivamente. A obesidade abdominal nos pontos de corte propostos pode
discriminar adequadamente indivduos em risco de se tornarem obesos, no entanto, apresenta um poder
apenas moderado para discriminar indivduos com nveis pressricos .
Keywords: Obesidade; Sade da Mulher; Quadril; Hipertenso; ndice de Massa Corporal.

FSP/USP - Programa de Vero 2005: Introduo Bioestatstica.


Denise Pimentel Bergamaschi, Jos Maria P de Souza, Patrcia Emlia Braga

87

Você também pode gostar