Você está na página 1de 129

Populao, amostra, varivel, coleta de dados, apurao de dados e apre-

sentao tabular.

A palavra estatstica vem do latim status e significa estado. Inicialmente, era utilizada para compilar
dados que descreviam caractersticas de pases (Estados). Em 1662, John Graunt publicou estatsticas
de nascimentos e mortes. A partir de ento, o estudo dos eventos vitais e da ocorrncia de doenas e
bitos impulsionou o desenvolvimento da Estatstica nos campos terico e aplicado (Triola, 1999).

Atualmente, ndices e indicadores estatsticos fazem parte do dia a dia, tais como taxa de inflao,
ndice de desemprego, taxa de natalidade, taxa de crescimento populacional, ndice de poluio at-
mosfrica, ndice de massa corporal, entre outros.

Estatstica: uma coleo de mtodos para planejar experimentos, obter e organizar dados, resumi-
los, analis-los, interpret-los e deles extrair concluses (Triola, 1999).

Bioestatstica Estatstica aplicada s cincias da vida.

Nveis de mensurao

Escala nominal
Os indivduos so classificados em categorias segundo uma caracterstica.
Ex: sexo (masculino, feminino), hbito de fumar (fumante, no fumante), sobrepeso (sim, no).

No existe ordem entre as categorias e suas representaes, se numricas, so destitudas de signifi-


cado numrico.
Ex: sexo masculino=1, sexo feminino = 2.
Os valores 1 e 2 so apenas rtulos.

Escala ordinal
Os indivduos so classificados em categorias que possuem algum tipo inerente de ordem. Neste caso,
uma categoria pode ser "maior" ou "menor" do que outra.

Ex: nvel scio-econmico (A, B, C e D; onde A representa maior poder aquisitivo);


nvel de retinol srico (alto, aceitvel, baixo, deficiente) onde alto: maior ou igual a 50,0
g/dl; aceitvel: 20,0 a 49,9 g/dl; baixo: 10,0 a 19,9 g/dl; deficiente: menor ou igual a 10,0
g/dl. Estes critrios so do Commitee on Nutrition for National Defense ICNND/USA, 1963 (in
Prado MS et al, 1995).

Embora exista ordem entre as categorias, a diferena entre categorias adjacentes no tem o mesmo
significado em toda a escala.

Escala numrica intervalar


Este nvel de mensurao possui um valor zero arbitrrio.
Ex: temperatura em graus Celsius.

Escala numrica de razes possui zero inerente natureza da caracterstica sendo aferida.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 1


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Escala de razes discreta: o resultado numrico da mensurao um valor inteiro.
Ex: nmero de refeies em um dia (nenhuma, uma, duas, trs, quatro, ...),
frequncia de consumo semanal de determinado alimento (1 vez, 2 vezes, 3 vezes, 4 vezes, 5
vezes, 6 vezes, 7 vezes) .

Escala de razes contnua: o resultado numrico um valor pertencente ao conjunto dos nmeros
reais R ={-; ...; 0; 0,2; 0,73; 1; 2,48;...; +}.
Ex: idade (anos), peso (g), altura (cm),nvel de retinol srico (g/dl), circunferncia da cintura
(cm).

Comparando-se as escalas intervalar e de razes contnua


0 0
material C F |dif0C| |dif 0F| dif0C/dif0F razo0C razo0F Razo0C/razo0F
A 20 68 |A-B|=20 |A-B|=36 0,56 A/B=0,50 A/B=0,65 0,77
B 40 104 |B-C|=20 |B-C|=36 0,56 B/C=0,67 B/C=0,74 0,91
C 60 140 |A-C|=40 |A-C|=72 0,56 A/C=0,33 A/C=0,49 0,67

comprimento cm polegada |difcm| |dif pol| Difcm/difpol Razocm Razopol Razocm/razopol


A 20 50,8 |A-B|=15 |A-B|=38,1 0,394 A/B=0,571 A/B=0,571 1
B 35 88,9 |B-C|=5 |B-C|=12,7 0,394 B/C=0,875 B/C=0,875 1
C 40 101,6 |A-C|=20 |A-C|=50,8 0,394 A/C=0,5 A/C=0,5 1

De acordo com os nveis de mensurao, pode-se classificar a natureza das variveis segundo a
escala de mensurao em:
nominal
qualitativa
ordinal
VARIVEL:

quantitativa discreta

contnua

O tipo da varivel ir indicar a melhor forma para o dado ser apresentado em tabelas e
grficos, em medidas de resumo e, a anlise estatstica mais adequada.

Exemplo 1 -Classificar quanto a natureza, as seguintes variveis


Varivel Tipo (natureza)
Condio de sade (doente, no doente)
Tipo de parto (normal, cesreo)
Nvel de colesterol srico (mg/100cc)
Tempo de um procedimento cirrgico (minutos)
Nmero de praias consideradas poludas
Custo do procedimento (reais)
Peso (g)
Estado nutricional (desnutrio, eutrofia, sobrepeso, obesidade)
Consumo de energia (Kcal)
Realizao da refeio caf da manh (sim/no)
Nmero de escolares por srie
Realizao de atividade fsica diria (sim/no)
Tempo assistindo TV/dia (< 2h, 2 a 4h, >4h)
Pores consumidas por grupo de alimentos
Percentual de gordura corporal (%)

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 2


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Coleta de dados
a observao e registro da categoria ou medida de variveis relacionadas ao objeto de estudo que
ocorrem em unidades (indivduos) de uma amostra ou populao.

Tpicos iniciais de amostragem

Populao: totalidade de elementos sob estudo. Apresentam uma ou mais caractersticas em comum.
Supor o estudo sobre a ocorrncia de sobrepeso em crianas de 7 a 12 anos no Municpio de So
Paulo.
Populao alvo todas as crianas nesta faixa etria deste municpio.
Populao de estudo crianas matriculadas em escolas.

Elementos: so unidades de anlise; podem ser pessoas, domiclios, escolas, creches, clulas ou qual-
quer outra unidade.

Amostra: uma parte da populao de estudo.

Amostragem: processo para obteno de uma amostra. Tem como objetivo estimar parmetros popu-
lacionais.

Parmetro: Quantidade fixa de uma populao.


Ex: peso mdio ao nascer de crianas que nascem no municpio de So Paulo ( = 3100 g);

Proporo de crianas de 7 a 12 anos classificadas como obesas, no municpio de So Paulo


( = 12%).

Estimador: uma frmula matemtica que permite calcular um valor (estimador por ponto) ou com
um conjunto de valores (estimador por intervalo) para um parmetro.
N

X
i =1
i
Ex: Mdia aritmtica: X = ,
N
N

onde X
i =1
i = X 1 + X 2 + ... + X N e N = nmero de observaes.

Estimativa: Valor do estimador calculado em uma amostra. Estima o valor do parmetro.

Ex: Peso mdio ao nascer, calculado em uma amostra de 120.000 crianas nascidas no Municpio de
So Paulo no ano de 2000: mdia amostral = x = 3000 g .

Indicaes para utilizar uma amostra


Populao muito grande
Processo destrutivo de investigao
Novas terapias

Vantagens de realizar um estudo com amostragem:


Menor custo
Menor tempo para obteno dos resultados
Possibilidade de objetivos mais amplos
Dados possivelmente mais fidedignos

Desvantagens
Resultados sujeitos variabilidade

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 3


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Tipos de Amostragem

Probabilstica: cada unidade amostral tem probabilidade conhecida e diferente de zero de pertencer
amostra. usada alguma forma de sorteio para a obteno da amostra.

No probabilstica: no se conhece a probabilidade de cada unidade amostral pertencer amostra.


Algumas unidades tero probabilidade zero de pertencer amostra.
Ex: amostragem intencional; por voluntrios; acesso mais fcil; por quotas.

Tipos de amostragem probabilstica:


- aleatria simples (com e sem reposio);
- sistemtica;
- com partilha proporcional ao tamanho do estrato;
- por conglomerado.

Amostragem aleatria simples (AAS)


o processo de amostragem onde qualquer subconjunto de n elementos diferentes de uma popula-
o de N elementos tem mesma probabilidade de ser sorteado (NN, 1998). Tamanho da populao:
N; tamanho da amostra: n; frao global de amostragem ou probabilidade de sortear um indivduo =
n
.
N
necessrio ter um sistema de referncia que contenha todos os elementos da populao
da qual ser retirada a amostra;
Utilizao da tabela de nmeros aleatrios mecnica;
Utilizao de programas computacionais.

Exemplo 2 -Os dados a seguir so de peso (kg) de 80 mulheres identificadas pela varivel id (identi-
ficao).
Id Peso Id peso Id Peso Id Peso Id Peso Id Peso
1 65 16 71 31 70 46 75 61 68 76 75
2 65 17 84 32 72 47 79 62 69 77 79
3 58 18 63 33 75 48 79 63 76 78 73
4 59 19 64 34 76 49 82 64 77 79 82
5 67 20 65 35 77 50 83 65 80 80 76
6 68 21 74 36 78 51 65 66 81
7 74 22 81 37 80 52 68 67 59
8 81 23 66 38 82 53 75 68 64
9 66 24 69 39 63 54 76 69 70
10 61 25 71 40 66 55 78 70 80
11 64 26 71 41 72 56 78 71 85
12 65 27 72 42 72 57 81 72 70
13 67 28 73 43 72 58 85 73 71
14 68 29 75 44 73 59 66 74 72
15 70 30 77 45 73 60 68 75 72
Fonte: Osborn JF. Statistical Exercises in Medical Research. John Wiley & Sons Inc., 1979. (adaptado).

a) Sorteie uma amostra aleatria de tamanho 20 utilizando a tabela dos nmeros equiprovveis.
b) Apresente os valores do peso dos indivduos sorteados.
c) Some os valores e divida pelo tamanho da amostra (nmero de valores).
d) Este valor o parmetro, o estimador ou a estimativa do peso mdio?

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 4


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Amostragem sistemtica
Utiliza-se a ordenao natural dos elementos da populao (pronturios, casa, ordem de nascimento).
N
Intervalo de amostragem k= , onde N= tamanho da populao e n = tamanho da amos-
n
tra
Incio casual i, sorteado entre 1 e k, inclusive
Amostra sorteada composta pelos elementos: i, i+k, i+2k, ...., i+(n-1)k

OBS: necessrio ter cuidado com a periodicidade dos dados, por exemplo se for feito sorteio de dia
no ms, pode cair sempre em um domingo onde o padro de ocorrncia do evento pode ser diferen-
te.
N 80
Exemplo: N=80; n=10; k= = = 8 ; incio casual: 1 i 8
n 10
Comeo casual sorteado: i=4
Amostra composta dos elementos:
i .............. 4
i+k .. 12
i+2k . 20
i+3k . 28
i+4k . 36
i+5k . 44
i+6k . 52
i+7k . 60
i+8k ... 68
i+(n-1)k . 76

Se o intervalo de amostragem no for inteiro proceder da seguinte forma:


N 321
N= 321 ; n=154; K = = = 2,084
n 154
i deve ser um nmero sorteado entre 1 e 2,084
Sortear um nmero entre 1000 e 2084 e dividir o resultado por 1000
Nmero sorteado = 1941, portanto i=1,941
Indivduos:
elemento
I 1,941 1
i+k 1,941+2,084 = 4,025 4
i+2k 1,941+4,1680 = 6,109 6
i+3k 1,941+6,252 = 8,193 8
. . .
. . .
. . .
i+(n-1)k 1,941+318,852 = 320,793 320

Exemplo 3 Utilize os dados do Exemplo 2.


a) Sorteie uma amostra sistemtica de tamanho 20. Indique o intervalo de amostragem e o co-
meo casual sorteado. Indique o nmero de identificao de cada elemento da amostra.
b) Some os valores e divida pelo tamanho da amostra (nmero de valores).
c) Compare com o peso mdio obtido no exemplo 2. Voc esperaria o mesmo resultado? Justifi-
que.
d) Qual dos dois valores voc diria que representa melhor o conjunto de dados? Justifique.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 5


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Amostragem casual simples estratificada com partilha proporcional

A populao possui estratos com tamanhos:


N1; N2; N3, onde a soma dos estratos o tamanho da populao, ou seja N i =N

A amostra deve conter os elementos da populao nas mesmas propores dos estratos. Tem-se que
os tamanhos dos estratos amostrais so n1, n2 e n3 tal que n i =n

Aplicando-se a proporo:
ni N i N
= ni = n i
n N N
Exemplo:
N=500; N1=50; N2=150; N3=300 e n=40

Tamanho do estrato ni N i
Estrato i na populao na amostra =
Ni ni
n N
1 50 4 0,1
2 150 12 0,3
3 300 24 0,6
Total 500 40

50 150 300
n1 = 40 = 4 ; n2 = 40 = 12 ; n3 = 40 = 24
500 500 500

Amostragem por conglomerado:

O conglomerado um conjunto de elementos formando uma unidade amostral. Se a unidade amos-


tral for indivduo e forem sorteados domiclios, ento a amostragem por conglomerado.

Exemplo 4
Cite dois exemplos de amostragens por conglomerado.

Apurao de dados

Processo no qual conta-se o nmero de vezes que a varivel assumiu um determinado valor (frequn-
cia de ocorrncia). Pode ser manual, mecnica ou eletrnica (programas estatsticos: Epi info, Stata,
Excel, SPSS, SAS, R, S-Plus).

Distribuio de frequncias - correspondncia entre categorias (valores) e frequncia de ocorrncia.

Distribuio de frequncias com dados pontuais e em intervalos de classe

Notao:
X : varivel
xi : valor observado para o indivduo i

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 6


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Apresentao pontual
Ex: 9 indivduos
X: nmero de refeies dirias
x: 2, 3, 3, 1, 5, 2, 3, 2, 3
Apurao:
nmero de refeies frequncia absoluta
1 1
2 3
3 4
5 1

X: idade (anos inteiros)


x: 5, 5, 15, 20, 20, 20, 21, 21, 22, 22
idade frequncia
5 2
15 1
20 3
21 2
22 2

X: peso ao nascer em gramas


X: 2250, 3025, 1600, 2725, 3750, 3950, 2400, 2180, 2520
peso frequncia
1600 1
2180 1
2250 1
2400 1
2520 1
2725 1
3025 1
3750 1
3950 1

Altura em metros
X: 1,63; 1,60; 1,59; 1,60; 1,45; 1,73; 2,05; 1,85
altura frequncia
1,45 1
1,59 1
1,60 2
1,63 1
1,73 1
1,85 1
2,05 1

Apresentao tabular

Elementos essenciais: ttulo, corpo, cabealho e coluna indicadora.


Tabela 1 - Ttulo: o que (natureza do fato estudado)?como (variveis)?onde? quando?
Varivel n %

Total
Fonte
notas, chamadas

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 7


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
OBS: nenhuma casela (interseco entre linha e coluna) deve ficar em branco.

A tabela deve ser uniforme quanto ao nmero de casas decimais e conter os smbolos ou 0 quando
o valor numrico nulo e ... quando no se dispe do dado.

Exemplo:
Distribuio de crianas(1) segundo nveis sricos de retinol. Cansao Bahia, 1992
Nvel de retinol srico(2) n %

Aceitvel 89 55,3
Baixo 65 40,4
Deficiente 7 4,3
Total 161 100
(1)
24 72 meses
(2)
aceitvel: 20,0 49,9 g/dl; baixo: 10,0 19,9 g/dl; deficiente: <10,0 g/dl
Fonte: Prado MS et al., 1995.

Apresentao tabular de varivel quantitativa contnua

Como idade varivel quantitativa contnua, a melhor forma de apresent-la em tabelas utilizando
intervalos de valores denominados intervalos de classe.
Ex:
x: 5, 5, 15, 20, 20, 20, 21, 21, 22, 22
idade frequncia %
5 |-- 10 2 20
10 |-- 15 0 -
15 |-- 20 1 10
20 |-- 25 7 70
Total 10 100

Intervalos de classe: conjunto de observaes contidas entre dois valores limite (limite inferior e limite
superior).

Representao:
5 | -- 10 intervalo fechado no limite inferior e aberto no limite superior (con-
tm o valor 5 mas no contm o valor 10)
5 -- 10 intervalo aberto nos limites inferior e superior
(no contm os valores 5 e 10)
5 |-- | 10 intervalo fechado nos limites inferior e superior
(contm os valores 5 e 10)

OBS: Representar o intervalo 0 |-- | 11 meses equivalente a represent-lo como 0 |-- 12 meses.

X: peso (g)
X: 2250, 3025, 1600, 2725, 3750, 3950, 2400, 2180, 2520, 2530

Peso (g) frequncia %


1500|--2000 1 10
2000|--2500 3 30
2500|--3000 3 30
3000|--3500 1 10
3500|--4000 2 20
Total 10 100

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 8


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
X: Altura (cm)
X: 1,63; 1,60; 1,59; 1,60; 1,45; 1,73; 2,05; 1,85

Altura (cm) n %
1,45|--1,55 1 12,5
1,55|--1,65 4 50,0
1,65|--1,75 1 12,5
1,75|--1,85 0 -
1,85|--1,95 1 12,5
1,95|--2,05 0 -
2,05|--2,15 1 12,5
Total 8 100

Os intervalos de classe devem ser mutuamente exclusivos (um indivduo no pode ser classificado
em dois intervalos ao mesmo tempo) e exaustivos (nenhum indivduo pode ficar sem classificao).
A amplitude do intervalo o tamanho do intervalo de classe. A amplitude do intervalo e o nmero
de intervalos dependem basicamente do problema especfico e da literatura existente sobre o assunto.
O ponto mdio do intervalo calculado somando-se o limite inferior e limite superior, dividindo-se
o resultado por dois.

Exemplo 5 Os dados a seguir so de altura de uma amostra de 351 mulheres idosas selecionadas
aleatoriamente de uma comunidade para um estudo de osteoporose.

142 152 154 156 157 158 160 161 163 164 165 169
145 152 154 156 157 158 160 161 163 164 165 169
145 152 154 156 157 158 160 161 163 164 165 169
145 152 154 156 157 158 160 161 163 164 165 169
146 152 155 156 157 158 160 161 163 164 166 169
147 152 155 156 157 158 160 161 163 164 166 169
147 153 155 156 158 158 160 161 163 164 166 169
147 153 155 156 158 158 160 161 163 164 166 170
147 153 155 156 158 159 160 162 163 164 166 170
148 153 155 156 158 159 160 162 163 164 166 170
148 153 155 156 158 159 160 162 163 164 166 170
149 153 155 156 158 159 160 162 163 164 166 170
150 153 155 156 158 159 160 162 163 164 166 170
150 153 155 156 158 159 160 162 163 164 166 170
150 153 155 156 158 159 160 162 163 164 166 170
150 153 155 157 158 159 160 162 163 165 167 170
150 153 155 157 158 159 160 162 163 165 167 170
150 153 155 157 158 159 161 162 163 165 167 170
151 153 155 157 158 159 161 162 163 165 167 171
151 153 155 157 158 159 161 162 163 165 167 171
151 153 155 157 158 159 161 162 163 165 167 171
151 153 155 157 158 159 161 162 163 165 167 173
151 153 155 157 158 159 161 162 163 165 168 173
151 154 155 157 158 159 161 162 163 165 168 173
152 154 155 157 158 159 161 162 163 165 168 174
152 154 156 157 158 160 161 162 163 165 168 176
152 154 156 157 158 160 161 163 163 165 168 177
152 154 156 157 158 160 161 163 164 165 168 178
152 154 156 157 158 160 161 163 164 165 169 178
152 154 156
Fonte: Hand DJ et alli. A handbook of small data sets. Chapman&Hall, 1994.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 9


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
a) Faa uma apurao dos dados e represente-os em uma tabela.
b) Interprete os resultados.
c) Se entre as 351 mulheres no fossem conhecidas as alturas de 15 delas, como voc represen-
taria esses valores?
d) Ao apresentar os dados em uma tabela voc iria incluir estes valores?
e) Estas 15 mulheres tinham, na verdade, altura maior que 180 e o investigador, por achar que
eram valores esquisitos resolveu exclu-los. Voc concorda com esta deciso? Justifique.

Tabela de dupla entrada

Distribuio de crianas(1) segundo nveis sricos de retinol e idade. Cansao Bahia, 1992.
Faixa etria (meses) Aceitvel Inadequado Total
n % n % n %
<12 5 45,5 6 54,5 11 100
12|--24 10 43,5 13 56,5 23 100
24|--36 19 54,3 16 45,7 35 100
36|--48 21 65,6 11 34,5 32 100
48|--60 16 43,2 21 56,8 37 100
60|--73 18 78,3 5 21,7 23 100
Total 89 55,3 72 44,7 161 100
(1)
24 72 meses.
(2)
aceitvel: 20,0 49,9 g/dl; baixo: 10,0 19,9 g/dl; deficiente: <10,0 g/dl.
Fonte: Prado MS et al., 1995.

Exemplo 6
Os dados a seguir so de um estudo que investiga a relao entre nveis de -caroteno (mg/L) e hbi-
to de fumar em gestantes.
a) Calcule as frequncias relativas. Fixando o 100% no total de fumantes e no fumantes.
b) Calcule as frequncias relativas. Fixando o 100% no total do nvel de B-caroteno (MG/L).
c) Interprete os resultados. Existe alguma indicao de existncia de associao entre as vari-
veis? Justifique.
a)
Distribuio de gestantes segundo nveis de -caroteno (mg/L) e hbito de fumar.
-caroteno (mg/L) Fumante No Fumante Total
n % n % n %
Baixo (0 0,213) 46 74 120
Normal (0,214 1,00) 12 58 70
Total 58 132 190
Fonte: Silmara Silva. Tese de Mestrado/FSP/USP.

b)
Distribuio de gestantes segundo nveis de -caroteno (mg/L) e hbito de fumar.
-caroteno (mg/L) Fumante No Fumante Total
n % n % n %
Baixo (0 0,213) 46 74 120
Normal (0,214 1,00) 12 58 70
Total 58 132 190
Fonte: Silmara Silva. Tese de Mestrado/FSP/USP.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 10


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Exerccios suplementares

Exerccio S1
Os dados a seguir so relativos ao nmero de refeies diria de 50 indivduos.
2 3 2 1 2 6 5 4 3
1 2 2 1 2 5 6 4 3
2 2 3 2 3 4 2 3 2
3 2 3 3 3 4 3 4 5
3 1 4 3 4 4 3
3 1 6 4 4 2 4
Fonte X.
a) Apresente os dados em uma tabela.
b) Interprete a disperso dos dados.

Exerccio S2
Os dados a seguir so provenientes do grupo Western Collaborative Group Study, criado na Califrnia
em 1960-61. Foram estudados 3154 homens de meia idade para investigar a relao entre padres de
comportamento e risco de doena coronariana. Os dados apresentados so de 40 homens para os
quais foram medidos os nveis de colesterol (mg/100ml) e realizada uma categorizao segundo com-
portamento. O comportamento de tipo A caracterizado pela urgncia, agressividade e ambio. O de
tipo B relaxado, no competitivo e menos preocupado.
Tipo A: nvel de colesterol

233 291 312 250 246 197 268 224 239 239
254 276 234 181 248 252 202 218 212 325

Tipo B: nvel de colesterol


344 185 263 246 224 212 188 250 148 169
226 175 242 252 153 183 137 202 194 213

a) Quais variveis que esto sendo estudadas? Identifique a natureza de cada varivel.
b) Apure os dados e apresente a varivel nvel de colesterol em uma tabela bidimensional, con-
siderando os nveis A e B.
c) Classifique a varivel nvel de colesterol em duas categorias: nvel normal (abaixo de 160
mg/100ml) e nvel elevado (160 mg/100ml e mais) e faa uma tabela bidimensional cruzando
as variveis: nvel de colesterol (normal e alto) e tipo de comportamento (A e B). Interprete
os resultados.

Exerccio S3
Os dados a seguir so provenientes de um estudo realizado com escolares de 7 a 10 anos que partici-
param de um treinamento para melhorar a habilidade dos mesmos em especificar os alimentos con-
sumidos atravs de um preenchimento de um Dirio Alimentar. Foram atribudos escores antes e aps
o treinamento para cada criana participante da pesquisa. Apresente os dados dos escores em trs
tabelas separadas e compare os dados da tabela antes e aps o treinamento.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 11


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Tabela 1. Valores das mdias do escore obtido por aluno antes e aps o treinamento, segundo as
categorias identificao do alimento, detalhamento e quantificao. So Paulo, SP, 2007.
Escolar Identificao de ali- Detalhamento do Quantificao
mento alimento
Antes Depois Antes Depois Antes Depois
1 4,67 5,00 2,50 1,88 - 3,17
2 4,89 5,00 3,33 2,50 - 4,33
3 5,00 5,00 - 1,25 2,67 5,00
4 4,44 5,00 0,83 1,25 - 4,50
5 5,00 4,92 2,50 0,63 - 5,00
6 3,11 5,00 3,33 3,00 - 4,87
7 3,83 5,00 2,50 3,33 - 5,00
8 4,17 5,00 2,50 3,75 2,33 4,58
9 3,33 4,58 2,50 3,13 1,00 4,58
10 5,00 5,00 - 5,00 - 5,00
11 2,50 4,67 - - 2,50 4,33
12 4,17 4,44 1,25 2,67 0,50 4,89
13 4,50 5,00 1,25 2,50 - 3,22
14 3,33 5,00 2,50 1,67 3,17 5,00
15 5,00 5,00 - 3,13 0,67 4,50
16 3,33 5,00 2,50 0,42 - 3,39
17 3,33 5,00 2,50 4,17 - -
18 3,83 5,00 - - - 3,67
19 1,67 5,00 0,63 0,83 - -
20 3,17 5,00 1,25 2,50 - 4,42
21 3,89 5,00 - 2,50 - 2,33
22 3,89 5,00 2,50 4,28 - 1,33
23 5,00 5,00 - - - 5,00
24 5,00 5,00 2,50 4,17 - 3,78
25 4,50 5,00 0,63 0,83 - 3,00
26 1,67 5,00 - 0,83 - -
27 5,00 5,00 0,50 2,17 - 5,00
28 3,33 5,00 0,50 0,67 - 1,00
29 4,53 4,53 1,50 2,50 - -
30 3,33 5,00 0,63 1,88 - 3,58
31 3,75 5,00 - 1,67 - 4,50
32 1,67 5,00 1,00 1,17 - -
33 4,17 3,75 - 0,21 - 0,25
- escore = zero.
Fonte: Consolmagno DC, 2009.

Exerccio S4
Os dados a seguir so relativos ao peso ao nascer (g) de recm nascidos com sndrome de desconfor-
to idioptico grave. Algumas crianas foram a bito (*) e outras sobrevieram.
1050* 2500* 1890* 1760 2830
1175* 1030* 1940* 1930 1410
1230* 1100* 2200* 2015 1715
1310* 1185* 2270* 2090 1720
1500* 1225* 2440* 2600 2040
1600* 1262* 2560* 2700 2200
1720* 1295* 2730* 2950 2400
1750* 1300* 1130 2550 3160
1770* 1550* 1575 2570 3400
2275* 1820* 1680 3005 3640
Fonte: Hand DJ et al., 1994.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 12


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
a) Classifique a varivel peso ao nascer em duas categorias: baixo peso (abaixo de 2500 g) e
no baixo peso (2500 g e mais) e faa uma tabela bidimensional cruzando as variveis: condi-
o do recm-nascido (sobrevivente ou no sobrevivente) e peso ao nascer (baixo peso e no
baixo peso).
b) Interprete os resultados.

Exerccio S5
A tabela abaixo foi extrada do artigo Tendncia secular do peso ao nascer na cidade de So Paulo
(1976-1998) de MONTEIRO CA et al. (Rev. Sade Pblica; 2000:34 (6, supl): 26-40).
Comente os resultados apresentados.

Apresentao grfica: diagrama de barras, diagramas de setores circula-


res, diagrama linear, histograma, polgono de frequncia, ogiva de fre-
quncias acumuladas.

Diagrama de barras

Utilizado para representar as variveis qualitativa nominal, ordinal e quantitativa discreta.

Caractersticas: figuras geomtricas (barras) separadas e bases de mesmo tamanho. A altura das
barras proporcional s frequncias.

Varivel qualitativa
O Inqurito Brasileiro de Nutrio (IBRANUTRI) foi um estudo de pacientes maiores de 18 anos, inter-
nados em hospitais da rede pblica, conveniados, filantrpicos e universitrios de 12 estados do Brasil
e do Distrito Federal, realizado de maio a novembro de 1996 (in Soares JF, Siqueira AL. Introduo
Estatstica Mdica, COOPMED,Belo Horizonte, MG 2002). Os dados da tabela so retirados deste estu-
do.

Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.


Estado nutricional n %
Nutrido 2061 51,5
Desnutrido 1905 47,6
Sem diagnstico 34 0,9
Total 4000 100,0
Fonte: adaptado de Soares JF, Siqueira AL, 2002.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 13


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
2500

2000

Nmero
1500

1000

500

0
Nutrido Desnutrido Sem
diagnstico
Estado nutricional

Fonte: adaptado de Soares JF, Siqueira AL, 2002.


Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.

Esta representao grfica est correta?

2100
2050
2000
Nmero

1950
1900
1850
1800
Nutrido Desnutrido
Estado nutricional

Ateno: cuidado com a origem!

Diagrama de barras da tabela anterior, excluindo-se os registros da categoria sem diagnstico

2500
2000
Nmero

1500
1000
500
0
Nutrido Desnutrido
Estado nutricional

Fonte: adaptado de Soares JF, Siqueira AL, 2002.


Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 14


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Varivel qualitativa nominal
Distribuio do consumo mdio per capita de carne vermelha (kg/ano) segundo pas.
Pas Consumo anual Pas Consumo anual
Albnia 10,1 Noruega 9,4
Alemanha Oriental 11,4 Polnia 6,9
ustria 8,9 Portugal 6,2
Blgica 13,5 Romnia 6,2
Bulgria 7,8 Espanha 7,1
Checoslovquia 9,7 Sucia 9,9
Dinamarca 10,6 Sua 13,1
Alemanha Ocidental 8,4 Reino Unido 17,4
Finlndia 9,5 Unio Sovitica 9,3
Frana 18,0 Iugoslvia 4,4
Grcia 10,2 Hungria 5,3
Itlia 9,0 Irlanda 13,9
Holanda 9,5
Fonte: Hand DJ et al., 1994 (adaptado).

Pas

Iugoslvia
Hungria
Rom nia
Pas
Portugal
Irlanda
Polnia
Hungria
Iugoslvia Espanha
Unio Sovitica Bulgria
Reino Unido Alem anha Ocidental
Sua
ustria
Sucia
Itlia
Espanha
Romnia Unio Sovitica
Portugal Noruega
Polnia Holanda
Noruega
Finlndia
Holanda
Checoslovquia
Itlia
Grcia Sucia

Frana Albnia
Finlndia Grcia
Alemanha Ocidental
Dinam arca
Dinamarca
Alem anha Oriental
Checoslovquia
Bulgria
Sua

Blgica Blgica
ustria Irlanda
Alemanha Oriental Reino Unido
Albnia
Frana
0 2 4 6 8 10 12 14 16 18 20
Consum o mdio per capita (Kg/ano) 0 5 10 15 20
Consum o m dio per capita (kg/ano)

Fonte: Hand DJ et al., 1994 (adaptado).


Distribuio do consumo mdio (kg/ano) per capita de carne vermelha, segundo pas.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 15


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Varivel qualitativa ordinal

Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.


Estado nutricionala n %
Nutrido 2061 52,0
Desnutrido moderado 1407 35,4
Desnutrido grave 498 12,6
Total 3966 100
a
excluindo-se 34 (0,9%) de pacientes sem diagnstico.
Fonte: adaptado de Soares JF, Siqueira AL, 2002.

%
60

50

40

30

20

10

0
Nutrido Des nutrido Des nutrido grave
m oderado
Estado nutriciona l

a
excluindo-se 34 (0,9%) de pacientes sem diagnstico.
Fonte: adaptado de Soares JF, Siqueira AL, 2002.
Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.

Varivel quantitativa discreta: nmero de bens

Foi realizada, no perodo de outubro de 1998 a outubro 1999, a pesquisa Alimentao no primeiro
ano de vida, onde se estudou uma coorte de recm-nascidos da maternidade do Hospital Universit-
rio (HU). Os dados a seguir so parte da caracterizao scio-econmica da amostra estudada.

Distribuio de famlias segundo nmero de bens* que possuem. Hospital Universitrio/USP, So Pau-
lo 1999.
Nmero de bens n %
0 146 40,6
1 97 26,9
2 87 24,2
3 26 7,2
4 4 1,1
Total 360 100
* automvel, telefone, TV a cabo e computador

50 %

40
30
20
10
0
0 1 2 3 4
Nmero de bens
*automvel, telefone, TV a cabo e computador

Distribuio de famlias segundo nmero de bens*. Hospital Universitrio/USP, So Paulo 1999.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 16


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Exemplo 7
Os dados a seguir so relativos ao nmero de refeies dirias de 50 indivduos, utilizados no exerc-
cio S1.

2 3 2 1 2 6 5 4 3
1 2 2 1 2 5 6 4 3
2 2 3 2 3 4 2 3 2
3 2 3 3 3 4 3 4 5
3 1 4 3 4 4 3
3 1 6 4 4 2 4
c) Apresente os dados em um grfico.
d) Interprete o grfico.

Diagrama de setores circulares


Variveis: qualitativa nominal e qualitativa ordinal
Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.
Estado nutricionala n %
Nutrido 2061 52,0
Desnutrido moderado 1407 35,4
Desnutrido grave 498 12,6
Total 3966 100
a
excluindo-se 34 (0,9%) de pacientes sem diagnstico.
Fonte: adaptado de Soares JF, Siqueira AL, 2002.

12,6%

52,0%
35,4%

Nutrido Desnutrido moderado Desnutrido grave


a
excluindo-se 34 (0,9%) de pacientes sem diagnstico.
Fonte: adaptado de Soares JF, Siqueira AL, 2002.
Distribuio de pacientes(a) segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.

Diagrama linear
Produo de leite (milhes de toneladas).
ndia e Estados Unidos, 1966 2000
Produo de leite (milhes de toneladas). 90
ndia
ndia e Estados Unidos, 1966 2000. 80 Estados Unidos
Ano ndia Estados Unidos 70
Milhoes de toneladas

1966 20 58 60
50
1970 23 56
40
1980 29 60
30
1990 50 70 20
2000 80 75 10
0
1960 1965 1970 1975 1980 1985 1990 1995 2000 2005
Fonte: State of the World, 2001.
Ano

Fonte: State of the World, 2001.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 17


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Exemplo 8

Os dados so referentes a produo (kg) de carne de peixes e de carne vermelha e de carneiro por
pessoa, no mundo, no perodo de 1950 a 2000.
Ano Pesca ocenica Carne vermelha e
(kg) de carneiro (kg)
1950 7,9 9,0
1960 12,0 10,0
1970 16,1 12,0
1980 15,5 11,9
1990 16,3 12,0
2000 15,0 11,7
Fonte: State of the World, 2001. The Worldwatch Institute.

a) Apresente os dados em um grfico.


b) Interprete os resultados.

Histograma

Adequado para representar varivel quantitativa contnua

Intervalos de classe com mesma amplitude


Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo
peso ao nascer (g)
Peso(g) No %
1000 |-- 1500 13 26
1500 |-- 2000 15 30
2000 |-- 2500 9 18
2500 |-- 3000 9 18
3000 |-- 3500 3 6
3500 |-- 4000 1 2
Total 50 100
Fonte: van Vliet PKJ, Gupta JM. (1973).

35 %
30
25
20
15
10
5
0
1000 1500 2000 2500 3000 3500 4000
Peso ao nascer (g)

Fonte: van Vliet PKJ, Gupta JM. (1973)

Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo


peso ao nascer (g).

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 18


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Notar que o grfico pode ser construdo considerando-se pessoas por unidade de medida
(densidade)

Peso(g) No Amplitude No/amplitude (No/amplitude)x10000


1000 |-- 1500 13 500 0,026 26
1500 |-- 2000 15 500 0,030 30
2000 |-- 2500 9 500 0,018 18
2500 |-- 3000 9 500 0,018 18
3000 |-- 3500 3 500 0,006 6
3500 |-- 4000 1 500 0,002 2
Total 50

0,030
0,025
nmero/g

0,020
0,015
0,010
0,005
0
1000 1500 2000 2500 3000 3500 4000

peso ao nascer (g)

Fonte: van Vliet PKJ, Gupta JM. (1973).

Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo


peso ao nascer (g).

OBS: notar que com intervalos iguais, no necessrio fazer ajuste na altura dos retngulos dado
que as bases so de mesmo tamanho (mesma amplitude) e, portanto, com proporcionalidade asse-
gurada.

Exemplo 9

Os dados so referentes distribuio de pacientes segundo taxa de albumina no sangue (g/dL).


Taxa de albumina (g/dL) No %
4,40|-4,60 6 10,0
4,60|-4,80 11 18,3
4,80|-5,00 14 23,3
5,00|-5,20 18 30,0
5,20|-5,40 8 13,3
5,40|-5,60 2 3,3
5,60|-5,80 0 -
5,80|-6,00 1 1,7
Total 60 100
Fonte: Soares JF, Siqueira AL. COOPMED, 2002.

a) Apresente os dados em um histograma.


b) Interprete os resultados.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 19


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Intervalos de classe com amplitudes diferentes
Distribuio de mulheres idosas segundo a altura.
Altura (cm) No %
140|--150 12 3,4
150|--155 52 14,8
155|--160 109 31,1
160|--170 156 44,4
170|--180 22 6,3
Total 351 100
Fonte: Hand DJ et al., 1994.
Ajuste
Altura (cm) No Amplitude No/amplitude
140|--150 12 10 1,2
150|--155 52 5 10,4
155|--160 109 5 21,8
160|--170 156 10 15,6
170|--180 22 10 2,2
Total 351
Fonte: Hand DJ et al., 1994.
Distribuio de mulheres idosas segundo a altura.

Cuidado: Sem fazer o ajuste, o grfico fica errado e pode levar a concluses incorretas.

%
50
45
40
35
30
25
20
15
10
5
0
140 150 160 170 180

Altura (cm)

Grfico correto, com o ajuste para intervalos de classe com amplitudes diferentes.
Mulheres/cm
25

20

15

10

0
140 145 150 155 160 165 170 175 180

altura (cm)

Fonte: Hand DJ et al., 1994.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 20


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Exemplo 10

Os dados a seguir so da altura (cm) de uma amostra de mulheres de Bangladesh.

Altura (cm) nmero


137,0 |--140,0 71
140,0 |--143,0 137
143,0 |--145,0 154
145,0 |--147,0 199
147,0 |--150,0 279
150,0 |--153,0 221
153,0 |--155,0 94
155,0 |--157,0 51
157,0 |--160,0 37
Total 1243
Fonte: Hand DJ et al, 1994 (adaptado).

a) Represente os dados acima, graficamente em um histograma.


b) Interprete os resultados.

Polgono de frequncia simples

Intervalos de classe com mesma amplitude

Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo


peso ao nascer (g).
Peso(g) No %
1000 |-- 1500 13 26
1500 |-- 2000 15 30
2000 |-- 2500 9 18
2500 |-- 3000 9 18
3000 |-- 3500 3 6
3500 |-- 4000 1 2
Total 50 100
Fonte: Hand DJ et al., 1994.

16 Nmero
14
12
10
8
6
4
2
0
0 500 1000 1500 2000 2500 3000 3500 4000 4500

peso (g)

Fonte: Hand DJ et al., 1994.


Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo
peso ao nascer (g).

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 21


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Exemplo 11

Os dados a seguir so referentes distribuio de usurias do Servio de Sade X segundo idade


(anos). Municpio de So Paulo, 2009.
Idade (anos) n %
15|-- 20 14 19,5
20|-- 25 24 33,3
25|-- 30 16 22,2
30|-- 35 9 12,5
35|-- 40 8 11,1
40|--45 1 1,4
Total 72 100
Fonte: Dados hipotticos.
a) Apresente a varivel em um polgono de frequncias simples.
b) Interprete os resultados.

Intervalos de classe com amplitudes diferentes

Distribuio de mulheres idosas segundo a altura.


Altura (cm) No %
140|--150 12 3,4
150|--155 52 14,8
155|--160 109 31,1
160|--170 156 44,4
170|--180 22 6,3
Total 351 100
Fonte: Hand DJ et al., 1994.
Ajuste

Altura (cm) No Amplitude No/amplitude


140|--150 12 10 1,2
150|--155 52 5 10,4
155|--160 109 5 21,8
160|--170 156 10 15,6
170|--180 22 10 2,2
Total 351

25

20
nm er o de p ess oa s/cm

15

10

0
1 30 1 35 140 14 5 1 50 1 55 160 16 5 1 70 175 180 18 5 1 90

Altu ra (c m)

Fonte: Hand DJ et al., 1994.


Distribuio de mulheres idosas segundo a altura (cm).

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 22


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Exemplo 12
Distribuio de homens segundo nvel de glicose no sangue (mg%).
Nvel de glicose no sangue n
(mg%)
50|-- 100 13
100|-- 150 45
150|-- 200 28
200|-- 250 10
250|-- 300 3
300|-- 450 1
Fonte: X.

a) Apresente os dados acima graficamente utilizando o polgono de frequncias simples.


b) Interprete os resultados.

Polgono (ogiva) de frequncias acumuladas


Distribuio de mulheres idosas segundo a altura.
Altura (cm) No % % acumulado
140|-145 1 0,29 0,29
145|-150 11 3,13 3,42
150|-155 52 14,81 18,23
155|-160 109 31,05 49,28
160|-165 106 30,20 79,48
165|-170 50 14,25 93,73
170|-175 18 5,13 98,86
175|-180 4 1,14 100
Total 351 100
Fonte: Hand DJ et al., 1994.

100 % acumulado

80

60

40

20

0
140 145 150 155 160 165 170 175 180

altura (cm)

Fonte: Hand DJ et al., 1994.

Distribuio acumulada de mulheres idosas segundo a altura.

Percentil Valor da varivel Medidas estatsticas


25% 156 cm Q1 primeiro quartil
50% 160 cm Q2 - segundo quartil ou mediana
75% 164 cm Q3 terceiro quartil

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 23


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Exemplo 13

Os dados a seguir so medidas de circunferncia do trax (polegadas) de 5732 soldados escoceses


apresentados pelo matemtico belga Adolphe Quetelet (17961874).
Medida (polegada) nmero % % acumulada
33,0 | 34,0 3
34,0 | 35,0 19
35,0 | 36,0 81
36,0 | 37,0 189
37,0 | 38,0 409
38,0 | 39,0 753
39,0 | 40,0 1062
40,0 | 41,0 1082
41,0 | 42,0 935
42,0 | 43,0 646
43,0 | 44,0 313
44,0 | 45,0 168
45,0 | 46,0 50
46,0 | 47,0 18
47,0 | 48,0 3
48,0 | 49,0 1
Total 5732
Fonte: Daly F et al. Elements of Statistics, 1999.

a) Represente os dados em um polgono de frequncias acumuladas.


b) Utilizando o grfico, identifique o valor da circunferncia de trax que deixa 25% dos indiv-
duos abaixo.
c) Qual o valor de circunferncia do trax que divide a distribuio em 2 partes iguais, isto ,
qual o valor da varivel que deixa 50% das observaes abaixo dele?
d) Qual a proporo de soldados com circunferncia do trax entre 40 a 42 polegadas?
e) Qual o valor de circunferncia do trax que deixa 95% dos soldados abaixo dele?

Representao grfica de duas variveis qualitativas

Os dados so de um estudo de obesidade em mulheres da zona urbana de Trinidade e Tobago,


realizado em 1985, que estuda a relao entre idade da menarca e a medida do trceps.
Distribuio de mulheres segundo idade da menarca e medida do trceps. Trinidade e Toba-
go,1985.
Idade da menarca Medida do trceps
Pequena Intermediria Grande
< 12 anos 15 29 36
12 anos e mais 156 197 150
Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 24


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Investigando-se a distribuio da idade segundo medida do trceps tem-se:
250 nmero <12

200 12 e +
150
100

50
0
Pequena Intermediria Grande
medida do trceps
Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.
Distribuio de mulheres segundo idade da menarca e medida do trceps. Trinidade e Toba-
go,1985.

Calculando-se as porcentagens, tomando-se as categorias da medida do trceps como 100%, tem-se:


Distribuio de mulheres segundo idade da menarca e medida do trceps. Trinidade e Tobago,
1985.
Idade (anos) Medida do trceps
Pequena Intermediria Grande Total
n % n % n % n %
<12 15 8,8 29 12,8 36 19,4 80 13,7
12 e + 156 91,2 197 87,2 150 80,6 503 86,3
Total 171 100 226 100 186 100 583 100
Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.

% <12
100

80
12 e +
60

40

20

0
Pequena Intermediria Grande

Medida do trceps

Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.


Distribuio de mulheres segundo idade da menarca e medida do trceps. Trinidade e Tobago,
1985.
Investigando-se a distribuio da medida do trceps segundo a idade:
250 nmero

200
Pequena
150 Intermediria
Grande
100

50

0
<12 12 e +

idade

Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.


Distribuio de mulheres segundo idade da menarca e medida do trceps. Trinidade e Tobago,
1985.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 25


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Calculando-se as porcentagens tem-se:

Idade Medida do trceps


(anos) Pequena Intermediria Grande Total
N % n % n % n %
<12 15 18,8 29 36,2 36 45,0 80 100
12 e + 156 31,0 197 39,2 150 29,8 503 100
Total 171 29,3 226 38,8 186 31,9 583 100
50 %
Pequena
45
Intermediria
40
Grande
35
30
25
20
15
10
5
0
<12 12 e +

Idade da menarca
Exemplo 14

A tabela apresenta dados de classificao de pessoas segundo doena coronariana (CHD) segundo
hbito de consumo de caf para uma coorte de 1718 homens com idade 40-55 anos.

Distribuio de homens segundo presena de doena coronariana (CHD) e consumo de caf.


condio Alto consumo de caf Moderado consumo de Total
( 100xcaras/ms) caf (<100 xcaras/ms)
n % n % n %
Com CHD 38 4,8 39 4,2 77 4,5
Sem CHD 752 95,2 889 95,8 1641 95,5
Total 790 100 928 100 1718 100

a) Apresente os dados graficamente.


b) Interprete os resultados.

Representao grfica de duas variveis quantitativas

Histograma

Fixando-se os percentuais na condio do recm-nascido:

Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo


peso ao nascer (g) e condio do recm-nascido.
Peso(g) Sobrevivente No sobrevivente Total
no % no % no %
1000 |-- 1500 2 9 11 41 13 26
1500 |-- 2000 6 26 9 33 15 30
2000 |-- 2500 5 22 4 15 9 18
2500 |-- 3000 6 26 3 11 9 18
3000 |-- 3500 3 13 0 - 3 6
3500 |-- 4000 1 4 0 - 1 2
Total 23 100 27 100 50 100
Fonte: Hand DJ et al., 1994.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 26


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
45 %
40
35
30
25
20
15
10
5
0
1000 1500 2000 2500 3000 3500 4000 1000 1500 2000 2500 3000

Sobrevivente No sobrevivente
Condio do recm nascido
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo
peso ao nascer (g) e condio do recm-nascidos.
Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.

Polgono de frequncias
45 %
40 Sobrevivente

35 No sobrev.

30
25
20
15
10
5
0
0 500 1000 1500 2000 2500 3000 3500 4000 4500
peso ao nascer (g)

Fonte: Hand DJ et al., 1994.


Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo
peso ao nascer (g) e condio do recm-nascido.

Fixando-se os percentuais no peso ao nascer:

Diagrama de barras
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo
peso ao nascer (g) e condio do recm-nascido.
Peso(g) Sobrevivente No sobrevivente Total
no % no % no %
1000 |-- 1500 2 15 11 85 13 100
1500 |-- 2000 6 40 9 60 15 100
2000 |-- 2500 5 56 4 44 9 100
2500 |-- 3000 6 67 3 33 9 100
3000 |-- 3500 3 100 0 - 3 100
3500 |-- 4000 1 100 0 - 1 100
Total 23 46 27 54 50 100
Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 27


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
120 % Sobrevivente

100
No sobrevivente
80

60

40

20

0
1000 |--1500 1500 |--2000 2000 |--2500 2500 |--3000 3000 |--3500 3500 |--4000

peso (g)

Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.

Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo


peso ao nascer (g) e condio do recm-nascido.
% no sobreviviente
100
sobrevivente
80

60
40
20
0
1000 1500 2000 2500 3000 3500 4000

peso (g)
Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo
peso ao nascer (g) e condio do recm-nascido.

Exemplo 15
Utilize os dados da tabela e apresente-os graficamente.
Distribuio de escolares de 7 a 10 anos segundo peso e sexo. Duas escolas do Municpio de So Pau-
lo, 2005.
Peso (kg) Sexo
Masculino Feminino
15,0 |-- 25,0 52 68
25,0 |-- 35,0 146 132
35,0 |-- 45,0 59 53
45,0 |-- 55,0 11 18
55,0 |-- 65,0 10 2
65,0 |-- 75,0 3 1
75,0 |-- 85,0 0 0
85,0 |-- 95,0 0 1
Total 281 275
Fonte: Koga CR. Estado nutricional de escolares de 7 a 10 anos de idade: diagnstico e comparao
de mtodos. So Paulo; 2005. [Dissertao de Mestrado-Faculdade de Sade Pblica da Universidade
de So Paulo/USP].

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 28


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Exemplo 16
Utilize os dados da tabela e apresente-os graficamente.
Distribuio de percentual (%) de escolares segundo estatura (cm), sexo e idade.
Estatura (cm) Sexo
Masculino Feminino
105,0 119,9 3 16
120,0 124,9 36 31
125,0 129,9 61 74
130,0 134,9 57 41
135,0 139,9 52 43
140,0 144,9 38 30
145,0 149,9 22 26
150,0 159,9 12 14
Total 281 275
Fonte: Koga CR. Estado nutricional de escolares de 7 a 10 anos de idade: diagnstico e comparao
de mtodos. So Paulo; 2005. [Dissertao de Mestrado-Faculdade de Sade Pblica da Universidade
de So Paulo/USP].

Escala aritmtica e escala logartmica

Nmero de crianas segundo massa corporal. Escola X, 2000 e 2002.


Ano Sobrepeso Obesas
2000 300 100
2002 150 50
Fonte: dados hipotticos.

Grfico em escala aritmtica

350
Sobrepeso
300
Obeso
250
Nmero

200

150

100

50

0
2000 2002
Ano

Fonte: dados hipotticos

Nmero de crianas segundo massa corporal. Escola X, 2000 e 2002.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 29


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Grfico em escala logartmica

Sobrepeso
1000
Obeso

100
Nmero

10

1
2000 2002
Ano

Fonte: dados hipotticos.

Nmero de crianas segundo massa corporal. Escola X, 2000 e 2002.

Grfico em escala aritmtica

Coeficiente de mortalidade pela doena X e Y (100.000 hab.). Determinada localidade,


1990- 1995.
Ano Doena X Doena Y
1990 123,5 28,7
1991 121,4 22,4
1992 111,9 17,7
1993 85,9 13,9
1994 77,1 14,8
1995 62,2 10,5
Fonte: dados hipotticos.

150 Doena X
Doena Y
100
Coeficiente

50

0
1990 1991 1992 1993 1994 1995
Ano

Fonte: dados hipotticos.


Coeficiente de mortalidade pela doena X e Y (100.000 hab.). Determinada loca-
lidade, 1990- 1995.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 30


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Grfico em escala logartmica

1000 Doena X
Doena Y

Coeficiente
100

10

1
1990 1991 1992 1993 1994 1995
Ano
Fonte: dados hipotticos.
Coeficiente de mortalidade pela doena X e Y (100.000 hab.). Determinada localidade, 1990 - 1995.

Exemplo 17
Os dados a seguir so referentes mortalidade por cncer de esfago, segundo sexo, no municpio de
So Paulo no perodo de 1968-1998.
Coeficientes de mortalidade por cncer de esfago (por 100.000 hab.).
Municpio de So Paulo, 1968-1998.
Ano Masculino Feminino
1968 8,81 2,00
1973 12,38 2,61
1978 10,93 1,98
1983 9,41 2,00
1988 8,60 1,67
1993 8,33 1,27
1998 8,37 1,12
Fonte: Incidncia de cncer no Municpio de So Paulo, 1997-1998. Registro de Cncer de So Paulo.
FSP/USP.

a) Represente os coeficientes de mortalidade por cncer de esfago para o sexo masculino e feminino
em um nico grfico, utilizando escala aritmtica.
b) Represente os coeficientes de mortalidade por cncer de esfago para o sexo masculino e feminino
em um nico grfico utilizando escala logartmica.
c) Comente os grficos dos itens a e b. Qual a melhor representao para os dados?

Exerccios suplementares

Exerccio S6
Apresente a varivel peso ao nascer graficamente utilizando a varivel definida em duas categorias,
conforme tabela abaixo.
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo
peso ao nascer (g). Austrlia, 1993.
Peso(g) No %
Baixo peso (<2500 g) 37 74,0
No baixo peso (2500 g e mais) 13 26,0
Total 50 100
Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 31


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Exerccio S7
Apresentar a varivel comprimento ao nascer em um histograma.
Distribuio de recm-nascidos segundo comprimento ao nascer (cm). Hospital X, 2009.
Comprimento (cm) n %
40|--43 1 1,2
43|--46 45 55,6
46|--49 25 30,9
49|--52 4 5
52|--55 3 3,7
55|--58 1 1,2
58|--61 2 2,5
Total 81 100
Fonte: dados hipotticos.

Exerccio S8

Apresentar a varivel idade da me em um polgono de frequncias.


Distribuio de mes segundo idade (anos). Centro de Sade X, 2009.
Idade (anos) n %
15|-- 20 14 19,5
20|-- 25 24 33,3
25|-- 30 16 22,2
30|-- 35 9 12,5
35|-- 40 8 11,1
40|--45 1 1,4
Total 72 100
Fonte: dados hipotticos.
Exerccio S9
Defeitos do tubo neural so m formaes congnitas que surgem durante o desenvolvimento fetal.
conhecida como spina bfida. Estes dados so de um estudo realizado no pas de Gales Reino Unido,
para investigar possvel associao entre defeito do tubo neural e dieta materna. O estudo do tipo
caso-controle: mes que tinham tido bebs com spina bfida (casos) e suas irms que no tinham tido
(controles) foram avaliadas segundo suas dietas e classificadas em boa, razovel e ruim.

Distribuio de recm-nascidos casos (acometidos de spina bfida) e controles segundo dieta da


me.
Dieta Casos Controles Total
n % n % n %
Boa 34 43 77
Razovel 110 48 158
Pobre 100 32 132
Total 244 123 367
Fonte: Hand DJ ET al., 1994.
a) Calcular percentuais tomando-se como 100% o grupo (caso, controle) e interprete os resulta-
dos.
b) Apresentar os dados em um grfico.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 32


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Exerccio S10

Represente os dados da tabela em um polgono de frequncias e interprete os resultados. Trata-se de


condenados por embriaguez em Londres, 1970.
Idade Homens Mulheres
Nmero % Nmero %
0 |--30 185 20,5 4 9,1
30 |-- 40 207 22,9 13 29,5
40 |-- 50 260 28,8 10 22,7
50 |--60 180 19,9 7 15,9
60 |--80 71 7,9 10 22,7
total 903 100 44 100
Fonte: Hand DJ et alli. A handbook of small data sets. Chapman&Hall, 1994.

Medidas de tendncia central e de disperso

Medidas de tendncia central

Mdia aritmtica
Notao:
X varivel

N tamanho da populao

n tamanho da amostra

Mdia populacional (parmetro, geralmente desconhecido)

X Estatstica (frmula)

x Mdia amostral (estimativa, valor calculado na amostra)

Mdia aritmtica o valor que indica o centro de equilbrio de uma distribuio de frequncias de uma
varivel quantitativa.

Definio: a soma dos valores de uma varivel, dividida pelo nmero de valores.

Em uma amostra aleatria simples de tamanho n, composta das observaes x1, x2, ..., xn, a mdia
aritmtica ( x ) igual a:
n

x + x 2 + ... + x n x i
x= 1 = i =1

n n

OBS:
s existe para variveis quantitativas e seu valor nico;

da mesma natureza da varivel considerada; e

sofre influncia dos valores aberrantes (outlier).

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 33


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Exemplo:
Os dados a seguir so provenientes do grupo Western Collaborative Group Study. Grupo tipo A: pes-
soas caracterizadas pela urgncia, agressividade e ambio. Os participantes de tipo B so mais rela-
xados, no competitivos e menos preocupados.

Tipo A: nvel de colesterol


233 291 312 250 246 197 268 224 239 239
254 276 234 181 248 252 202 218 212 325

Colesterol mdio:

233 + 291 + ... + 212 + 325


xA = = 245,05mg / 100ml
20
Tipo B: nvel de colesterol
344 185 263 246 224 212 188 250 148 169
226 175 242 252 153 183 137 202 194 213

xB =

O nvel mdio de colesterol dos homens do grupo A 245,1 mg/100ml e do tipo B _____________.

Exemplo 18
Os dados a seguir so provenientes de um estudo que avaliou o consumo alimentar de crianas de 7
a 10 anos de uma escola pblica do municpio de So Paulo no ano de 2008. Os dados apresentados
so de 15 meninos e 10 meninas para os quais foram investigados o consumo em energia (Kcal) de
um dia alimentar. Calcule a mdia aritmtica do consumo de energia para cada sexo:

Meninos
1976 3234 1405 1410 1782 2167 1917 2622 1824 3912
1412 1635 2230 1241 1866

x Meninos =

Meninas
2002 2964 2203 1478 1151 1083 1362 1392 1637 1628

x Meninas =

Mediana

o valor que ocupa a posio central de uma srie de n observaes, quando estas esto ordenadas
de forma crescente ou decrescente.

Quando nmero de observaes (n) for mpar:


n+1
a mediana o valor da varivel que ocupa o posto
2

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 34


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Quando o nmero de observaes (n) for par:
n n+2
a mediana a mdia aritmtica dos valores da varivel que ocupam os postos e
2 2
OBS:
existe para varivel quantitativa e qualitativa ordinal;

da mesma natureza da varivel considerada;

torna-se inadequada quando h muitos valores repetidos;

no sofre influncia de valores aberrantes.

Ex:

Tipo A: nvel de colesterol


233 291 312 250 246 197 268 224 239 239
254 276 234 181 248 252 202 218 212 325

Ordenando-se os valores:
Tipo A: nvel de colesterol
181 202 218 233 239 246 250 254 276 312
197 212 224 234 239 248 252 268 291 325

Mediana: (239+246)/2=242,5 mg/100ml

Tipo B: nvel de colesterol


344 185 263 246 224 212 188 250 148 169
226 175 242 252 153 183 137 202 194 213

Ordenando-se os valores:

Mediana:

Exemplo 19

Com os dados do exemplo 18, calcule a quantidade mediana de energia para os meninos e para as
meninas:

Meninos

Mediana=

Meninas

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 35


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Mediana=

Medidas de disperso

Valores mnimo e mximo: valores extremos da distribuio.

Amplitude de variao: a diferena entre os 2 valores extremos da distribuio.

Varincia: indica o quanto, em mdia, os quadrados dos desvios de cada observao em relao
mdia aritmtica esto afastados desta mdia.

(X i X )2
S (2N ) = i =1
ou
2 N
Populacional Parmetro estimador : N

(X i X )2
S (2N 1) = i =1

N 1

= 2
Desvio padro: a raiz quadrada da varincia , ou seja

S = S2
Coeficiente de Variao de Pearson (CV):
S
o quociente entre o desvio padro e a mdia, ou seja CV = x100
X

Ex e m pl o :

Tipo A: nvel de colesterol


233 291 312 250 246 197 268 224 239 239
254 276 234 181 248 252 202 218 212 325

(233 245,05) 2 + ... + (325 245,05) 2


Varincia: s2 = = 1342,37(mg / 100ml ) 2
19

Desvio padro s = 1342,37 = 36,64mg / 100ml

36,64
Coeficiente de Variao de Pearson CV = x100 = 15%
245,05

Tipo B: nvel de colesterol


344 185 263 246 224 212 188 250 148 169
226 175 242 252 153 183 137 202 194 213

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 36


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Varincia: s2 =
Desvio padro s=

Coeficiente de Variao de Pearson CV=

Exemplo 20

Com os dados do exemplo 18, calcule a varincia, o desvio-padro e o coeficiente de variao de


Pearson.

Meninos

Meninas

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 37


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Quartil

Valores da varivel que dividem a distribuio em quatro partes iguais.


25% 25% 25% 25%

Q1: deixa abaixo 25% das observaes


25% 75%

Q2: deixa abaixo 50% das observaes


50% 50%

Q3: deixa abaixo 75% das observaes


75% 25%
Q1 = x 1 e Q3 = x 3
( ( n +1)) ( ( n +1))
4 4
1 3
onde x o valor da varivel e ( (n + 1)) e ( ( n + 1)) so ndices que representam as posies
4 4
ocupadas por x.

Os dados abaixo so referentes ao peso ao nascer de 50 recm-nascidos que tiveram sndrome de


desconforto respiratrio idioptico grave.
23 crianas sobreviveram e 27 foram a bito (*).
1.050* 2.500* 1.890* 1.760 2.830
1.175* 1.030* 1.940* 1.930 1.410
1.230* 1.100* 2.200* 2.015 1.715
1.310* 1.185* 2.270* 2.090 1.720
1.500* 1.225* 2.440* 2.600 2.040
1.600* 1.262* 2.560* 2.700 2.200
1.720* 1.295* 2.730* 2.950 2.400
1.750* 1.300* 1.130 2.550 3.160
1.770* 1.550* 1.575 2.570 3.400
2.275* 1.820* 1.680 3.005 3.640

Ordenando-se os dados, em cada grupo, obtm-se:


1.030* 1.310* 2.200* 1.680 2.550
1.050* 1.500* 2.270* 1.715 2.570
1.100* 1.550* 2.275* 1.720 2.600
1.175* 1.600* 2.440* 1.760 2.700
1.185* 1.720* 2.500* 1.930 2.830
1.225* 1.750* 2.560* 2.015 2.950
1.230* 1.770* 2.730* 2.040 3.005
1.262* 1.820* 1.130 2.090 3.160
1.295* 1.890* 1.410 2.200 3.400
1.300* 1.940* 1.575 2.400 3.640

Fonte: van Vliet PK; Gupta JM. Sodium bicabornate in idiopatic respiratory distress syndrome. Arch.
Diseases in Childhood,1973:48, 249-255.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 38


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Entre os recm-nascidos que sobreviveram:
Q1 = x 1 = x 6 = 1720 g ; Q3 = x 3 = x18 = 2830 g
( ( 23+1)) ( ( 23+1))
4 4

Q2 = x 1 = x12 = 2200g
( ( 23+1))
2
Entre os recm-nascidos que foram a bito
Q1 = x 1 = x7 = 1230g ; Q3 = x 3 = x21 = 2200g
( ( 27+1)) ( ( 27 +1))
4 4

Q2 = x 1 = x14 = 1600 g
( ( 27 +1))
2

Se o resultado for um valor fracionrio:

Por exemplo, para n=22


Q1 = x 1 = x 23 = x 3
( ( 22+1)) ( ) (5 )
4 4 4

que do caminho entre x5=1715 e x6=1720


3
Q1 = 1715 + (1720 1715) = 1718,8 g
4
Q3 = x 3 =x 1
( ( 22+1)) (17 )
4 4

que do caminho entre x17=2700 e x18=2830


1
Q3 = 2700 + ( 2830 2700) = 2732,5 g
4
Decil
Valores da varivel que dividem a distribuio em dez partes iguais.

Percentil
Valores da varivel que dividem a distribuio em cem partes iguais.

Entre os recm-nascidos que sobreviveram

Percentil 5:
P5 = x 5 = x 120 = x 1
( ( 23+1)) ( ) (1 )
100 100 5

que 1/5 do caminho entre x1=1130 e x2=1410


1
P5 = 1130 + (1410 1130) = 1186 g
5

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 39


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Percentil 10:
P10 = x = x 240 = x 2
(
10
( 23+1)) ( )
2 ;
(2 )
P10 = 1410 + (1575 1410 ) = 1476 g
100 100 5 5
Percentil 50:
P50 = x 50 = x 1200 = x(12) ; P50 = 2200 g
( ( 23+1)) ( )
100 100
Percentil 75:
P75 = x 75 = x 1800 = x(18) ; P75 = 2830g
( ( 23+1)) ( )
100 100
Percentil 90:
P90 = x = x 2160 = x 3
(
90
( 23+1)) ( )
3 ;
( 21 )
P90 = 3160 + (3400 3160) = 3304 g
100 100 5 5
Percentil 95:
P95 = x = x 2280 = x 4
(
95
( 23+1)) ( )
4 ;
( 22 )
P95 = 3400 + (3640 3400 ) = 3592 g
100 100 5 5

Box plot e identificao de valores aberrantes (outliers)

O Box plot representa graficamente dados de forma resumida em um retngulo onde as linhas da
base e do topo so o primeiro e o terceiro quartis, respectivamente. A linha entre estas a mediana.
Linhas verticais que iniciam no meio da base e do topo do retngulo, terminam em valores
denominados adjacentes inferior e superior (Chambers et al., 1983, pag 60).

O valor adjacente superior o maior valor das observaes que menor ou igual a Q3+1,5(Q3-Q1).

O valor adjacente inferior definido como o menor valor que maior ou igual a Q1-1,5(Q3-Q1),
sendo a diferena Q3-Q1 denominada intervalo inter-quartil (IIQ).

Valores outliers (discrepantes ou aberrantes) so valores que fogem da distribuio dos dados. O
box plot alm de apresentar a disperso dos dados torna-se til tambm para identificar a ocorrncia
destes valores como sendo os que caem fora dos limites estabelecidos pelos valores adjacentes supe-
rior e inferior.

Exemplo:
Tipo A: nvel de colesterol
181 202 218 233 239 246 250 254 276 312
197 212 224 234 239 248 252 268 291 325

Tipo B: nvel de colesterol


137 153 175 185 194 212 224 242 250 263
148 169 183 188 202 213 226 246 252 344

Tipo A:
n=20;
1
Q1 = x 1 = x 21 = x 1 = 218 + (224 218) = 218 + 1,5 = 219,5
4
( n +1)
4
5
4
4
3
Q3 = x 3 = x3 =x 3 = 254 + (268 254) = 254 + 10,5 = 264,5
4
( n +1)
4
( 21) 15
4
4

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 40


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Intervalo Inter-Quartil (IIQ): Q3-Q1 = 45.

325 o valor adjacente superior. Este o maior valor da distribuio, igual ou abaixo de 332, onde
332 dado por: 264,5 + 1,5 x 45 = 332 .

181 o valor adjacente inferior. o menor valor da distribuio, igual ou acima de 152, onde 152
dado por: 219,5 1,5 x 45 = 152 .

Tipo B
n=20
1
Q1 = x 1 = x 21 = x 1 = 175 + (183 175) = 175 + 2 = 177
4
( n +1)
4
5
4
4
3
Q3 = x 3 = x3 =x 3 = 242 + (246 242) = 242 + 3 = 245
4
( n +1)
4
( 21) 15
4
4

Intervalo Inter-Quartil (IIQ): Q3-Q1 = 68

344 o valor adjacente superior. Este o maior valor da distribuio, igual ou abaixo de 347, onde
347 dado por: 245 + 1,5 x 68 = 347 .

137 o valor adjacente inferior. o menor valor da distribuio, igual ou acima de 75, onde 75
dado por: 177 1,5 x68 = 75 .

380

360
340

320
300
280

260
240
220
200

180
160

140
120
A B

Fonte: Fonte: Hand DJ et alli. A handbook of small data sets. Chapman&Hall, 1994.
Grfico - Box plot da varivel nvel de colesterol segundo tipo de personalidade.

Exemplo 21
Os dados a seguir so de uma pesquisa que investigou as concentraes de minerais no leite mater-
no, no perodo de 1984 a 1985. Foram coletadas amostras de leite materno de 55 mulheres que tive-
ram seus filhos no Hospital Maternidade Odete Valadares, em Belo Horizonte. As mes foram divididas
em perodo de lactao: colostro e leite maduro.
clcio (g/mL de leite) grupo colostro
113 181 254 311 334 145 221 256 312 344
163 225 275 313 372 163 231 296 323 375
167 241 303 325 375 437
clcio (g/mL de leite) grupo maduro
159 175 181 188 200 206 213 214 217 231
238 238 242 244 256 259 260 263 264 275
277 279 281 293 302 303 314 344 394

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 41


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
a) Calcule a quantidade mdia de clcio (g/mL de leite) em cada grupo.
b) Calcule a quantidade mediana de clcio (g/mL de leite) em cada grupo.
c) Desenhe o box plot da concentrao de clcio (g/mL de leite) representando os dois grupos
em um s grfico.
d) Comente o grfico box plot quanto a disperso dos dados, existncia de valores aberrantes e
igualdade de medianas.

Exerccios suplementares
Exerccio S11
Os dados a seguir so provenientes de um estudo que avalia o crescimento de crianas de 7 a 10
anos de uma escola pblica do municpio de So Paulo no ano de 2008. Os dados apresentados so
de 16 meninos e 16 meninas para os quais foram aferidos a circunferncia do brao (CB) (cm):
Meninos
18,3 19,3 20,9 19,0 20,5 16,3 21,0 17,8 21,6 22,6
27,3 26,7 29,0 22,0 25,2 19,5
Meninas
21,5 16,1 18,6 19,9 17,9 23,7 20,0 19,4 23,5 18,0
23,0 17,9 20,3 23,1 17,8 18,2

a) Calcule a circunferncia braquial (cm) mdia e mediana para cada sexo.


b) Calcule a varincia, o desvio-padro e o coeficiente de variao de Pearson da circunferncia
braquial (cm) para cada sexo.
c) Meninos e meninas so parecidos quanto a circunferncia braquial (cm)?
d) E quanto variabilidade?

Exerccio S12
Os dados a seguir so provenientes de um estudo que avaliou o nvel de colesterol sanguneo (mg/dl)
de 100 homens.
id colesterol id colesterol id colesterol id colesterol
1 134 26 189 51 216 76 239
2 147 27 189 52 217 77 239
3 157 28 190 53 217 78 240
4 161 29 190 54 218 79 240
5 162 30 192 55 218 80 240
6 164 31 194 56 219 81 243
7 165 32 195 57 219 82 246
8 166 33 196 58 219 83 248
9 171 34 198 59 221 84 251
10 173 35 199 60 221 85 255
11 176 36 199 61 223 86 255
12 176 37 199 62 223 87 256
13 178 38 201 63 224 88 259
14 179 39 203 64 225 89 261
15 179 40 204 65 228 90 267
16 180 41 205 66 230 91 268
17 181 42 206 67 230 92 272
18 181 43 209 68 231 93 279
19 183 44 210 69 231 94 286
20 184 45 211 70 231 95 287
21 185 46 211 71 232 96 289
22 186 47 212 72 234 97 290
23 186 48 213 73 234 98 296
24 186 49 215 74 238 99 298
25 187 50 216 75 238 100 382

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 42


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
a) Desenhe o box plot do colesterol (mg/dl).
b) Comente o grfico box plot quanto a disperso dos dados, existncia de valores aberran-
tes e igualdade de medianas.

Correlao e regresso linear simples

Anlise simultnea entre duas variveis quantitativas (associao entre duas variveis quantitativas).

Grfico de disperso: deve ser feito antes da anlise numrica dos dados.
construdo com conjuntos de pontos formados por pares de valores (x,y). Pode indicar correlao
linear positiva, negativa ou inexistncia de correlao. Tambm til para identificar existncia de
valores aberrantes.

Ex: X: coeficiente de mortalidade por cncer gstrico


Y: consumo mdio de sal

correlao positiva

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 43


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Ex: X: Esperana de vida ao nascer
Y: Coeficiente de mortalidade infantil (por 1000 nascidos vivos)

correlao negativa

45
40
35
CMI (por 1000 nv)

30
25
20
15
10
5
0
66 68 70 72 74 76
Esperana de vida ao nascer

X: coeficiente de mortalidade por cncer de colo de tero


Y: consumo de sal
Y

correlao inexistente

Distino entre associao e causao: duas variveis podem estar associadas mas uma no ser
necessariamente a causa da outra.

Na correlao comum investigar se mudanas na magnitude de uma varivel so acompanhadas de


mudanas na magnitude da outra sem significar que uma varivel causa a outra.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 44


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Coeficiente de correlao de Pearson (
), l-se rh

Mede o grau de associao entre 2 variveis X e Y.

XY
=
Definio:
X Y , onde

XY a covarincia de X e Y (disperso conjunta)


X o desvio padro de X (disperso de X)
Y o desvio padro de Y (disperso de X)

Covarincia: o valor mdio do produto dos desvios de X e Y, em relao s suas respectivas mdias.
_
_

X i X Yi Y

XY =
N

_
_

i i
x x y y
estimador (r) r=
_ 2
_ 2

x i x y i y

Propriedades
a) 1 +1 ;
b) no possui dimenso, isto , no depende da unidade de medida das variveis X e Y ;

c) XY = YX .

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 45


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Grficos de disperso para diferentes valores do coeficiente de correlao (rho).

Exemplo:
Os dados a seguir so provenientes de um estudo que investiga a composio corporal e fornece o
percentual de gordura corporal (%), idade e sexo para 18 adultos com idades entre 23 e 61 anos.
a) Qual a relao entre a idade e o % de gordura? Existe alguma evidncia de que a relao
diferente entre pessoas do sexo masculino e feminino? Explore os dados graficamente.
b) Calcule o coeficiente de correlao de Pearson entre a idade e o % de gordura para homens e
mulheres. Interprete os resultados.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 46


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Idade % Gordura Sexo Idade % Gordura Sexo
23 9,5 M 53 34,7 F
23 27,9 F 53 42,0 F
27 7,8 M 54 29,1 F
27 17,8 M 56 32,5 F
39 31,4 F 57 30,3 F
41 25,9 F 58 33,0 F
45 27,4 M 58 33,8 F
49 25,2 F 60 41,1 F
50 31,1 F 61 34,5 F

M=masculino ; F= feminino
Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.
Disperso entre % de gordura e idade

70

f f
f ff f
60

f f f
50 f f
m
idade

f
40 f

30
m m
m f
20
5 10 15 20 25 30 35 40 45
gordura

Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.

Clculo do coeficiente de correlao de Pearson


Sexo: masculino
Idade % gordura
(X) (Y) (x x) ( y y) ( x x )( y y ) (x x)2 ( y y)2
23 9,5 -7,5 -6,13 45,94 56,25 37,52
27 7,8 -3,5 -7,83 27,39 12,25 61,23
27 17,8 -3,5 2,18 -7,61 12,25 4,73
45 27,4 14,5 11,78 170,74 210,25 138,65
30,5 15,625 236,45 291,00 242,13

236,45
Coeficiente de correlao (idade,%gordura) masculino:
r= = 0,89
291x 242,13

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 47


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Sexo: feminino
Idade % gordura
(X) (Y) ( x x ) ( y y ) ( x x )( y y ) (x x)2 ( y y)2
23 27,9 -27,86 -4,42 123,17 776,02 19,55
39 31,4 -11,86 -0,92 10,93 140,59 0,85
41 25,9 -9,86 -6,42 63,30 97,16 41,23
49 25,2 -1,86 -7,12 13,23 3,45 50,71
50 31,1 -0,86 -1,22 1,05 0,73 1,49
53 34,7 2,14 2,38 5,10 4,59 5,66
53 42 2,14 9,68 20,74 4,59 93,67
54 29,1 3,14 -3,22 -10,12 9,88 10,38
56 32,5 5,14 0,18 0,92 26,45 0,03
57 30,3 6,14 -2,02 -12,42 37,73 4,09
58 33 7,14 0,68 4,85 51,02 0,46
58 33,8 7,14 1,48 10,56 51,02 2,19
60 41,1 9,14 8,78 80,26 83,59 77,06
61 34,5 10,14 2,18 22,10 102,88 4,75
50,86 32,32 333,64 1389,71 312,12

333,64
Coeficiente de correlao (idade,%gordura) feminino:
r= = 0,51 ;
1389,71x312,12

Coeficiente de correlao considerando o grupo todo (homens e mulheres)

Idade % gordura
(X) (Y) (x x) ( y y) ( x x )( y y ) (x x)2 ( y y)2
23 9,5 -23,33 -19,11 445,93 544,44 365,23
27 7,8 -19,33 -20,81 402,35 373,78 433,10
27 17,8 -19,33 -10,81 209,01 373,78 116,88
45 27,4 -1,33 -1,21 1,61 1,78 1,47
23 27,9 -23,33 -0,71 16,59 544,44 0,51
39 31,4 -7,33 2,79 -20,45 53,78 7,78
41 25,9 -5,33 -2,71 14,46 28,44 7,35
49 25,2 2,67 -3,41 -9,10 7,11 11,64
50 31,1 3,67 2,49 9,13 13,44 6,19
53 34,7 6,67 6,09 40,59 44,44 37,07
53 42 6,67 13,39 89,26 44,44 179,26
54 29,1 7,67 0,49 3,75 58,78 0,24
56 32,5 9,67 3,89 37,59 93,44 15,12
57 30,3 10,67 1,69 18,01 113,78 2,85
58 33 11,67 4,39 51,20 136,11 19,26
58 33,8 11,67 5,19 60,54 136,11 26,92
60 41,1 13,67 12,49 170,68 186,78 155,97
61 34,5 14,67 5,89 86,37 215,11 34,68
Soma 1627,53 2970,00 1421,54

x = 46,33 ; y = 28,61 ; Sy =
( y y) 2

=
1421,54
= 9,14% ; S X =
(x x) 2

=
2970,0
= 13,22anos
n 1 17 n 1 17

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 48


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
1627,53
r= = 0,79
2970,0 x1421,54

Anlise simultnea de duas variveis quantitativas.

REGRESSO LINEAR

ADMITINDO-SE Y COMO FUNO LINEAR DE X, AJUSTA-SE A MELHOR RETA AO CONJUNTO DE


DADOS.

EQUAO DE RETA: y = a + bx , onde

y = valor ajustado (valor mdio predito).

x = valor escolhido de X.

a = y bx ; a denominado intercepto; o valor predito para x=0.


sy
b = rxy ; b denominado coeficiente angular (slope). Indica quantas unidades de Y
sx
mudam para a mudana de uma unidade de X.

Utilizando-se os dados do exemplo considerando-se o grupo como um todo:

a = 28,61 b 46,33 ;

9,14
b = 0,79 x = 0,548
13,22

Para aumento de 1 ano, o percentual de gordura aumenta 0,55%.

Substituindo-se o valor b em a, obtm-se a=3,221.

Equao ajustada % gordura= 3,22 + 0,55 (idade)

Com base nesta equao possvel traar a reta que passa pelos pontos.

Para x = 30; y = 19,7; para x = 50, y = 30,7 50


y = 0,55x + 3,22
40
% gordura

30
20
10
0
0 20 40 60
idade (anos)

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 49


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
OBS: o coeficiente angular depende das unidades de medida de X e Y. Isto deve ser considerado

na deciso da importncia do coeficiente angular.

O coeficiente angular da equao de Y=f(X) diferente do coeficiente angular de X=f(Y), a menos

que os desvios padro de X e Y sejam iguais.

Usos da reta de regresso:

- Predio - utilizar X para predizer Y; quando a correlao for forte, melhor a predio;
- Correlao mede o grau de relacionamento linear entre X e Y;
- Resumir os dados cada valor de X tem um valor mdio de Y.

Exemplo:
Em um estudo sobre o efeito dos componentes de uma dieta (X) sobre a composio lipdica (Y) fo-
ram obtidos os seguintes dados em uma amostra de 15 animais.
Componente da dieta (X) Composio lipdica (Y)
18 30
21 35
28 43
35 60
47 50
33 28
40 40
41 60
28 43
21 30
30 33
46 65
44 68
38 62
19 25
Fonte:X.
a) Apresente os dados em um diagrama de disperso.
b) Calcule o coeficiente de correlao de Pearson entre X e Y.
c) Calcule a reta de regresso da composio lipdica como funo do componente da dieta.
d) Desenhe a reta de regresso.
e) Interprete os coeficientes da reta de regresso.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 50


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Exerccio suplementar
Exerccio S13
So apresentados valores da massa do corpo sem gordura (kg) e da taxa de metabolismo (calorias)
de 10 pessoas de ambos os sexos

Pessoa Sexo Massa Taxa


1 M 62,0 1792
2 M 62,9 1666
3 F 36,1 995
4 F 54,6 1425
5 F 48,5 1396
6 F 42,0 1418
7 M 47,4 1362
8 F 50,6 1502
9 F 42,0 1256
10 M 48,7 1614
Fonte: Moore et al., 2004 (adaptado)

a) Apresente os dados em um diagrama de disperso com pontos identificando os sexos. Apre-


sente a varivel Y, taxa de metabolismo, como varivel resposta (dependente) e a varivel X,
massa do corpo sem gordura, como explicativa (independente).
b) Calcule o coeficiente de correlao entre as variveis taxa e massa.
c) Calcule os coeficientes da reta de regresso e desenhe a reta.
d) Interprete os coeficientes da reta.
e) Com base no grfico de disperso, voc diria que o coeficiente de correlao de Pearson para
o sexo feminino maior, menor ou igual ao do sexo masculino? Justifique.

Medidas de Associao

ANLISE DA DISTRIBUIO DE DUAS VARIVEIS QUALITATIVAS

ESTUDO DE PREVALNCIA

So apresentados dados sobre o estado nutricional de 1226 crianas brasileiras de 2 anos de idade,
segundo sexo. Local X, Ano Y.
Estado nutricional Masculino Feminino Total
Desnutridas 29 20 49
Normais 574 603 1177
Total 603 623 1226
Fonte: dados hipotticos.
49
Prevalncia de desnutrio: = 0,040 ou 4%.
1226
Prevalncia de desnutrio segundo sexo:
29 20
Masculino: = 0,05 ou 5,0%; Feminino: = 0,032 ou 3,2%.
603 623
29
Razo de prevalncias: 603 = 1,5
20
623
Diferena de prevalncias: 0,05-0,032=0,018 ou 1,8%.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 51


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
A prevalncia de desnutrio parece ser maior entre as crianas do sexo masculino. Os meninos apre-
sentam uma prevalncia 50% maior do que as meninas.

A prevalncia de desnutrio entre meninos 1,5 vezes (uma vez e meia) a prevalncia de desnutri-
o entre meninas.

Tambm possvel dizer que a prevalncia de desnutrio entre meninos 50% maior que a preva-
lncia entre meninas, calculado como (1,5-1)x100.

Para a diferena de prevalncias diz que a prevalncia entre meninos excede a de meninas em 1,8%
ou que a diferena entre as prevalncias de 1,8%.

Se a razo de prevalncias for igual a 1 ou a diferenas de prevalncias for igual a 0 ento diz-se que
as variveis no esto associadas.

De forma geral
Y: varivel resposta (Ex: desnutrio)
X: varivel explicativa ou de confuso (Ex: sexo)
Varivel Y
Varivel X Y1 Y0 Total (%)
X1 a B n1 (100
X0 c D n0 (100
Total m1 m2 n (100)

p= prevalncia de Y1= m1/n


p1= prevalncia de Y1|x1= a/n1
p0= prevalncia de Y1|x0= c/n0
rp= razo de prevalncias= p1/p0; dp=diferena de prevalncias= p1-p0

Exemplo 22

Distribuio de indivduos segundo presena de obesidade e consumo de chocolate. Esto-


colmo, Sucia. Ano 2009.
Consumo de chocolate Obesidade (> 30Kg/m2)

Sim No Total
Mais de 1 vez por semana 128 625 753
At 1 vez por ms 68 353 421
Total 196 978 1174
Fonte: dados adaptados de Janszky I, Mukamal KJ, Ljung R, et al. Chocolate consuption and
mortality following a first acute myocardial infarction: The Stockholm Heart Epidemiology
Program. Journal of Internal Medicine 2009; 266: 248-257.

a) Calcule a prevalncia de obesidade entre pessoas que consomem chocolate at 1 vez por
ms.
b) Calcule a prevalncia de obesidade entre pessoas que consomem chocolate mais de uma vez
por semana.
c) Calcule a razo de prevalncias.
d) Interprete a razo de prevalncias. Voc diria que a obesidade est associada ao consumo de
chocolate? Justifique.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 52


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
ESTUDO DE INCIDNCIA

Distribuio de pessoas segundo hbito de fumar e morte em 5 anos por DIC. Local X. Ano Y
Morte em 5 anos por DIC
Fumar Sim No Total
Sim 208 850 1058
No 264 1467 1731
Total 472 2317 2789
Fonte: dados hipotticos.

r= 472/2789= 0,17 = 17%

r1=208/1058= 0,20= 20%

r0=264/1731= 0,15=15%

rr=0,20/0,15= 1,33

ra= 0,20- 0,15= 0,05= 5%

A incidncia de mortes parece ser maior entre as pessoas que fumam. Os fumantes apresentam uma
incidncia 33% maior do que os no fumantes.

Os bitos so 1,33 vezes mais incidentes entre fumantes do que entre no fumantes.

Tambm possvel dizer que os bitos so 33% maiores entre fumantes.

Pela diferena diz-se que 5% dos bitos excedentes so devidos ao fumo.

De forma geral
Y: varivel resposta
X: varivel explicativa ou de confuso
Varivel Y
Varivel X Y1 Y0 Total (%)
X1 A B n1 (100
X0 C D n0 (100
Total M1 m2 n (100)

r= incidncia de Y1= m1/n


r1= incidncia de Y1|x1= a/n1
r0= incidncia de Y1|x0= c/n0
ri= razo de incidncias= r1/r0
di= diferena de incidncias= r1-r0

incidncia risco
r1 r0 r1/r0 r1-r0
ri=rr=razo de riscos=risco relativo=r1/r0
di= ra= risco atribuvel= r1-r0

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 53


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Exemplo 23
Padro de amamentao de crianas segundo episdios de doenas respiratrias.
Padro Um ou mais episdios Nenhum episdio Total
Mamadeira e peito 207 238 445
Somente peito 34 72 106
Total 241 310 551
Fonte: Abramson JH e Abramson ZH.

a) Calcule a incidncia de um ou mais episdios de doenas respiratrias, dado que a criana se


alimenta de mamadeira e peito.
b) Calcule a incidncia de um ou mais episdios de doenas respiratrias, dado que a criana se
alimenta somente ao seio.
c) Calcule a razo de incidncias.
d) Calcule a diferena de incidncias.
e) Discuta os resultados.

Exemplo
Investigao de toxinfeco alimentar
Toxiinfeco
Tomou sorvete de baunilha Sim No Total (%)
Sim 43 11 54 (100)
No 3 18 21 (100)
Total 46 29 75 (100)
Fonte:Epi Info, 2000.

r= incidncia global = taxa de ataque global= 46/75= 0,61

r1= incidncia entre quem tomou sorvete= taxa de ataque1= 43/54= 0,80

r0= incidncia entre quem no tomou sorvete= taxa de ataque0= 3/21= 0,14

43 3 43x 21
rr= risco relativo= : = = 5,6
54 21 3x54
Odds ratio

Odds e probabilidade

Supor que durante um jogo de basquete um jogador acerta a cesta 2 vezes em 5 tentativas.
2
Chamando p ( p chapu) de probabilidade de acerto tem-se que p = = 0,4 ou 40% e a probabili-
5
3
dade de erro, q = = 0,6 ou 60%.
5

Considerando-se que a probabilidade de acerto ou de erro = p+q= 1; ento q = 1 p .

Odds ratio

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 54


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Define-se odds como a razo entre a probabilidade de acerto e a probabilidade de erro, ou seja,
p
.
1 p
2
p 2 x5 2
No exemplo acima, o odds a favor de acerto = 5 = = = 0,67 ou 0,67:1 (0,67 acertos
1 p 3 3 x5 3
5
para 1 erro).

Estudo do tipo caso-controle

Os dados a seguir so de um estudo sobre cncer de esfago e consumo de lcool. Local X. Ano Y.
Condio Consumo mdio de lcool (g/dia) Total
80 e + 0-79
Casos 96 104 200
Controles 109 666 775
Total 205 770 975
Fonte: Tuyns et al.,1977.

96 109 96
(entre expostos) odds a favor de casos entre consumidores de 80 e + g/dia: : = = 0,88
205 205 109

(entre no expostos) odds a favor de casos entre consumidores de 0-79g/dia: 104 : 666 = 104 = 0,16
770 770 666
96 104 96 x 666
odds ratio: : = = 5,6
109 666 109 x104

A fora de morbidade de cncer de esfago entre consumidores de 80 e + g/dias de bebida alcolica


5,6 a fora de morbidade entre os que consomem de 0 a 79g/dia.

Em casos especiais, o odds ratio pode ser um bom estimador do risco (quando a doena de estudo
rara).

Odds ratio utilizando-se os dados de DIC. or=(208x1467)/850x265)=1,36.

De forma geral
Y: varivel resposta
X: varivel explicativa ou de confuso
Varivel Y
Varivel X Y1 Y0 Total (%)
X1 a B n1 (100
X0 c D n0 (100
Total m1 m2 n (100)
odds a favor de Y1:
na categoria X1= (a/n1)(b/n1)
na categoria X0= (c/n0)(d/n0)
a
ad
odds ratio: [(a/n1)(b/n1)][(c/n0)(d/n0)]= b =
c bc
d

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 55


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Exemplo 24
Distribuio de recm-nascidos segundo condio caso - com defeitos do tubo neural; controle re-
cm-nascidos que no tinham defeitos do tubo neural e dieta materna. Local X. Ano Y.
Dieta Casos Controles Total
N % n % n %
Boa 34 13,9 43 35,0 77 21,0
Razovel 110 45,1 48 39,0 158 43,0
Pobre 100 41,0 32 26,0 132 36,0
Total 244 100 123 100 367 100
Fonte: X
Considere a dieta boa como categoria de referncia (basal) e calcule:

a) O odds ratio de dieta razovel em relao a dieta boa.


b) O odds ratio de dieta pobre em relao a boa.
c) Interprete os resultados.

QUI-QUADRADO DE PEARSON

DUAS VARIVEIS QUALITATIVAS

Os exemplos so retirados de BUSSAB, Wilson de O; MORETTIN, Pedro A. Estatstica bsica. 5 Ed.


So Paulo: Saraiva, 2004.

X - curso universitrio e
Y sexo do aluno

Questo: sexo do indivduo influi na escolha do curso?

Situao 1
Curso Masculino Feminino Total
n n n
Economia 24 36 60
Administrao 16 24 40
Total 40 60 100

Curso Masculino Feminino Total


N proporo n proporo n proporo
Economia 24 0,6 36 0,6 60 0,6
Administrao 16 0,4 24 0,4 40 0,4
Total 40 1 60 1 100 1

As propores de escolha dos cursos no diferem segundo sexo do estudante

Definio de independncia:
A Ser do sexo masculino;
B Estar cursando economia.

A e B so independentes se P(A e B) = P(A) x P(B).

P(A e B) = Probabilidade (ser homem e estar cursando Economia)

24
P(A e B) = = 0,24
100

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 56


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
40 60
P(A) = = 0,4 P(B) = = 0,6
100 100

24 40 60
Como = x , ento A e B so independentes e portanto no existe associao.
100 100 100

Situao 2

Curso Masculino Feminino Total


n n n
Fsica 100 (a) 20 (b) 120
Cincias Sociais 40 (c) 40 (d) 80
Total 140 60 200

Curso Masculino Feminino Total


n proporo n proporo n proporo
Fsica 100 0,7 20 0,3 120 0,6
Cincias Sociais 40 0,3 40 0,7 80 0,4
Total 140 1 60 1 200 1

A distribuio de alunos em cada curso, segundo sexo no a mesma, sexo e curso podem estar
associados.

Se a varivel sexo no fosse associada escolha do curso, quantos indivduos espera-se em Fsica,
entre os homens?

Aplicar a proporo marginal utilizando o raciocnio da regra de trs: 120 est para 200 assim como x
120 x 120 x140
estar para 140; ou seja: = e x=
200 140 200

Para os demais valores esperados observar os clculos abaixo.

Curso Sexo Valor Esperado sob a condio de independncia


120
Fsica Masculino (a) x140 = 84
200
120
Fsica Feminino (b) x60 = 36
200
80
Cincias Sociais Masculino (c) x140 = 56
200
80
Cincias Sociais Feminino (d) x60 = 24
200

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 57


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Tabela de frequncias esperadas, sob a condio de independncia.

Curso Masculino Feminino Total


n n n
Fsica 84 36 120
Cincias Sociais 56 24 80
Total 140 60 200

Valores observados Valores esperados (O-E) (O-E)2 (O E ) 2


O E
E
100 84 16 256 3,048
40 56 -16 256 4,571
20 36 -16 256 7,11
40 24 16 256 10,667
= Qui-quadrado=25,397

O Qui-quadrado obtido somando-se a diferena ao quadrado entre as frequncias observadas e as


esperadas, dividido pelas frequncias esperadas.

(O E ) 2
=
2
E

Se o Qui-quadrado for igual a zero, ento no existe associao entre as variveis.

Exemplo:
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo
condio de sobrevivncia e peso ao nascer (g).

Peso ao nascer bito Sobrevida Total


Baixo peso (<2500) 24 13 37
No baixo peso (2500 e mais) 3 10 13
Total 27 23 50
Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.

Clculo do qui-quadrado de Pearson


(O-E)2
Valores observados Valores esperados
O E
(O-E)
(O E ) 2
E
24 19,98 4,02 16,16 0,809
3 7,02 -4,02 16,16 2,302
13 17,02 -4,02 16,16 0,949
10 5,98 4,02 16,16 2,702
Qui-quadrado=6,762

Tem-se ainda que:


A incidncia de bitos entre crianas com baixo peso 24 = 0,65 ou 65%;
37
a incidncia de bitos entre crianas sem baixo peso 3 = 0,23 ou 23%;
13

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 58


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
24
e a razo de incidncias igual a 37 24 x13 .
= = 2,81
3 3 x37
13
Portanto pode-se dizer que a incidncia de bitos parece maior entre as crianas que tiveram baixo
peso ao nascer. O risco de bito entre as crianas com baixo peso ao nascer 2,8 o risco das crianas
com peso ao nascer maior ou igual a 2.500g. O qui-quadrado diferente de zero. Pode-se suspeitar
da existncia de associao entre as variveis.

Exemplo 25
A tabela abaixo apresenta dados de classificao de pessoas segundo doena isqumica coronariana
(DIC) e hbito de consumo de caf, para uma coorte de 1718 homens com idade 40-55 anos.

Distribuio de homens segundo presena de doena isqumica coronariana (DIC) e consumo de caf.
Local X. Ano y.
Condio Consumo mdio de caf Total
Alto ( 100 xcaras/ms) Moderado (<100 xcaras/ms)
Com DIC 38 39 77
Sem DIC 752 889 1641
Total 790 928 1718
Fonte: X.

a) calcule a incidncia de doena isqumica coronariana entre as pessoas com alto consumo de
caf.
b) calcule a incidncia de doena isqumica coronariana entre as pessoas com consumo mode-
rado de caf.
c) calcule a razo de incidncias.
d) calcule a diferena de incidncias.
e) Interprete os resultados.
f) Calcule o qui-quadrado de Pearson.

EXERCCIOS SUPLEMENTARES

Exerccio S14
Com base nos dados da tabela calcule:
a) a incidncia de toxinfeco, dado que o indivduo consumiu presunto cozido.
b) a incidncia de toiinfeco, dado que o indivduo no consumiu presunto cozido.
c) a razo de incidncias.
d) a diferena de incidncias.
e) discuta os resultados.
Distribuio de indivduos segundo ocorrncia de toxiinfeco e consumo de presunto cozido. Local X.
Ano Y
Toxiinfeco
Presunto cozido sim (taxa de ataque %) no Total
Sim 29 (0,63) 17 46
No 17 (0,59) 12 29
Total 46 (0,61) 29 75
RR 1,1
Fonte: Epi-Info 2000.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 59


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Exerccio S15
Os dados so de um estudo sobre consumo de pimenta e cncer gstrico, realizado no Mxico. Ano Y.
Consumo de pimenta Casos Controles Total
Sim 211 607 818
No 9 145 154
Total 220 752 972
Fonte: X.
a) calcule o odds a favor de casos entre pessoas que consomem pimenta.
b) calcule o odds a favor de casos entre pessoas que no consomem pimenta.
c) calcule a razo dos odds (odds ratio).
d) calcule o qui-quadrado de Pearson.
e) Discuta os resultados sobre possvel associao entre as variveis.

Exerccio S16
A tabela abaixo apresenta o nmero de crianas classificados segundo nvel de retinol srico e sexo.
Calcule a prevalncia de nvel inadequado de retinol para crianas de cada um dos sexos. Calcule a
razo de prevalncias. Calcule o qui-quadrado. Interprete os resultados.

Distribuio de crianas segundo sexo e nvel de retinol srico. Cansao, Bahia, 1992
Sexo Nvel de retinol
Aceitvel Inadequado Total
Masculino 50 40 90
Feminino 39 32 71
Total 89 72 161
Fonte: Prado MS et al. ,Revista de Sade Pblica, 29(4)295 300, 1995.

Exerccio S17
Os dados a seguir so de pesquisa que estuda a associao entre amamentao ao seio e Diabetes
Mellitus tipo I . Local X. Ano Y.
Amamentao ao Casos Controles Total
seio
No 35 17 52
Sim 311 329 640
Total 346 346 692
Fonte: Gimeno SGA. Consumo de leite e o Diabetes Mellitus insulino-dependente:um estudo
caso-controle. Tese de doutorado, 1996.

Com base nos dados apresentados


a) Calcule o odds ratio de casos entre expostos e no expostos.
b) Calcule e apresente o qui-quadrado de Pearson.
c) Os dados sugerem existncia de associao entre as variveis? Justifique.

Noes de probabilidade e distribuio Bernoulli e distribuio binomial

PROBABILIDADE (probability, chance, likelihood)


uma afirmao numrica sobre a possibilidade de que algum evento ocorra.
Quantifica o grau de incerteza de eventos, variando de 0 (0%) a 1 (100%).
Um evento impossvel de ocorrer tem probabilidade 0 (zero).
Um evento certo tem probabilidade 1 (um).
Quando se joga uma moeda, no se sabe se vai sair cara. Mas sabe-se que a probabilidade de sair
cara 0,5 = 50% = 1/2.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 60


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Dizer que a eficcia de uma vacina de 70% corresponde a dizer que cada indivduo vacinado tem
probabilidade 0,7 de ficar imune.

Probabilidade em espaos finitos contveis

Espao amostral (S)


o conjunto de todos os resultados possveis de um experimento.

Supor o experimento lanar uma moeda: S= {cara, coroa}

H dois pontos neste espao amostral, sendo um favorvel ao evento A={cara}.

Definio clssica de probabilidade

numero de elementos de A 1
P( A) = = = 0,5
numero de elementos de S 2

13 1
Exemplo: probabilidade de (ouros) = =
52 4

Probabilidade de eventos mutuamente excludentes


Diz-se que dois eventos so mutuamente excludentes (ou mutuamente exclusivos) quando no
podem ocorrer simultaneamente.

Exemplo:
A = {cara} ; B= {coroa}, no lanamento de uma moeda;
A = {carta com naipe vermelho}; B={carta com naipe preto}, na retirada de uma carta de baralho.

Exemplo de eventos no mutuamente exclusivos


A= {naipe vermelho} ; B = {s} .

A probabilidade da ocorrncia de um evento A ou de um evento B :


P(A ou B) = P(A B) = P(A) + P(B) P(A B)

Exemplo: P(naipe vermelho ou s) = P(naipe vermelho) + P(s) P(naipe vermelho e s) = (26/52)


+ (4/52) (2/52) = 28/52 = 0,538.

A probabilidade da ocorrncia simultnea de eventos mutuamente exclusivos zero.


P(cara e coroa) = P(cara coroa) = 0, no lanamento de uma moeda.

Se A e B forem mutuamente excludentes, P(A B) = 0 e


P(A ou B) = P(A B) = P(A) + P(B)

Exemplo:
P(Face 2 ou Face 3) no lanamento de um dado
P(2 ou 3)= P(2)+P(3)= 1/6 + 1/6 = 2/6 = 1/3.

P(Resultado mpar)= P(1 ou 3 ou 5)= P(1)+P(3)+P(5)= 3/6 = 1/2.

Regra da adio: P(A ou B) = P(A B) = P(A) + P(B) P(A B)

Probabilidade de eventos independentes

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 61


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Os eventos A e B so independentes quando o resultado de um no influi no resultado do outro.

Exemplo: no lanamento simultneo de duas moedas, o resultado de uma no interfere no resultado


da outra.

A probabilidade da ocorrncia de eventos independentes o produto das probabilidades de cada


evento.
P(A e B)= P(A B) = P(A) x P(B)

P(face 2 no primeiro dado e face 3 no segundo dado), no lanamento sequencial de dois dados =
P(2 e 3) = P(2)xP(3)= 1/6 x 1/6= 1/36= 0,0278= 2,78%.

Probabilidade condicional

A probabilidade condicional do evento A dado que ocorreu o evento B


P ( A B)
P( A | B ) = , para P( B) 0
P( B)
L-se P(A|B) como probabilidade de A dado B.

Exemplo:
Probabilidade de rei dado que ocorreu figura:
P(r|figura)= P(r e figura)/P(figura)= 4/52 12/52= 4/12= 1/3

Probabilidade de rei, dado que ocorreu copas:


P(r|)= P(r e )/P()= 1/5213/52= 1/13

Regra da multiplicao
P( A B) = P( A | B) xP( B)
se A e B forem independentes, P(A|B) = P(A) e como consequncia, P( A B) = P( A) xP( B)

Exemplo
Considerar uma populao de homens que foram classificados segundo o hbito de fumar e doena
respiratria crnica. Nesta populao sabe-se que 5% dos homens tm doena respiratria e so no
fumantes, 15% tm doena e so fumantes, 50% no tm doena e so no fumantes e 30% no
tm a doena e so fumantes.

Problema respiratrio No fumante Fumante


S S
No ( R ) 0,5 = P( S R ) 0,30 = P( R S ) 0,80 = P( R )
Sim (R) 0,05 = P( S R ) 0,15 = P(SR) 0,20 = P(R)
0,55 = P( S ) 0,45 = P(S)

Escolhe-se um homem ao acaso, qual a probabilidade dele ter doena respiratria dado que era fu-
mante?
P( R S )
P( R | S ) = = 0,15/0,45 = 0,33
P(S )
Os eventos no so independentes porque P ( S R ) P ( S ) xP ( R )

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 62


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Relao entre eventos mutuamente exclusivos e independentes:

Os eventos mutuamente exclusivos A e B satisfazem a condio que P(A e B) = 0, ento dois eventos
mutuamente exclusivos A e B so no independentes a menos que P(A)=0 ou P(B)=0. Caso contrrio,
eles so claramente dependentes pois P(A)P(B)>0 se ambos P(A)>0 e P(B)>0, portanto
P ( A B ) P ( A) P ( B ) porque P ( A B ) = 0 .

Assim, dois eventos mutuamente exclusivos A e B so dependentes exceto nos casos onde P(A)=0 ou
P(B)=0.

Definio frequentista de probabilidade:


m
n repeties do evento A; A ocorre m vezes, ento a frequncia relativa de A=
n
m m
Para n suficientemente grande, P ( A) ou seja, lim n = P( A)
n n
m
Quando n cresce, tende a se estabilizar em torno de uma constante, P(A)
n

Varivel aleatria discreta

Varivel aleatria qualquer funo de nmero real, definida no espao amostral e existe associado a
este nmero uma probabilidade de ocorrncia.

Exemplo:
No lanamento de 1 moeda, o nmero de caras uma varivel aleatria. Se esta varivel for denomi-
nada X, tem-se que os valores possveis para X so 0 e 1. Assim escreve-se X:0,1.

A probabilidade de cara 0,5: P(cara)= 0,5= 1/2.

No lanamento de 10 moedas, X:0, 1, 2,....,10; e a probabilidade de cara = 0,5.


Sair cara mutuamente exclusivo de sair coroa e um particular resultado de cada lanamento inde-
pende dos demais.

possvel calcular a probabilidade da varivel assumir cada valor x, ou seja, P(X=x).

O conjunto de valores da varivel aleatria e das probabilidades obtidas define uma distribuio de
probabilidades. Se X assume valores inteiros, a varivel denominada discreta. Se X assume valo-
res no conjunto dos nmeros reais, a varivel denominada contnua.

Distribuio de probabilidades

Modelo de probabilidade Bernoulli

Estrutura bsica: duas possibilidades de resultado (sucesso e fracasso).

Exemplo:
Joga-se uma moeda uma vez. A moeda equilibrada, ou seja, os lados possuem peso igual, no favo-
recendo nenhum dos lados, ao ser lanada.

Define-se como sucesso sair cara.

Define-se a varivel aleatria X que assume valor 1 se ocorrer sucesso e 0 se ocorrer fracasso. X: 0,1

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 63


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Parmetro: probabilidade da varivel assumir valor 1.
Notao: ou p.
Se probabilidade de sucesso = p, a probabilidade de fracasso ser igual a q=(1-p), porque p+q=1.

Probabilidade de sair cara = P(X=1) = p(1) = p = 0,5.

Probabilidade de sair coroa = P(X=0) = p(0) = q = 1-p = 0,5

Graficamente:

1 p(x)

0,8

0,6

0,4

0,2

0
0 1 x

p=0,5
Exemplo:

Uma droga cura 15% dos pacientes. Administra-se a droga a um paciente. Qual a probabilidade do
paciente ficar curado? Qual a probabilidade do paciente no ficar curado?
X: 0,1 (X ser 0 se o paciente no se curar e 1 se houver cura)

P(X=1) =p(1)=p= 0,15 ; P(X=0) =p(0)= q=0,85

1 p(x)

0,8
0,6
0,4

0,2
0
0 1 x
p=0,15

Os exemplos pertencem a mesma famlia de distribuies, mas tm parmetros diferentes.

A distribuio de Bernoulli pode ser escrita como P(X=1) = p(1)=p e P(X=0) =p(0) =1-p; ou, de for-
ma mais genrica:

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 64


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Isto significa que p( x ) = p x (1 p) 1 x , x=0,1
para x=0, p(0) = P(X = 0) = p 0 (1 p)10 = 1 p ,

para x=1, p(1) = P(X = 1) = p1 (1 p)11 = p

Mdia de uma varivel aleatria discreta: = E (X) = xp( x )


x
Na distribuio de Bernoulli:

= E(X) = xp( x ) = 1p( x = 1) + 0p( x = 0) = p


x

Mdia da distribuio Bernoulli p (probabilidade de ocorrer o sucesso)

Varincia de uma varivel aleatria discreta:

2 = V(X ) = E[(X ) 2 ] = ( x ) 2 p( x )
x

Desvio padro: SD(X) = V (X) =


Desvio padro da distribuio Bernoulli

(0 p) 2 .p( x = 0) + (1 p) 2 .p( x = 1) =

( p ) 2 .(1 p ) + (1 p ) 2 p = p (1 p )[ p + (1 p )] = pq

Resumindo,
Modelo de probabilidade Bernoulli
Uma varivel aleatria discreta X que pode assumir valores 0 e 1, com funo de probabilidade dada
x 1 x
por p ( x ) = p (1 p ) com x=0,1
segue uma distribuio Bernoulli com parmetro p , 0<p<1.

p a probabilidade de obter o resultado X=1. Isto pode ser escrito como X~Bernoulli(p) com mdia p

e desvio padro p(1 p) .


O smbolo ~ l-se tem distribuio ou se distribui segundo.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 65


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Distribuio binomial: Soma de n distribuies Bernoulli

Populao: 2 categorias
Ex: sexo (masculino, feminino),
faces de uma moeda (cara, coroa),
desfecho de um tratamento (cura, no cura)

Cara (K) probabilidade(K) = p



Lanamento de uma moeda Coroa (C) probabilidade (C) = q
p + q = 1 q = 1 - p

p = probabilidade de sucesso; q= probabilidade de fracasso.

Realiza-se o experimento n vezes, onde cada ensaio independente do outro e os resultados so


mutuamente exclusivos.

X: Nmero de vezes que sai cara.

A moeda lanada uma vez (n=1) X: 0,1 X~Bernoulli(p)


X resultado P(X=x)
0 C P(X=0) = q
1 K P(X=1) = p

A moeda lanada duas vezes (n=2) X: 0,1,2 X~B(n=2, p)


X resultado P(X=x)
0 C,C P(X=0) = q.q = q2
1 K,C ou C,K P(X=1) = p.q+q.p= 2.p.q
2 K,K P(X=2) = p.p= p2

A moeda lanada trs vezes (n=3) X: 0,1,2,3 X~B(n=3, p)


X resultado P(X=x)
0 C,C,C P(X=0) = q.q.q = q3

1 K,C,C ou P(X=1) = p.q.q+q.p.q +q.q.p =


C,K,C ou 3 p.q2
C,C,K

2 K,K,C ou P(X=2) = p.p.q +p.q.p +q.p.p =


K,C,K ou 3 p2.q
C,K,K

3 K,K,K P(X=3) = p.p.p = p3

Probabilidade (X=x) calculada pelo produto de 3 fatores:


1o - nmero (combinao de n elementos combinados x a x);
2o - probabilidade de sucesso elevado a um expoente (valor de x);
3o - probabilidade de fracasso elevado a um expoente (valor de n-x).

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 66


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
n n!
P( X = x) = p x q n x = p x q n x
x x! (n x)!

Resumindo
Modelo de probabilidade Binomial

Seja E um experimento com 2 resultados (mutuamente exclusivos): S (sucesso) e F (fracasso)


p = probabilidade de ocorrncia de S e q= probabilidade de ocorrncia de F
sendo que p+q=1.
Se E for repetido n vezes, de forma independente, mantendo-se p e q, a probabilidade da varivel
aleatria X= nmero de vezes que S ocorre dada por
n!
P( X = x ) = p x q n x X~B(n,p) onde n e p so os parmetros da
x !(n x )!
distribuio; a mdia = m = n.p, a varincia = n.p.q e o desvio padro = npq

Exemplo
Lanamento de moedas.
n= nmero de ensaios (n de lanamentos)= 10;
X= varivel aleatria (n de caras);
x= resultado particular de X (0, 1, 2, ...,10);
p= probabilidade de ocorrer cara (sucesso); p=P(cara)= 0,5.
n
P( X = x) = p x (1 p ) n x
x
Distribuio de probabilidade B(n=10; p=0,5)

X= n de caras P(X=x) 0,30 p(X=x)


0 0,0010 0,25
1 0,0098
0,20
2 0,0439
3 0,1172 0,15
4 0,2051 0,10
5 0,2461 0,05
6 0,2051 0,00
7 0,1172 0 1 2 3 5 5 6 7 8 9 10
8 0,0439 4
X
9 0,0098
10 0,0010
1

Mdia = np = 10x0,5 = 5.

Varincia = npq = 2,5.


Desvio padro = npq = 10 x 0,5 x 0,5 = 2,5 = 1,58 .

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 67


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
X
Se estivermos trabalhando com a proporo de sucessos, :
n
p
Mdia = n = p = 0,5
n
p q pq
Varincia = n x = = 0,025
n n n

npq npq pq
Desvio padro = = = = 0,158
n n2 n
Exemplo 26

Um programa de incentivo amamentao exclusiva ao seio nos primeiros 3 meses est sendo execu-
tado em um hospital universitrio. Verificou-se que a eficcia do programa era de = 60%.
Para uma amostra de 20 mes que deram luz neste hospital, a distribuio de probabilidade da vari-
vel aleatria nmero de mes amamentando exclusivamente ao seio a seguinte:

X= n de mes P(X=x|p=0,6)
amamentando
0 0,000
1 0,000 0,20 p(X=x)
2 0,000 0,18
3 0,000
0,16
4 0,000
0,14
5 0,001
6 0,005 0,12

7 0,015 0,10

8 0,035 0,08
9 0,071 0,06
10 0,117 0,04
11 0,160
0,02
12 0,180
0
13 0,166
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
14 0,124
15 0,075 X

16 0,035
17 0,012
18 0,003
19 0,000
20 0,000

Calcule a mdia, a varincia e o desvio-padro.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 68


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Exemplo 27
Uma suspenso contendo organismos de Leishmania preparada e quando uma determinada quanti-
dade inoculada em ratos, 30% deles se tornam infectados. Se 3 ratos forem inoculados independen-
temente, qual a probabilidade de:

a) Nenhum rato ficar infectado?

3 0 3 3! 3
P(X=0) = (0,3) (0,7) = (0,7) = 1x0,343 = 0,343 = 34,3%
0 0!(3 0)!

b) Um rato ficar infectado?

3 1 3 1 3! 3 x 2 x1
P(X=1) = (0,3) (0,7) = (0,3) 1 (0,7) 31 = 0,3 x0,49 = 0,441 = 44,1%
1 1! (3 1)! 1x 2 x1

c) Dois ratos ficarem infectado?

3 3! 3 x 2 x1
P(X=2) = (0,3) 2 (0,7) 3 2 = (0,3) 2 (0,7) 3 2 = 0,09 x0,7 = 0,189 = 18,9%
2 2! (3 2)! 2 x1x1

d) Todos os ratos ficarem infectados?

3 3 3 3 3! 3 x 2 x1
P(X=3) = (0,3) (0,7) = (0,3) 3 (0,7) 0 = 0,027 x1 = 0,027 = 2,7%
3 3! (3 3)! 3 x 2 x1x1

e) Pelo menos 2 fiquem infectados?

f) No mximo 1 fique infectado?

Exemplo 28
Uma indstria de alimentos est realizando testes com um bolo que ser comercializado. Durante a
prova do bolo, 20% das pessoas selecionadas para tal tarefa acharam o sabor muito doce. Supondo
que 5 pessoas provaro o bolo novamente, qual a probabilidade de:
a) Nenhuma pessoa achar o bolo muito doce?
b) Todos acharem o bolo muito doce ?
c) Pelo menos 4 pessoas acharem o bolo muito doce?
d) No mximo 2 pessoas acharem o bolo muito doce?

EXERCCIOS SUPLEMENTARES

Exerccio S18
Supor um teste com questes com 5 respostas de mltipla escolha com somente uma alternativa cor-
reta.
a) Se o aluno escolher uma ao acaso ("chute"), qual a probabilidade dele escolher a resposta certa?
b) Supondo que o teste tenha 20 questes; definindo-se a varivel aleatria T: nmero de questes
certas, qual a distribuio de probabilidade da varivel T?
c) Calcular a probabilidade de um aluno acertar, no chute, 3 questes.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 69


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
d) Se o escore mnimo para passar 10, qual a probabilidade de um aluno passar no teste, somente
chutando?
e) Qual o nmero mdio de acertos esperado se o aluno somente chutar as respostas?

Exerccio S19
Certa doena tem letalidade de 70%. Supondo-se que existam 20 pacientes com esta doena, calcu-
lar:
a) a probabilidade de que todos morram da doena.
b) a probabilidade de que nenhum paciente morra da doena.
c) a probabilidade de que 7 pacientes morram da doena.
d) a probabilidade de que, no mximo, 10 pacientes morram da doena.
e) a probabilidade de que, no mnimo, 5 pacientes sobrevivam.
f) o nmero esperado de bitos e o respectivo desvio padro.

Exerccio S20
Em uma grande populao, 20% das pessoas so canhotas. Assumindo que a varivel X: nmero de
pessoas canhotas segue uma distribuio Binomial, e sorteando-se uma amostra aleatria de 10 pes-
soas, encontre a probabilidade de:
a) encontrar 2 pessoas canhotas .
b) encontrar pelo menos 2 pessoas canhotas.
c) encontrar no mximo 1 pessoa canhota.
d) encontrar de 1 a 4 pessoas canhotas.

Exerccio S21
Um caso de esquistossomase identificado pela deteco de ovo de xistossoma em amostra de fe-
zes. Em pacientes com infeco baixa, uma tcnica de exame de fezes tem probabilidade de 0,4 de
detectar ovo. Se 5 amostras so examinadas para cada paciente, qual a probabilidade de um paciente
com baixa infeco no ser identificado?

Exerccio S22
Supor que 20% de certa populao tem sangue tipo B. Para uma amostra de tamanho 18, retirada
desta populao, calcule a probabilidade de que sejam encontradas:
a) 3 pessoas com sangue tipo B.
b) 3 ou mais pessoas com sangue tipo B.
c) no mximo 3 pessoas com sangue tipo B.

Exerccio S23
A probabilidade que uma pessoa que sofre de enxaqueca obter alvio utilizando certo medicamento
de 0,9. So selecionados 5 pacientes que sofrem de enxaqueca e recebem o medicamento. Quanto ao
nmero de pessoas que vai ter alvio, encontre a probabilidade de:
a) nenhuma pessoa ter alvio.
b) mais do que uma pessoa tenha alvio.
c) trs ou mais pessoas tenha alvio.
d) no mximo duas pessoas tenham alvio.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 70


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Distribuio normal ou de Gauss; distribuio amostral da mdia

Os dados abaixo so medidas do trax (polegadas) de 5732 soldados escoceses, tomadas pelo mate-
mtico belga, Adolphe Quetelet (1796-1874).

medidas | Freq, Percent Cum,


------------+-----------------------------------
33 | 3 0,05 0,05
34 | 19 0,33 0,38
35 | 81 1,41 1,80
36 | 189 3,30 5,09
37 | 409 7,14 12,23
38 | 753 13,14 25,37
39 | 1062 18,53 43,89
40 | 1082 18,88 62,77
41 | 935 16,31 79,08
42 | 646 11,27 90,35
43 | 313 5,46 95,81
44 | 168 2,93 98,74
45 | 50 0,87 99,62
46 | 18 0,31 99,93
47 | 3 0,05 99,98
48 | 1 0,02 100,00
------------+-----------------------------------
Total | 5732 100,00

Distribuio de medidas do trax (polegadas) de soldados escoceses.

1000

800
Frequency

600

400

200

0
33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48
medidas

Fonte: Daly F et al. Elements of Statistics, 1999.

Funo densidade de probabilidade da distribuio normal: Se a varivel aleatria X normalmente


distribuda com mdia
e desvio padro (varincia 2 ), a funo densidade de probabilidade de

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 71


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
( x )2
1 [
2 2
]
f ( x) = e
X dada por 2 , < x < + ; onde
: constante 3,1416; e: constante 2,718

: constante (mdia aritmtica da populao)


: constante (desvio padro populacional)
Propriedades:

campo de variao : < X < + ;


simtrica em torno da mdia m (ou );

a mdia e a mediana so coincidentes;

a rea total sob a curva igual a 1 ou 100%;

a rea sob a curva pode ser entendida como medida de probabilidade.

1 inclui 68,2% das observaes


1,96 inclui 95,0% das observaes
2,58 inclui 99,0% das observaes

Exemplo:
Depois de tomarmos vrias amostras, decidiu-se adotar um modelo para as medidas de permetro do
trax de uma populao de homens adultos com os parmetros: mdia ( ) = 40 polegadas e des-
vio padro ( ) = 2 polegadas.

40 43 X

Qual a probabilidade de um indivduo, sorteado desta populao, ter um permetro de trax entre 40

e 43 polegadas?
43 ( x 40 ) 2
1 [ ]
P ( 40 X 43) = 40 2 2 e 2x4
dx

Quantos desvio padro 43 est em torno da mdia?

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 72


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Normal reduzida:
x-
Z ~ N (0;1) onde Z =

40 40 X 43 40
P ( 40 X 43) = P ( ) = P (0 Z 1,5)
2 2

0 1,5 Z

Utilizando a tabela da curva normal reduzida,

P(0 Z 1,5) = 0,43319 =43,3%

Exemplo 29:
Com base na distribuio de X~N( =40, =2), calcular:
a) a probabilidade de um indivduo, sorteado desta populao, ter um permetro de trax maior ou
igual a 43 polegadas.

40 43 X
X 43 40
P ( X 43 ) = P ( ) = P (Z 1 ,5 )
2

0 1,5 Z

Utilizando a tabela da curva normal reduzida,

P( Z 1,5) = 0,5-0,43319=0,06681= 6,7%.

b) a probabilidade de um indivduo, sorteado desta populao, ter um permetro de trax entre 35 e


40 polegadas.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 73


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
c) a probabilidade de um indivduo, sorteado desta populao, ter um permetro de trax menor que
35.

d) Qual o valor do permetro do trax, que seria ultrapassado por 25% da populao?

Exemplo 30
Considerar a altura de 351 mulheres idosas como seguindo uma distribuio normal com mdia
160cm e desvio padro 6 cm. Sorteia-se uma mulher; qual a probabilidade de que ela tenha:
a) altura entre 160 cm e 165 cm?
b) altura menor do que 145 cm?
c) Altura maior do que 170 cm?

Distribuio amostral da mdia


Supor a situao onde uma populao composta por 6 elementos, para os quais observou-se a ca-
racterstica X, cujos valores esto apresentados abaixo.
elementos Xi
A 11
B 16
C 12
D 15
E 16
F 14
Fonte: Dixon WJ e Massey FJ. Introduction to Statistical Analysis. 2nd edit. The Maple Press Company,
York, 1957.

Mdia populacional ( ) = 14;

Varincia populacional ( 2 ) = 3,667;


Desvio padro populacional ( ) = 1,9149.
Parmetros valor Estimador Valor (estimativa)
Populao amostra Par(A,D)=(11,15)
Mdia ( ) 14 x 13
2 3,67 S2 8
Varincia ( )
Desvio padro ( ) 1,91 S 2,828

Todas as possveis amostras de tamanho 2, determinadas pelo processo de amostragem aleatrio,


com reposio (N=6, n=2):
Amostra Elementos que compem a amostra valores
Mdia( xi )
1 A,A (11,11) 11
2 A,B (11,16) 13,5
3 A,C (11,12) 11,5
4 A,D (11,15) 13
5 A,E (11,16) 13,5
6 A,F (11,14) 12,5

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 74


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
7 B,A (16,11) 13,5
8 B,B (16,16) 16
9 B,C (16,12) 14
10 B,D (16,15) 15,5
11 B,E (16,16) 16
12 B,F (16,14) 15
13 C,A (12,11) 11,5
14 CB (12,16) 14
15 CC (12,12) 12
16 C,D (12,15) 13,5
17 C,E (12,16) 14
18 C,F (12,14) 13
19 D,A (15,11) 13
20 D,B (15,16) 15,5
21 D,C (15,12) 13,5
22 D,D (15,15) 15
23 D,E (15,16) 15,5
24 D,F (15,14) 14,5
25 E,A (16,11) 13,5
26 E,B (16,16) 16
27 E,C (16,12) 14
28 E,D (16,15) 15,5
29 E,E (16,16) 16
30 E,F (16,14) 15
31 F,A (14,11) 12,5
32 F,B (14,16) 15
33 F,C (14,12) 13
34 F,D (14,15) 14,5
35 F,E (14,16) 15
36 F,F (14,14) 14

Distribuio de frequncia de todas as possveis mdias:


Distribuio amostral da mdia
i xi frequncia
8
1 11 1
2 11,5 2
3 12 1 6

4 12,5 2
Frequency

5 13 4 4

6 13,5 6
7 14 5 2

8 14,5 2
9 15 5 0
10 10.65 11.3 11.95 12.6 13.25 13.9 14.55 15.2 15.85
medias
10 15,5 4
11 16 4
Total 36

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 75


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
11

x
i =1
i fi
Mdia das mdias (x ) = = 14
n
11

(x i x)2 fi
Varincia das mdias x2 = i =1
= 1,833 ;
n

Desvio padro das mdias = erro padro da mdia = x = x2 ;

Erro padro da mdia = 1,833 = 1,354 .

Teorema central do limite: X varivel aleatria com mdia e varincia 2, ento


X ~ N ( , )
n
1,915
No exemplo, X ~ N ( = 14, = 1,915 ) , portanto X ~ N ( x = 14, x = = 1,354) .
2
Exemplo:
Os valores de cido rico em homens adultos sadios seguem distribuio aproximadamente Normal
com mdia 5,7mg% e desvio padro 1mg%. Encontre a probabilidade de que uma amostra aleatria
de tamanho 9, sorteada desta populao, tenha mdia
a) maior do que 6 mg%.
b) menor do que 5,2 mg%.

X~N( =5,7; = 1)
6 5,7
a) P( X 6) = P ( Z X ) = P( Z X 0,91) = 0,5 0,31859 = 0,18141.
1
9
b) 5,2 5,7
P( X 5,2) = P(Z X ) = P(Z X 1,52) = 0,5 0,43574 = 0,064 .
1
9
Exemplo 31

Suponha que o peso em gramas do contedo de pacotes de salgadinho siga uma distribuio normal
com mdia 500g e desvio padro 85g. Sorteia-se uma amostra de 50 pacotes. Calcule:
a) a probabilidade de obter peso mdio entre 500 e 530 gramas.
b) a probabilidade de obter peso mdio entre 450 e 500 gramas.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 76


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Aproximao da distribuio Binomial pela Normal

Representao grfica da distribuio Binomial(n=10;p=0,5).


0,30 P(X=x)

0,25

0,20

0,15

0,10

0,05

0
0 1 2 3 4 5 6 7 8 9 10
X

Aproximao da Binomial(n=10,p=0,5) pela distribuio normal.


0,30 P(x1 <X<x2)

0,25

0,20

0,15

0,10

0,05

0
0 1 2 3 4 5 6 7 8 9 10
X

Supor X~B(n,p), onde X:nmero de sucessos;

Parmetros da distribuio: p (probabilidade de sucessos); n (nmero de realizaes);

Binomial possui mdia=np; varincia =npq e desvio padro = npq .


Para n suficientemente grande (np 5 e nq 5), a varivel X pode ser aproximada para uma distribui-

o Normal(mdia=np, e desvio padro= npq )


X
Supor a proporo de sucessos dada por
n
X X pq
Mdia de =p e desvio padro de =
n n n
porque:
X X 1 1
mdia de = E( ) = E(X) = np = p ;
n n n n

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 77


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
X X 1 1 pq
varincia de = V( ) = 2 V(X) = 2 npq = ;
n n n n n

X X pq
desvio padro de = V( ) = .
n n n
X
Para n suficientemente grande (np 5 e nq 5), a distribuio de pode ser aproximada para a
n
pq
distribuio Normal(mdia=p, e desvio padro= ).
n
Exemplo:

Y: nmero de sucessos;

Y~B(n=10; p=0,5)

P(3 Y < 6) =P(Y=3)+P(Y=4)+P(Y=5)=0,11719+0,20508+0,24609=0,5684.


Pela distribuio normal: Y~N(np=5; dp= 10 x 0,5 x 0,5 = 1,581 )

2,5 5 Y 5 5,5 5
P(3 Y < 6) =P( < )=
1,581 npq 1,581
P( 1,581 Z Y < 0,316) =0,44295+0,12552=0,5685.
Trabalhando-se com a proporo de sucessos:
Y
: proporo de sucessos
n

Pela distribuio Binomial:


Y
P(0,3 < 0,6) = P(3 Y < 6) = 0,11719 + 0,20508 + 0,24609 = 0,5684
n
Y pq 0,5x 0,5
Pela distribuio normal: ~N(p=0,5; dp= = = 0,1581 )
n n 10
Y
0,5
P(3 Y < 6) =P( 0,25 0,5 n <
0,55 0,5 )=
0,1581 pq 0,1581
n
P( 1,581 Z Y < 0,316) =0,44295+0,12552 = 0,5685

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 78


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
EXERCCIOS SUPLEMENTARES

Exerccio S24
Suponha que o peso de acar em pacotes seja anunciado como sendo 2Kg (2000g). Suponha que o
peso (X) segue uma distribuio normal com mdia e desvio padro em gramas dado por
N( = 2003; = 1 ). Qual a probabilidade de sortear um pacote com peso abaixo do anunciado?

Exerccio S25
Suponha que o tempo mdio de permanncia em um hospital para pacientes com determinada doen-
a de 60 dias com desvio padro de 15 dias. Supor que o tempo de permanncia segue uma distri-
buio aproximadamente normal. Se for sorteado 1 paciente desta populao, calcule a probabilidade
de que seu tempo de permanncia ser
a) maior que 50 dias.
b) menor que 30 dias.
c) entre 40 e 70 dias.
d) maior do que 75 dias.

Exerccio S26
Supor que a idade para o aparecimento de certa doena possui distribuio aproximadamente normal
com mdia 11,5 anos e desvio padro 3 anos. Uma criana apresentou esta doena. Calcule a proba-
bilidade de que a criana tenha
a) idade entre 8,5 e 14,5 anos.
b) acima de 10 anos.
c) abaixo de 12 anos.

Exerccio S27
Supor que a presso mdia diastlica de certa populao em certo grupo de idade igual a 78mmHg
com desvio padro 9mmHg. Calcule a probabilidade de que em uma amostra de tamanho 16, a mdia
seja maior que 81mmgHg.

Exerccio S28
Seja X a varivel estatura de homens adultos, assuma que X segue uma distribuio normal com m-
dia = 172 cm e desvio padro = 7,6 cm. Supor que uma amostra de tamanho n= 25 retirada
desta populao.
a) Qual a distribuio da mdia amostral X e qual a mdia e o desvio padro desta distribu-
io?
b) Calcule a probabilidade que a mdia amostral seja menor que a mdia populacional em 2,5
cm.

A famlia de distribuies t de Student

Student o pseudnimo de W. S. Gosset que, em 1908, props a distribuio t. Esta distribuio


muito parecida com a distribuio normal. A famlia de distribuies t centrada no zero e possui
formato em sino. A curva no to alta quanto a curva da distribuio normal e as caudas da distri-
buio t so mais altas que as da distribuio normal. O parmetro que determina a altura e largura
da distribuio t depende do tamanho da amostra (n) e denominado graus de liberdade (gl), deno-

tado pela letra grega ( ) (l-se ni). A notao da distribuio t t .


Curvas t para graus de liberdade (tamanhos de amostra) diferentes.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 79


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Quando o nmero de graus de liberdade da distribuio t aumenta, a distribuio se aproxima de uma
distribuio normal.

Esta famlia t no descreve o que acontece na natureza mas sim o que aconteceria se selecionsse-

mos milhares de amostras aleatrias de uma populao normal com mdia


e fosse calculado
X
t= para cada amostra.
s
n
Calculando o valor de t para 500 amostras de tamanho 6 de uma populao com distribuio normal,
obtm-se o grfico a seguir:

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 80


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Estimao de parmetros populacionais

Estimao por ponto

X uma caracterstica que na populao possui distribuio normal com mdia e varincia 2
(desvio padro ).

Seja X1, X2, X3, ...Xn uma amostra aleatria de tamanho n extrada desta populao.

Os parmetros e2 podem ser estimados com base na amostra.

Se o estimador for um nico valor, a estimao chamada de estimao por ponto.


Se o estimador for um conjunto de valores, a estimao chamada de estimao por intervalo.

Estimao por ponto

Mdia aritmtica
N

estimador : X =
Xi
i =1
Populacional Parmetro
N

Varincia
N

(X i X )2
S (2N ) = i =1
ou
2 N
Populacional Parmetro estimador : N

(X i X )2
S (2N 1) = i =1

N 1

Ateno: Antes dos dados serem coletados, os estimadores so variveis aleatrias.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 81


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Estimao por intervalo

Intervalo de confiana: um conjunto de valores calculados com base na amostra. Pressupe-se que
cubra o parmetro de interesse com um certo grau (nvel) de confiana.

O grau de confiana tem origem na probabilidade associada ao processo de construo do intervalo


antes de se obter o resultado amostral.

O grau de confiana mais comumente utilizado o de 95%.

Seria impossvel construir um intervalo de 100% de confiana a menos que se medisse toda a popula-
o.

Na maioria das aplicaes no sabemos se um intervalo de confiana especfico cobre o verdadeiro


valor. S podemos aplicar o conceito frequentista de probabilidade e dizer que se realizarmos a amos-
tragem infinitas vezes e construirmos intervalos de confiana de 95%, em 95% das vezes os interva-
los de confiana estaro corretos (cobriro o parmetro) e 5% das vezes estaro errados.
Exemplos de intervalo de confiana:

IMC mdio, desvio padro (dp) e IC de 95% segundo sexo e idade (anos). Duas escolas pblicas de
So Paulo, 2004.
Sexo(1) Idade (anos)(2)
7 8 9 10
IMC (kg/m2) mdio e desvio padro (dp) (IC 95%)
Masculino 16,8 (2,5) 17,9 (4,0) 17,3 (3,1) 18,9 (4,0)
(16,2 17,4) (17,0 18,9) (16,5 18,1) (17,9 19,8)
Feminino 16,4 (2,30) 16,9 (2,9) 17,4 (3,3) 18,7 (3,1)
(15,9 17,0) (16,2 17,6) (16,6 18,2) (17,9 19,5)

Total 16,6 (2,4) 17,4 (3,5) 18,7 (3,2) 18,8 (3,7)


(16,2 17,0) (16,8 18,0) (17,9 19,5) (18,2 19,4)
(1) Masculino (n=281), Feminino (n=275);
(2) 7 anos (n=151); 8 anos (n=138); 9 anos (n=126); 10 anos (n=141)
Fonte: Claudia Regina Koga. Dissertao de Mestrado (dados preliminares)

IC para a proporo populacional

Os dados de composio corporal obtidos pela utilizao da BIA, classificados em duas cate-
gorias: sem risco de doena cardiovascular e com risco de DCV, resultaram em prevalncia de risco de
DCV igual a 42,3% (IC95%: 38,1 - 46,5%).

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 82


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
R ep r es en t a o g r f i ca

A linha vertical representa o parmetro populacional. O grfico foi gerado via programa de computa-
dor. So apresentados 50 intervalos de confiana para amostras de tamanho n=20. As linhas horizon-
tais representam os intervalos de confiana. Se o intervalo de confiana no contiver o parmetro, a
linha horizontal no cruzar a linha vertical. A linha vertical o parmetro. No exemplo, 3 intervalos
no cobrem ("capturam") o parmetro.

Apresentao grfica do efeito do tamanho da amostra:

Para amostras menores (n=5), as larguras dos intervalos so maiores a proporo de intervalos que
"capturam" o parmetro parecida com a anterior (para n=20). Portanto, o tamanho da amostra no
interfere na proporo de captura do parmetro mas sim na preciso do estimador.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 83


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Efeito do grau de confiana
Para n=20 e =0,25, obtm-se intervalos com os apresentados a seguir:

Os intervalos so mais estreitos do que para n=20 e


=0,05. Uma porcentagem bem maior no
contm o parmetro. Isto o que 75% de confiana significa. Do total de todas as possveis amos-
tras, 75% delas resultar em intervalos de confiana que contm o verdadeiro valor do parmetro.

Interpretando Intervalos de Confiana (IC)


Um intervalo de confiana para um parmetro um intervalo de valores no qual pode-se depositar
uma confiana que o intervalo cobre (contm) o valor do parmetro. Por exemplo, se com base em
uma amostra encontrarmos que o intervalo (3200 ; 3550) um intervalo de 95% de confiana para a

mdia ( ) da populao de valores do peso mdio ao nascer de recm-nascidos no Municpio de


So Paulo, ento podemos estar 95% confiantes que o conjunto de valores 3220 3500 gramas co-
bre (contm) o verdadeiro peso mdio ao nascer da populao.

Pode-se tambm pensar no IC a partir da seleo de milhares de amostras de uma populao. Para
cada amostra calcula-se um intervalo de confiana com grau de confiana 100(1- )%, para um pa-
rmetro da populao. A porcentagem de intervalos que contm o verdadeiro valor do parmetro
100(1- ). Para =0,05, o grau de confiana ser igual a 100(1-0,05)% = 100(0,95)% = 95%.

Na prtica, tomamos somente uma amostra e obtemos somente um intervalo. Mas sabemos que
100(1- )% de todas as amostras tem um intervalo de confiana contendo o verdadeiro valor do
parmetro, portanto depositamos uma confiana 100(1- )% que o particular intervalo contm o
verdadeiro valor do parmetro.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 84


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Amplitude do intervalo

Para um grau de confiana especificado (por exemplo, 95%), desejamos o intervalo to pequeno
quanto possvel.
Ex: o intervalo de confiana de 95% para o peso mdio ao nascer (gramas) de recm-nascidos no
Municpio de So Paulo de (2500, 4000) traz pouca informao prtica porque sabe-se, da experin-
cia, que a mdia populacional est neste intervalo. Deseja-se um intervalo com amplitude de poucas
gramas. o tamanho da amostra que determina a amplitude do intervalo. Quanto maior a amostra,
menor ser o intervalo.

Frmulas para construo dos intervalos de confiana:

As frmulas dos intervalos de confiana so derivadas da distribuio amostral da estatstica;

Construo do intervalo de confiana para a mdia populacional ;

Pressuposio: A amostra deve ser obtida de forma aleatria;

necessrio utilizar as propriedades do teorema central do limite :



X ~ N (, ) ; X ~ N ( , )
n
Padronizando-se a mdia X , obtm-se Z = X ~ N (0,1) , que permite calcular

n
X
P( z z) = 1 .

n
Para = 5% , X
P(1,96 +1,96) = 0,95

n


P(1,96 X +1,96 ) = 0,95
n n


P( X 1,96 X + 1,96 ) = 0,95
n n
Multiplicando tudo por -1

P( X + 1,96 X 1,96 ) = 0,95
n n

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 85


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Reescrevendo a equao tem-se

P( X 1,96 X + 1,96 ) = 0,95
n n
Obtm-se um intervalo aleatrio centrado na mdia amostral o qual possui 95% de probabilidade
de conter a verdadeira mdia populacional.

O parmetro ser estimado por um conjunto de valores provenientes de uma amostra. Quando isto
feito, a mdia estimada por um determinado valor ( X = x ), e o intervalo

x 1,96 x + 1,96 deixa de ser uma varivel aleatria.
n n
Este intervalo cobre (contm) ou no cobre (no contm) a verdadeira mdia (parmetro). Diz-se
ento que a confiana que se deposita neste intervalo de 95% porque antes de coletar a amostra de
tamanho n, existia, associada a ele, uma probabilidade de 95% de que contivesse a mdia populacio-
nal. Por isso chama-se intervalo de confiana para a mdia populacional.

IC(95%) : ( x 1,96 ; x + 1,96 )
n n

Intervalo de confiana para a mdia populacional com varincia populacional conhecida

Pressuposio: A amostra deve ser obtida de forma aleatria.


Estatstica: mdia populacional - .
x x
IC() = x z / 2. ; x +z / 2.
n n
Exemplo:
Construa um intervalo de 95% de confiana para estimar a presso diastlica mdia populacional
( ), sabendo que em uma amostra de 36 adultos a presso mdia amostral ( x ) foi igual a
85mmHg e o desvio padro populacional ( ) foi 9 mm de Hg. Interprete o significado desse interva-
lo
Soluo:
9 9
85 1,96 ;85 + 1,96 , ou seja, (82,06; 87,94mmHg)
36 36

Exemplo 32
Em uma amostra de 16 gestantes com diagnstico clnico de pr-eclmpsia, a taxa mdia de cido
rico no plasma foi de 5,3 mg sabendo que a variabilidade na populao igual a 0,6 mg. Estime,
com 95% de confiana, a taxa mdia de cido rico no plasma da populao de gestantes com diag-
nstico de pr-eclmpsia.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 86


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Intervalo de confiana para a mdia populacional com varincia populacional desconheci-
da
Sx S
IC() : x tn1, 2. ; x +tn1, 2. x
n n
Exemplo:
Construa um intervalo de 95% de confiana para estimar a presso diastlica mdia populacional
( ), sabendo que em uma amostra de 36 adultos a presso mdia amostral ( x ) foi igual a
85mmHg e o desvio padro amostral (s) foi 12 mm Hg. Interprete o significado desse intervalo.

12 12
85 2,03 ;85 + 2,03 , ou seja, (80,94; 89,06 mmHg)
36 36

Exemplo 33
Uma amostra de 25 adolescentes meninos apresenta peso mdio de 56 kg e desvio padro 8 kg.
a) encontre o intervalo de confiana de 95% para o peso mdio da populao da qual esta a-
mostra foi sorteada.
b) interprete o intervalo de confiana encontrado.

Intervalo de confiana aproximado pela Normal para a proporo populacional ( )

Pressuposies:
1- np e nq5
2- a amostra deve ser obtida de forma aleatria

Seja X uma varivel aleatria que segue uma distribuio binomial, X~ B(n,p).
X
A proporo de sucessos populacional desconhecido. Seu estimador por ponto p=
n
pq
Para n grande, p ~ N ( = p, = ).
n
Com intervalo de confiana para dado por

p q p q
IC( ) : p z / 2 . ; p +z / 2 . , com p e q estimados na amostra onde p =
x
e
n n n
q = 1 p e x o nmero de sucessos observado na amostra de tamanho n.

Exemplo:
Supor que em uma amostra de 200 casais encontrou-se 10 casais onde a esposa era mais alta que o
marido. Construir o intervalo de confiana de 95% para a proporo de casais na populao ( ) onde
as esposas so mais altas que seus maridos.
10
p = = 0,05 ; q = 1 p = 0,95
200

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 87


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
0,05x0,95 0,05x0,95
IC(95%, ) : 0,051,96 ;0,05+1,96
200 200

IC(95%, p): (2,0% ; 8,0% casais)

Se for de interesse estimar por intervalo o nmero esperado de sucessos na populao ( X = p N


onde N tamanho da populao) pode-se utilizar os valores obtidos no IC para a proporo popula-
cional.

IC95% para o nmero esperado de sucessos na populao: (N x p i ; N x p s ) onde p i a proporo


de sucessos estimada pelo limite inferior do IC e p s a proporo de sucessos estimada pelo limite
superior do IC.

Para uma populao de 1000 casais, obtm-se: (1000 x 0,02 ; 1000 x 0,08), ou seja, (20 ; 80 casais)

Exemplo 34
Em uma pesquisa sobre sade bucal na Inglaterra observou-se que de uma amostra de
262 mulheres com idade entre 25 e 34 anos, 7,6% no tinham dentes. Calcule o intervalo de confian-
a de 95% para a proporo de mulheres inglesas naquela faixa etria, que no possuem dentes.

Resumo: Intervalo de Confiana

Mdia populacional:

2: 2 2
Com varincia conhecida x Z / 2 ; x + Z / 2
n n

Com varincia 2 desconhecida: x t / 2 ,


s
, x + t / 2,
s
; = n 1
n n

Proporo populacional (p)

Intervalo aproximado: np , np (1 p ) 5

p (1 p ) p (1 p )
p Z / 2 ; p + Z / 2
n n
onde p a proporo de sucessos na amostra.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 88


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
EXERCCIOS SUPLEMENTARES

Exerccio S29
So apresentadas medidas de presso arterial sistlica de uma amostra de 20 pacientes.
a) Construa o intervalo de confiana de 90% para a presso sistlica mdia populacional.
b) Interprete o intervalo de confiana encontrado.

98 136 128 130 114 123 134 128 107 123


160 125 129 132 154 115 126 132 136 130

Valores de mdia e desvio padro das observaes:


Mdia ( x ) 128
Desvio padro (Sn-1) 13,91

Exerccio S30
Em uma pesquisa sobre propriedades teratognicas de uma droga, 85 camundongos fmeas grvidas
que no foram expostas a droga foram observadas. Do total de 85 ninhadas, 12 tiveram pelo menos 1
filhote com malformao.
a) Apresente o intervalo de confiana de 95% para a verdadeira proporo de malformao na
populao de camundongos de onde os 85 que participaram do estudo foram provenientes.
b) Interprete o intervalo de confiana encontrado.

Exerccio S31
Os dados a seguir so provenientes do grupo Western Collaborative Group Study, criado na Califrnia
em 1960-61.
Tipo A: nvel de colesterol
233 291 312 250 246 197 268 224 239 239
254 276 234 181 248 252 202 218 212 325

Tipo B: nvel de colesterol


344 185 263 246 224 212 188 250 148 169
226 175 242 252 153 183 137 202 194 213

Medidas(mg/100ml) Tipo A Tipo B


Mdia 245,05 210,3
Varincia (n-1) 1342,37 2336,747
Desvio padro (n-1) 36,64 48,33991

Com base nos valores fornecidos,


a) Calcule o intervalo de confiana de 95% para o nvel mdio populacional de colesterol para
cada um dos tipos.
b) Interprete os intervalos. Explique o que eles significam.
c) Compare os resultados.

Exerccio S32
So apresentados dados sobre o estado nutricional de 1226 crianas brasileiras de 2 anos de idade,
segundo sexo.
Estado nutricional Masculino Feminino total
Desnutridas 29 20 49
Normais 574 603 1177
Total 603 623 1226
Fonte: retirado de material de aula da Profa M. R. Cardoso

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 89


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Com base nos dados calcule a proporo de crianas desnutridas e respectivos intervalos de confiana
de 90% segundo sexo. Discuta os resultados.

Exerccio S33
No artigo Hipovitaminose A em crianas de reas rurais do semi-rido baiano a idade mdia das
crianas com nvel aceitvel e inadequado de retinol e seus respectivos desvios-padro so apresen-
tados a seguir. Encontre o intervalo de confiana de 90% para as verdadeiras idades mdias. Compa-
re os resultados. Pode-se dizer que as crianas provm de uma mesma populao?

Estatsticas Nvel aceitvel Nvel inadequado


Nmero de observaes (n) 89 72
Mdia ( x ) 41,9 37,4
Desvio padro (Sn-1) 17,4 17,1

Exerccio S34
O nvel mdio de protrombina em populaes normais 20 mg/100ml de sangue. Uma amostra de
40 pacientes que tinham deficincia de vitamina K tiveram nvel mdio observado de protrombina de
18,5mg/100ml e desvio padro 4mg/100ml. Seria razovel concluir que a verdadeira mdia de paci-
entes com deficincia de vitamina K a mesma que a da populao normal?

Exerccio S35
Uma companhia de produtos alimentcios solicitou pela mdia que os consumidores entrassem em
contato dizendo se tinham aprovado o sabor de um novo produto. Quem telefonasse receberia um
exemplar de um livro de receitas. 320 consumidores telefonaram sendo que 75% destes aprovaram o
produto.
a) Poderia ser construdo o intervalo de confiana de 95% para a proporo de consumidores
que aprovaram o produto na populao?
b) Se sim, calcule o intervalo; se no, explique porque no.

Teste de hipteses, teste de hipteses de uma proporo populacional


Estatstica descritiva
Descreve eventos por meio de:
tabelas
grficos
razes e ndices
parmetros tpicos (medidas de posio e disperso)

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 90


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Estatstica analtica
Nvel I - Terico (conceitos, hipteses cientficas)
Nvel II - operacional (hiptese estatstica)
Situao
Quanto mais bem educada uma pessoa, menor o seu preconceito em aceitar certa campanha sanitria
Nvel I Nvel II

Conceitos Definies Definies Hiptese operacional


Cientficas/ operacionais
tericas

educao Viso global Anos de escolarida-


de
do mundo
Quanto maior o nmero
de anos de escolaridade,
menor o escore em uma
escala de preconceito
preconceito Pr-julgamento Preconceito (escore
em uma escala)

Conceitos gerais
Hiptese cientfica Hiptese estatstica em termos operacionais relativos a po-
pulao
(inferncia dedutiva)
Estimador (Populacional)

Veracidade/ Regras de deciso: fixao de - nvel de significncia


falsidade cientfica
Delineamento: normas de coleta e anlise dos dados

Inferncia indutiva Coleta de dados (observao e mensurao)


(teoria probabilstica)
Verificao da veracidade da hiptese

Inferncia estatstica: qualquer procedimento que se utiliza para se generalizar afirmaes sobre
determinada populao, baseadas em dados retirados de uma amostra.

Parmetro: a medida usada para se descrever uma caracterstica de uma populao.

Estatstica: uma funo dos valores amostrais.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 91


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Estimao: o processo atravs do qual estima-se o valor de um parmetro de uma populao com
base no valor obtido em uma amostra.

Hiptese: uma forma de especulao relativa a um fenmeno estudado (qualquer que seja).
qualquer afirmao sobre a distribuio de probabilidade de uma varivel aleatria (afirmao sobre
um parmetro).

Hiptese estatstica: uma especulao feita em relao a uma proposio, porm relativa a uma
populao definida.

Teste de Hipteses

Abordagem de Neyman e Pearson

Neyman e Pearson propuseram uma abordagem, para a tomada de deciso, que envolve a fixao,
antes da realizao do experimento, das hipteses nula e alternativa, e fixao de valores de probabi-
lidade de ocorrncia de erros de deciso.

Considerar a situao na qual se deseja comparar a eficcia de uma nova droga (DN) com a eficcia
de uma droga padro (DA), que vem sendo atualmente utilizada.

Para a tomada de deciso sobre a eficcia de DN, torna-se necessrio seguir os seguintes passos:
Formular as hipteses;
Identificar a distribuio de probabilidade da estatstica do teste;
Fixar o nvel de significncia do teste ( );
Calcular o tamanho da amostra;
Determinar a regio de rejeio/aceitao de H0;
Realizar o estudo, observar os resultados, calcular a estatstica do teste;
Confrontar o valor observado da estatstica do teste com a regio de rejeio/aceitao de H0;
Tomar a deciso;
Apresentar a concluso.

Cada passo ser apresentado detalhadamente a seguir.

Fixao das hipteses para o exemplo da eficcia de DN


Para o estudo proposto, onde uma nova droga desenvolvida para apresentar maior eficcia que a
droga em uso, as hipteses apropriadas seriam:

H0 : DN = DA
Teste monocaudal direita
Ha : DN > DA
Se o estudo envolvesse a comparao de duas drogas, uma nova e outra que atualmente utilizada,
e a nova droga se prope a reduzir os efeitos colaterais, as hipteses seriam:

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 92


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
H0 : DN = DA
Teste monocaudal esquerda
Ha : DN < DA

Se ambas os lados forem possveis, deve-se optar pela hiptese alternativa que explicita a diferena
como na situao onde uma nova droga para depresso est em teste e deseja-se investigar se a
droga inibe ou provoca o apetite, como efeito colateral. Assim, antes do estudo no se conhece o
efeito da droga sobre o apetite dos pacientes.

H0 : DN = DA
Teste bicaudal
Ha : DN DA

Fixao de valores de probabilidade de ocorrncia de erros de deciso


Considerar o estudo que tem por objetivo comparar a eficcia de uma nova droga (DN) com a eficcia
de uma droga padro, que vem sendo utilizada (DA), cuja eficcia de 50%.

Eficcia (E) pode ser medida pelo nmero de curas.

Supor que a nova droga ser utilizada em 10 pacientes (n=10) e, considerando-se a eficcia conheci-
da da droga antiga (DA), de 50%, tem-se que a probabilidade de cura (p) igual a 0,5.

H 0 : D N = 0,5 H 0 : E N = 0,5
Hipteses: ou
H a : D N > 0,5 H a : E N > 0,5

Estatstica do teste: nmero de curas pela nova droga

X: nmero de curas, X~B(n=10; p=0,50), se H0 for verdade

X: 0, 1, 2, 3,...,10

Valor esperado de curas = n.p= 10x0,5 = 5 curas.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 93


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Distribuio de probabilidade Binomial para n=10 e p=0,5 (sob H0, ou seja, se H0 for verdade)

X (nmero de curas) P(X=x)


0 0,001
1 0,010
2 0,044
3 0,117
4 0,205
5 0,246
6 0,205
7 0,117
8 0,044
9 0,010
10 0,001

Utiliza-se o teste de hipteses para testar H0. O teste de hipteses fornece elementos para a tomada
de deciso com base em H0

possvel tomar somente uma deciso Rejeita-se H0 ou No rejeita-se H0 (Aceita-se H0)

Possveis erros na tomada da deciso:


Deciso Verdade
H0 Ha
H0 no cometeu erro erro tipo II
Ha erro tipo I no cometeu erro

= Pr obabilidade(erro tipoI ) = Probabilidade (Rejeitar H0 e H0 verdade)

= Pr obabilidad e(erro tipoII ) = Probabilidade (Aceitar H0 e H0 falsa)

(1 ) = poder do teste = Probabilidade (Rejeitar H 0 e H0 falsa)

Poder de revelar a falsidade de H0 quando a verdade Ha

Conduta: Antes do experimento, fixa-se e trabalha-se com o menor possvel.

Exemplo 35
Em um julgamento jurdico o jri tem que decidir sobre a culpa ou inocncia de um ru. Considere
dois fatos: 1) o sistema jurdico admite que toda pessoa inocente at que se prove o contrrio. 2) s
vai a julgamento pessoas sobre as quais existe dvida de sua inocncia. Fazendo uma analogia com
teste de hipteses, responda:

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 94


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
a) Apresente as hipteses nula e alternativa sobre a culpa ou inocncia do ru.

b) O jri pode errar se decidir que o ru culpado quando na verdade ele inocente. Qual o outro
erro de deciso que o jri pode cometer?

c) Qual dos dois erros o mais srio?

d) Na terminologia de teste de hiptese, qual tipo de erro (I ou II) pode-se vincular a cada uma das
decises do item b?

Exemplo 36
Supor duas situaes: 1- a pessoa est fazendo parte de um levantamento para diagnstico de para
cncer de mama (screening); 2- a pessoa realiza o teste para detectar anticorpos anti-HIV.
fornecido um diagnstico com base no resultado do teste.
a) Qual dos erros geralmente mais srio: um resultado falso positivo que diz que a pessoa tem a
doena quando na verdade ela no tem ou um resultado falso negativo, que diz que a pessoa no
tem a doena quando na verdade ela tem?

b) Apresente as hipteses nula e alternativa sobre a situao de sade do paciente; fazendo uma
analogia com teste de hipteses, que tipo de erro (I ou II) seria cometido se o resultado do teste
fosse falso positivo? Que tipo de erro (I ou II) seria cometido se o resultado do teste fosse falso nega-
tivo?

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 95


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Definio de critrios de aceitao ou rejeio de H0: estabelecimento das regies de re-
jeio e de aceitao de H0.
Distribuio de probabilidade do nmero de curas sob H0: B(n=10, p=0,5)
X (nmero de curas) P(X=x) Regio
0 0,001
1 0,010
2 0,044
3 0,117 Regio de aceitao de H0
4 0,205 1-
5 0,246
6 0,205
7 0,117
8 0,044
Regio de rejeio de H0
9 0,010
= 5,5%
10 0,001
Aps a definio da rea de rejeio de H0, pode-se realizar o experimento.
Por exemplo, supor que entre 10 pessoas que tomaram a nova droga, 9 se curaram. Como 9 cai na
regio de rejeio de H0, decide-se por rejeitar H0.

Se tivessem sido observadas 6 curas ou qualquer valor da rea de aceitao de H0, a deciso seria
no rejeitar H0 ou seja, aceitar H0.

Onde est ?
H 0 : D N = 0,5
Lembrar que as hipteses de teste so: e que a probabilidade do erro tipo II a pro-
H a : D N > 0,5
babilidade de aceitar H0 quando H0 falsa e que (1 ) o poder do teste, ou seja, a probabilidade

de rejeitar H0 quando H0 falsa.


Supor que no se rejeita H0, portanto, decide-se por H0. Entretanto, se estiver sendo cometido algum
erro de deciso, este ser do tipo II. Assim, a verdade seria uma eficcia da nova droga maior que
0,5.
Supor que uma diferena de no mnimo 10% seja suficiente. Assim, supondo-se p=0,6, a distribuio
do nmero de curas sob Ha, ou seja, sob uma B(n=10, p=0,6) seria:
X p=0,5 Regio p=0,6 Regio
(nmero de curas) P(X=x)
0 0,001 0,000
1 0,010 1 0,002
2 0,044 aceitao de H0 0,011
3 0,117 0,042 aceitao de H0
4 0,205 0,111 = 0,833
5 0,246 0,201
6 0,205 0,251
7 0,117 0,215
8 0,044 rejeio de H0 0,121
rejeio de H0
9 0,010 0,040
10 0,001 = 0,055 0,006 (1- ) = 0,167

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 96


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Notar que para n fixo, uma alterao no nvel de significncia, altera o poder do teste.

So apresentadas a seguir as relaes entre o tamanho da amostra, o nvel de significncia, e


1

Valores de e de 1 para o teste de H0:EN=EP=50% contra H1: EN>50%, quando n=10, 5%


(a rigor, 5,47%) segundo diferentes valores de EN .
EN (%) 1 (%)
60% 83,27 16,73
70% 61,72 38,28
80% 32,22 67,78
90% 7,02 92,98

Valores de e de 1 para o teste de H0: EN =EP=50% contra H1: EN >50%, quando n=10,
1% (a rigor, 1,08%) segundo diferentes valores de EN.
EN (%) 1 (%)
60% 95,36 4,64
70% 85,07 14,93
80% 62,42 37,58
90% 26,39 73,61

Valores de e de 1 para o teste de H0: EN =EP=50% contra H1: EN = 60%, quando 5%


para diferentes valores de n.

Tamanho da Valor de mais Valor de Valor de 1 (%)


amostra (n) prximo de 5% (%)
10 5,5 83,3 16,7
15 5,9 78,3 21,7
20 5,7 75,0 25,0
25 5,4 72,6 27,4
30 4,9 70,9 29,1
35 4,5 69,4 30,6
40 4,0 68,3 31,7
45 6,8 67,3 32,7
50 5,9 55,4 44,6
55 5,2 54,1 44,9
60 4,6 54,9 45,1
65 4,1 54,7 45,3
70 6,0 48,8 51,2
75 5,3 45,0 55,0
80 4,6 45,2 54,8
100 4,4 37,7 62,3
150 4,3 22,6 77,4
160 4,8 18,7 81,3
175 4,8 15,8 84,2
200 5,2 11,0 89,0

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 97


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Valores de e de 1 para o teste de H0: EN =EP=50% contra H1: EN = 55%, quando 5%
para diferentes valores de n.
Tamanho da Valor de mais Valor de Valor de 1 (%)
amostra (n) prximo de 5%
(%)
10 5,5 90,0 10,0
15 5,9 87,0 12,0
20 5,7 87,0 13,0
25 5,4 86,6 13,4
30 4,9 86,5 13,5
35 4,5 86,6 13,4
40 4,0 86,7 13,3
45 6,8 87,0 13,0
50 5,9 80,3 19,7
55 5,2 81,0 19,0
60 4,6 81,8 18,2
65 4,1 82,5 17,5
70 3,6 83,2 16,8
75 5,3 77,4 22,6
80 4,6 78,4 21,6
100 4,4 75,9 24,1
150 4,3 68,8 31,2
160 4,8 65,4 34,6
175 4,8 63,3 36,7
200 5,2 58,3 41,7
300 5,9 43,0 57,0
400 4,9 36,2 63,8
600 5,6 19,4 80,6

Para um teste bicaudal


Valores de e de 1 para o teste de H0: EN = EP=50% contra H1: EN 50%, quando 5%
para diferentes valores de n e E1 = 60% ou E1 = 40%
Poder do teste para tamanhos de amostra fixos em tes-
Tamanho Valor de Valor de Valor de
tes mono e bicaudal, com distribuies de probabilidade
da mais 1
B(n, p=0,5) para H0 e B(n, p=0,6) para Ha
amostra prximo (%) (%)
(n) de 5%
10 2,1 95,2 4,8
1,000
15 3,5 90,8 9,2 bicaudal monocaudal
20 4,1 87,3 12,7 0,900

25 4,3 84,5 15,5 0,800

30 4,3 82,3 17,7 0,700


35 4,1 80,4 19,6
0,600
40 3,8 78,8 21,1
45 7,2 67,2 32,8 0,500

50 6,5 66,4 33,6 0,400

55 5,8 65,7 34,3 0,300


60 5,2 65,1 34,9
0,200
65 4,6 64,5 35,5
70 4,1 64,0 36,0 0,100

75 6,4 54,4 45,6 0,000


80 5,7 54,2 45,8 0 50 100 150 200 250
T a m a nho da a m o s t ra
100 5,7 45,7 54,3
150 6,0 27,9 72,1
160 6,9 23,3 76,7
175 6,9 19,8 80,2
200 7,7 14,0 86,0

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 98


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Teste de hipteses segundo a abordagem de Fisher (Ronald Aylmer Fisher)

Inicia-se a abordagem de Fisher com a especificao de uma proposio inicial (equivalente H0 de


Neynman e Pearson). Considerando o estudo que tem por objetivo comparar a eficcia de uma nova
droga (DN) com a eficcia de uma droga padro, que vem sendo utilizada (DA), cuja eficcia de
50%, tem-se:

Proposio inicial: DN=0,5

Para tomada de deciso deve-se realizar o experimento e calcular a probabilidade de ocorrncia do


valor observado ou de um valor mais extremo da estatstica do teste, em uma curva de probabilidade
especificada na proposio inicial.

Se na amostra de 10 pacientes, 9 evolussem para a cura (90%), Fisher recomendava que se calculas-
se a probabilidade de 9 ou mais pacientes se curarem (P(X9)), tendo como base, a distribuio de
probabilidade conhecida, especificada na proposio inicial, onde a probabilidade de cura igual a
50%.

Pelo exemplo, esta probabilidade seria igual a P(X9) = P(X=9) + P(X=10) = 0,011 = 1,1%
Se na amostra de 10 pacientes, fossem observadas 6 curas (60%), P(X6) = P(X=6) + P(X=7) +
P(X=8) + P(X=9) + P(X=10) = 0,205 + 0,117 + 0,044 + 0,010 + 0,001 = 0,377 = 37,7%

A probabilidade calculada conhecida como valor de p (p-value) e a deciso estatstica ser tomada
com base no valor desta probabilidade.

Se o valor de p for considerado pequeno, conclui-se que os dados no mostram evidncia de perten-
cer a uma populao com proporo de cura igual a 50% e, portanto, a droga cura mais do que 50%.

Se o valor de p for considerado grande, ento se pode dizer que os dados provavelmente vm de uma
populao que possui como parmetro 50% de curas.

Definio:

Valor de p a probabilidade de ocorrncia do valor observado ou de um valor mais extremo de uma


estatstica, em uma curva de probabilidade especificada (conhecida, verdadeira).

Fisher dizia que antes de dar uma forma matemtica a um problema, propondo hipteses a serem
testadas, era necessrio um amplo conhecimento dos dados, o que poderia ser realizado com base no
valor de p.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 99


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Passos necessrios para a realizao de um teste de hipteses segundo a abordagem de
Fisher.
Formular a proposio inicial (hiptese) que ser testada;
Identificar a distribuio de probabilidade;
Realizar o estudo e observar o resultado da estatstica de interesse;
Calcular o valor de p, ou seja, a probabilidade de ocorrer o valor observado ou um valor mais
extremo, sob a curva especificada na proposio inicial;
Tomar a deciso com base no valor de p;
Apresentar as concluses.

Teste de hipteses para uma proporo populacional (Distribuio Binomial)

Considerar a seguinte situao:

Segundo dados de rotina dos servios de sade tem-se que, em determinada comunidade, a propor-
o de mes que amamentam at o 3 ms de idade da criana de 60%. Desejando-se aumentar
esta proporo, realizou-se o estudo que consistiu em desenvolver um programa educativo. Deseja-
se, portanto, avaliar a eficcia do programa.

Aps o programa observou-se que, em uma amostra de 10 mes que foram submetidas ao programa
e acompanhadas durante quatro meses, 9 mes amamentaram pelo menos at o 30 ms.

Utilizando-se teste de hipteses para decidir sobre a eficcia da interveno:

Pela abordagem de Neyman e Pearson

1) Elaborao das hipteses : H 0 : E P = 0,6


H a : E p > 0,6

2) Fixao de = Prob(rejeitar H0 e H0 V); fixando-se =0,05

3) Estabelecimento da regio de rejeio/aceitao de H0:


Estatstica do teste: nmero de mes que amamentaram at o 3 ms.

X: 0,1,2,...,10

Eventos independentes e mutuamente exclusivos; portanto, a distribuio de probabilidade de X se-


gue um modelo B(n=10; p=0,6).

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 100


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Regio de rejeio e aceitao de H0, se H0 for verdade
X P(X = x) ; so b H 0 , p = 0, 6 R e gi o
0 0, 0 0 0 1 0
1 0, 0 0 1 5 7
2 0, 0 1 0 6 2
3 0, 0 4 2 4 7 1
4 0, 1 1 1 4 8 Ace ita o de H 0
5 0, 2 0 0 6 6
6 0, 2 5 0 8 2
7 0, 2 1 4 9 9
8 0, 1 2 0 9 3
9 0, 0 4 0 3 1 R e je i o de H 0 ;
10 0, 0 0 6 0 5 = 0,04636 0,05

4) Deciso: Como 9 mes amamentaram pelo menos trs meses, e 9 cai na rea de re-
jeio de H0, decide-se por rejeitar H0.

5) Concluso: Foi encontrada diferena estatisticamente significante entre as propores


populacionais de mes que amamentam antes e aps o programa, para nvel de significncia de 5%.
O programa educativo, portanto, foi eficaz, pois as mes submetidas ao programa provm de uma
populao de mes onde mais do que 60% amamentam pelo menos at o 3 ms.

Ab o rd a g e m de Fi s h e r

Proposio: mes que so submetidas ao programa provm de uma populao onde 60% delas a-
mamentam pelo menos at o 3 ms.

Calculando-se a probabilidade de observar 9 ou mais mes amamentando pelo menos at o 3 ms,


utilizando uma curva onde 60% de mes amamentam at o 3 ms: considerando-se a distribuio de

probabilidade: B(n=10; p=0,6), tem-se p= P ( X 9) = P ( X = 9) + P ( X = 10) = 0,040 + 0,006 = 0,046 ou


4,6%.

Interpretao do valor de p: 4,6% a probabilidade de observar 9 ou mais mes amamentando


pelo menos at o 3 ms, se estas tivessem vindo de uma populao de mes na qual 60% amamen-
ta pelo menos at o 3 ms de idade da criana.

Para decidir com base no valor de p necessrio perguntar-se se os resultados observados so com-
patveis com a proposio de que as mes vm de populao na qual 60% das mes amamentam
pelo menos at o at o 3 ms. Em outras palavras, com base nos resultados, voc diria que existe
evidncia favorvel ou contrria proposio inicial?

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 101


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Se p for considerado, pelo investigador, pequeno ento se conclui que os dados observados mostram
evidncia contrria proposio inicial sendo que a proporo de mes que amamentaram, depois da
campanha mais compatvel com uma populao de mes na qual mais de 60% amamentam pelo
menos at o 3 ms. Neste caso, o programa foi eficaz.

Se p for considerado, pelo investigador, grande, ento se conclui que os dados no mostram evidn-
cia contrria proposio e, portanto, as mes, aps a interveno, devem ser de uma populao na
qual 60% amamentam pelo menos at o 3 ms. Neste caso, a interveno no surtiu efeito.

Consideraes finais
O valor de p a fora de evidncia contrria proposio inicial. Para existir forte evidncia contrria
proposio inicial, o valor de p deve ser bem pequeno;
O julgamento sobre o valor de p, se grande ou pequeno, arbitrrio e quem decide o investiga-
dor.

Exemplo
Considerar a situao, comum na rea de anlise sensorial, denominada comparao de par, direcio-
nada: A situao envolve um fabricante que quer lanar um bolo mais doce do que o produto que
est no mercado (cdigo 15). Para tanto desenvolvido um novo produto (cdigo 23).

O experimento consiste em oferecer uma fatia de cada produto a 20 degustadores, de modo indepen-
dente, e registrar (contar) quantos acham o produto novo mais doce.

No teste comparao de par, direcionada, o nmero K de degustadores que achou o


bolo com cdigo 23 mais doce foi k= 8. Pode-se admitir que os bolos diferem quanto doura?

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 102


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Abordagem de Neyman e Pearson
O investigador fixa o nvel de significncia em 5% (=0,05). Se os bolos no forem diferentes quanto
ao sabor, metade dos degustadores vai escolher um produto e a outra metade vai escolher o outro.
Assim, a probabilidade de escolher o cdigo 15 = 0,5.

H 0 : = 0,5
Hipteses:
H A : > 0,5

(onde representa a proporo populacional que escolhe o produto 23)

Estatstica do teste: nmero de pessoas que escolhem o novo produto

Distribuio de probabilidade:

X: nmero de degustadores que escolhem o produto novo. X:0, 1, 2,...,18, 19, 20

Cada degustador escolhe o produto independente do outro degustador e se for feita a escolha por
um produto (eventos independentes), o outro produto fica eliminado (mutuamente exclusivos).

X ~B( n = 2 0 ; p = 0 , 5)
X P(X = x) R e gi o d o te s te
0
.
Ace ita o de H 0
.
.
13
14 0, 0 3 6 9 6
15 0, 0 1 4 7 9
16 0, 0 0 4 6 2 R e je i o de H 0
17 0, 0 0 1 0 9 = 0,058
18 0, 0 0 0 1 8
19 0, 0 0 0 0 2
20 0, 0 0 0 0 0

Deciso: como k=8, decide-se no rejeitar H0.

Concluso: No foi encontrada diferena estatisticamente significante entre a proporo de escolha


dos produtos, podendo-se dizer que os produtos no diferem quanto ao sabor adocicado, para um
nvel de significncia de 5%.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 103


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Abordagem de Fisher

Proposio: Proporo de degustadores que escolhem cdigo 23 = 0,5

n=20

K: nmero de degustadores que escolhem cdigo 23; K: 0, 1, 2, ..., 20

K~B(n=20; p=0,5)

Observou-se que 8 degustadores escolheram o produto de cdigo 23 (k=8).

Valor de p=probabilidade de ocorrer 8 ou mais, se os dados vierem de uma populao que escolhe os
produtos em propores iguais.

Valor de p= P(K8) = P(k=8)+P(k=9)+...+P(k=20)= 0,868 ou 86,8%.

Conclui-se que os dados no mostram evidncia contrria proposio inicial (p=0,868). Os dados
so compatveis com uma populao que escolhe igualmente os produtos com cdigos 15 e 23. O
novo produto no foi considerado mais doce que o antigo.

OBS: Como np=10 e nq=10, para o clculo de p poderia ter sido utilizada a distribuio normal.

K ~ N ( = np = 20x0,5 = 10; = npq = 20 x0,5x0,5 = 2,24


7,5 10
P( K 8) = P( Z ) = P( Z 1,12) =
2,24 0,5+0,36864=0,86764 ou 86,8%

Exemplo 37
Supor o experimento onde existe interesse em investigar se o odor de determinado alimento atrai
camundongos. O experimento consiste em colocar um animal em um corredor que no final dividido
para a direita e para a esquerda. Um alimento colocado no final do corredor da esquerda, fora da
viso do animal. Entretanto, antes da realizao do experimento, decide-se eliminar a possibilidade de
incluir no estudo camundongos que tm predileo por um lado, independentemente do odor do ali-
mento. Neste caso, decide-se investigar inicialmente se os camundongos escolhem os lados em pro-
pores iguais. Para tanto, realiza-se o experimento com 12 camundongos sem a colocao do ali-
mento e verifica-se que 7 viram para a esquerda.
Realize um teste de hipteses seguindo as propostas de Neyman e Pearson, com nvel de significncia
de 5%, e a de Fisher, para verificar se os camundongos vm de uma populao que escolhe mais um
lado do que o outro.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 104


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Exemplo 38
Supor agora, o experimento para investigar se o odor de determinado alimento atrai camundongos.
Realiza-se o experimento colocando-se o alimento no final do corredor do lado esquerdo, fora da vi-
so dos camundongos. Observa-se que de 12 camundongos, 10 viram para a esquerda.
Realize um teste de hipteses seguindo as propostas de Neyman e Pearson e de Fisher, com clculo
do valor descritivo do teste, para verificar se os camundongos vm de uma populao que escolhe
mais o lado onde est o alimento. Utilize nvel de significncia de 5%.

EXERCCIOS SUPLEMENTARES

Exerccio S36
Um estudo foi desenvolvido para investigar se aleitamento materno um fator que protege a criana
contra diabetes, em idades maiores. Considerando H0: aleitamento materno no protege contra
diabetes e Ha: aleitamento materno protege contra diabetes, responda:
a) Tomando qual deciso (aceitar ou rejeitar) sobre H0 voc poderia estar cometendo o erro tipo I?
b) Tomando qual deciso (aceitar ou rejeitar) sobre H0 voc poderia estar cometendo o erro tipo II?
c) Como denominada a probabilidade de ocorrer o erro tipo I?
d) Como denominada a probabilidade de ocorrer o erro tipo II?
e) O que o poder do teste?
f) Se voc fosse fixar valores de probabilidades associadas ocorrncia dos erros tipo I e II para
este estudo, qual deles seria menor? Justifique.

Exerccio S37
Ser realizado um estudo para investigar a relao entre consumo de produtos derivados de soja e
presena de osteoporose em mulheres com mais de 50 anos. Para a tomada de deciso, ser utilizado
teste de hipteses, no modelo clssico, proposto por Neyman e Pearson. Apresente os passos
necessrios para a realizao do teste de hipteses, listados a seguir, em uma sequncia correta:
tomada de deciso, clculo do tamanho da amostra, elaborao das hipteses, determinao da
regio de rejeio do teste, coleta dos dados e clculo da estatstica do teste, fixao do nvel de
significncia, concluso, verificao se o valor observado da estatstica cai na regio de aceitao ou
rejeio, identificao da distribuio de probabilidade da estatstica do teste.

Exerccio S38
Considere a seguinte situao hipottica: A incidncia de resfriados durante o inverno, em uma creche
60%. Durante o ano de 2001, a direo da creche resolveu servir suco de acerola durante todo o
inverno com o objetivo de prevenir resfriados. Aps o inverno observou-se que de 20 crianas que

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 105


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
foram acompanhadas, 13 ficaram resfriadas e deseja-se saber se o suco de acerola teve efeito sobre
a ocorrncia de resfriados. Segundo a abordagem de Fisher, responda:

a) Qual seria a proposio ou hiptese nula?


b) Se for definida a varivel X: ficar resfriado, e considerando-se que foram acompanhadas 20 crian-
as, qual a distribuio de probabilidade de X? Especifique os parmetros da distribuio.
c) Fisher recomendava calcular o valor de p e decidir com base nele. O que o valor de p?
d) Calcule o valor de p e decida se os dados mostram evidncia favorvel ou desfavorvel ao que for
especificado na proposio ou hiptese H0.
e) Calcule o valor de p se 7 crianas tivessem ficado resfriadas e decida sobre a propriedade preven-
tiva do suco.

Exerccio S39

Considere a situao onde 40% de mulheres idosas apresentam condio esqueltica do tipo A. Sus-
peita-se que mulheres magras apresentam menor predisposio a esta condio. Realizou-se um es-
tudo e observou-se que entre 28 mulheres idosas magras, 6 apresentaram a condio.
a) Realize um teste de hipteses para investigar se os resultados do estudo so compatveis com
uma populao onde 40% apresentam a condio. Utilize a abordagem clssica de Neyman e Pe-
arson, com nvel de significncia de 10%.
b) Realize um teste de hipteses para investigar se os resultados do estudo so compatveis com
uma populao onde 40% apresentam a condio, utilizando a abordagem de Fisher.

Exerccio S40

A prevalncia de infeco por hepatite B na populao geral de 30%. A literatura sugere que a in-
feco por hepatite B maior entre pessoas com infectadas pelo vrus HIV. Em uma amostra de 20
pessoas que apresentaram teste HIV +, 8 apresentaram positividade para hepatite B. Teste a hipte-
se de que as pessoas HIV + possuem mesma prevalncia de Hepatite B que a populao geral. Utilize
a estratgia clssica de Neyman e Pearson, com nvel de significncia de 5% e a abordagem de Fi-
sher, com tomada de deciso a partir do valor descritivo do teste (valor de p).

Exerccio S41

Suponha que uma pesquisa de grande abrangncia encontrou que 60% de crianas entre 7 e 10 anos
consomem determinada marca de cereal. Com o objetivo de verificar possvel queda no consumo, a
indstria sorteou 15 crianas nesta faixa etria e observou 6 crianas consomem o produto. Teste a
hiptese de que o consumo do produto no foi alterado. Utilize a estratgia clssica de Neyman e

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 106


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Pearson, com nvel de significncia de 5% e a abordagem de Fisher, com tomada de deciso a partir
do valor descritivo do teste (valor de p).

Teste de hipteses para uma mdia populacional com varincia conhecida


e desconhecida

Teste de hipteses para uma mdia populacional com varincia conhecida

Tomando-se como exemplo os dados de recm-nascidos com Sndrome de Desconforto Idioptico


Grave (SDIG) possvel elaborar a hiptese de que crianas que nascem com esta sndrome possuem
peso mdio ao nascer menor do que o peso mdio ao nascer de crianas sadias.

A varivel de estudo X peso ao nascer (quantitativa contnua).

Com base em conhecimento prvio (da literatura) sabe-se que a distribuio do peso ao
nascer em crianas sadias segue uma distribuio normal com mdia 3000 gramas e desvio padro
500 gramas, ou seja X ~ N ( X = 3000; X = 500) .

Recordando-se, para a realizao do teste de hipteses segundo Neyman e Pearson


necessrio:
Formular as hipteses estatsticas;
Fixar a probabilidade do erro tipo I;
Calcular o tamanho da amostra necessria para detectar uma diferena que se suspeita exis-
tente o que equivalente a fixar a probabilidade do erro tipo II;
Apresentar a distribuio de probabilidade da estatstica do teste;
Estabelecer a(s) regio(es) de rejeio e aceitao (regies crticas) do teste;
Realizar o estudo, ou seja, coletar os dados e calcular a estatstica do teste;
Confrontar a estatstica do teste observada com a regio crtica;
Tomar a deciso;
Elaborar a concluso.

Formulao das hipteses


H 0 : SDIG = Sadia H 0 : SDIG = 3000
H a : SDIG < Sadia ou
H a : SDIG < 3000

Fixando-se o nvel de significncia = 0,05

Supor um tamanho de amostra n=50 recm-nascidos com SDIG

Distribuio de probabilidade
Como as hipteses envolvem a mdia populacional, necessrio utilizar a distribuio de probabilida-
de da mdia.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 107


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Pelo Teorema Central do Limite tem-se que X ~ N ( = X ; = X ) portanto, se H0 for verdade, e
X X
n
admitindo-se que as crianas com SDIG possuem distribuio do peso ao nascer com mesma disper-
so que as crianas sadias, tem-se X ~ N ( = 3000; = 500
X X
50 )

Pode-se utilizar ZX ou x obs para a tomada de deciso.

Regio de rejeio e aceitao da hiptese H0.

X = 3000
X = 70,71
X
H0

Rejeio de H0
Aceitao de H0

=0,05

-4 -3 -2 -1 0 1 2 3 4
z
Zcrtico=-1,64

Clculo do peso mdio na amostra de crianas com SDIG


Supor que na amostra de 50 crianas, foi observado peso mdio ao nascer igual a 2800 gramas
( x obs = 2800) .

Clculo do peso mdio observado em nmero de desvios padro:


xobs X 2800 3000
Z Xobs = = = 2,83
X 70,71

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 108


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Confrontar o valor da estatstica do teste com a regio de rejeio e aceitao de H0

Como Zobs est esquerda de Zcrtico (regio de rejeio), decide-se por rejeitar H0.

Deciso:
Rejeita-se H0.

Concluso
Foi encontrada diferena estatisticamente significante entre os pesos ao nascer de crianas sadias e
com SDIG para nvel de significncia = 0,05. Crianas com SDIG nascem com peso menor do que
crianas sadias.

possvel realizar o teste comparando a mdia observada na amostra ( x obs = 2800) e o valor de peso
mdio ao nascer que deixa, no caso deste exemplo, uma rea =0,05 sua esquerda. O valor de
peso mdio que limita esta rea denominado x critico .

Clculo de x critico
xcritico x x critico = Z critico X + X
De Z critico = tem-se
X

xcritico = 1,64 x70,71 + 3000 = 2884,04 g

Rejeita-se H0

Aceita-se H0

xcritico = 2884,04 g X = 3000


X = 70,71
X

Como xobs = 2800 menor que x critico (fica esquerda), opta-se por rejeitar H0.

Regra geral:

Rejeita-se H0 se

Zobs>Zcrtico para H a : SDIG > Sadias


Zobs<-Zcrtico para H a : SDIG < Sadias
Zobs>Zcrtico ou Zobs<-Zcrtico para H a : SDIG Sadias

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 109


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
ou

Rejeita-se H0 se

x obs > x critico para H a : SDIG > Sadias


xobs < xcritico para H a : SDIG < Sadias
x obs > x critico ou xobs < xcritico para H a : SDIG Sadias

Exemplo 39
O nvel mdio de protrombina em populaes normais 20 mg/100ml de sangue. Uma amostra de 40
pacientes que tinham deficincia de vitamina K tiveram nvel mdio observado de protrombina de
18,5mg/100ml e desvio padro 4mg/100ml. Seria razovel concluir que a verdadeira mdia de pacien-
tes com deficincia de vitamina K a mesma que a da populao normal? Realize um teste de hipte-
ses.

Teste de hipteses para uma mdia populacional com varincia desconhecida

Supor a situao anterior, s que a varincia (desvio padro) populacional do peso ao nascer de cri-
anas sadias desconhecida sendo conhecido somente o peso mdio populacional de crianas sadias

( Sadias =3000 gramas).

Formulao das hipteses:


H 0 : SDIG = 3000
H a : SDIG < 3000

Fixando-se o nvel de significncia: = 0,05

Clculo do tamanho da amostra: supor um tamanho de amostra n=50 recm-nascidos com SDIG

Distribuio de probabilidade:

Como as hipteses envolvem a mdia populacional, necessrio utilizar a distribuio de probabilida-


de da mdia.
X
Pelo Teorema Central do Limite tem-se que X ~ N ( X = X ; X = ).
n

Admitindo-se que H0 verdade, resta um problema que o fato de no se conhecer o valor da dis-
perso do peso ao nascer das crianas sadias. Neste caso no possvel utilizar a estatstica Z.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 110


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Utiliza-se, ento, a estatstica T onde T = X X = X X sendo SX o desvio padro da populao
SX SX
n
de estudo, estimado com os dados da amostra de crianas com SDIG.

T segue uma distribuio t de Student, com (n-1) graus de liberdade. Quando o tamanho da amostra
grande, a estatstica T tende para uma distribuio normal com mdia 0 e desvio padro 1

(n T ~ N (0 ;1) ). H0

Regio de rejeio
e aceitao
da hiptese H0. Rejeio de H0
Aceitao de H0

=0,05

X = 3000 tcrtico= -1,676 0


X t

Obs: utilizao da tabela t de Student


A tabela da distribuio de Student apresenta um valor de probabilidade dividido em duas partes
iguais. Para n=50, o nmero de graus de liberdade (gl) 49; como no existe este valor na tabela,
deve-se trabalhar com o nmero de gl mais prximo e dependendo se o teste mono ou bicaudal,
utiliza-se respectivamente o valor de p/2 ou p, apresentados na primeira linha da tabela.
Exemplo de utilizao da tabela t de Student:
n=10; teste bicaudal, =0,05; tcrtico=-2,262 e tcrtico= 2,262 (p da tabela =0,05)
n=10; teste monocaudal a esquerda, =0,05; tcrtico=-1,833 (p da tabela = 0,10)
n=10; teste monocaudal a direita, =0,05; tcrtico= 1,833 (p da tabela = 0,10)

Clculo do peso mdio na amostra de crianas com SDIG


Supor que na amostra de 50 crianas, foi observado peso mdio ao nascer igual a 2800 gramas e
( xobs = 2800; s X = 610)
desvio padro igual a 610g .

Clculo do peso mdio observado em nmero de desvios:


xobs X 2800 3000
tobs = = = 2,318
SX 610
50
Confronto do valor da estatstica do teste com a regio de rejeio e aceitao de H0

Como tobs est esquerda de tcrtico (regio de rejeio), decide-se por rejeitar H0.

Deciso
Rejeita-se H0.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 111


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Concluso
Foi encontrada diferena estatisticamente significante entre os pesos ao nascer de crianas sadias e
com SDIG para nvel de significncia = 0,05. Crianas com SDIG nascem com peso menor do que
crianas sadias.

Exemplo 40
Uma companhia de produtos alimentcios utiliza uma mquina para embalar salgadinhos cujas emba-
lagens especificam 454 gramas. Com o propsito de verificar se a mquina est trabalhando correta-
mente, selecionou-se 50 pacotes de salgadinhos, obtendo-se os seguintes valores de peso:

464 450 450 456 452 433 446 446 450 447
442 438 452 447 460 450 453 456 446 433
448 450 439 452 459 454 456 454 452 449
463 449 447 466 446 447 450 449 457 464
468 447 433 464 469 457 454 451 453 443
mdia da amostra, x =451,22 gramas e desvio padro amostral (s) =8,40 gramas

Testar a hiptese de que a mquina est trabalhando corretamente, para = 0,05.

Teste de hipteses de uma mdia populacional ( ) (com varincia conhecida e desconhe-


cida) Abordagem de Fisher

Reviso de conceitos bsicos

Distribuio Normal
Medindo-se a altura de muitas mulheres (populao), obtm-se o grfico a seguir.
proporo
.35

.3

.25

.2

.15

.1

.05

0
140 145 150 155 160 165 170 175 180
Altura(cm)

Aos dados pode ser ajustada uma curva terica


proporo
.35

.3

.25

.2

.15

.1

.05

0
140 145 150 155 160 165 170 175 180
Altura (cm)

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 112


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
A curva ajustada aos dados uma curva terica (curva de Gauss) que representa a altura de mulhe-
res idosas. Notao: X: altura, X ~ N ( = 160, = 10) .
A curva tem propriedades conhecidas:
Soma da rea sob a curva igual a 1 ou 100%;
Pode-se calcular probabilidade trabalhando-se com a rea sob a curva.

Sorteia-se uma mulher ao acaso; P(desta mulher ter mais de 160) = 50%;

P(esta mulher tenha mais de 180)= P( X > 180) = P( Z > 180 160 ) = P ( Z > 2) =0,5-0,47725=0,02275
10
ou 2,3%

Sortear uma mulher com altura 180 ou mais desta populao uma coisa comum?

P(esta mulher tenha mais de 170)= P( X > 170) = P( Z > 170 160 ) = P (Z > 1) = 0,5-0,34134=0,15866 ou
10
15,9%

Sortear uma mulher com altura 170 ou mais desta populao uma coisa comum?

O limite para decidir o que comum arbitrrio. O investigador que decide, com base no problema
que est sendo estudado.

S up or a go ra um a o ut ra d ist rib u i o de a lt ura , por e xe m p lo , e n tre ho -


m e n s.

proporo
.35

.3

.25

.2

.15

.1

.05

0
160 165 170 175 180 185 190 195 200
Altura (cm)

X: altura, X ~ N (m = 180, = 10)


P(homem tenha mais de 180)= P(X>180)=0,5 ou 50%

Supor que as pessoas da primeira curva tenham uma marca vermelha e as pessoas da segunda curva
tenham uma marca azul. Misturam-se todas as pessoas e sorteia-se uma pessoa ao acaso e ela tem
altura 180. De qual populao seria este indivduo?

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 113


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Agora no estamos mais interessados em um indivduo e sim em vrios indivduos portanto, vamos
trabalhar com a altura mdia.

Supor X: altura, X ~ N (m = 160, = 20) .


Toma-se uma amostra de tamanho n=30 desta populao e calcula-se a altura mdia ( x = 170 ).
Deseja-se saber a probabilidade desta amostra vir de populao com altura mdia maior ou igual a
170.

=160 170
X

Pelo Teorema Central do Limite


X m 170 160 170 160
P( X 170) = P( ) = P( Z X ) = P( Z 2,74)
X 20 3,6515
30

Na curva da Normal reduzida tem-se

=0 2,74
ZX
P(Z 2,74) = 0,5- 0,49693 = 0,0031 ou 0,31%

Sortear uma amostra que apresenta altura mdia igual a 170 cm ou mais da populao que tem altura
mdia 160 cm uma coisa comum?

Para decidir se a amostra representa uma populao com altura mdia maior e que o resultado no
devido ao acaso, realiza-se o teste de hipteses.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 114


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Teste de hipteses para uma mdia populacional com varincia conhecida - Abordagem
de Fisher

Situao:
Estudos mostram que crianas sadias possuem peso mdio (m) ao nascer igual a 3100 gramas e des-
vio padro = 610 gramas .
Suspeita-se que crianas que nascem com sndrome de desconforto idioptico grave possuem peso ao
nascer abaixo do peso ao nascer da populao de crianas sadias.

Proposio (equivalente H0): Crianas com sndrome vm de uma populao com peso mdio =3100
gramas.

Realiza-se um estudo em uma amostra de n=50 crianas que nasceram com esta sndrome, onde
observou-se peso mdio ( x ) igual a 2800 gramas.

Supondo-se que as crianas da amostra (com sndrome) vm de uma populao com mesma disper-
so do peso ao nascer de crianas sadias, teste a hiptese de que crianas com sndrome idioptica
grave possuem peso mdio ao nascer igual ao peso mdio ao nascer de crianas sadias.

Distribuio de probabilidade:

Distribuio do peso mdio: segue uma distribuio normal com mdia m=3100 gramas e desvio pa-
610
dro = = 86,27 gramas
n 50

2800 =3100
X

Clculo da probabilidade de observar um peso mdio ao nascer igual ou menor que 2800 se H0 for
verdade.

X m 2800 3100 300


P( X 2800) = P( ) = P( Z X ) = P( Z X 3,48)
X 610 86,27
50

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 115


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
-3,48 =0
ZX

Pela distribuio Normal reduzida tem-se que P ( Z 3,48) = 0,5 0,49975 = 0,00025 ou 0,025%

Os resultados no so compatveis com uma distribuio que tem peso mdio igual a 3100. Possivel-
mente a amostra vem de uma populao com mdia menor que 3100. Pode-se dizer que crianas
com sndrome de desconforto idioptico grave possivelmente possuem peso ao nascer menor do que
o peso mdio de crianas sadias.

Exemplo 41
O nvel mdio de protrombina em populaes normais 20 mg/100ml de sangue. Uma amostra de 40
pacientes que tinham deficincia de vitamina K tiveram nvel mdio observado de protrombina de
18,5mg/100ml e desvio padro 4mg/100ml. Seria razovel concluir que a verdadeira mdia de pacien-
tes com deficincia de vitamina K a mesma que a da populao normal? Realize um teste de hipte-
ses pela abordagem de Fisher.

Teste de hipteses para uma mdia populacional com varincia desconhecida - Aborda-
gem de Fisher

Supor a mesma situao anterior, s que neste caso somente a mdia populacional conhecida. O
peso mdio de crianas sadias () igual a 3100 gramas.
H0: Crianas com sndrome de desconforto idioptico grave vm de uma populao com peso mdio =
3100 gramas

Seleciona-se uma amostra de 50 crianas com a sndrome e calcula-se o peso mdio e o desvio pa-

dro do peso, obtendo-se n=50; x = 2800 e s=510

Distribuio de probabilidade:
Distribuio do peso mdio ao nascer de crianas sadias: como no se sabe o desvio padro popula-
cional, este estimado utilizando-se os dados da amostra.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 116


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Neste caso a varivel a varivel segue uma distribuio t de Student com n-1=50-1=49 graus de li-
berdade.

X m 2800 3100 300


P( X 2800) = P( ) = P (t X ) = P (t X 4,159)
SX 510 72,12
50

-4,16 =0 t

Pela distribuio t de Student com 49 graus de liberdade, tem-se P(t X 4,159) < 0,05%

Os resultados no so compatveis com uma distribuio que tem peso mdio igual a 3100. Pode-se
dizer que crianas com desconforto idioptico grave provavelmente vm de uma populao com peso
mdio ao nascer menor do que o peso mdio ao nascer de crianas sadias.

Exemplo 42
Uma companhia de produtos alimentcios utiliza uma mquina para embalar salgadinhos cujas emba-
lagens especificam 454 gramas. Com o propsito de verificar se a mquina est trabalhando correta-
mente, selecionou-se 50 pacotes de salgadinhos, obtendo-se os seguintes valores de peso:
464 450 450 456 452 433 446 446 450 447
442 438 452 447 460 450 453 456 446 433
448 450 439 452 459 454 456 454 452 449
463 449 447 466 446 447 450 449 457 464
468 447 433 464 469 457 454 451 453 443
mdia da amostra, x =451,22 gramas e s=8,40 gramas

Testar a hiptese, pela abordagem de Fisher, de que a mquina est trabalhando corretamente.

EXERCCIOS SUPLEMENTARES

Exerccio S42
Deseja-se saber se o consumo calrico mdio de determinada populao adulta de zona rural menor
que 2000 kcal. Uma amostra de 500 pessoas apresentou consumo mdio igual a 1985 kcal e desvio
padro igual a 210. Faa um teste de hipteses pela abordagem de Neyman e Pearson e de Fisher
para tomar a deciso; considere o nvel de significncia igual a 5%.

Exerccio S43
O contedo de iodo em pacotes de sal recomendado que seja igual a 590 g . Determinada inds-
tria, tendo recebido reclamaes de que estava vendendo seu produto com teor de iodo abaixo do

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 117


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
recomendado, realizou um estudo com dosagem de iodo em 15 amostras de sal. Os resultados das
quantidades de iodo so apresentados a seguir. Realize um teste de hipteses pela abordagem de
Neyman e Pearson e de Fisher para verificar se a reclamao procedia. Utilize nvel de significncia de
5%.

555 590 500 550 620


570 610 530 530 600
610 600 580 533 575

Exerccio S44
Vacas da raa Jersey (J) produzem porcentagem mdia de gordura para manteiga igual a 5,25%.
Suspeita-se que vacas Holstein-Fresian (HF), se no forem criadas de um modo especial, produzem
quantidades menores deste tipo de gordura. fornecida a porcentagem mdia de gordura de mantei-
ga de uma amostra de 10 vacas da raa Holstein-Fresian. Os dados sugerem que as que as vacas
Holstein-Fresian produzem a mesma quantidade de gordura do que as vacas Jersey? Conduza um
teste de hipteses pela abordagem de Neyman e Pearson e de Fisher. Utilize nvel de significncia de
5%.

Percentuais de gordura de uma amostra de 10 vacas Holstein-Fresian:


3,4 3,55 3,83 3,95 4,43 3,7 3,3 3,93 3,58 3,54

Exerccio S45
Em uma pesquisa realizada entre os cadetes da Fora Area sobre a relao entre sade em geral e
patologias orais, o escore mdio de CPO (nmero de superfcies de dentes cariados, obturados ou
extrados em um indivduo) foi 27,2. Em 121 cadetes que procuraram os servios mdicos 5 ou mais
vezes durante um ano, o CPO mdio foi 31,1 com desvio padro 15,5. Se for assumido que estes 121
cadetes representam a populao de cadetes com pior sade, existe evidncia que pior nvel de sade
est associado a escore de CPO mais elevado? Tome a deciso utilizando as duas estratgias: a cls-
sica de Neyman e Pearson, com nvel de significncia de 5% e a abordagem de Fisher, com tomada
de deciso a partir do valor descritivo do teste (valor de p).

Exerccio S46
O nvel mdio de ganho de peso entre 42 homens submetidos a exerccios fsicos durante 3 meses foi
igual a 0,5 kg com desvio padro de 2,2 kg. Entre homens que no fazem exerccios fsicos mas que
possuem uma dieta balanceada, o ganho mdio de peso de 1,3 kg. Seria razovel concluir que a
verdadeira mdia de ganho de peso entre homens que praticam exerccios a mesma que a de ho-
mens que no praticam exerccios mas que possuem dieta balanceada? Tome a deciso utilizando as
duas estratgias: a clssica de Neyman e Pearson, com nvel de significncia de 5% e a abordagem
de Fisher, com tomada de deciso a partir do valor descritivo do teste (valor de p).

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 118


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Teste de hipteses de associao pelo qui-quadrado de Pearson (2)

O qui-quadrado obtido somando-se razes dadas pelos quadrados das diferenas entre frequncias
observadas e as esperadas, divididos pelas frequncias esperadas.
(O E ) 2
=
2
E
Quando as variveis so independentes, equivalente a dizer que no existe associao, e neste
caso, o valor do qui-quadrado ser zero. O qui-quadrado no mede fora de associao e no sufi-
ciente para estabelecer relao de causa e efeito.

Distribuio qui-quadrado ( (2n 1) ) com (n-1) graus de liberdade


Seja uma populao com distribuio normal N ( , ) . Se desta populao se obtiver um nmero

infinito de amostras de tamanho n, calculando-se as quantidades x


e S2 em cada amostra, a varivel
2
2
2
aleatria (n 1) S ~ (2n 1) , onde( n 1) se l "qui-quadrado com n-1 graus de liberdade" Berqu

(1981).

A distribuio qui-quadrado assimtrica e se torna menos assimtrica a medida que os graus de


liberdade aumentam. Os valores da distribuio so sempre positivos (maior ou igual a zero). Existe
uma famlia de distribuies qui-quadrado, dependendo do nmero de graus de liberdade. Para gran-
des amostras, a distribuio qui-quadrado tende para uma distribuio normal.

Teste de hipteses de associao pelo Qui-quadrado de Pearson (2)

Abordagem de Neyman e Pearson .6


densidade

Estabelecimento das hipteses: .5

.4
H0: No existe associao
Ha: Existe associao .3

.2
rea de rejeio de H0
Fixando-se a probabilidade de erro tipo I: =0,05
Nvel de significncia () = 0,05 .1

0
rea de rejeio do teste: 0 5 10 15 20

Qui-quadrado crtico = 3,841 X2

Para a tomada de deciso, utiliza-se a regra: rejeita-se H0 se o valor calculado do qui-quadrado for
maior do que o valor crtico para um nvel de significncia pr definido.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 119


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Estatstica do teste:

Qui quadrado =
(O E ) 2
E
~ (2r 1)( c1)

onde r e c representam o nmero de linhas e de colunas, respectivamente.

Exemplo: na tabela abaixo, nmero de linhas =2 (masculino, feminino) e nmero de colunas = 2 (a-
ceitvel, no aceitvel). Assim, o nmero de graus de liberdade (gl) seria (2-1)x(2-1) = 1
Distribuio de crianas segundo sexo e nvel de retinol srico. Cansao, Bahia, 1992

Sexo Nvel de retinol


Aceitvel Inadequado Total
Masculino 50 40 90
Feminino 39 32 71
Total 89 72 161
Prado MS et al. ,Revista de Sade Pblica, 29(4)295 300, 1995.

Na tabela abaixo, gl = 2

Distribuio de recm-nascidos segundo condio caso - com defeitos do tubo neural; controle re-
cm-nascidos que no tinham defeitos do tubo neural e dieta materna.
Dieta Casos Controles Total
n % n % n %
Boa 34 13,9 43 35,0 77 21,0
Razovel 110 45,1 48 39,0 158 43,0
Pobre 100 41,0 32 26,0 132 36,0
Total 244 100 123 100 367 100
Fonte: Hand DJ et al. A handbook of small data sets. Chapman&Hall, 1994.

Correo de continuidade:

Qui quadradocorrecao de Yates =


(| O E | 0,5) 2
E
~ (2r 1)( c1)

L im i ta es :
Para n<20, utilizar o teste exato de Fisher
Para 20 n 40 , utilizar o qui-quadrado somente se os valores esperados forem maiores ou iguais
a 5.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 120


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Exemplo:
Com o objetivo de investigar a associao entre histria de bronquite na infncia e presena de tosse
diurna ou noturna em idades mais velhas, foram estudados 1319 adolescentes com 14 anos. Destes,
273 apresentaram histria de bronquite at os 5 anos de idade sendo que 26 apresentaram tosse
diurna ou noturna aos 14 anos.
Nmero de adolescentes segundo histria de bronquite aos 5 anos e tosse diurna
ou noturna aos 14 anos de idade. Local X, ano Y.
Tosse Bronquite Total
Sim No
Sim 26 44 70
No 247 1002 1249
Total 273 1046 1319
Fonte: Holland, WW et al.. Long-term consequences of respiratory disease in in-
fancy. Journal of Epidemiology and Community Health 1978; 32: 256-9.

Valores observados Valores espe- (O-E) (O-E)2 (O E ) 2 (| O E | 0,5) 2


(O) rados (E) E
E
26 14,488 11,512 132,526 9,147
247 258,512 -11,512 132,526 0,513
44 55,512 -11,512 132,526 2,387
1002 990,488 11,512 132,526 0,134
2 12,181 2
Qui-quadrado ( )= corrigido =

Deciso:
O valor do qui-quadrado calculado maior do que o valor do qui-quadrado crtico para 1 grau de li-
berdade e nvel de significncia de 5%, portanto, rejeita-se H0.

Concluso: Pode-se dizer que na populao existe associao entre bronquite na infncia e tosse na
adolescncia.

Abordagem de Fisher
Pela tabela da distribuio qui-quadrado, com 1 gl, p<0,001 (na tabela, menor que 0,1%)

Calculando-se o valor de p pelo Excel, para 1 gl, o valor de p no corrigido = 0,0004829


No Excel utilizar a funo DIST.QUI tendo como argumentos o valor calculado do qui-quadrado e o
nmero de graus de liberdade: = DIST.QUI(12,181;1))

Concluso: Existe forte evidncia contrria independncia portanto a associao observada ocorre
no devido ao acaso. Pode-se dizer que os dados so compatveis com existncia de associao entre
bronquite na infncia e tosse na adolescncia, na populao.

Exerccio
Considere os dados apresentados a seguir. Investigue a existncia de associao entre nveis de -
caroteno (mg/L) e hbito de fumar, em purperas. Utilize as abordagens de Neyman e Pearson (nvel
de significncia de 5%) e de Fisher.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 121


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Distribuio de mulheres no perodo ps parto, segundo hbito de fumar e nvel de -caroteno srico

-caroteno (mg/L) Fumante No Fumante Total


Baixo (0 0,213) 56 84 140
Normal (0,214 1,00) 22 68 90
Total 78 152 230
Fonte: Silmara Salete de Barros Silva, tese de Doutorado [2003].

Teste de hipteses de duas mdias

Comparao de duas mdias de populaes com distribuio normal amostras independentes.

So apresentadas duas situaes nas quais as amostras so coletadas de modo independente.

Situao 1
So coletados os pesos ao nascer de 50 recm nascidos (RN) com sndrome de desconforto respirat-
rio idioptico grave (SDIG) sendo que 54% dos RN vo a bito. Pode existir uma diferena entre o
peso ao nascer de crianas que sobrevivem e as que morrem. possvel realizar um teste de hipte-
se para confirmar a aparente diferena.
1.050* 2.500* 1.890* 1.760 2.830
1.175* 1.030* 1.940* 1.930 1.410
1.230* 1.100* 2.200* 2.015 1.715
1.310* 1.185* 2.270* 2.090 1.720
1.500* 1.225* 2.440* 2.600 2.040
1.600* 1.262* 2.560* 2.700 2.200
1.720* 1.295* 2.730* 2.950 2.400
1.750* 1.300* 1.130 2.550 3.160
1.770* 1.550* 1.575 2.570 3.400
2.275* 1.820* 1.680 3.005 3.640
Fonte: Hand DJ et alli. A handbook of small data sets. Chapman&Hall, 1994.
(*)
crianas que foram a bito.

Situao 2
Quantifica-se uma enzima (ornithine carbonyl transferase) do fgado de dois grupos de
pessoas que sofrem de hepatite. Um grupo tem a forma viral, aguda e o outro, a crnica. Existe inte-
resse em verificar se existe diferena entre pessoas com cada tipo de doena, com base na medida da
enzima.

Hepatite viral aguda (log das medidas)


2,66 2,38 2,37 2,31 2,50 1,96 2,85 2,68 1,76 2,36 2,56 2,09
2,85 2,67 2,37 2,40 2,79 1,82 3,00 2,50 2,36 2,48 2,60 2,42
2,51 2,51 2,80 2,50 2,57 2,54 2,53 2,78 2,07 2,35 2,98 2,31
2,45 2,75 2,56 2,50 3,00 2,94 2,46 2,83 3,61 2,99 2,78 3,02
2,93 2,78 2,57 2,62 2,71 2,18 3,21 2,86 2,51
Hepatite crnica (log das medidas)
3,01 2,99 2,60 2,47 3,04 1,92 2,17 2,33 2,07 2,30 2,56 2,11
3,32 2,21 1,71 2,60 2,79 2,71 2,64 2,52 2,21 2,58 2,40 2,45
3,18 2,84 2,84 2,31 2,71 2,47 2,72 3,71 2,73 3,69 3,40 2,77
2,28 2,84 2,80 3,02
Fonte: Daly et al.. Elements of Statistics. The open University, 1995.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 122


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
forma aguda forma crnica

1.5
Estatsticas Hepatite viral Hepatite
aguda crnica

1
(log medidas) (log medi-

Density
das)
n 57 40

.5
Mdia 2,587 2,651
Varincia 0,107 0,194

0
(n-1) 1.5 2 2.5 3 3.5 4 1.5 2 2.5 3 3.5 4
enzima
Density
Razo entre varincias =1,8 normal enzima
Graphs by grupo

Distribuio de pessoas segundo determinada enzima produzida no fgado e tipo de hepatite.

Teste t para duas amostras independentes

Sob certas circunstncias (pressuposies), o teste t permite testar a hiptese nula H 0 : 1 = 2

Com as seguintes possveis hipteses altenativas: H a : 1 > 2 ; H a : 1 < 2 ; H a : 1 2 , de-


pendendo do problema que est sendo proposto.

A hiptese nula equivalente : H 0 : 1 2 = 0 , onde 1 e 2 so mdias de populaes


distintas.

Pressuposies:
A varivel sob estudo segue as seguintes distribuies nas populaes de origem:
na populao 1 ~ N ( 1 , )
na populao 2 ~ N ( 2 , )

Observe que prossupem-se amostras provenientes de populaes normais, com mdias distintas e
mesma disperso.

Verificando-se as pressuposies (de modo informal):


1- Normalidade histograma
2- Igualdade de varincias (de desvios padro) uma varincia no pode ser 3 ou mais vezes a
outra.

Estatstica do teste:

Os estimadores das mdias populacionais 1 e 2 so X1 e X2.


Utilizando-se a estatstica X1 X 2 pode-se estimar a diferena entre as mdias populacionais.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 123


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Esta estatstica tem uma propriedade importante: a melhor estatstica quando as pressuposies de
normalidade e de igualdade de varincias esto satisfeitas.

Para duas amostras n1 e n2, como consequncia da distribuio amostral da mdia e Teorema Central


do Limite, tem-se X 1 ~ N (media = 1 , d . p = ) e
n1

X 2 ~ N (media = 2 , d . p. = )
n2

Assumindo que as amostras so independentes, tem-se a distribuio de X1 X 2 :


2 2 1 1
X 1 X 2 ~ N ( 1 2 , + ) ou X 1 X 2 ~ N (1 2 , ( + ))
n1 n2 n1 n 2

pode ser estimado tanto por S1 como por S2. Existe uma combinao de S1 e S2 que fornece um
estimador melhor:

(n1 1)S12 + (n 2 1) S 22
Estimador ponderado (agregado): S p =
(n1 + n 2 2)

Onde S12 e S 22 so as varincias amostrais,

Calcula-se T, o nmero de desvios padro da estatstica X 1 X 2 , em torno da diferena populacional

( 1 2 ) : T= ( X 1 X 2 ) ( 1 2 ) , que sob H0 torna-se T = ( X 1 X 2 ) ~ t ,


( n + n 2)
1 1
1 2
1 1
Sp + Sp +
n1 n 2 n1 n 2

onde (n1+n2-2) o nmero de graus de liberdade necessrio para o clculo de T, utilizando-se a dis-
tribuio t de Student .

Esta estatstica pode ser utilizada para a realizao do teste de hiptese e para o intervalo de confi-
ana da diferena de duas mdias para amostras independentes.

Se o teste for segundo Neyman e Pearson, deve-se confrontar o valor observado (tobs) de T, com a
rea de rejeio de H0, para um nvel de significncia pr-fixado. Se tobs cair na rea de rejeio de H0,
opta-se pela rejeio da hiptese nula.

Se o teste for segundo Fisher, deve-se calcular a probabilidade de observar o valor observado (tobs) de
T ou um valor mais extremo, na curva especificada em H0. Decide-se com base no valor de p. Se a
probabilidade for pequena, conclu-se que os dados mostram evidncia contrria proposio de i-
gualdade de mdias.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 124


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Aplicao:
Situao 1: Pesos ao nascer proveem de mesma populao?

Abordagem de Neyman e Pearson

H 0 : sobrev = no sobrevivente
H a : sobrev no sobreviviente

Considerar nvel de significncia pr-fixado em 5%


Olhando-se os dados e investigando-se as pressuposies do teste: sobrev nao sobrev

.001
Peso ao nascer segue distribuio normal?

Density
5.0e-04
Varincias so iguais?

razo entre as varincias 1,6

0
1000 1500 2000 2500 3000 3500 1000 1500 2000 2500 3000 3500
peso
Density
normal peso
Graphs by condicao

Clculo da estatstica do teste


n1=27, x1 = 1692 ; s12 = 267958,7
n2=23, x2 = 2307 ; s22 = 441856,5

(n1 1) S12 + (n2 1) S 22 (27 1)267958,7 + (23 1)441856,5 = 347661,86 = 589,63


Sp = =
(n1 + n2 2) (27 + 23 2)

(X1 X 2 ) (1692 2307)


tobs = = = 3,68
1 1 1 1
Sp + 589,63 +
n1 n2 27 23

H0
Graus de liberdade = 27+23 2 = 48

Comparao com a rea de rejeio de H0:


rea de aceitao de H0
rea de rejeio rea de rejeio de
Como o valor calculado caiu na rea de rejeio, de H0; = 0,025 H0; = 0,025
2
2
decide-se por rejeitar H0.

Conclui-se que foi encontrada diferena


estatisticamente significante entre os pesos -3,68 -2,009 =0 2,009 t

mdios ao naser de RN com SDIG, que

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 125


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
vo a bito e que sobrevivem, para nvel de significncia de 5%. Os RN sobreviventes apresentam
maior peso mdio ao nascer. Neste caso, os RN so provenientes de duas populaes distintas, com
relao ao peso ao nascer.

Abordagem de Fisher

Proposio inicial: sobrev = no sobrevivente


Valor calculado da estatstica do teste = -3,68

Clculo do valor de p: pela tabela da Distribuia t de Student, e 48 graus de liberdade (27+23-2),


obtm-se p<0,1% ou p<0,001.

Pode-se obter o valor exato de p, utilizando-se a funo =DISTT(3,68;48;2), no Excel, obtendo-se o


valor p = 0,0006, para um teste bi-caudal.

Pelo valor de p pode-se concluir que os dados mostram evidncia contrria proposio inicial. Os RN
sobreviventes apresentam maior peso mdio ao nascer.

Teste t para duas amostras dependentes

Existem situaes onde os dados da primeira amostra esto, de alguma forma, relacionados aos da-
dos da segunda amostra. So apresentadas duas situaes com amostras dependentes.

Situao 1
Uma certa droga est sendo testada quanto a seu efeito na presso sangunea. 12 pacientes tiveram
sua presso arterial diastlica (PAD) medida antes e aps o tratamento. Os resultados so mostrados
a seguir. Os resultados so compatveis com uma droga que produz efeito na presso sangunea dias-
tlica?

Paciente PAD antes PAD aps paciente PAD antes PAD aps
1 120 125 7 140 146
2 124 126 8 135 133
3 130 138 9 126 127
4 118 117 10 130 135
5 140 143 11 126 126
6 128 128 12 127 131

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 126


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Situao 2
So apresentados dados de um estudo biomdico do peso de rins em uma srie de autpsias realiza-
das no departamento de patologia de um hospital na frica. A diferena das mdias amostrais pode
ser razoavelmente explicada como sendo devida ao acaso?
Peso do rim esquerdo (gramas) Peso do rim direito (gramas)
170 150
155 145
140 105
115 100
235 222
125 115
130 120
145 105
105 125
145 135
155 150
110 125
140 150
145 140
120 90
130 120
105 100
95 100
100 90
125 125

Abordagem de Neyman e Pearson

H 0 : 1 = 2
Hipteses
H a : 1 2

A hiptese nula equivalente H 0 : 1 2 = 0 , como o teste emparelhado (pareado), deve-se


escrever H 0 : d = 0 , onde d vem de uma populao composta pela diferena entre as observaes
X1 e X2, para cada indivduo.

Pressuposio:
d segue uma distribuio normal; d ~ N ( d , d )

Estatstica do teste:
(d ) ( d ) (d ) ( d ) d
T= = , que sob H0 torna-se T = ~ t ( n1)
Sd Sd Sd
n n
Onde n o nmero de pares de valores.

Se o teste for segundo Neyman e Pearson, deve-se comparar o valor observado (tobs) de T, com a
rea de rejeio de H0, para um nvel de significncia pr-fixado. Se tobs cair na rea de rejeio de H0,
opta-se por esta deciso.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 127


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
Se o teste for segundo Fisher, deve-se calcular a probabilidade de observar o valor observado (tobs) de
T ou um valor mais extremo, na curva especificada em H0. Decide-se com base no valor de p. Se a
probabilidade for pequena, conclu-se que os dados mostram evidncia contrria proposio de i-
gualdade de mdias.

Aplicao:

Considerando-se os dados de presso arterial diastlica antes e aps um tratamento


Paciente Presso arterial diast- Presso arterial dias- Diferena
lica antes tlica aps (d)
1 120 125 -5
2 124 126 -2
3 130 138 -8
4 118 117 1
5 140 143 -3
6 128 128 0
7 140 146 -6
8 135 133 2
9 126 127 -1
10 130 135 -5
11 126 126 0
12 127 131 -4

Abordagem de neyman e Pearson


H 0 : d = 0
Hipteses:
H a : d 0

Nivel de significncia = 5%;n=12;


Graus de liberdade = n-1 = 11;

31
d= = 2,58 ;
12

( 5 ( 2,58) 2 + ...( 4 ( 2,58) 2 ) 104,51


sd2 = = = 9,501
11 11

sd = 9,501 = 3,082 ,

d 2,58
tobs = = = 2,90
sd 3,082
n 12

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 128


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig
rea de rejeio de H0 para 11 graus de liberdade:
H0

rea de aceitao de H0
rea de rejeio rea de rejeio de

de H0; = 0,025 H0; = 0,025


2
2

-2,9 -2,201 =0 2,201 t

Como o valor calculado caiu na rea de rejeio, decide-se por rejeitar H0.

Conclui-se que foi encontrada diferena estatisticamente significante entre os nveis mdios de pres-
so arterial diastlica antes e aps o tratamento, para nvel de significncia de 5%. O tratamento
provoca aumento da presso arterial diastlica.

Abordagem de Fisher

Proposio inicial: antes = aps


Valor calculado da estatstica do teste = -2,90

Clculo do valor de p: pela tabela da Distribuio t de Student, e 11 graus de liberdade (12-1), ob-
tm-se 1%<p<2% ou p 1,5% (p 0,015). Os dados mostram evidncia contrria proposio
inicial. O tratamento produz efeito, os valores mdios antes e aps o tratamento so diferentes, sendo
que aps o tratamento o nvel mdio maior.

Pode-se obter o valor exato de p, utilizando-se a funo =DISTT(2,9;11;2), no Excel, obtendo-se o


valor p = 0,014445, para um teste bi-caudal.

FSP/USP. HEP 103-Bioestatstica aplicada a Nutrio - 2010 129


Denise Pimentel Bergamaschi, Jos Maria Pacheco de Souza, Patrcia de Fragas Hinnig

Você também pode gostar