Você está na página 1de 40

Bioestatstica

Dr Cludio S. Sartori

FATEC

compreendida entre 5,25 e 5,31 m, apresentamos


uma estimativa por intervalo.

Inferncia Estatstica:
Introduo:
Inferncia estatstica o processo de
estimativas de uma populao a partir de propriedades
de uma amostra da populao. H dois tipos de
inferncia estatstica que discutiremos a seguir.
Do ponto de vista prtico, extremamente
mais importante poder deduzir informaes relativas a
uma populao mediante informaes de amostras dela
extradas.
Um problema importante na inferncia
estatstica a extimao dos parmetros populacionais
ou abreviadamente parmetro, deduzidos da estatstica
amostral.

Estimativas:

Envolve aproximadamente o valor de um


parmetro desconhecido. Esse parmetro um nmero
descrevendo alguma propriedade numrica de uma
populao.
Como exemplo, pode-se estar interessado em
obter uma estimativa do valor mdio de todas as casas
de uma determinada cidade.
Estimativas imparciais:
Se a mdia de uma distribuio amostral de
uma estatstica for igual ao parmetro populacional
correspondente, a estatstica ser denominada de
estimador imparcial do parmetro; se isso no ocorrer,
chamamos de estimador parcial. Tais valores
correspondentes desta estatstica so denominados
estimadores imparciais ou parciais, respectivamente.
Exemplo 1 - A mdia da distribuio amostral
das mdias, X igual a , isto , a mdia

A declarao do erro ou preciso de


uma estimativa denominada de sua
fidedignidade.
Distribuies amostrais:
Considerem-se todas as amostras
possveis de tamanho N que podem ser tiradas de
uma populao dada (com ou sem reposio).
Para cada amostra pode-se tirar uma grandeza
estatstica como uma mdia ou desvio padro,
que varia de amostra para amostra. Desse modo
obtm-se uma distribuio da grandeza que
denominada distribuio amostral. Se a
grandeza estatstica adotada for a mdia da
amostra, a distribuio denominada amostral
das mdias.
Distribuio amostral das mdias.
Admitindo-se amostras possveis de
tamanho N so retiradas sem reposio de uma
populao finita de tamanho Np > N. Se a mdia
e o desvio padro da distribuio amostral das
mdias forem designadas por X e X , e os

valores correspondentes da populao forem e


. Ento:

x =

x =

por

pontos

intervalos.

Quando estimamos um parmtro populacional


por um nmero, denominamos de etimativa de ponto;
quando estimamos por dois nmeros entre os quais
pode-se dizer que ele esteja situado, denominamos de
estimativa por intervalo. Tais estimativas indicam sua
preciso ou exatido e so preferveis s estimativas
por pontos.
Exemplo 2 - Se dissermos que uma certa
distncia mede 5,28 0,03 m , isto , ela est

NP N
N p 1

Se a populao for finita, ou se a


amostragem for tomada com reposio, os
resultados acima tornam-se:

x =

populacional. Por isso a estatstica amostral X uma


estimativa imparcial da populacional .
Estimativas
Fidedignidade.

x =

Para grandes valores de N (N 30) a


distribuio
amostral
das
mdias

aproximadamente normal, com a mdia X e o


desvio

padro

X ,independentemente

da

populao. Tal resultado fruto do teorema do


limite central:
Teorema do Limite Central: medida
que se aproxima o tamanho da amostra, a
distribuio de amostragem mdia se aproxima
da forma da distribuio normal, qualquer que
seja a forma da distribuio de populao. Na

Bioestatstica

Dr Cludio S. Sartori

prtica a distribuio de amostragem da mdia pode


ser considerada como aproximadamente normal
sempre que o tamanho da amostra for N > 30.
Erros padres:
O desvio padro de uma distribuio amostral
de uma grandeza estatstica frequentemente
denominado de seu erro padro.
Lembremos que , tendo N conjunto de dados
xi, calculamos a mdia e o desvio padro da forma:
N

xi
i =1

(xi )

i =1

Se os dados xi forem distribudos em


frequncia fi:
N

xi f i
i =1
N

fi
i =1

f i ( xi )

i =1

fi
i =1

FATEC

A tabela ilustra os valores da rea da


curva normal padro.

0,0

0,0000

0,0040

0,0080

0,0120

0,0160

0,0199

0,1

0,0398

0,0438

0,0478

0,0517

0,0557

0,0596

0,2

0,0793

0,0832

0,0871

0,0910

0,0948

0,0987

0,3

0,1179

0,1217

0,1255

0,1293

0,1331

0,1368

0,4

0,1554

0,1591

0,1628

0,1664

0,1700

0,1736

0,5

0,1915

0,1950

0,1985

0,2019

0,2054

0,2088

0,6

0,2258

0,2291

0,2324

0,2357

0,2389

0,2422

0,7

0,2580

0,2612

0,2642

0,2673

0,2704

0,2734

0,8

0,2881

0,2910

0,2939

0,2967

0,2996

0,3023

0,9

0,3159

0,3186

0,3212

0,3238

0,3264

0,3289

1,0

0,3413

0,3438

0,3461

0,3485

0,3508

0,3531

1,1

0,3643

0,3665

0,3686

0,3708

0,3729

0,3749

1,2

0,3849

0,3869

0,3888

0,3907

0,3925

0,3944

1,3

0,4032

0,4049

0,4066

0,4082

0,4099

0,4115

1,4

0,4192

0,4207

0,4222

0,4236

0,4251

0,4265

1,5

0,4332

0,4345

0,4357

0,4370

0,4382

0,4394

1,6

0,4452

0,4463

0,4474

0,4484

0,4495

0,4505

1,7

0,4554

0,4564

0,4573

0,4582

0,4591

0,4599

1,8

0,4641

0,4649

0,4656

0,4664

0,4671

0,4678

1,9

0,4713

0,4719

0,4726

0,4732

0,4738

0,4744

2,0

0,4772

0,4778

0,4783

0,4788

0,4793

0,4798

2,1

0,4821

0,4826

0,4830

0,4834

0,4838

0,4842

2,2

0,4861

0,4864

0,4868

0,4871

0,4875

0,4878

2,3

0,4893

0,4896

0,4898

0,4901

0,4904

0,4906

2,4

0,4918

0,4920

0,4922

0,4925

0,4927

0,4929

2,5

0,4938

0,4940

0,4941

0,4943

0,4945

0,4946

2,6

0,4953

0,4955

0,4956

0,4957

0,4959

0,4960

2,7

0,4965

0,4966

0,4967

0,4968

0,4969

0,4970

2,8

0,4974

0,4975

0,4976

0,4977

0,4977

0,4978

2,9

0,4981

0,4982

0,4982

0,4983

0,4984

0,4984

3,0

0,4987

0,4987

0,4987

0,4988

0,4988

0,4989

3,1

0,4990

0,4991

0,4991

0,4991

0,4992

0,4992

3,2

0,4993

0,4993

0,4994

0,4994

0,4994

0,4994

3,3

0,4995

0,4995

0,4995

0,4996

0,4996

0,4996

3,4

0,4997

0,4997

0,4997

0,4997

0,4997

0,4997

3,5

0,4998

0,4998

0,4998

0,4998

0,4998

0,4998

3,6

0,4998

0,4998

0,4998

0,4999

0,4999

0,4999

3,7

0,4999

0,4999

0,4999

0,4999

0,4999

0,4999

3,8

0,4999

3,9

0,5000

0,4999
0,5000

0,4999
0,5000

0,4999
0,5000

0,4999
0,5000

0,4999
0,5000

Bioestatstica

Dr Cludio S. Sartori

0,0

0,0239

0,0279

0,0319

0,0359

0,1

0,0636

0,0675

0,0714

0,0754

0,2

0,1026

0,1064

0,1103

0,1141

0,3

0,1406

0,1443

0,1480

0,1517

0,4

0,1772

0,1808

0,1844

0,1879

0,5

0,2123

0,2157

0,2190

0,2224

0,6

0,2454

0,2486

0,2518

0,2549

0,7

0,2764

0,2794

0,2823

0,2852

0,8

0,3051

0,3078

0,3106

0,3133

0,9

0,33151

0,3340

0,3365

0,3389

1,0

0,3554

0,3577

0,3599

0,3621

1,1

0,3770

0,3790

0,3810

0,3830

1,2

0,3962

0,3980

0,3997

0,4015

1,3

0,4131

0,4147

0,4162

0,4177

1,4

0,4279

0,4292

0,4306

0,4319

1,5

0,4406

0,4418

0,4429

0,4441

1,6

0,4515

0,4525

0,4535

0,4545

1,7

0,4608

0,4616

0,4625

0,4633

1,8

0,4686

0,4693

0,4699

0,4706

1,9

0,4750

0,4756

0,4761

0,4767

2,0

0,4803

0,4808

0,4812

0,4817

2,1

0,4846

0,4850

0,4854

0,4857

2,2

0,4881

0,4884

0,4887

0,4890

2,3

0,4909

0,4911

0,4913

0,4916

2,4

0,4931

0,4932

0,4934

0,4936

2,5

0,4948

0,4949

0,4951

0,4952

2,6

0,4961

0,4962

0,4963

0,4964

2,7

0,4971

0,4972

0,4973

0,4974

2,8

0,4979

0,4979

0,4980

0,4981

2,9

0,4985

0,4985

0,4986

0,4986

3,0

0,4989

0,4989

0,4990

0,4990

3,1

0,4992

0,4992

0,4993

0,4993

3,2

0,4994

0,4995

0,4995

0,4995

3,3

0,4996

0,4996

0,4996

0,4997

3,4

0,4997

0,4997

0,4997

0,4998

3,5

0,4998

0,4998

0,4998

0,4998

3,6

0,4999

0,4999

0,4999

0,4999

3,7

0,4999

0,4999

0,4999

0,4999

3,8

0,4999

0,4999

0,4999

0,4999

3,9

0,5000

0,5000

0,5000

FATEC

1
Yi =
e
2

( xi ) 2
2 2

Se tratamos os dados na varivel


reduzida z:

z=

z2

1 2i
Yi =
e
2

Para a distribuio amostral das mdias

Xi (

supondo distribuio normal) com mdia

X teremos a relao:
X X
zi = i
X

e desvio padro

Xi :
X i = X + X zi

Ou, explicitando o valor

Exerccios:

0,5000

Lembramos que para uma distribuio normal


ou gaussiana de dados (xi ,Yi ) e desvio padro e
mdia dados por :

1 - Uma populao consiste de 5


nmeros: 2,3,6,8 e 11. Considerem todas as
amostras possveis de 2 elementos que dela
podem ser retiradas com reposio. Determinar:
a) A mdia da populao.
b) O desvio padro da populao.
c) A mdia da distribuio amostral das
mdias.
d) O desvio padro da distribuio
amostral das mdias, isto , o erro padro das
mdias.
2. Resolver o problema anterior no caso
de amostragem sem repetio.
3. Admite-se que a altura de 3000
estudantes do sexo masculino de uma
universidade so normalmente distribudas, com
a mdia 172,72 cm e o desvio padro7,62 cm. Se
forem obtidas 80 amostras de 25 estudantes cada
uma, quais sero a mdia e o desvio padro
esperados na distribuio amostral das mdias
resultantes se a amostragem for feita:
a) Com reposio.
b) Sem reposio.
4. Em quantas amostras do problema
anterior pode-se esperar que a mdia se
encontre:
a) Entre 169,27 cm e 173,48 cm.
b) Abaixo de 169,65 cm?
5. Quinhentos rolamentos de esferas
tm um peso mdio de 5,02 onas (1 ona =
0,028349 kg). e um desvio padro de 0,3 ona.
Determinar a probabilidade de uma amostra de

Bioestatstica

rea sob a Curva Gaussiana

dftr
0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05

-1,000 -,500

,000

,500

1,000
X

(a) 0 x 3
(b) -2,5 x 4,5
Respostas:
(a)
rea sob a Curva Gaussiana

Y(X)

dftr
0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05

,000

,500

1,000

1,500
X

2,000

2,500

3,000

rea sob a curva normal padro


dftr
0,35
0,3

Y(z)

0,25
0,2
0,15
0,1
0,05

-2

-1,5

-1

-0,5
z

0,5

1,500

2,000

2,500

3,000

rea sob a curva normal padro


dftr
0,35
0,3
0,25
0,2
0,15
0,1
0,05
-3,5

-3

-2,5

-2

-1,5

-1
z

11. Construa as distribuies Gaussiana e


Normal padro para = 2 e = 0,816, com:

(b)

Y (X )

100 rolamentos de esferas, escolhidos ao acaso nesse


grupo, ter um peso total de:
a) Entre 496 e 500 onas.
b) Mais de 500 onas.
6. Suponha que a mdia de uma populao
bastante grande seja = 50,0 e o desvio padro =
12,0. Determine o desvio padro para a distribuio de
amostragem das mdias.
7. Sabe-se que a vida til de operao de um
tubo de imagem de TV de certa marca , em mdia,
= 9000 horas com um desvio padro = 500 horas.
Determinar o valor esperado e o desvio padro para a
distribuio de amostragem para a mdia, sendo o
tamanho da amostra n = 25.
8. Um analista financeiro toma uma amostra
aleatria de 10% de 300 contas e acha que o saldo
mdio das contas R $ 148,50. Sabendo que o desvio
padro da distribuio das mdias R$ 35,75 encontre
o desvio padro da amostra.
9. Dados os valores 3,5,7 e 8 encontre a
mdia da populao e seu desvio padro.
10. Se escolhermos uma populao de 2
elementos, sem reposio, encontre a mdia e o desvio
padro das mdias para o problema anterior.

FATEC

Y(z)

Dr Cludio S. Sartori

-0,5

0,5

Bioestatstica

Dr Cludio S. Sartori

Estimativas
Um problema importante da inferncia
estatstica a estimao dos parmetros populacionais,
ou parmetros (mdia, varincia, etc da populao)
deduzidos da estatstica amostral correspondente.
Estimativas imparciais so aquelas em que a mdia da
distribuio amostral igual ao parmetro
populacional correspondente. Caso contrrio ela ser
um estimador parcial.
Caso tenhamos duas estatsticas de
distribuies amostrais com a mesma mdia,
denominamos estimador eficiente da mdia, quela
estatstica de menor varincia, enquanto as demais
recebem o nome de ineficientes.
A estimativa de um valor populacional pode
ser dada por pontos ou por dois nmeros, entre os
quais ele pode ser considerado; ou seja, por meio de
um intervalo. Essas estimativas por intervalos so
preferveis s estimativas por pontos.
Estimativas de intervalo de confiana dos
parmetros populacionais.
Sejam s e s a mdia e o desvio padro (erro
padro) da distribuio amostral de uma estatstica S.
Ento a distribuio amostral de S aproximadamente
Normal (o que se tem verificado para N 30 ); pode-se
esperar que se encontre uma estatstica amostral real,
S, situada nos seguintes intervalos, com os seguintes
percentuais: (Entende-se: estar confiante de se
encontrar s nos intervalos dados).
Intervalo
(S - S , S + S )
(S - 2S , S + 2S )
(S - 3S , S + 3S )

%
68,27
95,45
99,73

FATEC

Limite de Confiana
(%)
99,73
99
98
96
95,45
90
80

Coeficientes de confiana
zc .
3,00
2,58
2,33
2,05
2,00
1,645
1,28
1,00

68,27
50

0,6745

Estimativa do intervalo de confiana


das mdias:
Se temos uma estatstica S que a
mdia
amostral X ento os limites de
confiana de 95% e 99%, para a estimao da
mdia populacional , so dados por:
X 1,96 X e X 2,58 , respectivamente.
X

De um modo geral os limites de


confiana so dados por: X z C
X

X zC
Ou

zC

(Para amostragem de uma populao


infinita ou quando a amostragem retirada
com reposio).

Esses intervalos so denominados de


intervalos de confiana de 68,27%;95,45% e
99,73%para a avaliao de S.
Os nmeros extremos desses intervalos so
denominados de limites de confiana ou limites
fiduciais.
A percentagem de confiana frequentemente
denominada de nvel de confiana. Os nmeros dos
limites de confiana so denominados de coeficientes
de confiana ou valores crticos , e representados por
zc. A tabela a seguir mostra os valores de zC
correspondente a diversos nveis de confiana adotados
na prtica.

X zC

zC

NP N
NP 1

ou

NP N
N

NP 1

(Para amostragem com populao


finita ou quando a amostragem retirada sem
reposio).
Em geral, o desvio padro da populao
desconhecido, de modo que, para se obterem
os limites de confiana acima emprega-se a
estimativa da amostra s. Isso ser satisfatrio
desde que N 30. Para N < 30, a aproximao
insuficiente e deve-se empregar a teoria de
pequenas amostras que veremos adiante.

Bioestatstica

Dr Cludio S. Sartori

todos os 1546 estudantes dessa universidade.


Determinar uma estimativa imparcial e
eficiente da mdia verdeira e da varincia
verdadeira.

A mdia da distribuio amostral das


varincias igual a = N 1 2 , onde 2 a
s2
N
varincia populacional e N o tamanho da amostra.
Ento a varincia amostral s2 uma estimativa parcial
da varincia populacional 2. Chamando de varincia

Alturas
(cm)

modificada , que uma estimativa imparcial de


2, teremos:
2

2 =

151
159
167
175
183

N
a2
N 1

Lembremos que h uma relao entre sa e a


dada por: = N 1s . Para N muito grande, no h
a
a
N
muita diferena entre s e .
Exemplo1 - A amostra constante de 5
medidas do dimetro de uma esfera foi registrada por
um cientista com os valores de 6.33, 6.37, 6.36, 6.32 e
6.37 cm. Determinar as estimativas imparciais e
eficientes da:
a) Mdia verdadeira.
b) Varincia e o desvio padro da amostra.
c) A varincia e o desvio padro da
populao.
d) O intervalo de confina correspondente
a 95%.
a) A estimativa imparcial e eficiente da mdia
verdadeira a mdia populacional:
x=

i =1

= 6.35

b) Desvio

a =
c)

( xi x )

da

amostra:

i =1

0 , 0022
5

= 0,0209 ;

5
18
42
27
8
N = fi
=100

x=

100

fi
i =1

Clculo

do

a =

f i (xi x )
i =1

desvio

padro:

=7,78 cm

N
2
N 1

2 =

154,5
162,5
170,5
178,5
186,5

158
166
174
182
190

xi f i x = 17170 = 171,70
i =1

2 =

padro

Frequncia
(f)

772,5
2 925,0
7 161,0
4819,5
1 492,0
xi fi = 17170,0

cm.

Ponto mdio
(xi)

fX

xi

FATEC

100
(7,78)2 = 62,4659 = 7,79
99

Varincia: a2 = 0,00044
A estimativa imparcial e eficiente da
varincia
verdadeira

a
varincia
populacional:
N

N
2 =
a2 =
N 1

( xi x )
i =1

N 1

d) X z = X z =
C
C

N
N
0.0234
= 6.35 1.96
= 6.35 0.00048
5

Note que, como N grande, no h


diferena entre 2 , 2 ou entre , .
Exemplo 3 - Determine os intervalos de
confiana de:
a) 95%
2
2
99%= 0,0234
= 0,00055cm = a = 0b),00055
Para a avaliao da altura mdia dos
estudantes da universidade do exemplo
anterior.
a) Lembrando que os limites de
confiana de 95% so dados por:

Exemplo 2 - Admita-se que as alturas de 100


estudantes do sexo masculino de uma universidade
representam uma amostra aleatria das alturas de

X 1,96

. Adotando x = 171,70 e
N

Bioestatstica

Dr Cludio S. Sartori

considerando como estimativa de , s = 7,79 ,


teremos:
7,79
171,70 1,96
= 171,70 1,526
100
Consequentemente, o intervalo de confiana de
95% para a mdia da populao de 170,174 a
173,226 cm; ou:

170,17 < < 173,23

= 171, 70 2, 58 7,79
= 171, 70 2, 01
100

O intervalo de confiana de 99% para a mdia


da populao :

169,69 < < 173,71

Exemplo 4 - As medidas dos dimetros de


uma amostra aleatria de 200 rolamentos esfricos
produzidos por certa mquina, durante uma semana,
apresentam a mdia de 0,824 polegada e o desvio
padro de 0,042 polegada. Determinar os limites de
confiana de:
a) 95%
b) 99%
Para o dimetro mdio de todos os rolamentos
esfricos.
Limites de confiana:
a) X 1,96 = X 1,96 s =
N
N
= 0,824 1, 96

b)

X 2,58

X 2,58
2,58

Erro da estimativa:
N

Tomando-se s = =0,05 segundo o

erro ser de
2,58

b) Os limites de confiana de 99% so:

s
X 2,58
= X 2,58
N
N

0,042
200

FATEC

0,05
N

= 0,01 N =

(2,58)(0,05)
N = 167
0,01

Exemplo 6 - Uma amostra aleatria de 50


graus em matemtica, num total de 200,
apresenta a mdia de 75 e desvio padro de 10.
a) Quais os limites de confiana de 95%, para a
estimativa da mdia dos 200 graus? b) Com que
grau de confiana se diria que a mdia dos 200
graus 75 1?
a) Como o tamanho da populao no
muito grande, em comparao
com o tamanho da amostra, deve-se
ajust-las. Ento os limites de
confiana de 95% so:

NP N
X 1, 96

= 75 1,96

= 0,824 0, 0058 = 0,824 0, 006

10
50

NP 1

200 50
= 75 2, 4
200 1

b) X z c = X z
X
c

NP N
NP 1

10 200 50
= 75 1,23 z C
50 200 1
valor
= 0Como
,824 esse
0,0077
= deve
0,824ser
0igual
,008a 75 1

= 75 z C

= X 2,58

s
042
= 0,824 2,58 0,200
N

Exemplo 5 - Ao medir o tempo de reao, um


psiclogo avaliou que seu desvio padro era de 0,05
segundos. Que extenso deve ser tomada para a
amostra destinada s medies para que se esteja:
a) 95% e b) 99% confiantes de que o erro
dessa estimativa no exceda a 0,01
segundo?

1,23zc = 1 zc = 0,81.
A rea subentendida pela curva normal,
entre z = 0 e z = zc=0,81 0,2910; ento
o grau de confiana desejado :
2.(0,2910) = 0,582 ou 58,2%.

Exerccios
1. Foram determinados os valores:
8,3;10,6;9,7;8,8;10,2
e
9,4
quilos,
respectivamente, para os pesos de uma amostra.
b) 95% possuem limites de confiana:
Determinar aas estimativas para:
Erro da estimativa:

a) A mdia populacional. (9,5 kg).


X 1,96
1,96
b) A varincia populacional. (0,74 kg).
N
N
c) Compare o desvio padro da
Tomando-se s = =0,05 segundo o erro ser de
amostracom sua estimativa para a
(1,96)(0,05)
0,05
populao. (0,78 e 0,86 kg).
1,96
= 0,01 N =
= 9,8 N = 96,04
0,01
N
2. Uma amostra de 10 componentes
b) 99% possuem limites de confiana:
eletrnicos de televiso produzidas por uma

Dr Cludio S. Sartori

Bioestatstica

companhia apresentou a vida mdia de 1200 horas e o


desvio padro de 100 horas. Estimar:
a) A mdia . (1200 h).
b) O desvio padro populacional de todos os
componentes produzidos pela companhia.
(105,4 h).
3. A mdia e o desvio padro das cargas
mximas suportadas por 60 cabos so dados por 11,09
t e 0,73 t , respectivamente. Determinar os limites de
confiana para a mdia de todos os cabos produzidos
para a companhia de:
a) 95%. (11,09 0,18 t)
b) 99% (11,09 0,24 t)
4. A mdia e o desvio padro dos dimetros de
uma amostra de 250 rebites fabricados por uma
companhia so:0,72642 e 0,00058 polegadas,
respectivamente. Determinar o limite de confiana para
todos os rebites fabricados pela companhia de:
a) 99 %. (0,72642 0,000095 polegadas).
b) 98 %. (0,72642 0,000085 polegadas).
c) 95 %. (0,72642 0,000072 polegadas).
d) 90 %. (0,72642 0,000060 polegadas).
5. Determine, em relao ao problema anterior, os
limites de confiana de 50% e o erro provvel para a
mdia dos dimetros. (0,72642 0,000025 e 0,000025
polegadas).
6. Um analista de mercados obtm dados de uma
amostra de 100 consumidores de um total de 400 que
adquiriram uma oferta especial. As 100 pessoas
gastaram na loja, uma mdia de $ 24,57 com um
desvio padro de $ 6,60. Usando um intervalo de 95%
de confiana, estimar:
a) O valor mdio de compras para todos os 400
clientes. ($23,45 a $25,69).
b) O valor total das compras dos 400 clientes.
($9.380 a $10.276).

FATEC

Dr Cludio S. Sartori

Bioestatstica

Testes de Hipteses:
Envolve a escolha de duas afirmaes de uma
dada populao. Tais afirmaes so chamadas de
hipteses.
Num teste de hiptese principiamos com um
valor suposto (hipottico) de um parmetro da
populao; depois de coletar uma amostra aleatria,
comparamos a estatstica da amostra , tal como a
mdia amostral, com o parmetro suposto, tal como a
mdia populacional hipottica. Ento, aceitamos ou
rejeitamos o valor hipottico como sendo correto. O
valor hipottico rejeitado somente se o resultado da
amostra for claramente improvvel de ocorrer quando
a hiptese for verdadeira.
Uma hiptese nula H0 o valor suposto do
parmetro o qual comparado com o resultado da
amostra. Ele rejeitado somente se o resultado da
amostra for improvvel sendo a hiptese considerada
verdadeira. A hiptese alternativa H1 aceita somente
se a hiptese nula rejeitada.
Dividimos em diversas etapas os testes de
hipteses:
ETAPA 1 - Formular a hiptese nula H0 e a
hiptese alternativa H1.
ETAPA 2 - Especificar o nvel de significncia a
ser usado. O nvel de significncia o padro
estatstico especificado para rejeitar a hiptese nula.
Se especificado um nvel de significncia de
5%, a hiptese nula rejeitada somente se o resultado
da amostra to diferente do valor suposto que uma
diferena igual ou maior ocorreria por acaso com uma
Decises possveis

Aceitao da hiptese
nula
Rejeio da hiptese
nula

FATEC

probabilidade mxima de 0,05. Observamos que


se for utilizado um nvel de significncia de 5%,
existe uma probabilidade de 5% de rejeitar a
hiptese nula sendo a mesma verdadeira. Este o
chamado Erro Tipo I. A probabilidade do Erro
Tipo I sempre igual ao nvel de significncia
utilizado como padro para rejeitar a hiptese
nula. Ele simbolizado pela letra grega
minscula "alfa" , sendo que representa o
nvel de significncia. Os nveis de significncia
mais frequentementes utilizados em testes de
hipteses so os de 1% e 5%.
Um Erro Tipo II ocorre quando a hiptese
nula aceita sendo a mesma falsa.
ETAPA 3 - Selecionar a estatstica do teste.
Poder ser ou a estatstica da amostra, ou uma
verso modificada da amostra.
A tabela a seguir ilustra as consequncias
de decises em testes de hipteses.

Estados possveis
Hiptese nula
Hiptese nula falsa
verdadeira
Aceita corretamente
Erro tipo II
Erro tipo I

ETAPA 4 - Estabelecer o valor crtico, ou


valores crticos da estatstica do teste. Tendo
estabelecido a hiptese nula, o nvel de significncia e
a estatstica a ser usada, agora estabelecemos o valor
crtico (ou valores crticos) da estatstica de teste. Pode
existir um ou dois desses valores, segundo seja
efetuado um teste unilateral ou bilateral.
Quando manifestamos interesse nos valores
extremos da estatstica, ou nos escores z de ambos os
lados da mdia, isto , em ambas as extremidades da
distribuio, chamamos esses testes de bilaterais.
Muitas vezes, entretanto, pode-se ter interesse em
apenas nos valores extremos de um mesmo lado da
mdia, isto , em uma extremidade da distribuio; por

Rejeita corretamente
exemplo, quando se est testando a hiptese de
um teste ser melhor do que o outro. Tais testes
denominam-se unilaterais.
Em ambos os casos, o valor crtico
identifica o valor da estatstica de teste
necessrio para rejeitar a hiptese nula.
ETAPA 5 - Determinar o valor real da
estatstica de teste. Exemplo: para testar um valor
hipottico da mdia populacional, coleta-se uma
amostra aleatria e determina-se o valor da
mdia da amostra. Se o valor crtico for
estabelecido como um valor z, a mdia da
amostra ser ento, convertida em um valor z.
ETAPA 6 - Tomar a deciso. O valor
observado da estatstica da amostra comparado

Bioestatstica

Dr Cludio S. Sartori

com o valor crtico da estatstica de teste. A hiptese


nula , ento, ou aceita ou rejeitada. Se a hiptese nula
rejeitada, a hiptese alternativa aceita. Esta deciso
ter relevncia em relao a outras decises a serem
tomadas por administradores, tais como se se deve ou
no manter um padro de desempenho, ou sobre qual,
de duas estratgias de mercado, deve empregar-se.
A tabela abaixo indica para alguns testes o nvel
de significncia.
0,10
Nvel de significncia
-1,28 ou
Valores crticos de z para testes
1,28
unilaterais
-1,645 e
Valores crticos de z para testes
1,645
bilaterais
Teste de um valor hipottico da mdia
utilizando a distribuio normal.
Pode-se utilizar a distribuio normal de
probabilidade para testar um valo hipottico da mdia
quando N > 30 ou, caso N < 30 e a populao ser
normalmente distribuda e o desvio padro ser
conhecido.
Um teste bilateral utilizado quando estamos
interessados em possveis desvios em ambas as
direes a partir do valor hipottico da mdia. A
frmula utilizada para estabelecer os valores crticos da
mdia da amostra similar frmula para determinar
os limites de confiana para estimar a mdia
populacional. Sendo a mdia da populao, os

X RC = z x = 260 1,96

FATEC

valores crticos da mdia da amostra, sendo


conhecido so:

X RC = z x

Exemplo 1 - Um auditor deseja testar a


hiptese de que o valor mdio de todas as contas
a receber em uma dada firma de $ 260,00,
tomando para uma amostra N = 36 e calculando a
mdia amostral. Ele deseja rejeitar o valor
hipottico
se tal valor
0,05 de $ 260,00
0,01 somente
0,005
0,002for
claramente
contraditado
pela
mdia
da
amostra,
-1,645 ou
-2,33 ou
-2,58 ou
-2,88 ou
sendo
que, desta 2,33
maneira, dado
1,645
2,58o valor suposto
2,88
o -1,96
"benefcio
da-2,58
dvida".
As
hipteses
nula ee
e
e
-2,81
e
-3,08
alternativa
0: = $ 260,00
1,96 para esse
2,58teste so H
2,81
3,08 e
H1: $260,00.
Para a hiptese nula, determinar os valores
crticos da mdiada amostra para testar a
hiptese a um nvel de significncia de 5%. Dado
que se conhece o desvio padro dos valores das
contas a receber:
= $ 43,00.
Hipteses: H0: : = $ 260,00 e H1:
$260.
Nvel de significncia: = 0,05

Estatstica do teste: X Baseada numa


amostra de n = 36 e = $ 43,00.

X RC :

Valores crticos da mdia da

amostra.

= 260 1,96

43 $245,95
=
36 $274,05

0.05
0.04
0.03
0.02
0.01

Regio de Aceitao
0
230

240

250

260

270

245,95
Regio de rejeio

280

290

274,05
Regio de rejeio

Portanto, para rejeitar a hiptese nula, a mdia


da amostra deve ter um valor menor que $245,95 ou
maior do que 274,05. Existem duas regies de rejeio
no caso de um teste bilateral.
Quando o valor da mdia da amostra estiver
determinado, ele ser transformado para um valor z, de
modo a poder ser comparado com os valores crticos

de z. A frmula para essa transformao, sendo


conhecido :
z = Xx
Exemplo 2 - Para o teste de hiptese anterior,
suponha que a mdia seja de X = $240 .
Determine se se deve aceitar ou rejeitar a

Bioestatstica

Dr Cludio S. Sartori

FATEC

hiptese nula transformando tal mdia no valor de z


crtico correspondente:

z=

= 2407,17260 = 2,79
0.05
0.04
0.03
0.02

Regio de aceitao

0.01
0
-3

-2

-1

-1,96
Regio de rejeio

1,96
z

Regio de rejeio

Este valor de z encontra-se na regio de


rejeio da da cauda esquerda; portanto rejeita-se a
hiptese nula e aceita-se a hiptese alternativa, isto ,
$260,00.
Um teste unilateral apropriado quando
estamos interessados em possveis desvios em apenas
uma direo, a partir do valor hipottico da mdia. No
exemplo anterior, o auditor pode no estar interessado
em que a verdadeira mdia de todas as contas a receber
supere $ 260,00, mas sim em que ela possa ser menor
que $ 260,00. Pode-se ter ento as hipteses: H0: $
260,00; H1: < $ 260,00.
Existe apenas uma regio de rejeio em um
teste unilateral, e, para o exemplo acima, o teste um
teste de cauda inferior. A regio de rejeio de um
teste unilateral encontra-se sempre na cauda que
representa apoio hiptese alternativa. O valor crtico
pode tambm ser determinado para a mdia ou em
termos de um valor z. Os valores crticos para testes
unilaterais diferem dos bilaterais devido s reas, como
mostramos em tabela.
Exemplo 3 - Suponha que o auditor comece
com a hiptese nula de que o valor mdio de todas as
contas a receber no mnimo de X = $260 . Dado que
a mdia da amostra $ 240,00, testar essa hiptese ao
nvel de significncia de 5%, atravs dos
procedimentos:

a)
Determinando o valor crtico do
valor mdio da amostra, onde H0 : $ 260,00; e
tomando para H1: < $ 260,00.

xrc = 0 + z x = 260 + (1,65)(7,17) = $248,17


Uma vez que X = $240 , o mesmo se
encontra na regio de rejeio. Rejeita-se
portanto a hiptese nula e aceita-se a hiptese
alternativa de que < $ 260,00.
b) especificando o valor crtico em
termos de z, onde zc(=0,05) = -1,65

z=

= 2407,17260 = 2,79

Ento se rejeita a hiptese nula.

Bioestatstica

Dr Cludio S. Sartori

FATEC

0.05
0.04
0.03
0.02
0.01
0
-3

-2

-1

-1,67

248,17

260

Regio de Rejeio

Regio de aceitao

Os limites crticos de X ( = 0.05) so:


Erros Tipo I e Tipo II em testes de hipteses.

A probabilidade do Erro Tipo I (A hiptese


nula rejeitada sendo a mesma verdadeira) igual ao
nvel de significncia utilizado no teste de hiptese.
Isso ocorre pois a proporo da rea na regio de
rejeio igual proporo dos resultados amostrais
que ocorreriam naquela regio se a hiptese nula fosse
verdadeira.
J a probabilidade de Erro Tipo II (A hiptese
nula aceita sendo a mesma falsa) indicada pela letra
grega "beta" () . A maneira pela qual ela pode ser
determinada relativa a um valor especfico, includo
dentro do intervalo da hiptese alternativa.
Exemplo 4 - O representante de um grupo
comunitrio informa a uma pessoa que est interessada
em estabelecer um centro comercial, que a renda mdia
familiar na rea de $ 15.000,00. Suponha que, para o
tipo de zona em questo, possvel supor que a renda
mdia familiar tem distribuio aproximadamente
normal, e que se pode aceitar o desvio padro como
sendo = $ 2.000,00 , com base em um estudo
anterior. Para uma amostra aleatria de 15 famlias, a
renda mdia familiar foi de $14.000,00 . Testar a
hiptese nula de que = $15.000,00 , estabelecendo os
limites crticos da mdia da amostra, utilizando um
nvel de significncia de 5%.
Observao: Mesmo se a amostra for
pequena, pode-se utilizar a distribuio normal, uma
vez que se supes a populao normalmente
distribuda e uma vez que conhecido.
H0: = $15.000,00 e H1: $15.000,00

X = z X =

= 15000 1,96 2000


15

$16.013,93
= 15000 1,96(516,80) =
$13987, 07
Uma vez que a mdia da amostra
X = $14.000,00 encontra-se na regio de
aceitaoda hiptese nula, no se pode rejeitar a
afirmao do representante da comunidade a um
nvel de significncia de 5%.
Exemplo 5 - Resolver o exemplo 4
utillizando a varivel reduzida z como estatstica
do teste:
zcritico ( = 0.05) = 1.96 Ento:

x =

= 2000
= $516,80
15

z=

15000
= 14000
= 1,93 . Logo
516 ,80

z = -1,93 est na regio de aceitao da hiptese


nula. No se pode rejeitar a informao do
representante da comunidade, ao nvel de
significncia de 0,05%.
Exemplo 6 - Para o exemplo anterior,
suponha que o desvio padro da populao
desconhecido, o que seria o caso tpico, e
suponha tambm, que a populao dos valores de
renda no esteja normalmente distribuda. Para
uma amostra de N = 30 famlias, o desvio padro
de s = $ 2.000 e a mdia da amostra
x = $14.000 . Testar a hiptese nula de que a
renda familiar mdia na populao , no mnimo,

Bioestatstica

Dr Cludio S. Sartori

$15.000,00, usando o nvel de significncia do teste de


5%.
Nota: A distribuio normal de probabilidade
pode ser usada por dois motivos: pelo Teorema do
Limite Central e z pode ser utilizado pois N 30.
Assim:
H0: $15.000,00; H1 : < $15.000,00

sx =

s
N

x
sx

z=

2000
30

= $364,96

15.000
= 14.000
= 2,74
364 ,96

z=

z c ( = 0,01) = +2,33

9000
= 8800
= 1,55
129 , 20

Exemplo 9 - Com respeito ao exemplo


anterior, suponha que a informao amostral foi
obtida de uma amostra de n = 35 televisores.
Testar a afirmao ao nvel de significncia de
5%.

H0: = 9000h; H1: < 9000h

z c ( = 0,05) = 1,65
x = N = 500
= 84,46
35
z=

9000
= 8800
= 2,37
84 , 46

Portanto rejeita-se a hiptese nula ao


nvel de significncia de 5%.
Exemplo 9 - Um analista de mercados
coleta informaes de uma amostra aleatria de
100 clientes, dos 400 que compraram uma oferta
especial. As 100 pessoas gastaram uma mdia de
x = $24,57 na loja, com desvio padro de $
6,60. Antes de ver esses resultados da amostra, o
gerente havia afirmado que a mdia das compras
feitas por aqueles que responderam oferta
especial teria sido de, no mnimo, $ 25,00. Podese rejeitar essa afirmao utilizando um nvel de
significncia de 5%?
Observao: necessrio o fator de
correo finita quando N > 0,05Np

xi

x = i =N1 = 450
40 = 11,25 min

H0: = $ 25,00; H1: < $ 25,00

sx =
z=

Logo a hiptese nula no pode ser


rejeitada ao nvel de significncia de 5%.

Logo, rejeita-se a hiptese nula ao nvel de


significncia de 5%
Exemplo 7 - Um fabricante interessado na
compra de um novo equipamento para produzir
ferramentas especificou que o equipamento no deve
exigir, em mdia, mais do que 10 minutos de
manuteno para cada hora de operao. O agente de
compras visita uma companhia onde est instalado o
equipamento, e, pela informao que recolhe, nota que
40 horas de operao aleatoriamente selecionadas
incluem um total de 7 horas e 30 minutos de
manuteno, sendo que o desvio padro do tempo de
manuteno por hora foi de 3,0 minutos. Com base
neste reultado amostral, pode-se rejeitar a hiptese de
que o equipamento possui as especificaes sobre o
tempo de manuteno, ao nvel de significncia de
1 %?
H0: 10 min/hora; H1: > 10 min/hora

FATEC

s
= 340 = 0,47 min
N
x
= 11,025, 4710 = +2,66
sx

z c ( = 0,05) = 1,65

Rejeita-se portanto a hiptese nula ao nvel de


significncia de 1% e aceita-se a hiptese alternativa
de que o tempo mdio de manuteno para esse
equipamento maior de que 10 minutos por hora de
operao.
Exemplo 8 - O desvio padro da vida til de
um tubo de TV de determinada marca de = 500
horas, sendo que a vida til dos tubos normalmente
distribudas. O fabricante afirma que a vida til mdia
, no mnimo, de 9.000 horas. Testar esta informao,
ao nvel de significncia de 5%, denominando-a como
hiptese nula, e dado que a vida mdia em uma
amostra de n = 15 tubos foi de x = 8800h .
H0: = 9000h; H1: < 9000h

z c ( = 0,05) = 1,65
x = N = 500
= 129,20
15

x =

N p N

z=

N P 1
x

=
=

6, 60
100

400 100
400 1

24 , 57 25, 00
0, 57

= 0,57

= 0,75

Portanto no se pode rejeitar


afirmao ao nvel de significncia de 5%.

Testes de significncia que envolvem


diferenas amostrais:

Sejam x1 e x 2 as mdias obtidas em


duas grandes amostras, de tamanhos N1 e N2,
retiradas de populaes respectivas que tm as
mdias 1 e 2 e desvios padres 1 e 2.
Considere-se a hiptese nula de que no h
diferena entre as mdias populacionais, isto ,
1 = 2, ou de que as amostras so retiradas de
duas populaes que tm mdias iguais.

Bioestatstica

Dr Cludio S. Sartori

Vemos que a distribuio amostral para a


diferena das mdias aproximadamente normal, com
mdia e desvio padro dados por:

x1x2 = 1 2 x1x2 = 0 ; ( 1 = 2 )
12

x1 x2 =

N1

22
N2

Exemplo 10 - Determinar a probabilidade de


obter-se entre 40 a 60 caras, inclusive, em 100 lances
de uma moeda honesta.
A mdia e o desvio padro dos nmeros de
caras, em 100 lances, de acordo com a Distribuio de
Bernoulli ou Binomial dado por:
= Np : (p:probabilidade de obter-se

sucesso em um lanamento)

= Npq :

(q:probabilidade

de

insucesso em um lanamento (q = 1- p))


Lembre-se que a distribuio de Bernoulli
N!
p X qNX
p( X ) = CN , X p X q N X =
X !( N X )!
dada por (X: nmero de sucessos) :
A probabilidade dada por:

100 40 60 100 41 59
100 60 40
P = (12) (12) + (12) (12) ++ (12) (12)
40
41
60
Utilizando o ajustamento da curva normal
distribuio de Bernoulli:

FATEC

100.0,5=50

= 100.0,5.0,5 = 5
Considerando a escala contnua, o
intervalo entre 40 e 60 caras, inclusive, o
mesmo que entre 39,5 e 60,5 caras. Passando
para varivel reduzida:
Z1 = (39,5 - 50)/5 = -2,10
Z2 = (60,5 - 50)/5 = +2,10
A rea subebntendida entre a curva
normal de z1 a z2 dar a probabilidade: P =
0,9642.
Exemplo 11 - Para testar a hiptese de
que a moeda honesta, adota-se a seguinte
deciso:
(1) Aceita-se a hiptese, se o nmero
de caras em uma nica amostra de
100 lances, estiver entre 40 e 60,
inclusive.
(2) Rejeit-la, caso contrrio.

a) Determine a probabilidade de rejeitar


a hiptese, quando ela for realmente
correta.
A probabilidade de no se obter entre
40 e 60 caras, inclusive, dada por: 1-0,9642 =
0,0358.
Ento a probabilidade da hiptese ser
rejeitada quando ela for correta de
0,0358=3,58%.
b) Interprete a regra de deciso e o
resultado do item a).

0.08

0.06

0.04

0.02

Regio de
Rejeio

-3

Regio de
Rejeio

Regio de aceitao

-2

-1

z =-2.10
(39,5 caras)

z = 2.10
(60,5 caras)

Se uma nica amostra de 100 lances resultar


em um escore z entre -2,10 e 2,10. Aceitar-se- a
hiptese; caso contrrio ela ser rejeitada e dicidir-se-
que a moeda viciada. O erro cometido ao rejeitar a

hiptese, quando deveria ser aceita, do Tipo I, e


a probabilidade de comet-lo igual a 0,0358,
conforme o item a).

Bioestatstica

Dr Cludio S. Sartori

c) Que concluses se poderiam tirar do fato


de uma amostra de 100 lances apresentar 53 caras? 60
caras?
De acordo com a regra de deciso, deve-se
aceitar a hiptese da moeda ser honesta, em ambos os
casos.
d)
Poder-se-ia
estar
errado
nas
concluses do item c? Explicar.
Sim. Poder-se-ia aceitar a hiptese quando
deveria ser rejeitada, e esse seria o caso, por exemplo,
se a probabilidade de caras fosse de 0,7 em vez de 0,5.
O erro cometido ao aceitar a hiptese, quando deveria
ser rejeitada, do Tipo II da deciso.
Exemplo 12 - Em uma experincia sobre
percepo extra-sensorial (P.E.S), um sujeito, em uma
sala, solicitado a declarar a cor vermelha ou preta de
uma carta escolhida, de um baralho bem embaralhado
de 50 cartas, por outro indivduo colocado na mesma
sala. O sujeito desconhece quantas cartas vermelhas ou
pretas h no baralho. Se o sujeito identifica
corretamente 32 cartas, determinar se os resultados so
significativos, nos nveis de significncia de:
a) 0,05
b) 0,01
Se p a probabilidade do sujeito declarar a
cor da carta corretamente, eno deve-se
decidir entre as hipteses:
H0: p = 0,5 e o sujeito est simplesmente
adivinhando.
H1: p > 0,5 e o sujeito tem faculdades em
P.E.S..
Escolhe-se um teste unilateral, pois no h
interesses em obter escores extremamente
baixos mas, ao contrrio, na de obter escores
altos:
Mdia: = N p = 50 (0,5) = 25 e

Desvio Padro:

= Npq = 3,54

Para x = 32, em unidades reduzidas:

z=

= 323,5425 = 1,98

Como

z c ( = 0,05) = 1,65

e o z

encontrado encontra-se na regio crtica,


rejeita-se H0, ou seja o indivduo apresenta
P.E.S.
Exemplo 13 - O fabricante de uma droga
medicinal reivindicou que ela era 90% eficaz em curar
uma alergia, em umperodo de 8 horas. Em uma
amostra de 200 pessoas que tinham a alergia, a droga
curou 160 pessoas. Determinar se a pretenso do
fabricante legtima

p: probabilidade de obter-se a cura da alergia.

FATEC

H0: p = 0,9 A pretenso correta.


H1: p < 0,9 A pretenso falsa.
Escolhemos um teste unilateral pois no
h interesse em determinar se a proporo de
pessoas curadas pela droga muito baixa..
Se o nvel de significncia = 0,01 e
z() = -2,33
= Np =200.0,9 = 180

= Npq = 200.0,9.0,1 = 4,23


z = (x - ) / = ( 160 - 180 ) / 4,23 = 4,73
Logo como z < -2,33 conclui-se que a
pretenso no
legtima.
0.08

0.06

z = -2,33

0.04

0.02

-3

-2

-1

Exemplo 14 - A vida mdia de uma


amostra de 100 lmpadas fluorescentes,
produzidas por uma companhia, foi calculada em
1570 horas, com o desvio padro de 120 horas.
Se a vidamdia de todas as lmpadas
produzidas pela companhia, testar a hiptese de
= 1600 horas, em face da hiptese alternativa d
de 1600 horas, adotando o nvel de
significncia de:
a) = 0,05
b) = 0,01
H0: = 1600 h; H1: 1600 h
Teste tipo bilateral:
a) zc ( = 0,05) = 1,96
x = = 120 = 12 h; x =
N

z=

100

15701600
12

= 2,50

Este valor est fora do intervalo (1.96,+1.96)


Logo rejeita-se H0 ao bnvel de
significncia de 0,05%
b) = 0,01
Agora o intervalo zc ( = 0,05) =
2,58 ((-2.58,+2.58))

Bioestatstica

Dr Cludio S. Sartori

Como -2.50 est dentro do intervalo, aceita-se


H0 no nvel de significncia de 0,01.
Exerccios:

1.
A tenso de ruptura dos cabos
produzidos por um fabricante apresenta a mdia de
1800 kg e o desvio padro de 100 kg. Mediante nova
tcnica no processo de fabricao, proclamou-se que a
tenso de ruptura pode ter aumentado. Para testar essa
declarao, ensaiou-se uma amostra de 50 cabos,
tendo-se determinado a tenso mdia de ruptura de
1850 kg. Pode-se confirmar a declarao no nvel de
significncia de 0,01?
2.
Referente ao exemplo 14, testar a
hiptese de = 1600 h em face da alternativa < 1600
h para o nvel de significncia de :
a) 0,05
b) 0,01
3
Uma companhia fabrica cabos cuja
tenso de ruptura tm mdia de 300 kg e desvio padro
de 24 kg. Acredita-se que, mediante um processo
recentemente aperfeioado, a tenso mdia de ruptura
pode ser aumentada.
a)
Planejar uma regra de deciso para
rejeio do processo anrtigo, ao nvel de significncia
de 0,01, se foi resolvido submeter 64 cabos a ensaio.
b)
De acordo com a regra de deciso
adotada em a), qual a probabilidade de aceitao do
processo antigo, quando, de fato, o novo aumentou a
tenso mdia de ruptura para 310 kg? Considerar que o
desvio padro ainda 24 kg.
4.
Um analista de mercados coleta
informaes de uma amostra aleatria de 100 clientes,
dos 400 que compraram uma oferta especial. As 100
pessoas gastaram uma mdia de x = $24,57 na loja,
com desvio padro de $ 6,60. Antes de ver esses
resultados da amostra, o gerente havia afirmado que a
mdia das compras feitas por aqueles que responderam
oferta especial teria sido de, no mnimo, $ 25,00.
Pode-se rejeitar essa afirmao utilizando um nvel de
significncia de 1%?
5.
Um fabricante interessado na
compra de um novo equipamento para produzir
ferramentas especificou que o equipamento no deve
exigir, em mdia, mais do que 10 minutos de
manuteno para cada hora de operao. O agente de
compras visita uma companhia onde est instalado o
equipamento, e, pela informao que recolhe, nota que
40 horas de operao aleatoriamente selecionadas
incluem um total de 7 horas e 30 minutos de
manuteno, sendo que o desvio padro do tempo de

FATEC

manuteno por hora foi de 3,0 minutos. Com


base neste reultado amostral, pode-se rejeitar a
hiptese de que o equipamento possui as
especificaes sobre o tempo de manuteno, ao
nvel de significncia de
5 %?
Esboce o grfico da distribiuio
normal explicitando as regies de aceitao e
rejeio.
6.
Uma cadeia de lanchonetes
instalar um novo estabelecimento em um local
proposto se passarem pelo local, no mnimo, 200
carros por hora durante certos perodos do dia.
Para 20 horas aleatriamente selecionadas
durante tais perodos, o nmero mdio de carros
que passarem pelo local foi de x = 208,5 com
desvio padro de 30. Supe-se que a populao
estatstica seja aproximadamente normal. O
gerente da cadeia de lanchonete adota,
conservadoramente, a hiptese nula de que o
volume de trfego no satisfaz a exigncia, ou
seja, H0: 200,0. Pode essa hiptese ser
rejeitada a um nveld e significncia de 5%?
7.
Suponha que os resultados
amostrais do problema anterior sejam baseados
em uma amostra de n = 50 horas. Pode a hiptese
nula ser rejeitada ao nvel de significncia de
5%?
8.
O valor mdio das vendas por
estabelecimento varejista, durante o ltimo ano
de um particular produto, foi de x = $3.425,00
para uma amostra de 25 estabelecimentos. Com
base em dados de vendas em outros produtos
similares, supe-se que a distribuio das vendas
seja normal e que o valor do desvio padro da
amostra seja de = $ 200,00. Suponha que tenha
sido afirmado que o verdadeiro valor das vendas
no estabelecimento no mnimo de $ 3.500,00.
Testar essa afirmao ao nvel de significncia
de:
a) 5%
b) 1%
9.
Uma amostra de 50 firmas
tomadas de uma particular indstria, o nmero
mdio de empregados por firma de 420,5 com
desvio padro amostral de 55,7. Existem ao todo
380 firmas nesta indstria. Antes que os dados
fossem coletados, foi feita a hiptese de que o
nmero mdio de empregados por firma, nesta
indstria, no era superior a 408. Testar a
hiptese ao nvel de significncia de 5%.

Dr Cludio S. Sartori

Bioestatstica

10. Suponha que o analista do problema anterior


ignorasse o uso do fator de correo finita para
determinar o valor deo erro padro da mdia. Qual
teria sido o resultado do teste, ainda usando o nvel de
significncia de 5%?
11.
Uma amostra de aleatria de 30
empregados no nvel II de Secretariado foi submetido a
um teste de datilografia. Os resultados da amostra so:
x = 63,0 ppm (palavras por minuto) e = 5,0 ppm.
Testar a hiptese nula de que as secretrias, em geral,
no ultrapassam uma velocidade de datilografia de 60
ppm, usando um nvel de significncia de 1%.
12.
Um analista de departamento de
pessoal seleciona aleatoriamente os registros de 16
empregados horistas e acha um salrio mdio horrio
de x = $7,50 com um desvio padro de $ 1,00.
Supe-se que os salrios da firma sejam normalmente
distribudos. Testar a hiptese nula H0 : = $ 8,00
usando um nvel de significncia de 10%.

FATEC

Bioestatstica

Dr Cludio S. Sartori

Exerccios - Reviso

1. Uma populao consta de 4 nmeros: 3,


7, 11 e 15. Considerar todas as amostras possveis de 2
elementos, que podem ser retiradas com reposio.
Determinar:
a) A mdia populacional.
b) O desvio padro da populao.
c) A mdia da distribuio amostral das
mdias.
d) O desvio padro da distribuio amostral
das mdias.
Dados:

x =

x =
x =

NP N
N p 1

125
206
154
309
40
78

16
25
3
50
7
6

64
100
81
225
49
144

bairro, mostraram uma mdia de $29400,00 e


desvio padro de $ 6325,00.
a) Encontre um intervalo de
confiana para a mdia de 95%, assumindo que
h 120 casas no bairro. Faa o grfico da
distribuio gaussiana indicando os valores do
intervalo para a mdia populacional, , usando a
( xi )2

expresso: Y = 1 e 2 2 e localize a mdia


i
2
amostral nesse grfico.
b) Encontre um intervalo de
confiana para a mdia de 95%, assumindo que
h 1000 casas no bairro. Faa o grfico da
distribuio gaussiana indicando os valores do
intervalo para a mdia populacional, , usando a
( xi )2

expresso: Y = 1 e 2 2 e localize a mdia


i
2
amostral nesse grfico. Utilize a aproximao de
que N < 10%Np.

; N < 10% N P

2. Para cada dado, encontre o intervalo de


confiana para a mdia populacional . N se refere ao
tamanho da amostra.

FATEC

Intervalo de Confiana
(%)
95
99
90
95
99
90

6. Testes sonoros feitos em 40 veculos


indicaram uma mdia de 65 decibis e desvio
padro de 6 decibis.
a) Encontre um intervalo de 90% de
confiana para a mdia.
b) Quais so os limites de confiana?
7. Os dados a seguir indicam para
alguns dados econmicos para o Brasil.

3. Considere uma simulao feita em um


computador em que em uma amostra de 100 elementos
de uma populao de mdia 50 e desvio padro 5. O
nmero de elementos da populao muito maior que
o da amostra. Construa o intervalo de confiana de
95%.
4. Um mdico quer estimar o tempo mdio
que um determinado paciente espera para uma
consulta. Uma amostra de 50 pacientes mostraram uma
mdia de espera de 23,4 minutos e desvio padro de
7.1 minutos. Encontre o intervalo de confiana de 95%
para a mdia
5. Um acessor de uma determinada cidade
deseja estimar o valor mdio de casas em um certo
bairro. A mdia previamente conhecida de
$23500,00. Uma amostra randmica de 40 casas no

Ano

PIB($)
(bi)

Cresci
mento
(%)

1990
1991
1992
1993
1994
1995
1996
1997
1998
1999

652
659
655
688
728
758
779
804

-4,3
1,0
-0,5
4,9
5,9
4,2
2,8
3,2

Renda
per
capita
($)
4526
4500
4407
4555
4752
4883
4949
5029

Cresc
iment
o (%)

-5,5
-0,6
-2,1
3,4
4,3
2,8
1,3
1,6

a) Utilizando uma mdia dos ltimos 2


anos, faa uma projeo para o PIB e renda per
capita para os anos de 1998 e 1999.
b) Determine agora a mdia e o desvio
padro dos 10 anos. Utilize:

Bioestatstica

Dr Cludio S. Sartori

xi
i =1

(xi )

i =1

c) Construa um histograma para o PIB e a


renda per capita. Indique os valores das mdias.
d) Construa a funo gaussiana que representa
o Pib e a renda per capita. Atravs dela estime os
valores do PIB e renda per capita para os anos de 1998
e 1999. Compare com os valores da tabela.
e) Construa um intervalo de confiana de 95%
para a mdia do PIB e a renda per capita. Os valores de
1999 esto dentro dos limites de confiana?
8. Para testar a hiptese de que a moeda
honesta, adota-se a seguinte deciso:
(3) Aceita-se a hiptese, se o nmero de
caras em uma nica amostra de 100
lances, estiver dentro de um intervalo de
confiana de 95%.
(4) Rejeit-la, caso contrrio.
a) Construa o intervalo de confiana,
usando a aproximao normal para a
distribuio binomial.
b) Determine o nmero de caras
correspondente.
b) Que concluses se poderiam tirar do fato
de uma amostra de 100 lances apresentar 53
caras? 60 caras? 20 caras? 78 caras?
Dados:
= Np : (p:probabilidade de obter-se
sucesso em um lanamento)

= Npq :

(q:probabilidade

de

insucesso em um lanamento (q = 1- p))

z=

Repita o problema para 99% de confiana.


9.
Uma experincia sobre percepo
extra-sensorial (P.E.S), um sujeito, em uma sala,
solicitado a declarar a cor vermelha ou preta de uma
carta escolhida, de um baralho bem embaralhado de 50
cartas, por outro indivduo colocado na mesma sala. O
sujeito desconhece quantas cartas vermelhas ou pretas
h no baralho. Se o sujeito identifica corretamente 32
cartas, determinar se os resultados so significativos,
nos nveis de significncia de:
c) 0,05
d) 0,01
10. Um determinado tipo de plstico possui
uma resistncia de 27 e um desvio padro de 15 libras
por polegada quadrada ( 1 libra . 0.45 kg ). Um novo
6

FATEC

processo ser desenvolvido substituindo o


antigo, providenciando uma significativa
mudana na resistncia do plstico. Uma amostra
de 40 peas feita com o novo processo d uma
mdia de 30 libras por polegada quadrada.
Assumindo desvio padro de 6 h suficiente
evidncia para sugerir que a resistncia do
produto aumentou a 5% de significncia ?
11. Um industrial gostaria que seu
produto esteja pronto em pelo menos 700 horas.
Ele espera que seu produto no atrase muito nem
se adiante muito em relao a 700 horas. Numa
amostra de 48 produtos obteve-se mdia de 675 h
e desvio padro de 77 h.
Faa o teste a 1% de significncia.
12. Um pediatra mede um parmetro de
recordao relativo a seus 38 pacientes. Ele
espera que seu resultado seja menor que a mdia
sempre adotada, de 6.5 dias. Os resultados
amostrais obtidos so:
8 7 2 6 9 4 5 3 7 8 10 7 7
6 4 10 3 6 8
2 5 4 4 5 3 8 7 4 6 3 7
12 4 3 6 6 9 4
Usando um nvel de significncia de
5%, construa o intervalo de confina e em
seguida faa o teste de hiptese explicitando a
hiptese nula e a alternativa. Indique na
gaussiana a mdia amostral.
13. O proprietrio de uma empresa de
mquinas de copiar utiliza frequentemente, um
modelo de mquina denominado DW 140. O
proprietrio est interessado em decidir no
utilizar esse modelo caso a mdia dos trabalhos
executados pela mquina exceder 40 min. Ele
mediu o tempo de trabalho da mquina para 36
trabalhos:
23 27 28 33 35 37 39 40 40
41 42 42 42 42 43 43 44 44 45 46
46 46 47
47 47 48 49 50 51 52 53 53
56 57 61 62
Use um nvel de significncia de 5%
para decidir se o proprietrio utilizar o modelo
DW140 para seus trabalhos.
14. Um procedimento de treinamento
datilogrfico padro baseia-se em 64 palavras
datilografadas por minuto. Um instrutor analisou
38 candidatas a secretria e encontrou os
seguintes resultados (palavras por minuto):

Bioestatstica

Dr Cludio S. Sartori

56 60 60 70 60 59 41 66 67 33 55
43 61 71 73 60 56 77 43 58 65 67 71
56 48 90 82 46 68 36 27 52 64 54
49 69 46 68
Usando uma significncia de 5% pode o
instrutor afirmar que a este nvel a mdia seja diferente
de 64?
15. H duas medidas de presso sangunea
utilizadas em exames: a correspondente sstole,
quando o msculo do corao est contraindo e `a
distole, quando o msculo do corao est relaxado.
Para adultos jovens, a presso sstole/distole vale
120/74 mm de Hg. Essa presso tende a aumentar com
a idade. Para homens de 35-59 anos se encontra a
130/84. Alguns mdicos estudaram a presso
sangunea para alguns (41) atletas em determinada
universidade e encontraram uma presso mdia
(sstole/distole) de 123/80 mm Hg). Utilizando uma
significncia de 1% verifique se essa mdia est na
regio de aceitao ou rejeio e escreva as hipteses
nula e alternativa:
15.1) Para a presso correspondente sstole:
a) Comparada com adultos jovens e desvio
padro de 2 mm Hg.
b) Comparada com adultos jovens e desvio
padro de 4 mm Hg.
c) Comparada com homens de 35 - 59 anos
e desvio padro de 2 mm Hg.
d) Comparada com homens de 35 - 59 anos
e desvio padro de 4 mm Hg.

FATEC

15.2) Para a presso correspondente


distole:
Comparada com adultos jovens e
desvio padro de 2 mm Hg.
f) Comparada com adultos jovens e
desvio padro de 4 mm Hg.
g) Comparada com homens de 35 - 59
anos e desvio padro de 2 mm Hg.
h) Comparada com homens de 35 - 59
anos e desvio padro de 4 mm Hg.
e)

Exerccios - Testes de Hipteses

Uma companhia de nibus


4.
avisa que o tempo de viagem entre duas cidades
de 150 min. Um grupo de consumidores
reclamou que o tempo mdio era maior que 150
minutos, atrassando assim seus compromissos.
Uma amostra de 40 viagens mostrou uma mdia
de 153 minutos e um desvio padro de 7,5 min.
Usando um nvel de significncia de 5%, h
evidncias suficientes para crer no grupo?
H0: = 150 min ;Ha: > 150 min
= 7,5 min
Como Ha apresenta sinal > o tipo do
teste de "cauda direita".

Grfico de:

1
e
2 7.5

( x 150 ) 2
2( 7 , 5 ) 2

0.4
0.05
0.3

0.04
0.03

0.2
0.02
0.1

0.01
0
120

0
130

140

150

Regio de aceitao de H0

160

170

180

Regio de rejeio a H0

151.951

Construo do intervalo de confiana: z=0,05 = 1,645

+ zC

= 150 + 1.645

-4

7.5
= 150 + 1.951 = 151.951
40

-2

Regio de aceitao de H0 Regio de rejeio a H0

1.645

Bioestatstica

Dr Cludio S. Sartori

Como 153 pertence regiod e rejeio,


rejeita-se Ho, ou seja, o grupo est certo a um nvelde
confiana de 95%.
Podemos tambm utilizar a varivel reduzida:

z=
z=

xa

+ zC

= 15 + 1.645

5.4
= 15 + 0.7637 = 15.7637
50

Deciso: Como 17.3 > 15, rejeita-se H0,


ou seja, aceita-se Ha de que > 15.

153 150
= 2.5298
1.1851

Como 2.5298 > 1.645, rejeita-se H0 a um


nvel de confiana de 95%.
2. Uma psicloga quer confirmar sua crena
que crianas maltratadas teriam elevados nveis de
depresso. Ela d um teste chamado de POMS (Profile
of Mood States) parta uma amostra de 50 crianas
abusadas. Os resultados mostraram um escore de
depresso mdia de 17.3 e um desvio padro de 5.4 . A
um nvel de 5%, pode-se concluir que, as crianas
abusadas, tm em geral um nvel de depresso maior
de 15 (que a mdia para estudantes de colgio) ?

= 1,645

FATEC

3. O proprietrio de uma empresa


perfuradora de poos artesianos suspeita que,
para um determinado tipo de solo, a
profundidade mdia na qual se encontrava gua
era inferior a 500 ps. Perfuraes realizadas em
32 regies diferentes mostraram uma mdia de
486 ps e um desvio padro de 53 ps. A um
nvel de significncia de 1 %, justificada a
suspeita do proprietrio?
H0 = 500 ps; Ha: < 500 ps Como
Ha contm <: Teste unilateral cauda esquerda.

H0 : = 15; Ha > 15
Teste unilateral cauda direita.
Construo do intervalo de confiana: z=0,05

Construo do intervalo de confiana: z=0,01 = 2,33

53
= 500 + ( 2.33)
= 500 21.830 = 478.16
+ zC
32

0.007
0.006
0.005
0.004
0.003
0.002
0.001
0
300

400

500

Rejeio a H0

600

700

Aceitao a H0

478.16
Grfico de:
1
e
2 53

( x 500 ) 2
2( 53) 2

Como 486 pertence regio de aceitao,


aceita-se H0 a um nvel de confiana de 5%, ou seja a
mdia da profundidade de perfurao de poos
artesianos de 500 ps.

4. Um determinado tipo de plstico


possui uma resistncia de 27 e um desvio padro
de 15 libras por polegada quadrada ( 1 libra .

Bioestatstica

Dr Cludio S. Sartori

0.45 kg ). Um novo processo ser desenvolvido


substituindo
o
antigo,
providenciando
uma
significativa mudana na resistncia do plstico. Uma
amostra de 40 peas feita com o novo processo d uma
mdia de 30 libras por polegada quadrada. Assumindo
desvio padro de 6 h suficiente evidncia para sugerir
que a resistncia do produto aumentou a 1% de
significncia ?
H0 = 27 libras/pol2 ; Ha: > 27 ps Como
Ha contm >: Teste unilateral cauda direita.
Construo do intervalo de confiana: z=0,01
= 2,33

15
= 27 + 2.33
= 27 + 5.526 = 32.526
+ zC
40

Como 30 < 32.526, est na regio de


aceitao, aceita-se H0 a 1% de significncia.
Poderamos resolver tambm:

z=

xa

30 27
15
40

= 1.265

Como 1.265 < 2.33 est na regio de


aceitao, no se rejeita H0.
5. Um industrial gostaria que seu produto
esteja pronto em pelo menos 700 horas. Ele espera que
seu produto no atrase muito nem se adiante muito em
relao a 700 horas. Numa amostra de 48 produtos
obteve-se mdia de 675 h e desvio padro de 77 h.
a) Complete o teste a 5% de significncia.
b) Qual o tipo de erro de se cometer e com
que probabilidade?
a) H0 = 700 h ; Ha: 700 h

z=0,01 = 1.96
zC

= 700 1.96

77
= 700 21.783 678.216 < I < 721.783
48

Como 675 est na regio de rejeio, rejeitase H0 a um nvel de significncia de 5%.


b) O erro do Tipo I com 5% de
probabilidade.

FATEC

Bioestatstica

Dr Cludio S. Sartori

televisores vendidos eram pequenos, 35 de


tamanho mdio e 10 grandes.

Exerccios de Reviso - Estatstica

Distribuies t de Student e Qui Quadrado

a)

1. Construir um intervalo de confiana para


estimar a vida mdia til dos tubos de imagem de TV
com base em uma amostra n = 15, desvio padro e
mdia da amostra, respectivamente iguais a = 500 h
e = 8900 h, respectivamente.
2. Um encarregado de compras em um
supermercado toma uma amostra aleatria de 12 latas
de ervilha e encontra os seguintes dados:

Peso por lata (em 10


gramas)
15,7
15,8
15,9
16,0
16,1
16,2

( )

Televisores

Tela
Pequena (<
14)

Tela
Grande
(> 21)

b) Calcule o valor de 2 com base na tabela,


atravs de sua definio: (NE:Nmero de
eventos).
NE

( f e f o )2

i =1

fe

1
2
2
3
3
1

< <

Tela
mdia
(14 20)

Frequncia observada fo
em N = 100
Frequncia esperada fe
Em N = 100

c) Verifique as hipteses a 1 % de
significncia:
H0: A percentagem de todas as compras de
televisores das categorias seguem 40%,
40%, 20%.
H1: O padro atual das compras diferente
do padro histrico apresentado em H0.

3. Para o conjunto de 12 latas do exemplo


anterior, encontre, usando a distribuio Qui Quadado,
um intervalo de confiana de 95% para o desvio

Ns

Construa a tabela abaixo.

Nmero de latas

Determine:
a) O peso lquido mdio em cada lata desta
amostra e o desvio padro da amostra.
b) Use a distribuio t de Student para construir
um intervalo de confiana de 95%.

2
1 2

FATEC

Ns

2 ( )

5. A tabela a seguir ilustra o nmero de


instalaes de um sistema de ar-condicionado de
acordo com o tipo de sala usado em uma
indstria.

fo (nmero
observado)
fe (nmero
esperado)

A
6
10

Tipos de sala
B C
D
12 14
8

10

10

10

Total
40
40

a) Calcule o valor de 2 com base na tabela.


b) Dada as hipteses:

padro da populao:
Com = N 1
4. Historicamente, um fabricante de televisores
vende 40% de aparelhos com tela pequena (menos de
14 polegadas), 40 % de aparelhos com telas mdias (de
14 a 20 polegadas) e 20 % de aparelhos com telas
grandes ( 21 polegadas ou mais). Com o fim de
estabelecer programas apropriados de produo para o
prximo ms, ele toma uma amostra aleatria de 100
vendas durante o atual perodo e encontra que 55

H0: A quantidade de instalaes est


igualmente distribuda entre as 4 salas.
H1: A quantidade de instalaes no est
igualmente distribuda nas 4 salas
Testar a 5% de significncia as
hipteses acima.
6. Um gerente de departamento de pessoal
estima que 40% dos empregados de uma grande
empresa participar de um novo programa de
investimentos em aes. So feitos contatos com
uma amostra aleatria de 50 empregados, sendo
que 10 deles indicam sua inteno de participar.

Bioestatstica

Dr Cludio S. Sartori

Espera-se, com o emprego da distribuio normal, que


20 funcionrios participem do programa.
a)

Monte a tabela abaixo.


Participao do
programa
Sim
No

Total

fo
fe
20
30
50
b) A uma significncia de 5% teste a hiptese
inicial de que
H0: percentual de participao = 40 %
H1: percentual de participao 40 %
Utilize um teste bilateral com a distribuio Qui
Quadrado.
c) Faa o mesmo teste a 1 % de significncia.
7. Um fabricante de refrigeradores oferece trs
linhas de produtos bsicos, que podem ser
descritascomo "baixa" , "intermediria" e "alta" em
termos comparatuvos de preos. Antes de uma
promoo de vendas destinada a destacar as qualidades
de refrigeradores de preo alto, as vendas percentuais
das trs categorias eram, respectivamente, 45, 30, 25.
De uma amostra aleatria de 50 refrigeradores
vendidos depois da promoo, as quantidades vendidas
nas categorias de preo baixa, intermediria e alta
foram, respectivamente, 15,15 e 20. Completar a tabela
abaixo e testar a hiptese nula de que o atual padro de
vendas no difere do padro histrico, utilizando um
nvel de significncia de 5%. Ou seja
H0: o atual padro de vendas segue o padro
histrico;
H1: o atual padro de vendas difere do padro
histrico.

Categoria
s
Baixa

Interme
diria

Alta

Total

fo (quantidade
vendida)
fe (quantidade que se
espera vender)

8. Em um trabalho publicado em 1908, Gosset


(Student) discutiu alguns .dados obtidos pelos
cientistas A. Cushny e A. Peebles, que estudaram os
efeitos de ismeros ticos de hyoscyamine
hydrobromide em induzir o sono nas pessoas. Os
dados obtidos eram de horas adicionais de sono por

FATEC

noite em 10 pacientes tratados com hyoscine e


so mostrados na tabela abaixo.
As drogas promoveriam horas adicionais de
sono se a mdia de sono para todos os pacientes
possveis excedesse 0 ( > 0). Estabeleceu-se as
hipteses:
H0: = 0
Ha: > 0
Paciente
Horas
adicionais de
sono
1
1.9
2
0.8
3
1.1
4
0.1
5
-0.1
6
4.4
7
5.5
8
1.6
9
4.6
10
3.4
a) Encontre a mdia e o desvio padro das
horas adicionais de sono por paciente.
b) A um nvel de significncia de 5%, confirme
se as drogas promovem o aumento de sono
ou no.
9. A associao americana do corao
recomenda que um nvel de colesterol abaixo de
200 miligramas por 100 mililitros. Mediu-se o
nvel de colesterol de mulheres com idade
inferior a 40 anos escolhidas randomicamente:
233 197 192 179 174 217 186 221 188 209 196
167 238 179 196 191.
A um nvel de significncia de 10 %
razovel supor que mulheres abaixo de 40 anos
possuem nvel de colesterol abaixo da mdia 200
?
H0: = 200 mg/100ml
Ha: < 200 mg/100ml
10.
Uma companhia de sorvete
argumenta que seu produto contm 500 cal por
quartil, (1 quartil equivale a 560 ml,
aproximadamente). Para comprovar essa
hiptese, foram analizados 24 potes de 1 quartil,
onde obteve-se uma mdia de 507 calorias e
desvio padro de 21 calorias. Teste a hipotese a
2 % de nvel de significncia utilizando a
distribuio t de Student.
H0: = 500 cal
Ha: 500 cal
11. Construa um intervalo de confiana
de 95% utilizando a distribuio t de Student

Bioestatstica

Dr Cludio S. Sartori

FATEC

para o nvel mdio de ansiedade de estudantes de


colgio, medidos por meio de um questionrio, cuja
pontuao mdia para 20 estudantes equivale a 60
pontos com desvio padro de 7.5 .
12. Uma indstria de produtos eletrnicos
utiliza na montagem de um produto, 4 linhas de
manufatura para produzir o mesmo produto. Cada
linha de produo teoricamente equivalente, desde
que todos tenham a mesma razo de produo de
instrumentos necessrios at o prazo de garantia do
produto. A companhia deseja checar esse processo. A
deciso foi tomada em observar os prximos 100
produtos que retornaram defeituosos e determinar
quantos chegam a cada linha de montagem. A linha de
montagem 1 usada 2 vezes por dia enquanto as
linhas de montagem 2, 3 e 4 so utilizadas uma vez s.
Os produtos defeituosos que chegam nas linhas 1,2,3 e
4 so, respectivamente, 53,18,14 e 15.
a)

Determine as probabilidades com que


ocorrem os produtos defeituosos nas linhas de
produo.
b) Construa a tabela abaixo.
Linha de
1
2
3
4 Total
produo
Frequncia
observada fo em
N = 100
Frequncia
esperada fe
Em N = 100
c) Calcule o valor de 2 com base na tabela,
atravs de sua definio: (NE:Nmero de eventos).
NE

( f e f o )2

i =1

fe

=
2

d) Verifique as hipteses a 1 % de significncia:


H0: As linhas de produo seguem as
probebilidades encontradas (2/5 para linha 1,1/5 para
linha 2,1/5 para linha 3,1/5 para linha 4) para produtos
defeituosos.
H1: O padro maior do apresentado em H0.
13.
A tabela a seguir ilustra o nmero de
instalaes de ventiladores de acordo com o tipo de
sala usado em uma indstria.

fo (nmero
observado)
fe (nmero
esperado)

A
6
5

Tipos de sala
B C D
12 12 10

15

15

Total
40
40

Calcule o valor de 2 com base na


tabela.
d) Dada as hipteses:
c)

H0: A quantidade de instalaes est


igualmente distribuda entre as 4 salas.
H1: A quantidade de instalaes no est
igualmente distribuda nas 4 salas
Testar a 5% de significncia as
hipteses acima.
Adaptados de General Statistics, Warren Chase and
Fred Bown, John Wiley & Sons, Inc., Third edition

Distribuies t de Student e Qui Quadrado

Bioestatstica

Dr Cludio S. Sartori

Teoria de Pequenas Amostras

Notamos anteriormente que para


distribuies de amostras com nmero N > 30,
denominadas de grandes amostras, as distribuies
eram aproximadamente normais, tornando-se a
aproximao melhor com o crescimento de N. Para
amostras com N < 30 essa aproximao no e boa
piora com o decrscimo de N. Elas so denominadas
de pequenas amostras e seu estudo denominado de
teoria de pequenas amostras, onde duas distribuies
importantes, a Student t ou t de Student e a qui
quadrado sero estudadas.

do qual podem ser calculados x e s. Entretanto,


como deve ser avaliado, k =1.
O parmetro de normalizao pode ser
obtido e a distribuio t de student dada por:

f ( x, , ) =

A Distribuio de Student t

x
s / N

Com

s =

x 2


s

1 +

+1

N
N 1 s

Considerando-se amostras com tamanho N,


extradas
de
uma
populao
normal
(ou
aproximadamente normal) de mdia , e, se para
amostra , calcular-se o valor de t, por meio da mdia
amostral x e do desvio padro s, pode-se determinar a
distribuio amostral de t.
Tal distribuio dada por:

+1
2

f ( t , ) =

t2

1 +
2

+1
2

Aqui, a funo Gamma, definida


por:

( x ) = t x 1e t dt

Y0

Y=

+1

Ou, reduzindo a varivel:

Definimos a estatstica :

t=

FATEC

t2 2
1 +

ou

Y=

Y0
t2
1 +

( +1)
2

Onde (letra grega "nu") denominada de


nmero de graus de liberdade.
Note que

= N 1

O nmero de graus de liberdade de uma


estatstica definido o nmero N de observaes
independentes da amostras menos o nmero k de
parmetros populacionais que devem ser estimados por
meio
das
observaes
amostrais.
Ento:
= N k . No caso da estatstica definida por t, o
nmero de observaes independentes da amostra N,
6

A forma grfica da distribuio t de


Student est mostrada a seguir, para alguns
valores do grau de liberdade e comparadas
com a distribuio normal, pois para grandes
valores de N a distribuio t de Student se
aproxima com a normal reduzida:
2

1 t2
Y=
e
2

Pequena
Bibliografia
(http://history.math.csusb.edu/Mathematicians/G
osset.html)

Bioestatstica

Dr Cludio S. Sartori

Gosset trabalhou com um grande


nmero de estatsticos, como Fisher, Neyman e
Pearson.

http://ubmail.ubalt.edu/~harsham/statdata/opre330.htm#rt distributions

( 2+1 ) 1
Chamamos de y =
(2 )
parmetro relacionado normalizao de f (t ) .

0.4

(n 2 )!!
( n 1 )

0.35
0.3
0.25

importante salientar as propriedades da funo


gamma:

( n2 ) =

FATEC

0.2
0.15
0.1

n = 1,3,5 ,

0.05

(n ) = (n 1)! n = 1,2,3,4,5,

-4

n !! chamado de fatorial duplo, e


definido por:

n (n 2) (n 4) 5 31 se n > 0 mpar

n!!= n (n 2) (n 4) 6 4 2 se n > 0 par.

1se n = 1,0.

-2

Curvas t de Student para =4 ,Y0=0.4 , =1


Y0=0.35 e =2 Y0=0.33 comparadas
com a distribuio normal
(linha cheia).
N-1= 1
N-1= 2
N-1= 3
N-1= 4
N-1= 5
N-1= 6

Distribuio t de Student: Varivel reduzida t

0,35

Com essas propriedades possvel encontrar


o parmetro de normalizao da distribuio, y.

0,3

y ( t)

0,25

William Gosset - 1876 em


Canterbury, Inglaterra -16 outubro
1937 em Beaconsfield, Inglaterra.
William foi educado em Winchester, onde em
Oxford estudou qumica a matemtica. Trabalhou em
Dublin onde fez importante trabalho importante em
estatstica. Em 1905 contatou Karl Pearson foi
Londres estudar no laboratrio de Pearson.
Neste tempo trabalhou no chamado limite de
Poisson, com a distribuio binomial e de amostragem,
desvio padro, e do coeficiente de correlao. Publicou
mais tarde trs trabalhos importantes que tinha
empreendido durante este ano que trabalhou no
laboratrio de Pearson .
familiarmente conhecido como "estudante"
mas no como Gosset.
De fato, Gosset escreveu sob pseudnimo de
"estudante" que explica porque seu nome no era
divulgado em virtude de resultados estatsticos
importantes. Inventou o t - teste para segurar amostras
pequenas para o controle de qualidade.
Descobriu o formulrio da distribuio de t
por uma combinao do trabalho matemtico e
emprico com os nmeros aleatrios, uma aplicao
adiantada do mtodo de Monte-Carlo.

0,2
0,15
0,1
0,05
-3

-2,5

-2

-1,5

-1

-0,5

0
t

0,5

1,5

2,5

A tabela ilustra a rea compreendida


pela curva da distribuio t de Student, de - a

tp :
Valores dos percentis t p

Distribuio t de Student

com graus de liberdade


(rea sombreada =p)

tp

Bioestatstica

Dr Cludio S. Sartori

FATEC

t 0.995

t 0.99

t 0.975

t 0.95

t 0.9

t 0.8

t 0.75

t 0.7

t 0.6

t 0.55

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

63,66
9,92
5,84
4,60
4,03
3,71
3,50
3,36
3,25
3,17
3,11
3,06
3,01
2,98
2,95
2,92
2,90
2,88
2,86
2,84
2,83
2,82
2,81
2,80
2,79
2,78
2,77
2,76
2,76
2,75
2,70
2,66
2,62
2,58

31,82
6,96
4,54
3,75
3,36
3,14
3,00
2,90
2,82
2,76
2,72
2,68
2,65
2,62
2,60
2,58
2,57
2,55
2,54
2,53
2,52
2,51
2,50
2,49
2,48
2,48
2,47
2,47
2,46
2,46
2,42
2,39
2,36
2,33

12,71
4,80
3,18
2,78
2,57
2,45
2,36
2,31
2,26
2,23
2,20
2,18
2,16
2,14
2,13
2,12
2,11
2,10
2,09
2,09
2,08
2,07
2,07
2,06
2,06
2,06
2,05
2,05
2,04
2,04
2,02
2,00
1,98
1,96

6,31
2,92
2,35
2,13
2,02
1,94
1,90
1,86
1,83
1,81
1,80
1,78
1,77
1,76
1,75
1,75
1,74
1,73
1,73
1,72
1,72
1,72
1,71
1,71
1,71
1,71
1,70
1,70
1,70
1,70
1,68
1,67
1,66
1,645

3,08
1,89
1,64
1,53
1,48
1,44
1,42
1,40
1,38
1,37
1,36
1,36
1,35
1,34
1,34
1,34
1,33
1,33
1,33
1,32
1,32
1,32
1,32
1,32
1,32
1,32
1,31
1,31
1,31
1,31
1,30
1,30
1,29
1,28

1,376
1,061
0,978
0,941
0,920
0,906
0,896
0,889
0,883
0,879
0,876
0,873
0,870
0,868
0,866
0,865
0,863
0,862
0,861
0,860
0,859
0,858
0,858
0,857
0,856
0,856
0,855
0,855
0,854
0,854
0,851
0,848
0,845
0,842

1,000
0,816
0,765
0,741
0,727
0,718
0,711
0,706
0,703
0,700
0,697
0,695
0,694
0,692
0,691
0,690
0,689
0,688
0,688
0,687
0,686
0,686
0,685
0,685
0,684
0,684
0,684
0,683
0,683
0,683
0,681
0,679
0,677
0,674

0,727
0,617
0,584
0,569
0,559
0,553
0,549
0,546
0,543
0,542
0,540
0,539
0,538
0,537
0,536
0,535
0,534
0,534
0,533
0,533
0,532
0,532
0,532
0,531
0,531
0,531
0,531
0,530
0,530
0,530
0,529
0,527
0,526
0,524

0,325
0,289
0,277
0,271
0,267
0,265
0,263
0,262
0,261
0,260
0,260
0,259
0,259
0,258
0,258
0,258
0,257
0,257
0,257
0,257
0,257
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,255
0,254
0,254
0,253

0,158
0,142
0,137
0,134
0.132
0,131
0,130
0,130
0,129
0,129
0,129
0,128
0,128
0,128
0,128
0,128
0,128
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,126
0,126
0,126
0,126

Nmero de graus de liberdade:

= N 1

Intervalo de Confiana com um determinado nvel de significncia : t p

Bilaterais: t p

= t1 ; Unilaterais: t p = t1
2

Bioestatstica

Dr Cludio S. Sartori

Intervalos de Confiana da Distribuio tde Student:

FATEC

confiana desejado e do tamanho da amostra.


Tambm so tirados da tabela anterior.
Testes de Hiptese e Confiana:

Como na distribuio normal, podem ser


definidos intervalos de confiana de 95%, 99% e
outros para a distribuio t de Student, com o emprego
da tabela anterior. Dessa maneira, a mdia da
populao pode ser avaliada dentro dos limites de
confiana especificados.
Por exemplo, -t0,975 e t0,975 so os valores de t,
para os quais 2,5% da rea ficam localizados em cada
extremidade da distribuio t, ento o intervalo de
confiana de 95% para t :

t 0,975 <

x
N 1 < t 0,975
s

Ou seja, verifica-se que a mdia avaliado


para que caia no intervalo:

t 0,975

s
N 1

< < t 0,975

So estendidos aos problemas que


envolvem pequenas amostras. A nica diferena
que tratamos ao escore t, com a estatstica t de
Student.
Exemplo 1 - O grfico da distribuio t
de Student est indicado abaixo, para 9 graus de
liberdade e Y0 = 1. Determinar os valores de t1
para os quais:
a) A rea sombreada direita igual a
0,05.
b) A rea sombreada total vale 0,05.
c) A rea no sombreada total 0,99.
d) A rea sombreada esquerda vale 0,01.
e) A rea esquerda de t1 = 0,90.

s
N 1

Com a confiana de 95% (ou probabilidade de


0,95). t0,975 representa o valor do percentil 97,5,
enquanto t0,025 = -t0,975 representa o do percentil 2,5.
Em geral, pode-se representar os limites de
confiana para as mdias populacionais como sendo:

tc

Os valores tc so chamados crticos ou


coeficientes de confiana e dependem do nvel de

1
0.8
0.6
0.4
0.2

-4

-2

-t1
a) rea sobreada direita 0,05, ento a rea
esquerda de t1 1-0,05=0,95 e t1 representa o percentil
950, e, pela tabela, t0.95 = 1,83.
b) Se a rea total sombreada 0,05, por simetria, a
rea direita 0,025. Portanto a rea esquerda de t1
vale 1-0,025 = 0,975. t1 representa o percentil 97,50.
Na tabela encontra-se o valor de t0.975=2,26.

t1
c) Se a rea no sombreada 0,99, a rea
total sombreada 1 - 0,99 = 0,01 e a sombreada
direita 0,01/2=0,005. Na tabela se determina
t0,995=3,25.
d) Se a rea sombreada esquerda vale 0,01,
por simetria, direita 0,01. Na tabela, t0,99=2,82. Portanto o valor crtico de t, para o qual a
rea sombreada esquerda 0,01 igual a -2,82.

Bioestatstica

Dr Cludio S. Sartori

e) Se a rea esquerda de t1 0,90, ento t1


corresponde ao 900 percentil; t0,90 = 1,38.
Exemplo 2 - Determinar os valores crticos de
t para os quais a rea da extremidade direita da
distribuio t 0,05, quando o nmero de graus de
liberdade for:
a) = 16
b) = 27
c) = 200

Os limites de confiana de 95% so


dados por:

= x t 0.975

s
N 1

Como N = 10 = N - 1 = 9; Da tabela
encontramos t0.975 = 2,26.
Logo:
polegad
x t0.975 Ns 1 = 4, 38 2, 26 0,06
10 1
s
N 1

= x t 0.995

s
N 1

Como N = 10 = N - 1 = 9; Da
tabela encontramos t0.995 = 3,25.
Os limites de confiana sero:
s

s
N 1

= 4, 38 3, 25

0,06
10 1

= 4, 38 0, 0650

Exemplo 5 - Antigamente, certa


mquina produzia arruelas que tinham a
espessura de 0,05 polegadas. Para se verificar se
a mquina est trabalhando adequadamente,
escolheu-se uma amostra de 10 arruelas cuja
espessura mdia 0,053 polegada e cujo desvio
padro 0,003 polegada. Testar a hiptese de a
mquina estar trabalhando adequadamente,
adotando os nveis de significncia de:
a) 0,05.
b) 0,01

Deseja-se decidir entre as hipteses:


H0: = 0,05, e a mquina est
trabalhando adequadamente.
H1: 0,05 ela no est.
Tipo de teste: Bilateral.
Ento:

t=

x
s

N 1

0,053 0,05
0, 03

=3

101

a) Para =0,05 Aceitamos H0 quando


t estiver compreendido entre -t0.975 e t 0,975.
Pela tabela, = 9; t0.975=2,26 e o
intervalo vai de -2.26 a 2.26.
Como t = 3, rejeita-se H0 ao nvel de
significncia de 0,05.
b) Se =0,01, aceitamos H0 quando t
estiver compreendido entre -t0.995 e t 0,995
Pela tabela, = 9; t0.995= 3,25 e o
intervalo vai de -3.25 a 3.25.
Logo, como t = 3, aceita-se H0 ao nvel
de 0,01.
Exemplo 6 - Um ensaio de tenses de
ruptura de 6 cabos produzidos por uma
companhia mostrou que a tenso mdia de
ruptura de 7750 kg e o desvio padro de 145 kg,

as.

x t0.975

s
N 1

O intervalo de confiana de 99% ser:


(4.315,4.445) polegadas.

Exemplo 4 - Uma amostra de 10 medidas de


dimetro de uma esfera apresentou a mdia de
x = 4,38 polegadas e o desvio padro s = 0,06
polegada. Determinar os limites de confiana de:
a) 95%
b) 99% para o dimetro real.

s
N 1

x tc

x t0.995

Exemplo 3 - Os coeficientes de confiana de


95% (bilateral) para a distribuio normal so dados
por 1,96. Quais sero os coeficientes correspondentes
para a distribuio t, quando:
a) = 9 ?
b) = 120 ?
c) = 30 ?
d) = 60 ?
A rea total sombreada ( caudas) ser de: 1 0,95 = 0,05. A rea da extremidade direita 0,025 e o
valor crtico correspondente de t tc = t0.975. Ento os
coeficientes de confiana desejados so t0.975
Logo:
a) = 9 t0.975 = 2,26
b) = 120 t0.975 = 2,09
c) = 30 t0.975 = 2,04
d) = 60 t0.975 = 2,00

x tc

Pode-se estar 95% confiante de que a


mdia verdadeira est compreendida entre 4,38 0,045 = 4,335 polegadas e 4,38+0,045 = 4,425
polegadas.
b) Os limites de confiana de 99 %
so:

x t0.995

Escolhendo-se t0.95 na tabela achamos:


a) = 16 t0.95 = 1,75
b) = 27 t0.95 = 1,70
c) = 200 t0.95 = 1,645

a)

FATEC

= 4, 38 0, 0452

Bioestatstica

Dr Cludio S. Sartori

ao passo que o fabricante declara que aquela tenso


mdia de 8000 kg. Ser verdadeira a declarao do
fabricante, aos nveis de significncia de:
a) 0,05
b) 0,01
Deve-se decidir em: H0: = 8000 kg, e a
declarao do fabricante justificada.
H1: < 8000 kg e ela
no o . Teste tipo unilateral.
a)

t=

x
s

N 1

7750 8000
145

= 3,86

61

Como = N - 1 = 6 - 1 = 5
Aceitamos H0 desde que t seja superior a t0.95; para = 5 t0.95 = -2,02. Caso contrrio, rejeitase H0. Como t = -3,86 < t0.95 rejeitamos H0 ao nvel de
significncia de 0.05.
b) Aceitaremos H0 desde que t > t0.99 ; para
= 5 t0.99 = -3,36 ; ou seja t > -3,36
Como t = -3,86 < -3,36rejeita-se H0,
ou seja, improvvel a declarao do fabricante.
Exerccios:

A vida mdia de operao de 10


1.
lmpadas x = 4000h com o desvio padro da
amostra de s = 200 horas. Supe-se que o tempo de
operao das lmpadas em geral tenha distribuio
aproximadamente normal. Estimar a vida mdia de
operao para a populao das lmpadas da qual foi
extrada a amostra, usando um intervalo de confiana
da forma:

x tc

s
N 1

2.
A hiptese nula formulada de que a
mdia da vida til de lmpadas de uma determinada
marca, , no mnimo, de 4200 horas, com desvio
padro amostral de s = 200 horas. A vida til das
lmpadas segue uma distribuio normal. Teste a
hiptese nula a um nvel de significncia de 5%,
usando a distribuio t de Student.
3
Um representante de um grupo
comunitrio informa, a um investidor interessado em
desenvolver um centro comercial, que a renda mdia
familiar na comunidade no mnimo = $ 15000,00.
Supe-se que os valores de renda na populao
comunitria sejam normalmente distribudos. Para uma
amostra aleatria de n = 15 famlias na comunidade, a
mdia amostral de x = $14000,00 e o desvio
padro amostral vale s = $ 2000,00. Testar a hiptese
nula ao nvel de significncia de 5%.
4.
Como agente de compras de um
certo supermercado, suponha que voc tome uma
amostra aleatria de 12 latas de vagens em conserva na

FATEC

prpria fbrica de enlatados. O peso lquido, em


10 gramas, encontrado em mdia por lata foi de
x = $15,97 , com s = 0,15. Foi afirmado que o
preo mdio por lata, era de $ 16,00, sempre em
unidades de 10 gramas. Pode essa afirmao ser
rejeitada a um nvel de significncia de 10% ?
5.
Como agente de compras de
um certo supermercado, suponha que voc tome
uma amostra aleatria de 12 latas de vagens em
conserva na prpria fbrica de enlatados. O peso
lquido, em 10 gramas, encontrado em mdia por
lata foi de x = $15,97 , com s = 0,15. Foi
afirmado que o preo mdio por lata, era de $
16,00, sempre em unidades de 10 gramas. Pode
essa afirmao ser rejeitada a um nvel de
significncia de 5% ?
6.
Para uma distribuio t de
Student com 10 graus de liberdade, determine o
valor de t1 de modo que:
a) A rea direita de t1 seja de 0,01.
b) A rea esquerda de t1 seja de 0,95.
c) A rea direirata de t1 seja de 0,10.
d) A soma das reas direita de t1 e
esquerda de -t1 seja de 0,01.
e) A rea entre -t1 e t1 seja de 0,85.
7. Determinar os valores crticos de t ,
para oa quais a rea da extremidade direita da
distribuio ser 0,01, se o nmero de graus de
liberdade for:
a) = 4
b) = 12
c) = 25
d) = 60
e) = 160
8.
Usando o software Excel da
Microsoft, elabore uma planilha para construir os
grficos da distribuio t de Student com os
graus de liberdade:
a)
b)
c)
d)

=4
=6
=8
= 16

Utilize Y0 = 1.

Bioestatstica

Dr Cludio S. Sartori

FATEC

A distribuio de qui quadrado

Definimos a estatstica:
N

2 =

Ns

( X i X )2
i =1

em que a letra grega qui e 2 lido como


qui quadrado. Considerando-se amostras de tamanho
N retiradas de uma populao normal, com o desvio
, e se, para cada amostra, for calculado o valor de 2,
pode-se obter uma distribuio amostral desses
valores.
Essa distribuio chamada de qui quadrado,
e dada por:

Y = Y0 2 e

2
2

Aqui: = N - 1 o nmero de graus de


liberdade e Y0 uma constante dependente de , de
modo que a rea total subentendida pela curva igual a
1.
As distribuies esto mostradas na figura
abaixo, para alguns valores de . ( = 2,4,6,8,10)
N-1=
N-1=
N-1=
N-1=
N-1=
N-1=

Distribuio Qui-Quadrado
0,55
0,5

1
2
3
4
5
6

0,45
0,4

0,35
0,3
0,25
0,2
0,15
0,1
0,05
0

10
2

12

14

16

18

20

Tabela: Valores dos percentis

2p

da

distribuio de Qui Quadrado com graus de


liberdade (rea sombreada =p) .

Intervalo de confiana para 2

Como fizemos para as distribuies normal e t


de Student, podem ser definidos os limites e intervalos
de confiana de 95%, 99% e outros, para 2, mediante
o emprego da tabela a seguir.

2p

Bioestatstica

Dr Cludio S. Sartori

02,995

02,99

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100

7,88
10,6
12,8
14,9
16,7
18,3
20,3
22,0
23,6
25,2
26,8
28,3
29,8
31,3
32,8
34,3
35,7
37,2
38,6
40,0
41,4
42,8
44,2
45,6
46,9
48,3
49,6
51,0
52,3
53,7
66,8
79,5
92,0
104,2
116,3
128,3
140,2

6,63
9,21
11,3
13,3
15,1
16,8
18,5
20,1
21,7
23,2
24,7
26,2
27,7
29,1
30,6
32,0
33,4
34,8
36,2
37,6
38,9
40,3
41,6
43,0
44,3
45,6
47,0
48,3
49,6
50,9
63,7
76,2
88,4
100,4
112,3
124,1
135,5

5,02
7,38
9,35
11,1
12,8
14,4
16,0
17,5
19,0
20,5
21,9
23,3
24,7
26,1
27,5
28,8
30,2
31,5
32,9
34,2
35,5
36,8
38,1
39,4
40,6
41,9
43,2
44,5
45,7
47,0
59,3
71,4
83,3
95,0
106,6
118,1
129,6

2
0 , 975

02,95

02,90

02,75

3,84
5,99
7,81
9,49
11,1
12,6
14,1
15,5
16,9
18,3
19,7
21,0
22,4
23,7
25,0
26,3
27,6
28,9
30,1
31,4
32,7
33,9
35,2
36,4
37,7
38,9
40,1
41,3
42,6
43,8
55,8
67,5
79,1
90,5
101,9
113,1
124,3

2,71
4,61
6,25
7,78
9,24
10,6
12,0
13,4
14,7
16,0
17,3
18,5
19,8
21,1
22,3
23,5
24,8
26,0
27,2
28,4
29,6
30,8
32,0
33,2
34,4
35,6
36,7
37,9
39,1
40,3
51,8
63,2
74,4
85,5
96,6
107,6
118,5

1,32
2,77
4,11
5,39
6,63
7,84
9,04
10,2
11,4
12,5
13,7
14,8
16,0
17,1
18,2
19,4
20,5
21,6
22,7
23,8
24,9
26,0
27,1
28,2
29,3
30,4
31,5
32,6
33,7
34,8
45,6
56,3
67,0
77,6
88,1
98,6
109,1

FATEC

02,50

02,25

02,10

02,05

02, 025

02,01

0,455
1,39
2,37
3,36
4,35
5,35
6,35
7,34
8,34
9,34
10,3
11,3
12,3
13,3
14,3
15,3
16,3
17,3
18,3
19,3
20,3
21,3
22,3
23,3
24,3
25,3
26,3
27,3
28,3
29,3
39,3
49,3
59,3
69,3
79,3
89,3
99,3

0,102
0,575
1,21
1,92
2,67
3,45
4,25
5,07
5,90
6,74
7,58
8,44
9,30
10,2
11,0
11,9
12,8
13,7
14,6
15,5
16,3
17,2
18,1
19,0
19,9
20,8
21,7
22,7
23,6
24,5
33,7
42,9
52,3
61,7
71,1
80,6
90,1

0,0158
0,211
0,584
1,06
1,61
2,20
2,83
3,49
4,17
4,87
5,58
6,30
7,04
7,79
8,55
9,31
10,1
10,9
11,7
12,4
13,2
14,0
14,8
15,7
16,5
17,3
18,1
18,9
19,8
20,6
29,1
37,7
46,5
55,3
64,3
73,3
82,4

0,0039
0,103
0,352
0,711
1,15
1,64
2,17
2,73
3,33
3,94
4,57
5,23
5,89
6,57
7,26
7,96
8,67
9,39
10,1
10,9
11,6
12,3
13,1
13,8
14,6
15,4
16,2
16,9
17,7
18,5
26,5
34,8
43,2
51,7
60,4
69,1
77,9

0,001
0,0506
0,216
0,484
0,831
1,24
1,69
2,18
2,70
3,25
3,82
4,40
5,01
5,63
6,26
6,91
7,56
8,23
8,91
9,59
10,3
11,0
11,7
12,4
13,1
13,8
14,6
15,3
16,0
16,8
24,4
32,4
40,5
48,8
57,2
65,6
74,2

0,0002
0,0201
0,115
0,297
0,554
0,872
1,24
1,65
2,09
2,56
3,05
3,57
4,11
4,66
5,23
5,81
6,41
7,01
7,73
8,26
8,90
9,54
10,2
10,9
11,5
12,2
12,9
13,6
14,3
15,0
22,2
29,7
37,5
45,4
53,5
61,8
70,1

0,000
0,010
0,072
0,207
0,412
0,676
0,989
1,34
1,73
2,16
2,60
3,07
3,57
4,07
4,60
5,14
5,70
6,26
6,84
7,43
8,03
8,64
9,26
9,89
10,5
11,2
11,8
12,5
13,1
13,8
20,7
28,0
35,5
43,3
51,2
59,2
67,3

2
0 , 005

Bioestatstica

Dr Cludio S. Sartori

Exemplo 1 - O grfico da distribuio


qui quadrado com 5 graus de liberdade est
representado ao lado:

A distribuio de Qui-Quadrado pode ser


escrita por:

Y (

)=


22
2

0.2

0.175

0.15
0.125
0.1
0.075

Pode-se avaliar, dentro dos limites do


intervalo de confiana, o desvio padro populacional
, expresso em funo do desvio padro amostral s.

Ns 2

2 <

a)
b)
c)
d)

2
0 , 975 so os

< 02.975

02.975

< <

s N

02.025

com o grau de confiana de 95%.


Similarmente podemos determinar outros intervalos de
confiana. Os valores

02.025

02.975

representam ,

respectivamente, os valores dos percentis 2,5 e 97,5. A


tabela anterior fornece os valores dos percentis
correspondentes aos graus de liberdade . Para grandes
valores de ( 30), pode-se utilizar o fato de

2 2 1 ter
2

distribuio

aproximadamente normal com mdia 0 e desvio


padro 1, de modo que podem ser usadas as tabelas da
distribuio normal, quando 30.
Ento, se

2p e zp so percentis de ordem p

das distribuies qui


respectivamente, tem-se:

22

A rea sombreada direita = 0,05


A rea sombreada total 0,05
A rea sombreada esquerda 0,10.
A rea sombreada direita = 0,01.
a)

Se a rea sombreada direita

0,05, ento a rea situada esquerda de


(1-0,05)=0,95 e

do qual se deduz que estimado para que


fique dentro do intervalo :

s N

20

que:

valores de (denominados valores crticos), para os


quais 2,5% da rea so localizados em cada
extremidade da distribuio, o intervalo de confiana
de 95% ento:

02.025 <

15

Determine os valores crticos de 2 tais

Ns 2

10

2
0 , 025 e

12

0.05
0.025

< 2

< < s

Exemplificando, se

FATEC

quadrado

normal,

2p = 12 (z p + 2 1)

22

22

representa o 950 percentil,

02.95 . Percorrendo a tabela por = 5 achamos


02,95 = 11,1
b)
Como
a
distribuio

assimtrica, h vrios valores crticos para os


quais a rea total sombreada igual a 0,05.
costume escolher as duas reas de valores iguais,
0,025. Se a rea sombreada direita 0,025, a
situada esquerda de situada
= 0,975 e

22

(1 - 0,025)

2
0
2 representa o 97,5 percentil,

02,975 =12,8
Similarmente, se a rea sombreada

12 0,025, e 12 representa o 2,50


2
percentil, ento 0, 025 = 0,831
esquerda de

c) Se a rea sombreada esquerda


0,10,

12

representa

02,1 = 1,61 .

100

percentil

Bioestatstica

Dr Cludio S. Sartori

Se a rea sombreada direita 0,10,

d)

a rea esquerda de
990 percentil e

22

0,99 e

22

Exemplo 2 Determinar os valores crticos de


2 para os quais a rea da extremidade direita da
distribuio de 2 ser de 0.05, quando o nmero de
graus de liberdade, for igual a:

b) Para 99%, os limites de confiana

s N
02,95

0.995

encontra-se os valores dos

percentis:
a) = 15 25
b) = 21 32.7
c) = 50 67.5

Como

2
0 , 995

< <

= 32.8;

=
2
0 , 005

s N

0.005

16

15

= 4.60

0.995 = 32.8 0.995 = 5.73

Exemplo 3 Determinar os valores medianos


de 2 correspondente aos graus de liberdade de:

0.005 = 4.60 0.005 = 2.14


Limites de confiana de 99%:

a) 9
b) 28
c) 40
Na coluna

2.4 16
2.4 16
< <
5.24
2.50
1.83 < < 3.84
sero:

a) 15
b) 21
c) 50
Na coluna

0.025 = 6.26 0.025 = 2.50

representa o

02,99 = 15,1.

FATEC

2.4 16
2.4 16
< <
5.73
2.14

02,50

encontra-se os valores dos

percentis:
d) = 9 8.34
e) = 28 27.3
f) = 40 39.3
Exemplo 4 O desvio padro das alturas de 16
estudantes
do
sexo
masculino,
escolhidos
aleatoriamente em uma escola de 1000 estudantes vale
2.4 cm. Determinar os limites de confiana de:
a) 95%
b) 99%
Do desvio padro para todos os estudantes do
sexo masculino da escola.

Os limites de confiana so dados por:

s N

0.975

< <

s N

0.025

Para N = 16 = N - 1 = 16 - 1 = 15
Observando
a
tabela,
temos:

02,975 = 27.5; 02,025 = 6.26

0.975 = 27.5 0.975 = 5.24


7

1.68 < < 4.49

Portanto, pode-se estar 99% confiante


em que o desvio padro populacional est entre
1.68 e 4.49 cm.

Bioestatstica

Dr Cludio S. Sartori

O teste de Qui Quadrado

Os resultados obtidos por meio de amostras,


nem sempre coincidem com os tericos esperados, de
acordo
com
as
regras
de
probabilidade.
Exemplificando: teoricamente espera-se obter 50 caras
e 50 coroas em 100 lanamentos de uma moeda
honesta, mas raro obter esses resultados na prtica.
Suponha-se que, em uma determinada
amostra, observou-se que um conjunto de eventos
possveis, E1, E2, E3,, Ek, ocorreram com as
freqncias o1, o2, o3,,ok, denominadas freqncias
observadas, , e que, de acordo com as regras de
probabilidade, esperar-se-ia que elas ocorressem com
as freqncias e1, e2, e3,,ek, denominadas
freqncias esperadas ou tericas.
Evento
Freqncia
observada
Freqncia
terica

E1
o1

E2
o2

E3
o3

Ek
ok

e1

e2

e3

ek

Deseja-se, frequentemente, saber se as


freqncias observadas diferem de modo significativo,
das freqncias esperadas. No caso de serem possveis
somente dois eventos E1 e E2, o que denominado s
vezes de classificao dicotmica ou dicotomia, como,
por exemplo, caras e coroas, parafusos defeituosos ou
no, etc., o problema resolvido satisfatoriamente
como descrevemos anteriormente. Vamos agora
considerar o caso geral.
Definio de 2:
Uma medida da discrepncia existente entre
as freqncias observadas e esperadas proporcionada
pela estatstica de 2, expressa por:

=
2

( o1 e1 ) 2
e1

( o2 e2 ) 2
e2

=
2

j =1

(f

oj

( o3 e3 )2
e3

fe j

++

Testes de significncia:

Na prtica, as freqncias esperadas so


calculadas com base em uma hiptese H0. Se,
para essa hiptese, o valor de 2 calculado pela
equao dada for maior que alguns valores
crticos, tais como

02.95

fe j
2

2 e 2

O nmero de graus de liberdade dado por:


=k-1
Quando as freqncias esperadas puderem ser
calculadas, sem que se faam estimativas dos

02.99 , que so os

valores crticos nos nveis de significncia 0.05 e


0.01, respectivamente, concluir-se- que as
freqncias observadas diferem, de modo
significativo, das esperadas, e rejeitar-se- H0 ao
nvel de significncia dado. Caso contrrio,
aceitar-se- H0, ou pelo menos, no a rejeitar.
Esse processo denominado teste de qui
quadrado da hiptese ou significncia.
Encaramos com suspeita quando 2
prximo de 0, pois em geral raro que as
freqncias observadas concordem com as
esperadas.
A tabela anterior, na quais as
freqncias observadas figuram numa linha
nica, denominada de tabela de simples
entrada. Quando as freqncias observadas
ocupam h linhas e k colunas, ou seja, uma tabela
dupla de entrada h x k denominamos de tabelas
de contingncia. A freqncia total de cada linha
ou coluna denominada de freqncia marginal.
Para verificar a concordncia entre as
freqncias observadas e esperadas:, calcula-se a
estatstica:
k

2 =
j =1

parmetros populacionais, a partir de


estatsticas amostrais.
= k - 1 -m
Quando as freqncias esperadas
somente podem ser calculadas mediante a
estimativa de m parmetros populacionais, a
partir de estatsticas amostrais.

( ok ek ) 2
ek

A distribuio amostral de 2 pode ser aproximada por:

Y = Y0

FATEC

(f

oj

fe j

fe j

Considera-se a soma de todas as casas


da tabela de contingncia de ordem j. Essa soma
contm kh termos. A soma de todas as
freqncias observadas igual a soma de todas
as freqncias esperadas e vale N.
O nmero de graus de liberdade dessa
distribuio qui quadrado, para k > 1 e h > 1
dado por:
= (h - 1)(k - 1)
Quando as freqncias esperadas
puderem ser calculadas, sem que se faam
estimativas dos parmetros populacionais, a
partir de estatsticas amostrais.

Bioestatstica

Dr Cludio S. Sartori

= (h - 1)(k - 1) -m
Quando as freqncias esperadas somente
podem ser calculadas mediante a estimativa de m
parmetros populacionais, a partir de estatsticas
amostrais.

=
2

(o

ej )

(o

ej )

ej

j =1

(o

ej )
ej

j =1

2 = (

=(

115100)
100

+(

85100 )
100

j =1

a) O valor crtico

02.95

para 1 grau de

liberdade vale 3.84. Como 4.50 > 3.84, rejeitar-se- a


hiptese ser honesta, no nvel de significncia 0.05
b) O valor crtico

02.99

(o

para 1 grau de

ej )

ej

j =1

= 4.50
ej
O nmero de classes k = 2. Ento:
=k-1=2-1=1
2

Exemplo 1 - Em 200 lances de uma moeda,


observaram 115 caras e 85 coroas. Testar a hiptese da
moeda ser honesta, adotadas os nveis de significncia:
a) 0.05
b) 0.01
As freqncias observadas de caras e coroas
so, respectivamente: o1 = 115 e o2 = 85.
As freqncias esperadas de caras e coroas
so 100 e 100
Ento:

FATEC

315312.75)
312.75

(o

ej )

ej

j =1

+(

108104.25)
104.25

a) para

+(

101104.25)
104.25

=
2

+(

3234.75)
34.75

= 0.47

= 3; 02.99 = 11.3 No

se pode rejeitar a teoria no nvel de significncia


0.01.
b) para

= 3; 02.95 = 7.81 No

se pode rejeitar a teoria no nvel de significncia


0.05.
Exemplo 3 - Numa urna h grande
nmero de bolas de gude de quatro cores
distintas: vermelha, laranja, amarela e verde.
Uma amostra de 12 bolas, retiradas da urna ao
acaso, revelou 2 vermelhas, 5 laranjas, 4
amarelas e 1 verde. Testar a hiptese da urna
conter propores iguais das bolas de gude de
cores diferentes.
Para conter propores iguais, seria
esperado 3 bolas de cada cor.
Como esses nmeros esperados so
menores que 5, a aproximao qui-quadrado
estaria incorreta. Assim consideramos as
catagorias amarela ou verde; laranja ou
vermelha:

liberdade vale 6.33. Como 4.50 < 6.33, rejeitar-se- a


hiptese ser honesta, no nvel de significncia 0.01.

Exemplo 2 - Nas estatsticas de Mendel


realizadas com ervilhas, ele observou 315 redondas e
amarelas, 108 redondas e verdes, 101 enrugadas e
amarelas e 32 enrugadas e verdes. De acordo com a
teoria de hereditariedade, os nmeros deveriam estar
na proporo 9:3:3:1. H alguma evidncia para se
duvidar de sua teoria, nos nveis de significncia:

2 = (

(o

ej )

ej

j =1

3 6 )
6

+(

j =1

96 )
6

(o

ej )
ej

=3

Para = 2 - 1 = 1

= 2; 02.95 = 3.84 No se
pode rejeitar a hiptese no nvel de significncia
de 0.05.

a) 0.01 ?
b) 0.05?

Exemplo 4 - Em 360 lances de um par


de dados obtiveram-se 74 setes e 24 onzes.
Adotado o nvel de significncia 0.05, testar a
hiptese de o dado ser honesto.
Um par de dados pode cair de 36
maneiras. Um sete pode ocorrer de seis maneiras
e um onze de 2 maneiras.
Ento: Pr{" 7"}=1/6 e :
Pr{" 11"}=2/36=1/18
Em 360 lances esperar-se-ia:
360 (1/6) = 60 " setes" e
360 (1/18) = 20 " onzes". Assim:

O nmero total de ervilhas :


315+108+101+32 = 556.
Os nmeros esperados esto na proporo
9:3:3:1 (9+3+3+1=16)
(9/16)556=312.75 redondas e amarelas.
(3/16)556=104.25 enrugadas e amarelas.
(3/16)556=104.25 redondas e verdes.
(1/16)556=34.75 enrugadas e verdes.
Ento:

Bioestatstica

Dr Cludio S. Sartori

=
2

(o

ej )

2 = (
; Como

74 60 )
60

ej

j =1

+(

24 20 )
20

Exerccios

= 4.07

= 2; 02.95 = 3.84 rejeita-se a

hiptese no nvel de significncia de 0.05 do dado ser


honesto.
Exemplo 5 - O recenseamento de 320 famlias
com cinco crianas revelou a distribuio apresentada
na tabela abaixo. Esse resultado compatvel com a
hiptese dos nascimentos de homens e mulheres
igualmente provveis?

Tipo

5 meninos
0 meninas
4 meninos
1 meninas
3 meninos
2 meninas
2 meninos
3 meninas
1 meninos
4 meninas
0 meninos
5 meninas
Total

Nmero
De
famlias
18

pe(X)
5

10

FATEC

fei

5p4 q =5/32

110

10p3 q2=10/32

88

10p2 q5=10/32

40

5p q4=5/32

q5=1/32

Nmero
de Caras
X
0
1
2
3
4
5

Pr {X}

fe

fo

0.0332
0.1619
0.3162
0.3087
0.1507
0.0294

33.2
161.9
316.2
308.7
150.7
29.4

38
144
342
287
164
25

2. Dois grupos, A e B, so formados,


cada um de 100 pessoas que tm a mesma
enfermidade. ministrado um soro ao grupo A,
mas no ao B (denominado grupo de controle), a
todos os outros respeitos, os dois grupos so
tratados de modo idntico. Determinou-se que 75
e 65 pessoas dos grupos A e B, respectivamente,
curaram-se da enfermidade. Testar a hiptese do
soro auxiliar a cura da enfermidade, mediante o
teste qui quadrado, adotando o nvel de
significncia:
a) = 0.01
b) = 0.05
c) = 0.10

= 1/32

56

1. Usar o teste de chi quadrado quando


lanamos 5 moedas 100 vezes. A tabela mostra
em cada lance o nmero de caras, a frequncia
esperada e medida.

320

Freqncias observadas:
Seja p a probabilidade do nascimento de 1
homem. q =1 - p a de uma mulher. Dado o
desenvolvimento binomial:
5 5i i 5
4
3 2
2 3
4
5
p q = p + 5 p q +10p q +10p q + 5 pq + q
i=0 i

( p + q)5 =
5

Os valores esperados (freqncias esperadas)


para famlias com 5,4,3,2,1 e 0 meninos so obtidos,
respectivamente, multiplicando-se as probabilidade por
320:
Assim:
k

2 =

(o

ej )

1810)
10

+(

5650)
50

ej

j =1

2 = (

+(

110100)
100

(o

j =1

+(

88100)
100

ej )
ej

+(

Grupo A
(Usando o soro)
Grupo B
(No usando o
soro)
Total

Curados

No
curados

Total

75

25

100

65

35

100

140

60

200

Freqncias esperadas:
Curados

No
curados

Total

70

30

100

70

30

100

140

60

200

4050)
50

+(

810)
10

= 12

= 6 1 = 5; 02.95 = 11.1; 02.99 = 15.1


pode-se rejeitar a hiptese no nvel de significncia
de 0.05 mas no de 0.01.

10

Grupo A
(Usando o
soro)
Grupo B
(No usando o
soro)
Total

Bioestatstica

Dr Cludio S. Sartori

Na tabela esto indicadas os nmeros


3.
de estudantes aprovados e reprovados por 3
instrutores:Sr. X, Sr. Y e Sr. Z . Testar a hiptese das
propores dos estudantes reprovados pelos 3
instrutores serem iguais.
Freqncias observadas:
Sr. X

Sr. Y

Sr. Z

Total

50
5
55

47
14
61

56
8
64

153
27
180

Aprovados
Reprovados
Total

Sr. X

Sr. Y

Sr. Z

Total

46.75

54.4

153

Reprovados
Total

8.25
55

51.8
5
9.15
61

9.6
64

27
180

4.

Para cada um dos itens abaixo, encontre:

i) t 0.005

ii) t 0.01

iii)

t 0.025

iv) t 0.05
v) t 0.1
a) Assumindo uma distribuio t de Student
com = 7 graus de liberdade.
b) Assumindo uma distribuio t de Student
com = 12 graus de liberdade.
c) Assumindo uma distribuio t de Student
com = 25 graus de liberdade.
5.

11

criana por ano. Para verificar essa hiptese, ele


pesquisou uma amostra de 20 famlias e
encontrou uma mdia de R$ 620,00 e desvio
padro s = R$ 30,00. Assumindo = 0.05 teste
sua hiptese.
7. A mdia gasta por ano em um
departamento de uma determinada loja de roupa,
relativa compra de retalhos, vale R$ 30,00. O
departamento quer substituir os retalhos por um
novo produto e estima-se que uma amostra de 25
peas custaria uma mdia de R$ 34,25 e desvio
padro s = R$5,48. Faa o teste de hiptese para
a mdia utilizando a distribuio t de Student.

Freqncias esperadas:

Aprovados

FATEC

Para cada item abaixo, resolva o teste de


hiptese assumindo:

a) Que a mdia populacional > 16 e


N = 14; = 0.01; x =18; s =4
b) Que a mdia populacional < 27 e
N = 9; = 0.05; x =23; s =7

8. Recentes estudos mostram que para


um funcionrio terminar determinado trabalho
leva em mdia 160 minutos. Um novo mtodo de
aprimorao aplicada em uma amostra de 11
funcionrios revelou uma mdia de 145 minutos
e desvio padro 9.47 minutos. Estabelecer o teste
de hiptese para a distribuio t de Student
usando uma significncia de 5%.
9. Uma bateria alcalina para radio
stereo FM-AM dura pelo menos 30 horas, na
mdia. Consumidores suspeitaram que o tempo
de durao era inferior a 30 horas, pois
analisaram uma amostra de 38 baterias e
obtiveram uma mdia de 29.3 horas e desvio
padro de 2.95 horas. coerente a suspeita dos
consumidores a 5% de significncia?
10. O proprietrio de uma clnica
dentria suspeita que o tempo mdio de
atendimento em uma clnica dentria ultrapassa
40 minutos. Analisando uma amostra de 18
pacientes, constatou um tempo mdio de espera
de 43.50 minutos e desvio padro de 10.62
minutos. consistente a suspeita do proprietrio,
a 5% de significncia?
11. Um mdico suspeita que fumantes
entre 40-45 anos portadores de bronquite crnica
haviam fumado na mdia por mais de 20 anos.
Umas amostras de 10 pacientes deram os
seguintes tempos, em anos, pelos fumantes:

c) Que a mdia populacional 30 e


N = 6; = 0.01; x =25; s =4
d) Que a mdia populacional > 125 e
N = 40; = 0.05; x =128; s =18

22 21 19 25 24 26 23 21 23 22

e) Que a mdia populacional < 50 e


N = 8; = 0.1; x =70; s =16
6. O diretor de uma universidade sabe que
famlias com renda acima de R$ 3.000,00 contribuem
com uma mdia de R$ 600,00 na educao de uma

11

Usando 1% de significncia, h
suficiente evidncia para justificar a hiptese do
mdico?

Dr Cludio S. Sartori

Bioestatstica

12

FATEC

12

Você também pode gostar