Você está na página 1de 40

Dr Cludio S.

Sartori

Bioestatstica Inferncia Estatstica: Introduo:

FATEC

compreendida entre 5,25 e 5,31 m, apresentamos uma estimativa por intervalo. A declarao do erro ou preciso de uma estimativa denominada de sua fidedignidade. Distribuies amostrais: Considerem-se todas as amostras possveis de tamanho N que podem ser tiradas de uma populao dada (com ou sem reposio). Para cada amostra pode-se tirar uma grandeza estatstica como uma mdia ou desvio padro, que varia de amostra para amostra. Desse modo obtm-se uma distribuio da grandeza que denominada distribuio amostral. Se a grandeza estatstica adotada for a mdia da amostra, a distribuio denominada amostral das mdias. Distribuio amostral das mdias. Admitindo-se amostras possveis de tamanho N so retiradas sem reposio de uma populao finita de tamanho Np > N. Se a mdia e o desvio padro da distribuio amostral das mdias forem designadas por X e X , e os

Inferncia estatstica o processo de estimativas de uma populao a partir de propriedades de uma amostra da populao. H dois tipos de inferncia estatstica que discutiremos a seguir. Do ponto de vista prtico, extremamente mais importante poder deduzir informaes relativas a uma populao mediante informaes de amostras dela extradas. Um problema importante na inferncia estatstica a extimao dos parmetros populacionais ou abreviadamente parmetro, deduzidos da estatstica amostral. Estimativas:

Envolve aproximadamente o valor de um parmetro desconhecido. Esse parmetro um nmero descrevendo alguma propriedade numrica de uma populao. Como exemplo, pode-se estar interessado em obter uma estimativa do valor mdio de todas as casas de uma determinada cidade. Estimativas imparciais: Se a mdia de uma distribuio amostral de uma estatstica for igual ao parmetro populacional correspondente, a estatstica ser denominada de estimador imparcial do parmetro; se isso no ocorrer, chamamos de estimador parcial. Tais valores correspondentes desta estatstica so denominados estimadores imparciais ou parciais, respectivamente. Exemplo 1 - A mdia da distribuio amostral das mdias, X igual a , isto , a mdia
populacional. Por isso a estatstica amostral X uma estimativa imparcial da populacional . Estimativas Fidedignidade. por pontos e intervalos.

valores correspondentes da populao forem e . Ento:

x =
N

x =

NP N N p 1

Se a populao for finita, ou se a amostragem for tomada com reposio, os resultados acima tornam-se:

x =

x =

Quando estimamos um parmtro populacional por um nmero, denominamos de etimativa de ponto; quando estimamos por dois nmeros entre os quais pode-se dizer que ele esteja situado, denominamos de estimativa por intervalo. Tais estimativas indicam sua preciso ou exatido e so preferveis s estimativas por pontos. Exemplo 2 - Se dissermos que uma certa distncia mede 5,28 0,03 m , isto , ela est

Para grandes valores de N (N 30) a distribuio amostral das mdias aproximadamente normal, com a mdia X e o desvio padro

X ,independentemente

da

populao. Tal resultado fruto do teorema do limite central: Teorema do Limite Central: medida que se aproxima o tamanho da amostra, a distribuio de amostragem mdia se aproxima da forma da distribuio normal, qualquer que seja a forma da distribuio de populao. Na

Dr Cludio S. Sartori

Bioestatstica

FATEC

prtica a distribuio de amostragem da mdia pode ser considerada como aproximadamente normal sempre que o tamanho da amostra for N > 30. Erros padres: O desvio padro de uma distribuio amostral de uma grandeza estatstica frequentemente denominado de seu erro padro. Lembremos que , tendo N conjunto de dados xi, calculamos a mdia e o desvio padro da forma:

A tabela ilustra os valores da rea da curva normal padro.

z
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8

0
0,0000 0,0398 0,0793 0,1179 0,1554 0,1915 0,2258 0,2580 0,2881 0,3159 0,3413 0,3643 0,3849 0,4032 0,4192 0,4332 0,4452 0,4554 0,4641 0,4713 0,4772 0,4821 0,4861 0,4893 0,4918 0,4938 0,4953 0,4965 0,4974 0,4981 0,4987 0,4990 0,4993 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,5000

1
0,0040 0,0438 0,0832 0,1217 0,1591 0,1950 0,2291 0,2612 0,2910 0,3186 0,3438 0,3665 0,3869 0,4049 0,4207 0,4345 0,4463 0,4564 0,4649 0,4719 0,4778 0,4826 0,4864 0,4896 0,4920 0,4940 0,4955 0,4966 0,4975 0,4982 0,4987 0,4991 0,4993 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,5000

2
0,0080 0,0478 0,0871 0,1255 0,1628 0,1985 0,2324 0,2642 0,2939 0,3212 0,3461 0,3686 0,3888 0,4066 0,4222 0,4357 0,4474 0,4573 0,4656 0,4726 0,4783 0,4830 0,4868 0,4898 0,4922 0,4941 0,4956 0,4967 0,4976 0,4982 0,4987 0,4991 0,4994 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,5000

3
0,0120 0,0517 0,0910 0,1293 0,1664 0,2019 0,2357 0,2673 0,2967 0,3238 0,3485 0,3708 0,3907 0,4082 0,4236 0,4370 0,4484 0,4582 0,4664 0,4732 0,4788 0,4834 0,4871 0,4901 0,4925 0,4943 0,4957 0,4968 0,4977 0,4983 0,4988 0,4991 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000

4
0,0160 0,0557 0,0948 0,1331 0,1700 0,2054 0,2389 0,2704 0,2996 0,3264 0,3508 0,3729 0,3925 0,4099 0,4251 0,4382 0,4495 0,4591 0,4671 0,4738 0,4793 0,4838 0,4875 0,4904 0,4927 0,4945 0,4959 0,4969 0,4977 0,4984 0,4988 0,4992 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000

5
0,0199 0,0596 0,0987 0,1368 0,1736 0,2088 0,2422 0,2734 0,3023 0,3289 0,3531 0,3749 0,3944 0,4115 0,4265 0,4394 0,4505 0,4599 0,4678 0,4744 0,4798 0,4842 0,4878 0,4906 0,4929 0,4946 0,4960 0,4970 0,4978 0,4984 0,4989 0,4992 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000

xi
i =1

(xi )
i =1

Se os dados xi forem distribudos em frequncia fi:

xi f i
i =1 N

fi
i =1
N 2

f i ( xi )
i =1

1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9

fi
i =1

Dr Cludio S. Sartori

Bioestatstica

FATEC

z
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9

6
0,0239 0,0636 0,1026 0,1406 0,1772 0,2123 0,2454 0,2764 0,3051 0,33151 0,3554 0,3770 0,3962 0,4131 0,4279 0,4406 0,4515 0,4608 0,4686 0,4750 0,4803 0,4846 0,4881 0,4909 0,4931 0,4948 0,4961 0,4971 0,4979 0,4985 0,4989 0,4992 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000

7
0,0279 0,0675 0,1064 0,1443 0,1808 0,2157 0,2486 0,2794 0,3078 0,3340 0,3577 0,3790 0,3980 0,4147 0,4292 0,4418 0,4525 0,4616 0,4693 0,4756 0,4808 0,4850 0,4884 0,4911 0,4932 0,4949 0,4962 0,4972 0,4979 0,4985 0,4989 0,4992 0,4995 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000

8
0,0319 0,0714 0,1103 0,1480 0,1844 0,2190 0,2518 0,2823 0,3106 0,3365 0,3599 0,3810 0,3997 0,4162 0,4306 0,4429 0,4535 0,4625 0,4699 0,4761 0,4812 0,4854 0,4887 0,4913 0,4934 0,4951 0,4963 0,4973 0,4980 0,4986 0,4990 0,4993 0,4995 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000

9
0,0359 0,0754 0,1141 0,1517 0,1879 0,2224 0,2549 0,2852 0,3133 0,3389 0,3621 0,3830 0,4015 0,4177 0,4319 0,4441 0,4545 0,4633 0,4706 0,4767 0,4817 0,4857 0,4890 0,4916 0,4936 0,4952 0,4964 0,4974 0,4981 0,4986 0,4990 0,4993 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,4999 0,5000

1 Yi = e 2

( xi ) 2 2 2

Se tratamos os dados na varivel reduzida z:

z=

i 1 2 Yi = e 2

z2

Para a distribuio amostral das mdias

Xi (

supondo distribuio normal) com mdia e desvio padro

X teremos a relao: X X zi = i X

Ou, explicitando o valor

Xi : X i = X + X zi

Exerccios: 1 - Uma populao consiste de 5 nmeros: 2,3,6,8 e 11. Considerem todas as amostras possveis de 2 elementos que dela podem ser retiradas com reposio. Determinar: a) A mdia da populao. b) O desvio padro da populao. c) A mdia da distribuio amostral das mdias. d) O desvio padro da distribuio amostral das mdias, isto , o erro padro das mdias. 2. Resolver o problema anterior no caso de amostragem sem repetio. 3. Admite-se que a altura de 3000 estudantes do sexo masculino de uma universidade so normalmente distribudas, com a mdia 172,72 cm e o desvio padro7,62 cm. Se forem obtidas 80 amostras de 25 estudantes cada uma, quais sero a mdia e o desvio padro esperados na distribuio amostral das mdias resultantes se a amostragem for feita: a) Com reposio. b) Sem reposio. 4. Em quantas amostras do problema anterior pode-se esperar que a mdia se encontre: a) Entre 169,27 cm e 173,48 cm. b) Abaixo de 169,65 cm? 5. Quinhentos rolamentos de esferas tm um peso mdio de 5,02 onas (1 ona = 0,028349 kg). e um desvio padro de 0,3 ona. Determinar a probabilidade de uma amostra de

Lembramos que para uma distribuio normal ou gaussiana de dados (xi ,Yi ) e desvio padro e mdia dados por :

Dr Cludio S. Sartori

Bioestatstica

FATEC

100 rolamentos de esferas, escolhidos ao acaso nesse grupo, ter um peso total de: a) Entre 496 e 500 onas. b) Mais de 500 onas. 6. Suponha que a mdia de uma populao bastante grande seja = 50,0 e o desvio padro = 12,0. Determine o desvio padro para a distribuio de amostragem das mdias. 7. Sabe-se que a vida til de operao de um tubo de imagem de TV de certa marca , em mdia, = 9000 horas com um desvio padro = 500 horas. Determinar o valor esperado e o desvio padro para a distribuio de amostragem para a mdia, sendo o tamanho da amostra n = 25. 8. Um analista financeiro toma uma amostra aleatria de 10% de 300 contas e acha que o saldo mdio das contas R $ 148,50. Sabendo que o desvio padro da distribuio das mdias R$ 35,75 encontre o desvio padro da amostra. 9. Dados os valores 3,5,7 e 8 encontre a mdia da populao e seu desvio padro. 10. Se escolhermos uma populao de 2 elementos, sem reposio, encontre a mdia e o desvio padro das mdias para o problema anterior.
11. Construa as distribuies Gaussiana e Normal padro para = 2 e = 0,816, com: (a) 0 x 3 (b) -2,5 x 4,5 Respostas: (a)
rea sob a Curva Gaussiana

(b)
rea sob a Curva Gaussiana

dftr
0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05

Y (X )

-1,000 -,500

,000

,500

1,000 X

1,500

2,000

2,500

3,000

rea sob a curva normal padro dftr 0,35 0,3 0,25

Y(z)

0,2 0,15 0,1 0,05 -3,5 -3 -2,5 -2 -1,5 z -1 -0,5 0 0,5 1

dftr
0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05

Y(X)

,000

,500

1,000

1,500 X

2,000

2,500

3,000

rea sob a curva normal padro dftr


0,35 0,3 0,25

Y(z)

0,2 0,15 0,1 0,05

-2

-1,5

-1

-0,5 z

0,5

Dr Cludio S. Sartori

Bioestatstica

FATEC

Estimativas Um problema importante da inferncia estatstica a estimao dos parmetros populacionais, ou parmetros (mdia, varincia, etc da populao) deduzidos da estatstica amostral correspondente. Estimativas imparciais so aquelas em que a mdia da distribuio amostral igual ao parmetro populacional correspondente. Caso contrrio ela ser um estimador parcial. Caso tenhamos duas estatsticas de distribuies amostrais com a mesma mdia, denominamos estimador eficiente da mdia, quela estatstica de menor varincia, enquanto as demais recebem o nome de ineficientes. A estimativa de um valor populacional pode ser dada por pontos ou por dois nmeros, entre os quais ele pode ser considerado; ou seja, por meio de um intervalo. Essas estimativas por intervalos so preferveis s estimativas por pontos. Estimativas de intervalo de confiana dos parmetros populacionais. Sejam s e s a mdia e o desvio padro (erro padro) da distribuio amostral de uma estatstica S. Ento a distribuio amostral de S aproximadamente Normal (o que se tem verificado para N 30 ); pode-se esperar que se encontre uma estatstica amostral real, S, situada nos seguintes intervalos, com os seguintes percentuais: (Entende-se: estar confiante de se encontrar s nos intervalos dados). Intervalo (S - S , S + S ) (S - 2S , S + 2S ) (S - 3S , S + 3S ) % 68,27 95,45 99,73

Limite de Confiana (%) 99,73 99 98 96 95,45 90 80


68,27 50

Coeficientes de confiana zc . 3,00 2,58 2,33 2,05 2,00 1,645 1,28 1,00
0,6745

Estimativa do intervalo de confiana das mdias: Se temos uma estatstica S que a mdia amostral X ento os limites de confiana de 95% e 99%, para a estimao da mdia populacional , so dados por: X 1,96 X e X 2,58 , respectivamente.
X

De um modo geral os limites de confiana so dados por: X z C X

X zC
Ou

zC

(Para amostragem de uma populao infinita ou quando a amostragem retirada com reposio).

Esses intervalos so denominados de intervalos de confiana de 68,27%;95,45% e 99,73%para a avaliao de S. Os nmeros extremos desses intervalos so denominados de limites de confiana ou limites fiduciais. A percentagem de confiana frequentemente denominada de nvel de confiana. Os nmeros dos limites de confiana so denominados de coeficientes de confiana ou valores crticos , e representados por zc. A tabela a seguir mostra os valores de zC correspondente a diversos nveis de confiana adotados na prtica.

X zC

NP N NP 1

zC

ou NP N
N NP 1

(Para amostragem com populao finita ou quando a amostragem retirada sem reposio). Em geral, o desvio padro da populao desconhecido, de modo que, para se obterem os limites de confiana acima emprega-se a estimativa da amostra s. Isso ser satisfatrio desde que N 30. Para N < 30, a aproximao insuficiente e deve-se empregar a teoria de pequenas amostras que veremos adiante.

Dr Cludio S. Sartori

Bioestatstica

FATEC

A mdia da distribuio amostral das varincias igual a = N 1 2 , onde 2 a s2 N varincia populacional e N o tamanho da amostra. Ento a varincia amostral s2 uma estimativa parcial da varincia populacional 2. Chamando de varincia

todos os 1546 estudantes dessa universidade. Determinar uma estimativa imparcial e eficiente da mdia verdeira e da varincia verdadeira. Alturas (cm) 151 159 167 175 183 158 166 174 182 190 Ponto mdio (xi) 154,5 162,5 170,5 178,5 186,5
Frequncia (f)

, que uma estimativa imparcial de modificada 2, teremos:


2

2 =

N 2 a N 1

Lembremos que h uma relao entre sa e a dada por: = N 1s . Para N muito grande, no h a a N muita diferena entre s e .
Exemplo1 - A amostra constante de 5 medidas do dimetro de uma esfera foi registrada por um cientista com os valores de 6.33, 6.37, 6.36, 6.32 e 6.37 cm. Determinar as estimativas imparciais e eficientes da: a) Mdia verdadeira. b) Varincia e o desvio padro da amostra. c) A varincia e o desvio padro da populao. d) O intervalo de confina correspondente a 95%. a) A estimativa imparcial e eficiente da mdia verdadeira a mdia populacional:
x=

5 18 42 27 8 N = fi =100

fX

772,5 2 925,0 7 161,0 4819,5 1 492,0 xi fi = 17170,0

x=

xi f i x = 17170 = 171,70 i =1 fi
i =1 N

100

Clculo

do
2

desvio

padro:

a =

f i (xi x )
i =1

=7,78 cm

xi
i =1

= 6.35

cm. da
0 , 0022 5

2 =
amostra:

N 2 N 1

b) Desvio
N

padro

a =
c)

( xi x )
i =1

= 0,0209 ;

2 =

100 = 62,4659 = 7,79 (7,78)2 99

2 Varincia: a = 0,00044 A estimativa imparcial e eficiente da varincia verdadeira a varincia populacional:

N 2 2 = a = N 1

( xi x )
i =1

N 1

N N 0.0234 = 6.35 1.96 = 6.35 0.00048 5

d) X z = X z = C C

Note que, como N grande, no h diferena entre , . 2 , 2 ou entre Exemplo 3 - Determine os intervalos de confiana de: a) 95% 2 2 b) 99%= 0,0234 = a = 0 = 0,00055cm ,00055 Para a avaliao da altura mdia dos estudantes da universidade do exemplo anterior. a) Lembrando que os limites de confiana de 95% so dados por:

Exemplo 2 - Admita-se que as alturas de 100 estudantes do sexo masculino de uma universidade representam uma amostra aleatria das alturas de

X 1,96

. Adotando x = 171,70 e
N

Dr Cludio S. Sartori

Bioestatstica

FATEC

considerando como estimativa de , s = 7,79 , teremos: 7,79 171,70 1,96 = 171,70 1,526 100 Consequentemente, o intervalo de confiana de 95% para a mdia da populao de 170,174 a 173,226 cm; ou:

X 2,58 2,58

Erro da estimativa:
N

N
0,05 N

Tomando-se s = =0,05 segundo o

erro ser de
2,58 = 0,01 N = (2,58)(0,05) N = 167 0,01

170,17 < < 173,23

b) Os limites de confiana de 99% so: s X 2,58 = X 2,58 N N


= 171, 70 2, 58 7,79 = 171, 70 2, 01 100

O intervalo de confiana de 99% para a mdia da populao :

169,69 < < 173,71

Exemplo 4 - As medidas dos dimetros de uma amostra aleatria de 200 rolamentos esfricos produzidos por certa mquina, durante uma semana, apresentam a mdia de 0,824 polegada e o desvio padro de 0,042 polegada. Determinar os limites de confiana de: a) 95% b) 99% Para o dimetro mdio de todos os rolamentos esfricos. Limites de confiana: a) X 1,96 = X 1,96 s = N N
= 0,824 1, 96
0,042 200

Exemplo 6 - Uma amostra aleatria de 50 graus em matemtica, num total de 200, apresenta a mdia de 75 e desvio padro de 10. a) Quais os limites de confiana de 95%, para a estimativa da mdia dos 200 graus? b) Com que grau de confiana se diria que a mdia dos 200 graus 75 1? a) Como o tamanho da populao no muito grande, em comparao com o tamanho da amostra, deve-se ajust-las. Ento os limites de confiana de 95% so: NP N
X 1, 96 N NP 1
=

= 75 1,96

10 50

200 50 = 75 2, 4 200 1

= 0,824 0, 0058 = 0,824 0, 006

b) X z c = X z X c

NP N NP 1

b)

X 2,58

= 75 z C

= X 2,58

s 042 = 0,824 2,58 0,200 N

10 200 50 = 75 1,23 z C 50 200 1 valor ser igual = 0Como ,824 esse 0,0077 = deve 0,824 0 ,008a 75 1

Exemplo 5 - Ao medir o tempo de reao, um psiclogo avaliou que seu desvio padro era de 0,05 segundos. Que extenso deve ser tomada para a amostra destinada s medies para que se esteja: a) 95% e b) 99% confiantes de que o erro dessa estimativa no exceda a 0,01 segundo?

1,23zc = 1 zc = 0,81. A rea subentendida pela curva normal, entre z = 0 e z = zc=0,81 0,2910; ento o grau de confiana desejado : 2.(0,2910) = 0,582 ou 58,2%.

Exerccios 1. Foram determinados os valores: 8,3;10,6;9,7;8,8;10,2 e 9,4 quilos, respectivamente, para os pesos de uma amostra. b) 95% possuem limites de confiana: Determinar aas estimativas para: Erro da estimativa: a) A mdia populacional. (9,5 kg). X 1,96 1,96 b) A varincia populacional. (0,74 kg). N N c) Compare o desvio padro da Tomando-se s = =0,05 segundo o erro ser de amostracom sua estimativa para a (1,96)(0,05) 0,05 populao. (0,78 e 0,86 kg). 1,96 = 0,01 N = = 9,8 N = 96,04 0,01 N 2. Uma amostra de 10 componentes b) 99% possuem limites de confiana: eletrnicos de televiso produzidas por uma

Dr Cludio S. Sartori

Bioestatstica

FATEC

companhia apresentou a vida mdia de 1200 horas e o desvio padro de 100 horas. Estimar: a) A mdia . (1200 h). b) O desvio padro populacional de todos os componentes produzidos pela companhia. (105,4 h). 3. A mdia e o desvio padro das cargas mximas suportadas por 60 cabos so dados por 11,09 t e 0,73 t , respectivamente. Determinar os limites de confiana para a mdia de todos os cabos produzidos para a companhia de: a) 95%. (11,09 0,18 t) b) 99% (11,09 0,24 t) 4. A mdia e o desvio padro dos dimetros de uma amostra de 250 rebites fabricados por uma companhia so:0,72642 e 0,00058 polegadas, respectivamente. Determinar o limite de confiana para todos os rebites fabricados pela companhia de: a) 99 %. (0,72642 0,000095 polegadas). b) 98 %. (0,72642 0,000085 polegadas). c) 95 %. (0,72642 0,000072 polegadas). d) 90 %. (0,72642 0,000060 polegadas). 5. Determine, em relao ao problema anterior, os limites de confiana de 50% e o erro provvel para a mdia dos dimetros. (0,72642 0,000025 e 0,000025 polegadas). 6. Um analista de mercados obtm dados de uma amostra de 100 consumidores de um total de 400 que adquiriram uma oferta especial. As 100 pessoas gastaram na loja, uma mdia de $ 24,57 com um desvio padro de $ 6,60. Usando um intervalo de 95% de confiana, estimar: a) O valor mdio de compras para todos os 400 clientes. ($23,45 a $25,69). b) O valor total das compras dos 400 clientes. ($9.380 a $10.276).

Dr Cludio S. Sartori

Bioestatstica

FATEC

Testes de Hipteses: Envolve a escolha de duas afirmaes de uma dada populao. Tais afirmaes so chamadas de hipteses. Num teste de hiptese principiamos com um valor suposto (hipottico) de um parmetro da populao; depois de coletar uma amostra aleatria, comparamos a estatstica da amostra , tal como a mdia amostral, com o parmetro suposto, tal como a mdia populacional hipottica. Ento, aceitamos ou rejeitamos o valor hipottico como sendo correto. O valor hipottico rejeitado somente se o resultado da amostra for claramente improvvel de ocorrer quando a hiptese for verdadeira. Uma hiptese nula H0 o valor suposto do parmetro o qual comparado com o resultado da amostra. Ele rejeitado somente se o resultado da amostra for improvvel sendo a hiptese considerada verdadeira. A hiptese alternativa H1 aceita somente se a hiptese nula rejeitada. Dividimos em diversas etapas os testes de hipteses: ETAPA 1 - Formular a hiptese nula H0 e a hiptese alternativa H1. ETAPA 2 - Especificar o nvel de significncia a ser usado. O nvel de significncia o padro estatstico especificado para rejeitar a hiptese nula. Se especificado um nvel de significncia de 5%, a hiptese nula rejeitada somente se o resultado da amostra to diferente do valor suposto que uma diferena igual ou maior ocorreria por acaso com uma Decises possveis

probabilidade mxima de 0,05. Observamos que se for utilizado um nvel de significncia de 5%, existe uma probabilidade de 5% de rejeitar a hiptese nula sendo a mesma verdadeira. Este o chamado Erro Tipo I. A probabilidade do Erro Tipo I sempre igual ao nvel de significncia utilizado como padro para rejeitar a hiptese nula. Ele simbolizado pela letra grega minscula "alfa" , sendo que representa o nvel de significncia. Os nveis de significncia mais frequentementes utilizados em testes de hipteses so os de 1% e 5%. Um Erro Tipo II ocorre quando a hiptese nula aceita sendo a mesma falsa. ETAPA 3 - Selecionar a estatstica do teste. Poder ser ou a estatstica da amostra, ou uma verso modificada da amostra. A tabela a seguir ilustra as consequncias de decises em testes de hipteses.

Aceitao da hiptese nula Rejeio da hiptese nula

Estados possveis Hiptese nula Hiptese nula falsa verdadeira Aceita corretamente Erro tipo II Erro tipo I

Rejeita corretamente exemplo, quando se est testando a hiptese de um teste ser melhor do que o outro. Tais testes denominam-se unilaterais. Em ambos os casos, o valor crtico identifica o valor da estatstica de teste necessrio para rejeitar a hiptese nula. ETAPA 5 - Determinar o valor real da estatstica de teste. Exemplo: para testar um valor hipottico da mdia populacional, coleta-se uma amostra aleatria e determina-se o valor da mdia da amostra. Se o valor crtico for estabelecido como um valor z, a mdia da amostra ser ento, convertida em um valor z. ETAPA 6 - Tomar a deciso. O valor observado da estatstica da amostra comparado

ETAPA 4 - Estabelecer o valor crtico, ou valores crticos da estatstica do teste. Tendo estabelecido a hiptese nula, o nvel de significncia e a estatstica a ser usada, agora estabelecemos o valor crtico (ou valores crticos) da estatstica de teste. Pode existir um ou dois desses valores, segundo seja efetuado um teste unilateral ou bilateral. Quando manifestamos interesse nos valores extremos da estatstica, ou nos escores z de ambos os lados da mdia, isto , em ambas as extremidades da distribuio, chamamos esses testes de bilaterais. Muitas vezes, entretanto, pode-se ter interesse em apenas nos valores extremos de um mesmo lado da mdia, isto , em uma extremidade da distribuio; por

Dr Cludio S. Sartori

Bioestatstica

FATEC

com o valor crtico da estatstica de teste. A hiptese nula , ento, ou aceita ou rejeitada. Se a hiptese nula rejeitada, a hiptese alternativa aceita. Esta deciso ter relevncia em relao a outras decises a serem tomadas por administradores, tais como se se deve ou no manter um padro de desempenho, ou sobre qual, de duas estratgias de mercado, deve empregar-se. A tabela abaixo indica para alguns testes o nvel de significncia. 0,10 Nvel de significncia -1,28 ou Valores crticos de z para testes 1,28 unilaterais -1,645 e Valores crticos de z para testes 1,645 bilaterais
Teste de um valor hipottico da mdia utilizando a distribuio normal. Pode-se utilizar a distribuio normal de probabilidade para testar um valo hipottico da mdia quando N > 30 ou, caso N < 30 e a populao ser normalmente distribuda e o desvio padro ser conhecido. Um teste bilateral utilizado quando estamos interessados em possveis desvios em ambas as direes a partir do valor hipottico da mdia. A frmula utilizada para estabelecer os valores crticos da mdia da amostra similar frmula para determinar os limites de confiana para estimar a mdia populacional. Sendo a mdia da populao, os

valores crticos da mdia da amostra, sendo conhecido so:

X RC = z x

Exemplo 1 - Um auditor deseja testar a hiptese de que o valor mdio de todas as contas a receber em uma dada firma de $ 260,00, tomando para uma amostra N = 36 e calculando a mdia amostral. Ele deseja rejeitar o valor hipottico se tal valor for 0,05 de $ 260,00 0,01 somente 0,005 0,002 claramente contraditado pela mdia da amostra, -1,645 ou -2,33 ou -2,58 ou -2,88 ou sendo que, desta 2,33 maneira, dado o valor suposto 1,645 2,58 2,88 o -1,96 "benefcio da dvida". As hipteses nula ee e -2,58 e -2,81 e -3,08 alternativa teste so H 0: = $ 260,00 1,96 para esse 2,58 2,81 3,08 e H1: $260,00. Para a hiptese nula, determinar os valores crticos da mdiada amostra para testar a hiptese a um nvel de significncia de 5%. Dado que se conhece o desvio padro dos valores das contas a receber: = $ 43,00. Hipteses: H0: : = $ 260,00 e H1: $260. Nvel de significncia: = 0,05

Estatstica do teste: X Baseada numa amostra de n = 36 e = $ 43,00.

X RC :
amostra.

Valores crticos da mdia da

X RC = z x = 260 1,96

= 260 1,96

43 $245,95 = 36 $274,05

0.05 0.04 0.03 0.02 0.01

Regio de Aceitao
0 230 240 250 260 270 280 290
245,95 Regio de rejeio 274,05 Regio de rejeio

Portanto, para rejeitar a hiptese nula, a mdia da amostra deve ter um valor menor que $245,95 ou maior do que 274,05. Existem duas regies de rejeio no caso de um teste bilateral. Quando o valor da mdia da amostra estiver determinado, ele ser transformado para um valor z, de modo a poder ser comparado com os valores crticos

de z. A frmula para essa transformao, sendo conhecido : z= X x Exemplo 2 - Para o teste de hiptese anterior, suponha que a mdia seja de X = $240 . Determine se se deve aceitar ou rejeitar a

Dr Cludio S. Sartori

Bioestatstica

FATEC

hiptese nula transformando tal mdia no valor de z crtico correspondente:

z=

260 = 240 = 2,79 7 ,17

0 . 0 5 0 . 0 4 0 . 0 3 0 . 0 2 0 . 0 1 0 3 2
-1,96 Regio de rejeio z Regio de aceitao

2
1,96

Regio de rejeio

Este valor de z encontra-se na regio de rejeio da da cauda esquerda; portanto rejeita-se a hiptese nula e aceita-se a hiptese alternativa, isto , $260,00. Um teste unilateral apropriado quando estamos interessados em possveis desvios em apenas uma direo, a partir do valor hipottico da mdia. No exemplo anterior, o auditor pode no estar interessado em que a verdadeira mdia de todas as contas a receber supere $ 260,00, mas sim em que ela possa ser menor que $ 260,00. Pode-se ter ento as hipteses: H0: $ 260,00; H1: < $ 260,00. Existe apenas uma regio de rejeio em um teste unilateral, e, para o exemplo acima, o teste um teste de cauda inferior. A regio de rejeio de um teste unilateral encontra-se sempre na cauda que representa apoio hiptese alternativa. O valor crtico pode tambm ser determinado para a mdia ou em termos de um valor z. Os valores crticos para testes unilaterais diferem dos bilaterais devido s reas, como mostramos em tabela.
Exemplo 3 - Suponha que o auditor comece com a hiptese nula de que o valor mdio de todas as contas a receber no mnimo de X = $260 . Dado que a mdia da amostra $ 240,00, testar essa hiptese ao nvel de significncia de 5%, atravs dos procedimentos:

xrc = 0 + z x = 260 + (1,65)(7,17) = $248,17


Uma vez que X = $240 , o mesmo se encontra na regio de rejeio. Rejeita-se portanto a hiptese nula e aceita-se a hiptese alternativa de que < $ 260,00. b) especificando o valor crtico em termos de z, onde zc(=0,05) = -1,65

z=

260 = 240 = 2,79 7 ,17

Ento se rejeita a hiptese nula.

a) Determinando o valor crtico do valor mdio da amostra, onde H0 : $ 260,00; e tomando para H1: < $ 260,00.

Dr Cludio S. Sartori

Bioestatstica

FATEC

0.05 0.04 0.03 0.02 0.01 0 -3 -2 -1 0 1 2 3

-1,67
248,17 Regio de Rejeio

z
260 Regio de aceitao

Os limites crticos de X ( = 0.05) so:


Erros Tipo I e Tipo II em testes de hipteses.

X = z X =

= 15000 1,96 2000 15

A probabilidade do Erro Tipo I (A hiptese nula rejeitada sendo a mesma verdadeira) igual ao nvel de significncia utilizado no teste de hiptese. Isso ocorre pois a proporo da rea na regio de rejeio igual proporo dos resultados amostrais que ocorreriam naquela regio se a hiptese nula fosse verdadeira. J a probabilidade de Erro Tipo II (A hiptese nula aceita sendo a mesma falsa) indicada pela letra grega "beta" () . A maneira pela qual ela pode ser determinada relativa a um valor especfico, includo dentro do intervalo da hiptese alternativa.
Exemplo 4 - O representante de um grupo comunitrio informa a uma pessoa que est interessada em estabelecer um centro comercial, que a renda mdia familiar na rea de $ 15.000,00. Suponha que, para o tipo de zona em questo, possvel supor que a renda mdia familiar tem distribuio aproximadamente normal, e que se pode aceitar o desvio padro como sendo = $ 2.000,00 , com base em um estudo anterior. Para uma amostra aleatria de 15 famlias, a renda mdia familiar foi de $14.000,00 . Testar a hiptese nula de que = $15.000,00 , estabelecendo os limites crticos da mdia da amostra, utilizando um nvel de significncia de 5%. Observao: Mesmo se a amostra for pequena, pode-se utilizar a distribuio normal, uma vez que se supes a populao normalmente distribuda e uma vez que conhecido. H0: = $15.000,00 e H1: $15.000,00

$16.013,93 = 15000 1,96(516,80) = $13987, 07 Uma vez que a mdia da amostra X = $14.000,00 encontra-se na regio de aceitaoda hiptese nula, no se pode rejeitar a afirmao do representante da comunidade a um nvel de significncia de 5%.
Exemplo 5 - Resolver o exemplo 4 utillizando a varivel reduzida z como estatstica do teste: zcritico ( = 0.05) = 1.96 Ento:

x =

= 2000 = $516,80 15

z=

15000 = 14000 = 1,93 . Logo 516 ,80

z = -1,93 est na regio de aceitao da hiptese nula. No se pode rejeitar a informao do representante da comunidade, ao nvel de significncia de 0,05%.
Exemplo 6 - Para o exemplo anterior, suponha que o desvio padro da populao desconhecido, o que seria o caso tpico, e suponha tambm, que a populao dos valores de renda no esteja normalmente distribuda. Para uma amostra de N = 30 famlias, o desvio padro de s = $ 2.000 e a mdia da amostra x = $14.000 . Testar a hiptese nula de que a renda familiar mdia na populao , no mnimo,

Dr Cludio S. Sartori

Bioestatstica
x

FATEC

$15.000,00, usando o nvel de significncia do teste de 5%. Nota: A distribuio normal de probabilidade pode ser usada por dois motivos: pelo Teorema do Limite Central e z pode ser utilizado pois N 30. Assim: H0: $15.000,00; H1 : < $15.000,00

z=

9000 = 8800 = 1,55 129 , 20

Logo a hiptese nula no pode ser rejeitada ao nvel de significncia de 5%.


Exemplo 9 - Com respeito ao exemplo anterior, suponha que a informao amostral foi obtida de uma amostra de n = 35 televisores. Testar a afirmao ao nvel de significncia de 5%.

sx =

s N

2000 30

= $364,96

z=

x sx

15.000 = 14.000 = 2,74 364 ,96

Logo, rejeita-se a hiptese nula ao nvel de significncia de 5%


Exemplo 7 - Um fabricante interessado na compra de um novo equipamento para produzir ferramentas especificou que o equipamento no deve exigir, em mdia, mais do que 10 minutos de manuteno para cada hora de operao. O agente de compras visita uma companhia onde est instalado o equipamento, e, pela informao que recolhe, nota que 40 horas de operao aleatoriamente selecionadas incluem um total de 7 horas e 30 minutos de manuteno, sendo que o desvio padro do tempo de manuteno por hora foi de 3,0 minutos. Com base neste reultado amostral, pode-se rejeitar a hiptese de que o equipamento possui as especificaes sobre o tempo de manuteno, ao nvel de significncia de 1 %? H0: 10 min/hora; H1: > 10 min/hora

H0: = 9000h; H1: < 9000h

z c ( = 0,05) = 1,65 x = N = 500 = 84,46 35


z=
x

9000 = 8800 = 2,37 84 , 46

z c ( = 0,01) = +2,33
xi
N

Portanto rejeita-se a hiptese nula ao nvel de significncia de 5%. Exemplo 9 - Um analista de mercados coleta informaes de uma amostra aleatria de 100 clientes, dos 400 que compraram uma oferta especial. As 100 pessoas gastaram uma mdia de x = $24,57 na loja, com desvio padro de $ 6,60. Antes de ver esses resultados da amostra, o gerente havia afirmado que a mdia das compras feitas por aqueles que responderam oferta especial teria sido de, no mnimo, $ 25,00. Podese rejeitar essa afirmao utilizando um nvel de significncia de 5%?
Observao: necessrio o fator de correo finita quando N > 0,05Np

1 x = i =N = 450 40 = 11,25 min

sx =
z=

s = 3 = 0,47 min N 40 x 10 = 11,025 = +2,66 sx , 47

H0: = $ 25,00; H1: < $ 25,00

z c ( = 0,05) = 1,65
N p N N P 1
x

Rejeita-se portanto a hiptese nula ao nvel de significncia de 1% e aceita-se a hiptese alternativa de que o tempo mdio de manuteno para esse equipamento maior de que 10 minutos por hora de operao.
Exemplo 8 - O desvio padro da vida til de um tubo de TV de determinada marca de = 500 horas, sendo que a vida til dos tubos normalmente distribudas. O fabricante afirma que a vida til mdia , no mnimo, de 9.000 horas. Testar esta informao, ao nvel de significncia de 5%, denominando-a como hiptese nula, e dado que a vida mdia em uma amostra de n = 15 tubos foi de x = 8800h . H0: = 9000h; H1: < 9000h

x =

=
=

6, 60 100

400 100 400 1

= 0,57
a

z=

24 , 57 25, 00 0, 57

= 0,75

Portanto no se pode rejeitar afirmao ao nvel de significncia de 5%.

Testes de significncia que envolvem diferenas amostrais:

z c ( = 0,05) = 1,65 x = N = 500 = 129,20 15

Sejam x1 e x 2 as mdias obtidas em duas grandes amostras, de tamanhos N1 e N2, retiradas de populaes respectivas que tm as mdias 1 e 2 e desvios padres 1 e 2. Considere-se a hiptese nula de que no h diferena entre as mdias populacionais, isto , 1 = 2, ou de que as amostras so retiradas de duas populaes que tm mdias iguais.

Dr Cludio S. Sartori

Bioestatstica

FATEC

Vemos que a distribuio amostral para a diferena das mdias aproximadamente normal, com mdia e desvio padro dados por:

100.0,5=50

= 100.0,5.0,5 = 5
Considerando a escala contnua, o intervalo entre 40 e 60 caras, inclusive, o mesmo que entre 39,5 e 60,5 caras. Passando para varivel reduzida: Z1 = (39,5 - 50)/5 = -2,10 Z2 = (60,5 - 50)/5 = +2,10 A rea subebntendida entre a curva normal de z1 a z2 dar a probabilidade: P = 0,9642.
Exemplo 11 - Para testar a hiptese de que a moeda honesta, adota-se a seguinte deciso: (1) Aceita-se a hiptese, se o nmero de caras em uma nica amostra de 100 lances, estiver entre 40 e 60, inclusive. (2) Rejeit-la, caso contrrio.

x1 x2 = 1 2 x1 x2 = 0 ; ( 1 = 2 ) x1 x2 = 12
N1 +
2 2

N2

Exemplo 10 - Determinar a probabilidade de obter-se entre 40 a 60 caras, inclusive, em 100 lances de uma moeda honesta. A mdia e o desvio padro dos nmeros de caras, em 100 lances, de acordo com a Distribuio de Bernoulli ou Binomial dado por: = Np : (p:probabilidade de obter-se

sucesso em um lanamento)

= Npq :

(q:probabilidade

de

insucesso em um lanamento (q = 1- p)) Lembre-se que a distribuio de Bernoulli N! p X qNX p( X ) = CN , X p X q N X = X !( N X )! dada por (X: nmero de sucessos) : A probabilidade dada por:

100 1 40 1 60 100 1 41 1 59 100 1 60 1 40 P = 40 (2) (2) + 41 (2) (2) ++ 60 (2) (2)


Utilizando o ajustamento da curva normal distribuio de Bernoulli:

a) Determine a probabilidade de rejeitar a hiptese, quando ela for realmente correta. A probabilidade de no se obter entre 40 e 60 caras, inclusive, dada por: 1-0,9642 = 0,0358. Ento a probabilidade da hiptese ser rejeitada quando ela for correta de 0,0358=3,58%. b) Interprete a regra de deciso e o resultado do item a).

0.08

0.06

0.04

Regio de Rejeio

0.02
Regio de aceitao

Regio de Rejeio

-3

-2
z =-2.10 (39,5 caras)

-1

2
z = 2.10 (60,5 caras)

Se uma nica amostra de 100 lances resultar em um escore z entre -2,10 e 2,10. Aceitar-se- a hiptese; caso contrrio ela ser rejeitada e dicidir-se- que a moeda viciada. O erro cometido ao rejeitar a

hiptese, quando deveria ser aceita, do Tipo I, e a probabilidade de comet-lo igual a 0,0358, conforme o item a).

Dr Cludio S. Sartori

Bioestatstica

FATEC

c) Que concluses se poderiam tirar do fato de uma amostra de 100 lances apresentar 53 caras? 60 caras? De acordo com a regra de deciso, deve-se aceitar a hiptese da moeda ser honesta, em ambos os casos. d) Poder-se-ia estar errado nas concluses do item c? Explicar. Sim. Poder-se-ia aceitar a hiptese quando deveria ser rejeitada, e esse seria o caso, por exemplo, se a probabilidade de caras fosse de 0,7 em vez de 0,5. O erro cometido ao aceitar a hiptese, quando deveria ser rejeitada, do Tipo II da deciso.
Exemplo 12 - Em uma experincia sobre percepo extra-sensorial (P.E.S), um sujeito, em uma sala, solicitado a declarar a cor vermelha ou preta de uma carta escolhida, de um baralho bem embaralhado de 50 cartas, por outro indivduo colocado na mesma sala. O sujeito desconhece quantas cartas vermelhas ou pretas h no baralho. Se o sujeito identifica corretamente 32 cartas, determinar se os resultados so significativos, nos nveis de significncia de: a) 0,05 b) 0,01 Se p a probabilidade do sujeito declarar a cor da carta corretamente, eno deve-se decidir entre as hipteses: H0: p = 0,5 e o sujeito est simplesmente adivinhando. H1: p > 0,5 e o sujeito tem faculdades em P.E.S.. Escolhe-se um teste unilateral, pois no h interesses em obter escores extremamente baixos mas, ao contrrio, na de obter escores altos: Mdia: = N p = 50 (0,5) = 25 e

H0: p = 0,9 A pretenso correta. H1: p < 0,9 A pretenso falsa. Escolhemos um teste unilateral pois no h interesse em determinar se a proporo de pessoas curadas pela droga muito baixa.. Se o nvel de significncia = 0,01 e z() = -2,33 = Np =200.0,9 = 180

= Npq = 200.0,9.0,1 = 4,23


z = (x - ) / = ( 160 - 180 ) / 4,23 = 4,73 Logo como z < -2,33 conclui-se que a pretenso no legtima.
0.08

0.06

z = -2,33

0.04

0.02

-3

-2

-1

Desvio Padro:

= Npq = 3,54

z=

Para x = 32, em unidades reduzidas:


25 = 32 = 1,98 3,54
z c ( = 0,05) = 1,65

Como

e o z

encontrado encontra-se na regio crtica, rejeita-se H0, ou seja o indivduo apresenta P.E.S.
Exemplo 13 - O fabricante de uma droga medicinal reivindicou que ela era 90% eficaz em curar uma alergia, em umperodo de 8 horas. Em uma amostra de 200 pessoas que tinham a alergia, a droga curou 160 pessoas. Determinar se a pretenso do fabricante legtima

Exemplo 14 - A vida mdia de uma amostra de 100 lmpadas fluorescentes, produzidas por uma companhia, foi calculada em 1570 horas, com o desvio padro de 120 horas. Se a vidamdia de todas as lmpadas produzidas pela companhia, testar a hiptese de = 1600 horas, em face da hiptese alternativa d de 1600 horas, adotando o nvel de significncia de: a) = 0,05 b) = 0,01 H0: = 1600 h; H1: 1600 h Teste tipo bilateral: a) zc ( = 0,05) = 1,96 x = = 120 = 12 h; x =
N 100

z=

15701600 12

= 2,50

Este valor est fora do intervalo (1.96,+1.96) Logo rejeita-se H0 ao bnvel de significncia de 0,05% b) = 0,01 Agora o intervalo zc ( = 0,05) = 2,58 ((-2.58,+2.58))

p: probabilidade de obter-se a cura da alergia.

Dr Cludio S. Sartori

Bioestatstica

FATEC

Como -2.50 est dentro do intervalo, aceita-se H0 no nvel de significncia de 0,01.


Exerccios:

1. A tenso de ruptura dos cabos produzidos por um fabricante apresenta a mdia de 1800 kg e o desvio padro de 100 kg. Mediante nova tcnica no processo de fabricao, proclamou-se que a tenso de ruptura pode ter aumentado. Para testar essa declarao, ensaiou-se uma amostra de 50 cabos, tendo-se determinado a tenso mdia de ruptura de 1850 kg. Pode-se confirmar a declarao no nvel de significncia de 0,01? 2. Referente ao exemplo 14, testar a hiptese de = 1600 h em face da alternativa < 1600 h para o nvel de significncia de : a) 0,05 b) 0,01 3 Uma companhia fabrica cabos cuja tenso de ruptura tm mdia de 300 kg e desvio padro de 24 kg. Acredita-se que, mediante um processo recentemente aperfeioado, a tenso mdia de ruptura pode ser aumentada. a) Planejar uma regra de deciso para rejeio do processo anrtigo, ao nvel de significncia de 0,01, se foi resolvido submeter 64 cabos a ensaio. b) De acordo com a regra de deciso adotada em a), qual a probabilidade de aceitao do processo antigo, quando, de fato, o novo aumentou a tenso mdia de ruptura para 310 kg? Considerar que o desvio padro ainda 24 kg. 4. Um analista de mercados coleta informaes de uma amostra aleatria de 100 clientes, dos 400 que compraram uma oferta especial. As 100 pessoas gastaram uma mdia de x = $24,57 na loja, com desvio padro de $ 6,60. Antes de ver esses resultados da amostra, o gerente havia afirmado que a mdia das compras feitas por aqueles que responderam oferta especial teria sido de, no mnimo, $ 25,00. Pode-se rejeitar essa afirmao utilizando um nvel de significncia de 1%? 5. Um fabricante interessado na compra de um novo equipamento para produzir ferramentas especificou que o equipamento no deve exigir, em mdia, mais do que 10 minutos de manuteno para cada hora de operao. O agente de compras visita uma companhia onde est instalado o equipamento, e, pela informao que recolhe, nota que 40 horas de operao aleatoriamente selecionadas incluem um total de 7 horas e 30 minutos de manuteno, sendo que o desvio padro do tempo de

manuteno por hora foi de 3,0 minutos. Com base neste reultado amostral, pode-se rejeitar a hiptese de que o equipamento possui as especificaes sobre o tempo de manuteno, ao nvel de significncia de 5 %? Esboce o grfico da distribiuio normal explicitando as regies de aceitao e rejeio. 6. Uma cadeia de lanchonetes instalar um novo estabelecimento em um local proposto se passarem pelo local, no mnimo, 200 carros por hora durante certos perodos do dia. Para 20 horas aleatriamente selecionadas durante tais perodos, o nmero mdio de carros que passarem pelo local foi de x = 208,5 com desvio padro de 30. Supe-se que a populao estatstica seja aproximadamente normal. O gerente da cadeia de lanchonete adota, conservadoramente, a hiptese nula de que o volume de trfego no satisfaz a exigncia, ou seja, H0: 200,0. Pode essa hiptese ser rejeitada a um nveld e significncia de 5%? 7. Suponha que os resultados amostrais do problema anterior sejam baseados em uma amostra de n = 50 horas. Pode a hiptese nula ser rejeitada ao nvel de significncia de 5%? 8. O valor mdio das vendas por estabelecimento varejista, durante o ltimo ano de um particular produto, foi de x = $3.425,00 para uma amostra de 25 estabelecimentos. Com base em dados de vendas em outros produtos similares, supe-se que a distribuio das vendas seja normal e que o valor do desvio padro da amostra seja de = $ 200,00. Suponha que tenha sido afirmado que o verdadeiro valor das vendas no estabelecimento no mnimo de $ 3.500,00. Testar essa afirmao ao nvel de significncia de: a) 5% b) 1% 9. Uma amostra de 50 firmas tomadas de uma particular indstria, o nmero mdio de empregados por firma de 420,5 com desvio padro amostral de 55,7. Existem ao todo 380 firmas nesta indstria. Antes que os dados fossem coletados, foi feita a hiptese de que o nmero mdio de empregados por firma, nesta indstria, no era superior a 408. Testar a hiptese ao nvel de significncia de 5%.

Dr Cludio S. Sartori

Bioestatstica

FATEC

10. Suponha que o analista do problema anterior ignorasse o uso do fator de correo finita para determinar o valor deo erro padro da mdia. Qual teria sido o resultado do teste, ainda usando o nvel de significncia de 5%? 11. Uma amostra de aleatria de 30 empregados no nvel II de Secretariado foi submetido a um teste de datilografia. Os resultados da amostra so: x = 63,0 ppm (palavras por minuto) e = 5,0 ppm. Testar a hiptese nula de que as secretrias, em geral, no ultrapassam uma velocidade de datilografia de 60 ppm, usando um nvel de significncia de 1%. 12. Um analista de departamento de pessoal seleciona aleatoriamente os registros de 16 empregados horistas e acha um salrio mdio horrio de x = $7,50 com um desvio padro de $ 1,00. Supe-se que os salrios da firma sejam normalmente distribudos. Testar a hiptese nula H0 : = $ 8,00 usando um nvel de significncia de 10%.

Dr Cludio S. Sartori

Bioestatstica

FATEC

Exerccios - Reviso

1. Uma populao consta de 4 nmeros: 3, 7, 11 e 15. Considerar todas as amostras possveis de 2 elementos, que podem ser retiradas com reposio. Determinar: a) A mdia populacional. b) O desvio padro da populao. c) A mdia da distribuio amostral das mdias. d) O desvio padro da distribuio amostral das mdias. Dados:

bairro, mostraram uma mdia de $29400,00 e desvio padro de $ 6325,00. a) Encontre um intervalo de confiana para a mdia de 95%, assumindo que h 120 casas no bairro. Faa o grfico da distribuio gaussiana indicando os valores do intervalo para a mdia populacional, , usando a
expresso: Y = 1 e 2 2 e localize a mdia i 2 amostral nesse grfico. b) Encontre um intervalo de confiana para a mdia de 95%, assumindo que h 1000 casas no bairro. Faa o grfico da distribuio gaussiana indicando os valores do intervalo para a mdia populacional, , usando a
expresso: Y = 1 e 2 2 e localize a mdia i 2 amostral nesse grfico. Utilize a aproximao de que N < 10%Np. ( xi )2

( xi )2

x =
N

x =
x =

NP N N p 1

; N < 10% N P

2. Para cada dado, encontre o intervalo de confiana para a mdia populacional . N se refere ao tamanho da amostra.

x
125 206 154 309 40 78

16 25 3 50 7 6

64 100 81 225 49 144

Intervalo de Confiana (%) 95 99 90 95 99 90

6. Testes sonoros feitos em 40 veculos indicaram uma mdia de 65 decibis e desvio padro de 6 decibis. a) Encontre um intervalo de 90% de confiana para a mdia. b) Quais so os limites de confiana? 7. Os dados a seguir indicam para alguns dados econmicos para o Brasil.
Ano PIB($) (bi) Cresci mento (%) Renda per capita ($) 4526 4500 4407 4555 4752 4883 4949 5029 Cresc iment o (%)

3. Considere uma simulao feita em um computador em que em uma amostra de 100 elementos de uma populao de mdia 50 e desvio padro 5. O nmero de elementos da populao muito maior que o da amostra. Construa o intervalo de confiana de 95%. 4. Um mdico quer estimar o tempo mdio que um determinado paciente espera para uma consulta. Uma amostra de 50 pacientes mostraram uma mdia de espera de 23,4 minutos e desvio padro de 7.1 minutos. Encontre o intervalo de confiana de 95% para a mdia 5. Um acessor de uma determinada cidade deseja estimar o valor mdio de casas em um certo bairro. A mdia previamente conhecida de $23500,00. Uma amostra randmica de 40 casas no

1990 1991 1992 1993 1994 1995 1996 1997 1998 1999

652 659 655 688 728 758 779 804

-4,3 1,0 -0,5 4,9 5,9 4,2 2,8 3,2

-5,5 -0,6 -2,1 3,4 4,3 2,8 1,3 1,6

a) Utilizando uma mdia dos ltimos 2 anos, faa uma projeo para o PIB e renda per capita para os anos de 1998 e 1999. b) Determine agora a mdia e o desvio padro dos 10 anos. Utilize:

Dr Cludio S. Sartori

Bioestatstica

FATEC

xi
i =1

(xi )
i =1

c) Construa um histograma para o PIB e a renda per capita. Indique os valores das mdias. d) Construa a funo gaussiana que representa o Pib e a renda per capita. Atravs dela estime os valores do PIB e renda per capita para os anos de 1998 e 1999. Compare com os valores da tabela. e) Construa um intervalo de confiana de 95% para a mdia do PIB e a renda per capita. Os valores de 1999 esto dentro dos limites de confiana? 8. Para testar a hiptese de que a moeda honesta, adota-se a seguinte deciso: (3) Aceita-se a hiptese, se o nmero de caras em uma nica amostra de 100 lances, estiver dentro de um intervalo de confiana de 95%. (4) Rejeit-la, caso contrrio. a) Construa o intervalo de confiana, usando a aproximao normal para a distribuio binomial. b) Determine o nmero de caras correspondente. b) Que concluses se poderiam tirar do fato de uma amostra de 100 lances apresentar 53 caras? 60 caras? 20 caras? 78 caras? Dados: = Np : (p:probabilidade de obter-se sucesso em um lanamento)

processo ser desenvolvido substituindo o antigo, providenciando uma significativa mudana na resistncia do plstico. Uma amostra de 40 peas feita com o novo processo d uma mdia de 30 libras por polegada quadrada. Assumindo desvio padro de 6 h suficiente evidncia para sugerir que a resistncia do produto aumentou a 5% de significncia ? 11. Um industrial gostaria que seu produto esteja pronto em pelo menos 700 horas. Ele espera que seu produto no atrase muito nem se adiante muito em relao a 700 horas. Numa amostra de 48 produtos obteve-se mdia de 675 h e desvio padro de 77 h. Faa o teste a 1% de significncia. 12. Um pediatra mede um parmetro de recordao relativo a seus 38 pacientes. Ele espera que seu resultado seja menor que a mdia sempre adotada, de 6.5 dias. Os resultados amostrais obtidos so: 8 7 2 6 9 4 5 3 7 8 10 7 7 6 4 10 3 6 8 2 5 4 4 5 3 8 7 4 6 3 7 12 4 3 6 6 9 4 Usando um nvel de significncia de 5%, construa o intervalo de confina e em seguida faa o teste de hiptese explicitando a hiptese nula e a alternativa. Indique na gaussiana a mdia amostral. 13. O proprietrio de uma empresa de mquinas de copiar utiliza frequentemente, um modelo de mquina denominado DW 140. O proprietrio est interessado em decidir no utilizar esse modelo caso a mdia dos trabalhos executados pela mquina exceder 40 min. Ele mediu o tempo de trabalho da mquina para 36 trabalhos: 23 27 28 33 35 37 39 40 40 41 42 42 42 42 43 43 44 44 45 46 46 46 47 47 47 48 49 50 51 52 53 53 56 57 61 62 Use um nvel de significncia de 5% para decidir se o proprietrio utilizar o modelo DW140 para seus trabalhos. 14. Um procedimento de treinamento datilogrfico padro baseia-se em 64 palavras datilografadas por minuto. Um instrutor analisou 38 candidatas a secretria e encontrou os seguintes resultados (palavras por minuto):

= Npq :
z= X

(q:probabilidade

de

insucesso em um lanamento (q = 1- p))

Repita o problema para 99% de confiana. 9. Uma experincia sobre percepo extra-sensorial (P.E.S), um sujeito, em uma sala, solicitado a declarar a cor vermelha ou preta de uma carta escolhida, de um baralho bem embaralhado de 50 cartas, por outro indivduo colocado na mesma sala. O sujeito desconhece quantas cartas vermelhas ou pretas h no baralho. Se o sujeito identifica corretamente 32 cartas, determinar se os resultados so significativos, nos nveis de significncia de: c) 0,05 d) 0,01 10. Um determinado tipo de plstico possui uma resistncia de 27 e um desvio padro de 15 libras por polegada quadrada ( 1 libra . 0.45 kg ). Um novo 6

Dr Cludio S. Sartori

Bioestatstica

FATEC

56 60 60 70 60 59 41 66 67 33 55 43 61 71 73 60 56 77 43 58 65 67 71 56 48 90 82 46 68 36 27 52 64 54 49 69 46 68 Usando uma significncia de 5% pode o instrutor afirmar que a este nvel a mdia seja diferente de 64? 15. H duas medidas de presso sangunea utilizadas em exames: a correspondente sstole, quando o msculo do corao est contraindo e `a distole, quando o msculo do corao est relaxado. Para adultos jovens, a presso sstole/distole vale 120/74 mm de Hg. Essa presso tende a aumentar com a idade. Para homens de 35-59 anos se encontra a 130/84. Alguns mdicos estudaram a presso sangunea para alguns (41) atletas em determinada universidade e encontraram uma presso mdia (sstole/distole) de 123/80 mm Hg). Utilizando uma significncia de 1% verifique se essa mdia est na regio de aceitao ou rejeio e escreva as hipteses nula e alternativa: 15.1) Para a presso correspondente sstole: a) Comparada com adultos jovens e desvio padro de 2 mm Hg. b) Comparada com adultos jovens e desvio padro de 4 mm Hg. c) Comparada com homens de 35 - 59 anos e desvio padro de 2 mm Hg. d) Comparada com homens de 35 - 59 anos e desvio padro de 4 mm Hg.

15.2) Para a presso correspondente distole: Comparada com adultos jovens e desvio padro de 2 mm Hg. f) Comparada com adultos jovens e desvio padro de 4 mm Hg. g) Comparada com homens de 35 - 59 anos e desvio padro de 2 mm Hg. h) Comparada com homens de 35 - 59 anos e desvio padro de 4 mm Hg. e)
Exerccios - Testes de Hipteses

Uma companhia de nibus 4. avisa que o tempo de viagem entre duas cidades de 150 min. Um grupo de consumidores reclamou que o tempo mdio era maior que 150 minutos, atrassando assim seus compromissos. Uma amostra de 40 viagens mostrou uma mdia de 153 minutos e um desvio padro de 7,5 min. Usando um nvel de significncia de 5%, h evidncias suficientes para crer no grupo? H0: = 150 min ;Ha: > 150 min = 7,5 min Como Ha apresenta sinal > o tipo do teste de "cauda direita".

( x 150 ) 2 2( 7 , 5 ) 2

Grfico de:

1 e 2 7.5

0 . 4 0 . 0 5 0 . 0 4 0 . 0 3 0 . 2 0 . 0 2 0 . 0 1 0 1 2 0 0 . 1 0 . 3

0 1 3 0 1 4 0 1 5 0 1 6 0 1 7 0 1 8 0 4 2 0 2 4
Regio de rejeio a H0 Regio de aceitao de H0 Regio de rejeio a H0

Regio de aceitao de H0

151.951

1.645

Construo do intervalo de confiana: z=0,05 = 1,645

+ zC

= 150 + 1.645

7.5 = 150 + 1.951 = 151.951 40

Dr Cludio S. Sartori

Bioestatstica

FATEC

Como 153 pertence regiod e rejeio, rejeita-se Ho, ou seja, o grupo est certo a um nvelde confiana de 95%. Podemos tambm utilizar a varivel reduzida:

+ zC

= 15 + 1.645

5.4 = 15 + 0.7637 = 15.7637 50

z=
z=

xa
N

Deciso: Como 17.3 > 15, rejeita-se H0, ou seja, aceita-se Ha de que > 15. 3. O proprietrio de uma empresa perfuradora de poos artesianos suspeita que, para um determinado tipo de solo, a profundidade mdia na qual se encontrava gua era inferior a 500 ps. Perfuraes realizadas em 32 regies diferentes mostraram uma mdia de 486 ps e um desvio padro de 53 ps. A um nvel de significncia de 1 %, justificada a suspeita do proprietrio? H0 = 500 ps; Ha: < 500 ps Como Ha contm <: Teste unilateral cauda esquerda.

153 150 = 2.5298 1.1851

Como 2.5298 > 1.645, rejeita-se H0 a um nvel de confiana de 95%. 2. Uma psicloga quer confirmar sua crena que crianas maltratadas teriam elevados nveis de depresso. Ela d um teste chamado de POMS (Profile of Mood States) parta uma amostra de 50 crianas abusadas. Os resultados mostraram um escore de depresso mdia de 17.3 e um desvio padro de 5.4 . A um nvel de 5%, pode-se concluir que, as crianas abusadas, tm em geral um nvel de depresso maior de 15 (que a mdia para estudantes de colgio) ? H0 : = 15; Ha > 15 Teste unilateral cauda direita. Construo do intervalo de confiana: z=0,05

= 1,645

Construo do intervalo de confiana: z=0,01 = 2,33 53 = 500 + ( 2.33) = 500 21.830 = 478.16 + zC
N 32

0.007 0.006 0.005 0.004 0.003 0.002 0.001 0 300 400 500 600 700

Rejeio a H0

Aceitao a H0

478.16 Grfico de:


1 e 2 53
( x 500 ) 2 2( 53) 2

Como 486 pertence regio de aceitao, aceita-se H0 a um nvel de confiana de 5%, ou seja a mdia da profundidade de perfurao de poos artesianos de 500 ps.

4. Um determinado tipo de plstico possui uma resistncia de 27 e um desvio padro de 15 libras por polegada quadrada ( 1 libra .

Dr Cludio S. Sartori

Bioestatstica

FATEC

0.45 kg ). Um novo processo ser desenvolvido substituindo o antigo, providenciando uma significativa mudana na resistncia do plstico. Uma amostra de 40 peas feita com o novo processo d uma mdia de 30 libras por polegada quadrada. Assumindo desvio padro de 6 h suficiente evidncia para sugerir que a resistncia do produto aumentou a 1% de significncia ? H0 = 27 libras/pol2 ; Ha: > 27 ps Como Ha contm >: Teste unilateral cauda direita. Construo do intervalo de confiana: z=0,01 = 2,33 15 = 27 + 2.33 = 27 + 5.526 = 32.526 + zC
N 40

Como 30 < 32.526, est na regio de aceitao, aceita-se H0 a 1% de significncia. Poderamos resolver tambm:

z=

xa

30 27
15 40

= 1.265

Como 1.265 < 2.33 est na regio de aceitao, no se rejeita H0. 5. Um industrial gostaria que seu produto esteja pronto em pelo menos 700 horas. Ele espera que seu produto no atrase muito nem se adiante muito em relao a 700 horas. Numa amostra de 48 produtos obteve-se mdia de 675 h e desvio padro de 77 h. a) Complete o teste a 5% de significncia. b) Qual o tipo de erro de se cometer e com que probabilidade? a) H0 = 700 h ; Ha: 700 h

z=0,01 = 1.96
zC
N = 700 1.96 77 = 700 21.783 678.216 < I < 721.783 48

Como 675 est na regio de rejeio, rejeitase H0 a um nvel de significncia de 5%. b) O erro do Tipo I com 5% de probabilidade.

Dr Cludio S. Sartori

Bioestatstica

FATEC

Exerccios de Reviso - Estatstica

televisores vendidos eram pequenos, 35 de tamanho mdio e 10 grandes. a) Construa a tabela abaixo.
Tela Pequena (< 14) Tela mdia (14 20) Tela Grande (> 21)

Distribuies t de Student e Qui Quadrado

1. Construir um intervalo de confiana para estimar a vida mdia til dos tubos de imagem de TV com base em uma amostra n = 15, desvio padro e mdia da amostra, respectivamente iguais a = 500 h e = 8900 h, respectivamente. 2. Um encarregado de compras em um supermercado toma uma amostra aleatria de 12 latas de ervilha e encontra os seguintes dados:

Televisores Frequncia observada fo em N = 100 Frequncia esperada fe Em N = 100

b) Calcule o valor de 2 com base na tabela, atravs de sua definio: (NE:Nmero de eventos).

Peso por lata (em 10 gramas) 15,7 15,8 15,9 16,0 16,1 16,2

Nmero de latas

1 2 2 3 3 1

=
2 i =1

NE

( f e f o )2
fe

c) Verifique as hipteses a 1 % de significncia: H0: A percentagem de todas as compras de televisores das categorias seguem 40%, 40%, 20%. H1: O padro atual das compras diferente do padro histrico apresentado em H0. 5. A tabela a seguir ilustra o nmero de instalaes de um sistema de ar-condicionado de acordo com o tipo de sala usado em uma indstria. A 6 10
Tipos de sala B C D 12 14 8

Determine: a) O peso lquido mdio em cada lata desta amostra e o desvio padro da amostra. b) Use a distribuio t de Student para construir um intervalo de confiana de 95%. 3. Para o conjunto de 12 latas do exemplo anterior, encontre, usando a distribuio Qui Quadado, um intervalo de confiana de 95% para o desvio

Total 40 40

Ns

2 1 2

( )

< <

Ns

fo (nmero observado) fe (nmero esperado)

10

10

10

2 ( )
2

a) Calcule o valor de 2 com base na tabela. b) Dada as hipteses: H0: A quantidade de instalaes est igualmente distribuda entre as 4 salas. H1: A quantidade de instalaes no est igualmente distribuda nas 4 salas Testar a 5% de significncia as hipteses acima. 6. Um gerente de departamento de pessoal estima que 40% dos empregados de uma grande empresa participar de um novo programa de investimentos em aes. So feitos contatos com uma amostra aleatria de 50 empregados, sendo que 10 deles indicam sua inteno de participar.

padro da populao: Com = N 1 4. Historicamente, um fabricante de televisores vende 40% de aparelhos com tela pequena (menos de 14 polegadas), 40 % de aparelhos com telas mdias (de 14 a 20 polegadas) e 20 % de aparelhos com telas grandes ( 21 polegadas ou mais). Com o fim de estabelecer programas apropriados de produo para o prximo ms, ele toma uma amostra aleatria de 100 vendas durante o atual perodo e encontra que 55

Dr Cludio S. Sartori

Bioestatstica

FATEC

Espera-se, com o emprego da distribuio normal, que 20 funcionrios participem do programa. a) Monte a tabela abaixo. Participao do programa Sim No
Total

fo fe 20 30 50 b) A uma significncia de 5% teste a hiptese inicial de que H0: percentual de participao = 40 % H1: percentual de participao 40 % Utilize um teste bilateral com a distribuio Qui Quadrado. c) Faa o mesmo teste a 1 % de significncia. 7. Um fabricante de refrigeradores oferece trs linhas de produtos bsicos, que podem ser descritascomo "baixa" , "intermediria" e "alta" em termos comparatuvos de preos. Antes de uma promoo de vendas destinada a destacar as qualidades de refrigeradores de preo alto, as vendas percentuais das trs categorias eram, respectivamente, 45, 30, 25. De uma amostra aleatria de 50 refrigeradores vendidos depois da promoo, as quantidades vendidas nas categorias de preo baixa, intermediria e alta foram, respectivamente, 15,15 e 20. Completar a tabela abaixo e testar a hiptese nula de que o atual padro de vendas no difere do padro histrico, utilizando um nvel de significncia de 5%. Ou seja H0: o atual padro de vendas segue o padro histrico; H1: o atual padro de vendas difere do padro histrico.

noite em 10 pacientes tratados com hyoscine e so mostrados na tabela abaixo. As drogas promoveriam horas adicionais de sono se a mdia de sono para todos os pacientes possveis excedesse 0 ( > 0). Estabeleceu-se as hipteses: H0: = 0 Ha: > 0 Paciente Horas adicionais de sono 1 1.9 2 0.8 3 1.1 4 0.1 5 -0.1 6 4.4 7 5.5 8 1.6 9 4.6 10 3.4 a) Encontre a mdia e o desvio padro das horas adicionais de sono por paciente. b) A um nvel de significncia de 5%, confirme se as drogas promovem o aumento de sono ou no. 9. A associao americana do corao recomenda que um nvel de colesterol abaixo de 200 miligramas por 100 mililitros. Mediu-se o nvel de colesterol de mulheres com idade inferior a 40 anos escolhidas randomicamente: 233 197 192 179 174 217 186 221 188 209 196 167 238 179 196 191. A um nvel de significncia de 10 % razovel supor que mulheres abaixo de 40 anos possuem nvel de colesterol abaixo da mdia 200 ? H0: = 200 mg/100ml Ha: < 200 mg/100ml 10. Uma companhia de sorvete argumenta que seu produto contm 500 cal por quartil, (1 quartil equivale a 560 ml, aproximadamente). Para comprovar essa hiptese, foram analizados 24 potes de 1 quartil, onde obteve-se uma mdia de 507 calorias e desvio padro de 21 calorias. Teste a hipotese a 2 % de nvel de significncia utilizando a distribuio t de Student. H0: = 500 cal Ha: 500 cal 11. Construa um intervalo de confiana de 95% utilizando a distribuio t de Student

Categoria s Baixa fo (quantidade vendida) fe (quantidade que se espera vender)

Interme diria

Alta

Total

8. Em um trabalho publicado em 1908, Gosset (Student) discutiu alguns .dados obtidos pelos cientistas A. Cushny e A. Peebles, que estudaram os efeitos de ismeros ticos de hyoscyamine hydrobromide em induzir o sono nas pessoas. Os dados obtidos eram de horas adicionais de sono por

Dr Cludio S. Sartori

Bioestatstica

FATEC

para o nvel mdio de ansiedade de estudantes de colgio, medidos por meio de um questionrio, cuja pontuao mdia para 20 estudantes equivale a 60 pontos com desvio padro de 7.5 . 12. Uma indstria de produtos eletrnicos utiliza na montagem de um produto, 4 linhas de manufatura para produzir o mesmo produto. Cada linha de produo teoricamente equivalente, desde que todos tenham a mesma razo de produo de instrumentos necessrios at o prazo de garantia do produto. A companhia deseja checar esse processo. A deciso foi tomada em observar os prximos 100 produtos que retornaram defeituosos e determinar quantos chegam a cada linha de montagem. A linha de montagem 1 usada 2 vezes por dia enquanto as linhas de montagem 2, 3 e 4 so utilizadas uma vez s. Os produtos defeituosos que chegam nas linhas 1,2,3 e 4 so, respectivamente, 53,18,14 e 15. Determine as probabilidades com que ocorrem os produtos defeituosos nas linhas de produo. b) Construa a tabela abaixo. Linha de 1 2 3 4 Total produo Frequncia observada fo em N = 100 Frequncia esperada fe Em N = 100 c) Calcule o valor de 2 com base na tabela, atravs de sua definio: (NE:Nmero de eventos). a) A 6 5
Tipos de sala B C D 12 12 10

Total 40 40

fo (nmero observado) fe (nmero esperado) c)

15

15

Calcule o valor de 2 com base na tabela. d) Dada as hipteses: H0: A quantidade de instalaes est igualmente distribuda entre as 4 salas. H1: A quantidade de instalaes no est igualmente distribuda nas 4 salas Testar a 5% de significncia as hipteses acima.
Adaptados de General Statistics, Warren Chase and Fred Bown, John Wiley & Sons, Inc., Third edition

Distribuies t de Student e Qui Quadrado

=
2 i =1

NE

( f e f o )2
fe

d) Verifique as hipteses a 1 % de significncia: H0: As linhas de produo seguem as probebilidades encontradas (2/5 para linha 1,1/5 para linha 2,1/5 para linha 3,1/5 para linha 4) para produtos defeituosos. H1: O padro maior do apresentado em H0. 13. A tabela a seguir ilustra o nmero de instalaes de ventiladores de acordo com o tipo de sala usado em uma indstria.

Dr Cludio S. Sartori

Bioestatstica

FATEC

Teoria de Pequenas Amostras

Notamos anteriormente que para distribuies de amostras com nmero N > 30, denominadas de grandes amostras, as distribuies eram aproximadamente normais, tornando-se a aproximao melhor com o crescimento de N. Para amostras com N < 30 essa aproximao no e boa piora com o decrscimo de N. Elas so denominadas de pequenas amostras e seu estudo denominado de teoria de pequenas amostras, onde duas distribuies importantes, a Student t ou t de Student e a qui quadrado sero estudadas.
A Distribuio de Student t

do qual podem ser calculados x e s. Entretanto, como deve ser avaliado, k =1. O parmetro de normalizao pode ser obtido e a distribuio t de student dada por:

f ( x, , ) =

+1 2 x 2 s 1 + 2

+1
2

Definimos a estatstica :

Ou, reduzindo a varivel:

t=

x / N s

Com

= s

N N 1 s

Considerando-se amostras com tamanho N, extradas de uma populao normal (ou aproximadamente normal) de mdia , e, se para amostra , calcular-se o valor de t, por meio da mdia amostral x e do desvio padro s, pode-se determinar a distribuio amostral de t. Tal distribuio dada por:

f ( t , ) =

+1 2 t2 1 + 2

+1
2

Aqui, a funo Gamma, definida por:

Y=

Y0 t2 2 1 + N 1
ou
N

( x ) = t x 1e t dt
0

Y=

Y0 t2 1 +

( +1) 2

Onde (letra grega "nu") denominada de nmero de graus de liberdade. Note que

= N 1

A forma grfica da distribuio t de Student est mostrada a seguir, para alguns valores do grau de liberdade e comparadas com a distribuio normal, pois para grandes valores de N a distribuio t de Student se aproxima com a normal reduzida:

O nmero de graus de liberdade de uma estatstica definido o nmero N de observaes independentes da amostras menos o nmero k de parmetros populacionais que devem ser estimados por meio das observaes amostrais. Ento: = N k . No caso da estatstica definida por t, o nmero de observaes independentes da amostra N, 6

1 t2 Y= e 2

Pequena Bibliografia (http://history.math.csusb.edu/Mathematicians/G osset.html)

Dr Cludio S. Sartori

Bioestatstica

FATEC

http://ubmail.ubalt.edu/~harsham/statdata/opre330.htm#rt distributions
+1 ) 1 ( 2 = y Chamamos de ) ( 2 parmetro relacionado normalizao de f (t ) .

Gosset trabalhou com um grande nmero de estatsticos, como Fisher, Neyman e Pearson.
0.4

0.35 0.3 0.25 0.2 0.15 0.1

importante salientar as propriedades da funo gamma:

(n 2)=

(n 2 )!!
( n 1 )
2

n = 1,3,5 ,

0.05 -4 -2 0 2 4

(n ) = (n 1)! n = 1,2,3,4,5,
n !! chamado de fatorial duplo, e definido por:

n (n 2) (n 4) 5 31 se n > 0 mpar n!!= n (n 2) (n 4) 6 4 2 se n > 0 par. 1se n = 1,0.


Com essas propriedades possvel encontrar o parmetro de normalizao da distribuio, y.

Curvas t de Student para =4 ,Y0=0.4 , =1 Y0=0.35 e =2 Y0=0.33 comparadas com a distribuio normal (linha cheia).
Distribuio t de Student: Varivel reduzida t
N-1= 1 N-1= 2 N-1= 3 N-1= 4 N-1= 5 N-1= 6

0,35 0,3 0,25

y ( t)

0,2 0,15 0,1 0,05


-3 -2,5 -2 -1,5 -1 -0,5 0 t 0,5 1 1,5 2 2,5 3

William Gosset - 1876 em Canterbury, Inglaterra -16 outubro 1937 em Beaconsfield, Inglaterra. William foi educado em Winchester, onde em Oxford estudou qumica a matemtica. Trabalhou em Dublin onde fez importante trabalho importante em estatstica. Em 1905 contatou Karl Pearson foi Londres estudar no laboratrio de Pearson. Neste tempo trabalhou no chamado limite de Poisson, com a distribuio binomial e de amostragem, desvio padro, e do coeficiente de correlao. Publicou mais tarde trs trabalhos importantes que tinha empreendido durante este ano que trabalhou no laboratrio de Pearson . familiarmente conhecido como "estudante" mas no como Gosset. De fato, Gosset escreveu sob pseudnimo de "estudante" que explica porque seu nome no era divulgado em virtude de resultados estatsticos importantes. Inventou o t - teste para segurar amostras pequenas para o controle de qualidade. Descobriu o formulrio da distribuio de t por uma combinao do trabalho matemtico e emprico com os nmeros aleatrios, uma aplicao adiantada do mtodo de Monte-Carlo.

A tabela ilustra a rea compreendida pela curva da distribuio t de Student, de - a

tp :
Valores dos percentis t p Distribuio t de Student

com graus de liberdade (rea sombreada =p)

tp

Dr Cludio S. Sartori

Bioestatstica

FATEC

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120

t 0.995
63,66 9,92 5,84 4,60 4,03 3,71 3,50 3,36 3,25 3,17 3,11 3,06 3,01 2,98 2,95 2,92 2,90 2,88 2,86 2,84 2,83 2,82 2,81 2,80 2,79 2,78 2,77 2,76 2,76 2,75 2,70 2,66 2,62 2,58

t 0.99
31,82 6,96 4,54 3,75 3,36 3,14 3,00 2,90 2,82 2,76 2,72 2,68 2,65 2,62 2,60 2,58 2,57 2,55 2,54 2,53 2,52 2,51 2,50 2,49 2,48 2,48 2,47 2,47 2,46 2,46 2,42 2,39 2,36 2,33

t 0.975
12,71 4,80 3,18 2,78 2,57 2,45 2,36 2,31 2,26 2,23 2,20 2,18 2,16 2,14 2,13 2,12 2,11 2,10 2,09 2,09 2,08 2,07 2,07 2,06 2,06 2,06 2,05 2,05 2,04 2,04 2,02 2,00 1,98 1,96

t 0.95
6,31 2,92 2,35 2,13 2,02 1,94 1,90 1,86 1,83 1,81 1,80 1,78 1,77 1,76 1,75 1,75 1,74 1,73 1,73 1,72 1,72 1,72 1,71 1,71 1,71 1,71 1,70 1,70 1,70 1,70 1,68 1,67 1,66 1,645

t 0.9
3,08 1,89 1,64 1,53 1,48 1,44 1,42 1,40 1,38 1,37 1,36 1,36 1,35 1,34 1,34 1,34 1,33 1,33 1,33 1,32 1,32 1,32 1,32 1,32 1,32 1,32 1,31 1,31 1,31 1,31 1,30 1,30 1,29 1,28

t 0.8
1,376 1,061 0,978 0,941 0,920 0,906 0,896 0,889 0,883 0,879 0,876 0,873 0,870 0,868 0,866 0,865 0,863 0,862 0,861 0,860 0,859 0,858 0,858 0,857 0,856 0,856 0,855 0,855 0,854 0,854 0,851 0,848 0,845 0,842

t 0.75
1,000 0,816 0,765 0,741 0,727 0,718 0,711 0,706 0,703 0,700 0,697 0,695 0,694 0,692 0,691 0,690 0,689 0,688 0,688 0,687 0,686 0,686 0,685 0,685 0,684 0,684 0,684 0,683 0,683 0,683 0,681 0,679 0,677 0,674

t 0.7
0,727 0,617 0,584 0,569 0,559 0,553 0,549 0,546 0,543 0,542 0,540 0,539 0,538 0,537 0,536 0,535 0,534 0,534 0,533 0,533 0,532 0,532 0,532 0,531 0,531 0,531 0,531 0,530 0,530 0,530 0,529 0,527 0,526 0,524
s

t 0.6
0,325 0,289 0,277 0,271 0,267 0,265 0,263 0,262 0,261 0,260 0,260 0,259 0,259 0,258 0,258 0,258 0,257 0,257 0,257 0,257 0,257 0,256 0,256 0,256 0,256 0,256 0,256 0,256 0,256 0,256 0,255 0,254 0,254 0,253

t 0.55
0,158 0,142 0,137 0,134 0.132 0,131 0,130 0,130 0,129 0,129 0,129 0,128 0,128 0,128 0,128 0,128 0,128 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,126 0,126 0,126 0,126

Nmero de graus de liberdade:

Intervalo de Confiana com um determinado nvel de significncia : t p

= N 1

Bilaterais: t p

= t1 ; Unilaterais: t p = t1
2

Dr Cludio S. Sartori

Bioestatstica

FATEC

Intervalos de Confiana da Distribuio tde Student:

confiana desejado e do tamanho da amostra. Tambm so tirados da tabela anterior.


Testes de Hiptese e Confiana:

Como na distribuio normal, podem ser definidos intervalos de confiana de 95%, 99% e outros para a distribuio t de Student, com o emprego da tabela anterior. Dessa maneira, a mdia da populao pode ser avaliada dentro dos limites de confiana especificados. Por exemplo, -t0,975 e t0,975 so os valores de t, para os quais 2,5% da rea ficam localizados em cada extremidade da distribuio t, ento o intervalo de confiana de 95% para t :

So estendidos aos problemas que envolvem pequenas amostras. A nica diferena que tratamos ao escore t, com a estatstica t de Student.
Exemplo 1 - O grfico da distribuio t de Student est indicado abaixo, para 9 graus de liberdade e Y0 = 1. Determinar os valores de t1 para os quais: a) A rea sombreada direita igual a 0,05. b) A rea sombreada total vale 0,05. c) A rea no sombreada total 0,99. d) A rea sombreada esquerda vale 0,01. e) A rea esquerda de t1 = 0,90.

t 0,975 <

Ou seja, verifica-se que a mdia avaliado para que caia no intervalo:

x N 1 < t 0,975 s

t 0,975

s N 1

< < t 0,975

s N 1

Com a confiana de 95% (ou probabilidade de 0,95). t0,975 representa o valor do percentil 97,5, enquanto t0,025 = -t0,975 representa o do percentil 2,5. Em geral, pode-se representar os limites de confiana para as mdias populacionais como sendo:

tc

Os valores tc so chamados crticos ou coeficientes de confiana e dependem do nvel de

1 0.8 0.6 0.4 0.2

-4

-2

-t1 a) rea sobreada direita 0,05, ento a rea esquerda de t1 1-0,05=0,95 e t1 representa o percentil 950, e, pela tabela, t0.95 = 1,83. b) Se a rea total sombreada 0,05, por simetria, a rea direita 0,025. Portanto a rea esquerda de t1 vale 1-0,025 = 0,975. t1 representa o percentil 97,50. Na tabela encontra-se o valor de t0.975=2,26.

t1 c) Se a rea no sombreada 0,99, a rea total sombreada 1 - 0,99 = 0,01 e a sombreada direita 0,01/2=0,005. Na tabela se determina t0,995=3,25. d) Se a rea sombreada esquerda vale 0,01, por simetria, direita 0,01. Na tabela, t0,99=2,82. Portanto o valor crtico de t, para o qual a rea sombreada esquerda 0,01 igual a -2,82.

Dr Cludio S. Sartori

Bioestatstica

FATEC

e) Se a rea esquerda de t1 0,90, ento t1 corresponde ao 900 percentil; t0,90 = 1,38.


Exemplo 2 - Determinar os valores crticos de t para os quais a rea da extremidade direita da distribuio t 0,05, quando o nmero de graus de liberdade for: a) = 16 b) = 27 c) = 200

Pode-se estar 95% confiante de que a mdia verdadeira est compreendida entre 4,38 0,045 = 4,335 polegadas e 4,38+0,045 = 4,425 polegadas. b) Os limites de confiana de 99 % so:

x tc

s N 1

= x t 0.995

s N 1

Como N = 10 = N - 1 = 9; Da tabela encontramos t0.995 = 3,25. Os limites de confiana sero:

Escolhendo-se t0.95 na tabela achamos: a) = 16 t0.95 = 1,75 b) = 27 t0.95 = 1,70 c) = 200 t0.95 = 1,645
Exemplo 3 - Os coeficientes de confiana de 95% (bilateral) para a distribuio normal so dados por 1,96. Quais sero os coeficientes correspondentes para a distribuio t, quando: a) = 9 ? b) = 120 ? c) = 30 ? d) = 60 ? A rea total sombreada ( caudas) ser de: 1 0,95 = 0,05. A rea da extremidade direita 0,025 e o valor crtico correspondente de t tc = t0.975. Ento os coeficientes de confiana desejados so t0.975 Logo: a) = 9 t0.975 = 2,26 b) = 120 t0.975 = 2,09 c) = 30 t0.975 = 2,04 d) = 60 t0.975 = 2,00 Exemplo 4 - Uma amostra de 10 medidas de dimetro de uma esfera apresentou a mdia de x = 4,38 polegadas e o desvio padro s = 0,06 polegada. Determinar os limites de confiana de: a) 95% b) 99% para o dimetro real.

x t0.995
x t0.995
s

s N 1

= 4, 38 3, 25

0,06 10 1

= 4, 38 0, 0650

O intervalo de confiana de 99% ser: (4.315,4.445) polegadas.


Exemplo 5 - Antigamente, certa mquina produzia arruelas que tinham a espessura de 0,05 polegadas. Para se verificar se a mquina est trabalhando adequadamente, escolheu-se uma amostra de 10 arruelas cuja espessura mdia 0,053 polegada e cujo desvio padro 0,003 polegada. Testar a hiptese de a mquina estar trabalhando adequadamente, adotando os nveis de significncia de: a) 0,05. b) 0,01

Deseja-se decidir entre as hipteses: H0: = 0,05, e a mquina est trabalhando adequadamente. H1: 0,05 ela no est. Tipo de teste: Bilateral. Ento:

t=

x
s

0,053 0,05
0, 03 101

=3

N 1

a)

Os limites de confiana de 95% so dados por:


s N 1

x tc

= x t 0.975

s N 1

Como N = 10 = N - 1 = 9; Da tabela encontramos t0.975 = 2,26. Logo: polegad x t0.975 Ns 1 = 4, 38 2, 26 0,06 10 1 as.

a) Para =0,05 Aceitamos H0 quando t estiver compreendido entre -t0.975 e t 0,975. Pela tabela, = 9; t0.975=2,26 e o intervalo vai de -2.26 a 2.26. Como t = 3, rejeita-se H0 ao nvel de significncia de 0,05. b) Se =0,01, aceitamos H0 quando t estiver compreendido entre -t0.995 e t 0,995 Pela tabela, = 9; t0.995= 3,25 e o intervalo vai de -3.25 a 3.25. Logo, como t = 3, aceita-se H0 ao nvel de 0,01.
Exemplo 6 - Um ensaio de tenses de ruptura de 6 cabos produzidos por uma companhia mostrou que a tenso mdia de ruptura de 7750 kg e o desvio padro de 145 kg,

x t0.975

s N 1

= 4, 38 0, 0452

Dr Cludio S. Sartori

Bioestatstica

FATEC

ao passo que o fabricante declara que aquela tenso mdia de 8000 kg. Ser verdadeira a declarao do fabricante, aos nveis de significncia de: a) 0,05 b) 0,01 Deve-se decidir em: H0: = 8000 kg, e a declarao do fabricante justificada. H1: < 8000 kg e ela no o . Teste tipo unilateral. a)

prpria fbrica de enlatados. O peso lquido, em 10 gramas, encontrado em mdia por lata foi de x = $15,97 , com s = 0,15. Foi afirmado que o preo mdio por lata, era de $ 16,00, sempre em unidades de 10 gramas. Pode essa afirmao ser rejeitada a um nvel de significncia de 10% ? 5. Como agente de compras de um certo supermercado, suponha que voc tome uma amostra aleatria de 12 latas de vagens em conserva na prpria fbrica de enlatados. O peso lquido, em 10 gramas, encontrado em mdia por lata foi de x = $15,97 , com s = 0,15. Foi afirmado que o preo mdio por lata, era de $ 16,00, sempre em unidades de 10 gramas. Pode essa afirmao ser rejeitada a um nvel de significncia de 5% ? 6. Para uma distribuio t de Student com 10 graus de liberdade, determine o valor de t1 de modo que: a) A rea direita de t1 seja de 0,01. b) A rea esquerda de t1 seja de 0,95. c) A rea direirata de t1 seja de 0,10. d) A soma das reas direita de t1 e esquerda de -t1 seja de 0,01. e) A rea entre -t1 e t1 seja de 0,85. 7. Determinar os valores crticos de t , para oa quais a rea da extremidade direita da distribuio ser 0,01, se o nmero de graus de liberdade for: a) = 4 b) = 12 c) = 25 d) = 60 e) = 160 8. Usando o software Excel da Microsoft, elabore uma planilha para construir os grficos da distribuio t de Student com os graus de liberdade: a) b) c) d) =4 =6 =8 = 16

t=

x
s

7750 8000
145 61

= 3,86

N 1

Como = N - 1 = 6 - 1 = 5 Aceitamos H0 desde que t seja superior a t0.95; para = 5 t0.95 = -2,02. Caso contrrio, rejeitase H0. Como t = -3,86 < t0.95 rejeitamos H0 ao nvel de significncia de 0.05. b) Aceitaremos H0 desde que t > t0.99 ; para = 5 t0.99 = -3,36 ; ou seja t > -3,36 Como t = -3,86 < -3,36rejeita-se H0, ou seja, improvvel a declarao do fabricante.
Exerccios:

A vida mdia de operao de 10 1. lmpadas x = 4000h com o desvio padro da amostra de s = 200 horas. Supe-se que o tempo de operao das lmpadas em geral tenha distribuio aproximadamente normal. Estimar a vida mdia de operao para a populao das lmpadas da qual foi extrada a amostra, usando um intervalo de confiana da forma:

x tc

s N 1

2. A hiptese nula formulada de que a mdia da vida til de lmpadas de uma determinada marca, , no mnimo, de 4200 horas, com desvio padro amostral de s = 200 horas. A vida til das lmpadas segue uma distribuio normal. Teste a hiptese nula a um nvel de significncia de 5%, usando a distribuio t de Student. 3 Um representante de um grupo comunitrio informa, a um investidor interessado em desenvolver um centro comercial, que a renda mdia familiar na comunidade no mnimo = $ 15000,00. Supe-se que os valores de renda na populao comunitria sejam normalmente distribudos. Para uma amostra aleatria de n = 15 famlias na comunidade, a mdia amostral de x = $14000,00 e o desvio padro amostral vale s = $ 2000,00. Testar a hiptese nula ao nvel de significncia de 5%. 4. Como agente de compras de um certo supermercado, suponha que voc tome uma amostra aleatria de 12 latas de vagens em conserva na

Utilize Y0 = 1.

Dr Cludio S. Sartori

Bioestatstica

FATEC

A distribuio de qui quadrado

Definimos a estatstica:

2 =

Ns

em que a letra grega qui e 2 lido como qui quadrado. Considerando-se amostras de tamanho N retiradas de uma populao normal, com o desvio , e se, para cada amostra, for calculado o valor de 2, pode-se obter uma distribuio amostral desses valores. Essa distribuio chamada de qui quadrado, e dada por:

( X i X )2
i =1

Y = Y0 2 e

2
2

Aqui: = N - 1 o nmero de graus de liberdade e Y0 uma constante dependente de , de modo que a rea total subentendida pela curva igual a 1. As distribuies esto mostradas na figura abaixo, para alguns valores de . ( = 2,4,6,8,10)
Distribuio Qui-Quadrado
0,55 0,5 0,45 0,4 0,35
Y

N-1= N-1= N-1= N-1= N-1= N-1=

1 2 3 4 5 6

0,3 0,25 0,2 0,15 0,1 0,05 0

10 2

12

14

16

18

20

Tabela: Valores dos percentis Intervalo de confiana para 2

2 p

da

distribuio de Qui Quadrado com graus de liberdade (rea sombreada =p) .

Como fizemos para as distribuies normal e t de Student, podem ser definidos os limites e intervalos de confiana de 95%, 99% e outros, para 2, mediante o emprego da tabela a seguir.

2 p

Dr Cludio S. Sartori

Bioestatstica

FATEC

2 0 ,995

2 0 ,99

2 0 , 975

2 0 ,95

2 0 ,90
2,71 4,61 6,25 7,78 9,24 10,6 12,0 13,4 14,7 16,0 17,3 18,5 19,8 21,1 22,3 23,5 24,8 26,0 27,2 28,4 29,6 30,8 32,0 33,2 34,4 35,6 36,7 37,9 39,1 40,3 51,8 63,2 74,4 85,5 96,6 107,6 118,5

2 0 ,75
1,32 2,77 4,11 5,39 6,63 7,84 9,04 10,2 11,4 12,5 13,7 14,8 16,0 17,1 18,2 19,4 20,5 21,6 22,7 23,8 24,9 26,0 27,1 28,2 29,3 30,4 31,5 32,6 33,7 34,8 45,6 56,3 67,0 77,6 88,1 98,6 109,1

2 0 ,50
0,455 1,39 2,37 3,36 4,35 5,35 6,35 7,34 8,34 9,34 10,3 11,3 12,3 13,3 14,3 15,3 16,3 17,3 18,3 19,3 20,3 21,3 22,3 23,3 24,3 25,3 26,3 27,3 28,3 29,3 39,3 49,3 59,3 69,3 79,3 89,3 99,3

2 0 ,25
0,102 0,575 1,21 1,92 2,67 3,45 4,25 5,07 5,90 6,74 7,58 8,44 9,30 10,2 11,0 11,9 12,8 13,7 14,6 15,5 16,3 17,2 18,1 19,0 19,9 20,8 21,7 22,7 23,6 24,5 33,7 42,9 52,3 61,7 71,1 80,6 90,1

2 0 ,10
0,0158 0,211 0,584 1,06 1,61 2,20 2,83 3,49 4,17 4,87 5,58 6,30 7,04 7,79 8,55 9,31 10,1 10,9 11,7 12,4 13,2 14,0 14,8 15,7 16,5 17,3 18,1 18,9 19,8 20,6 29,1 37,7 46,5 55,3 64,3 73,3 82,4

2 0 ,05
0,0039 0,103 0,352 0,711 1,15 1,64 2,17 2,73 3,33 3,94 4,57 5,23 5,89 6,57 7,26 7,96 8,67 9,39 10,1 10,9 11,6 12,3 13,1 13,8 14,6 15,4 16,2 16,9 17,7 18,5 26,5 34,8 43,2 51,7 60,4 69,1 77,9

2 0 , 025

2 0 ,01
0,0002 0,0201 0,115 0,297 0,554 0,872 1,24 1,65 2,09 2,56 3,05 3,57 4,11 4,66 5,23 5,81 6,41 7,01 7,73 8,26 8,90 9,54 10,2 10,9 11,5 12,2 12,9 13,6 14,3 15,0 22,2 29,7 37,5 45,4 53,5 61,8 70,1

2 0 , 005

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100

7,88 10,6 12,8 14,9 16,7 18,3 20,3 22,0 23,6 25,2 26,8 28,3 29,8 31,3 32,8 34,3 35,7 37,2 38,6 40,0 41,4 42,8 44,2 45,6 46,9 48,3 49,6 51,0 52,3 53,7 66,8 79,5 92,0 104,2 116,3 128,3 140,2

6,63 9,21 11,3 13,3 15,1 16,8 18,5 20,1 21,7 23,2 24,7 26,2 27,7 29,1 30,6 32,0 33,4 34,8 36,2 37,6 38,9 40,3 41,6 43,0 44,3 45,6 47,0 48,3 49,6 50,9 63,7 76,2 88,4 100,4 112,3 124,1 135,5

5,02 7,38 9,35 11,1 12,8 14,4 16,0 17,5 19,0 20,5 21,9 23,3 24,7 26,1 27,5 28,8 30,2 31,5 32,9 34,2 35,5 36,8 38,1 39,4 40,6 41,9 43,2 44,5 45,7 47,0 59,3 71,4 83,3 95,0 106,6 118,1 129,6

3,84 5,99 7,81 9,49 11,1 12,6 14,1 15,5 16,9 18,3 19,7 21,0 22,4 23,7 25,0 26,3 27,6 28,9 30,1 31,4 32,7 33,9 35,2 36,4 37,7 38,9 40,1 41,3 42,6 43,8 55,8 67,5 79,1 90,5 101,9 113,1 124,3

0,001 0,0506 0,216 0,484 0,831 1,24 1,69 2,18 2,70 3,25 3,82 4,40 5,01 5,63 6,26 6,91 7,56 8,23 8,91 9,59 10,3 11,0 11,7 12,4 13,1 13,8 14,6 15,3 16,0 16,8 24,4 32,4 40,5 48,8 57,2 65,6 74,2

0,000 0,010 0,072 0,207 0,412 0,676 0,989 1,34 1,73 2,16 2,60 3,07 3,57 4,07 4,60 5,14 5,70 6,26 6,84 7,43 8,03 8,64 9,26 9,89 10,5 11,2 11,8 12,5 13,1 13,8 20,7 28,0 35,5 43,3 51,2 59,2 67,3

Dr Cludio S. Sartori

Bioestatstica

FATEC

A distribuio de Qui-Quadrado pode ser escrita por:

Exemplo 1 - O grfico da distribuio qui quadrado com 5 graus de liberdade est representado ao lado:
0.2 0.175 0.15 0.125 0.1 0.075 0.05 0.025 0 5 10 15 20

Y (

)=

1 22 2

2
2

Pode-se avaliar, dentro dos limites do intervalo de confiana, o desvio padro populacional , expresso em funo do desvio padro amostral s.
2 < 2

Ns 2

< 2
1 2

12
N

2 2

< < s

2 2

Determine os valores crticos de 2 tais que: a) b) c) d) A rea sombreada direita = 0,05 A rea sombreada total 0,05 A rea sombreada esquerda 0,10. A rea sombreada direita = 0,01. a) Se a rea sombreada direita
2 2

Exemplificando, se
2

2 0 , 025 e

2 0 , 975 so os

valores de (denominados valores crticos), para os quais 2,5% da rea so localizados em cada extremidade da distribuio, o intervalo de confiana de 95% ento:
2 0 .025 <

Ns 2

0,05, ento a rea situada esquerda de (1-0,05)=0,95 e


2 2

do qual se deduz que estimado para que fique dentro do intervalo :

2 < 0 .975

representa o 950 percentil,

2 0 .95 . Percorrendo a tabela por = 5 achamos


2 0 ,95 = 11,1

s N
2 0 .975

< <

s N
2 0 .025

com o grau de confiana de 95%. Similarmente podemos determinar outros intervalos de confiana. Os valores
2 0 .025

b) Como a distribuio assimtrica, h vrios valores crticos para os quais a rea total sombreada igual a 0,05. costume escolher as duas reas de valores iguais, 0,025. Se a rea sombreada direita 0,025, a situada esquerda de situada = 0,975 e
2 2

2 0 .975

representam ,

(1 - 0,025)

respectivamente, os valores dos percentis 2,5 e 97,5. A tabela anterior fornece os valores dos percentis correspondentes aos graus de liberdade . Para grandes valores de ( 30), pode-se utilizar o fato de

2 0 2 representa o 97,5 percentil,

2 0 , 975 =12,8

Similarmente, se a rea sombreada

2 2 1 ter
2

distribuio

aproximadamente normal com mdia 0 e desvio padro 1, de modo que podem ser usadas as tabelas da distribuio normal, quando 30. Ento, se

12 0,025, e 12 representa o 2,50 2 percentil, ento 0, 025 = 0,831


esquerda de c) Se a rea sombreada esquerda 0,10,

2 p e zp so percentis de ordem p
quadrado
2

12

representa

100

percentil

das distribuies qui respectivamente, tem-se:

normal,

2 0 ,1 = 1,61 .

1 2 p = 2 (z p + 2 1 )

Dr Cludio S. Sartori

Bioestatstica

FATEC

d)

Se a rea sombreada direita 0,10,


2 2

a rea esquerda de 990 percentil e

0,99 e

2 2

representa o

0.025 = 6.26 0.025 = 2.50


2.4 16 2.4 16 < < 5.24 2.50 1.83 < < 3.84
b) Para 99%, os limites de confiana sero:

2 0 , 99 = 15,1 .

Exemplo 2 Determinar os valores crticos de 2 para os quais a rea da extremidade direita da distribuio de 2 ser de 0.05, quando o nmero de graus de liberdade, for igual a:

a) 15 b) 21 c) 50 Na coluna
2 0 , 95

s N
encontra-se os valores dos

0.995
Como

< <
=
2 0 , 005

s N

0.005
1 = 15

percentis: a) = 15 25 b) = 21 32.7 c) = 50 67.5


Exemplo 3 Determinar os valores medianos de 2 correspondente aos graus de liberdade de:

16

2 0 , 995

= 32.8;

= 4.60

0.995 = 32.8 0.995 = 5.73 0.005 = 4.60 0.005 = 2.14


Limites de confiana de 99%:

a) 9 b) 28 c) 40 Na coluna
2 0 , 50

encontra-se os valores dos

percentis: d) = 9 8.34 e) = 28 27.3 f) = 40 39.3


Exemplo 4 O desvio padro das alturas de 16 estudantes do sexo masculino, escolhidos aleatoriamente em uma escola de 1000 estudantes vale 2.4 cm. Determinar os limites de confiana de: a) 95% b) 99% Do desvio padro para todos os estudantes do sexo masculino da escola.

Portanto, pode-se estar 99% confiante em que o desvio padro populacional est entre 1.68 e 4.49 cm.

1.68 < < 4.49

2.4 16 2.4 16 < < 5.73 2.14

Os limites de confiana so dados por:

s N

0.975

< <

s N

0.025

Para N = 16 = N - 1 = 16 - 1 = 15 Observando a tabela, temos:


2 2 0 ,975 = 27.5; 0 , 025 = 6.26

0.975 = 27.5 0.975 = 5.24


7

Dr Cludio S. Sartori

Bioestatstica

FATEC

O teste de Qui Quadrado

Os resultados obtidos por meio de amostras, nem sempre coincidem com os tericos esperados, de acordo com as regras de probabilidade. Exemplificando: teoricamente espera-se obter 50 caras e 50 coroas em 100 lanamentos de uma moeda honesta, mas raro obter esses resultados na prtica. Suponha-se que, em uma determinada amostra, observou-se que um conjunto de eventos possveis, E1, E2, E3,, Ek, ocorreram com as freqncias o1, o2, o3,,ok, denominadas freqncias observadas, , e que, de acordo com as regras de probabilidade, esperar-se-ia que elas ocorressem com as freqncias e1, e2, e3,,ek, denominadas freqncias esperadas ou tericas.
Evento Freqncia observada Freqncia terica

parmetros populacionais, a partir de estatsticas amostrais. = k - 1 -m Quando as freqncias esperadas somente podem ser calculadas mediante a estimativa de m parmetros populacionais, a partir de estatsticas amostrais.
Testes de significncia:

Na prtica, as freqncias esperadas so calculadas com base em uma hiptese H0. Se, para essa hiptese, o valor de 2 calculado pela equao dada for maior que alguns valores crticos, tais como
2 0 .95

2 0 .99 , que so os

E1 o1 e1

E2 o2 e2

E3 o3 e3

Ek ok ek

Deseja-se, frequentemente, saber se as freqncias observadas diferem de modo significativo, das freqncias esperadas. No caso de serem possveis somente dois eventos E1 e E2, o que denominado s vezes de classificao dicotmica ou dicotomia, como, por exemplo, caras e coroas, parafusos defeituosos ou no, etc., o problema resolvido satisfatoriamente como descrevemos anteriormente. Vamos agora considerar o caso geral.
Definio de 2: Uma medida da discrepncia existente entre as freqncias observadas e esperadas proporcionada pela estatstica de 2, expressa por:
( o1 e1 ) 2 e1 ( o2 e2 ) 2 e2 ( o3 e3 )2 e3

valores crticos nos nveis de significncia 0.05 e 0.01, respectivamente, concluir-se- que as freqncias observadas diferem, de modo significativo, das esperadas, e rejeitar-se- H0 ao nvel de significncia dado. Caso contrrio, aceitar-se- H0, ou pelo menos, no a rejeitar. Esse processo denominado teste de qui quadrado da hiptese ou significncia. Encaramos com suspeita quando 2 prximo de 0, pois em geral raro que as freqncias observadas concordem com as esperadas. A tabela anterior, na quais as freqncias observadas figuram numa linha nica, denominada de tabela de simples entrada. Quando as freqncias observadas ocupam h linhas e k colunas, ou seja, uma tabela dupla de entrada h x k denominamos de tabelas de contingncia. A freqncia total de cada linha ou coluna denominada de freqncia marginal. Para verificar a concordncia entre as freqncias observadas e esperadas:, calcula-se a estatstica:

=
2

+
2

++

( ok ek ) 2 ek

2 =
j =1

(f

oj

fe j fe j

=
j =1

(f

oj

fe j fe j

A distribuio amostral de 2 pode ser aproximada por:

Y = Y0

2 e 2

O nmero de graus de liberdade dado por: =k-1 Quando as freqncias esperadas puderem ser calculadas, sem que se faam estimativas dos

Considera-se a soma de todas as casas da tabela de contingncia de ordem j. Essa soma contm kh termos. A soma de todas as freqncias observadas igual a soma de todas as freqncias esperadas e vale N. O nmero de graus de liberdade dessa distribuio qui quadrado, para k > 1 e h > 1 dado por: = (h - 1)(k - 1) Quando as freqncias esperadas puderem ser calculadas, sem que se faam estimativas dos parmetros populacionais, a partir de estatsticas amostrais.

Dr Cludio S. Sartori

Bioestatstica

FATEC

= (h - 1)(k - 1) -m Quando as freqncias esperadas somente podem ser calculadas mediante a estimativa de m parmetros populacionais, a partir de estatsticas amostrais.
Exemplo 1 - Em 200 lances de uma moeda, observaram 115 caras e 85 coroas. Testar a hiptese da moeda ser honesta, adotadas os nveis de significncia: a) 0.05 b) 0.01 As freqncias observadas de caras e coroas so, respectivamente: o1 = 115 e o2 = 85. As freqncias esperadas de caras e coroas so 100 e 100 Ento:

=
2 j =1

(o

ej ) ej
2

=
j =1

(o
2

ej ) ej

=
2

2 = (

315312.75) 312.75

+(

108104.25) 104.25

+(

101104.25) 104.25

+(

3234.75) 34.75

= 0.47

a) para

2 = 3; 0 .99 = 11.3 No

se pode rejeitar a teoria no nvel de significncia 0.01. b) para


2 = 3; 0 .95 = 7.81 No

=
2 j =1

(o

ej ) ej

=
j =1
2

(o

ej ) ej

=
2 j =1

= 4.50 ej O nmero de classes k = 2. Ento: =k-1=2-1=1


j

(o

ej )

=(

115100) 100

+(

85100 ) 100

se pode rejeitar a teoria no nvel de significncia 0.05. Exemplo 3 - Numa urna h grande nmero de bolas de gude de quatro cores distintas: vermelha, laranja, amarela e verde. Uma amostra de 12 bolas, retiradas da urna ao acaso, revelou 2 vermelhas, 5 laranjas, 4 amarelas e 1 verde. Testar a hiptese da urna conter propores iguais das bolas de gude de cores diferentes. Para conter propores iguais, seria esperado 3 bolas de cada cor. Como esses nmeros esperados so menores que 5, a aproximao qui-quadrado estaria incorreta. Assim consideramos as catagorias amarela ou verde; laranja ou vermelha:

a) O valor crtico

2 0 .95

para 1 grau de

liberdade vale 3.84. Como 4.50 > 3.84, rejeitar-se- a hiptese ser honesta, no nvel de significncia 0.05 b) O valor crtico
2 0 .99

para 1 grau de

liberdade vale 6.33. Como 4.50 < 6.33, rejeitar-se- a hiptese ser honesta, no nvel de significncia 0.01.
Exemplo 2 - Nas estatsticas de Mendel realizadas com ervilhas, ele observou 315 redondas e amarelas, 108 redondas e verdes, 101 enrugadas e amarelas e 32 enrugadas e verdes. De acordo com a teoria de hereditariedade, os nmeros deveriam estar na proporo 9:3:3:1. H alguma evidncia para se duvidar de sua teoria, nos nveis de significncia:

=
2 j =1

(o
2

ej ) ej

=
j =1
2

(o

ej ) ej

2 = (

3 6 ) 6

+(

96 ) 6

=3

Para = 2 - 1 = 1
2 = 2; 0 .95 = 3.84 No se

pode rejeitar a hiptese no nvel de significncia de 0.05.


Exemplo 4 - Em 360 lances de um par de dados obtiveram-se 74 setes e 24 onzes. Adotado o nvel de significncia 0.05, testar a hiptese de o dado ser honesto. Um par de dados pode cair de 36 maneiras. Um sete pode ocorrer de seis maneiras e um onze de 2 maneiras. Ento: Pr{" 7"}=1/6 e : Pr{" 11"}=2/36=1/18 Em 360 lances esperar-se-ia: 360 (1/6) = 60 " setes" e 360 (1/18) = 20 " onzes". Assim:

a) 0.01 ? b) 0.05? O nmero total de ervilhas : 315+108+101+32 = 556. Os nmeros esperados esto na proporo 9:3:3:1 (9+3+3+1=16) (9/16)556=312.75 redondas e amarelas. (3/16)556=104.25 enrugadas e amarelas. (3/16)556=104.25 redondas e verdes. (1/16)556=34.75 enrugadas e verdes. Ento:

Dr Cludio S. Sartori

Bioestatstica

FATEC

10

=
2 j =1
2

(o

ej ) ej
2

=
= 4.07

Exerccios

2 = (
; Como

74 60 ) 60

+(

24 20 ) 20

2 = 2; 0 .95 = 3.84 rejeita-se a

hiptese no nvel de significncia de 0.05 do dado ser honesto.


Exemplo 5 - O recenseamento de 320 famlias com cinco crianas revelou a distribuio apresentada na tabela abaixo. Esse resultado compatvel com a hiptese dos nascimentos de homens e mulheres igualmente provveis?

1. Usar o teste de chi quadrado quando lanamos 5 moedas 100 vezes. A tabela mostra em cada lance o nmero de caras, a frequncia esperada e medida.
Nmero de Caras X 0 1 2 3 4 5 Pr {X}

fe 33.2 161.9 316.2 308.7 150.7 29.4

fo 38 144 342 287 164 25

Tipo

5 meninos 0 meninas 4 meninos 1 meninas 3 meninos 2 meninas 2 meninos 3 meninas 1 meninos 4 meninas 0 meninos 5 meninas Total

Nmero De famlias 18

pe(X)
5

fei

0.0332 0.1619 0.3162 0.3087 0.1507 0.0294

= 1/32

56 110 88 40 8
320

5p4 q =5/32
10p3 q2=10/32 10p2 q5=10/32

5p q4=5/32 q5=1/32

2. Dois grupos, A e B, so formados, cada um de 100 pessoas que tm a mesma enfermidade. ministrado um soro ao grupo A, mas no ao B (denominado grupo de controle), a todos os outros respeitos, os dois grupos so tratados de modo idntico. Determinou-se que 75 e 65 pessoas dos grupos A e B, respectivamente, curaram-se da enfermidade. Testar a hiptese do soro auxiliar a cura da enfermidade, mediante o teste qui quadrado, adotando o nvel de significncia: a) = 0.01 b) = 0.05 c) = 0.10 Freqncias observadas:

Seja p a probabilidade do nascimento de 1 homem. q =1 - p a de uma mulher. Dado o desenvolvimento binomial:

Curados

No curados

Total

( p + q)5 =
5

5 5i i 5 p q = p + 5 p4q +10p3q2 +10p2q3 + 5 pq4 + q5 i=0 i

Os valores esperados (freqncias esperadas) para famlias com 5,4,3,2,1 e 0 meninos so obtidos, respectivamente, multiplicando-se as probabilidade por 320: Assim:
2 =
j =1 k

Grupo A (Usando o soro) Grupo B (No usando o soro) Total

75 65 140

25 35 60

100 100 200

Freqncias esperadas:
Curados No curados Total

(o

ej ) ej

=
j =1
2

(o

ej ) ej
+(

=
2

2 = (

1810) 10

+(

5650) 50

+(

110100) 100

+(

88100) 100

4050) 50

+(

810) 10

= 12

2 2 = 6 1 = 5; 0 .95 = 11.1; 0.99 = 15.1

pode-se rejeitar a hiptese no nvel de significncia de 0.05 mas no de 0.01.

Grupo A (Usando o soro) Grupo B (No usando o soro) Total

70

30

100

70

30

100

140

60

200

10

Dr Cludio S. Sartori

Bioestatstica

FATEC

11

Na tabela esto indicadas os nmeros 3. de estudantes aprovados e reprovados por 3 instrutores:Sr. X, Sr. Y e Sr. Z . Testar a hiptese das propores dos estudantes reprovados pelos 3 instrutores serem iguais. Freqncias observadas:
Sr. X Aprovados Reprovados Total Sr. Y Sr. Z Total

criana por ano. Para verificar essa hiptese, ele pesquisou uma amostra de 20 famlias e encontrou uma mdia de R$ 620,00 e desvio padro s = R$ 30,00. Assumindo = 0.05 teste sua hiptese. 7. A mdia gasta por ano em um departamento de uma determinada loja de roupa, relativa compra de retalhos, vale R$ 30,00. O departamento quer substituir os retalhos por um novo produto e estima-se que uma amostra de 25 peas custaria uma mdia de R$ 34,25 e desvio padro s = R$5,48. Faa o teste de hiptese para a mdia utilizando a distribuio t de Student. 8. Recentes estudos mostram que para um funcionrio terminar determinado trabalho leva em mdia 160 minutos. Um novo mtodo de aprimorao aplicada em uma amostra de 11 funcionrios revelou uma mdia de 145 minutos e desvio padro 9.47 minutos. Estabelecer o teste de hiptese para a distribuio t de Student usando uma significncia de 5%. 9. Uma bateria alcalina para radio stereo FM-AM dura pelo menos 30 horas, na mdia. Consumidores suspeitaram que o tempo de durao era inferior a 30 horas, pois analisaram uma amostra de 38 baterias e obtiveram uma mdia de 29.3 horas e desvio padro de 2.95 horas. coerente a suspeita dos consumidores a 5% de significncia? 10. O proprietrio de uma clnica dentria suspeita que o tempo mdio de atendimento em uma clnica dentria ultrapassa 40 minutos. Analisando uma amostra de 18 pacientes, constatou um tempo mdio de espera de 43.50 minutos e desvio padro de 10.62 minutos. consistente a suspeita do proprietrio, a 5% de significncia? 11. Um mdico suspeita que fumantes entre 40-45 anos portadores de bronquite crnica haviam fumado na mdia por mais de 20 anos. Umas amostras de 10 pacientes deram os seguintes tempos, em anos, pelos fumantes: 22 21 19 25 24 26 23 21 23 22 Usando 1% de significncia, h suficiente evidncia para justificar a hiptese do mdico?

50 5 55

47 14 61

56 8 64

153 27 180

Freqncias esperadas:
Sr. X Aprovados Reprovados Total Sr. Y Sr. Z Total

46.75 8.25 55

51.8 5 9.15 61

54.4 9.6 64

153 27 180

4.

Para cada um dos itens abaixo, encontre: ii) t 0.01 iii)

i) t 0.005

iv) t 0.05 v) t 0.1 a) Assumindo uma distribuio t de Student com = 7 graus de liberdade. b) Assumindo uma distribuio t de Student com = 12 graus de liberdade. c) Assumindo uma distribuio t de Student com = 25 graus de liberdade. 5. Para cada item abaixo, resolva o teste de hiptese assumindo:

t 0.025

a) Que a mdia populacional > 16 e N = 14; = 0.01; x =18; s =4 b) Que a mdia populacional < 27 e N = 9; = 0.05; x =23; s =7 c) Que a mdia populacional 30 e N = 6; = 0.01; x =25; s =4 d) Que a mdia populacional > 125 e N = 40; = 0.05; x =128; s =18 e) Que a mdia populacional < 50 e N = 8; = 0.1; x =70; s =16 6. O diretor de uma universidade sabe que famlias com renda acima de R$ 3.000,00 contribuem com uma mdia de R$ 600,00 na educao de uma

11

Dr Cludio S. Sartori

Bioestatstica

FATEC

12

12