Você está na página 1de 78




          
 

 !#"%$"'&("*) + , -.$0/21$3 ! 4653 "'3 !


7 89:<; =':> 8 ?=*@ A8 BDC#=E: =%FC#=%G0HI:

LJ KNM*OQPSRTPSUTVXWDYMEWZVX[]\#U_^`VaWbM%c
dfeNghOQVi^kjmlon*V prqUTV`MEWZgQs*gtR]WZgtUuPos
vwZxw*y z {u|2z2}~wZxw*y z {u|
E_*Q`tu oSu*
TN*#m

f **0 0
*0 (

Universidade Federal de Minas Gerais


Instituto de Cincias Exatas
Departamento de Estatstica

Exerccios Resolvidos em
Introduo Bioestatstica

Edna Afonso Reis


Ilka Afonso Reis

Segunda Edio Novembro/2000

ndice Geral
Primeira Parte - Enunciado dos Exerccios

Segunda Parte - Soluo dos Exerccios

31

Referncias Bibliogrficas

77

Agradecimento
Gostaramos de agradecer ao Prof. Alosio J. F. Ribeiro, do departamento de Estatstica da
UFMG, pela reviso cuidadosa deste trabalho e pelas valiosas contribuies,
principalmente na complementao da soluo dos exerccios da seo 12.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

Primeira Parte:
Enunciado dos Exerccios

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

ndice da Primeira Parte - Enunciado dos Exerccios

Seo 1:

Tipos de Estudos e Variveis

Seo 2:

Anlise Descritiva e Exploratria de Dados

Seo 3:

Probabilidade

12

Seo 4:

Avaliao da Qualidade de Testes Clnicos

14

Seo 5:

Distribuies de Probabilidade: Binomial e Poisson

18

Seo 6:

Distribuies de Probabilidade: Normal

19

Seo 7:

Faixas de Referncia

21

Seo 8:

Intervalos de Confiana

22

Seo 9:

Conceitos Bsicos de Testes de Hipteses

23

Seo 10:

Testes de Hipteses para uma Populao

23

Seo 11:

Testes de Hipteses para Duas Populaes

24

Seo 12:

Teste Qui-Quadrado

27

Observao: Os exerccios marcados com asterisco (*) foram adaptados da apostila


Introduo Bioestatstica, de Nogueira et alli, Edio de 1997.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

Seo 1: Tipos de Estudos e Variveis


1.1)

Classifique as seguintes variveis em :


Quantitativas (Discretas ou Contnuas) ou Qualitativas (Nominais ou Ordinais).

a) A cor da pele de pessoas (ex.: branca, negra, amarela).


Varivel do tipo _______________________ e _______________________

b) O nmero de consultas mdicas feitas por ano por um associado de certo plano de sade.
Varivel do tipo _______________________ e _______________________

c) O teor de gordura, medido em gramas por 24 horas, nas fezes de crianas de 1 a 3 anos de idade.
Varivel do tipo _______________________ e _______________________

d) O tipo de droga que os participantes de certo estudo tomaram, registrados como: Droga A, Droga B e
placebo.
Varivel do tipo _______________________ e _______________________

e) A presso intra-ocular, medida em mmHg, em pessoas.


Varivel do tipo _______________________ e _______________________

f)

O nmero de filhos das pacientes participantes de certo estudo.


Varivel do tipo _______________________ e _______________________

1.2) Classifique os seguintes estudos como observacionais ou experimentais.


o

a) Viagra para os diabticos (Revista Isto n 1535 de 03/03/1999)


A famosa plula azul pode tambm ser eficaz para diabticos que tm a funo ertil comprometida. Estudos
preliminares haviam descartado a eficincia do Viagra nesses casos. Mas uma pesquisa realizada com 268
homens pela Universidade de Creighton, nos Estados Unidos, mostrou que 56% dos pacientes que tomaram
Viagra tiveram melhora contra 10% dos que ingeriram placebo (plula incua). Mas em hiptese nenhuma se
recomenda o uso do medicamento sem orientao mdica.
Estudo do tipo _________________________________

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

b) Sexo feliz (Revista Isto n 1537 de 17/03/1999)


Ter relaes sexuais trs vezes por semana rejuvenesce. Um estudo do Hospital Real de Edimburgo (Reino
Unido), feito com 3,5 mil europeus e americanos, revelou que a qualidade e a freqncia das relaes sexuais
influem diretamente na aparncia fsica. Todos os selecionados para a pesquisa afirmavam sentirem-se mais
jovens do que realmente eram. E essas pessoas faziam sexo pelo menos trs vezes por semana. "Durante o
ato sexual o organismo produz substncias qumicas como a endorfina que causam sensao de bem-estar e
melhoram a condio do corpo e da mente", explica o neuropsiclogo David Weeks, coordenador do estudo.
Estudo do tipo _________________________________
o

c) Alerta da pele (Revista Isto n 1537 de 17/03/1999)


Quem j teve cncer de pele deve redobrar os cuidados para no ser vtima de um outro tipo de tumor. Um
estudo publicado no Jornal da Associao Mdica Americana revelou que aqueles que tiveram cncer
dermatolgico esto 25% a 30% mais propensos a desenvolver um outro cncer at 12 anos depois de se
terem curado. Acredita-se que o tumor de pele aumente a suscetibilidade geral do organismo a novos
episdios da doena.
Estudo do tipo _________________________________
o

d) Gene da gordura (Revista Isto n 1537 de 17/03/1999)


Cientistas americanos anunciaram na semana passada ter descoberto em ratos o primeiro gene que suprime a
obesidade e regula a queima de calorias. Essa pode ser a chave para o desenvolvimento de uma droga para
manter as pessoas em forma. Na verdade, esse o sexto gene relacionado com a obesidade, mas, de acordo
com os pesquisadores, o primeiro que age no metabolismo e consegue gastar energia. Eles submeteram
dois grupos de ratos a testes com alimentos gordurosos. Aqueles com uma mutao nesse gene no
ganharam peso enquanto que os normais engordaram.
Estudo do tipo _________________________________
o

e) Colesterol na medida (Revista Isto n 1536 de 10/3/1999)


Nveis muito baixos de colesterol podem ser prejudiciais, afirma um estudo divulgado na semana passada, no
congresso da American Heart Association. A pesquisa comparou 714 vtimas de derrame com 3.743 pessoas
saudveis. Quem tinha colesterol acima de 280 estava duas vezes mais suscetvel a sofrer derrame isqumico
(bloqueio de vaso sangneo). Aqueles com colesterol abaixo de 180 estavam duas vezes mais propensos a
ter derrame hemorrgico. Explica-se: o colesterol ajuda na estrutura das veias e evita que elas se rompam. O
ideal mant-lo no nvel mdio (200), como recomendam os rgos de sade.
Estudo do tipo _________________________________
f) Efeito protetor da vacina BCG em crianas (Boletim OPAS 1986)
Para avaliar o efeito protetor da vacina BCG em crianas com menos de 15 anos de idade, na cidade de
Buenos Aires (Argentina), estudaram-se as crianas que receberam algum tratamento antituberculose durante
o ano de 1981, tanto internados em hospitais ou tratados na forma ambulatorial. Para cada uma destas
crianas, encontrou-se outra criana de mesma idade, sexo, condio scio-econmica e que tinha tido
alguma doena aguda, diferente da tuberculose, no mesmo perodo e que havia sido tratada no mesmo
estabelecimento. Em ambos os grupos, considerou-se como vacinados os que tinham a cicatriz
correspondente vacina BCG em uma ou ambas regies deltoidianas.
Estudo do tipo _________________________________

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

g) Torcida bastante eficaz (Revista Isto n 1581 de 19/01/2000)


O sabor de vitria tem um efeito qumico muito mais benfico para a alma do que se acreditava. A concluso
de uma equipe de pesquisadores americanos. Eles mediram o nvel de testosterona (hormnio masculino)
em torcedores de futebol e basquete e constataram um aumento de 20% do hormnio quando seus times
vencem (quando os times perdem h uma queda de 20%). Como o hormnio regula o humor, a sensao de
bem-estar e o interesse sexual, uma dose extra de testosterona vai bem.
Estudo do tipo _________________________________
h) Animais contra alergia (Revista Isto n 1569 de 27/10/1999)
Brincar na fazenda, onde vivem animais como vacas, galinhas e outros bichos, diminui as chances de a
criana desenvolver alergias. A constatao de pesquisadores austracos, que estudaram 2.283 crianas.
Aquelas que tinham contato com animais eram trs vezes menos sensveis a problemas alrgicos e
respiratrios, como a asma, do que as que vivem na zona urbana. A hiptese a de que o contato precoce
com os animais aumente a tolerncia das clulas de defesa do organismo a bactrias e caros.
Estudo do tipo _________________________________

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

Seo 2: Anlise Descritiva e Exploratria de Dados


2.1)

As Tabelas 2.1 e 2.2 mostram a Distribuio de Freqncias do nmero de erros cometidos na


traduo de um texto do ingls para o portugus por 150 estudantes da escola A e 200
estudantes da escola B, respectivamente.
Complete as tabelas, faa um histograma e uma ogiva para cada uma e compare os estudantes
das duas escolas quanto varivel nmero de erros cometidos na traduo de um texto do
ingls para o portugus.
Tabela 2.1: Nmero de erros de traduo de 150 estudantes da escola A
Ponto
Freqncia
Freqncia
Freqncia
Freqncia
Mdio
Absoluta
Relativa (%)
Absoluta
Relativa
Acumulada
Acumulada (%)
10 |- 15
5
15 |- 20
57
20 |- 25
42
25 |- 30
28
30 |- 35
17
35 |- 40
1
Total
150
o

N de
erros

Tabela 2.2: Nmero de erros de traduo de 200 estudantes da escola B


Ponto
Freqncia
Freqncia
Freqncia
Freqncia
Mdio
Absoluta
Relativa (%)
Absoluta
Relativa
Acumulada
Acumulada (%)
10 |- 15
4
15 |- 20
18
20 |- 25
43
25 |- 30
76
30 |- 35
43
35 |- 40
16
Total
200
Obs: lembre-se de que a ogiva deve ser feita com o limite superior de cada classe no eixo X.
o

N de
erros

2.2)

Num estudo sobre a associao entre tromboembolismo e tipo sangneo, participaram 200
usurias de contraceptivo oral . Dessas mulheres, 55 tinham tromboembolismo. Quanto ao
grupo sanguneo, o tipo A foi o mais numeroso, com 83 mulheres, seguido dos grupos O e B,
com 79 e 27 mulheres, respectivamente. Das pacientes sadias, 70 eram do grupo O, 51 do grupo
A e 19 do grupo B.
a) A partir dessas informaes, preencha a Tabela 2.3 abaixo (Dica: comece encontrando os
totais de linha e coluna)
b) Utilizando a tabela preenchida no item a), compare os dois grupos de mulheres (sadias e
doentes) de forma grfica e/ou numrica.

Grupo
Sangneo

Tabela 2.3
Tromboembolismo
Doente

Sadia

A
B
AB
O
Total
2.3)

Total

200

*Analisando os histogramas apresentados a seguir, comente sobre a distribuio da presso


ocular e do nvel de cido rico srico.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

Figura 2.1

35

Frequncia (%)

30
25
20
15
10
5
0
8

12

16

20

24

28

32

36

40

44

48

7.7

8.3

8.9

Presso Ocular (mmHg)

Frequncia (%)

30

20

10

0
2.9

3.5

4.1

4.7

5.3

5.9

6.5

7.1

cido rico Srico (mg/100ml)

2.4)

*Utilizando a ogiva apresentada a seguir (Figura 2.2), estime a mediana, o primeiro e o terceiro
quartis e o percentil de ordem 95. Interprete estes valores

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

Ogiva para dados de Presso Intraocular


100
Frequncia Acumulada (%)

90
80
70
60
50
40
30
20
10
0
5

10

15

20

25

30

35

40

45

Presso Intraocular (mmHg)

Figura 2.2
2.5)

*O tempo (em meses) entre a remisso de uma doena e a recidiva de 48 pacientes de uma
determinada clnica mdica foi registrado. Os dados ordenados so apresentados a seguir, para
homens e mulheres

Homens:

2 2 3 4 4 4 4 7 7 7 8 9 9 10 12

15 15 15

16

18

18

22 22 24

Mulheres:

2 2 3 3 4 4 5 5 6 6 7 7 7 7 8 8 8 8 10 10 11 11 12 18

a) Construa o diagrama de pontos para cada sexo e comente-os.


b) Construa um ramo-e-folhas para cada sexo usando 10 meses como escala e outro usando 5 meses
c) Calcule a mdia, o desvio padro, a mediana e o coeficiente de variao para cada sexo. Comente essas
estatsticas descritivas, comparando os grupos.
d) Repita os clculos pedidos em (c) para todos os 48 pacientes, sem distino de sexo. Compare com os
resultados em (c)
2.6)

*A mdia do nvel de colesterol de um grupo de jovens recrutas 205 mg/dl e o desvio padro
22 mg/dl. Para um grupo de oficiais, entretanto, a mdia obtida foi 244 mg/dl e o desvio padro
45 mg/dl. Compare os dois grupos quanto homogeneidade da varivel nvel de colesterol.

2.7)

Considere as alturas dos cascos de uma amostra de 48 tartarugas pintadas (24 machos e 24
fmeas).
Machos
Fmeas

35
40
38
51

35
41
38
51

35
41
42
53

37
41
42
55

37
42
44
56

38
43
46
57

38
44
48
60

39
45
49
61

39
45
50
62

40
45
51
63

40
46
51
63

40
47
51
67

a) Complete a tabela de estatsticas descritivas para a varivel altura de casco , segundo o sexo da
tartaruga.
Grupo

Mdia

Macho
Fmea

40,54
52,04

Desvio
padro
3,54
8,05

Coeficiente de
Variao

Mediana

Primeiro
Quartil

Terceiro
Quartil

b) Construa um box-plot para as medidas de altura de casco de cada grupo (Utilize a mesma escala nos
dois grficos para que eles sejam comparveis).
c) Usando os resultados do item (a) e os box-plots em (b), compare os dois grupos de tartaruga pintada
quanto a varivel altura do casco.
10
Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

2.8)

*Como resultado de um programa de fortificao isomtrica desenvolvido em 10 semanas,


alunos da oitava srie foram avaliados em duas ocasies, antes e aps o programa, quanto a
sua habilidade em executar abdominais em dois minutos.
Os dados so apresentados a
tabela a seguir. Quanto maior o escore, maior a habilidade do aluno em executar abdominais
de dois minutos.
Analise graficamente a efetividade ou no do programa isomtrico no aumento da habilidade em
executar abdominais nestes alunos. (Use o grfico de disperso Antes X Depois [grfico XY] e
desenhe a reta x=y).

No do
aluno
1
2
3
4
5
6
7
8
9
10

Tabela 2.4
Escores de abdominais
Antes
12
10
23
25
29
32
14
17
19
20

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

Depois
15
9
25
25
31
30
16
20
22
22

11

Seo 3: Probabilidade
3.1)

Considere um baralho com 52 cartas numeradas, 13 para cada um dos naipes (ouros, copas,
espada e paus). Seja o experimento de retirar uma carta aleatoriamente, observando seu naipe,
nmero e/ou cor (vermelha ou preta).
Sejam os seguintes eventos:
A = [a carta retirada um s];
V = [a carta retirada vermelha] e
E = [a carta retirada de espada].
Calcule:

a) P(A), P(V) e P(E).


b) P(A V), P(A E) e P(V E).
c) P(A V), P(A E) e P(V E).
d) P(A|V) . Os eventos A e V so independentes ?
e) P(V|E). Os eventos V e E so independentes ?
f)

Suponha que voc retire do baralho, aleatoriamente, duas cartas do seguinte modo: retira uma, observa
seu naipe, nmero e cor, e a coloca de volta. Em seguida, retira a segunda carta, observa seu naipe,
nmero e cor, e a coloca de volta. Sejam os eventos:
A1 = [a primeira carta retirada um s] e A2 = [a segunda carta retirada um s].

f.1) Sem fazer clculos, voc acha que os eventos A1 e A2 so independentes ? Ou seja, voc acha que o
fato da primeira carta retirada ter sido um s altera a probabilidade de que a segunda carta seja um s ?
Ento, qual o valor de P(A2|A1) ?
f.2) Qual a probabilidade das duas cartas retiradas serem um s ? Ou seja, calcule P(A1 A2).

3.2)

* bem conhecido que o daltonismo hereditrio. Devido ao fato do gene responsvel ser
ligado ao sexo, o daltonismo ocorre mais freqentemente nos homens do que nas mulheres. As
10.000 pessoas de uma amostra aleatria de uma populao foram classificadas de acordo com
seu sexo e se sofrem ou no de daltonismo da cor vermelha-verde. Os resultados so
mostrados na Tabela 3.1.

Daltonismo
Presente
Ausente
Total

Notao:

Sexo Masculino: M
Sexo Feminino: F

Tabela 3.1
Sexo
Masculino
423
4848

Total

Feminino
65
4664
10.000

Daltonismo Presente: D
Daltonismo Ausente: D

I) Complete a Tabela 3.1.


II) Uma pessoa escolhida ao acaso desta populao. Estime a probabilidade desta pessoa ser:

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

12

a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)

Daltnica
No daltnica
Do sexo masculino
Do sexo feminino
Daltnica e do sexo masculino
Daltnica e do sexo feminino
No daltnica e do sexo masculino
No daltnica e do sexo feminino
Daltnica dado que do sexo masculino
Daltnica dado que do sexo feminino
No daltnica dado que do sexo masculino
No daltnica dado que do sexo feminino

III) Os eventos ser daltnica e ser do sexo masculino so independentes ?

3.3)

A deteco precoce do cncer cervical crucial para o tratamento e cura da paciente. As 600
mulheres de amostra aleatria foram classificadas em um de dois grupos: com cncer ou
sem cncer atravs de bipsia cervical (Tabela 3.2).
Outro teste que pode ser usado no diagnstico do cncer cervical o papanicolau, mais barato
e mais rpido que a bipsia cervical. Para avaliar a qualidade de diagnstico do papanicolau, as
600 mulheres mencionadas anteriormente foram submetidas a este teste.
Os resultados do teste papanicolau so mostrados na Tabela 3.2 (Positivo indica que o teste
classifica a paciente como portadora do cncer; negativo, caso contrrio).
Assuma que o resultado da bipsia cervical certo.

Situao
da paciente
Com cncer
Sem cncer
Total

Tabela 3.2
Resultado do Papanicolau
Positivo
94
250
344

Negativo
6
250
256

Total
100
500
600

a) Estime a proporo de mulheres que tm cncer cervical na populao de onde foi retirada esta amostra
(ou seja, a prevalncia do cncer na populao).
b) Para quantas pacientes o teste papanicolau acertou o diagnstico ?
c) Para quantas pacientes o teste papanicolau errou o diagnstico ?
d) Qual a probabilidade do teste papanicolau ter resultado positivo dentre as pacientes que realmente tm
cncer ? (Esta probabilidade chamada sensibilidade do teste)
e) Qual a probabilidade do teste papanicolau ter resultado negativo dentre as pacientes que no tm cncer
? (Esta probabilidade chamada especificidade do teste)
f)

Qual a probabilidade de uma paciente realmente ter cncer dentre aquelas com resultado positivo no
teste papanicolau? (Esta probabilidade chamada valor de predio positiva do teste)

g) Qual a probabilidade de uma paciente realmente no ter cncer dentre aquelas com resultado negativo
no teste papanicolau? (Esta probabilidade chamada valor de predio negativa do teste)
h) Qual a probabilidade de uma paciente realmente no ter cncer dentre aquelas com resultado positivo
no teste papanicolau? (Esta a proporo de falsos positivos do teste)
i) Qual a probabilidade de uma paciente realmente ter cncer dentre aquelas com resultado negativo no
teste papanicolau? (Esta a proporo de falsos negativos do teste)

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

13

Seo 4: Avaliao da Qualidade de Testes Clnicos


4.1)

No contexto da avaliao da qualidade de um teste clnico, associe as definies a seguir com:


sensibilidade, especificidade, valor de predio positiva, valor de predio negativa, proporo
de falsos positivos ou proporo de falsos negativos.

a) A probabilidade de um paciente com resultado positivo no estar doente.


Definio de: __________________________________________

b) A probabilidade do paciente no estar doente dado que seu resultado no teste foi negativo.
Definio de: __________________________________________

c) A probabilidade do resultado do teste ser negativo dentre os pacientes realmente no doentes.


Definio de: __________________________________________

d) A probabilidade do paciente realmente estar doente dado que seu resultado no teste foi positivo.
Definio de: __________________________________________

e) A probabilidade de um paciente com resultado negativo estar doente.


Definio de: __________________________________________

f)

A probabilidade do resultado do teste ser positivo dentre os pacientes realmente doentes.


Definio de: __________________________________________

4.2)

Um dos testes utilizados para detectar a doena de Aujelski em sunos, tambm conhecida
como pseudo-raiva, o teste ELISA. Na tabela abaixo so apresentados os resultados deste
teste para 52 sunos portadores da doena e 238 no portadores da doena.
Tabela 4.1
Teste ELISA

Doena de Aujelski

Doente

Total

No doente D

(D)
Positivo (+)
Negativo (- )
Total

51
1

6
232

57
233

52

238

290

a) Calcule a sensibilidade e a especificidade do teste.


b) Se a prevalncia dessa doena (na populao) de 17,9%, voc pode calcular o VPP e o VPN
diretamente da tabela ? Por que ? Calcule estes ndices.
c) Suponha que a prevalncia da doena seja bem menor que 17,9%. Sabendo que o tratamento da
pseudo-raiva relativamente caro, qual atitude deveria ser tomada para um suno que apresentasse
resultado positivo no teste ELISA ?
Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

14

4.3)

*A creatinina fosfacinase (CFC) um marcador para o diagnstico de infarto agudo do


miocrdio. Pacientes com infarto agudo do miocrdio apresentam valores elevados de CFC. A
tabela a seguir apresenta os valores de CFC para 360 pacientes de um hospital do corao,
sendo 230 com infarto agudo do miocrdio. Considere que a prevalncia de infarto agudo do
miocrdio em hospitais do corao seja igual a desse estudo.

Tabela 4.2
Valores de CFC

Infarto agudo
do miocrdio
Doente

(D)

No doente (D )
Total

Total

CFC < 80

80 CFC < 280

CFC 280

15
114

118
15

97
1

230
130

129

133

98

360

Sejam dois testes de diagnstico de infarto agudo do miocrdio baseados no valor de CFC do
paciente:
Teste 1: O resultado positivo se os valores de CFC so 80 e negativo caso contrrio;
Teste 2: O resultado positivo se os valores de CFC so 280 e negativo caso contrrio.
a) Calcule a sensibilidade e a especificidade do Teste 1 e do Teste 2. Comente.
b) Calcule o VPP, VPN, PFP e PFN do Teste 1 e do Teste 2. Comente.

4.4)

Sabe-se que o Valor de Predio Positiva (VPP) e o Valor de Predio Negativa (VPN) de um
teste clnico de diagnstico de uma doena depende da Prevalncia (p) da doena na
populao, da Sensibilidade (s) e da Especificidade (e) do teste.
Estas relaes podem ser expressas atravs das equaes:

VPP =

sp
sp + (1 e)(1 p)

VPN =
e

e(1 p)
e(1 p) + (1 s) p

A Figura 4.1 mostra a relao entre VPP e Especificidade e entre VPN e Especificidade para
vrios valores de Sensibilidade, mantendo-se p=0,05. Analogamente, estas mesmas relaes
so mostradas Figura 4.2, com p=0,5.
a) Considere as figuras 4.1(a) e 4.2(a). Para um valor fixo de prevalncia e sensibilidade, o que acontece
com o VPP medida que a especificidade aumenta ?

b) Considere as figuras 4.1(b) e 4.2(b). Para um valor fixo de prevalncia e sensibilidade, o que acontece
com o VPN medida que a especificidade aumenta ?

c) Considere a Figura 4.2(a), onde a prevalncia est fixada em p=0,5.


i. Para um valor fixo de sensibilidade, qual , aproximadamente, o aumento que se tem no VPP quando
se passa de e=0,7 para e=0,95 ?

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

15

ii. Para um valor fixo de especificidade, qual , aproximadamente, o aumento que se tem no VPP
quando se passa de s=0,7 para s=0,95 ?
iii. O teste ser poderoso para confirmar a presena da doena se ele tiver PFP grande ou pequena?

iv. Suponha que se queria que o teste seja poderoso para confirmar a presena da doena em uma
populao com p=0,5. Baseado na sua resposta em (iii) e comparando suas respostas em (i) e (ii), voc
acha melhor trabalhar para aumentar a sensibilidade ou a especificidade do teste ?
d) Considere a Figura 4.1(b), onde a prevalncia est fixa em p=0,05
i. Para um valor fixo de sensibilidade, qual , aproximadamente, o aumento que se tem no VPN quando
se passa de e=0,7 para e=0,95 ?
ii. Para um valor fixo de especificidade, qual , aproximadamente, o aumento que se tem no VPN
quando se passa de s=0,7 para s=0,95 ?
iii. O teste ser poderoso para descartar a presena da doena se ele tiver PFN grande ou
pequena?
iv. Suponha que se queira que o teste seja poderoso para descartar a presena da doena em uma
populao com p=0,05. Baseado na sua resposta em (iii) e comparando suas respostas em (i) e (ii), voc
acha melhor trabalhar para aumentar a sensibilidade ou a especificidade do teste ?

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

16

Figura 4.1
(b)

(a)
Prevalncia = 0,05
0,6

Prevalncia = 0,05
1

0,5
0,4

0,99
s= 0.7

VPP 0,3

s = 0.8

VPN 0,98

s = 0.9

0,2

s = 0.95
0,97

0,1
0
0,7

0,8

0,9

0,95

0,96
0,70

Especificidade

0,80

0,90

0,95

Especificidade

Figura 4.2
(b)

(a)
Prevalncia = 0,5
1

Prevalncia = 0,5
1

0,9
0,9
s= 0.7

VPP 0,8

s = 0.8

VPN 0,8

s = 0.9

0,7

s = 0.95
0,7

0,6

0,6

0,7

0,8

0,9

0,95

0,7

Especificidade

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

0,8

0,9

0,95

Especificidade

17

Seo 5: Distribuies de Probabilidade: Binomial e Poisson


5.1)

*Em uma determinada populao, a probabilidade de um indivduo ter sangue Rh negativo de


0,10. Qual a probabilidade de 4 indivduos dessa populao que se apresentarem para o
exame de sangue serem todos Rh negativo ?

5.2)

5.3)

*Suponha que o nmero de unidades vendidas de um medicamento por dia numa rede de
drogarias tenha uma distribuio de Poisson com mdia 3 (
= 3).

A probabilidade de que um casal com olhos azuis escuros tenha filhos com olhos azuis de
. Se esse casal tiver 3 filhos, qual a probabilidade de que pelo menos 2 tenham olhos azuis?

a) Construa o grfico para a distribuio de probabilidade do nmero de unidades vendidas desse


medicamento por dia (use a tabela de Poisson).
b) Calcule a probabilidade de que sejam vendidas entre 7 e 11 unidades por dia.
c) Qual distribuio do nmero de unidades vendidas desse medicamento por semana ?
d) Qual a probabilidade de que 100 unidades desses medicamento sejam vendidas em uma semana ?

5.4)

5.5)

Em uma certa populao, a probabilidade de um menino ser daltnico 0,08. Num grupo de 4
meninos vindos dessa populao, qual a probabilidade de 3 no serem daltnicos ?

A probabilidade de um animal sobreviver durante um experimento cirrgico 2/3.


Seja X o nmero de animais que sobrevivem quando 5 animais so submetidos cirurgia.

a) Determine a distribuio de probabilidade de X.


b) Determine a probabilidade de :
i. Exatamente 3 animais sobreviverem
ii. No mnimo 1 animal sobreviver
iii. Mais de 2 animais no sobreviverem
c) Se 60 animais se submeterem a essa cirurgia, espera-se que, em mdia, quantos no sobrevivam?

5.6)

Um produtor de sementes vende pacotes com 10 sementes cada. Os pacotes que apresentam
mais de quatro sementes sem germinar sero indenizados. A probabilidade de uma semente
germinar 0,8.

a) Qual a probabilidade de um pacote ser indenizado ?


b) Se o produtor vende 1000 pacotes, qual o nmero esperado de pacotes indenizados ?

5.7)

Suponha que o nmero mdio de colnias de bactrias por 10 ml de gua de um lago seja 3.

a) Qual a probabilidade de no se achar nenhuma colnia em 10 ml de gua desse lago ?


b) Qual a probabilidade de se achar pelo menos duas colnias em 10 ml de gua desse lago ?
c) Qual a probabilidade de que 5 ou mais colnias sejam achadas em uma amostra de 30 ml de gua desse
lago ?

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

18

Seo 6: Distribuies de Probabilidade: Normal


6.1)

Suponha que a quantidade de ferro srico de indivduos sadios de uma populao (varivel X)
tenha distribuio Normal com parmetros = 100 mcg/dl e = 25 mcg/ dl.

a) Qual o valor da quantidade mdia de ferro srico em indivduos desta populao ?


E qual o valor do desvio padro da quantidade de ferro srico nesta populao ?
b) Faa um esboo da curva normal X definida no enunciado, representando os intervalos simtricos em
torno da mdia correspondentes s probabilidades 0,683, 0,954 e 0,997 ( ; 2; 3).
c) Como a equao da varivel normal padro Z neste caso ?
d) Complete o quadro a seguir:
Um valor de X
igual a ...
25

Corresponde a
Z igual a ...

P(X x ) =

Um valor de X
igual a ...

Corresponde a
Z igual a ...
3

P(X x ) =

-2

0,022750
0,158655

125

59

1,64
-1,28

0,100273
0,248252

117

90

0,4

Obs: Use duas casas decimais para Z, nenhuma para X e seis para P(X x ) e P(X x )
i. Qual a probabilidade de X assumir um valor entre 68 e 110 mcg/dl ?
Se tomarmos uma amostra aleatria de 500 indivduos sadios desta populao, quantos
indivduos podemos esperar que tenham quantidade de ferro srio entre 68 e 110 mcg/dl ?
ii. Qual o intervalo [x1;x2] simtrico em torno da mdia, que contm 50% dos valores de X ?
iii. Qual o intervalo [x3;x4] simtrico em torno da mdia, que contm 95% dos valores de X ?
6.2)

*Suponha que a concentrao srica de tiroxina T4(D) em ces machos sadios tenha
distribuio Normal com mdia 2,04 mcg/100ml e desvio padro 0,78 mcg/100ml.

a) Determine a probabilidade de um co macho sadio apresentar concentrao srica de tiroxina:


i
ii
iii

Inferior a 2,81 mcg/100ml


Superior a 1,8 mcg/100ml
Entre 1,01 e 2,50 mcg/100ml

b) Se considerarmos 200 desses ces, quantos se poderia esperar que tivessem uma concentrao srica
entre 2,20 e 3,80 mcg/100ml ?
c) Qual intervalo de valores, simtrico em torno da mdia, abrange 98% dos ces sadios ?
6.3) 1Os prazos de durao de gravidez tm distribuio Gaussiana com mdia de 268 dias e
desvio-padro de 15 dias. Definindo como prematura uma criana que nascer com menos de
247 dias de gestao, responda :

Exerccio adaptado de Triola, M. F. (1999) - Introduo Estatstica - 7a Edio - LTC


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

19

a) Qual a porcentagem de crianas nascidas prematuramente?


b) Se desejssemos mudar a definio de uma criana prematura como sendo aquela cujo o perodo de
gestao est entre os 4% menores, qual seria o tempo mnimo de gestao para que uma criana no
fosse considerada prematura?

6.4)

Os escores de Q.I. tm distribuio Gaussiana com mdia 100 pontos e desvio-padro 15


pontos. Uma organizao s admite pessoas de Q.I. elevado, para ela, maiores do que 131,5 .
Com base nessas informaes, responda:

a) Escolhida uma pessoa aleatoriamente, qual a probabilidade de que ela seja admita por essa
organizao?
b) Definindo como gnio uma pessoa que tenha seu escore de Q.I. situado entre os 1% mais altos, qual
seria o valor para o escore de Q.I. que separaria os gnios das pessoas comuns?

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

20

Seo 7: Faixas de Referncia


7.1)

*Um pesquisador deseja criar um padro para identificao de infeco bacteriana


(pseudomonas sp) no trato respiratrio, atravs de cultura de escarro. Para isto, coletou dados
de pessoas sabidamente sadias e determinou o nmero de colnias encontradas em cada
cultura de escarro. Os resultados foram os seguintes:

17 22 23 23 23 23 24 24 24 24 24 24 25 25 25 25 25 25 25 26 28 28
29 30 30 31 31 35 35 35 36 40 41 41 41 42 51 54 56 56 58 60 68 79
(n = 44 pessoas;

x = 34,3 colnias por cultura de escarro; s =14,2 colnias por cultura de escarro)

a) Verifique a suposio de normalidade deste dados.


b) Determine uma faixa de normalidade de 95% para o nmero de colnias de bactrias no trato
respiratrio de pessoas sadias, usando:
i. Mtodo dos Percentis
ii. Mtodo da Curva de Gauss
c) Qual dos dois mtodos o mais indicado nesse caso ? Justifique.

7.2)

Um dos parmetros hematolgicos de uso rotineiro na clnica mdica para diagnstico da


anemia o valor de hemoglobina. A figura abaixo apresenta a ogiva de propores acumuladas
para 1000 mulheres sadias de uma amostra, na qual o valor mdio de hemoglobina foi de 14 g/dl
e o desvio padro de 2 g/dl.

a) Construa uma Faixa de Referncia de 80% para o valor de hemoglobina em mulheres sadias usando o
Mtodo dos Percentis. Interprete o resultado obtido.
b) A partir da interpretao da faixa de referncia calculada em a), responda:
b.1) qual seria a especificidade de um mtodo de diagnstico de anemia baseado nessa faixa
de referncia?
b.2) qual seria a sensibilidade?

Figura 7.1Ogiva de propores acumuladas para hemoglobina (g/dl)


em uma amostra de 1000 mulheres sadias

1,0

Proporo Acumulada

0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
10

15

20

Hemoglobina (g/dl)

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

21

Seo 8: Intervalos de Confiana


8.1)

Num estudo para descrever o perfil dos pacientes adultos atendidos no ambulatrio de um
posto de sade, uma amostra de 70 pacientes adultos foi selecionada ao acaso entre o total de
pacientes atendidos no posto durante os ltimos trs anos, coletando-se dos pronturios
desses pacientes dados relativos idade, escolaridade e a outros fatores de interesse.
Para a varivel idade, observou-se uma mdia amostral de 36,86 anos com um desvio padro
amostral de 17,79 anos. Para a varivel escolaridade, observou-se que 19 pacientes da amostra
eram analfabetos.

a) Defina a populao e a amostra.


b) Fornea uma estimativa pontual, um intervalo de 90% de confiana e um intervalo de 95% de confiana
para a idade mdia dos adultos atendidos neste ambulatrio nos ltimos trs anos. Interprete e compare
os intervalos de confiana.
c) Fornea uma estimativa pontual, um intervalo de 90% de confiana e um intervalo de 95% de confiana
para proporo de analfabetos dentre os adultos atendidos neste ambulatrio nos ltimos trs anos.
Interprete e compare os intervalos de confiana.

8.2)

A produo de leite na primeira lactao foi medida em 20 vacas selecionadas aleatoriamente


dentre as vacas de uma fazenda. A produo mdia nesta amostra de 1500 litros e o desvio
padro de 300 litros. Construa e interprete um intervalo de 98% de confiana para a produo
mdia de leite na primeira lactao das vacas dessa fazenda.

8.3)

Considere o Intervalo de 100(1-


)% Confiana para a mdia (
) de uma varivel com distribuio
Normal e desvio-padro (
) conhecido :


IC 100(1 )% x z / 2
; x + z / 2
.
n
n

Note que o intervalo simtrico em torno da mdia amostral x e que, quanto menor a parcela

z / 2 n , menor ser a amplitude do intervalo.


a) Por que um intervalo com grande amplitude no til para o pesquisador fazer inferncia sobre a mdia
da varivel estudada ?
b) Mantendo fixos o tamanho de amostra (n) e o desvio-padro (), o que aconteceria com esta parcela se
reduzirmos o nvel de confiana (100(1-)) requerido para o intervalo ?
c) Mantendo fixos o tamanho de amostra (n) e o nvel de confiana (100(1-)) requerido para o intervalo, o
que aconteceria com esta parcela se o desvio-padro () fosse menor ?
d) Mantendo fixos o desvio-padro () e o nvel de confiana (100(1-)) requerido para o intervalo, o que
aconteceria com esta parcela se o tamanho de amostra (n) fosse maior ?
e) Qual(is) dos trs elementos que compem esta parcela (n, e ), o pesquisador capaz de alterar para
conseguir um intervalo mais curto para a mdia da varivel estudada ?
f)

Caso o pesquisador queira um intervalo curto e com nvel de confiana alto (ex. 98%, 99%), o que ele
deveria fazer ?

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

22

Seo 9: Conceitos Bsicos de Testes de Hipteses


Para cada uma das situaes abaixo, identifique:
a) O parmetro que est sendo testado (mdia ou proporo);
b) As hipteses nula e alternativa;
c) Os erros Tipo I e Tipo II.
Situao 1 - Um mtodo padro para identificao de bactrias em hemoculturas vem sendo utilizado h
muitos anos e seu tempo mdio de execuo (desde a etapa de preparo das amostras at a identificao
do gnero e espcie) de 40,5 horas. Um microbiologista props uma nova tcnica que ele afirma ter
menor tempo de execuo que o mtodo padro. A nova tcnica foi aplicada em uma amostra de 18
hemoculturas e para cada uma mediu-se o tempo de execuo. A mdia amostral foi 39,42 horas e o
desvio padro amostral foi 1,96 horas.
Situao 2 - Estudos sobre mortalidade de homens com idade superior a 65 anos de uma cidade mostram
que 4% deles morrem dentro de um ano. Num grupo de 1000 indivduos selecionados dessa populao,
60 morreram no perodo de um ano. Suspeita-se de que houve um aumento da mortalidade anual nessa
populao.
Situao 3 - Um restaurante compra frangos abatidos inteiros com peso mdio de 3 quilos h vrios anos de
um fornecedor. Outro fornecedor prope ao gerente do restaurante vender frangos com peso mdio maior
que 3 quilos ao mesmo preo do fornecedor antigo. Antes de mudar de fornecedor, o gerente do
restaurante decidiu comprar 25 frangos do novo fornecedor e pes-los. Encontrou um peso mdio de 3,2
quilos com um desvio padro de 0,4 quilos.
Situao 4 - Uma indstria farmacutica especifica que em certo analgsico a quantidade mdia de cido
acetil saliclico deve ser 5,5 gramas por comprimido. A indstria suspeita que houve problemas na
produo de um determinado lote e que, nesse lote, a quantidade mdia dessa substncia est diferente
da especificada. Para verificar essa suspeita, a indstria selecionou uma amostra aleatria de 40
comprimidos desse lote, observando uma quantidade mdia de cido acetil saliclico igual a 5,2 gramas e
um desvio padro de 0,7 gramas.
Situao 5 - Um vendedor de sementes de milho garantiu a um agricultor que a proporo de sementes de
sua marca que realmente chegam a germinar 95%. O agricultor desconfia que na verdade esta
proporo menor do que a anunciada pelo vendedor. Antes de efetuar uma grande compra, o agricultor
comprou um pacote com 1000 sementes e plantou, observando mais tarde que 940 sementes
germinaram.

Seo 10: Testes de Hipteses para Uma Populao


10.1) Para cada uma das situaes descritas na Seo 9, responda as questes abaixo, utilizando:
a)
Mtodo Tradicional de Teste de Hipteses ;
b)
Mtodo do Valor P;
c)
Mtodo do Intervalo de Confiana, quando for adequado.
Utilize um nvel de significncia =0,05.
Situao 1 - A nova tcnica reduz o tempo para identificao de bactrias ?
Situao 2 - Existe evidncia de que houve um aumento da mortalidade anual nesta populao ?
Situao 3 - A afirmao do novo fornecedor confirmada pelos dados coletados pelo gerente ?
Situao 4 - Os dados confirmam a suspeita da indstria ?
Situao 5 - O resultado do experimento do agricultor confirma sua desconfiana ?

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

23

Seo 11: Testes de Hipteses para Duas Populaes


11.1) Como resultado de um programa de fortificao isomtrica desenvolvido em 10 semanas,
alunos da oitava srie foram avaliados em duas ocasies, antes e aps o programa, quanto a
sua habilidade em executar abdominais em dois minutos. Os dados so apresentados a tabela
abaixo. Quanto maior o escore, maior a habilidade do aluno em executar abdominais de dois
minutos.

No do
aluno
1
2
3
4
5
6
7
8
9
10

Tabela 11.1
Escores de abdominais
Antes
12
10
23
25
29
32
14
17
19
20

Depois
15
9
25
25
31
30
16
20
22
22

a) Faa um teste de hipteses (ao nvel de significncia = 5%) para verificar se o programa de fortificao
isomtrica aumenta a habilidade em executar abdominais em dois minutos.
(Dica: tome a diferena de depois-antes e teste se depois > antes )
b) Calcule o valor p do teste de hipteses acima. Como voc chegaria concluso do teste do item (a)
usando a informao do valor p ?
c) Construa e interprete um Intervalo de 95% de Confiana para a diferena entre a habilidade mdia depois
do programa e a habilidade mdia antes do programa.

11.2) *Em um experimento, dois grupos de ratos fmeas foram alimentados com dietas apresentando
alto e baixo contedo de protena. O quadro abaixo fornece, para cada rato, o ganho de peso,
o
o
em gramas, entre o 28 e o 84 dia de vida.

Contedo de
protena
Alto
Baixo

Ganho de peso
123 134 146 104 119 124 161 107 83 113 129 97
70 118 101 85 107 132 94

a) Ao nvel de significncia de 1%, h evidncia estatstica de que a dieta com alto contedo de protena
aumenta o ganho de peso?
b) Calcule o valor P e use-o para responder pergunta do item (a).
c) Construa e interprete um intervalo de 95% de confiana para a diferena entre os ganhos mdios de peso
com as dietas de alto e baixo contedo de protena.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

24

11.3) *Em um estudo sobre a influncia do uso de cocana no peso de crianas nascidas de mes
dependentes, pesquisadores trabalharam com dois grupos de crianas nascidas a termo: o
primeiro grupo era composto de mes que usaram regularmente a droga durante toda a
gravidez (Grupo I) e o segundo, de mes que no tinham histria ou evidncia de uso de
cocana (Grupo II). A hiptese dos pesquisadores era de que o peso mdio de crianas de mes
dependentes menor do que o peso mdio de crianas de mes no-dependentes. Os
resultados so apresentados abaixo:.

Grupo
I
II

Tamanho da amostra
36
39

Peso mdio (g)


2829
3436

Desvio padro (g)


708
628

Fonte: Chanoff, I. J. et al. (1989) Temporal patterns of cocaine


use in pregnancy - perinatal outcome, JAMA, maro.

a) Usando um nvel de significncia igual a 5%, teste a hiptese dos pesquisadores. (Para isso, estabeleas
as hipteses nula e alternativa adequadas, construa a regio de rejeio, calcule o valor da estatstica de
teste e conclua).
b) Calcule o Valor P do teste. Use o Valor P obtido para responder questo formulada no enunciado do
problema, com nvel de significncia de 1%.

11.4) *Em um estudo publicado no Canadian Medical Association Journal em novembro de 1972,
procurou-se investigar o efeito do uso da vitamina C na preveno de resfriados. Para isso,
realizou-se o seguinte experimento: por um determinado perodo de tempo, 407 indivduos
tomaram fortes doses de vitamina C e 411 receberam placebo. No grupo da vitamina, 105
participantes ficaram livres de doenas do trato respiratrio, enquanto, no grupo placebo, esse
nmero foi de apenas 76 participantes. O que os pesquisadores puderam concluir? (Use =
0,05 e calcule o Valor P)

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

25

11.5) Em um estudo para determinar se o tratamento com estrognio e progestina altera o risco de
eventos de doena coronariana (DC) em mulheres na ps-menopausa com doena coronariana
estabelecida, um total de 2.763 destas mulheres foram divididas aleatoriamente em dois
grupos: 1.380 fizeram uso desses hormnios e o restante fez uso de um placebo.
A Figura 11.1 mostra os resultados publicados na edio brasileira do Journal of American
Medical Association em setembro de 1999. Para cada desfecho considerado nas linhas da
tabela, corresponde, na ltima coluna, o Valor P do teste:
H0: O desfecho no est associado ao uso dos hormnios;
H1: O desfecho est associado ao uso dos hormnios.
Analisando o Valor P, quais os desfechos podem ser considerados associados ao uso de
reposio hormonal, ao nvel de significncia de 5% ?

Figura 11.1

Fonte: JAMABrasil, set 1999, v.3, n. 8

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

26

Seo 12: Teste Qui-Quadrado


12.1) Desejando-se verificar se duas vacinas contra brucelose (uma padro e um nova) so
igualmente eficazes, pesquisadores realizaram o seguinte experimento: um grupo de 14
bezerras tomou a vacina padro e outro grupo de 16 bezerras tomou a vacina nova.
Considerando que os dois grupos estavam igualmente expostos ao risco de contrair a doena,
aps algum tempo, verificou-se quantos animais, em cada grupo, havia contrado a doena. Os
resultados esto na Tabela 12.1.

Vacina
Padro
Nova
Total

Tabela 12.1
Brucelose
Sim
10
5
15

Total

No
4
11
15

14
16
30

Existe diferena estatisticamente significativa entre as propores de bezerras que contraram brucelose
usando a nova vacina e a vacina padro? (Use o teste Qui-Quadrado, com nvel de significncia de 5%, e
calcule o valor P).

12.2) *Com o objetivo de examinar a existncia do efeito de determinado fertilizante na incidncia da


Bacterium phithotherum em plantao de batatas, foi realizado o seguinte experimento: ps de
batata tratados com diferentes fertilizantes foram classificados, ao final do estudo, como
contaminados ou livres de contaminao. Os resultados esto na Tabela 12.2.

Fertilizante
Nenhum
Nitrognio
Esterco
Nitrognio e Esterco
Total

Tabela 12.2
Contaminao
Sim
16
10
4
14
44

No
85
85
109
127
406

Total
101
95
113
141
450

Existe efeito de fertilizante na incidncia desse tipo de bactria nas plantaes de batata? (Use o teste QuiQuadrado, com nvel de significncia de 5%, e calcule o valor P).

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

27

12.3) Pesquisadores de doenas parasitrias em animais de grande porte suspeitam que a incidncia
de certos parasitas esteja associada raa do animal, pura ou no-pura. Num estudo para
verificar essa suspeita, 1200 animais selecionados aleatoriamente de uma grande fazenda
foram classificados segundo sua raa e incidncia de parasitose (berne), dando origem aos
dados na Tabela 12.3.

Raa
Pura
No-pura
Total

Tabela 12.3
Incidncia de parasitas
Sim
105
50
155

No
595
450
1045

Total
700
500
1200

Existem evidncias estatsticas suficientes nesses dados para verificar a hiptese de que a raa do animal e a
incidncia de parasitas estejam associadas ? (Use nvel de significncia igual a 1% e calcule o valor P).

12.4)

Num estudo da associao entre a ocorrncia de tromboembolismo e grupo sanguneo, 200


mulheres usurias de contraceptivo oral foram classificadas quanto presena de
tromboembolismo (doente ou sadia) e quanto ao grupo sangneo (A, B, AB ou O). Os
resultados dessa classificao foram reproduzidos na Tabela 12.4

Grupo
Sangneo
A
B
AB
O
Total

Tabela 12.4
Tromboembolismo
Doente
32
8
7
9
56

Sadia
47
19
14
64
144

Total
79
27
21
73
200

Existem evidncias estatsticas suficientes nesses dados para verificar a hiptese de que a presena do
tromboembolismo e o grupo sanguneo estejam associados ? (Use nvel de significncia igual a 1% e calcule o
valor P).

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

28

Segunda Parte:
Resoluo dos Exerccios

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

29

ndice

Seo 1:

Tipos de Estudos e Variveis

31

Seo 2:

Anlise Descritiva e Exploratria de Dados

33

Seo 3:

Probabilidade

41

Seo 4:

Avaliao da Qualidade de Testes Clnicos

44

Seo 5:

Distribuies de Probabilidade: Binomial e Poisson

47

Seo 6:

Distribuies de Probabilidade: Normal

51

Seo 7:

Faixas de Referncia

57

Seo 8:

Intervalos de Confiana

60

Seo 9:

Conceitos Bsicos de Testes de Hipteses

63

Seo 10:

Testes de Hipteses para Uma Populao

65

Seo 11:

Testes de Hipteses para Duas Populaes

68

Seo 12:

Teste Qui-Quadrado

72

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

30

Seo 1: Tipos de Estudos e Variveis


Exerccio (1.1)
a) Qualitativa e Nominal
b) Quantitativa e Discreta
c) Quantitativa e Contnua
d) Qualitativa e Nominal
e) Quantitativa e Contnua
f)

Quantitativa e Discreta

Exerccio (1.2)
a) Estudo do tipo experimental.
Varivel resposta:
Grupos comparados:

Alguma medida da disfuno ertil.


- Grupo Tratamento, formado pelos pacientes que tomaram Viagra;
- Grupo Controle, formado pelos pacientes que tomaram placebo.

b) Estudo do tipo observacional.


Varivel resposta:

Sensao de ter aparncia fsica mais jovem do que a realidade.

Na verdade, no comparam grupos, apenas estudaram quem tinha vida sexual intensa dentre os que
tinham a varivel resposta positiva (sentiam-se jovens). O que deveria ter sido feito era entrevistar dois
grupos: pessoas com vida sexual intensa e pessoas com vida sexual fraca. Para cada grupo, classificar os
componentes em pessoas que sentem-se jovens e pessoas que no se sentem jovens. Finalmente, verificar
se h (ou no) maior proporo de pessoas que sentem-se jovens dentre os de vida sexual intensa do que
entre aquelas de vida sexual fraca.

c) Estudo do tipo observacional.


Varivel resposta:
Grupos comparados:

Ocorrncia de algum tumor no dermatolgico.


- Pessoas que tiveram cncer dermatolgico;
- Pessoas que no tiveram cncer dermatolgico.

d) Estudo do tipo experimental, se a mutao no gene foi feita no laboratrio;


Estudo do tipo observacional, caso contrrio.
Varivel resposta:
Grupos comparados:

Ganho de peso
- Ratos com mutao no tal gene;
- Ratos sem mutao no tal gene.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

31

e) Estudo do tipo observacional.


Para a varivel resposta ocorrncia de derrame isqumico, temos a comparao entre os seguintes
grupos:

Pessoas com nvel de colesterol acima de 280;


Pessoas com nvel de colesterol abaixo de 280.

Para a varivel resposta ocorrncia de derrame hemorrgico temos a comparao entre os seguintes
grupos:

f)

Pessoas com nvel de colesterol abaixo de 180;


Pessoas com nvel de colesterol acima de 180.

Estudo do tipo observacional.


Varivel resposta:
Grupos comparados:

Ocorrncia de tuberculose
- Crianas com a marca da vacina BCG;
- Crianas sem a marca da vacina BCG .

g) Estudo do tipo observacional.


Varivel resposta:
Grupos comparados:

Nvel de testosterona
- Torcedores de futebol e basquete quando seus times ganharam;
- Torcedores de futebol e basquete quando seus times perderam;

h) Estudo do tipo observacional.


Varivel resposta:
Grupos comparados:

Ocorrncia de problemas respiratrios e/ou alergias.


- Crianas que tinham contato com animais;
- Crianas que viviam na zona urbana.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

32

Seo 2: Anlise Descritiva e Exploratria de Dados


Exerccio (2.1)
Tabela 2.1: Nmero de erros de traduo de 150 estudantes da escola A
Freqncia
Freqncia
o
N de
Ponto
Freqncia
Freqncia
Absoluta
Relativa
erros
Mdio
Absoluta
Relativa (%)
Acumulada
Acumulada (%)
10 |- 15
12,5
5
3,33
5
3,33
15 |- 20
17,5
57
38,00
62
41,33
20 |- 25
22,5
42
28,00
104
69,33
25 |- 30
27,5
28
18,67
132
88,00
30 |- 35
32,5
17
11,33
149
99,33
35 |- 40
37,5
1
0,67
150
100,00
Total
150
100,00
-----------

Tabela 2.2: Nmero de erros de traduo de 200 estudantes da escola B


Freqncia
Freqncia
o
N de
Ponto
Freqncia
Freqncia
Absoluta
Relativa
erros
Mdio
Absoluta
Relativa (%)
Acumulada
Acumulada (%)
10 |- 15
12,5
4
2,00
4
2,00
15 |- 20
17,5
18
9,00
22
11,00
20 |- 25
22,5
43
21,50
65
32,50
25 |- 30
27,5
76
38,00
141
70,50
30 |- 35
32,5
43
21,50
184
92,00
35 |- 40
37,5
16
8,00
200
100,00
Total
200
100,00
----------

Observao: a soma da coluna Frequncia Relativa (%) tem que ser 100,00 . No entanto, por causa de
arredondamentos, algumas vezes os valores dessa coluna somaro 100,01 (ou 99,99). Para corrigir o
problema, podemos subtrair (ou somar) 0,01 frequncia relativa da classe com maior frequncia. A
mesma observao vale para quando estivermos usando somente uma casa decimal aps a vrgula.
Nesse caso, o total da coluna Frequncia Relativa (%) tem que ser 100,0 e, se ocorrer o problema, a
correo pode ser feita subtraindo-se (ou somando-se) 0,1 frequncia relativa da classe com maior
frequncia.

Como podemos notar pela anlise dos histogramas a seguir, a distribuio de frequncia dos erros de
digitao da Escola A assimtrica com concentrao esquerda, enquanto a distribuio de frequncia dos
erros de digitao da Escola B razoavelmente simtrica em torno da classe 25 a 30 erros. A assimetria com
concentrao esquerda dos dados da Escola A tambm pode ser percebida atravs da sua ogiva, que
cresce mais rpido do que a ogiva da Escola B, que tem distribuio simtrica. Atravs desses grficos,
podemos observar que os alunos da Escola A tendem a errar menos do que os alunos do que os alunos a
Escola B.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

33

Escola B

40

40

30

30

Frequncia (%)

Frequncia (%)

Escola A

20

10

20

10

0
10

15

20

25

30

35

40

10

15

20

Nmero de Erros

Frequncia (%) Acumulada

Frequncia (%)
Acumulada

100
80
60
40
20
0
10

15

20

25

30

35

40

Ogiva para a Escola B

Ogiva para a Escola A

25

Nmero de Erros

30

35

40

100
80
60
40
20
0
5

Nm ero de erros

10

15

20

25

30

35

40

Nm ero de Erros

Observao 1: Como gostaramos de comparar as duas escolas, os histogramas e as ogivas foram feitos
usando a frequncia relativa, pois os tamanhos das amostras so diferentes. Se os tamanhos das amostras
fossem iguais, a frequncia absoluta poderia ser usada, embora o uso da frequncia relativa torna os grficos
mais, digamos, teis, pois eles podero ser comparados com outros que tambm usem a frequncia relativa,
mesmo que as amostras sejam de tamanhos diferentes.
Observao 2: O primeiro ponto na ogiva deve ser o limite inferior da primeira classe, que corresponde
frequncia acumulada igual a 0, ou seja, abaixo desse limite no existe nenhum dado.

Exerccio (2.2)
a)
Grupo
Sangneo
A
B
AB
O
Total

Tabela 2.3
Tromboembolismo
Doente
Sadia
32
51
8
19
6
5
9
70
55
145

Total
83
27
11
79
200

Percebe-se que grande parte das pessoas nesse estudo sadia (72,5%).
Como as variveis em questo (presena de tromboembolismo e grupo sanguneo) so do tipo
qualitativas, poderemos usar os grficos de colunas (barras) ou de setores (torta) para representar
esses dados.
O grfico abaixo revela que a maioria dos pacientes da amostra tem o sangue do tipo A, seguido
pelas pessoas de sangue tipo O e tipo B, sendo que a minoria tem o sangue do tipo AB.
34
Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

Distribuio dos pacientes segundo grupo


sanguneo

39%

41%

A
B
AB
O

6%

14%

frequencia relativa
(%)

O grfico a seguir representa a frequncia relativa da doena dentro de cada grupo sanguneo. A
frequncia relativa tem que ser usada porque os grupos de sangue tm tamanhos diferentes. Usamos
o grfico de colunas por ser de melhor visualizao, nesse caso em que temos 4 categorias (os tipos
sanguneos), ao invs de usarmos quatro grficos de setores.

100
80
60

Doente

40

Sadio

20
0
A

AB

grupo sanguneo

Pela tabela do exerccio, temos que os pacientes sadios representam a maioria (72,5%) dos 200 pacientes
amostrados. No grfico acima, podemos observar que, nos grupos sanguneos A, B e O, essa maioria se
mantm, embora em propores diferentes (no grupo O, por exemplo, em torno de 90% das pessoas so
sadias). No entanto, no grupo AB, essas propores se invertem, sendo as pessoas doentes mais frequentes.
Isso pode ser um indcio de que a distribuio de frequncias do estado do paciente depende do tipo
sanguneo, ou seja, de que as variveis tipo sanguneo e presena de tromboembolismo podem estar
associadas. Esses conceitos sero melhor elaborados mais adiante, quando tratarmos de independncia de
eventos e associao de variveis.

Exerccio (2.3)
Os valores de presso intraocular tm distribuio de frequncias assimtrica com concentrao
esquerda. Isso significa que a maioria das pessoas avaliadas possui valores pequenos para a presso
intraocular e algumas poucas pessoas possuem valores mais altos.
J os valores de cido rico srico tm distribuio de frequncias que pode ser considerada simtrica em
torno do valores de 5,3 a 5,9 mg/100ml. Isto , a maioria das pessoas possui medidas de cido rico srico em
torno desses valores, que podem ser considerados tpicos. Algumas poucas pessoas possuem valores mais
altos (cauda direita do histograma) e outras poucas pessoas possuem valores mais baixos (cauda esquerda).
Essa questo dos valores que podem ser considerados tpicos ser melhor discutida mais adiante quando
tratarmos do conceito e construo das Faixas de Referncias .

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

35

Exerccio (2.4)
Queremos encontrar a mediana, que o valor que deixa 50% dos dados abaixo dela. Essa tambm
a definio do percentil de ordem 50. O primeiro quartil o valor que deixa um quarto dos dados (25%)
abaixo dele e, portanto, o percentil de ordem 25. O terceiro quartil o valor que deixa trs quartos
dos dados (75%) abaixo dele e, portanto, o percentil de ordem 75. O percentil de ordem 90 o valor
que deixa 90% dos dados abaixo dele.
O clculo de percentis atravs da ogiva aproximado, pois os dados foram agrupados para que o
ogiva pudesse ser construda. Para encontrar o percentil de ordem 50, por exemplo, devemos traar no
grfico, a partir do valor 50 no eixo das frequncias acumuladas, uma reta paralela ao eixo dos valores
(eixo X) at que essa reta encontre a curva (veja no grfico). No ponto em que a primeira reta encontrar
a curva, devemos traar uma outra reta, agora vertical, paralela ao eixo das frequncias (eixo Y), at
que essa reta encontre o eixo dos valores (eixo X). O ponto em que essa segunda reta encontrar o eixo
X ser o percentil de ordem 50. No grfico, ele aproximadamente o valor 19,0. Usamos o mesmo
raciocnio para encontrar qualquer outro percentil. No grfico, tambm esto ilustrados os
procedimentos para encontrar os valores dos percentis de ordem 25, 75 e 90 (P25, P75 e P90,
respectivamente). Os valores aproximados para esses percentis so P25 igual a 16,5 , P75 igual a 22,5
e P95 igual a 34,5.

Frequncia Acumulada (%)

Ogiva para dados de Presso Intraocular


100
95
90
85
80
75
70
65
60
55
50
45
40
35
30
25
20
15
10
5
0

P50 (mediana)

P25(Q2)

10

15

20

P75(Q3)

25

P95

30

35

40

45

Presso Intraocular (mmHg)

Observe que o primeiro e o terceiro quartis (que deixam a mesma porcentagem de dados, 25%, abaixo e
acima deles, respectivamente) esto praticamente mesma distncia da mediana. Isso um ndicio de que a
distribuio desses dados de presso intraocular pode ser considerada simtrica. Outro indcio de simetria
que o percentil de ordem 5 (calcule!!!) e percentil de ordem 95 (que deixam a mesma porcentagem de dados,
5%, abaixo e acima deles, respectivamente) tambm esto praticamente mesma distncia da mediana.

Exerccio (2.5)
a) Diagrama de Pontos para os Tempos entre a Remisso e a Recidiva de uma Doena (em meses)

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

36

:
.
.
: .:
:. :. .
:. :
: .
-----+---------+---------+---------+---------+---------+- Homens
::
: :: :: :: : :.
.
-----+---------+---------+---------+---------+---------+- Mulheres
4,0

8,0

12,0

16,0

20,0

24,0

O grupo de mulheres tem, em geral, tempos entre a remisso e a recidiva dessa doena menores do que
os dos homens , sendo esses tempos mais homogneos no grupo feminino do que no grupo masculino.
b)
Ramo-e-folhas usando escala de 10 meses
Homens
0 | 2234444777899
0 | 223344556677778888
1 | 02555688
1 | 001128
2 | 224
Legenda: 0|2 : leia-se 2 meses

Ramo-e-folhas usando escala de 5 meses


Homens
0 | 2234444
0 | 777899
1 | 02
1 | 555688
2 | 224

0 | 223344
0 | 556677778888
1 | 00112
1|8
Legenda: 0|2 : leia-se 2 meses

Comentrio: Atravs do ramo-e-folhas com escala de 10 meses, a distribuio de frequncias dos tempos nos
dois grupos poderiam ser consideradas assimtricas com concentrao esquerda. No entanto, o ramo-efolhas com escala mais refinada (5 meses) permite um melhor detalhamento da distribuio dos tempos nos
dois grupos. A distribuio dos tempos no grupo feminino ainda pode ser considerado assimtrico com
concentrao esquerda. Porm, a anlise do ramo-e-folhas do grupo masculino nos revela que o grupo dos
homens parece ser a unio de dois grupos : um, que tem tempos baixose, outro grupo que tem tempos
altos. O ponto de corte para a definio de um tempo baixo ou alto ficaria a critrio do pesquisador, mas
poderia ser, por exemplo, 12 meses. Essa subdiviso do grupo masculino tambm pode ser notada no
diagrama de pontos, embora de maneira mais sutil.
A escolha da escala a ser usado num grfico deve ser guiada pelo bom senso: nem muito grande, o que
tornaria a representao grosseira; nem muito pequena, o que diminuiria o poder de resumo da representao
grfica.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

37

c)
Grupo
Homens
Mulheres

Mdia
10,71
7,17

Mediana
9,00
7,00

Desvio-padro
6,82
3,67

Coeficiente de Variao
0,64
0,51

Os homens possuem tempos entre a remisso e a recidiva da doena maiores, em mdia e em mediana,
do que os tempos das mulheres. A anlise do coeficiente de variao confirma o que j havamos observado
no diagrama de pontos: o grupo feminino possui tempos mais homogneos (C.V. menor) do que o grupo
masculino.
d)
Grupo
Todos

Mdia
8,94

Mediana
7,5

Desvio-padro
5,71

Coeficiente de Variao
0,64

Exerccio (2.6)
Para comparar a homogeneidade de dois grupos com mdias diferentes, precisamos calcular o
coeficiente de variao, que uma medida de variabilidade que considera a escala em que a varivel
est sendo medida.
Coeficiente de variao no grupo de recrutas:
Coeficiente de variao no grupo de oficiais:

22/205 = 0,11
45/244 = 0,18

O grupo de oficiais, alm de ter um nvel mdio de colesterol maior do que o nvel mdio dos
recrutas, tambm um grupo mais heterogneo com respeito a essa varivel (C.V. maior do que o
dos recrutas). Lembrando que o nvel de colesterol de um indivduo est relacionado tambm ao
seu grau de sedentarismo, a maior heterogeneidade do nvel de colesterol entre os oficiais pode
ser explicada pela diversidade de funes que esses oficiais desempenham , podendo implicar
em maior ou menor sedentarismo. J os jovens recrutas passam por constantes treinamentos e
exerccios, o que diminui a heterogeneidade entre eles desse importante fator associado ao nvel
de colesterol.

Exerccio (2.7)
a)
Grupo

Mdia

Macho
Fmea

40,54
52,04

Desvio
padro
3,54
8,05

Coeficiente de
Variao
0,09
0,15

Mediana
40,00
51,00

Primeiro
Quartil
38,00
47,00

Terceiro
Quartil
43,50
58,50

P10
35
42

Exemplos de clculo dos percentis:


o

Clculo do 1 quartil (grupo das tartarugas machos):


o
o
o
0,25 x 24 = 6 (nmero inteiro). O 1 quartil est o 6 valor e o 7 valor, os nmeros 38 e 38, respectivamente.
Tomaremos a mdia desses valores, que o prprio 38.
o

Clculo do 3 quartil (grupo das tartarugas fmeas):


o
o
o
075 x 24 = 18 (nmero inteiro). O 3 quartil est o 18 valor e o 19 valor, os nmeros 57 e 60,
respectivamente. Tomaremos a mdia desses valores, que 58,50.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

38

Clculo do Percentil de ordem 10 (grupo das tartarugas fmeas):


o
0,10 x 24 = 2,4 (nmero fracionrioarredondar para cima) O percentil de ordem 10 o 3 valor, o nmero
42. (isto significa que aproximadamente 10% das tartarugas fmeas possuem cascos com alturas inferiores ou
iguais a 42).
Clculo do Percentil de ordem 90 (grupo das tartarugas fmeas):
o
0,90 x 24 = 21,6 (nmero fracionrioarredondar para cima) O percentil de ordem 90 o 22 valor, o nmero
63 (isto significa que aproximadamente 90% das tartarugas fmeas possuem cascos com alturas inferiores ou
iguais a 63.

Observao: existem vrios mtodos para o clculo de percentis e todos resultaro em valores aproximados.
O mtodo apresentado acima o mais simples de todos.

c) As fmeas tm, em geral, cascos mais altos que


os machos, pois os valores da mdia e da mediana
so maiores para as fmeas. Isto tambm pode ser
visto nos box-plots, onde a maior parte das medidas
das fmeas encontram-se acima das medidas dos
machos: o terceiro quartil dos machos menor que o
primeiro quartil das fmeas. Alm disso, os box-plots
mostram que a altura do casco bem mais varivel
para as fmeas do que para os machos (a largura da
caixa maior para as fmeas), o que confirmado
comparando-se os coeficientes de variao. O grupo
de fmeas menos homogneo quanto altura do
casco.

b)

Grupo

35
Grupo 1: macho
Grupo 2: fmea

45

55

65

Altura do casco

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

39

Exerccio (2.8)
No grfico abaixo, verificamos que a habilidade aumenta aps o programa de fortificao para a maioria
dos alunos (pontos acima da linha x=y). Para apenas trs deles, a habilidade igual ou menor aps o
programa. Portanto, o programa se mostrou eficaz para a maioria dos alunos. Note que os pontos tendem a se
posicionar ao longo de uma linha reta (no caso, a linha x=y).

Grfico de Disperso

Esc ores de abdominais antes e depois do programa


(Linha x=y)
5

30
3

Depois

9 10
8

20
1

10

10

20

30

Antes

Algumas consideraes sobre o relacionamento entre variveis quantitativas : no problema acima, dizemos
que os escores antes e depois do programa esto linearmente correlacionados. O Diagrama de Disperso
um modo de visualizar essa correlao. Para medir o grau de correlao, usa-se o Coeficiente de Correlao
Linear, que um nmero entre -1 e 1. Um coeficiente de correlao positivo (> 0) acontece se a relao entre
as duas variveis do tipo: quando o valor de uma varivel aumenta, o valor da outra aumenta tambm; ou,
quando o valor de uma varivel diminui, o valor da outra tambm diminui. J um coeficiente de correlao
negativo (< 0) acontece se a relao entre as duas variveis do tipo: quando o valor de uma varivel
aumenta, o valor da outra diminui; ou vice-versa. Um coeficiente de correlao linear igual a zero significa que
as duas variveis no possuem nenhuma correlao do tipo linear, mas podem estar relacionadas de uma
maneira no linear (quadrtica, por exemplo). Isso poder ser percebido atravs do exame do Diagrama de
Disperso. Assim, o Coeficiente de Correlao Linear e o Diagrama de Disperso so ferramentas que devem
ser usadas conjuntamente. Para mais detalhes sobre correlao, veja Soares, J. F. e colegas (Introduo
Estatstica) e tambm Triola, M. F. (Introduo Estatstica, Editora LTC) . O coeficiente de correlao entre
os escores antes e depois nesse exerccio de 0,97, indicando uma forte correlao positiva entre as medidas
antes e depois do programa de fortificao isomtrica.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

40

Seo 3: Probabilidade
Exerccio (3.1)
g) Existem quatro ases em um baralho de 52 cartas. Assim P(A) = 4/52 = 1/13.
Metade as cartas (as de naipe ouros e copas) so vermelhas. Assim, P(V) = 26/52 = 1/2.
Cada naipe tem 13 cartas. Assim, P(E) = 13/52 = 1/4.
h) H duas cartas que so, ao mesmo tempo, ases e vermelhas (s de ouros e s de copas). Assim, P(A
V) = 2/52 = 1/26.
H somente uma carta que , ao mesmo tempo, s e de espada. Assim, P(A E) = 1/52.
Nenhuma carta , ao mesmo tempo, vermelha e de espada. Assim, P(V E) = 0, ou seja, os
eventos V e E so mutuamente exclusivos.
i)

P(A V) = P(A) + P(V) - P(A V) = 1/13 + 1/2 + 1/26 = (2 + 13 + 1)/26 = 16/26 = 8/13.
P(A E) = P(A) + P(E) - P(A E) = 1/13 + 1/4 - 1/52 = (4 + 13 +1)/52 = 18/52 = 9/26.
P(V E) = P(V) + P(E) - P(V E) = 1/2 + 1/4 - 0 = (2+1)/4 = 3/4.

j)

P(A|V) = P(A V)/P(V) = (1/26)/(1/2) = 1/13. Ou seja, como, das 26 cartas vermelhas, duas so ases,
ento P(A|V) = 2/26 = 1/13.
Como P(A|V) = P(A), os eventos A e V so independentes.

k) P(V|E) = P(V E)/P(E) = 0/(1/4) = 0. Ou seja, como nenhuma carta de espada vermelha, ento P(V|E) =
0.
Como P(V|E) P(V), os eventos V e E no so independentes.
f.1) O fato da primeira carta retirada ter sido um s no altera a probabilidade de que a segunda carta seja um
s, pois a primeira carta foi devolvida ao baralho, tornando, assim, a segunda retirada um experimento
idntico quele da primeira retirada. Ento, os eventos A1 e A2 so independentes: P(A2|A1) = P(A2) = 4/52 =
1/13.
f.2) Como os eventos A1 e A2 so independentes, P(A1 A2) = P(A1) x P(A2) = 1/13 x 1/13 = 1/169.

Exerccio (3.2)
Tabela 3.1
Sexo
Daltonismo
Presente
Ausente
Total

Sejam os eventos:

D=
ND =
M=
F =

Total
Masculino
423
4848
5271

Feminino
65
4664
4729

488
9512
10.000

{a pessoa escolhida Daltnica}


{a pessoa escolhida No Daltnica}
{a pessoa escolhida do sexo Masculino}
{a pessoa escolhida do sexo Feminino}

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

41

Item (I)

a)
b)

P(D) = 488/10.000 = 0,0488


P(ND) = 9512/10.000 = 0,9512

Observe que P(D) + P(ND) = 1

c)
d)

P(M) = 5271/10.000 = 0,5271


P(F) = 4729/10.000 = 0,4729

Observe que P(M) + P(F) = 1

e)
f)

P(DM) = 423/10.000 = 0,0423


P(DF) = 65/10.000 = 0,0065

Observe que:
P(DM) + P(DF) +

g)
h)
i)
j)

P(NDM) = 4848/10.000 = 0,4848


P(NDF) = 4664/10.000 = 0,4664

+ P(NDM) + P(NDF) = 1

P(D|M) = P(DM)/ P(M) = 0,0423/0,5271 = 0,0803


P(D|F) = P(DF)/ P(F) = 0,0065/0,4729 = 0,0137

Observe que:
P(D|M) + P(ND|M) = 1

k) P(ND|M) = P(NDM)/ P(M) = 0,4848/0,5271 = 0,9197


l) P(ND|F) = P(NDF)/ P(F) = 0,4664/0,4729 = 0,9863

P(D|F) + P(ND|F) = 1

Item (II)
P(D) = 0,0488
P(D|M) = 0,0803 P(D)
Portanto, os eventos ser daltnica e ser do sexo masculino no so independentes

Exerccio (3.3)

Situao
da paciente
Com cncer
Sem cncer
Total

Tabela 3.2
Resultado do Papanicolau
Total
Positivo
94
250
344

Negativo
6
250
256

100
500
600

Sejam os eventos: C =
{ter cncer}
S = {no ter cncer}
P=
{teste papanicolau positivo}
N = {teste papanicolau negativo}

a) Prevalncia do cncer = 100/600 = 0,1617

b) (Pessoas com cncer e teste positivo) + (Pessoas sem cncer e teste negativo) = 94 + 250 = 344
c) (Pessoas com cncer e teste negativo) + (Pessoas sem cncer e teste positivo) = 6 + 250 = 256

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

42

d) Sensibilidade: P(P|C) = 94/100 = 0,94


e) Especificidade:

f)

P(N|S) = 250/500 = 0,50

Valor de Predio Positiva:

P(C|P) = 94/344 = 0,27

g) Valor de Predio Negativa: P(S|N) = 250/256 = 0,98

h) Proporo de Falsos Positivos:


i)

Proporo de Falsos Negativos:

P(S|P) = 250/344 = 0,73


P(C|N) =

6/256 = 0,02

Observe que:

Valor de Predio Positiva + Proporo de Falsos Positivos

=1

Valor de Predio Negativa + Proporo de Falsos Negativos = 1

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

43

Seo 4: Avaliao da Qualidade de Testes Clnicos


Exerccio (4.1)
a) Proporo de falsos positivos:

PFP =

P( D | + )

VPN = P( D | - )

b) Valor de Predio Negativa:

e = P( - | D )

c) Especificidade:
d) Valor de Predio Positiva:

VPP = P( D| + )

e) Proporo de falsos negativos:


f)

PFN =

P( D | - )

Sensibilidade:

s = P( + |D )

Exerccio (4.2)
a)

Sensibilidade :
Especificidade:

b)

s = p (+ | D ) =
e = P ( | D ) =

51
= 0,98
52

232
= 0,97
238

Prevalncia na populao: p = 0,179

Prevalncia na amostra:

nmero de doentes na amostra


tamanho total da amostra

52
= 0,1793 p
290

Como a prevalncia da doena na amostra prxima da prevalncia na populao, podemos calcular VPP
e VPN diretamente da tabela.

51
= 0,89
57
232
VPN = P ( D | ) =
= 0,996
233
VPP = P ( D | + ) =

PFP = 1-VPP = 0,11


PFN = 1-VPN = 0,004

c) Suponha que p <<0,179. Ento, VPP << 0,89 e, da, PFP >>0,11. Portanto, um resultado positivo no teste
tem uma probabilidade considervel de ser um falso positivo. Como o tratamento caro, no podemos
correr um risco de estar tratando um falso positivo como muita frequncia (PFP). Assim, o melhor
procedimento diante de um resultado positivo fazer mais investigaes com outros testes de diagnstico.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

44

Exerccio (4.3)
Resultados do Teste 1
Diagnstico do Teste
Negativo (CFC<80)
Positivo (CFC 80)

Infarto agudo
do miocrdio
Doente

(D)

No doente

(D )

Total

Doente

(D)

No doente

(D )

215
16

15
114

230
130

231

129

360

Resultados do Teste 2
Diagnstico do Teste
Negativo (CFC<280)
Positivo (CFC 280)

Infarto agudo
do miocrdio

Total

Total

Total

97
1

133
129

230
130

98

262

360

a)
Teste 1:

215
= 0,93
230
114
= 0,88
e1 = P ( | D ) =
130
s1 = P ( + | D ) =

Teste 2:

97
= 0,42
230
129
= 0,99
e 2 = P( | D ) =
130
s 2 = P (+ | D ) =

O Teste 1 tem sensibilidade e especificidade bastante altas, o que no ocorre com o Teste 2, que tem uma
especificidade muito alta e uma sensibilidade muito baixa. Assim, o Teste 1 o teste mais sensvel dentre os
dois e o Teste 2 o teste mais especfico. A qualidade do diagnstico baseado nesses testes, medida pelos
Valores de Predio Positiva e Negativa, depende da prevalncia da doena na populao onde eles sero
usados. Conforme for o objetivo do procedimento (descartar ou confirmar a presena da doena), um ou outro
teste ser mais til, como veremos no prximo item.

b) Considerando que os testes seriam aplicados numa populao cuja a prevalncia de infarto agudo no
corao aproximadamente igual prevalncia da amostra (230/360=0,64), poderemos calcular os
valores de predio positiva e negativa diretamente da tabela.
Teste 1:

VPP1 = P ( D | + ) =
VPN 1 = P ( D | ) =

215
= 0,93
231

114
= 0,88
129

PFP1 = 1 0,93 = 0,07

PFN1 = 1 0,88 = 0,12

Observao: a coincidncia do valor da sensibilidade com o valor do VPP, assim como do valor da
especificidade com o valor do VPN, para o teste 1, no regra. Apenas aconteceu porque os denominadores
so muito parecidos. Isso no ocorrer com o teste 2, como veremos a seguir.
Teste 2:

VPP2 = P ( D | +) =
VPN 2 = P ( D | ) =

97
= 0,99
98

129
= 0, 49
262

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

PFP2 = 1 0,99 = 0,01

PFN2 = 1 0,49 = 0,51

45

Comentrios sobre os testes: na escolha de qual teste deve ser usado, devemos estar atento ao objetivo do
procedimento e prevalncia da doena na populao onde ele for aplicado. Nesta anlise, vamos considerar
que a populao de trabalho tem uma prevalncia de infarto no corao aproximadamente igual prevalncia
desse estudo (64%). Se o objetivo do procedimento diagnstico for o de confirmar a doena, o Teste 2 deve
ser usado, pois seu VPP bastante alto (99%), isto , um paciente que tenha o resultado positivo no Teste 2
tem grande probabilidade de estar doente. Por outro lado, se o objetivo for o de descartar a doena, o Teste 2
no deve ser mais usado, pois seu VPN muito baixo, levando a uma Proporo de Falsos Negativos muito
alta (51%). Assim, ser prefervel usar o Teste 1, que apesar de ter uma Proporo de Falsos Negativos
considervel (12%), melhor do que o Teste 2 nesse ponto. Numa populao onde a prevalncia de infarto for
menor do que 64%, os valores de VPN para os dois testes vo aumentar e, ento, a utilizao do Teste 1 para
descartar a presena da doena ser mais confivel (a proporo de falsos negativos ir diminuir). Como j
sabemos, quanto menor a prevalncia, maior o valor de VPN e menor o valor de VPP.

Exerccio (4.4)
a) O VPP aumenta medida que a especificidade aumenta, com sensibilidade e prevalncia fixas.
b) O VPN aumenta medida que a especificidade aumenta, com sensibilidade e prevalncia fixas.
c)
i) VPP aumenta aproximadamente em 0,23 quando se passa de um teste com especificidade
igual a 0,7 para 0,95, com p = 0,5.
ii) VPP aumenta aproximadamente entre 0,02 e 0,06, dependendo do valor da especificidade,
quando se passa de um teste com sensibilidade igual a 0,7 para 0,95, com p = 0,5.
iii) O teste ser poderoso para confirmar a presena da doena se ele tiver uma PFP pequena, o
que significa que seu VPP grande. Ou seja, haver uma alta probabilidade de um paciente
ser doente dado que seu resultado no teste foi positivo.
iv) Deseja-se, neste caso, um teste com VPP alto. Desse modo, devemos aumentar a
especificidade do teste, pois, como foi mostrado nos itens (i) e (ii), o aumento da
especificidade provoca um maior acrscimo no VPP.
d)
i) VPN aumenta aproximadamente em 0,003 quando se passa de um teste com especificidade
igual a 0,7 para 0,95, com p = 0,05.
ii) VPN aumenta aproximadamente em 0,019, quando se passa de um teste com sensibilidade igual a 0,7
para 0,95, com p = 0,05.
iii) O teste ser poderoso para descartar a presena da doena se ele tiver uma PFN pequena, o que
significa que seu VPN grande. Ou seja, haver uma alta probabilidade de um paciente no ser doente
dado que seu resultado no teste foi negativo.
iv) Deseja-se, neste caso, um teste com VPN alto. Desse modo, devemos aumentar a
sensibilidade do teste, pois, como foi mostrado nos itens (i) e (ii), o aumento da
sensibilidade provoca um maior acrscimo no VPN.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

46

Seo 5: Distribuies de Probabilidade: Binomial e Poisson


Exerccio (5.1)
o

X: n de pessoas com Rh negativo em um grupo de n=4


Valores que X pode assumir: x = 0,1,2,3 ou 4
Probabilidade de uma pessoa ser Rh negativo: p = 0,10
Desse modo,

X ~ Binomial (n=4,p=0,10)

4
P( X = x ) = 0,10 x (1 0,10) 4 x para x = 0,1,2, 3 ou 4
x

Assim,

Estamos interessados em saber qual a probabilidade de que todas as 4 pessoas desse grupo sejam Rh
negativo, ou seja, estamos interessados em saber qual a probabilidade da varivel X assumir o valor 4
(P[X=4]).

4
4!
P( X = 4) = 0,10 4 (1 0,10) 4 4 =
0,10 4 (0,90) 0 = 1 0,0001 1 = 0,0001
4!0!
4
Quando a probabilidade de uma pessoa ser Rh negativo 10%, a probabilidade de que todas as 4 pessoas
de um grupo sejam Rh negativo 0,01%.

Exerccio (5.2)
o

Y: n de crianas com olhos azuis numa famlia de 3 filhos (n=3)


Valores que Y pode assumir: y = 0,1,2 ou 3
Probabilidade de uma criana ter olhos azuis: p = 0,25
Desse modo,

Assim,

Y ~ Binomial (n=3,p=0,25)

3
P(Y = y) = 0,25 y (1 0,25) 3 y
y

para y = 0,1,2 ou 3

Pelo menos duas crianas devem ter olhos azuis, ou seja, 2 ou todas as 3 crianas. Assim, estamos
interessados na probabilidade de Y assumir valores maiores ou iguais a 2, ou seja, os valores 2 ou 3.

P[Y2] = {P[Y=2]+P[Y=3]} =
=

3
0,252 (1 0,25) 32
2

3
0,253 (1 0,25) 33
3

3!
3!
0,25 2 (0,75) 1 +
0,25 3 (0,75) 0
2!1!
3!0!

= 3 . 0,0625 . 0,75 + 1 . 0,0156 . 1 = 0,1406 + 0,0156 = 0,1562


A probabilidade de que pelo menos 2 das 3 crianas de um casal de olhos azuis tambm tenham olhos
azuis de 15,62 %.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

47

Exerccio (5.3)
o

X: n de unidades do medicamento vendidas em 1 dia


Valores que X pode assumir: x = 0, 1, 2, ... (at um limite mximo desconhecido)
= 3)
Nmero mdio de unidades do medicamento vendidas por dia: 3 (
Supondo X ~ Poisson ( = 3)

Assim,

P( X = x ) =

e 3 3 x
x!

para x = 0, 1, 2, ...

(e 2,72)

a)

0.1690

0.2240

0.1494

0.20
0.18

0.0027

0.0008

0.0002

0.0000

10

11

12

0.03

0.05

0.0081

0.08

0.10

0.0504

0.13

0.0216

0.1010

0.15

0.0498

Probabilidade

0.23

0.25

0.2240

0.28

0.30

0.00
Nm
ero de partculas
emvendidas
itidas porpor
segundo
Nmero
de unidades
dia

Note que a distribuio de probabilidade do nmero unidades do medicamento vendidas por dia assimtrica
com concentrao esquerda, isto , nos valores mais prximos do valor esperado (3). Para valores maiores
ou iguais a 12, a probabilidade to pequena que pode ser considerada igual a zero.
b) P[X entre 7 e 11] = P[7 X 11] = {P[X=7]+ P[X=8]+ P[X=9]+ P[X=10]+ P[X=11]}
Do grfico em a), temos que :
P[X entre 7 e 11] = 0,0216 + 0,0081 + 0,0027 + 0,0008 + 0,0002 = 0,0334
A probabilidade de que sejam vendidas entre 7 e 11 unidades do medicamento por dia de 3,34%.

c) Considerando que a procura pelo medicamento durante os dias da semana se mantm constante e que o
que ocorre em um dia independente do que ocorre em outro dia, podemos concluir que o nmero mdio de
unidades do medicamento vendidas em 1 semana de 7 x 3 = 21 unidades. Assim, o nmero de unidades do
medicamento vendidas em 1 semana tem distribuio de Poisson com mdia igual a 21.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

48

d) Y: n de unidades do medicamento vendidas em 1 semana (7 dias)


Valores que Y pode assumir: y = 0, 1, 2, ... (at um limite mximo desconhecido)
Nmero mdio de unidades do medicamento vendidas em 1 semana: 21 ( = 21)
Supondo Y~ Poisson ( = 21).

e 21 21 y
Assim, P (Y = y ) =
, para y = 0, 1, 2, ...
y!
P (Y = 100) =

e 21 21100
=
100!

(e 2,72)

-35

0,0000000000000000000000000000000000135 (1,35 x 10 )
(uma probabilidade baixssima!!!)

Exerccio (5.4)
o

X: n de meninos de daltnicos em um grupo de n=4


Valores que X pode assumir: x = 0,1,2,3 ou 4
Probabilidade de um menino ser daltnico: p = 0,08
Portanto, X ~ Binomial (n=4,p=0,08)
Assim,

4
P( X = x) = 0,08 x (1 0,08) 4 x para x = 0,1,2, 3 ou 4
x

A probabilidade de 3 meninos no serem daltnicos num grupo de 4 meninos igual probabilidade de 1


menino ser daltnico num grupo de 4 meninos, ou seja P(X=1):

4
4!
0,08 (0,92) = 4 0,08 0,78 = 0,25
P ( X = 1) = 0,081 (1 0,08) 3 =
1!3!
1

Exerccio (5.5)
o

X: n de animais que sobrevivem em n animais submetidos ao experimento cirrgico


Valores que X pode assumir: x = 0,1,2,...,n
Probabilidade de um animal sobreviver p = 2/3.
a) Distribuio de probabilidade de X:

X ~ Binomial (n=5 , p=2/3)

5 2 1
5!
1
1
1
= 1
= 0,004
P( X = 0) = =
0!5! 243
243
0 3 3
0

5 2 1
5! 2 1
2
= 5
= 0,041
P( X = 1) = =
1!4! 3 81
243
1 3 3
2
3
5 2 1
5! 4 1
4

= 10
= 0,165
P( X = 2) = =
2!3! 9 27
243
2 3 3
1

5 2 1
5! 8 1
8 1
= 10 = 0,329
P( X = 3) = =
3!2! 27 9
27 9
3 3 3
4
1
5 2 1
5! 16 1
16
= 5
= 0,329
P( X = 4) = =
4!1! 81 3
243
4 3 3
3

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

49

5 2 1
5! 32
32
P( X = 5) = =

1 = 1
= 0,132
5!0! 243
243
5 3 3
5

Note que P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5) = 1

b)
i. P(X = 3) = 0,33
ii. P(X 1) = 1- P(X = 0) = 1- 0,004 = 0,996
iii. Mais de 2 animais no sobreviverem o mesmo que no no mximo 2 animais sobreviverem: P(X 2 )
= P(X = 0) + P(X = 1) +P(X = 2) = 0,004 + 0,041 + 0,165 = 0,210

c) Se 60 animais se submeterem a essa cirurgia, espera-se que, em mdia, 60 x p = 60 x 1/3 = 20 no


sobrevivam.

Exerccio (5.6)
o

X: n de sementes que no germinam em um pacote com 10 sementes


Valores que X pode assumir: x = 0,1,2,...,10
Probabilidade de uma semente germinar: p = 0,2
X ~ Binomial (n=10,p=0,2)

Assim,

10
P( X = x) = 0,2 x 0,810 x para x = 0,1,2,...,10
x

a) P ( X > 4) = 1 P ( X 4) = 1 (P ( X = 0) + P ( X = 1) + P ( X = 2) + P ( X = 3) + P ( X = 4) )
= 1 - 0,9672 = 0,0328

10
P ( X = 0) = 0,2 0 0,810 = 0,1074
0
10
P ( X = 1) = 0,21 0,8 9 = 0,2684
1
10
P ( X = 2) = 0,2 2 0,8 8 = 0,3020
2
10
P ( X = 3) = 0,2 3 0,8 7 = 0,2013
3

10
P ( X = 4) = 0,2 4 0,8 6 = 0,0881
4
b) O nmero esperado de pacotes indenizados quando 1000 so vendidos 1000 vezes a probabilidade de
um pacote ser indenizado, ou seja, 1000 x 0, 0328 33 pacotes.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

50

Exerccio (5.7)
o

X: n de colnias de bactrias por 10 ml de gua de um lago.


Valores que X pode assumir: x = 0, 1, 2, ... (at um limite mximo desconhecido)
Supondo X ~ Poisson ( = 3)

e 3 3 x
Assim, P( X = x) =
x!

para x = 0, 1, 2, ...

(e 2,72)

a) Qual a probabilidade de no se achar nenhuma colnia em 10 ml de gua desse lago ?

P( X = 0) =

e 3 30 2,72 3 1
1
=
=
= 0,05
0!
1
2,723

b) Qual a probabilidade de se achar pelo menos duas colnias em 10 ml de gua desse lago ?

P( X 2) = 1 P ( X 1) = 1 (P( X = 0) + P ( X = 1)) = 1 (0,05 + 0,15) = 1 0,20 = 0,80

P( X = 0) = 0,05 pelo item (a)


e 3 31 2,72 3 3
3
P( X = 1) =
=
=
= 0,15
1!
1
2,723
c) O volume de gua triplicou.
o
X: n de colnias de bactrias por 30 ml de gua de um lago.
Portanto, a mdia de X passa a ser = 3 x 3 = 9 colnias por 30 ml de gua.
Assim, P ( X = x) =

e 9 9 x
x!

para x = 0, 1, 2, ...

(e 2,72)

P ( X 5) = 1 P ( X 4) = 1 (P ( X = 0) + P ( X = 1) + P ( X = 2) + P ( X = 3) + P ( X = 4) )
e 9 9 0 e 9 91 e 9 9 2 e 9 9 3 e 9 9 4
=
= 1
+
+
+
+
1!
2!
3!
4!
0!
1 (0,000123 + 0,001111 + 0,004998 + 0,014994 + 0,033737) = 1 0,056074 = 0,943926

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

51

Seo 6: Distribuies de Probabilidade: Normal


Exerccio (6.1)
X: quantidade de ferro srico de indivduos sadios
X ~ Normal ( = 100 ; = 25)
a) Quantidade mdia de ferro srico em indivduos desta populao: = 100 mcg/dl
Desvio padro da quantidade de ferro srico nesta populao: = 25 mcg/dl
b) Representao grfica da funo de densidade de probabilidade da varivel X:
68,3% dos valores de X esto dentro do intervalo [ ] = [100 25] = [75 ; 125] mcg/dl
95,4% dos valores de X esto dentro do intervalo [ 2] = [100 50] = [50 ; 150] mcg/dl
99,7% dos valores de X esto dentro do intervalo [ 3] = [100 75] = [25 ; 175] mcg/dl

25

50

125


Neste caso, Z =

75


c) Equao da varivel normal padro Z:

Z=

150

175

X
.

X 100
25

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

52

d)
Um valor de X
igual a ...

Corresponde a
Z igual a ...

P(X x ) =

25

25 100
= 3
25

100 2 x 25
= 50
100 1 x 25
= 75
59
100 1,28 x 25
= 68
100 0,68 x 25
= 83
90

-2
Da tabela
Z = -1

Corresponde a
Z igual a ...

P(Z -3) =
0,001350

Um valor de X
igual a ...
100 + 3 x 25
= 175

P(Z -2) =
0,022750

100 + 2 x 25
= 150

Da tabela
Z=2

0,158655

125

125100
=1
25

100 + 1,64 x 25
= 141

1,64

P(Z -1,28) =
0,100273

100 + 1,28 x 25
= 132

Da tabela
Z = 1,28

0,248252

117

117100
= 0,68
25

P(Z -0,4) =
0,344578

100 + 0,4 x 25
= 110

90100
= 0,4
25

P(Z3) = P(Z-3)
= 0,001350

P(Z -1,64) =
59100
= 1,64
0,050503
25
-1,28
Da tabela
Z = -0,68

P(X x ) =

0,4

0,022750
P(Z1) = P(Z-1)
= 0,158655
P(Z1,64)=P(Z-1,64)
= 0,050503
0,100273
P(Z0,68) = P(Z-0,68)
0,248252
P(Z0,4) = P(Z-0,4)
= 0,344578

(i)

110 100
68 100
Z
P(68 X 110 ) = P
= P( 1,28 Z 0,40 )
25
25

= P (Z 0,40 ) P(Z 1,28) = 0,655422 0,100273 = 0,555149


Em uma amostra aleatria de 500 indivduos sadios desta populao, esperamos que
500 x 0,555149 276
tenham quantidade de ferro srio entre 68 e 110 mcg/dl.

(ii)
Devemos ter P(x1 < X < x2)= 0,50 e (100 x1) = (x2 100??pela simetria em torno da mdia.

x 100
x 100
P(x1 < X < x 2 ) = P 1
<Z< 2
= P (z1< Z < z 2 ) = 0,50
25
25
Pela simetria de Z em torno da mdia, z1= -z2 e ento: P ( z 2 < Z < z 2 ) = 0,50

P(Z > z 2 ) = P( Z < z 2 ) =

1 0,50 0,50
=
= 0,25
2
2

Na Tabela Z vemos que P(Z < -0,67) = 0,251429 0,25. Portanto, -z2 = -0,67 e z2 = 0,67.
Assim:

x1 100
= z 2 x1 = 100 z 2 25 = 100 0,67 25 = 100 17 = 83
25
x 2 100
= z 2 x 2 = 100 + z 2 25 = 100 + 0,67 25 = 100 + 17 = 117
25
Portanto, o intervalo simtrico em torno da mdia 100 que abrange 50% das quantidades de ferro em
indivduos sadios [83;117] mcg/dl.
(iii)
Devemos ter P(x1 < X < x2)= 0,95 e (100 x1) = (x2 100) pela simetria em torno da mdia.
Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

53

x 100
x 100
P(x1 < X < x 2 ) = P 1
<Z< 2
= P (z1< Z < z 2 ) = 0,95
25
25
Pela simetria de Z em torno da mdia, z1= -z2 e ento: P ( z 2 < Z < z 2 ) = 0,95

P( Z > z 2 ) = P( Z < z 2 ) =

1 0,95 0,05
=
= 0,025
2
2

Na Tabela Z vemos que P(Z < -1,96) = 0,024998 0,025. Portanto, -z2 = -1,96 e z2 = 1,96.
Assim:

x1 100
= z 2 x1 = 100 z 2 25 = 100 1,96 25 = 100 49 = 51
25
x 2 100
= z 2 x 2 = 100 + z 2 25 = 100 + 01,96 25 = 100 + 49 = 149
25
Portanto, o intervalo simtrico em torno da mdia 100 que abrange 95% das quantidades de ferro em
indivduos sadios [51;149] mcg/dl.

Exerccio (6.2)
X: concentrao srica de tiroxina T4(D) em ces machos sadios
X ~ Normal (
= 2,04 ; = 0,78)
a)
i)

2,81 2,04

P(X < 2,81) = P Z <


= P(Z < 0,99) = 0,838913
0,78

ii)

1,8 2,04

P(X > 1,8) = P Z >


= P (Z > 0,31) = P (Z < 0,31) = 0,621719
0,78

iii)

2,50 2,04
1,01 2,04
P (1,01 X 2,50 ) = P
Z
= P ( 1,32 Z 0,59 )
0,78
0,78

= P (Z 0,59 ) P (Z 1,32 ) = 0,722405 0,093418 = 0,628987

b)

3,80 2,04
2,20 2,04
P(2,20 X 3,80) = P
Z
= P(0,21 Z 2,26 )
0,78
0,78

= P(Z 2,26 ) P(Z 0,21) = 0,988089 0,583166 = 0,404923


Assim, em 200 ces sadios, esperamos 200 x 0,404923 81 ces com concentrao srica entre
2,20 e 3,80 mcg/100ml.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

54

c)
Devemos ter P(x1 < X < x2)= 0,98 e (2,04 x1) = (x2 2,04) pela simetria em torno da mdia.

x 2,04
x 2,04
P(x1 < X < x 2 ) = P 1
<Z< 2
= P (z1< Z < z 2 ) = 0,98
20,78
0,78
Pela simetria de Z em torno da mdia, z1= -z2 e ento: P ( z 2 < Z < z 2 ) = 0,98.

P( Z > z 2 ) = P( Z < z 2 ) =

1 0,98 0,02
=
= 0,01
2
2

Na Tabela Z vemos que P(Z < -2,33) = 0,009903 0,01. Portanto, -z2 = -2,33 e z2 = 2,33.
Assim:

x1 2,04
= z 2 x1 = 2,04 z 2 0,78 = 2,04 2,33 0,78 = 2,04 1,82 = 0,22
0,78
x 2 2,04
= z 2 x2 = 2,04 + z 2 0,78 = 2,04 + 2,33 0,78 = 2,04 + 1,82 = 3,86
0,78
Portanto, o intervalo simtrico em torno da mdia 2,04 que abrange 98% das concentraes sricas em ces
sadios [0,22 ; 3,86] mcg/100ml.

Exerccio (6.3)
X: tempo de gestao de um beb, em dias.
X ~ Normal (
= 268 ; = 15)
a) Uma criana ser considerada prematura se o seu tempo de gestao for inferior a 247 dias, ou seja, se
X<247. Ento, devemos calcular P[X<247].

X 268 247 268


padronixando
P ( X < 247 )

= P
<
= P ( Z < 1,40 ) = 0,0808

15
15
Assim, a porcentagem de crianas nascidas prematuramente ser de 8,08% .

b) Para que uma criana no seja considerada prematura, seu tempo de gestao tem que ser maior do que
um valor, digamos a . E o valor a aquele que deixa 4% dos tempos de gestao abaixo dele. Ou seja, o
valor a tal que P(X < a) = 0,04. O valor a o percentil de ordem 4 (ou 4%).
Encontrando o valor de a

a - 268
X 268 a 268

padronixando
P( X < a)

= P
<
= P Z <
= 0,04

15
15
15
Na tabela Z, o valor que deixa, aproximadamente, 4% da rea abaixo dele o -1,75.
Assim, (a - 268)/15 = -1,75. Ento, a = (-1,75 x 15) + 268 = 241,75.
Desse modo, para que uma criana no seja considerada prematura pelo novo critrio, seu tempo de gestao
tem que ser, no mnimo, de 242 dias.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

55

Exerccio (6.4)
X: escore de Q.I.
= 100 ; = 15)
X ~ Normal (
a) Uma pessoa ser admitida nessa organizao se o seu escore de Q.I. for superior a 131,5 pontos, ou seja,
se X>131,5. Ento, devemos calcular P[X>131,5].

1 3 1 ,5 1 0 0
X 100
a d r o n iz a n d o

= P
>
P ( X > 1 3 1 ,5 ) p
=

15
15
o r s i m e tr i a
a ta b e la
= P ( Z > 2 ,1 0 ) p
= P ( Z < 2 ,1 0 ) n

= 0 ,0 1 7 9

Assim, a probabilidade de uma pessoa escolhida aleatoriamente ser aceita nessa organizao de apenas
1,79%.

b) Para que uma pessoa seja considerada um gnio, ela deve ter um Q.I superior a um valor, digamos b .
Esse valor b aquele que deixa 1% dos escores de Q.I. acima dele. Ou seja, o valor b tal que P(X > b) =
0,01 e, portanto, P(X < b) = 0,99. O valor b o percentil de ordem 99 (ou 99%).
Encontrando o valor b

b - 100
X 100 b 100

padronixando

= P
<
P ( X < b)
= P Z <
= 0,99
15

15
15
O valor, na tabela Z, que deixa, aproximadamente, 99% da rea abaixo dele o 2,33.
Assim, (b - 100)/15 = 2,33. Ento, b = (2,33 x 15) + 100 = 134,95.
Desse modo, para que uma pessoa seja considerada um gnio, ela deve ter um Q.I superior a 134,95 pontos.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

56

Seo 7: Faixas de Referncia


Exerccio (7.1)
X: nmero de colnias por cultura de escarro em pessoas sadias

a) Ramo-e-Folhas para nmero colnias por cultura de escarro

n = 44

Escala: |1|7 = 17

|1|7
|2|23333444444
|2|55555556889
|3|0011
|3|5556
|4|01112
|4|
|5|14
|5|668
|6|0
|6|8
|7|
|7|9

Podemos ver que a distribuio de freqncia


do nmero de colnias por cultura de escarro
muito assimtrica.
Portanto, no podemos supor que siga uma
esta varivel siga a distribuio Normal

b)
Faixa de Normalidade de 95%
100(1- )% = 95%
(1- ) = 95/100 = 0,95
= 1- 0,95 = 0,05
/2 = 0,05/2 = 0,025
1 /2 = 1 - 0,025 = 0,975

(i)

Mtodo dos Percentis

Faixa de Referncia de 100(1- )% : [Percentil de ordem /2 ; Percentil de ordem (1- /2)]


Assim, a Faixa de Referncia de 95% : [Percentil de ordem 0,025; Percentil de ordem 0,975]

Percentil de ordem 0,025 (2,5%): 44 x 0,025 = 1,1 (arredonda para 2)


o
O 2 valor (em ordem crescente) X = 22
Portanto: P2,5% = 22

Percentil de ordem 0,975 (97,5%):


44 x 0,975 = 42,9 (arredonda para 43)
o
O 43 valor (em ordem crescente) X = 68
Pontanto: P97,5% = 68

Portanto, a Faixa de Referncia de 95% para o nmero de colnias por cultura de escarro em pessoas sadias
[22; 68] colnias, pelo mtodo dos percentis.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

57

Observao: Fazendo pelo mtodo dos percentis ensinado na apostila Introduo Bioestatstica.
Na tabela a seguir, vemos que as ordem de percentis que mais se aproximam de 0,025 e 0,975 so,
o
respectivamente 0,034091 e 0,965909 correspondendo aos valores de X (n de colnias por cultura de
escarro) X = 22 e X = 68.
Portanto, a Faixa de Referncia de 95% para o nmero de colnias por cultura de escarro em pessoas
sadias [22 ; 68], pelo mtodo dos percentis da Apostila.
o

N de ordem
i
1
2
3
.....
42
43
44

X: n de colnias por
culura de escarro
17
22
23
.....
60
68
79

Ordem do percentil
( i- 0,5)/44
0,011364
0,034091
0,056818
.....
0,943182
0,965909
0,988636

Mais prximo do P 0,025

Mais prximo do P 0,975

Observao: Note que, na verdade, a faixa de referncia encontrada acima de


(96, 5909 - 3,4091) 93%
(ii)

Mtodo da Curva de Gauss


.

Faixa de Referncia de 100(1- )% : [ z(/2) ; + z(/2) ]


Como e s so desconhecidos, vamos estim-los por x = 34,3 e s =14,2 e, assim, a Faixa de Referncia de
.
.
95% torna-se: [ x - z(/2) s ; x - z(s/2) s ] = [34,3 - z(0,025)(14,2) ; 34,3 + z(0,025)(14,2)]
Vamos descobrir na Tabela da Distribuio Normal Padronizada (Tabela Z) quem z(0,025):
Pela definio, z(0,025) o valor de Z tal que P(Z > z(0,025)) = 0,025.
Pela simetria em torno de zero da distribuio de Z, temos: P(Z < -z(0,025)) = 0,025.
Na tabela Z temos que P(Z < -1,96) = 0,024998 0,025
Portanto, -z(0,025) = -1,96 e assim, z(0,025) = 1,96.
A Faixa de Referncia de 95% torna-se:
[34,3 - z(0,025)(14,2) ; 34,3 + z(0,025)(14,2)] = [34,3 1,96(14,2) ; 34,3 + 1,96(14,2)] = [6 ; 62] colnias
Portanto, a Faixa de Referncia de 95% para o nmero de colnias por cultura de escarro em pessoas sadias
[6; 62], pelo mtodo da curva de Gauss.

Note que as Faixas de Referncia de 95% para o nmero de colnias por cultura de escarro em pessoas
sadias fornecida pelo dois mtodos diferem bastante no limite inferior:
Mtodo da Curva de Gauss:
Mtodo dos Percentis:

FR(95%) : [ 6; 62] colnias


FR(95%): [22 ; 68] colnias

Como vimos no item (a) a Curva Normal (Curva de Gauss) no se ajusta bem a esses dados. Assim, o mtodo
mais indicado neste caso o Mtodo dos Percentis.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

58

Exerccio (7.2)
a) A Faixa de Referncia de 80% ser dada por FR(80%) = [P0,10; P0,90], pois:
100(1-)% = 80%
(1- ) = 80/100 = 0,80
= 1- 0,80 = 0,20
/2 = 0,20/2 = 0,10
1 /2 = 1- 0,10 = 0,90
O percentil de ordem 10% (P0,10) pode ser encontrado procurando-se o valor de hemoglobina ao qual
corresponde a proporo acumulada igual a 0,10 na ogiva. Este valor aproximadamente 11 g/dl.
O percentil de ordem 90% (P0,90) pode ser encontrado procurando-se o valor de hemoglobina ao qual
corresponde a proporo acumulada igual a 0,90 na ogiva. Este valor aproximadamente 17 g/dl.
A Faixa de Referncia de 80% so os valores de hemoglobina de 11 a 17 g/dl. Isto significa que
aproximadamente 80% das mulheres sadias desta populao tm valor de hemoglobina entre 11 e 17 g/dl.

b.1) Um mtodo de diagnstico para anemia baseado nessa faixa de referncia daria resultado:
negativo, se a paciente tivesse valor de hemoglobina entre 11 e 17 g/dl;
positivo,
se a paciente tivesse esse valor menor do que 11 g/dl ou maior do que 17 g/dl.
Como sabemos, a especificidade de um teste estimada como sendo a frequncia de negativos entre as
pessoas sadias. Nesse problema, todas as mulheres so sadias, e 80% tem valores entre 11 e 17 g/dl, sendo
consideradas negativas. Assim, estimativa da especificidade justamente 80%. Esse um valor aproximado,
j que a prpria faixa aproximada.
b.2) Como tambm sabemos, a sensibilidade de um teste estimada como sendo a frequncia de positivos
entre as pessoas doentes. Aqui, a sensibilidade desse mtodo no pode ser calculada somente com esses
dados, pois precisamos de uma amostra de pessoas doentes para sabermos quantas delas sero consideradas
positivas pelo mtodo.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

59

Seo 8: Intervalos de Confiana


Exerccio (8.1)
a) Populao: todos os pacientes atendidos no posto durante os ltimos trs anos.
Amostra: os 70 pacientes adultos selecionados.
b) Varivel X: idade dos pacientes desta populao (varivel contnua)
Parmetro : idade mdia dos pacientes desta populao

Estimativa Pontual para :

x= 36,86 anos (mdia amostral)

Intervalo de 100(1-)% de Confiana para :

s
s
; x + Z ( / 2 )
x Z ( / 2 )
com 0<<1
n
n

s = 17,79 anos (desvio padro amostral)


n = 70 (tamanho da amostra)

Intervalo de 90% de Confiana para : (a amostra grande n = 70 > 30)


100(1- ) = 90
1- = 0,90
= 0,10
/2 = 0,05
Z0,05 = 1,64 pois P( Z > 1,64 ) 0,05

s
s
IC 90% = x Z ( 0, 05 )
; x + Z ( 0 ,05 )

n
n

17,79
17,79

= 36,86 1,64
;36,86 + 1,64

70
70

= [36,86 3, 49;36,86 + 3, 49] = [33,37;40,35]

Interpretao: A idade de mdia dos adultos que frequentam o posto est entre 33,37 e 40,35 anos com
90% de confiana.

Intervalo de 95% de Confiana para :

100(1-) = 95
1- = 0,95
= 0,05
/2 = 0,025
Z0,025 = 1,96 pois P( Z > 1,96 ) 0,025

s
s

IC 95% = x Z ( 0 , 025)
; x + Z (0 , 025 )

n
n

17,79
17,79

= 36,86 1,96
;36,86 + 1,96

70
70

= [36,86 4,17;36,86 + 4,17] = [32,69;41,03]

Interpretao: A idade de mdia dos adultos que frequentam o posto est entre 32,69 e 41,03 anos com
95% de confiana.
Comparando os dois intervalos: o IC de 95% mais amplo que o IC de 90%.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

60

c) Varivel Y: ser ou no analfabeto (varivel categrica)


Parmetro p: proporo de analfabetos nesta populao

= 19 70 = 0,27
Estimativa Pontual para p: p
ou seja, 27% dos pacientes deste posto so analfabetos

Intervalo de 90% de Confiana para p: (a amostra grande n = 70 > 30)

100(1- ) = 90
1- = 0,90
= 0,10
/2 = 0,05
Z0,05 = 1,64 pois P( Z > 1,64 ) 0,05

p (1 p )
0,27(0,73)
%
IC 90
= p Z ( / 2)
= 0,27 1,64

p
n
70

= [0,27 0,09] = [0,18;0,36]

Interpretao: A proporo de frequentadores adultos do posto que so analfabetos est entre 18% e 36%
com 90% de confiana.

Intervalo de 95% de Confiana para p:

100(1-) = 95
1- = 0,95
= 0,05
/2 = 0,025
Z0,025 = 1,96 pois P( Z > 1,96 ) 0,025

0,27(0,73)
%
IC 95
= 0, 27 1,96
p

70

= [0, 27 0,10] = [0,17;0,37]

Interpretao: A proporo de frequentadores adultos do posto que so analfabetos est entre 17% e 37%
com 95% de confiana.
Comparando os dois intervalos: o IC de 95% mais amplo que o IC de 90%.

Exerccio (8.2)
Varivel X: produo de leite (em litros) na primeira lactao de vacas desta fazenda
(varivel contnua)
Parmetro : produo mdia de leite na primeira lactao de vacas desta fazenda

Estimativa Pontual para :

x= 1500 litros (mdia amostral)

s = 300 litros (desvio padro amostral)


n = 20 (tamanho da amostra)

Intervalo de 98% de Confiana para : (a amostra pequena n = 20 < 30)

100(1-) = 98
1- = 0,98
= 0,02
/2 = 0,01
gl = n-1 = 20-1 =19
t(19; 0,01) = 2,539

s
300
IC 98% = x t19 ;0, 01)
= 1500 2,539

20
n

= [1500 170] = [1330;1670] litros.

Interpretao: A produo mdia de leite na primeira lactao de vacas desta fazenda est entre
1330 e 1670 litros, com 98% de confiana.

Exerccio (8.3)
Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

61

a) Porque a informao sobre o parmetro (neste caso, a mdia da varivel na populao) muito vaga. Por
exemplo, se o intervalo de confiana para a altura mdia das pessoas adultas de uma cidade vai de 1 a
2,50 metros, no saberemos dizer se esta cidade habitada por adultos que tendem a ser altos ou baixos.
Alm disso, no seria necessrio um estudo para obter esta informao, pois j sabemos que os adultos
no medem menos que um metro nem mais que 2,50 metros.
b) Reduzir o nvel de confiana 100(1-) significa aumentar o valor de , o que leva a valor menor de z /2,
reduzindo a amplitude do intervalo.
Por exemplo: passar de 100(1-) = 95 para 100(1-) = 90 significa passar de = 0,05 para = 0,10.
Assim, passamos de Z/2 = Z0,025= 1,96 para Z/2 = Z0,05 = 1,64.
Desse modo, quanto menor o nvel de confiana requerido, menor ser a amplitude do
intervalo.
c) Esta parcela seria menor. Desse modo, quanto menor a variabilidade da varivel, menor ser a
amplitude do intervalo.
d) Esta parcela seria menor. Desse modo, quanto maior o tamanho da amostra, menor ser a amplitude
do intervalo.
e) Apenas o tamanho da amostra (n), que ele pode aumentar, e o nvel de confiana do intervalo (100(1)), que ele pode reduzir. O pesquisador no tem controle sobre a variabilidade (
) da caracterstica
estudada.
f)

Aumentar o tamanho da amostra (n).

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

62

Seo 9: Conceitos Bsicos de Testes de Hipteses


Situao 1:
a) Parmetro a ser testado

b) Hiptese Nula
Hiptese Alternativa
c) Erro Tipo I:
Erro Tipo II:

: tempo mdio (em horas) da execuo de uma nova


tcnica para identificar bactrias em hemoculturas.
H0: = 40,5 horas
Ha: < 40,5 horas

Concluir que o novo mtodo tem tempo mdio de execuo menor do que
40,5 horas quando, na verdade, seu tempo mdio igual a 40,5 horas.
Concluir que novo mtodo tem tempo mdio de execuo igual a 40,5 horas
quando, na verdade, seu tempo mdio menor do que 40,5 horas.

Situao 2:
a) Parmetro a ser testado

b) Hiptese Nula
Hiptese Alternativa
c) Erro Tipo I:

Erro Tipo II:

p: proporo de homens com mais de 65 anos de uma cidade


que morrem dentro de um ano.
H0: p = 0,04
Ha: p > 0,04

Concluir que a proporo de homens com mais de 65 anos que morrem dentro de
um ano nessa cidade maior do que 0,04 quando, na verdade, essa proporo
igual a 0,04.
Concluir que a proporo de homens com mais de 65 anos que morrem dentro de
um ano nessa cidade igual a 0,04 quando, na verdade, essa proporo
aumentou.

Situao 3:
a) Parmetro a ser testado

b) Hiptese Nula
Hiptese Alternativa

: peso mdio (em quilos) de frangos vendidos pelo fornecedor


novo
H0: = 3 quilos
Ha: > 3 quilos

c) Erro Tipo I:

Concluir que o peso mdio dos frangos do novo fornecedor maior do que 3
quilos quando, na verdade, o peso mdio igual a 3 quilos.
Erro Tipo II: Concluir que o peso mdio dos frangos do novo fornecedor igual a 3 quilos
quando, na verdade, peso mdio maior do que 3 quilos.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

63

Situao 4:
a) Parmetro a ser testado

b) Hiptese Nula
Hiptese Alternativa

: quantidade mdia de cido acetil saliclico (gramas por


comprimido) de certo analgsico.
H0: = 5,5 gramas
Ha: 5,5 gramas

c) Erro Tipo I:

Concluir que a quantidade mdia de cido acetil saliclico nos comprimidos do


analgsico diferente da especificada quando, na verdade, ela igual a 5,5 g.
d) Erro Tipo II: Concluir que a quantidade mdia de cido acetil saliclico nos comprimidos do
analgsico igual especificada quando, na verdade, ela diferente de 5,5 g.

Situao 5:
a) Parmetro a ser testado:

p: proporo de sementes que germinam

b) Hiptese Nula
Hiptese Alternativa

H0: p = 0,95
Ha: p < 0,95

c) Erro Tipo I:
Erro Tipo II:

Concluir que a proporo de sementes que germinam menor de 0,95 quando,


na verdade, essa proporo igual a 0,95.
Concluir que a proporo de sementes que germinam igual a 0,95 quando, na
verdade, essa proporo menor do que 0,95.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

64

Seo 10: Testes de Hipteses para Uma Populao


Situao 1:
H0: = 40,5 horas
Ha: < 40,5 horas

obs

n = 18 (amostra pequena)
mdia amostral = 39,42;
desvio-padro amostral = 1,96

39,42 40,50
= 2,34
1,96 18

RR: Tobs < -t(17;0,05)

que seja

Tobs < -1,74

Como o valor de Tobs est na Regio de Rejeio, rejeitamos H0, ao nvel de significncia de 5%.
Valor P = P[t17 < -2,34] = ?
Deve-se encontrar a P[t17 > 2,34], que, por simetria, igual a P[t17 < -2,34]).
Na linha 17 da tabela t-student, no existe o valor 2,34. Ele est entre os valores 2,110 e 2,567, que
correspondem s colunas 0,025 e 0,01, respectivamente. Assim, P[t17 > 2,34] est entre 0,01 e 0,025.
Consequentemente, o valor P est entre 1% e 2,5%.
Concluso: Rejeita-se a hiptese de que o tempo mdio de execuo do novo mtodo igual a 40,5 horas, em
favor da hiptese de que ele menor do que 40,5 horas, ao nvel de significncia de 5% (0,01 < valor P <
0,025).

Situao 2:
H0: p = 0,04
Ha: p > 0,04

obs

n = 1000 (amostra grande); proporo amostral = 60/1000 = 0,06

0,06 0,04
= 3,23
0,04(1 0,04)
1000

RR: Zobs > z0,05

Zobs > 1,64


Como o valor de Zobs est na Regio de Rejeio, rejeitamos H0, ao nvel de significncia de 5%.
Valor P = P[Z > 3,23] = ?
O ltimo valor da tabela Z 3,10. Como 3,23 > 3,10, podemos concluir que P[Z > 3,23] 0,000.
Concluso: rejeitamos a hiptese de que a proporo de idosos que morrem por ano nessa cidade igual a
4%, em favor da hiptese de que essa proporo maior 4%, ao nvel de significncia de 5% (valor P
0,000).

Situao 3:
H0: = 3 quilos
Ha: > 3 quilos

3,2 3,0
= 2,5
25

T obs = 0,4

n = 25 (amostra pequena); mdia amostral = 3,2; desvio-padro amostral = 0,4


RR: Tobs > t24;0,05
Tobs > 1,711

Como o valor de Tobs est na Regio de Rejeio, rejeitamos H0, ao nvel de significncia de 5%.
Valor P = P[t24 > 2,5] = ?
Na linha 24 da tabela t-student, no existe o valor 2,5. Ele est entre as colunas do 0,01 e 0,005. Assim, 0,005
< P[t24 > 0,016] < 0,01. Consequentemente, 0,005 < valor P < 0,01.
65
Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

Concluso: Ao nvel de significncia de 5%, rejeitamos a hiptese de que o peso mdio de frangos vendidos
pelo fornecedor novo igual a 3 quilos, em favor da hiptese de que o peso mdio desses frangos maior do
que 3 quilos (0,005 < valor P < 0,01).

Situao 4:
H0: = 5,5 gramas
Ha: 5,5 gramasn = 40 (amostra grande); mdia amostral = 5,2 ; desvio-padro amostral = 0,7

5,2 5,5
= 2,71
40

Z obs = 0,7

RR: Zobs < -z0,025 ou Zobs > z0,025


Zobs < -1,96 ou Zobs > 1,96

Como o valor de Zobs est na Regio de Rejeio, rejeitamos H0, ao nvel de significncia de 5%.
Valor P = 2 x P[Z > |-2,71|] = 2 x P[Z > 2,71] = (por simetria) 2 x P[Z <-2,71] = 2 x 0,0034 = 0,0068.
Concluso: rejeitamos a hiptese de que a quantidade mdia de cido acetil saliclico (gramas por
comprimido) de certo analgsico igual a 5,5 gramas ao nvel de significncia de 5% (valor P = 0,0068).
Nessa situao, podemos usar o intervalo de confiana para realizar o teste de hipteses, pois a hiptese
alternativa bilateral. Como queremos um teste a 5% de significncia, calcularemos um intervalo de 95% de
confiana para a quantidade mdia de cido acetil saliclico, por comprimido.
Intervalo de 95% de Confiana para : (a amostra grande n = 40 > 30)
100(1-) = 95
1- = 0,95
= 0,05
/2 = 0,025
Z 0,025 = 1,96

IC

95%

IC

95%

IC

95%

= x z 0 ,0 2 5
n

0 ,7

= 5 ,2 1 ,9 6
= [ 5 ,2 0 ,2 ]
4 0

= [ 5 ,0 ; 5 , 4 ]

Interpretao: A quantidade mdia de cido acetil saliclico, por comprimido, est entre 5,0 e 5,4
gramas, com 95% de confiana.
Teste de hipteses baseado no intervalo de confiana: como o valor 5,5 no pertence ao intervalo de 95% de
confiana para a quantidade mdia de cido acetil saliclico, por comprimido, rejeitamos a hiptese de que a
quantidade mdia de cido acetil saliclico de certo analgsico igual a 5,5 gramas ao nvel de significncia
de 5%.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

66

Situao 5:
H0: p = 0,95
Ha: p < 0,95

obs

n = 1000 (amostra grande); proporo amostral = 940/1000 = 0,94

0,94 0,95
= 1,45
0,95(1 0,95)
1000

RR: Zobs < -z0,05

Zobs < -1,64


Como o valor de Zobs no est na Regio de Rejeio, no rejeitamos H0, ao nvel de significncia de 5%.
Valor P = P[Z < -1,45] = 0,0735
Concluso: no rejeitamos a hiptese de que a proporo de sementes que germinam igual a 95%
(valorP=0,0735).

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

67

Seo 11: Testes de Hipteses para Duas Populaes


Exerccio (11.1)
a)
H0: a mdia da diferena dos escores depois e antes do programa igual a zero
(o programa no funciona);
Ha: a mdia da diferena dos escores depois e antes do programa maior do que zero
(o programa aumenta a habilidade);
o

N do
aluno
1
2
3
4
5

Escores de abdominais
Antes
Depois
12
15
10
9
23
25
25
25
29
31

6
7
8
9
10

Mdia das diferenas:

32
14
17
19
20

d =

30
16
20
22
22

Diferenas (d)
(Depois Antes)
15 - 12 = 3
9 - 10 = -1
25 - 23 = 2
25 - 25 = 0
31 - 29 = 2
30 - 32 = -2
16 - 14 = 2
20 - 17 = 3
22 - 19 = 3
22 - 20 = 2

d = 1,4
sd = 1,8

3 1 + 2 + 0 + 2 2 + 2 + 3 + 3 + 2 14
=
= 1,4
10
10

Desvio padro das diferenas:

sd =

obs

(3 1,4) 2 + (1 1,4) 2 + ... + (3 1,4) 2 + ( 2 1,4) 2


= 1,8
10 1

1,4 0
= 2,45
1,8 10

RR: Tobs > t(10-1);0,05 = 1,833

Como Tobs est na regio de rejeio, rejeitamos H0 ao nvel de 5% de significncia.


b) Valor P = P[t9>2,45] = ? O valor 2,45 no existe na linha 9 da tabela t-Student. Ele est entre os valores
2,262 e 2,821, correspondentes s colunas 0,025 e 0,01. Assim, a P[t9>2,45] est entre 1% e 2,5% .
Como o valor P menor do que o nvel de significncia (5%), rejeitamos H0.
Concluso: Ao nvel de 5% de significncia, rejeitamos a hiptese de que a mdia dos escores depois do
programa igual mdia dos escores antes do programa, em favor da hiptese de que a mdia dos escores
depois do programa maior do que mdia dos escores antes do programa (0,01< valor p < 0,025).
c) 100(1-)% = 95%; 1- = 0,95 ; =0,05 ; /2 = 0,025;
t9;0,025 = 2,262

[1,4 2,262 1,8 / 10] = [1,4 0,57]


[0,83 ; 1,97]

A diferena mdia entre os escores depois e antes do programa est entre 0,83 e 1,97, com 95% de
confiana.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

68

Exerccio (11.2)
1 : peso mdio no grupo I;
2 : peso mdio no grupo II;
a)

H0: 1 = 2
Ha: 1 > 2

x1 = 120

s = 21,39 n1 = 12

x2 = 101

s = 20,62 n2 = 7

T obs =

120 101
= 1,89
1 1
+
2112
,
12 7

comb

(12 1)(21,29) 2 + (7 1)(20,62) 2


= 2112
,
12 + 7 2

RR: Tobs > t(12+7-2);0,01


Tobs > 2,57
Como Tobs no est na regio de rejeio, no rejeitamos H0, ao nvel de 1% de significncia.
Concluso: Ao nvel de 1% de significncia, no rejeitamos a hiptese de que o ganho mdio de peso no
grupo alimentado com dieta de alto contedo proteico igual ao ganho mdio de peso no grupo alimentado
com dieta de baixo contedo proteico.
b) Valor P= P[t17 > 1,89] = ? Na linha 17 da tabela t-Student, no existe o valor 1,89. Ele est entre os valores
1,74 e 2,11, correspondentes s colunas 0,05 e 0,025, respectivamente. Assim, P[t17 > 1,89] est entre
2,5% e 5%. O valor P est entre 0,025 e 0,05.
Como o valor P maior do que 1%, no rejeitamos H0.
Concluso: Ao nvel de 1% de significncia, no existem evidncias para rejeitarmos a hiptese de que o
ganho mdio de peso no grupo alimentado com dieta de alto contedo proteico igual ao ganho mdio de
peso no grupo alimentado com dieta de baixo contedo proteico (0,025 < valor P < 0,05).
1 1
c)
+ = [19 21,18]
(120 101) 2,11 21,12
12
7

[ -2,18 ; 40,18]
A diferena entre o ganho mdio de peso no grupo alimentado com dieta de alto contedo proteico e o ganho
mdio de peso no grupo alimentado com dieta de baixo contedo proteico est entre -2,18 gramas e 40,18
gramas, com 95% de confiana.
Observao para todo o exerccio: se estivssemos testando a H0: 1 = 2, a 5% de significncia, ns
rejeitaramos H0 em favor de H1: 1 > 2, pois o valor P < 0,05. Porm, se estivssemos testando a H1: 1
2, no teramos evidncias suficientes para rejeitar H0, a 5% de significncia, pois o intervalo de 95% de
confiana para a diferena entre as duas mdias contm o valor zero. Isso mostra que a no indicao de uma
direo para o valor da diferena entre as duas mdias (maior ou menor do que zero) reduz o poder do teste
para rejeitar H0. Ou seja, quando o teste unilateral, estamos fornecendo uma informao a mais para o
teste, e no precisaremos de evidncias amostrais to fortes para rejeitar H0 quanto precisaramos se o teste
fosse bilateral, onde no fornecemos nenhuma informao a mais.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

69

Exerccio (11.3)
1 : peso mdio dos bebs no grupo de mes que usaram cocana durante toda a gravidez;
2 : peso mdio dos bebs no grupo de mes que no tm histria de uso de cocana;
a)
H0: 1 = 2
Ha: 1 < 2

x1 = 2829

s = 708

n1 = 36

x 2 = 3436

s = 628

n2 = 39

obs

2829 3436
708 2 628 2
+
36
39

607
= 3,92
155,04

RR: Zobs < -z0,05


Zobs < -1,64
Como Zobs est na regio de rejeio, rejeitamos a hiptese de que o peso mdio dos bebs no grupo de
mes que usaram cocana durante toda a gravidez igual ao peso mdio dos bebs no grupo de mes que
no tm histria de uso de cocana, em favor da hiptese de que o peso mdio dos bebs do primeiro grupo
de mes menor do que o peso mdio dos bebs do segundo grupo de mes, ao nvel de 5 % de
significncia.
b) Valor P = P[Z < -3,92] 0,000 , pois o menor valor da tabela Normal padro -3,10.
Concluso: ao nvel de 1% de significncia, rejeitamos a hiptese de que o peso mdio dos bebs no grupo de
mes que usaram cocana durante toda a gravidez igual ao peso mdio dos bebs no grupo de mes que
no tm histria de uso de cocana, em favor da hiptese de que o peso mdio dos bebs do primeiro grupo
de mes menor do que o peso mdio dos bebs do segundo grupo de mes (valor P 0,000).

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

70

Exerccio (11.4)
pC : proporo de pessoas que tomaram vitamina C e ficaram livres de doenas
do trato respiratrio
pP : proporo de pessoas que tomaram o placebo e ficaram livres de doenas do trato
respiratrio
H0: pC = pP

105
p C = 407 = 0,26

p p =

76
= 0,18
411

Ha: pC > pP

obs

0,26 0,18
0,07
=
= 2,77
0,26(1 0,26) 0,18(1 0,18) 0,028
+
407
411

RR: Zobs > z0,025

RR: Zobs > 1,64

Como Zobs est na regio de rejeio, rejeitamos H0, ao nvel de significncia de 5%.
Valor P = P[Z>2,77] = P[Z < -2,77] = 0,0028.
Concluso: Ao nvel de significncia de 5%, rejeitamos a hiptese de que a proporo de pessoas que
tomaram vitamina C e ficaram livres de doenas do trato respiratrio igual proporo de pessoas que
tomaram placebo e ficaram livres de doenas do trato respiratrio, em favor da hiptese de que a proporo
de pessoas livres de doenas no trato respiratrio entre as que tomaram vitamina C maior do que essa
proporo entre as que tomaram placebo (valor P = 0,0028).
Observao: Tambm rejeitaramos a hiptese nula se o nvel de significncia fosse 1%.

Exerccio (11.5)
Para que um desfecho possa ser considerado associado ao uso de reposio hormonal, devemos rejeitar a
hipotse nula no seu teste, ou seja, o Valor P de seu teste deve ser menor que o nvel de significncia, neste
caso, 5%.
Assim, qualquer evento tromboemblico pode ser considerado, ao nvel de significncia de 5%, associado ao
uso de reposio hormonal (Valor P = 0,002). Em especial, a trombose venosa profunda (Valor P = 0,004).
Observaes:
1) O evento doena da vescula biliar tem Valor P igual a 5%, e pode ser considerado sob suspeita.
2) Note que 34 das 1.380 (2,46%) mulheres que fizeram uso desses hormnios tiveram algum evento
tromboemblico, contra apenas 12 das 1383 (0,87%) mulheres do grupo placebo. Assim, o risco de ter
algum evento tromboemblico 2,46/0,87= 2,84 vezes maior para as mulheres que usam reposio
hormonal. O valor 2,84 aproximadamente aquele que est na coluna do Risco Relativo (RR). A mesma
concluso pode ser feita para o desfecho trombose venosa profunda, cujo risco 3,18 vezes maior entre
as mulheres que fizeram reposio hormonal do que entre as mulheres do grupo placebo.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

71

Seo 12: Teste Qui-Quadrado


Exerccio (12.1)
Este um Teste de Homogeneidade, pois deseja comparar a eficcia das vacinas padro e nova.
H0: As propores de animais que contraram a doena so iguais para as duas vacinas
Ha: As propores de animais que contraram a doena so diferentes para as duas vacinas
Tabela de valores esperados sob a hiptese de homogeneidade
Brucelose
Vacina
Total
Sim
No
Padro
14x15/30 =7
14x15/30=7
14
Nova
16x15/30=8
16x15/30=8
16
Total
15
15
30

(10 7) 2 ( 4 7) 2 (5 8) 2 (11 8) 2
+
+
+
7
7
8
8
2
=
+
+
+
=
1
,
286
1
,
286
1125
,
1125
,
4
,
821
X

Estatstica de Teste:

Regio de Rejeio:

X
2
obs

2
1;0,05

> 3,84 (X

= 3,84)

Verificao: Como 4,821 est na regio de rejeio, rejeitamos a hiptese nula ao nvel de 5% de
significncia.
2

Clculo do Valor P: Valor P = P[X 1 > 4,821] = ?


Na tabela Qui-quadrado, na linha 1, no existe o valor 4,821. Ele est entre os valores 3,84 e 5,024,
2
correspondentes s colunas do 5% e 2,5%, respectivamente. Assim, P[X 1 > 4,821] est entre 0,025 e 0,05.
Concluso: ao nvel de significncia de 5%, rejeitamos a hiptese de homogeneidade entre as propores de
animais que contraram a doena nos grupos vacina padro e vacina nova, em favor da hiptese de que essas
propores so diferentes (0,025 < valor P < 0,05).
Medindo a associao entre variveis: o Risco Relativo
O risco (probabilidade) de uma bezerra que recebeu a vacina padro contrair brucelose estimado em
11/14=0,71. Para as bezerras que receberam a vacina nova, este risco estimado por 5/16=0,31. Logo, as
bezerras vacinadas com vacina padro apresentam um risco de desenvolver brucelose 2,29 (0,71/0,31) vezes
maior que o risco das bezerras vacinadas com a vacina nova. O valor 2,29 uma estimativa do risco relativo.
O risco relativo definido como RR=p1/p2, onde p1 e a probabilidade de ocorrncia do evento (brucelose) no
grupo 1 (vacina padro) e p2 a probabilidade de ocorrncia do evento (brucelose) no grupo 2 (vacina nova).
O risco relativo calculado somente para estudos prospectivos, onde a ocorrncia do evento de interesse
2
(brucelose) precedida pelos tratamentos (vacina nova e vacina padro). As hipteses de teste X podem ser
escritas em funo de RR como :
H0 : RR = 1
x
Ha: RR 1,
pois,
se no existe associao entre as variveis (H0), os riscos nos dois grupos so iguais e RR=1.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

72

Exerccio (12.2)
Teste de Homogeneidade
H0: As propores de contaminao so iguais para todos os tipos de fertilizantes
Ha: As propores de contaminao so diferentes para todos os tipos de fertilizantes
Tabela de valores esperados sob a hiptese de homogeneidade
Contaminao
Fertilizante
Sim
No
Nenhum
101x44/450=9,88
101x406/450=91,12
Nitrognio
95x44/450=9,29
95x406/450=85,71
Esterco
113x44/450=11,05
113x406/450=101,95
Nitrognio e Esterco
141x44/450=13,79
141x406/450=127,21
Total
44
406

Total
101
95
113
141
450

(16 9,88) 2 (85 91,12) 2 (10 9,29) 2 (85 85,71) 2


+
+
+
+
X
9,88
9112
,
9,29
85,71
(4 11,05) 2 (109 101,95) 2 (14 13,79) 2 (127 127,21) 2
+
+
+
+
11,05
101,95
13,79
127,21

Estatstica de Teste:

= 3.798 + 0.412 + 0.054 + 0.006 + 4.497 + 0.487 + 0.003 + 0.000 = 9.258

X obs > X (4-1)(2-1);0,05


2
2
X obs > X 3;0,05
2
X obs > 7,82

Regio de Rejeio:

Verificao: Como 9,258 est na regio de rejeio, rejeitamos a hiptese nula ao nvel de 5% de
significncia.
Concluso: ao nvel de significncia de 5%, rejeitamos a hiptese de homogeneidade entre as propores de
contaminao dos tipos de fertilizantes estudados, em favor da hiptese de que essas propores so
diferentes (0,025<valorP<0,05).
2

Clculo do Valor P: Valor P = P[X 3 > 9,258] = ?.


Na tabela Qui-quadrado, na linha 3, no existe o valor 9,258.
Ele est entre os valores 7,82 e 9,35, correspondentes s colunas do 5%e 2,5%, respectivamente. Assim,
2
P[X 3 > 9,258] est entre 0,025 e 0,05.
Observao
Os tratamentos Nenhum, Nitrognio, Esterco e Nitrognio e Esterco podem ser vistos como a
combinao de dois fatores: Nitrognio (presente e ausente) e Esterco (presente e ausente), pois
Tratamento
Nitrognio ausente
Nitrognio ausente
Nitrognio presente
Nitrognio presente

+
+
+
+

Esterco ausente
Esterco presente
Esterco ausente
Esterco presente

=
=
=
=

Nenhum
Esterco
Nitrognio
Nitrognio e Esterco

A estrutura desse experimento chamada fatorial 2 a 2, pois existem dois fatores (Nitrognio e Esterco), cada
um com dois nveis (ausente e presente).

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

73

O grfico a seguir mostra as porcentagens de contaminao para os 4 tratamentos.

Porcentagens de contaminao por Bacterium


Phithotherum em plantao de batatas segundo
tipo de adubao

% de contaminao

0.25
0.2
0.15
Esterco presente
Esterco ausente

0.1
0.05
0
Ausente

Presente
Nitrognio

O grfico indica que, na ausncia de esterco (linha cheia), a adio de nitrognio diminui a porcentagem de
contaminao, mas, na presena do esterco (linha pontilhada), a adio do nitrognio aumenta a porcentagem
de contaminao. Em outras palavras, o efeito do nitrognio de aumentar a porcentagem de contaminao
quanto o esterco presente e de diminuir essa porcentagem quanto o esterco ausente. Esse fato indica
caracteriza a interao entre os fatores Esterco e Nitrognio, isto , o efeito do Nitrognio na porcentagem de
contaminao no o mesmo nos dois nveis de Esterco. Se no houvesse interao entre esse dois fatores,
as retas do grfico seriam paralelas.

Exerccio (12.3)
Esse um teste de independncia entre as variveis incidncia de parasitose e raa.
Hipteses:
H0: A incidncia de parasitose independe da raa do animal
(ou seja, as duas variveis no esto associadas)
Ha: A incidncia de parasitose depende da raa do animal
(ou seja, as duas variveis esto associadas)

Raa
Pura
No-pura
Total

Estatstica de Teste:

Tabela de valores esperados sob a hiptese de independncia (H0)


Incidncia de parasitas
Sim
700x155/1200=90,42
500x155/1200=64,58
155

No
700x1045/1200=609,58
500x1045/1200=435,42
1045

Total
700
500
1200

(105 90,42) 2 (595 609,58) 2 (50 64,58) 2 (450 435,42) 2


+
+
+
90,42
609 ,58
64,58
435,42

= 2,352 + 0,349 + 3,293 + 0,488 = 6,482


2
obs

Regio de Rejeio: Rejeita-se H0 se X

2
1;0,01

>

= 6,64

Verificao: Como 6,482 no est na regio de rejeio (6,482 > 6,64), no rejeitamos a hiptese nula ao
nvel de significncia de 1%.
Concluso: Ao nvel de significncia de 1%, no rejeitamos a hiptese de independncia entre a incidncia de
parasitose e a raa do animal (0,01 < valor P < 0,025).
Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

74

Clculo do Valor P:

2
1

Valor P = P[X

> 6,482] = ?

Na tabela Qui-Quadrado, na linha 1, no existe o valor 6,482.


Mas 6,482 est entre os valores 5,024 e 6,635, correspondentes s colunas de 2,5% e 1% de probabilidade,
2
respectivamente. Assim, P[X 1 > 6,482] est entre 0,01 e 0,025.
Desse modo, 0,01 < Valor P < 0,025.
Como Valor P > 0,01 (), no rejeitamos a hiptese nula ao nvel de significncia de 1%, confirmando (como
esperado) a concluso anterior.

Medindo a associao entre variveis: a Razo das Chances


Atravs de teste Qui-quadrado verificou-se a existncia de associao entre a incidncia de parasitose e
raa. Como quantificar esta associao? Quando as variveis so quantitativas, pode-se medir a associao
linear entre duas variveis atravs do coeficiente de correlao. Quando duas variveis so qualitativas, essa
medida seria o Risco Relativo. Porm, o Risco Relativo s pode ser calculado em estudos prospectivos, que
no o caso do estudo desse problema, pois os animais foram classificados simultaneamente quanto raa e
incidncia de parasitose (os grupos de raa no-pura e pura no foram fixados previamente e depois
contada a incidncia de parasitose). A medida alternativa ao Risco Relativo nesses casos a Razo das
Chances (RC). Chance definido como razo de probabilidades. A chance de ter parasitose no grupo de raa
pura, por exemplo, definido como a razo entre a probabilidade de ter parasitose e a probabilidade de no
ter parasitose, ou seja, (105/700) / (595/700) = 105/595 = 0,18. No grupo de raa no-pura, a chance de ter
parasitose 50/450 = 0,11. Comparando as chances nos dois grupos, temos que 0,176/0,111 = 1,59. Essa a
estimativa da Razo das Chances de parasitose entre os grupos de raa pura e no-pura. Interpretando esse
nmero, vemos que a chance de parasitose no grupo de raa pura 59% maior do que no grupo de raa nopura. De maneira geral, no caso de tabelas 2x2 como a que apresentamos a seguir
Resposta de Interesse
Sucesso
Fracasso
a
b
c
d
a+c
b+d

Grupo
A
B
Total

Total
a+b
c+d
a+b+c+d

a razo das chances de sucesso entre o grupo A e B estimada como


a
a+b
chance de sucesso no grupo A
RC =
=
chance de sucesso no grupo B

No caso do problema, RC =

b
a
a + b = b = ad .
c
c
b c
d
c+d
d
c+d

105
chance de parasitose no grupo raca pura
595 = 105 450 = 1,59
=
chance de parasitose no grupo raca nao - pura 50
50 595
450

Exerccio (12.4)
Esse um teste de independncia entre as variveis ocorrncia de tromboembolismo e grupo sanguneo.
Hipteses:
H0: A ocorrncia de tromboembolismo independe do grupo sanguneo
(ou seja, as duas variveis no esto associadas)
Ha: A ocorrncia de tromboembolismo depende do grupo sanguneo
(ou seja, as duas variveis esto associadas)

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

75

Grupo
Sanguneo
A
B
AB
O
Total

Estatstica de Teste:

Tabela de valores esperados sob a hiptese de independncia (H0)


Ocorrncia de tromboembolismo
Sim
79 x 56/1200 = 22,12
21 x 56/1200 = 7,56
27 x 561200 = 5,88
73 x 56/1200 = 20,44
56

X
+

No
79 x 144/1200 = 56,88
21 x 144/1200 = 19,44
27 x 144/1200 = 5,12
73 x 144/1200 = 52,56
144

Total
79
21
27
73
200

( 32 22 ,12 ) 2 ( 47 56 ,88 ) 2 (8 7 ,56 ) 2 (19 19 ,44 ) 2


+
+
+
+
22 ,12
56 ,88
7 ,56
19 ,44

( 7 5,88 ) 2 (14 5,12 ) 2 ( 9 20 ,44 ) 2 ( 64 52 ,56 ) 2


+
+
+
5,88
5,12
20 ,44
52 ,56

  
     

 !
#"$%&('$
)'*
2
obs

Regio de Rejeio: Rejeita-se H0 se X

2
3;0,01

>

= 11,345

Verificao: Como 15,354 est na regio de rejeio (15,354 > 11,345), rejeitamos a hiptese nula ao nvel de
significncia de 1%.
Concluso: Ao nvel de significncia de 1%, rejeitamos a hiptese de independncia a ocorrncia de
tromboembolismo e o grupo sanguneo (Valor P < 0,005).
Clculo do Valor P:

2
3

Valor P = P[X

> 15,354] = ?

Na tabela Qui-Quadrado, na linha 3, no existe o valor 15,354.


2
Ele maior do que o ltimo valor (12,838), correspondente coluna do 0,5%. Assim, P[X 3 > 15,354] menor
do que 0,5%. Desse modo, Valor P < 0,005.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

76

Referncias Bibliogrficas

Nogueira, M. L. G. et alli (1997), Introduo Bioestatstica, apostila do Instituto de Cincias Exatas da


UFMG.
Soares, J. F. et alli ( ), Introduo Estatstica, Editora Guanabara Dois

Triola, M. F. (1998), Introduo Estatstica, 7 Edio, LTC.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

77

Você também pode gostar