Escolar Documentos
Profissional Documentos
Cultura Documentos
Exercícios Resolvidos
Exercícios Resolvidos
LJ KNM*OQPSRTPSUTVXWDYMEWZVX[]\#U_^`VaWbM%c
dfeNghOQVi^kjmlon*V prqUTV`MEWZgQs*gtR]WZgtUuPos
vwZxw*y z {u|2z2}~wZxw*y z {u|
E_*Q`tu oSu*
TN*#m
f **0 0
*0 (
Exerccios Resolvidos em
Introduo Bioestatstica
ndice Geral
Primeira Parte - Enunciado dos Exerccios
31
Referncias Bibliogrficas
77
Agradecimento
Gostaramos de agradecer ao Prof. Alosio J. F. Ribeiro, do departamento de Estatstica da
UFMG, pela reviso cuidadosa deste trabalho e pelas valiosas contribuies,
principalmente na complementao da soluo dos exerccios da seo 12.
Primeira Parte:
Enunciado dos Exerccios
Seo 1:
Seo 2:
Seo 3:
Probabilidade
12
Seo 4:
14
Seo 5:
18
Seo 6:
19
Seo 7:
Faixas de Referncia
21
Seo 8:
Intervalos de Confiana
22
Seo 9:
23
Seo 10:
23
Seo 11:
24
Seo 12:
Teste Qui-Quadrado
27
b) O nmero de consultas mdicas feitas por ano por um associado de certo plano de sade.
Varivel do tipo _______________________ e _______________________
c) O teor de gordura, medido em gramas por 24 horas, nas fezes de crianas de 1 a 3 anos de idade.
Varivel do tipo _______________________ e _______________________
d) O tipo de droga que os participantes de certo estudo tomaram, registrados como: Droga A, Droga B e
placebo.
Varivel do tipo _______________________ e _______________________
f)
N de
erros
N de
erros
2.2)
Num estudo sobre a associao entre tromboembolismo e tipo sangneo, participaram 200
usurias de contraceptivo oral . Dessas mulheres, 55 tinham tromboembolismo. Quanto ao
grupo sanguneo, o tipo A foi o mais numeroso, com 83 mulheres, seguido dos grupos O e B,
com 79 e 27 mulheres, respectivamente. Das pacientes sadias, 70 eram do grupo O, 51 do grupo
A e 19 do grupo B.
a) A partir dessas informaes, preencha a Tabela 2.3 abaixo (Dica: comece encontrando os
totais de linha e coluna)
b) Utilizando a tabela preenchida no item a), compare os dois grupos de mulheres (sadias e
doentes) de forma grfica e/ou numrica.
Grupo
Sangneo
Tabela 2.3
Tromboembolismo
Doente
Sadia
A
B
AB
O
Total
2.3)
Total
200
Figura 2.1
35
Frequncia (%)
30
25
20
15
10
5
0
8
12
16
20
24
28
32
36
40
44
48
7.7
8.3
8.9
Frequncia (%)
30
20
10
0
2.9
3.5
4.1
4.7
5.3
5.9
6.5
7.1
2.4)
*Utilizando a ogiva apresentada a seguir (Figura 2.2), estime a mediana, o primeiro e o terceiro
quartis e o percentil de ordem 95. Interprete estes valores
90
80
70
60
50
40
30
20
10
0
5
10
15
20
25
30
35
40
45
Figura 2.2
2.5)
*O tempo (em meses) entre a remisso de uma doena e a recidiva de 48 pacientes de uma
determinada clnica mdica foi registrado. Os dados ordenados so apresentados a seguir, para
homens e mulheres
Homens:
2 2 3 4 4 4 4 7 7 7 8 9 9 10 12
15 15 15
16
18
18
22 22 24
Mulheres:
2 2 3 3 4 4 5 5 6 6 7 7 7 7 8 8 8 8 10 10 11 11 12 18
*A mdia do nvel de colesterol de um grupo de jovens recrutas 205 mg/dl e o desvio padro
22 mg/dl. Para um grupo de oficiais, entretanto, a mdia obtida foi 244 mg/dl e o desvio padro
45 mg/dl. Compare os dois grupos quanto homogeneidade da varivel nvel de colesterol.
2.7)
Considere as alturas dos cascos de uma amostra de 48 tartarugas pintadas (24 machos e 24
fmeas).
Machos
Fmeas
35
40
38
51
35
41
38
51
35
41
42
53
37
41
42
55
37
42
44
56
38
43
46
57
38
44
48
60
39
45
49
61
39
45
50
62
40
45
51
63
40
46
51
63
40
47
51
67
a) Complete a tabela de estatsticas descritivas para a varivel altura de casco , segundo o sexo da
tartaruga.
Grupo
Mdia
Macho
Fmea
40,54
52,04
Desvio
padro
3,54
8,05
Coeficiente de
Variao
Mediana
Primeiro
Quartil
Terceiro
Quartil
b) Construa um box-plot para as medidas de altura de casco de cada grupo (Utilize a mesma escala nos
dois grficos para que eles sejam comparveis).
c) Usando os resultados do item (a) e os box-plots em (b), compare os dois grupos de tartaruga pintada
quanto a varivel altura do casco.
10
Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG
2.8)
No do
aluno
1
2
3
4
5
6
7
8
9
10
Tabela 2.4
Escores de abdominais
Antes
12
10
23
25
29
32
14
17
19
20
Depois
15
9
25
25
31
30
16
20
22
22
11
Seo 3: Probabilidade
3.1)
Considere um baralho com 52 cartas numeradas, 13 para cada um dos naipes (ouros, copas,
espada e paus). Seja o experimento de retirar uma carta aleatoriamente, observando seu naipe,
nmero e/ou cor (vermelha ou preta).
Sejam os seguintes eventos:
A = [a carta retirada um s];
V = [a carta retirada vermelha] e
E = [a carta retirada de espada].
Calcule:
Suponha que voc retire do baralho, aleatoriamente, duas cartas do seguinte modo: retira uma, observa
seu naipe, nmero e cor, e a coloca de volta. Em seguida, retira a segunda carta, observa seu naipe,
nmero e cor, e a coloca de volta. Sejam os eventos:
A1 = [a primeira carta retirada um s] e A2 = [a segunda carta retirada um s].
f.1) Sem fazer clculos, voc acha que os eventos A1 e A2 so independentes ? Ou seja, voc acha que o
fato da primeira carta retirada ter sido um s altera a probabilidade de que a segunda carta seja um s ?
Ento, qual o valor de P(A2|A1) ?
f.2) Qual a probabilidade das duas cartas retiradas serem um s ? Ou seja, calcule P(A1 A2).
3.2)
* bem conhecido que o daltonismo hereditrio. Devido ao fato do gene responsvel ser
ligado ao sexo, o daltonismo ocorre mais freqentemente nos homens do que nas mulheres. As
10.000 pessoas de uma amostra aleatria de uma populao foram classificadas de acordo com
seu sexo e se sofrem ou no de daltonismo da cor vermelha-verde. Os resultados so
mostrados na Tabela 3.1.
Daltonismo
Presente
Ausente
Total
Notao:
Sexo Masculino: M
Sexo Feminino: F
Tabela 3.1
Sexo
Masculino
423
4848
Total
Feminino
65
4664
10.000
Daltonismo Presente: D
Daltonismo Ausente: D
12
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
Daltnica
No daltnica
Do sexo masculino
Do sexo feminino
Daltnica e do sexo masculino
Daltnica e do sexo feminino
No daltnica e do sexo masculino
No daltnica e do sexo feminino
Daltnica dado que do sexo masculino
Daltnica dado que do sexo feminino
No daltnica dado que do sexo masculino
No daltnica dado que do sexo feminino
3.3)
A deteco precoce do cncer cervical crucial para o tratamento e cura da paciente. As 600
mulheres de amostra aleatria foram classificadas em um de dois grupos: com cncer ou
sem cncer atravs de bipsia cervical (Tabela 3.2).
Outro teste que pode ser usado no diagnstico do cncer cervical o papanicolau, mais barato
e mais rpido que a bipsia cervical. Para avaliar a qualidade de diagnstico do papanicolau, as
600 mulheres mencionadas anteriormente foram submetidas a este teste.
Os resultados do teste papanicolau so mostrados na Tabela 3.2 (Positivo indica que o teste
classifica a paciente como portadora do cncer; negativo, caso contrrio).
Assuma que o resultado da bipsia cervical certo.
Situao
da paciente
Com cncer
Sem cncer
Total
Tabela 3.2
Resultado do Papanicolau
Positivo
94
250
344
Negativo
6
250
256
Total
100
500
600
a) Estime a proporo de mulheres que tm cncer cervical na populao de onde foi retirada esta amostra
(ou seja, a prevalncia do cncer na populao).
b) Para quantas pacientes o teste papanicolau acertou o diagnstico ?
c) Para quantas pacientes o teste papanicolau errou o diagnstico ?
d) Qual a probabilidade do teste papanicolau ter resultado positivo dentre as pacientes que realmente tm
cncer ? (Esta probabilidade chamada sensibilidade do teste)
e) Qual a probabilidade do teste papanicolau ter resultado negativo dentre as pacientes que no tm cncer
? (Esta probabilidade chamada especificidade do teste)
f)
Qual a probabilidade de uma paciente realmente ter cncer dentre aquelas com resultado positivo no
teste papanicolau? (Esta probabilidade chamada valor de predio positiva do teste)
g) Qual a probabilidade de uma paciente realmente no ter cncer dentre aquelas com resultado negativo
no teste papanicolau? (Esta probabilidade chamada valor de predio negativa do teste)
h) Qual a probabilidade de uma paciente realmente no ter cncer dentre aquelas com resultado positivo
no teste papanicolau? (Esta a proporo de falsos positivos do teste)
i) Qual a probabilidade de uma paciente realmente ter cncer dentre aquelas com resultado negativo no
teste papanicolau? (Esta a proporo de falsos negativos do teste)
13
b) A probabilidade do paciente no estar doente dado que seu resultado no teste foi negativo.
Definio de: __________________________________________
d) A probabilidade do paciente realmente estar doente dado que seu resultado no teste foi positivo.
Definio de: __________________________________________
f)
4.2)
Um dos testes utilizados para detectar a doena de Aujelski em sunos, tambm conhecida
como pseudo-raiva, o teste ELISA. Na tabela abaixo so apresentados os resultados deste
teste para 52 sunos portadores da doena e 238 no portadores da doena.
Tabela 4.1
Teste ELISA
Doena de Aujelski
Doente
Total
No doente D
(D)
Positivo (+)
Negativo (- )
Total
51
1
6
232
57
233
52
238
290
14
4.3)
Tabela 4.2
Valores de CFC
Infarto agudo
do miocrdio
Doente
(D)
No doente (D )
Total
Total
CFC < 80
CFC 280
15
114
118
15
97
1
230
130
129
133
98
360
Sejam dois testes de diagnstico de infarto agudo do miocrdio baseados no valor de CFC do
paciente:
Teste 1: O resultado positivo se os valores de CFC so 80 e negativo caso contrrio;
Teste 2: O resultado positivo se os valores de CFC so 280 e negativo caso contrrio.
a) Calcule a sensibilidade e a especificidade do Teste 1 e do Teste 2. Comente.
b) Calcule o VPP, VPN, PFP e PFN do Teste 1 e do Teste 2. Comente.
4.4)
Sabe-se que o Valor de Predio Positiva (VPP) e o Valor de Predio Negativa (VPN) de um
teste clnico de diagnstico de uma doena depende da Prevalncia (p) da doena na
populao, da Sensibilidade (s) e da Especificidade (e) do teste.
Estas relaes podem ser expressas atravs das equaes:
VPP =
sp
sp + (1 e)(1 p)
VPN =
e
e(1 p)
e(1 p) + (1 s) p
A Figura 4.1 mostra a relao entre VPP e Especificidade e entre VPN e Especificidade para
vrios valores de Sensibilidade, mantendo-se p=0,05. Analogamente, estas mesmas relaes
so mostradas Figura 4.2, com p=0,5.
a) Considere as figuras 4.1(a) e 4.2(a). Para um valor fixo de prevalncia e sensibilidade, o que acontece
com o VPP medida que a especificidade aumenta ?
b) Considere as figuras 4.1(b) e 4.2(b). Para um valor fixo de prevalncia e sensibilidade, o que acontece
com o VPN medida que a especificidade aumenta ?
15
ii. Para um valor fixo de especificidade, qual , aproximadamente, o aumento que se tem no VPP
quando se passa de s=0,7 para s=0,95 ?
iii. O teste ser poderoso para confirmar a presena da doena se ele tiver PFP grande ou pequena?
iv. Suponha que se queria que o teste seja poderoso para confirmar a presena da doena em uma
populao com p=0,5. Baseado na sua resposta em (iii) e comparando suas respostas em (i) e (ii), voc
acha melhor trabalhar para aumentar a sensibilidade ou a especificidade do teste ?
d) Considere a Figura 4.1(b), onde a prevalncia est fixa em p=0,05
i. Para um valor fixo de sensibilidade, qual , aproximadamente, o aumento que se tem no VPN quando
se passa de e=0,7 para e=0,95 ?
ii. Para um valor fixo de especificidade, qual , aproximadamente, o aumento que se tem no VPN
quando se passa de s=0,7 para s=0,95 ?
iii. O teste ser poderoso para descartar a presena da doena se ele tiver PFN grande ou
pequena?
iv. Suponha que se queira que o teste seja poderoso para descartar a presena da doena em uma
populao com p=0,05. Baseado na sua resposta em (iii) e comparando suas respostas em (i) e (ii), voc
acha melhor trabalhar para aumentar a sensibilidade ou a especificidade do teste ?
16
Figura 4.1
(b)
(a)
Prevalncia = 0,05
0,6
Prevalncia = 0,05
1
0,5
0,4
0,99
s= 0.7
VPP 0,3
s = 0.8
VPN 0,98
s = 0.9
0,2
s = 0.95
0,97
0,1
0
0,7
0,8
0,9
0,95
0,96
0,70
Especificidade
0,80
0,90
0,95
Especificidade
Figura 4.2
(b)
(a)
Prevalncia = 0,5
1
Prevalncia = 0,5
1
0,9
0,9
s= 0.7
VPP 0,8
s = 0.8
VPN 0,8
s = 0.9
0,7
s = 0.95
0,7
0,6
0,6
0,7
0,8
0,9
0,95
0,7
Especificidade
0,8
0,9
0,95
Especificidade
17
5.2)
5.3)
*Suponha que o nmero de unidades vendidas de um medicamento por dia numa rede de
drogarias tenha uma distribuio de Poisson com mdia 3 (
= 3).
A probabilidade de que um casal com olhos azuis escuros tenha filhos com olhos azuis de
. Se esse casal tiver 3 filhos, qual a probabilidade de que pelo menos 2 tenham olhos azuis?
5.4)
5.5)
Em uma certa populao, a probabilidade de um menino ser daltnico 0,08. Num grupo de 4
meninos vindos dessa populao, qual a probabilidade de 3 no serem daltnicos ?
5.6)
Um produtor de sementes vende pacotes com 10 sementes cada. Os pacotes que apresentam
mais de quatro sementes sem germinar sero indenizados. A probabilidade de uma semente
germinar 0,8.
5.7)
Suponha que o nmero mdio de colnias de bactrias por 10 ml de gua de um lago seja 3.
18
Suponha que a quantidade de ferro srico de indivduos sadios de uma populao (varivel X)
tenha distribuio Normal com parmetros = 100 mcg/dl e = 25 mcg/ dl.
Corresponde a
Z igual a ...
P(X x ) =
Um valor de X
igual a ...
Corresponde a
Z igual a ...
3
P(X x ) =
-2
0,022750
0,158655
125
59
1,64
-1,28
0,100273
0,248252
117
90
0,4
Obs: Use duas casas decimais para Z, nenhuma para X e seis para P(X x ) e P(X x )
i. Qual a probabilidade de X assumir um valor entre 68 e 110 mcg/dl ?
Se tomarmos uma amostra aleatria de 500 indivduos sadios desta populao, quantos
indivduos podemos esperar que tenham quantidade de ferro srio entre 68 e 110 mcg/dl ?
ii. Qual o intervalo [x1;x2] simtrico em torno da mdia, que contm 50% dos valores de X ?
iii. Qual o intervalo [x3;x4] simtrico em torno da mdia, que contm 95% dos valores de X ?
6.2)
*Suponha que a concentrao srica de tiroxina T4(D) em ces machos sadios tenha
distribuio Normal com mdia 2,04 mcg/100ml e desvio padro 0,78 mcg/100ml.
b) Se considerarmos 200 desses ces, quantos se poderia esperar que tivessem uma concentrao srica
entre 2,20 e 3,80 mcg/100ml ?
c) Qual intervalo de valores, simtrico em torno da mdia, abrange 98% dos ces sadios ?
6.3) 1Os prazos de durao de gravidez tm distribuio Gaussiana com mdia de 268 dias e
desvio-padro de 15 dias. Definindo como prematura uma criana que nascer com menos de
247 dias de gestao, responda :
19
6.4)
a) Escolhida uma pessoa aleatoriamente, qual a probabilidade de que ela seja admita por essa
organizao?
b) Definindo como gnio uma pessoa que tenha seu escore de Q.I. situado entre os 1% mais altos, qual
seria o valor para o escore de Q.I. que separaria os gnios das pessoas comuns?
20
17 22 23 23 23 23 24 24 24 24 24 24 25 25 25 25 25 25 25 26 28 28
29 30 30 31 31 35 35 35 36 40 41 41 41 42 51 54 56 56 58 60 68 79
(n = 44 pessoas;
x = 34,3 colnias por cultura de escarro; s =14,2 colnias por cultura de escarro)
7.2)
a) Construa uma Faixa de Referncia de 80% para o valor de hemoglobina em mulheres sadias usando o
Mtodo dos Percentis. Interprete o resultado obtido.
b) A partir da interpretao da faixa de referncia calculada em a), responda:
b.1) qual seria a especificidade de um mtodo de diagnstico de anemia baseado nessa faixa
de referncia?
b.2) qual seria a sensibilidade?
1,0
Proporo Acumulada
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
10
15
20
Hemoglobina (g/dl)
21
Num estudo para descrever o perfil dos pacientes adultos atendidos no ambulatrio de um
posto de sade, uma amostra de 70 pacientes adultos foi selecionada ao acaso entre o total de
pacientes atendidos no posto durante os ltimos trs anos, coletando-se dos pronturios
desses pacientes dados relativos idade, escolaridade e a outros fatores de interesse.
Para a varivel idade, observou-se uma mdia amostral de 36,86 anos com um desvio padro
amostral de 17,79 anos. Para a varivel escolaridade, observou-se que 19 pacientes da amostra
eram analfabetos.
8.2)
8.3)
IC 100(1 )% x z / 2
; x + z / 2
.
n
n
Note que o intervalo simtrico em torno da mdia amostral x e que, quanto menor a parcela
Caso o pesquisador queira um intervalo curto e com nvel de confiana alto (ex. 98%, 99%), o que ele
deveria fazer ?
22
23
No do
aluno
1
2
3
4
5
6
7
8
9
10
Tabela 11.1
Escores de abdominais
Antes
12
10
23
25
29
32
14
17
19
20
Depois
15
9
25
25
31
30
16
20
22
22
a) Faa um teste de hipteses (ao nvel de significncia = 5%) para verificar se o programa de fortificao
isomtrica aumenta a habilidade em executar abdominais em dois minutos.
(Dica: tome a diferena de depois-antes e teste se depois > antes )
b) Calcule o valor p do teste de hipteses acima. Como voc chegaria concluso do teste do item (a)
usando a informao do valor p ?
c) Construa e interprete um Intervalo de 95% de Confiana para a diferena entre a habilidade mdia depois
do programa e a habilidade mdia antes do programa.
11.2) *Em um experimento, dois grupos de ratos fmeas foram alimentados com dietas apresentando
alto e baixo contedo de protena. O quadro abaixo fornece, para cada rato, o ganho de peso,
o
o
em gramas, entre o 28 e o 84 dia de vida.
Contedo de
protena
Alto
Baixo
Ganho de peso
123 134 146 104 119 124 161 107 83 113 129 97
70 118 101 85 107 132 94
a) Ao nvel de significncia de 1%, h evidncia estatstica de que a dieta com alto contedo de protena
aumenta o ganho de peso?
b) Calcule o valor P e use-o para responder pergunta do item (a).
c) Construa e interprete um intervalo de 95% de confiana para a diferena entre os ganhos mdios de peso
com as dietas de alto e baixo contedo de protena.
24
11.3) *Em um estudo sobre a influncia do uso de cocana no peso de crianas nascidas de mes
dependentes, pesquisadores trabalharam com dois grupos de crianas nascidas a termo: o
primeiro grupo era composto de mes que usaram regularmente a droga durante toda a
gravidez (Grupo I) e o segundo, de mes que no tinham histria ou evidncia de uso de
cocana (Grupo II). A hiptese dos pesquisadores era de que o peso mdio de crianas de mes
dependentes menor do que o peso mdio de crianas de mes no-dependentes. Os
resultados so apresentados abaixo:.
Grupo
I
II
Tamanho da amostra
36
39
a) Usando um nvel de significncia igual a 5%, teste a hiptese dos pesquisadores. (Para isso, estabeleas
as hipteses nula e alternativa adequadas, construa a regio de rejeio, calcule o valor da estatstica de
teste e conclua).
b) Calcule o Valor P do teste. Use o Valor P obtido para responder questo formulada no enunciado do
problema, com nvel de significncia de 1%.
11.4) *Em um estudo publicado no Canadian Medical Association Journal em novembro de 1972,
procurou-se investigar o efeito do uso da vitamina C na preveno de resfriados. Para isso,
realizou-se o seguinte experimento: por um determinado perodo de tempo, 407 indivduos
tomaram fortes doses de vitamina C e 411 receberam placebo. No grupo da vitamina, 105
participantes ficaram livres de doenas do trato respiratrio, enquanto, no grupo placebo, esse
nmero foi de apenas 76 participantes. O que os pesquisadores puderam concluir? (Use =
0,05 e calcule o Valor P)
25
11.5) Em um estudo para determinar se o tratamento com estrognio e progestina altera o risco de
eventos de doena coronariana (DC) em mulheres na ps-menopausa com doena coronariana
estabelecida, um total de 2.763 destas mulheres foram divididas aleatoriamente em dois
grupos: 1.380 fizeram uso desses hormnios e o restante fez uso de um placebo.
A Figura 11.1 mostra os resultados publicados na edio brasileira do Journal of American
Medical Association em setembro de 1999. Para cada desfecho considerado nas linhas da
tabela, corresponde, na ltima coluna, o Valor P do teste:
H0: O desfecho no est associado ao uso dos hormnios;
H1: O desfecho est associado ao uso dos hormnios.
Analisando o Valor P, quais os desfechos podem ser considerados associados ao uso de
reposio hormonal, ao nvel de significncia de 5% ?
Figura 11.1
26
Vacina
Padro
Nova
Total
Tabela 12.1
Brucelose
Sim
10
5
15
Total
No
4
11
15
14
16
30
Existe diferena estatisticamente significativa entre as propores de bezerras que contraram brucelose
usando a nova vacina e a vacina padro? (Use o teste Qui-Quadrado, com nvel de significncia de 5%, e
calcule o valor P).
Fertilizante
Nenhum
Nitrognio
Esterco
Nitrognio e Esterco
Total
Tabela 12.2
Contaminao
Sim
16
10
4
14
44
No
85
85
109
127
406
Total
101
95
113
141
450
Existe efeito de fertilizante na incidncia desse tipo de bactria nas plantaes de batata? (Use o teste QuiQuadrado, com nvel de significncia de 5%, e calcule o valor P).
27
12.3) Pesquisadores de doenas parasitrias em animais de grande porte suspeitam que a incidncia
de certos parasitas esteja associada raa do animal, pura ou no-pura. Num estudo para
verificar essa suspeita, 1200 animais selecionados aleatoriamente de uma grande fazenda
foram classificados segundo sua raa e incidncia de parasitose (berne), dando origem aos
dados na Tabela 12.3.
Raa
Pura
No-pura
Total
Tabela 12.3
Incidncia de parasitas
Sim
105
50
155
No
595
450
1045
Total
700
500
1200
Existem evidncias estatsticas suficientes nesses dados para verificar a hiptese de que a raa do animal e a
incidncia de parasitas estejam associadas ? (Use nvel de significncia igual a 1% e calcule o valor P).
12.4)
Grupo
Sangneo
A
B
AB
O
Total
Tabela 12.4
Tromboembolismo
Doente
32
8
7
9
56
Sadia
47
19
14
64
144
Total
79
27
21
73
200
Existem evidncias estatsticas suficientes nesses dados para verificar a hiptese de que a presena do
tromboembolismo e o grupo sanguneo estejam associados ? (Use nvel de significncia igual a 1% e calcule o
valor P).
28
Segunda Parte:
Resoluo dos Exerccios
29
ndice
Seo 1:
31
Seo 2:
33
Seo 3:
Probabilidade
41
Seo 4:
44
Seo 5:
47
Seo 6:
51
Seo 7:
Faixas de Referncia
57
Seo 8:
Intervalos de Confiana
60
Seo 9:
63
Seo 10:
65
Seo 11:
68
Seo 12:
Teste Qui-Quadrado
72
30
Quantitativa e Discreta
Exerccio (1.2)
a) Estudo do tipo experimental.
Varivel resposta:
Grupos comparados:
Na verdade, no comparam grupos, apenas estudaram quem tinha vida sexual intensa dentre os que
tinham a varivel resposta positiva (sentiam-se jovens). O que deveria ter sido feito era entrevistar dois
grupos: pessoas com vida sexual intensa e pessoas com vida sexual fraca. Para cada grupo, classificar os
componentes em pessoas que sentem-se jovens e pessoas que no se sentem jovens. Finalmente, verificar
se h (ou no) maior proporo de pessoas que sentem-se jovens dentre os de vida sexual intensa do que
entre aquelas de vida sexual fraca.
Ganho de peso
- Ratos com mutao no tal gene;
- Ratos sem mutao no tal gene.
31
Para a varivel resposta ocorrncia de derrame hemorrgico temos a comparao entre os seguintes
grupos:
f)
Ocorrncia de tuberculose
- Crianas com a marca da vacina BCG;
- Crianas sem a marca da vacina BCG .
Nvel de testosterona
- Torcedores de futebol e basquete quando seus times ganharam;
- Torcedores de futebol e basquete quando seus times perderam;
32
Observao: a soma da coluna Frequncia Relativa (%) tem que ser 100,00 . No entanto, por causa de
arredondamentos, algumas vezes os valores dessa coluna somaro 100,01 (ou 99,99). Para corrigir o
problema, podemos subtrair (ou somar) 0,01 frequncia relativa da classe com maior frequncia. A
mesma observao vale para quando estivermos usando somente uma casa decimal aps a vrgula.
Nesse caso, o total da coluna Frequncia Relativa (%) tem que ser 100,0 e, se ocorrer o problema, a
correo pode ser feita subtraindo-se (ou somando-se) 0,1 frequncia relativa da classe com maior
frequncia.
Como podemos notar pela anlise dos histogramas a seguir, a distribuio de frequncia dos erros de
digitao da Escola A assimtrica com concentrao esquerda, enquanto a distribuio de frequncia dos
erros de digitao da Escola B razoavelmente simtrica em torno da classe 25 a 30 erros. A assimetria com
concentrao esquerda dos dados da Escola A tambm pode ser percebida atravs da sua ogiva, que
cresce mais rpido do que a ogiva da Escola B, que tem distribuio simtrica. Atravs desses grficos,
podemos observar que os alunos da Escola A tendem a errar menos do que os alunos do que os alunos a
Escola B.
33
Escola B
40
40
30
30
Frequncia (%)
Frequncia (%)
Escola A
20
10
20
10
0
10
15
20
25
30
35
40
10
15
20
Nmero de Erros
Frequncia (%)
Acumulada
100
80
60
40
20
0
10
15
20
25
30
35
40
25
Nmero de Erros
30
35
40
100
80
60
40
20
0
5
Nm ero de erros
10
15
20
25
30
35
40
Nm ero de Erros
Observao 1: Como gostaramos de comparar as duas escolas, os histogramas e as ogivas foram feitos
usando a frequncia relativa, pois os tamanhos das amostras so diferentes. Se os tamanhos das amostras
fossem iguais, a frequncia absoluta poderia ser usada, embora o uso da frequncia relativa torna os grficos
mais, digamos, teis, pois eles podero ser comparados com outros que tambm usem a frequncia relativa,
mesmo que as amostras sejam de tamanhos diferentes.
Observao 2: O primeiro ponto na ogiva deve ser o limite inferior da primeira classe, que corresponde
frequncia acumulada igual a 0, ou seja, abaixo desse limite no existe nenhum dado.
Exerccio (2.2)
a)
Grupo
Sangneo
A
B
AB
O
Total
Tabela 2.3
Tromboembolismo
Doente
Sadia
32
51
8
19
6
5
9
70
55
145
Total
83
27
11
79
200
Percebe-se que grande parte das pessoas nesse estudo sadia (72,5%).
Como as variveis em questo (presena de tromboembolismo e grupo sanguneo) so do tipo
qualitativas, poderemos usar os grficos de colunas (barras) ou de setores (torta) para representar
esses dados.
O grfico abaixo revela que a maioria dos pacientes da amostra tem o sangue do tipo A, seguido
pelas pessoas de sangue tipo O e tipo B, sendo que a minoria tem o sangue do tipo AB.
34
Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG
39%
41%
A
B
AB
O
6%
14%
frequencia relativa
(%)
O grfico a seguir representa a frequncia relativa da doena dentro de cada grupo sanguneo. A
frequncia relativa tem que ser usada porque os grupos de sangue tm tamanhos diferentes. Usamos
o grfico de colunas por ser de melhor visualizao, nesse caso em que temos 4 categorias (os tipos
sanguneos), ao invs de usarmos quatro grficos de setores.
100
80
60
Doente
40
Sadio
20
0
A
AB
grupo sanguneo
Pela tabela do exerccio, temos que os pacientes sadios representam a maioria (72,5%) dos 200 pacientes
amostrados. No grfico acima, podemos observar que, nos grupos sanguneos A, B e O, essa maioria se
mantm, embora em propores diferentes (no grupo O, por exemplo, em torno de 90% das pessoas so
sadias). No entanto, no grupo AB, essas propores se invertem, sendo as pessoas doentes mais frequentes.
Isso pode ser um indcio de que a distribuio de frequncias do estado do paciente depende do tipo
sanguneo, ou seja, de que as variveis tipo sanguneo e presena de tromboembolismo podem estar
associadas. Esses conceitos sero melhor elaborados mais adiante, quando tratarmos de independncia de
eventos e associao de variveis.
Exerccio (2.3)
Os valores de presso intraocular tm distribuio de frequncias assimtrica com concentrao
esquerda. Isso significa que a maioria das pessoas avaliadas possui valores pequenos para a presso
intraocular e algumas poucas pessoas possuem valores mais altos.
J os valores de cido rico srico tm distribuio de frequncias que pode ser considerada simtrica em
torno do valores de 5,3 a 5,9 mg/100ml. Isto , a maioria das pessoas possui medidas de cido rico srico em
torno desses valores, que podem ser considerados tpicos. Algumas poucas pessoas possuem valores mais
altos (cauda direita do histograma) e outras poucas pessoas possuem valores mais baixos (cauda esquerda).
Essa questo dos valores que podem ser considerados tpicos ser melhor discutida mais adiante quando
tratarmos do conceito e construo das Faixas de Referncias .
35
Exerccio (2.4)
Queremos encontrar a mediana, que o valor que deixa 50% dos dados abaixo dela. Essa tambm
a definio do percentil de ordem 50. O primeiro quartil o valor que deixa um quarto dos dados (25%)
abaixo dele e, portanto, o percentil de ordem 25. O terceiro quartil o valor que deixa trs quartos
dos dados (75%) abaixo dele e, portanto, o percentil de ordem 75. O percentil de ordem 90 o valor
que deixa 90% dos dados abaixo dele.
O clculo de percentis atravs da ogiva aproximado, pois os dados foram agrupados para que o
ogiva pudesse ser construda. Para encontrar o percentil de ordem 50, por exemplo, devemos traar no
grfico, a partir do valor 50 no eixo das frequncias acumuladas, uma reta paralela ao eixo dos valores
(eixo X) at que essa reta encontre a curva (veja no grfico). No ponto em que a primeira reta encontrar
a curva, devemos traar uma outra reta, agora vertical, paralela ao eixo das frequncias (eixo Y), at
que essa reta encontre o eixo dos valores (eixo X). O ponto em que essa segunda reta encontrar o eixo
X ser o percentil de ordem 50. No grfico, ele aproximadamente o valor 19,0. Usamos o mesmo
raciocnio para encontrar qualquer outro percentil. No grfico, tambm esto ilustrados os
procedimentos para encontrar os valores dos percentis de ordem 25, 75 e 90 (P25, P75 e P90,
respectivamente). Os valores aproximados para esses percentis so P25 igual a 16,5 , P75 igual a 22,5
e P95 igual a 34,5.
P50 (mediana)
P25(Q2)
10
15
20
P75(Q3)
25
P95
30
35
40
45
Observe que o primeiro e o terceiro quartis (que deixam a mesma porcentagem de dados, 25%, abaixo e
acima deles, respectivamente) esto praticamente mesma distncia da mediana. Isso um ndicio de que a
distribuio desses dados de presso intraocular pode ser considerada simtrica. Outro indcio de simetria
que o percentil de ordem 5 (calcule!!!) e percentil de ordem 95 (que deixam a mesma porcentagem de dados,
5%, abaixo e acima deles, respectivamente) tambm esto praticamente mesma distncia da mediana.
Exerccio (2.5)
a) Diagrama de Pontos para os Tempos entre a Remisso e a Recidiva de uma Doena (em meses)
36
:
.
.
: .:
:. :. .
:. :
: .
-----+---------+---------+---------+---------+---------+- Homens
::
: :: :: :: : :.
.
-----+---------+---------+---------+---------+---------+- Mulheres
4,0
8,0
12,0
16,0
20,0
24,0
O grupo de mulheres tem, em geral, tempos entre a remisso e a recidiva dessa doena menores do que
os dos homens , sendo esses tempos mais homogneos no grupo feminino do que no grupo masculino.
b)
Ramo-e-folhas usando escala de 10 meses
Homens
0 | 2234444777899
0 | 223344556677778888
1 | 02555688
1 | 001128
2 | 224
Legenda: 0|2 : leia-se 2 meses
0 | 223344
0 | 556677778888
1 | 00112
1|8
Legenda: 0|2 : leia-se 2 meses
Comentrio: Atravs do ramo-e-folhas com escala de 10 meses, a distribuio de frequncias dos tempos nos
dois grupos poderiam ser consideradas assimtricas com concentrao esquerda. No entanto, o ramo-efolhas com escala mais refinada (5 meses) permite um melhor detalhamento da distribuio dos tempos nos
dois grupos. A distribuio dos tempos no grupo feminino ainda pode ser considerado assimtrico com
concentrao esquerda. Porm, a anlise do ramo-e-folhas do grupo masculino nos revela que o grupo dos
homens parece ser a unio de dois grupos : um, que tem tempos baixose, outro grupo que tem tempos
altos. O ponto de corte para a definio de um tempo baixo ou alto ficaria a critrio do pesquisador, mas
poderia ser, por exemplo, 12 meses. Essa subdiviso do grupo masculino tambm pode ser notada no
diagrama de pontos, embora de maneira mais sutil.
A escolha da escala a ser usado num grfico deve ser guiada pelo bom senso: nem muito grande, o que
tornaria a representao grosseira; nem muito pequena, o que diminuiria o poder de resumo da representao
grfica.
37
c)
Grupo
Homens
Mulheres
Mdia
10,71
7,17
Mediana
9,00
7,00
Desvio-padro
6,82
3,67
Coeficiente de Variao
0,64
0,51
Os homens possuem tempos entre a remisso e a recidiva da doena maiores, em mdia e em mediana,
do que os tempos das mulheres. A anlise do coeficiente de variao confirma o que j havamos observado
no diagrama de pontos: o grupo feminino possui tempos mais homogneos (C.V. menor) do que o grupo
masculino.
d)
Grupo
Todos
Mdia
8,94
Mediana
7,5
Desvio-padro
5,71
Coeficiente de Variao
0,64
Exerccio (2.6)
Para comparar a homogeneidade de dois grupos com mdias diferentes, precisamos calcular o
coeficiente de variao, que uma medida de variabilidade que considera a escala em que a varivel
est sendo medida.
Coeficiente de variao no grupo de recrutas:
Coeficiente de variao no grupo de oficiais:
22/205 = 0,11
45/244 = 0,18
O grupo de oficiais, alm de ter um nvel mdio de colesterol maior do que o nvel mdio dos
recrutas, tambm um grupo mais heterogneo com respeito a essa varivel (C.V. maior do que o
dos recrutas). Lembrando que o nvel de colesterol de um indivduo est relacionado tambm ao
seu grau de sedentarismo, a maior heterogeneidade do nvel de colesterol entre os oficiais pode
ser explicada pela diversidade de funes que esses oficiais desempenham , podendo implicar
em maior ou menor sedentarismo. J os jovens recrutas passam por constantes treinamentos e
exerccios, o que diminui a heterogeneidade entre eles desse importante fator associado ao nvel
de colesterol.
Exerccio (2.7)
a)
Grupo
Mdia
Macho
Fmea
40,54
52,04
Desvio
padro
3,54
8,05
Coeficiente de
Variao
0,09
0,15
Mediana
40,00
51,00
Primeiro
Quartil
38,00
47,00
Terceiro
Quartil
43,50
58,50
P10
35
42
38
Observao: existem vrios mtodos para o clculo de percentis e todos resultaro em valores aproximados.
O mtodo apresentado acima o mais simples de todos.
b)
Grupo
35
Grupo 1: macho
Grupo 2: fmea
45
55
65
Altura do casco
39
Exerccio (2.8)
No grfico abaixo, verificamos que a habilidade aumenta aps o programa de fortificao para a maioria
dos alunos (pontos acima da linha x=y). Para apenas trs deles, a habilidade igual ou menor aps o
programa. Portanto, o programa se mostrou eficaz para a maioria dos alunos. Note que os pontos tendem a se
posicionar ao longo de uma linha reta (no caso, a linha x=y).
Grfico de Disperso
30
3
Depois
9 10
8
20
1
10
10
20
30
Antes
Algumas consideraes sobre o relacionamento entre variveis quantitativas : no problema acima, dizemos
que os escores antes e depois do programa esto linearmente correlacionados. O Diagrama de Disperso
um modo de visualizar essa correlao. Para medir o grau de correlao, usa-se o Coeficiente de Correlao
Linear, que um nmero entre -1 e 1. Um coeficiente de correlao positivo (> 0) acontece se a relao entre
as duas variveis do tipo: quando o valor de uma varivel aumenta, o valor da outra aumenta tambm; ou,
quando o valor de uma varivel diminui, o valor da outra tambm diminui. J um coeficiente de correlao
negativo (< 0) acontece se a relao entre as duas variveis do tipo: quando o valor de uma varivel
aumenta, o valor da outra diminui; ou vice-versa. Um coeficiente de correlao linear igual a zero significa que
as duas variveis no possuem nenhuma correlao do tipo linear, mas podem estar relacionadas de uma
maneira no linear (quadrtica, por exemplo). Isso poder ser percebido atravs do exame do Diagrama de
Disperso. Assim, o Coeficiente de Correlao Linear e o Diagrama de Disperso so ferramentas que devem
ser usadas conjuntamente. Para mais detalhes sobre correlao, veja Soares, J. F. e colegas (Introduo
Estatstica) e tambm Triola, M. F. (Introduo Estatstica, Editora LTC) . O coeficiente de correlao entre
os escores antes e depois nesse exerccio de 0,97, indicando uma forte correlao positiva entre as medidas
antes e depois do programa de fortificao isomtrica.
40
Seo 3: Probabilidade
Exerccio (3.1)
g) Existem quatro ases em um baralho de 52 cartas. Assim P(A) = 4/52 = 1/13.
Metade as cartas (as de naipe ouros e copas) so vermelhas. Assim, P(V) = 26/52 = 1/2.
Cada naipe tem 13 cartas. Assim, P(E) = 13/52 = 1/4.
h) H duas cartas que so, ao mesmo tempo, ases e vermelhas (s de ouros e s de copas). Assim, P(A
V) = 2/52 = 1/26.
H somente uma carta que , ao mesmo tempo, s e de espada. Assim, P(A E) = 1/52.
Nenhuma carta , ao mesmo tempo, vermelha e de espada. Assim, P(V E) = 0, ou seja, os
eventos V e E so mutuamente exclusivos.
i)
P(A V) = P(A) + P(V) - P(A V) = 1/13 + 1/2 + 1/26 = (2 + 13 + 1)/26 = 16/26 = 8/13.
P(A E) = P(A) + P(E) - P(A E) = 1/13 + 1/4 - 1/52 = (4 + 13 +1)/52 = 18/52 = 9/26.
P(V E) = P(V) + P(E) - P(V E) = 1/2 + 1/4 - 0 = (2+1)/4 = 3/4.
j)
P(A|V) = P(A V)/P(V) = (1/26)/(1/2) = 1/13. Ou seja, como, das 26 cartas vermelhas, duas so ases,
ento P(A|V) = 2/26 = 1/13.
Como P(A|V) = P(A), os eventos A e V so independentes.
k) P(V|E) = P(V E)/P(E) = 0/(1/4) = 0. Ou seja, como nenhuma carta de espada vermelha, ento P(V|E) =
0.
Como P(V|E) P(V), os eventos V e E no so independentes.
f.1) O fato da primeira carta retirada ter sido um s no altera a probabilidade de que a segunda carta seja um
s, pois a primeira carta foi devolvida ao baralho, tornando, assim, a segunda retirada um experimento
idntico quele da primeira retirada. Ento, os eventos A1 e A2 so independentes: P(A2|A1) = P(A2) = 4/52 =
1/13.
f.2) Como os eventos A1 e A2 so independentes, P(A1 A2) = P(A1) x P(A2) = 1/13 x 1/13 = 1/169.
Exerccio (3.2)
Tabela 3.1
Sexo
Daltonismo
Presente
Ausente
Total
Sejam os eventos:
D=
ND =
M=
F =
Total
Masculino
423
4848
5271
Feminino
65
4664
4729
488
9512
10.000
41
Item (I)
a)
b)
c)
d)
e)
f)
Observe que:
P(DM) + P(DF) +
g)
h)
i)
j)
+ P(NDM) + P(NDF) = 1
Observe que:
P(D|M) + P(ND|M) = 1
P(D|F) + P(ND|F) = 1
Item (II)
P(D) = 0,0488
P(D|M) = 0,0803 P(D)
Portanto, os eventos ser daltnica e ser do sexo masculino no so independentes
Exerccio (3.3)
Situao
da paciente
Com cncer
Sem cncer
Total
Tabela 3.2
Resultado do Papanicolau
Total
Positivo
94
250
344
Negativo
6
250
256
100
500
600
Sejam os eventos: C =
{ter cncer}
S = {no ter cncer}
P=
{teste papanicolau positivo}
N = {teste papanicolau negativo}
b) (Pessoas com cncer e teste positivo) + (Pessoas sem cncer e teste negativo) = 94 + 250 = 344
c) (Pessoas com cncer e teste negativo) + (Pessoas sem cncer e teste positivo) = 6 + 250 = 256
42
f)
6/256 = 0,02
Observe que:
=1
43
PFP =
P( D | + )
VPN = P( D | - )
e = P( - | D )
c) Especificidade:
d) Valor de Predio Positiva:
VPP = P( D| + )
PFN =
P( D | - )
Sensibilidade:
s = P( + |D )
Exerccio (4.2)
a)
Sensibilidade :
Especificidade:
b)
s = p (+ | D ) =
e = P ( | D ) =
51
= 0,98
52
232
= 0,97
238
Prevalncia na amostra:
52
= 0,1793 p
290
Como a prevalncia da doena na amostra prxima da prevalncia na populao, podemos calcular VPP
e VPN diretamente da tabela.
51
= 0,89
57
232
VPN = P ( D | ) =
= 0,996
233
VPP = P ( D | + ) =
c) Suponha que p <<0,179. Ento, VPP << 0,89 e, da, PFP >>0,11. Portanto, um resultado positivo no teste
tem uma probabilidade considervel de ser um falso positivo. Como o tratamento caro, no podemos
correr um risco de estar tratando um falso positivo como muita frequncia (PFP). Assim, o melhor
procedimento diante de um resultado positivo fazer mais investigaes com outros testes de diagnstico.
44
Exerccio (4.3)
Resultados do Teste 1
Diagnstico do Teste
Negativo (CFC<80)
Positivo (CFC 80)
Infarto agudo
do miocrdio
Doente
(D)
No doente
(D )
Total
Doente
(D)
No doente
(D )
215
16
15
114
230
130
231
129
360
Resultados do Teste 2
Diagnstico do Teste
Negativo (CFC<280)
Positivo (CFC 280)
Infarto agudo
do miocrdio
Total
Total
Total
97
1
133
129
230
130
98
262
360
a)
Teste 1:
215
= 0,93
230
114
= 0,88
e1 = P ( | D ) =
130
s1 = P ( + | D ) =
Teste 2:
97
= 0,42
230
129
= 0,99
e 2 = P( | D ) =
130
s 2 = P (+ | D ) =
O Teste 1 tem sensibilidade e especificidade bastante altas, o que no ocorre com o Teste 2, que tem uma
especificidade muito alta e uma sensibilidade muito baixa. Assim, o Teste 1 o teste mais sensvel dentre os
dois e o Teste 2 o teste mais especfico. A qualidade do diagnstico baseado nesses testes, medida pelos
Valores de Predio Positiva e Negativa, depende da prevalncia da doena na populao onde eles sero
usados. Conforme for o objetivo do procedimento (descartar ou confirmar a presena da doena), um ou outro
teste ser mais til, como veremos no prximo item.
b) Considerando que os testes seriam aplicados numa populao cuja a prevalncia de infarto agudo no
corao aproximadamente igual prevalncia da amostra (230/360=0,64), poderemos calcular os
valores de predio positiva e negativa diretamente da tabela.
Teste 1:
VPP1 = P ( D | + ) =
VPN 1 = P ( D | ) =
215
= 0,93
231
114
= 0,88
129
Observao: a coincidncia do valor da sensibilidade com o valor do VPP, assim como do valor da
especificidade com o valor do VPN, para o teste 1, no regra. Apenas aconteceu porque os denominadores
so muito parecidos. Isso no ocorrer com o teste 2, como veremos a seguir.
Teste 2:
VPP2 = P ( D | +) =
VPN 2 = P ( D | ) =
97
= 0,99
98
129
= 0, 49
262
45
Comentrios sobre os testes: na escolha de qual teste deve ser usado, devemos estar atento ao objetivo do
procedimento e prevalncia da doena na populao onde ele for aplicado. Nesta anlise, vamos considerar
que a populao de trabalho tem uma prevalncia de infarto no corao aproximadamente igual prevalncia
desse estudo (64%). Se o objetivo do procedimento diagnstico for o de confirmar a doena, o Teste 2 deve
ser usado, pois seu VPP bastante alto (99%), isto , um paciente que tenha o resultado positivo no Teste 2
tem grande probabilidade de estar doente. Por outro lado, se o objetivo for o de descartar a doena, o Teste 2
no deve ser mais usado, pois seu VPN muito baixo, levando a uma Proporo de Falsos Negativos muito
alta (51%). Assim, ser prefervel usar o Teste 1, que apesar de ter uma Proporo de Falsos Negativos
considervel (12%), melhor do que o Teste 2 nesse ponto. Numa populao onde a prevalncia de infarto for
menor do que 64%, os valores de VPN para os dois testes vo aumentar e, ento, a utilizao do Teste 1 para
descartar a presena da doena ser mais confivel (a proporo de falsos negativos ir diminuir). Como j
sabemos, quanto menor a prevalncia, maior o valor de VPN e menor o valor de VPP.
Exerccio (4.4)
a) O VPP aumenta medida que a especificidade aumenta, com sensibilidade e prevalncia fixas.
b) O VPN aumenta medida que a especificidade aumenta, com sensibilidade e prevalncia fixas.
c)
i) VPP aumenta aproximadamente em 0,23 quando se passa de um teste com especificidade
igual a 0,7 para 0,95, com p = 0,5.
ii) VPP aumenta aproximadamente entre 0,02 e 0,06, dependendo do valor da especificidade,
quando se passa de um teste com sensibilidade igual a 0,7 para 0,95, com p = 0,5.
iii) O teste ser poderoso para confirmar a presena da doena se ele tiver uma PFP pequena, o
que significa que seu VPP grande. Ou seja, haver uma alta probabilidade de um paciente
ser doente dado que seu resultado no teste foi positivo.
iv) Deseja-se, neste caso, um teste com VPP alto. Desse modo, devemos aumentar a
especificidade do teste, pois, como foi mostrado nos itens (i) e (ii), o aumento da
especificidade provoca um maior acrscimo no VPP.
d)
i) VPN aumenta aproximadamente em 0,003 quando se passa de um teste com especificidade
igual a 0,7 para 0,95, com p = 0,05.
ii) VPN aumenta aproximadamente em 0,019, quando se passa de um teste com sensibilidade igual a 0,7
para 0,95, com p = 0,05.
iii) O teste ser poderoso para descartar a presena da doena se ele tiver uma PFN pequena, o que
significa que seu VPN grande. Ou seja, haver uma alta probabilidade de um paciente no ser doente
dado que seu resultado no teste foi negativo.
iv) Deseja-se, neste caso, um teste com VPN alto. Desse modo, devemos aumentar a
sensibilidade do teste, pois, como foi mostrado nos itens (i) e (ii), o aumento da
sensibilidade provoca um maior acrscimo no VPN.
46
X ~ Binomial (n=4,p=0,10)
4
P( X = x ) = 0,10 x (1 0,10) 4 x para x = 0,1,2, 3 ou 4
x
Assim,
Estamos interessados em saber qual a probabilidade de que todas as 4 pessoas desse grupo sejam Rh
negativo, ou seja, estamos interessados em saber qual a probabilidade da varivel X assumir o valor 4
(P[X=4]).
4
4!
P( X = 4) = 0,10 4 (1 0,10) 4 4 =
0,10 4 (0,90) 0 = 1 0,0001 1 = 0,0001
4!0!
4
Quando a probabilidade de uma pessoa ser Rh negativo 10%, a probabilidade de que todas as 4 pessoas
de um grupo sejam Rh negativo 0,01%.
Exerccio (5.2)
o
Assim,
Y ~ Binomial (n=3,p=0,25)
3
P(Y = y) = 0,25 y (1 0,25) 3 y
y
para y = 0,1,2 ou 3
Pelo menos duas crianas devem ter olhos azuis, ou seja, 2 ou todas as 3 crianas. Assim, estamos
interessados na probabilidade de Y assumir valores maiores ou iguais a 2, ou seja, os valores 2 ou 3.
P[Y2] = {P[Y=2]+P[Y=3]} =
=
3
0,252 (1 0,25) 32
2
3
0,253 (1 0,25) 33
3
3!
3!
0,25 2 (0,75) 1 +
0,25 3 (0,75) 0
2!1!
3!0!
47
Exerccio (5.3)
o
Assim,
P( X = x ) =
e 3 3 x
x!
para x = 0, 1, 2, ...
(e 2,72)
a)
0.1690
0.2240
0.1494
0.20
0.18
0.0027
0.0008
0.0002
0.0000
10
11
12
0.03
0.05
0.0081
0.08
0.10
0.0504
0.13
0.0216
0.1010
0.15
0.0498
Probabilidade
0.23
0.25
0.2240
0.28
0.30
0.00
Nm
ero de partculas
emvendidas
itidas porpor
segundo
Nmero
de unidades
dia
Note que a distribuio de probabilidade do nmero unidades do medicamento vendidas por dia assimtrica
com concentrao esquerda, isto , nos valores mais prximos do valor esperado (3). Para valores maiores
ou iguais a 12, a probabilidade to pequena que pode ser considerada igual a zero.
b) P[X entre 7 e 11] = P[7 X 11] = {P[X=7]+ P[X=8]+ P[X=9]+ P[X=10]+ P[X=11]}
Do grfico em a), temos que :
P[X entre 7 e 11] = 0,0216 + 0,0081 + 0,0027 + 0,0008 + 0,0002 = 0,0334
A probabilidade de que sejam vendidas entre 7 e 11 unidades do medicamento por dia de 3,34%.
c) Considerando que a procura pelo medicamento durante os dias da semana se mantm constante e que o
que ocorre em um dia independente do que ocorre em outro dia, podemos concluir que o nmero mdio de
unidades do medicamento vendidas em 1 semana de 7 x 3 = 21 unidades. Assim, o nmero de unidades do
medicamento vendidas em 1 semana tem distribuio de Poisson com mdia igual a 21.
48
e 21 21 y
Assim, P (Y = y ) =
, para y = 0, 1, 2, ...
y!
P (Y = 100) =
e 21 21100
=
100!
(e 2,72)
-35
0,0000000000000000000000000000000000135 (1,35 x 10 )
(uma probabilidade baixssima!!!)
Exerccio (5.4)
o
4
P( X = x) = 0,08 x (1 0,08) 4 x para x = 0,1,2, 3 ou 4
x
4
4!
0,08 (0,92) = 4 0,08 0,78 = 0,25
P ( X = 1) = 0,081 (1 0,08) 3 =
1!3!
1
Exerccio (5.5)
o
5 2 1
5!
1
1
1
= 1
= 0,004
P( X = 0) = =
0!5! 243
243
0 3 3
0
5 2 1
5! 2 1
2
= 5
= 0,041
P( X = 1) = =
1!4! 3 81
243
1 3 3
2
3
5 2 1
5! 4 1
4
= 10
= 0,165
P( X = 2) = =
2!3! 9 27
243
2 3 3
1
5 2 1
5! 8 1
8 1
= 10 = 0,329
P( X = 3) = =
3!2! 27 9
27 9
3 3 3
4
1
5 2 1
5! 16 1
16
= 5
= 0,329
P( X = 4) = =
4!1! 81 3
243
4 3 3
3
49
5 2 1
5! 32
32
P( X = 5) = =
1 = 1
= 0,132
5!0! 243
243
5 3 3
5
b)
i. P(X = 3) = 0,33
ii. P(X 1) = 1- P(X = 0) = 1- 0,004 = 0,996
iii. Mais de 2 animais no sobreviverem o mesmo que no no mximo 2 animais sobreviverem: P(X 2 )
= P(X = 0) + P(X = 1) +P(X = 2) = 0,004 + 0,041 + 0,165 = 0,210
Exerccio (5.6)
o
Assim,
10
P( X = x) = 0,2 x 0,810 x para x = 0,1,2,...,10
x
a) P ( X > 4) = 1 P ( X 4) = 1 (P ( X = 0) + P ( X = 1) + P ( X = 2) + P ( X = 3) + P ( X = 4) )
= 1 - 0,9672 = 0,0328
10
P ( X = 0) = 0,2 0 0,810 = 0,1074
0
10
P ( X = 1) = 0,21 0,8 9 = 0,2684
1
10
P ( X = 2) = 0,2 2 0,8 8 = 0,3020
2
10
P ( X = 3) = 0,2 3 0,8 7 = 0,2013
3
10
P ( X = 4) = 0,2 4 0,8 6 = 0,0881
4
b) O nmero esperado de pacotes indenizados quando 1000 so vendidos 1000 vezes a probabilidade de
um pacote ser indenizado, ou seja, 1000 x 0, 0328 33 pacotes.
50
Exerccio (5.7)
o
e 3 3 x
Assim, P( X = x) =
x!
para x = 0, 1, 2, ...
(e 2,72)
P( X = 0) =
e 3 30 2,72 3 1
1
=
=
= 0,05
0!
1
2,723
b) Qual a probabilidade de se achar pelo menos duas colnias em 10 ml de gua desse lago ?
e 9 9 x
x!
para x = 0, 1, 2, ...
(e 2,72)
P ( X 5) = 1 P ( X 4) = 1 (P ( X = 0) + P ( X = 1) + P ( X = 2) + P ( X = 3) + P ( X = 4) )
e 9 9 0 e 9 91 e 9 9 2 e 9 9 3 e 9 9 4
=
= 1
+
+
+
+
1!
2!
3!
4!
0!
1 (0,000123 + 0,001111 + 0,004998 + 0,014994 + 0,033737) = 1 0,056074 = 0,943926
51
25
50
125
Neste caso, Z =
75
Z=
150
175
X
.
X 100
25
52
d)
Um valor de X
igual a ...
Corresponde a
Z igual a ...
P(X x ) =
25
25 100
= 3
25
100 2 x 25
= 50
100 1 x 25
= 75
59
100 1,28 x 25
= 68
100 0,68 x 25
= 83
90
-2
Da tabela
Z = -1
Corresponde a
Z igual a ...
P(Z -3) =
0,001350
Um valor de X
igual a ...
100 + 3 x 25
= 175
P(Z -2) =
0,022750
100 + 2 x 25
= 150
Da tabela
Z=2
0,158655
125
125100
=1
25
100 + 1,64 x 25
= 141
1,64
P(Z -1,28) =
0,100273
100 + 1,28 x 25
= 132
Da tabela
Z = 1,28
0,248252
117
117100
= 0,68
25
P(Z -0,4) =
0,344578
100 + 0,4 x 25
= 110
90100
= 0,4
25
P(Z3) = P(Z-3)
= 0,001350
P(Z -1,64) =
59100
= 1,64
0,050503
25
-1,28
Da tabela
Z = -0,68
P(X x ) =
0,4
0,022750
P(Z1) = P(Z-1)
= 0,158655
P(Z1,64)=P(Z-1,64)
= 0,050503
0,100273
P(Z0,68) = P(Z-0,68)
0,248252
P(Z0,4) = P(Z-0,4)
= 0,344578
(i)
110 100
68 100
Z
P(68 X 110 ) = P
= P( 1,28 Z 0,40 )
25
25
(ii)
Devemos ter P(x1 < X < x2)= 0,50 e (100 x1) = (x2 100??pela simetria em torno da mdia.
x 100
x 100
P(x1 < X < x 2 ) = P 1
<Z< 2
= P (z1< Z < z 2 ) = 0,50
25
25
Pela simetria de Z em torno da mdia, z1= -z2 e ento: P ( z 2 < Z < z 2 ) = 0,50
1 0,50 0,50
=
= 0,25
2
2
Na Tabela Z vemos que P(Z < -0,67) = 0,251429 0,25. Portanto, -z2 = -0,67 e z2 = 0,67.
Assim:
x1 100
= z 2 x1 = 100 z 2 25 = 100 0,67 25 = 100 17 = 83
25
x 2 100
= z 2 x 2 = 100 + z 2 25 = 100 + 0,67 25 = 100 + 17 = 117
25
Portanto, o intervalo simtrico em torno da mdia 100 que abrange 50% das quantidades de ferro em
indivduos sadios [83;117] mcg/dl.
(iii)
Devemos ter P(x1 < X < x2)= 0,95 e (100 x1) = (x2 100) pela simetria em torno da mdia.
Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG
53
x 100
x 100
P(x1 < X < x 2 ) = P 1
<Z< 2
= P (z1< Z < z 2 ) = 0,95
25
25
Pela simetria de Z em torno da mdia, z1= -z2 e ento: P ( z 2 < Z < z 2 ) = 0,95
P( Z > z 2 ) = P( Z < z 2 ) =
1 0,95 0,05
=
= 0,025
2
2
Na Tabela Z vemos que P(Z < -1,96) = 0,024998 0,025. Portanto, -z2 = -1,96 e z2 = 1,96.
Assim:
x1 100
= z 2 x1 = 100 z 2 25 = 100 1,96 25 = 100 49 = 51
25
x 2 100
= z 2 x 2 = 100 + z 2 25 = 100 + 01,96 25 = 100 + 49 = 149
25
Portanto, o intervalo simtrico em torno da mdia 100 que abrange 95% das quantidades de ferro em
indivduos sadios [51;149] mcg/dl.
Exerccio (6.2)
X: concentrao srica de tiroxina T4(D) em ces machos sadios
X ~ Normal (
= 2,04 ; = 0,78)
a)
i)
2,81 2,04
ii)
1,8 2,04
iii)
2,50 2,04
1,01 2,04
P (1,01 X 2,50 ) = P
Z
= P ( 1,32 Z 0,59 )
0,78
0,78
b)
3,80 2,04
2,20 2,04
P(2,20 X 3,80) = P
Z
= P(0,21 Z 2,26 )
0,78
0,78
54
c)
Devemos ter P(x1 < X < x2)= 0,98 e (2,04 x1) = (x2 2,04) pela simetria em torno da mdia.
x 2,04
x 2,04
P(x1 < X < x 2 ) = P 1
<Z< 2
= P (z1< Z < z 2 ) = 0,98
20,78
0,78
Pela simetria de Z em torno da mdia, z1= -z2 e ento: P ( z 2 < Z < z 2 ) = 0,98.
P( Z > z 2 ) = P( Z < z 2 ) =
1 0,98 0,02
=
= 0,01
2
2
Na Tabela Z vemos que P(Z < -2,33) = 0,009903 0,01. Portanto, -z2 = -2,33 e z2 = 2,33.
Assim:
x1 2,04
= z 2 x1 = 2,04 z 2 0,78 = 2,04 2,33 0,78 = 2,04 1,82 = 0,22
0,78
x 2 2,04
= z 2 x2 = 2,04 + z 2 0,78 = 2,04 + 2,33 0,78 = 2,04 + 1,82 = 3,86
0,78
Portanto, o intervalo simtrico em torno da mdia 2,04 que abrange 98% das concentraes sricas em ces
sadios [0,22 ; 3,86] mcg/100ml.
Exerccio (6.3)
X: tempo de gestao de um beb, em dias.
X ~ Normal (
= 268 ; = 15)
a) Uma criana ser considerada prematura se o seu tempo de gestao for inferior a 247 dias, ou seja, se
X<247. Ento, devemos calcular P[X<247].
= P
<
= P ( Z < 1,40 ) = 0,0808
15
15
Assim, a porcentagem de crianas nascidas prematuramente ser de 8,08% .
b) Para que uma criana no seja considerada prematura, seu tempo de gestao tem que ser maior do que
um valor, digamos a . E o valor a aquele que deixa 4% dos tempos de gestao abaixo dele. Ou seja, o
valor a tal que P(X < a) = 0,04. O valor a o percentil de ordem 4 (ou 4%).
Encontrando o valor de a
a - 268
X 268 a 268
padronixando
P( X < a)
= P
<
= P Z <
= 0,04
15
15
15
Na tabela Z, o valor que deixa, aproximadamente, 4% da rea abaixo dele o -1,75.
Assim, (a - 268)/15 = -1,75. Ento, a = (-1,75 x 15) + 268 = 241,75.
Desse modo, para que uma criana no seja considerada prematura pelo novo critrio, seu tempo de gestao
tem que ser, no mnimo, de 242 dias.
55
Exerccio (6.4)
X: escore de Q.I.
= 100 ; = 15)
X ~ Normal (
a) Uma pessoa ser admitida nessa organizao se o seu escore de Q.I. for superior a 131,5 pontos, ou seja,
se X>131,5. Ento, devemos calcular P[X>131,5].
1 3 1 ,5 1 0 0
X 100
a d r o n iz a n d o
= P
>
P ( X > 1 3 1 ,5 ) p
=
15
15
o r s i m e tr i a
a ta b e la
= P ( Z > 2 ,1 0 ) p
= P ( Z < 2 ,1 0 ) n
= 0 ,0 1 7 9
Assim, a probabilidade de uma pessoa escolhida aleatoriamente ser aceita nessa organizao de apenas
1,79%.
b) Para que uma pessoa seja considerada um gnio, ela deve ter um Q.I superior a um valor, digamos b .
Esse valor b aquele que deixa 1% dos escores de Q.I. acima dele. Ou seja, o valor b tal que P(X > b) =
0,01 e, portanto, P(X < b) = 0,99. O valor b o percentil de ordem 99 (ou 99%).
Encontrando o valor b
b - 100
X 100 b 100
padronixando
= P
<
P ( X < b)
= P Z <
= 0,99
15
15
15
O valor, na tabela Z, que deixa, aproximadamente, 99% da rea abaixo dele o 2,33.
Assim, (b - 100)/15 = 2,33. Ento, b = (2,33 x 15) + 100 = 134,95.
Desse modo, para que uma pessoa seja considerada um gnio, ela deve ter um Q.I superior a 134,95 pontos.
56
n = 44
Escala: |1|7 = 17
|1|7
|2|23333444444
|2|55555556889
|3|0011
|3|5556
|4|01112
|4|
|5|14
|5|668
|6|0
|6|8
|7|
|7|9
b)
Faixa de Normalidade de 95%
100(1- )% = 95%
(1- ) = 95/100 = 0,95
= 1- 0,95 = 0,05
/2 = 0,05/2 = 0,025
1 /2 = 1 - 0,025 = 0,975
(i)
Portanto, a Faixa de Referncia de 95% para o nmero de colnias por cultura de escarro em pessoas sadias
[22; 68] colnias, pelo mtodo dos percentis.
57
Observao: Fazendo pelo mtodo dos percentis ensinado na apostila Introduo Bioestatstica.
Na tabela a seguir, vemos que as ordem de percentis que mais se aproximam de 0,025 e 0,975 so,
o
respectivamente 0,034091 e 0,965909 correspondendo aos valores de X (n de colnias por cultura de
escarro) X = 22 e X = 68.
Portanto, a Faixa de Referncia de 95% para o nmero de colnias por cultura de escarro em pessoas
sadias [22 ; 68], pelo mtodo dos percentis da Apostila.
o
N de ordem
i
1
2
3
.....
42
43
44
X: n de colnias por
culura de escarro
17
22
23
.....
60
68
79
Ordem do percentil
( i- 0,5)/44
0,011364
0,034091
0,056818
.....
0,943182
0,965909
0,988636
Note que as Faixas de Referncia de 95% para o nmero de colnias por cultura de escarro em pessoas
sadias fornecida pelo dois mtodos diferem bastante no limite inferior:
Mtodo da Curva de Gauss:
Mtodo dos Percentis:
Como vimos no item (a) a Curva Normal (Curva de Gauss) no se ajusta bem a esses dados. Assim, o mtodo
mais indicado neste caso o Mtodo dos Percentis.
58
Exerccio (7.2)
a) A Faixa de Referncia de 80% ser dada por FR(80%) = [P0,10; P0,90], pois:
100(1-)% = 80%
(1- ) = 80/100 = 0,80
= 1- 0,80 = 0,20
/2 = 0,20/2 = 0,10
1 /2 = 1- 0,10 = 0,90
O percentil de ordem 10% (P0,10) pode ser encontrado procurando-se o valor de hemoglobina ao qual
corresponde a proporo acumulada igual a 0,10 na ogiva. Este valor aproximadamente 11 g/dl.
O percentil de ordem 90% (P0,90) pode ser encontrado procurando-se o valor de hemoglobina ao qual
corresponde a proporo acumulada igual a 0,90 na ogiva. Este valor aproximadamente 17 g/dl.
A Faixa de Referncia de 80% so os valores de hemoglobina de 11 a 17 g/dl. Isto significa que
aproximadamente 80% das mulheres sadias desta populao tm valor de hemoglobina entre 11 e 17 g/dl.
b.1) Um mtodo de diagnstico para anemia baseado nessa faixa de referncia daria resultado:
negativo, se a paciente tivesse valor de hemoglobina entre 11 e 17 g/dl;
positivo,
se a paciente tivesse esse valor menor do que 11 g/dl ou maior do que 17 g/dl.
Como sabemos, a especificidade de um teste estimada como sendo a frequncia de negativos entre as
pessoas sadias. Nesse problema, todas as mulheres so sadias, e 80% tem valores entre 11 e 17 g/dl, sendo
consideradas negativas. Assim, estimativa da especificidade justamente 80%. Esse um valor aproximado,
j que a prpria faixa aproximada.
b.2) Como tambm sabemos, a sensibilidade de um teste estimada como sendo a frequncia de positivos
entre as pessoas doentes. Aqui, a sensibilidade desse mtodo no pode ser calculada somente com esses
dados, pois precisamos de uma amostra de pessoas doentes para sabermos quantas delas sero consideradas
positivas pelo mtodo.
59
s
s
; x + Z ( / 2 )
x Z ( / 2 )
com 0<<1
n
n
s
s
IC 90% = x Z ( 0, 05 )
; x + Z ( 0 ,05 )
n
n
17,79
17,79
= 36,86 1,64
;36,86 + 1,64
70
70
Interpretao: A idade de mdia dos adultos que frequentam o posto est entre 33,37 e 40,35 anos com
90% de confiana.
100(1-) = 95
1- = 0,95
= 0,05
/2 = 0,025
Z0,025 = 1,96 pois P( Z > 1,96 ) 0,025
s
s
IC 95% = x Z ( 0 , 025)
; x + Z (0 , 025 )
n
n
17,79
17,79
= 36,86 1,96
;36,86 + 1,96
70
70
Interpretao: A idade de mdia dos adultos que frequentam o posto est entre 32,69 e 41,03 anos com
95% de confiana.
Comparando os dois intervalos: o IC de 95% mais amplo que o IC de 90%.
60
= 19 70 = 0,27
Estimativa Pontual para p: p
ou seja, 27% dos pacientes deste posto so analfabetos
100(1- ) = 90
1- = 0,90
= 0,10
/2 = 0,05
Z0,05 = 1,64 pois P( Z > 1,64 ) 0,05
p (1 p )
0,27(0,73)
%
IC 90
= p Z ( / 2)
= 0,27 1,64
p
n
70
Interpretao: A proporo de frequentadores adultos do posto que so analfabetos est entre 18% e 36%
com 90% de confiana.
100(1-) = 95
1- = 0,95
= 0,05
/2 = 0,025
Z0,025 = 1,96 pois P( Z > 1,96 ) 0,025
0,27(0,73)
%
IC 95
= 0, 27 1,96
p
70
Interpretao: A proporo de frequentadores adultos do posto que so analfabetos est entre 17% e 37%
com 95% de confiana.
Comparando os dois intervalos: o IC de 95% mais amplo que o IC de 90%.
Exerccio (8.2)
Varivel X: produo de leite (em litros) na primeira lactao de vacas desta fazenda
(varivel contnua)
Parmetro : produo mdia de leite na primeira lactao de vacas desta fazenda
100(1-) = 98
1- = 0,98
= 0,02
/2 = 0,01
gl = n-1 = 20-1 =19
t(19; 0,01) = 2,539
s
300
IC 98% = x t19 ;0, 01)
= 1500 2,539
20
n
Interpretao: A produo mdia de leite na primeira lactao de vacas desta fazenda est entre
1330 e 1670 litros, com 98% de confiana.
Exerccio (8.3)
Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG
61
a) Porque a informao sobre o parmetro (neste caso, a mdia da varivel na populao) muito vaga. Por
exemplo, se o intervalo de confiana para a altura mdia das pessoas adultas de uma cidade vai de 1 a
2,50 metros, no saberemos dizer se esta cidade habitada por adultos que tendem a ser altos ou baixos.
Alm disso, no seria necessrio um estudo para obter esta informao, pois j sabemos que os adultos
no medem menos que um metro nem mais que 2,50 metros.
b) Reduzir o nvel de confiana 100(1-) significa aumentar o valor de , o que leva a valor menor de z /2,
reduzindo a amplitude do intervalo.
Por exemplo: passar de 100(1-) = 95 para 100(1-) = 90 significa passar de = 0,05 para = 0,10.
Assim, passamos de Z/2 = Z0,025= 1,96 para Z/2 = Z0,05 = 1,64.
Desse modo, quanto menor o nvel de confiana requerido, menor ser a amplitude do
intervalo.
c) Esta parcela seria menor. Desse modo, quanto menor a variabilidade da varivel, menor ser a
amplitude do intervalo.
d) Esta parcela seria menor. Desse modo, quanto maior o tamanho da amostra, menor ser a amplitude
do intervalo.
e) Apenas o tamanho da amostra (n), que ele pode aumentar, e o nvel de confiana do intervalo (100(1)), que ele pode reduzir. O pesquisador no tem controle sobre a variabilidade (
) da caracterstica
estudada.
f)
62
b) Hiptese Nula
Hiptese Alternativa
c) Erro Tipo I:
Erro Tipo II:
Concluir que o novo mtodo tem tempo mdio de execuo menor do que
40,5 horas quando, na verdade, seu tempo mdio igual a 40,5 horas.
Concluir que novo mtodo tem tempo mdio de execuo igual a 40,5 horas
quando, na verdade, seu tempo mdio menor do que 40,5 horas.
Situao 2:
a) Parmetro a ser testado
b) Hiptese Nula
Hiptese Alternativa
c) Erro Tipo I:
Concluir que a proporo de homens com mais de 65 anos que morrem dentro de
um ano nessa cidade maior do que 0,04 quando, na verdade, essa proporo
igual a 0,04.
Concluir que a proporo de homens com mais de 65 anos que morrem dentro de
um ano nessa cidade igual a 0,04 quando, na verdade, essa proporo
aumentou.
Situao 3:
a) Parmetro a ser testado
b) Hiptese Nula
Hiptese Alternativa
c) Erro Tipo I:
Concluir que o peso mdio dos frangos do novo fornecedor maior do que 3
quilos quando, na verdade, o peso mdio igual a 3 quilos.
Erro Tipo II: Concluir que o peso mdio dos frangos do novo fornecedor igual a 3 quilos
quando, na verdade, peso mdio maior do que 3 quilos.
63
Situao 4:
a) Parmetro a ser testado
b) Hiptese Nula
Hiptese Alternativa
c) Erro Tipo I:
Situao 5:
a) Parmetro a ser testado:
b) Hiptese Nula
Hiptese Alternativa
H0: p = 0,95
Ha: p < 0,95
c) Erro Tipo I:
Erro Tipo II:
64
obs
n = 18 (amostra pequena)
mdia amostral = 39,42;
desvio-padro amostral = 1,96
39,42 40,50
= 2,34
1,96 18
que seja
Como o valor de Tobs est na Regio de Rejeio, rejeitamos H0, ao nvel de significncia de 5%.
Valor P = P[t17 < -2,34] = ?
Deve-se encontrar a P[t17 > 2,34], que, por simetria, igual a P[t17 < -2,34]).
Na linha 17 da tabela t-student, no existe o valor 2,34. Ele est entre os valores 2,110 e 2,567, que
correspondem s colunas 0,025 e 0,01, respectivamente. Assim, P[t17 > 2,34] est entre 0,01 e 0,025.
Consequentemente, o valor P est entre 1% e 2,5%.
Concluso: Rejeita-se a hiptese de que o tempo mdio de execuo do novo mtodo igual a 40,5 horas, em
favor da hiptese de que ele menor do que 40,5 horas, ao nvel de significncia de 5% (0,01 < valor P <
0,025).
Situao 2:
H0: p = 0,04
Ha: p > 0,04
obs
0,06 0,04
= 3,23
0,04(1 0,04)
1000
Situao 3:
H0: = 3 quilos
Ha: > 3 quilos
3,2 3,0
= 2,5
25
T obs = 0,4
Como o valor de Tobs est na Regio de Rejeio, rejeitamos H0, ao nvel de significncia de 5%.
Valor P = P[t24 > 2,5] = ?
Na linha 24 da tabela t-student, no existe o valor 2,5. Ele est entre as colunas do 0,01 e 0,005. Assim, 0,005
< P[t24 > 0,016] < 0,01. Consequentemente, 0,005 < valor P < 0,01.
65
Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG
Concluso: Ao nvel de significncia de 5%, rejeitamos a hiptese de que o peso mdio de frangos vendidos
pelo fornecedor novo igual a 3 quilos, em favor da hiptese de que o peso mdio desses frangos maior do
que 3 quilos (0,005 < valor P < 0,01).
Situao 4:
H0: = 5,5 gramas
Ha: 5,5 gramasn = 40 (amostra grande); mdia amostral = 5,2 ; desvio-padro amostral = 0,7
5,2 5,5
= 2,71
40
Z obs = 0,7
Como o valor de Zobs est na Regio de Rejeio, rejeitamos H0, ao nvel de significncia de 5%.
Valor P = 2 x P[Z > |-2,71|] = 2 x P[Z > 2,71] = (por simetria) 2 x P[Z <-2,71] = 2 x 0,0034 = 0,0068.
Concluso: rejeitamos a hiptese de que a quantidade mdia de cido acetil saliclico (gramas por
comprimido) de certo analgsico igual a 5,5 gramas ao nvel de significncia de 5% (valor P = 0,0068).
Nessa situao, podemos usar o intervalo de confiana para realizar o teste de hipteses, pois a hiptese
alternativa bilateral. Como queremos um teste a 5% de significncia, calcularemos um intervalo de 95% de
confiana para a quantidade mdia de cido acetil saliclico, por comprimido.
Intervalo de 95% de Confiana para : (a amostra grande n = 40 > 30)
100(1-) = 95
1- = 0,95
= 0,05
/2 = 0,025
Z 0,025 = 1,96
IC
95%
IC
95%
IC
95%
= x z 0 ,0 2 5
n
0 ,7
= 5 ,2 1 ,9 6
= [ 5 ,2 0 ,2 ]
4 0
= [ 5 ,0 ; 5 , 4 ]
Interpretao: A quantidade mdia de cido acetil saliclico, por comprimido, est entre 5,0 e 5,4
gramas, com 95% de confiana.
Teste de hipteses baseado no intervalo de confiana: como o valor 5,5 no pertence ao intervalo de 95% de
confiana para a quantidade mdia de cido acetil saliclico, por comprimido, rejeitamos a hiptese de que a
quantidade mdia de cido acetil saliclico de certo analgsico igual a 5,5 gramas ao nvel de significncia
de 5%.
66
Situao 5:
H0: p = 0,95
Ha: p < 0,95
obs
0,94 0,95
= 1,45
0,95(1 0,95)
1000
67
N do
aluno
1
2
3
4
5
Escores de abdominais
Antes
Depois
12
15
10
9
23
25
25
25
29
31
6
7
8
9
10
32
14
17
19
20
d =
30
16
20
22
22
Diferenas (d)
(Depois Antes)
15 - 12 = 3
9 - 10 = -1
25 - 23 = 2
25 - 25 = 0
31 - 29 = 2
30 - 32 = -2
16 - 14 = 2
20 - 17 = 3
22 - 19 = 3
22 - 20 = 2
d = 1,4
sd = 1,8
3 1 + 2 + 0 + 2 2 + 2 + 3 + 3 + 2 14
=
= 1,4
10
10
sd =
obs
1,4 0
= 2,45
1,8 10
A diferena mdia entre os escores depois e antes do programa est entre 0,83 e 1,97, com 95% de
confiana.
68
Exerccio (11.2)
1 : peso mdio no grupo I;
2 : peso mdio no grupo II;
a)
H0: 1 = 2
Ha: 1 > 2
x1 = 120
s = 21,39 n1 = 12
x2 = 101
s = 20,62 n2 = 7
T obs =
120 101
= 1,89
1 1
+
2112
,
12 7
comb
[ -2,18 ; 40,18]
A diferena entre o ganho mdio de peso no grupo alimentado com dieta de alto contedo proteico e o ganho
mdio de peso no grupo alimentado com dieta de baixo contedo proteico est entre -2,18 gramas e 40,18
gramas, com 95% de confiana.
Observao para todo o exerccio: se estivssemos testando a H0: 1 = 2, a 5% de significncia, ns
rejeitaramos H0 em favor de H1: 1 > 2, pois o valor P < 0,05. Porm, se estivssemos testando a H1: 1
2, no teramos evidncias suficientes para rejeitar H0, a 5% de significncia, pois o intervalo de 95% de
confiana para a diferena entre as duas mdias contm o valor zero. Isso mostra que a no indicao de uma
direo para o valor da diferena entre as duas mdias (maior ou menor do que zero) reduz o poder do teste
para rejeitar H0. Ou seja, quando o teste unilateral, estamos fornecendo uma informao a mais para o
teste, e no precisaremos de evidncias amostrais to fortes para rejeitar H0 quanto precisaramos se o teste
fosse bilateral, onde no fornecemos nenhuma informao a mais.
69
Exerccio (11.3)
1 : peso mdio dos bebs no grupo de mes que usaram cocana durante toda a gravidez;
2 : peso mdio dos bebs no grupo de mes que no tm histria de uso de cocana;
a)
H0: 1 = 2
Ha: 1 < 2
x1 = 2829
s = 708
n1 = 36
x 2 = 3436
s = 628
n2 = 39
obs
2829 3436
708 2 628 2
+
36
39
607
= 3,92
155,04
70
Exerccio (11.4)
pC : proporo de pessoas que tomaram vitamina C e ficaram livres de doenas
do trato respiratrio
pP : proporo de pessoas que tomaram o placebo e ficaram livres de doenas do trato
respiratrio
H0: pC = pP
105
p C = 407 = 0,26
p p =
76
= 0,18
411
Ha: pC > pP
obs
0,26 0,18
0,07
=
= 2,77
0,26(1 0,26) 0,18(1 0,18) 0,028
+
407
411
Como Zobs est na regio de rejeio, rejeitamos H0, ao nvel de significncia de 5%.
Valor P = P[Z>2,77] = P[Z < -2,77] = 0,0028.
Concluso: Ao nvel de significncia de 5%, rejeitamos a hiptese de que a proporo de pessoas que
tomaram vitamina C e ficaram livres de doenas do trato respiratrio igual proporo de pessoas que
tomaram placebo e ficaram livres de doenas do trato respiratrio, em favor da hiptese de que a proporo
de pessoas livres de doenas no trato respiratrio entre as que tomaram vitamina C maior do que essa
proporo entre as que tomaram placebo (valor P = 0,0028).
Observao: Tambm rejeitaramos a hiptese nula se o nvel de significncia fosse 1%.
Exerccio (11.5)
Para que um desfecho possa ser considerado associado ao uso de reposio hormonal, devemos rejeitar a
hipotse nula no seu teste, ou seja, o Valor P de seu teste deve ser menor que o nvel de significncia, neste
caso, 5%.
Assim, qualquer evento tromboemblico pode ser considerado, ao nvel de significncia de 5%, associado ao
uso de reposio hormonal (Valor P = 0,002). Em especial, a trombose venosa profunda (Valor P = 0,004).
Observaes:
1) O evento doena da vescula biliar tem Valor P igual a 5%, e pode ser considerado sob suspeita.
2) Note que 34 das 1.380 (2,46%) mulheres que fizeram uso desses hormnios tiveram algum evento
tromboemblico, contra apenas 12 das 1383 (0,87%) mulheres do grupo placebo. Assim, o risco de ter
algum evento tromboemblico 2,46/0,87= 2,84 vezes maior para as mulheres que usam reposio
hormonal. O valor 2,84 aproximadamente aquele que est na coluna do Risco Relativo (RR). A mesma
concluso pode ser feita para o desfecho trombose venosa profunda, cujo risco 3,18 vezes maior entre
as mulheres que fizeram reposio hormonal do que entre as mulheres do grupo placebo.
71
(10 7) 2 ( 4 7) 2 (5 8) 2 (11 8) 2
+
+
+
7
7
8
8
2
=
+
+
+
=
1
,
286
1
,
286
1125
,
1125
,
4
,
821
X
Estatstica de Teste:
Regio de Rejeio:
X
2
obs
2
1;0,05
> 3,84 (X
= 3,84)
Verificao: Como 4,821 est na regio de rejeio, rejeitamos a hiptese nula ao nvel de 5% de
significncia.
2
72
Exerccio (12.2)
Teste de Homogeneidade
H0: As propores de contaminao so iguais para todos os tipos de fertilizantes
Ha: As propores de contaminao so diferentes para todos os tipos de fertilizantes
Tabela de valores esperados sob a hiptese de homogeneidade
Contaminao
Fertilizante
Sim
No
Nenhum
101x44/450=9,88
101x406/450=91,12
Nitrognio
95x44/450=9,29
95x406/450=85,71
Esterco
113x44/450=11,05
113x406/450=101,95
Nitrognio e Esterco
141x44/450=13,79
141x406/450=127,21
Total
44
406
Total
101
95
113
141
450
Estatstica de Teste:
Regio de Rejeio:
Verificao: Como 9,258 est na regio de rejeio, rejeitamos a hiptese nula ao nvel de 5% de
significncia.
Concluso: ao nvel de significncia de 5%, rejeitamos a hiptese de homogeneidade entre as propores de
contaminao dos tipos de fertilizantes estudados, em favor da hiptese de que essas propores so
diferentes (0,025<valorP<0,05).
2
+
+
+
+
Esterco ausente
Esterco presente
Esterco ausente
Esterco presente
=
=
=
=
Nenhum
Esterco
Nitrognio
Nitrognio e Esterco
A estrutura desse experimento chamada fatorial 2 a 2, pois existem dois fatores (Nitrognio e Esterco), cada
um com dois nveis (ausente e presente).
73
% de contaminao
0.25
0.2
0.15
Esterco presente
Esterco ausente
0.1
0.05
0
Ausente
Presente
Nitrognio
O grfico indica que, na ausncia de esterco (linha cheia), a adio de nitrognio diminui a porcentagem de
contaminao, mas, na presena do esterco (linha pontilhada), a adio do nitrognio aumenta a porcentagem
de contaminao. Em outras palavras, o efeito do nitrognio de aumentar a porcentagem de contaminao
quanto o esterco presente e de diminuir essa porcentagem quanto o esterco ausente. Esse fato indica
caracteriza a interao entre os fatores Esterco e Nitrognio, isto , o efeito do Nitrognio na porcentagem de
contaminao no o mesmo nos dois nveis de Esterco. Se no houvesse interao entre esse dois fatores,
as retas do grfico seriam paralelas.
Exerccio (12.3)
Esse um teste de independncia entre as variveis incidncia de parasitose e raa.
Hipteses:
H0: A incidncia de parasitose independe da raa do animal
(ou seja, as duas variveis no esto associadas)
Ha: A incidncia de parasitose depende da raa do animal
(ou seja, as duas variveis esto associadas)
Raa
Pura
No-pura
Total
Estatstica de Teste:
No
700x1045/1200=609,58
500x1045/1200=435,42
1045
Total
700
500
1200
2
1;0,01
>
= 6,64
Verificao: Como 6,482 no est na regio de rejeio (6,482 > 6,64), no rejeitamos a hiptese nula ao
nvel de significncia de 1%.
Concluso: Ao nvel de significncia de 1%, no rejeitamos a hiptese de independncia entre a incidncia de
parasitose e a raa do animal (0,01 < valor P < 0,025).
Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG
74
Clculo do Valor P:
2
1
Valor P = P[X
> 6,482] = ?
Grupo
A
B
Total
Total
a+b
c+d
a+b+c+d
No caso do problema, RC =
b
a
a + b = b = ad .
c
c
b c
d
c+d
d
c+d
105
chance de parasitose no grupo raca pura
595 = 105 450 = 1,59
=
chance de parasitose no grupo raca nao - pura 50
50 595
450
Exerccio (12.4)
Esse um teste de independncia entre as variveis ocorrncia de tromboembolismo e grupo sanguneo.
Hipteses:
H0: A ocorrncia de tromboembolismo independe do grupo sanguneo
(ou seja, as duas variveis no esto associadas)
Ha: A ocorrncia de tromboembolismo depende do grupo sanguneo
(ou seja, as duas variveis esto associadas)
75
Grupo
Sanguneo
A
B
AB
O
Total
Estatstica de Teste:
X
+
No
79 x 144/1200 = 56,88
21 x 144/1200 = 19,44
27 x 144/1200 = 5,12
73 x 144/1200 = 52,56
144
Total
79
21
27
73
200
!
#"$%&('$
)'*
2
obs
2
3;0,01
>
= 11,345
Verificao: Como 15,354 est na regio de rejeio (15,354 > 11,345), rejeitamos a hiptese nula ao nvel de
significncia de 1%.
Concluso: Ao nvel de significncia de 1%, rejeitamos a hiptese de independncia a ocorrncia de
tromboembolismo e o grupo sanguneo (Valor P < 0,005).
Clculo do Valor P:
2
3
Valor P = P[X
> 15,354] = ?
76
Referncias Bibliogrficas
77