Você está na página 1de 6

MAE116 – Noções de Estatística

Grupo B - 2º semestre de 2019


Lista de Revisão 2

Exercício 1

Em floriculturas de São Paulo as mudas de orquídea são disponibilizadas para venda 5 semanas
após a semeação. Quanto maior a muda, maior o preço que ela pode ser comercializada. A altura
das orquídeas nesse período da vida pode ser modelada por uma distribuição Normal com média μ
= 15 cm. Um procedimento mais barato de adubagem para mudas foi adotado e deseja-se saber
se a altura das orquídeas adubadas com esse procedimento piora o desenvolvimento da planta.
Para tanto, 10 orquídeas foram sorteadas, 5 semanas após serem semeadas com esse procedi-
mento e forneceram as seguintes medidas de altura em centímetros:
14,5 12,7 14,9 13,8 15,1 12,2 15,1 14,7 15,2 13,8.
(a) Formule o problema como um problema de testes de hipóteses. Especifique o parâmetro a ser
testado.
A variável de interesse 𝑋𝑋 é a altura da planta tratada com o método mais barato.

O parâmetro de interesse é μ: a média da altura das plantas tratadas com o procedimento mais barato,
as hipóteses de interesse são:
𝐻𝐻0: 𝜇𝜇 = 15 𝑐𝑐𝑐𝑐
𝐻𝐻1 : 𝜇𝜇 < 15 𝑐𝑐𝑐𝑐

(b) Calcule o nível descritivo do teste e conclua para um nível de significância de 5%.

Temos que, na amostra,


(14,5 + 12,7 + 14,9 + 13,8 + 15,1 + 12,2 + 15,1 + 14,7 + 15,2 + 13,8)
𝑥𝑥̅ = = 14,2 ,
10

∑𝑥𝑥 2 − 𝑛𝑛 × 𝑥𝑥̅ 2 2026,42 − 10 × 14,22


𝑆𝑆 2 = = = 1,113 ,
𝑛𝑛 − 1 9

valor- 𝑝𝑝 = 𝑃𝑃(𝑋𝑋� ≤ 𝑥𝑥̅ | 𝐻𝐻₀ verdadeira) = 𝑃𝑃(𝑋𝑋� ≤ 14,2 | 𝜇𝜇 = 15) .

Como 𝑋𝑋 ~ 𝑁𝑁(𝜇𝜇, 𝜎𝜎 2 ), com 𝜎𝜎 2 desconhecido, então utilizamos a padronização


𝑥𝑥̅ − 𝜇𝜇
𝑇𝑇 = ~ 𝑡𝑡𝑛𝑛−1
𝑆𝑆 2
�� �
𝑛𝑛

Assim,

14,2 − 15
valor-𝑝𝑝 = 𝑃𝑃(𝑥𝑥̅ ≤ 14,2 | 𝜇𝜇 = 15) = 𝑃𝑃 ⎛𝑇𝑇 ≤ ⎞ = 𝑃𝑃(𝑇𝑇 ≤ −2,3976), onde 𝑇𝑇 ~ 𝑡𝑡9 .
1,113

⎝ 10 ⎠
Consultando a tabela da t-Student, com 𝑛𝑛 − 1 = 9 graus de liberdade, encontramos o valor aproximado
de 0,98, ou seja, 𝑃𝑃(𝑇𝑇 ≤ 2,3976) = 0,98 . Pela simetria da T, 𝑃𝑃(𝑇𝑇 ≤ −2,3976) = 0,02.
Assim rejeitamos H₀ à 5% de significância pois o valor-p ≅ 0,02 < 0,05.
Conclusão: Há evidência suficiente de que o fertilizante mais barato piora o desenvolvimento da planta,
a 5% de significância.

(c) Construa um intervalo de confiança para a altura média de orquídeas adubadas segundo o novo
procedimento, 5 semanas após a semeação, com coeficiente de confiança de 90%.

Página 1 de 6
MAE116 – Noções de Estatística
Grupo B - 2º semestre de 2019
Lista de Revisão 2

Um intervalo de confiança de 90% para a média μ da população é


𝑆𝑆 2 𝑆𝑆 2
𝐶𝐶
[𝑥𝑥̅ − ε; 𝑥𝑥̅ + ε] = �𝑥𝑥̅ − 𝑡𝑡𝑛𝑛−1 × � 𝑛𝑛 ; 𝑥𝑥̅ + 𝑡𝑡𝑛𝑛−1
𝐶𝐶
× � 𝑛𝑛 �

Para 𝛾𝛾 = 0,90 ⇒ 𝑡𝑡9𝑐𝑐 = 1,833 .


Então o IC é dado por

1,113 1,113
�14,2 − 1,833 × � ; 14,2 + 1,833 × � � = [14,2 − 0,6116; 14,2 + 0,6116]
10 10
= [13,5884; 14,8116]

Exercício 2
Um criador de gado constatou que 10% de seu rebanho está com verminose. O veterinário respon-
sável, com o intuitivo de diminuir os casos de verminose, alterou a dieta dos animais. Após três
meses, um exame foi feito em 100 animais para determinar a presença de verminose.
(a) Formule esse problema como um problema de teste de hipóteses especificando as hipóteses
nula e alternativa.

O parâmetro de interesse é p: proporção de bois com verminose após a alteração da dieta.


𝐻𝐻₀: 𝑝𝑝 = 0,1
𝐻𝐻1 : 𝑝𝑝 < 0,1

(b) Quais são os significados práticos dos erros tipo I e tipo II?

Erro tipo I: A dieta alterada é considerada eficaz sendo que não houve redução na proporção de bois
com verminose.
Erro tipo II: A dieta alterada é considerada ineficaz sendo que houve redução na proporção de bois
com verminose.

(c) Apresente a região crítica associada ao nível de significância de 5%.

A região crítica é dada por 𝑅𝑅𝑅𝑅 = {𝑝𝑝̂ : 𝑝𝑝̂ < 𝑎𝑎}.

𝛼𝛼 = 0,05 = 𝑃𝑃(erro tipo I) = 𝑃𝑃(rejeita𝐻𝐻0 , sendo𝐻𝐻0verdadeira) = 𝑃𝑃(𝑝𝑝̂ < 𝑎𝑎 | 𝑝𝑝 = 0,1) .

0,1×0,9
Sob H₀, usando TLC, 𝑝𝑝̂ ≈ 𝑁𝑁 �0,1, 100
�. Então,

𝑎𝑎 − 0,1 𝑎𝑎 − 0,1
0,05 = 𝑃𝑃 ⎛𝑍𝑍 ≤ ⎞ = 𝑃𝑃 �𝑍𝑍 ≤ � = 𝑃𝑃(𝑍𝑍 ≤ 𝑧𝑧),
0,1×0,9 0,03

⎝ 100 ⎠
e z é tal que 𝐴𝐴(𝑧𝑧) = 0,95 ⇒ 𝑧𝑧 = 1,64. Assim,
𝑎𝑎 − 0,1
= −1,64
0,1×0,9

100

0,1 × 0,9
𝑎𝑎 = 0,1 − 1,64� = 0,1 − 1,64 × 0,03 = 0,1 − 0,0492 = 0,0508 .
100

Página 2 de 6
MAE116 – Noções de Estatística
Grupo B - 2º semestre de 2019
Lista de Revisão 2

Logo, 𝑅𝑅𝑅𝑅 = {𝑝𝑝̂ : 𝑝𝑝̂ < 0,0508}.


(d) Se 7 dos 100 animais examinados foram diagnosticados com verminose, qual é a conclusão
sobre a eficiência da nova dieta? Adote 𝛼𝛼= 5%.

Nesse caso, 𝑝𝑝̂𝑜𝑜𝑜𝑜𝑜𝑜 = 0,07 está fora da região crítica para 𝛼𝛼 = 5%, então não rejeitamos H₀.
Concluímos que não há evidência de que a nova dieta reduz a incidência de verminose no gado.

(e) Suponha que o veterinário deseja realizar o teste, não com a região crítica, mas usando o nível
descritivo. Calcule então o valor-p e conclua com 𝛼𝛼= 5%.

Temos que
𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 − 𝑝𝑝 = 𝑃𝑃(𝑝𝑝̂ ≤ 0,07 | 𝑝𝑝 = 0,1) ≈

0,07 − 0,1 0,03


≈ 𝑃𝑃 ⎛ 𝑍𝑍 ≤ ⎞ = 𝑃𝑃 � 𝑍𝑍 ≤ − �
0,1(1−0,1) 0,03

⎝ 100 ⎠
= 𝑃𝑃( 𝑍𝑍 ≤ −1)
= 1 − 𝐴𝐴(1,0)
= 1 − 0,8413
= 0,1587.

Como valor-p = 0,1587 > 0,05 decidimos pela não-rejeição de H₀ e concluímos que não há evidências
de que nova dieta reduz a incidência de verminose no gado.

Exercício 3
Em uma pesquisa de mercado deseja-se estimar a proporção p de pessoas que compram livros
digitais.
(a) Qual deve ser o tamanho da amostra para que o erro de sua estimativa seja no máximo 0,04
com um coeficiente de confiança de 92%?
𝑧𝑧 2
O tamanho amostral é dado por 𝑛𝑛 = � � × 𝑝𝑝(1 − 𝑝𝑝).
ε
Temos que ε = 0,04, 𝛾𝛾 = 0,92 ⇒ z é tal que A(z) = 0,96 ⇒ z = 1,75.
Como não conhecemos o valor de p, adotamos o maior valor possível para 𝑝𝑝(1 − 𝑝𝑝), que é 0,25 (quando
𝑝𝑝 = 0,5).
Assim,
1,75 2
𝑛𝑛 = � � × 0,25 = 478,5.
0,04
Logo, a amostra deve ter 479 indivíduos.

(b) Uma companhia que fabrica livros digitais acredita que a proporção p não seja superior a 25%.
Com essa informação seria possível considerar em (a) uma amostra de tamanho menor? Se sim,
de quanto? Se não, por quê?

Sim, agora que conhecemos que 𝑝𝑝 ≤ 0,25, então 𝑝𝑝(1 − 𝑝𝑝) ≤ 0,25 × 0,75 = 0,1875.
1,75 2
Logo, 𝑛𝑛 = �0,04� × 0,1875 = 385,9 .
Assim, a amostra deve ter 386 indivíduos, havendo uma redução de 479 – 386 = 93 indivíduos.

Página 3 de 6
MAE116 – Noções de Estatística
Grupo B - 2º semestre de 2019
Lista de Revisão 2

(c) Em um grupo de 360 pessoas consultadas verificou-se que 62 delas compraram livros digitais.
Calcule a estimativa pontual da proporção de pessoas que compram livros digitais.

A estimativa pontual é
62
𝑝𝑝̂𝑜𝑜𝑜𝑜𝑜𝑜 = = 0,172
360
(d) Construa um intervalo de confiança para a proporção p com coeficiente de confiança igual a
92%. Qual é a margem de erro do intervalo?

O intervalo de confiança é dado por


𝐼𝐼𝐼𝐼(𝑝𝑝; 92%) = [𝑝𝑝̂ − 𝜖𝜖; 𝑝𝑝̂ + 𝜖𝜖]

Assim

𝑝𝑝̂ (1 − 𝑝𝑝̂ ) 𝑝𝑝̂ (1 − 𝑝𝑝̂ )


𝐼𝐼𝐼𝐼(𝑝𝑝; 92%) = �𝑝𝑝̂ − 𝑧𝑧 × � ; 𝑝𝑝̂ + 𝑧𝑧 × � �
𝑛𝑛 𝑛𝑛

0,172(1 − 0,172) 0,172(1 − 0,172)


= �0,172 − 1,75 × � ; 0,172 + 1,75 × � �
360 360

= [0,172 − 0,0348; 0,172 + 0,0348 ]


= [0,1372; 0,2068] .

0,172(1−0,172)
A margem de erro é 1,75 × � = 0,0348 .
360

Exercício 4
Criminologistas têm debatido com frequência se a incidência de crime violento muda com a estação
do ano. O autor do artigo "lsThere a Season for Homicide? " (Criminology, 1988, p. 287- 296) clas-
sificou 1361 homicídios de acordo com a estação do ano, resultando nos dados a seguir.
Inverno Primavera Verão Outono
328 334 372 327

(a) Quais as hipóteses H₀ e H₁ adequadas a um teste de hipóteses estatístico que atenda os inte-
resses dos criminologistas?
𝐻𝐻₀: A incidência de crime violento é a mesma para todas as estações do ano.
𝐻𝐻₁: A incidência de crime violento não é a mesma para todas as estações do ano.

As hipóteses então ficam:


𝐻𝐻 : 𝑝𝑝 = 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 = 𝑝𝑝𝑣𝑣𝑣𝑣𝑣𝑣ã𝑜𝑜 = 𝑝𝑝𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜 = 0,25
� 0 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖
𝐻𝐻1: 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑢𝑢𝑢𝑢𝑢𝑢 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑ç𝑎𝑎

(b) Se a incidência de crime violento não se altera com a estação do ano, quantos homicídios seriam
esperados no Inverno na amostra? E quantos foram observados?
Se H₀ for verdadeira, 𝑝𝑝𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 = 0,25 , assim o número esperado de homicídios no inverno é dado por
0,25 × 1361 = 340,25

Página 4 de 6
MAE116 – Noções de Estatística
Grupo B - 2º semestre de 2019
Lista de Revisão 2

Foram observados 328 homicídios no inverno.


(c) Considerando as hipóteses em (a), você diria que a incidência de crime violento se altera com a
estação do ano? Conclua com base no valor-p. Adote um nível se significância igual a 5%.

Para esse teste, obtemos a tabela de valores observados e esperados:


Frequência Frequência
Categorias
observada esperada, sob H₀
Inverno 328 340,25
Primavera 334 340,25
Verão 372 340,25
Outono 327 340,25
Total 1361 1361

A estatística do teste de aderência é


2
2
∑𝑘𝑘𝑖𝑖=1(𝑂𝑂𝑖𝑖 − 𝐸𝐸𝑖𝑖 )
𝜒𝜒 =
𝐸𝐸𝑖𝑖

Sob 𝐻𝐻0 , 𝜒𝜒2 ~ 𝜒𝜒2 com 𝑘𝑘 − 1 graus de liberdade.


Usando os valores da tabela, obtemos:
2
(328 − 340,25)2 (334 − 340,25)2 (372 − 340,25)2 (327 − 340,25)2
𝜒𝜒𝑜𝑜𝑜𝑜𝑜𝑜 = + + +
340,25 340,25 340,25 340,25
= 0,4410 + 0,1148 + 2,9627 + 0,5160 = 4,0345
valor-p = 𝑃𝑃(𝜒𝜒32 > 4,0345).
Pelo Rcmdr, valor-𝑝𝑝 = 0,2582 > 𝛼𝛼 = 0,05 , logo, não rejeitamos 𝐻𝐻0, ou seja, não há evidência para con-
cluir que a incidência de crimes violentos se altera com a estação do ano.

Exercício 5
Um especialista em treinamento funcional assegura que os treinos de Crossfit são populares em
todo o mundo, uma vez que os exercícios deste programa são dinâmicos e variados. Um estudo
está investigando se a opinião sobre se exercitar por meio deste treinamento depende do nível
socioeconômico do indivíduo. Considere os seguintes dados coletados de 432 entrevistas feitas em
uma grande área comercial.
Nível Opinião sobre Crossfit
Total
socioeconômico Favorável Contra
Baixo 84 56 140
Médio 63 57 120
Alto 64 108 172
Total 211 221 432

(a) Se a opinião do indivíduo sobre se exercitar por meio de Crossfit não depende do nível
socioeconômico, quantas pessoas de cada nível seriam esperadas favoráveis na amostra?
E quantas foram observadas?

Como queremos testar a independência entre as variáveis Nível Socioeconômico e Opinião, temos que
𝑂𝑂.𝑗𝑗
𝐸𝐸𝑖𝑖𝑖𝑖 = 𝑂𝑂𝑖𝑖 .× , 𝑖𝑖 = 1,2,3 𝑒𝑒𝑒𝑒 = 1,2 ,
𝑛𝑛
Em que 𝑂𝑂𝑖𝑖 . corresponde ao total da linha i e 𝑂𝑂.𝑗𝑗 corresponde ao total da coluna j. Assim, as frequências
esperadas sob H₀ são:

Página 5 de 6
MAE116 – Noções de Estatística
Grupo B - 2º semestre de 2019
Lista de Revisão 2

140 × 211
𝐸𝐸𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏,𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓á𝑣𝑣𝑣𝑣𝑣𝑣 = = 68,38
432
120 × 211
𝐸𝐸𝑚𝑚é𝑑𝑑𝑑𝑑𝑑𝑑,𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓á𝑣𝑣𝑣𝑣𝑣𝑣 = = 58,61
432
172 × 211
𝐸𝐸𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎,𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓á𝑣𝑣𝑣𝑣𝑣𝑣 = = 84,01
432
140 × 221
𝐸𝐸𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏,𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 = = 71,62
432
140 × 221
𝐸𝐸𝑚𝑚é𝑑𝑑𝑑𝑑𝑑𝑑,𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 = = 61,39
432
172 × 221
𝐸𝐸𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎,𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 = = 87,99
432

(b) Especifique as hipóteses H₀ e H₁ de um teste de hipóteses estatístico adequado ao objetivo do


estudo.
As hipóteses são
H : O nível socioeconômico e a opinião sobre Crossfit são independentes;
� 0
H1 : Nível socioeconômico e opinião sobre Crossfit são variáveis dependentes

(c) Utilizando o nível descritivo (valor-p), conclua sobre suas hipóteses utilizando um nível de signi-
ficância de 5%.

A estatística do teste de independência é


r s 2
2
�𝑂𝑂𝑖𝑖𝑖𝑖 − 𝐸𝐸𝑖𝑖𝑖𝑖 �
𝜒𝜒 = � �
𝐸𝐸𝑖𝑖𝑖𝑖
𝑖𝑖=1 𝑗𝑗=1
2 2
Sob 𝐻𝐻0 , 𝜒𝜒 ~ 𝜒𝜒 com(𝑟𝑟 − 1) × (𝑠𝑠 − 1) graus de liberdade.
A tabela de frequências observadas 𝑂𝑂𝑖𝑖𝑖𝑖 e esperadas 𝐸𝐸𝑖𝑖𝑖𝑖 sob a hipótese de independência entre as va-
riáveis é:
Opinião sobre Crossfit
Nível socioeconômico
Favorável Contra
Baixo 84 (68,38) 56 (71,62)
Médio 63 (58,61) 57 (61,39)
Alto 64 (84,01) 108 (87,99)

Assim,
2
(84 − 68,38)2 (56 − 71,62)2 (63 − 58,61)2 (57 − 61,39)2 (64 − 84,01)2
𝜒𝜒𝑜𝑜𝑜𝑜𝑜𝑜 = + + + +
68,38 71,62 58,61 61,39 84,01
(108 − 87,99)2
+
87,99
= 3,568 + 3,407 + 0,329 + 0,314 + 4,766 + 4,551 = 16,934

O valor-𝑝𝑝 = 𝑃𝑃(𝜒𝜒22 ≥ 16,934) = 0,0002 < 𝛼𝛼 = 0,05.


Como o valor-p é menor que o nível de significância fixado em 5%, decidimos por rejeitar a hipótese
nula, e concluímos que há evidências da existência de relação entre o nível socioeconômico e a opinião
sobre o Crossfit.

Página 6 de 6

Você também pode gostar