Você está na página 1de 7

Prova3IEC-2020.

2-resolvida

August 12, 2021

[1]: from scipy.stats import norm, t, chi2, f


import numpy as np

1 AP 3 Inferência estatística 2020.2


1.1 Questão 1
Fazendo o teste


 H0 : µ = 1150 (σ = 150)
vs

H1 : µ = 1200 (σ = 200),
e n = 100, estabeleceu-se a seguinte região crítica:

RC = {x | x ≥ 1170},

(a) Defina os erros tipo I e tipo II.


(b) Qual a probabilidade α de rejeitar H0 quando verdadeira?
(c) Qual a probabilidade β de aceitar H0 quando H1 é verdadeira?

1.1.1 Item (a)


Erro tipo I Rejeitar H0 dado que H0 é verdadeira. Isto é, admitir que µ = 1200 e σ = 200 quando
na verdade µ = 1150 e σ = 150.
Erro tipo II Não rejeitar H0 dado que H0 é falsa. Isto é, admitir que µ = 1150 e σ = 150 quando
na verdade µ = 1200 e σ = 200.

1.1.2 Item (b)


Método I  
σ
RC = {xc | xc ≥ 1170} =
xc xc ≥ z1−α √ + µ
n
 
150 150
=
xc xc ≥ z1−α + 1150 =⇒ z1−α + 1150 = 1170
10 10

[2]: z_1_alpha = (1170 - 1150) * 10 / 150


z_1_alpha

1
[2]: 1.3333333333333333

z1−α = 1.3333
α = P (erro tipo I) = P (Rejeitar H0 | H0 é verdadeira)
= P (Z ≥ z1−α ) = 1 − P (Z < 1.333) = 9.12%.

Método II
α = P (erro tipo I) = P (Rejeitar H0 | H0 é verdadeira)
= P (X ∈ RC | H0 é verdadeira)
Quando H0 for verdadeira, isto é, µ = 1150 e σ = 150, o teorema do limite central fornece
 
1502
X ∼ N 1150, .
100

Assim,   
1502
X ≥ 1170 X ∼ N 1150,
P
100
 
1170 − 1150
=P Z≥ = P (Z ≥ 1.333) = 9.12%
150/10

[3]: z_c = (1170 - 1150)/(15)


z_c, (1 - norm.cdf(z_c))*100 # porcentagem

[3]: (1.3333333333333333, 9.121121972586788)

1.1.3 Item (c)


β = P (erro tipo II) = P (Não rejeitar H0 | H0 é falsa)
= P (X ∈
/ RC | H0 é falsa)
Nesse caso, o teorema do limite central fornece
 
2002
X ∼ N 1200, =⇒ X ∼ N (1200, 400).
100

Assim,

P (X ≤ 1170 | X ∼ N (1200, 202 ))


 
1170 − 1200
=P Z≤ = P (Z ≤ −1.5) = 6.68%.
20

[4]: z_c = (1170 - 1200) / 20


z_c, norm.cdf(z_c)*100 # porcentagem

[4]: (-1.5, 6.680720126885807)

2
1.2 Questão 2
O número médio diário de clientes de um posto de gasolina tem sido 250, com um desvio padrão de
80 clientes. Durante uma campanha de 25 dias, em que os clientes recebiam um brinde, o número
médio de clientes foi 280, com um desvio padrão de 50. Você diria que a campanha modificou a
distribuição do número de clientes do posto? Descreva as suposições feitas para a resolução do
problema.

1.2.1 Solução
Assumindo normalidade (blá blá blá etc.)
O sistema de hipóteses é 
H0 : µ = 250 (σ = 80)
H1 : µ = 280 (σ = 50),
com n = 25. Fixando α = 0.05, obtemos z1− α2 = 1.960. Sob H0 , obtemos

280 − 250
zc = = 1.875.
80/5

[5]: norm.ppf(0.95), norm.ppf(0.975), (280 - 250) / (80/5)

[5]: (1.6448536269514722, 1.959963984540054, 1.875)

Como zc = 1.875 < z1− α2 = 1.960, não rejeitamos H0 , isto é, a campanha não modificou a dis-
tribuição do número de clientes, a nível de significância de 5%. Curiosamente, como z0.95 = 1.6459,
a nível de significância de 10%, teríamos rejeitado H0 e admitido que a campanha impactou o
número médio de clientes.

1.3 Questão 3
Para verificar a importância de um cartaz nas compras de certo produto, procedeu-se do seguinte
modo: formaram-se sete pares de lojas; os pares foram formados de modo que tivessem as mesmas
características quanto à localização, ao tamanho e ao volume de vendas; num dos elementos do par,
colocou-se o cartaz; no outro, não; as vendas semanais foram registradas, e os resultados estão a
seguir.

Pares Vendas
Com cartaz Sem cartaz
1 13 16
2 18 24
3 14 18
4 16 14
5 19 26
6 12 17
7 22 29

Qual seria a sua conclusão sobre a eficiência do cartaz?

3
1.3.1 Solução
Como as lojas em cada par foram configuradas para terem as mesmas características, mas não
podemos garantir insonomia entre lojas de pares diferentes, recaímos em um caso de variáveis
emparelhadas.
O sistema de hipóteses é 
H0 : µA − µB = 0
H1 : µA − µB < 0.
2 ).
Admitamos que, sob H0 , a diferença de vendas segue uma distribuição normal N (0, σD

[6]: com_cartaz = np.array([13, 18, 14, 16, 19, 12, 22])


sem_cartaz = np.array([16, 24, 18, 14, 26, 17, 29])
alpha = 0.05
n = 7
diferenca = com_cartaz - sem_cartaz
mu_D = diferenca.mean()
S_D = diferenca.std(ddof = 1)
t_alpha = t.ppf(alpha, n - 1)
mu_D, S_D, t_alpha

[6]: (-4.285714285714286, 3.147183169877773, -1.9431802803927818)

Fixando α = 5%, obtemos o intervalo de confiança

RC = {tc | tc ≤ −1.9432}.

A estatística avaliada nos dados da amostra é


−4.2857
Tc = √ = −3.6029.
3.1472/ 7

Como tc = −3.6029 < tα = −1.9432, não rejeitamos H0 , isto é, a nível de significância de 5%,
admitimos que o cartaz influencia positivamente no número de vendas.

[7]: mu_D / (S_D / np.sqrt(n))

[7]: -3.60288346061446

1.4 Questão 4
Uma pesquisa mercadológica sobre fidedignidade a um produto foi realizada em dois anos consec-
utivos, com duas amostras independentes de 400 donas de casa em cada uma delas. A preferência
pela marca em questão foi de 33% e 29%, respectivamente. Os resultados trazem alguma evidência
de mudança de preferência? Cacule o p-valor, qual seria seu parecer?

1.4.1 Solução
O sistema de hipóteses é 
H0 : pA − pB = 0
H1 : pA − pB ̸= 0.

4
Como consideramos a hipótese nula H0 : pA − pB = 0, utilizamos
400(0.33 + 0.29)
pb = = 0.31.
800
Utilizando esse valor para calcular a estatística de teste, obtemos
0.33 − 29
Z= r = 2.6446.
2
400

[8]: pA = 0.33
pB = 0.29
n = m = 400
alpha = 0.05
p_chapeu = (n*pA + m*pB) / (n + m)
z_c = (pA - pB) / (p_chapeu * (1 - p_chapeu) * np.sqrt(1/n + 1/m))
p_chapeu, z_c, norm.ppf(1 - alpha/2)

[8]: (0.31, 2.6446256425864356, 1.959963984540054)

Fixando α = 0.05, temos RC = {zc | |zc | ≥ z1− α2 = 1.960}. Como zc ≥ z1− α2 , rejeitamos H0 , ou
seja, somos levados a admitir que houve mudança de preferência.

[9]: p_valor = 2*(1 - norm.cdf(z_c))


p_valor

[9]: 0.008178133901203921

O p-valor da amostra é 0.0082, ou 0.82%, fornecendo forte evidência da nossa conclusão anterior.
Poderíamos sustentar nossa conclusão à nível de significância de 1%.

1.5 Questão 5
Numa discussão sobre reajuste salarial, entre empresários e o sindicato dos empregados, chegouse a
um impasse. Os empresários dizem que o salário médio da categoria é 7, 6 salários mínimos (SM),
e os empregados dizem que é 6, 5 SM. Para eliminar dúvidas, cada um dos grupos resolveu colher
uma amostra independente. Os empresários, com uma amostra de 25 operários, observaram um
salário médio de 7, 0 SM, com um desvio padrão igual a 2, 9 SM. Já a amostra do sindicato, com
21 operários, apresentou média igual a 7, 10 SM e desvio padrão de 2, 4 SM.
(a) As amostras colhidas servem para justificar as respectivas afirmações dos dois grupos?
(b) De posse dos dois resultados, qual é o seu parecer?

[10]: nA = 25
muA = 7
SA = 2.9
nB = 21
muB = 7.1
SB = 2.4

5
alpha = 0.05

1.5.1 Item (a)


Assumimos a média salarial segue uma distribuição normal.
Primeiramente, verificamos a afirmação dos empresários. O sistema de hipóteses é
 µI
H0 : µ = 7.6
H1µI : µ = 6.5

A estatística de teste é
7 − 7.6
tc = √ = −0.0414.
2.9 25
Fixando α = 0.05, o intervalo de confiança é

RC = {tc | tc ≤ −1.7109}.

Como tc = −0.0414 > tα;n−1 = −1.7109, não rejeitamos H0µI , isto é, aceitamos a afirmação dos
empresários.

[17]: (7 - 7.6) / (2.9 * 5), t.ppf(0.05, nA - 1)

[17]: (-0.041379310344827565, -1.7108820799094282)

A seguir, verificamos a afirmação dos empregados. O sistema de hipóteses é


 µII
H0 : µ = 6.5
H1µII : µ = 7.6

A estatística de teste é
7.1 − 6.5
tc = √ = 0.0546.
2.4 21
Fixando α = 0.05, o intervalo de confiança é

RC = {tc | tc ≥ 1.7247}.

Como tc = 0.0546 < tα;n−1 = 1.7247, não rejeitamos H0µII , isto é, aceitamos a afirmação dos
empregados.

[18]: (muB - 6.5) / (SB * np.sqrt(nB)), t.ppf(1 - alpha, nB - 1)

[18]: (0.05455447255899807, 1.7247182429207857)

1.5.2 Item (b)


Baseando-nos apenas nos dois resultados, nada podemos afirmar. Análises subsequentes são
necessárias para respaldar uma das visões ou uma visão alternativa.
Por exemplo, vamos verificar se há diferença entre as médias. O novo sistema de hipóteses é
 D
H0 : µ A − µ B = 0
H1D : µA − µB ̸= 0

6
Como desconhecemos as variâncias, vamos utilizar a seguinte estatística de teste:

X −Y 7.0 − 7.1
tc = r =r = −0.1280.
S12 S22 2.92 2.42
+ +
n m 25 21
O número de graus de liberdade estimado é 43. A α = 0.05, a região crítica é

RC = {tc | |tc | ≥ t0.975;43 } = 2.0167.

Não rejeitamos H0D . Admitimos, então, que ambas as partes coletaram dados a respeito de uma
mesma média. Como ela não pode ser ao mesmo tempo o valor alegado por uma parte e aquele
alegado pela outra, somos levados a concluir que deve se tratar de um valor intermediário.

[14]: nu = int(( SA**2 / nA + SB**2 / nB)**2 / ( (SA**2 / nA)**2 / (nA - 1) + (SB**2 /


,→ nB)**2 / (nB - 1)))

nu

[14]: 43

[15]: t_c = (muA - muB) / np.sqrt(SA**2 / nA + SB**2 / nB)


t_c

[15]: -0.12796497602610174

[16]: t_1_alpha_2 = t.ppf(1 - alpha/2, nu)


t_1_alpha_2

[16]: 2.0166921941428133

Você também pode gostar