Você está na página 1de 11

Lista de Exercícios

Entregar exercícios 3, 5 e 10

Aulas 1 e 2 – Comparação de Médias – variâncias populacionais conhecidas


1) As taxas de queima de dois propulsores de combustível sólido diferentes usados em sistemas de
escape de tripulações estão sendo estudadas. Sabe-se que ambos os propulsores têm
aproximadamente o mesmo desvio padrão da taxa de queima, σ1 = σ2 = 3 cm por segundo. Duas
amostras aleatórias de tamanhos n1 = n2 = 20 foram testadas para cada tipo de propulsor, e as taxas
médias de queimas observadas foram 𝑥̅1 = 18 e 𝑥̅2 = 24 cm por segundo.
a) Avalie através de um teste de hipóteses ao nível de significância de 5% se os 2 tipos de
propulsores apresentam as mesmas taxas de queima médias. Considere nível de significância
de 5 %.
Siga as etapas:
i) Defina quais variáveis aleatórias que estão sendo comparadas e os pressupostos sobre
elas utilizados para construção das inferências.
X1 – tempo de queima do propulsor 1
X2 – tempo de queima do propulsor 2
X11, X12, ...., X1 20 é uma a.a. de uma N(µ1, σ1 = 3)
X21, X220, ...., X2 20 é uma a.a. de uma N(µ2, σ2 = 3)
ii) Defina os parâmetros que estão sendo comparados.
µ1 = tempo médio de queima do propulsor 1
µ2 = tempo médio de queima do propulsor 2
iii) Escreva as hipóteses nula e alternativa em função destes parâmetros.( )
H0: µ1 = µ2 x Ha: µ1 ≠ µ2
iv) Obtenha a região crítica do teste.
|𝑍0 | ≥ 𝑍0,025 = 1,96
v) Calcule a estatística do teste.
18 − 24
𝑍0 = = −6,32
√9 ( 1 + 1 )
20 20
vi) Calcule o p valor e interprete.
𝑉𝑎𝑙𝑜𝑟 𝑝 = 𝑃 (𝑍0 ≥ |−6,32|) = 0,0000
A probabilidade de observar um valor da estatística de teste, tão grande, em valor
absoluto, quanto seu valor observado, quando a hipótese nula é verdadeira é
praticamente igual a zero. Isto indica que é muito improvável de observar um valor da
estatística de teste desta ordem quando a hipótese nula é verdadeira.
vii) Escreva sua conclusão final.
Como o valor da estatística do teste pertence à região crítica do teste, |-6,32| ≥1,96,
rejeitamos a hipótese nula, e concluímos que ao nível de significância de 5% existem
evidências de que as taxas de queima dos 2 tipos de propulsores são diferentes.
A decisão pode ser tomada verificando se seu valor está dentro da região crítica ou se
o p-valor é menor do que o nível de significância de 5%. Observe que o p-valor igual
a 0,0000 é menor do que 𝛼 = 0,05, indicando que devemos rejeitar H0.
b) Construa a interprete um intervalo de 95% de confiança para a diferença entre as taxas médias
de queima dos propulsores dos tipos 1 e 2.

1 1
(18 − 24) ± 1.96√9 ( + ) = [−7,86 ; −4,14]
20 20

Com 95% de confiança a diferença entre os tempos médios de queima dos propulsores 1 e 2
está entre -4,14 e -7,86 cm por segundo.

2) Um pesquisador deseja realizar um estudo para comparar os gastos médios com medicamentos
de homens e mulheres com idade entre 60 e 70 anos. Para isto ele selecionará 2 amostras de
mesmo tamanho, uma da população de idosos do sexo masculino e outra da população de idosos
do sexo feminino. Assuma que os gastos dos idosos com saúde possam ser descritos por
distribuições Normais. Assuma que os desvios padrão populacionais dos gastos com saúde dos
2 grupos são iguais a 50 reais.
a) Que tamanhos de amostras ele deve utilizar para garantir que, com probabilidade igual a 0,95, o
erro amostral cometido ao estimar a diferença entre os gastos médios com medicamentos de
homens e mulheres, seja no máximo igual a 10 reais?
1.960 2
𝑛=( ) (502 + 502 ) = 192,03
10

n deve ser ≥ 193

O valor de n diminui com o aumento de Δ, a diferença entre o parâmetro que queremos estimar
e sua estimativa. Para termos maior precisão temos de aumentar o valor de n.

b) Refaça o item a) assumindo que o erro amostral deve ser de no máximo 5 reais. Compare com
os resultados do item a.
1.960 2
𝑛=( ) (502 + 502 ) = 192,08 = 768,32
5
n deve ser ≥ 769
c) Refaça o item a) assumindo que os desvios padrão das notas são iguais a 40 reais. Compare com
os resultados do item a.
1.960 2
𝑛=( ) (402 + 402 ) = 112,93
10

n deve ser ≥ 113

O valor de n aumento com o aumento do desvio padrão, isto é com o aumento da incerteza sobre
a quantidade que queremos estimar.

3) Suponha que, ao comparar os gastos médios com medicamentos de homens e mulheres, o


pesquisador deseja identificar com um teste bilateral ao nível de significância de 5% uma
diferença entre as médias populacionais tão grande, em valor absoluto, quanto 10 reais, com
poder igual a 0,90.
a) Quais tamanhos de amostras ele deve utilizar. Considere tamanhos de amostras iguais e
desvios padrão populacionais dos gastos com medicamentos iguais a 50 para os 2 grupos
comparados.
z / 2  z  2  12   22  1,96  1,28 2 50 2  50 2 
n   524,88
 2 10 2
n deve ser ≥ 525
b) Refaça o item a, considerando que os desvios padrão são iguais a 40. Compare com o
resultado obtido em a.
z / 2  z  2  12   22  1,96  1,28 2 40 2  40 2 
n   335,92
 2 10 2
n deve ser ≥ 336
c) Refaça o item a, considerando que se deseja identificar uma diferença entre as médias igual
a 20. Compare com o resultado obtido em a.
z / 2  z  2  12   22  1,96  1,28 2 50 2  50 2 
n   131,22
 2 20 2
n deve ser ≥ 113
d) Para tamanhos de amostras iguais a 150, qual o poder do teste em identificar uma diferença
entre as 2 médias populacionais igual a 10 reais.

   
   
    0       0  
1   ( )  1  P Z  z / 2    P Z   z / 2  
  12  22    12  22 
     
 n1 n2   n1 n2 

𝛿 = 10, ∆0 = 0, 𝜎 2 = 2500, 𝑛1 = 𝑛1 = 150, 𝛼 = 0,05 𝑒 𝑧0,025 = 1,96

10 10
1 − 𝛽 (10) = 1 + 𝑃 𝑍 < −1,96 − − 𝑃 𝑍 < 1,96 − =
√2 × 2500 √2 × 2500
( 150 ) ( 150 )

1 − 𝛽 (10) = 1 + 𝑃(𝑍 < −1,96 − 1,73) − 𝑃 (𝑍 < 1.96 − 1,73) =


1 + 𝑃 (𝑍 < −3,69) − 𝑃(𝑍 < 0,23) = 0,4091
Aula 2 – Comparação de médias – variâncias desconhecidas
.
4) Uma fábrica utiliza em seu processo de produção matérias primas de dois fornecedores. O
engenheiro responsável pelo processo de produção suspeita que haja diferença entre os graus de
pureza da matéria prima dos 2 fornecedores. Para verificar sua suspeita ele obteve de uma amostra
aleatória de 10 porções da matéria prima de cada fornecedor e mediu o seu grau de pureza. Os
dados são apresentados na tabela abaixo.
Fornecedor Grau de pureza da matéria prima
A 12,8 13,4 11,2 11,6 9,4 10,3
14,1 11,9 12.4 9,8 11,0 13,2
B 8,1 10,3 4,2 7,8 8,1 12,7
6,8 6,4 5,7 6,1 7,0 6,2

a) Avalie através de um teste hipóteses para diferença de médias, ao nível de significância de 5%,
se há evidências a favor da hipótese do engenheiro. Siga as etapas:
i) Defina as variáveis aleatórias de interesse e os pressupostos realizados sobre elas para a
construção das inferências.
Y1 – grau de pureza da matéria prima do fornecedor A
Y2 – grau de pureza da matéria prima do fornecedor B
Y1,1, Y1,2 , .... , Y1,12 é uma a.a. N(µ1 ,σ1)
Y2,1, Y2,2, .... , Y2,12 é uma a.a. N(µ2, σ2)
As amostras são independentes.

ii) Verifique a validade dos pressupostos realizados sobre as variâncias populacionais. Para isto
construa o teste para comparação de 2 variâncias populacionais.

Hipóteses:

𝐻0 : 𝜎12 = 𝜎22 × 𝐻𝑎 : 𝜎12 ≠ 𝜎22

𝑆12
𝐄𝐬𝐭𝐚𝐭í𝐬𝐭𝐢𝐜𝐚 𝐝𝐞 𝐭𝐞𝐬𝐭𝐞: F0 = Distribuição de F0 sob H0: F ~ F(11,11)
𝑆22

Região Critica do Teste:

𝐹 < 𝐹11,11;0.975 = 0.28778 𝑜𝑢 𝐹 > 𝐹11,11; 0.025 = 3,4737

Quantis da distribuição obtidos no R


qf(0.025,11,11) [1] 0.2878776
qf(0.975,11,11) [1] 3.473699

2,20
f0 = = 0,4371
5,03

f0 não pertence a região crítica do teste → aceitar a hipótese nula

Valor P: f0 < 1 →valor P = 2 x P(F0<0,4371) = 0,1855 (obtido no R)

2*pf(0.4370,11,11) [1] 0.1855156

Ao nível de significância de 5% não há evidências de que as variâncias populacionais dos graus


de pureza da matéria prima dos 2 fornecedores sejam diferentes (Valor P = 0,1855 > α = 0.05)

Usando a função var.test do R

> x=c(12.8, 13.4, 11.2, 11.6, 9.4, 10.3, 14.1, 11.9, 12.4, 9.8,11.0, 13.2
)
> y = c(8.1, 10.3, 4.2, 7.8, 8.1, 12.7, 6.8, 6.4, 5.7, 6.1, 7.0, 6.2)
> var.test(X,Y)
F test to compare two variances
data: X and Y
F = 0.43707, num df = 11, denom df = 11, p-value = 0.1856
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.1258219 1.5182408
sample estimates:
ratio of variances
0.4370675

iii) Escrevas as hipóteses nula e alternativa em termos dos parâmetros de interesse relativos
às variáveis aleatórias.
iv) Indique qual a distribuição da estatística de teste quando H0 é verdadeira e a região crítica
do teste.
v) Calcule o valor da estatística de teste e escreva sua conclusão em termos do problema
proposto (não vale escrever apenas rejeito ou aceito H0). Mostre como foi calculada a
estatística de teste, não apenas o seu valor.
vi) Calcule e interprete o P-valor.

Hipóteses testadas:

𝐻0 : 𝜇1 = 𝜇2 × 𝐻𝑎 : 𝜇1 ≠ 𝜇2

Como não há evidências de que as variâncias populacionais são diferentes vamos utilizar
o teste t para amostras independentes assumindo variâncias iguais.

Estatística de teste:

Y1 - Y2   0
T0 
1 1
S C2   
 12 12 

que possui distribuição t de Student com 22 g. l quando a hipótese nula é verdadeira.

Região Crítica:

𝑇0 < −𝑡22;0,025 = −2,074 𝑜𝑢 𝑇0 > 𝑡22;0,025 = 2,074

Cálculo da estatística de teste e P-valor

2,2 + 5,03
𝑦̅1 = 11,76 𝑦̅2 = 7,45 𝑆𝑐2 = = 3,61
2

𝑡0 = 5,54 pertence à região crítica → rejeitar H0.

Valor P: 2 x P(T0 ≥ |5,74|) = 0,0000 (usando o R: 2 * pt(5.74, 22, lower.tail = F)

O valor P indica que é muito improvável observar um valor da estatística de teste maior ou
igual, em valor absoluto, que aquele observado neste estudo quando a hipótese nula é
verdadeira.

Ao nível de significância de 5% há evidências de que as médias dos graus de pureza das porções
de matéria prima dos 2 fornecedores são diferentes (valor P = 0,0000 < α = 0,05)
b) Construa e interprete um intervalo de 95% de confiança para a diferença entre os graus médios
de pureza das porções de matéria prima dos fornecedores A e B.

1 1
(11,76 − 7,45) ± 2,074√3,61 ( + ) = [2.70 ; 5.92 ]
12 12

Com 95% de confiança a diferença entre os graus médios de pureza das porções de matéria prima
dos fornecedores A e B está entre 2,70 e 5,92.

Realizando o teste e o intervalo de confiança no R.

> t.test(X,Y, var.equal=T)


Two Sample t-test
data: X and Y
t = 5.5481, df = 22, p-value = 1.413e-05
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
2.697875 5.918792
sample estimates:
mean of x mean of y
11.75833 7.45000

5) Como parte de uma pesquisa sobre reconhecimento de padrões, pessoas foram convidadas a
examinar uma figura para encontrar uma palavra escrita de trás em para frente e camuflada em
um padrão elaborado. Os tempos para reconhecimento da palavra tecnologia foram medidos para
dois grupos de pessoas, de 2 profissões diferentes: profissão A e B. De uma amostra de 23 pessoas
da profissão A, 11 reconheceram a palavra e de uma amostra de 19 profissionais da profissão B,
13. Os tempos em segundo, obtidos para os 2 grupos foram:

Profissão A: 55, 18, 99, 54, 87, 11, 68, 62, 27, 90, 57

Profissão B: 23, 69, 34, 27, 51, 29, 45, 42, 48, 64, 31, 30, 31

Nos itens seguintes, defina as variáveis aleatórias de interesse e os pressupostos realizados


sobre elas para a construção das inferências.
a) Construa e interprete um intervalo de 90% de confiança para a razão entre as variâncias dos
tempos até o reconhecimento da palavra pelos profissionais das 2 categorias.

Y1 – tempo até o reconhecimento da palavra por pessoas da profissão A


Y2 – tempo até o reconhecimento da palavra por pessoas da profissão B
Y1,1, Y1,2,...., Y1,12 é uma a.a. N(µ1,σ1)
Y2,1, Y2,2,...., Y2,12 é uma a.a. N(µ2,σ2)
As amostras são independentes.

𝑠12
𝑠12 = 844,89 𝑒 𝑠22 = 208,89 = 4,04
𝑠22

 4,04 4,04   4,04 4,04 



F ;   ;   1,47; 11,78
 0, 05,10,12 F0 , 95,10,12   3,37 0, 28 

Com 90% de confiança a razão entre as variâncias está entre 1,47 e 11,78.

No R:

> var.test(A,B,conf.level=0.95)
F test to compare two variances
data: A and B
F = 4.0445, num df = 10, denom df = 12, p-value
= 0.02536
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
1.198892 14.645005
sample estimates:
ratio of variances
4.044525

b) A partir deste intervalo, você concluiria que ao nível de significância de 10% existe diferenças
entre as variâncias dos tempos de reconhecimento da palavra entre as 2 categorias
profissionais.

Sim, pois o intervalo de confiança não inclui o valor 1, isto é o valor esperado da razão entre as
2 variâncias quando a hipótese nula é verdadeira.
c) Utilizando o teste adequado, ao nível de significância de 10%, avalie se há diferenças entre os
tempos médios gastos pelos profissionais das 2 categorias para reconhecimento da palavra.

Hipóteses testadas:

𝐻0 : 𝜇1 = 𝜇2 × 𝐻𝑎 : 𝜇1 ≠ 𝜇2

Como no item b, verificamos que as variâncias populacionais são diferentes, vamos utilizar o
teste de Welch, isto é a estatística de teste

Y1 - Y2   0
T0 
 S 12 S 22 
 
 11  13 
 

Cuja distribuição é aproximada por uma distribuição t de Student com v g.l..

2
 S12 S 22   844,89 208,90 
2
     
v  n1 n2 
  11 13 
 14,107
S12 / n1 2  S 22 / n2 2 844,89 / 102  208,90 / 132
n1  1 n2  1 10 12

A região de crítica do teste usando a tabela t é obtida aproximando os grau de liberdade pelo valor
inteiro mais próximo (14)

𝑡0 < −𝑡14;0,05 = −1,76 𝑜𝑢 𝑡0 > 𝑡14;0,05 = 1,76

O valor observado da estatística de teste é dado por:

57,09  40,31
t0   1,7415
 844,89 208,90 
  
 11 13 

que não se encontra dentro da região crítica do teste e portanto não temos evidências de diferenças
entre as 2 categorias profissionais quanto ao tempo médio até o reconhecimento da palavra, ao
nível de significância de 10%.

O valor P e calculado como:

Valor P: 2 x P(T0 ≥ |1,7415|) = 0,1034 (usando o R)

Temos então que a probabilidade de observar um valor da estatística do teste, quando a hipótese
nula é verdadeira, tão grande em valor absoluto quando o observado no estudo é igual a 0,1034,
maior que valor do nível de significância α = 0,10.
Quando a hipótese nula é verdadeira, toda a variação existente entre as médias amostrais dos 2
grupos é atribuída ao acaso. Portanto o p-valor pode ser interpretado como a probabilidade de obter
por mero acaso uma estatística de teste tão grande, em valor absoluto, quanto aquela observada
no estudo.

> t.test(A,B,conf.level=0.90)
Welch Two Sample t-test
data: A and B
t = 1.7415, df = 14.107, p-value = 0.1034
alternative hypothesis: true difference in means is not equal to 0
90 percent confidence interval:
-0.1819136 33.7483472
sample estimates:
mean of x mean of y
57.09091 40.30769

d) Quantifique a diferença entre os 2 grupos, construindo um intervalo de 90% de confiança para


a diferença entre os tempos médios para reconhecimento da palavra.

57,09  40,31   1,76 


844,89 208,90 
    0,19 ; 33,75
 11 13 

Então com 90% de confiança a diferença nos tempos médios até o reconhecimento das palavras
pelos profissionais das categorias A e B está entre -0,19 segundos e 33,75 segundos.

Você também pode gostar