Você está na página 1de 8

Introdução à inferência estatística

Lista de exercícios # 6

A resolução desta lista deve entregada via escaninho TIDIA até no máximo dia 21
de Maio.

As questões têm o mesmo valor, 10/4 = 2,5 pontos (o valor dos itens é equivalente à
divisão equitativa do valor da respectiva questão).

A Testes de diferença de média, populações independentes e


normais
(Q.1) Cap.13, Ex. 22 (adaptado). Em um levantamento feito com os operários da
indústria mecânica, chegou-se aos seguintes números: salário médio = 3,64 salários
mínimos e desvio padrão = 0,85 salário mínimo [tamanho amostral = 30]. Suspeita-se
que os salários da subclasse formada pelos torneiros mecânicos são diferentes dos
salários do conjunto todo, tanto na média como na variância.

(a) Que conclusões você retiraria se uma amostra de 25 torneiros apresentasse salário
médio igual a 4,22 salários mínimos e desvio padrão igual a 1 salário mínimo? [nota:
aplicar, inicialmente, o teste de igualdade de variâncias e, em seguida, o teste de
diferença de médias; assumir populações normais]

(b) Refaça o exercício tomando agora uma segunda categoria de trabalhadores


industriais, os operadores de máquinas de transporte. Em uma amostra de 25
operadores, o salário médio foi de 4,4 salários mínimos e desvio padrão igual a 1,5
salários mínimos.

R:

Item a

Estágio 1: teste de igualdade/razão de variâncias

Passo 1.1: Definição do teste: denotando-se a variância populacional salarial dos


torneiros mecânicos por σ2T e a variância populacional geral por σ2, e percebendo que a
afirmação sob teste é a de que a variância dos torneiros é diferente da geral (i.e., maior
ou menor), as hipóteses são:

H0: σ2T = σ2 vs H1: σ2T ≠ σ2

Passo 1.2: estatística do teste e FD (colocam-se os torneiros no denominador pois com


isso a interpretação da implicação da estatística é mais simples)

Estatística do teste = Fobs = S2T/S2 = 12 /0,852 = 1,384083

Fobs ~ F(24,29)

1
Passo 1.3: RC(σ2T / σ2;5%) = {0,F1} U {F2,ꚙ}, com F1 = qf(0.025, 24,29) =
0.4509699 e F2 = qf(1-0.025, 24,29) = 2.154006. RC = {0;0,45} U {2,154;ꚙ}

Passo 1.4: Fobs = 1,384083 ∉ RC = {0;0,45} U {2,154;ꚙ}. A decisão correta é não


rejeitar H0 e concluir que a variância salarial dos torneiros é de fato diferente.

Estágio 2: teste de diferença de média para populações normais, independentes, com


variâncias desconhecidas e iguais [situação 2]

Passo 2.1: definição do teste: H0: μT = μ vs H1: μT ≠ μ

Passo 2.2: estatística e FD


𝑋̅𝑇 −𝑋̅−𝛥0 4,22−3,64 0.58
Estatística do teste = tobs = = = (𝑖)
2 ( 1 +1)
√𝑆2𝐴 2 (1+1)
√𝑆2𝐴
1 1
2 ( + )
√𝑆2𝐴
𝑁𝑇 𝑁 25 30 25 30

𝑁−1 𝑀−1 24 29 24 29
2
𝑆2𝐴 = 𝑆𝑇2 + 𝑆2 = 1 + 0,852 = 1+ 0,852
𝑁+𝑀−2 𝑁+𝑀−2 53 53 53 53
= 0.8481604(𝑖𝑖)

(iii) Incorporando (ii) em (i):


0.58
tobs = 1 1
= 2.325617
√0.8481604( + )
25 30

Tobs ~ t(NT+N-2) = t(53)

Passo 2.3: RC = {0,-tα} U {tα;ꚙ}, P(t53<-tα) = 2,5%. O comando qt(0.025,53)


retorna -2,005746  RC = {0;-2,005746} U {2,005746,ꚙ}. P-valor observado =
2P(t53<-|2,325617|) = segundo comando 2.pt(-2.325617,53) = 0.02389801 ~ 2,4%.

Passo 2.4, decisão: tobs = 2,325617 ∈ RC = {0;-2,005746} U {2,005746,ꚙ} e p-valor


observador = 2,4% < 5%. A decisão correta é rejeitar H0 e concluir pela diferença
salarial média entre torneiros e trabalhadores em geral.

Conclusão dos dois estágios: a categoria dos torneiros difere em média salarial mas não
em variância (dispersão) salarial dos trabalhadores industriais em geral.

Item b

Passo 1.2: Fobs = 1,52/0,852 = 3,11

Passo 1.3: a RC é função unicamente dos tamanhos amostrais e nível de significância,


mantendo-se pois equivalente ao item a, RC = {0;0,45} U {2,154;ꚙ}.

Passo 1.4: 3,11 ∈ RC = {0;0,45} U {2,154;ꚙ}, rejeita-se pois igualdade de variâncias.

Estágio 2: teste de diferença de médias, populações normais e independentes, variâncias


desconhecidas e diferentes [situação 3].

2
Passo 2.2:
𝑋̅𝑇 −𝑋̅ −𝛥0 4,4−3,64
Estatística do teste = tobs = = = 2,250103
𝑆 2 𝑆2 1,52 0,852
√ 𝑇+ √ +
𝑁𝑇 𝑁 25 30

(𝐴+𝐵)2
FD da estatística: Tobs ~ t(v), sendo 𝑣 = 𝑎 [ 𝐴2 𝐵2
] , com a(.) sendo a função que
+
𝑁𝑇 𝑁

arredonda para o inteiro mais próximo e A e B dados a seguir.

A = S2T/NT = 1,52/25 = 0.09

B = S2/N = 0,852/30 = 0.02408333

(0.09 + 0.0248333)2
𝑣 = 𝑎[ ] = 38
0.0092 0.02483332
+
25 30
Tobs ~ t(38)

Passo 2.3: RC = {0;-tα} U {tα,ꚙ}, P(t38< -tα) = -2,024394 segundo comando


qt(0.025,38) do R. RC = {0; -2,024394} U {2,024394,ꚙ}

P-valor observado = 2.P(t38<-|2,250103|) = 0.03031286 ~ 3%

Passo 2.4: 2,25 ∈ RC = {0;-2,02} U {2,02,ꚙ} e 3% < α = 5%. A decisão correta é


rejeitar H0.

Conclui-se, pois, que os operadores de máquinas diferem tanto em média com em


variância salariais dos trabalhadores em geral.

(Q.2) Cap.13, Ex. 24 (adaptado). Deseja-se saber se duas amostras de trabalhadores


participaram de um mesmo programa de qualificação, o qual já se mostrou eficaz em
reduzir o tempo médio para a realização de uma tarefa produtiva específica. A primeira
amostra, com 100 trabalhadores, demora, em média, 12 minutos para completar a tarefa,
com um desvio padrão de dois minutos. A segunda amostra, com 50 trabalhadores
demora, em média, 11 minutos para completar a tarefa, com desvio padrão igual a três
minutos. Uma terceira amostra, com 64 trabalhadores, demora, em média, 10 minutos
com desvio padrão igual a dois minutos e vinte segundos [nota: os desvios-padrão
informados são amostrais].

(a) Teste a hipótese de que a primeira e a segunda amostra são provenientes da mesma
população, definida em função da participação (ou não) no programa de qualificação.
I.e., teste a hipótese de não há diferença em média;

(b) Replique o item anterior, agora comparando a primeira e a terceira amostra.

3
R: não havendo menção no enunciado acerca das variâncias populacionais, é necessário
aplicar um teste em dois estágios, iniciando pelo teste de razão de variâncias. É
necessário assumir que as três amostras são provenientes de populações normais.

Estágio 1: teste de razão de variâncias

Passo 1.1: Definição do teste:

H0: σ21 = σ22 vs H1: σ21 ≠ σ22

Passo 1.2: estatística e FD

Estatística do teste = Fobs = S12/ S22 = 22/32 = 4/9 ~ 0,444.

Fobs ~ F(99,49)

Passo 1.3: RC = {0,F1} U {F2;ꚙ}, F1 = 0,626023, segundo comando qf(0.025,99,49) e


F2 =1.663804, de acordo com comando qf(1-0.025,99,49). RC = {0;0,626023} U
{1.663804; ꚙ}.

Passo 1.4: Fobs = 0,444 ∈ RC = {0;0,626023} U {1.663804; ꚙ}, no caso Fobs pertence à
cauda inferior. A hipótese nula é rejeitada, e, pois, conclui-se pela diferença das
variâncias populacionais.

Estágio 2: teste de diferença de médias, populações normais, independentes, variâncias


desconhecidas e diferentes [situação 3]

Passo 2.1: H0: μ1 = μ2 vs H0: μ1 ≠ μ2 (notar que H1 é a mais geral possível pois o
enunciado solicita o teste de diferença em média).

Passo 2.2
𝑋̅1 −𝑋̅2 −𝛥0 12−11
Estatística do teste = tobs = = 2 2
= 2,132007
𝑆2 𝑆2 √ 2 +3
√ 1+ 2 100 50
𝑁1 𝑁2

(𝐴+𝐵)2
FD da estatística: Tobs ~ t(v), sendo 𝑣 = 𝑎 [ 𝐴2 𝐵2
] , com a(.) sendo a função que
+
𝑁1 𝑁2

arredonda para o inteiro mais próximo e A e B são dados a seguir.

A = S21/N1 = 22/100 = 0,04

B = S22/N2 = 32/50 = 0,18

(0.04 + 0.18)2
𝑣 = 𝑎[ ] = 73
0.042 0.182
100 + 50
Tobs ~ t(73)

4
Passo 2.2 RC = {-ꚙ;-tα} U { tα ; ꚙ}, P(t<- tα) = 2,5%, e, pois, tα = -1,992997, conforme
comando qt(0.025,73). RC = {-ꚙ; -1,992997} U {1,992997;ꚙ}. P-valor observado =
2P(t73<-|2,132007|) = 0.02868351~2,9%, segundo comando pt(-2,232007,73).

Passo 2.4 tobs = 2,132007 ∈ RC = {-ꚙ; -1,992997} U {1,992997;ꚙ} e p-valor


observado = 2,9% < 5%. O correto é rejeitar a hipótese nula.

Como conclusão geral do teste, a amostra 1 é proveniente de população que difere da


que deu origem à amostra 2 tanto em média como em variância.

Item b

Estágio 1: teste de razão de variâncias.

Passo 1.1: Definição do teste:

H0: σ21 = σ23 vs H1: σ21 ≠ σ23

Passo 1.2: estatística e FD

Estatística do teste = Fobs = S12/ S32 = 22/(2+20/60)2 = 22/(2,333)2 = 0,7349038

Fobs ~ F(99,63)

Passo 1.3: RC = {0,F1} U {F2;ꚙ}, F1 = 0,6448231, segundo comando qf(0.025,99,63)


e F2 =1.586521, de acordo com comando qf(1-0.025,99,63). RC = {0;0,65} U {1,59;
ꚙ}.

Passo 1.4: Fobs = 0,74 ∉ {0;0,65} U {1.59; ꚙ}. A hipótese nula não deve ser
rejeitada, concluindo-se pela igualdade de variâncias.

Estágio 2: teste de diferença de médias, populações normais e independentes, variâncias


desconhecidas e iguais [situação 2].

Passo 2.1: H0: μ1 = μ3 vs H1: μ1 ≠ μ3

Passo 2.2:
12−10−𝛥0 2
Estatística do teste = tobs = = (𝑖)
2 ( 1 + 1 ) 2 ( 1 1
√𝑆2𝐴 𝑁1 𝑁2
√𝑆2𝐴 + )
100 64

2
99 2 63 2 99 2 63
𝑆2𝐴 = 𝑆1 + 𝑆2 = 2 + 2,332 = 4,555683(𝑖𝑖)
162 162 162 162
(iii) Incorporando (ii) em (i):
2
tobs = 1 1
= 3.460211
√4.555683( + )
25 30

Tobs ~ t(N1+ N2-2) = t(162)

5
Passo 2.3: RC = {-ꚙ;-tα} U {tα; ꚙ}, P (t162 < tα) = 2,5%, sendo, pois, tα = -1,974716
segundo comando qt(0.025,162). RC = {-ꚙ;-1,974716} U {1,974716; ꚙ}.

P-valor observado = 2P(t162 < -|3,460211|) = 0,00069 ~ 0,007%, de acordo com


comando pt(-3.460211,162).

Passo 2.4: tobs = 3,46021 ∈ RC = {-ꚙ;-1,974716} U {1,974716; ꚙ} e p-valor


observado = 0,007% < 5%. É correto rejeitar a hipótese nula.

Segundo os dois estágios, primeira e terceira amostras são provenientes de populações


distintas em média mas não em variância.

B Testes de diferença de média, populações dependentes e


normais
(Q.3) Cap.12, Ex. 28. Um médico deseja saber se certa droga reduz a pressão arterial
média. Para isso, mediu a pressão arterial em cinco voluntários, antes e depois da
ingestão da droga, obtendo os dados do quadro abaixo. Você acha que existe evidência
estatística de que a droga realmente reduz a pressão arterial média? Que suposições
você fez para resolver o problema [Atenção: tratam-se dos mesmos voluntários,
observados em dois estados, antes e depois do tratamento]?

Volutário A B C D E
Antes 68 80 90 72 80
Depois 60 71 88 74 76

R: Pareando os dados e calculando as diferenças intra-indivíduo (antes - depois),


chega-se a uma diferença média de 4,2 e a um desvio padrão da diferença de 4,49444,
de modo que a estatística do teste é 4,2 / 4,4944 = 0,93449. Há N-2 = 3 graus de
liberdade, de modo que RC = {-∞;-3,18} U {3,18;∞} e, pois, H0 é não-rejeitada.

C Testes de diferença de média, populações independentes,


não-normais (teste de Wilcoxon)
Observação: tomar por base a nota de aula 8.

(Q.4) Cap.13, Ex. 36 (adaptado). Em um estudo sobre um novo método para ensinar
Matemática a alunos do primeiro grau, dez crianças foram selecionadas ao acaso de um
grupo de 20 e ensinadas pelo novo método, enquanto as outras dez serviram como
controle e ensinadas pelo método tradicional. Após dez semanas, o desempenho dos
alunos em um teste foi avaliado e obtiveram-se as seguintes notas:

Novo método 8,5 7,5 9 9,5 10 7 6,5 8 8,3 7,1


Controle 7,3 10,1 6,3 5 8,1 7,7 4,5 9,7 6,7 7,2

6
Responda à pergunta quanto a se o novo método aumenta o desempenho aplicando o
teste de Mann-Whitney. Atenção 1: fazer o teste passo a passo, conforme
apresentado na nota de aula 8 (à mera apresentação do resultado do comando
“wilcox.test” será atribuída nota nula). Atenção 2: não há repetição de valores (não
há empates).

R:

Passo 1: As crianças submetidas ao novo método serão denominadas por tratamento,


“T”, e as do grupo de controle representadas por “C”. Com isso:

H0: PT = PC vs H1: PT ≠ PC;

Ou, alternativamente:

H0: ΩT = ΩC vs H1: ΩT ≠ ΩC;

Passo 2:

Estatística do teste = Us = Ws + m(m+1), Ws sendo a soma dos postos do grupo de


referência, no caso, será assumido que se trata do grupo de tratamento. Também seria
possível assumir que se trata do grupo de controle. Em qualquer um dos dois casos,
bastaria ser coerente com a definição do grupo de referência ao longo de todos os
passos.

(2.a) Postos do grupo de referência: elabora-se uma lista única das observações, em
ordem crescente e com identificação do grupo de origem [dica: usar planilha eletrônica];

Posto Grupo Observação


1 C 4.5
2 C 5
3 C 6.3
4 T 6.5
5 C 6.7
6 T 7
7 T 7.1
8 C 7.2
9 C 7.3
10 T 7.5
11 C 7.7
12 T 8
13 C 8.1
14 T 8.3
15 T 8.5
16 T 9
17 T 9.5
18 C 9.7

7
19 T 10
20 C 10.1
(2.b) Wsobs = 4+6+7+10+12+14+15+16+17+19 = 120.

(2.c) Usobs = Wsobs – m(m+1)/2 = 120 – 55 = 65 (m = tamanho do grupo de referência)

(2.d) FD: U(10,10), sendo U a FD de Mann-Whitney.

Passo 3: RC = {0,c1} U {c2;m.n}, P(U10,10 < c1) = 2,5%, P(U10,10 > c2) = 2,5%, m.n =
100 (n = tamanho do grupo de comparação). Com base nos comandos
qwilcox(0.025,10,10) e qwilcox(1-0.025,10,10), acionados no R, obtêm-se,
respectivamente, c1 = 24 e c2 = 76. Com isso, RC = {0,24} U {76;100}.

Passo 4, decisão: Usobs = 65 ∉ RC = {0,24} U {76;100}, uma vez que Usobs é


intermediário aos valores críticos. Não se deve rejeitar a hipótese nula de que as duas
populações são equivalentes. Conclui-se, pois, que o novo método não aumenta o
desempenho dos alunos.

Você também pode gostar