Você está na página 1de 6

Introdução à inferência estatística

Lista de exercícios # 7

A resolução desta lista deve entregada via escaninho TIDIA até no máximo dia 01
de Junho.

As questões têm o mesmo valor, 10/4 = 2,5 pontos (o valor dos itens é equivalente à
divisão equitativa do valor da respectiva questão).

A Teste de aderência
(Q.1) Cap.14, ex.3. Um modelo genético especifica que animais de certa população
devam estar classificados em quatro categorias, com probabilidades p1 = 0,656, p2 =
0,093, p3= 0,093, p4 = 0,158. Dentre 197 animais, obtivemos as seguintes frequências
observadas: O1 = 125, O2 = 18, O3 = 20, O4 = 34. Teste se esses dados estão de acordo
com o modelo genético postulado.

Passo 1: A hipótese a ser testada é a de que as probabilidades teóricas são válidas na


realidade, i.e., correspondem às empíricas.

H0 [todas iguais]: p1 = 0,656, p2 = 0,093, p3= 0,093, p4 = 0,158 vs

H1 [pelo menos uma diferente]: (p1 ≠ 0,656 e p2 = 0,093, p3= 0,093, p4 = 0,158) ou
(p1 = 0,656 e p2 ≠ 0,093, p3= 0,093, p4 = 0,158) ou (p1 = 0,656 e p2 = 0,093, p3≠
0,093, p4 = 0,158) ou (p1 = 0,656 e p2 = 0,093, p3= 0,093, p4 ≠ 0,158)

Passo 2: estatística do teste


𝑁
2
(𝑂𝑖 − 𝐸𝑖 )2
𝜒 =∑
𝐸𝑖
𝑖=1

(125 − 0,656(197))2 (18 − 0,093(197))2 (20 − 0,093(197))2


+ +
0,656(197) 0,093(197) 0,093(197)
(34 − 0,158(197)) 2
+
0,158(197)

=0.1385866+ 0.005624202+0.1538694+ 0.265369=0.5634492

Passo 3: com 3 graus de liberdade, RC = {7.814728;∞}.

Passo 4, como o valor observado da estatística não pertence à RC, a hipótese é não-
rejeitada.

1
B Teste de homogeneidade
(Q.2) Cap.14, ex. 6. Suponha que tenhamos razões para crer que as notas obtidas por
estudantes de escolas públicas sejam menores do que as notas obtidas por estudantes de
escolas particulares, ao tomarem o exame vestibular para uma Universidade. Para testar
essa hipótese, foram selecionadas duas amostras de estudantes que prestaram o
vestibular, suas notas gerais foram anotadas e obteve-se a tabela a seguir.

Escola /
Faixa de (0;2,5] (2,5;5] (5;7,5] (7,5;10] Total
nota
Pública 15 22 18 3 58
Particular 6 10 20 6 42
Total 21 32 38 9 100
Teste a hipótese de que as duas populações são homogêneas, para o nível de
significância α = 0,01. Obtenha a região crítica e calcule o p-valor.

R: Passo 1,
H0: P(I|Pública) = P(I|Privada), para todo I, com “I” sendo o i-ésimo intervalo de notas.
H1: P(I|Pública) ≠ P(I|Privada) para pelo menos um intervalo I.
Passo 2 Estatística do teste
Cálculo das frequências relativas esperadas como na tabela abaixo.

Escola /
Faixa de (0;2,5] (2,5;5] (5;7,5] (7,5;10] Total
nota
Pública 21% 32% 38% 9% 100%
Particular 21% 32% 38% 9% 100%
Total 21% 32% 38% 9% 100%
Cálculo das frequências absolutas esperadas como na tabela abaixo.

Escola /
Faixa de (0;2,5] (2,5;5] (5;7,5] (7,5;10] Total
nota
Pública 12 19 22 5 58
Particular 9 13 16 4 42
Total 21 32 38 9 100

A estatística do teste é:
𝐶 𝐿 2
2
(𝑂𝑖,𝑗 − 𝐸𝑖,𝑗 )
𝜒 = ∑∑ ~𝜒 2 [(𝐿 − 1)(𝐶 − 1)]
𝐸𝑖,𝑗
𝑗=1 𝑖=1

Sendo L o número de linhas, C o de colunas.

Tomando por base as frequências absolutas esperadas e observadas, o valor observado da


estatística é 7,08.

2
Passo 3: Como há (L-1)(C-1) = (2-1)(4-1) = 3 graus de liberdade, RC = {7.814728;∞}
Passo 4: o valor observado da estatística não pertence à RC e, pois, H0 não deve ser
rejeitada.

C Teste de independência
(Q.3) Cap.14, Q. 14. Uma pesquisa sobre a qualidade de certo produto foi realizada
enviando-se questionários a donas de casa pelo correio. Aventando-se a possibilidade de
que os respondentes voluntários tenham um particular viés de respostas, fizeram-se
mais duas tentativas com os não-respondentes. Os resultados estão indicados abaixo.
Você acha que existe relação entre a resposta e o número de tentativas?

Opinião Número de respondentes


sobre o
produto 1a 2a 3a
tentativa tentativa tentativa
Excelente 62 36 12
Satisfatório 84 42 14
Insatisfatório 24 22 24

R: assumindo dependência conforme exige H0, chega-se à tabela abaixo:

Opinião Número de respondentes


sobre o
produto 1a 2a 3a
tentativa tentativa tentativa
Excelente 58,4375 34,375 17,1875
Satisfatório 74,375 43,75 21,875
Insatisfatório 37,1875 21,875 10,9375

Assim como no exercício anterior, a estatística do teste é


2
(𝑂𝑖,𝑗 −𝐸𝑖,𝑗 )
𝜒 2 = ∑𝐶𝑗=1 ∑𝐿𝑖=1 ~𝜒 2 [(𝐿 − 1)(𝐶 − 1)]. Cujo valor é 26,29. Uma vez que (L-
𝐸𝑖,𝑗
1)(C-1) = (3-1)(3-1) = 4, há 4 graus de liberdade e RC = {9.487729;∞}. Deve-se, pois, rejeitar
a hipótese nula de independência.

3
D Teste de correlação
(Q.4) Na tabela abaixo há o salário horário e os anos de estudo de uma subamostra de
30 indivíduos extraída da Pesquisa Nacional por Amostra de Domicílios Anual (PNAD)
de 2015.

Salário horário Anos de


N
(R$/hora) estudo
1 5.450498 13
2 15.37083 6
3 13.48791 11
4 8.30025 11
5 11.98925 2
6 4.150125 0
7 21.44231 13
8 13.83375 11
9 6.916875 11
10 16.34898 15
11 6.288068 9
12 6.288068 11
13 4.542081 5
14 5.450498 11
15 6.148333 9
16 14.60229 14
17 6.916875 9
18 6.164319 5
19 20.75063 15
20 13.83375 13
21 4.954998 11
22 8.30025 11
23 6.288068 11
24 10.16357 11
25 4.954998 11
26 8.30025 0
27 5.187656 8
28 11.067 10
29 6.056108 11
30 17.29219 11
Com base nos dados, teste a hipótese de que o valor populacional da correlação entre as
duas variáveis é zero. Para realizar o teste, seguir os passos: (i) calcular o coeficiente de
correlação passo a passo com auxílio de uma planilha eletrônica (excel ou Calc (Libre
Office), p.ex.), (ii) calcular o valor da estatística do teste, (iii) obter a região crítica, (iv)
tomar a decisão quanto à rejeição da hipótese nula.

4
Passo 1: H0: ρ = 0 vs H1: ρ ≠ 0

Passo 2:

𝑁−2 𝑋𝑖 −𝑋̅ 𝑌𝑖 −𝑌̅


Estatística do teste = T = r√1−𝑟 2 →𝐷 𝑡(𝑁 − 2), r = 𝑁 −1 ∑𝑁
𝑖=1 ( )( ). O valor
𝑆𝑋 𝑆𝑌
de r foi calculado a partir de uma planilha eletrônica, como detalhado abaixo.

X = Salário horário Y = Anos de A= B=


N A.B
(R$/hora) estudo Xi-m(X)/s(x) Yi-m(X)/s(x)
1 5.450498 13 -0.861873335 0.880126252 -0.75856
2 15.37083 6 1.152659557 -0.949839222 -1.09484
3 13.48791 11 0.770292891 0.357278973 0.275209
4 8.30025 11 -0.283171015 0.357278973 -0.10117
5 11.98925 2 0.465958332 -1.995533778 -0.92984
6 4.150125 0 -1.125941531 -2.518381057 2.83555
7 21.44231 13 2.385601777 0.880126252 2.099631
8 13.83375 11 0.840523006 0.357278973 0.300301
9 6.916875 11 -0.56409452 0.357278973 -0.20154
10 16.34898 15 1.351293569 1.40297353 1.895829
11 6.288068 9 -0.69178706 -0.165568305 0.114538
12 6.288068 11 -0.69178706 0.357278973 -0.24716
13 4.542081 5 -1.046346589 -1.211262861 1.267401
14 5.450498 11 -0.861873335 0.357278973 -0.30793
15 6.148333 9 -0.720163202 -0.165568305 0.119236
16 14.60229 14 0.996591282 1.141549891 1.137659
17 6.916875 9 -0.56409452 -0.165568305 0.093396
18 6.164319 5 -0.716916907 -1.211262861 0.868375
19 20.75063 15 2.245141548 1.40297353 3.149874
20 13.83375 13 0.840523006 0.880126252 0.739766
21 4.954998 11 -0.962495073 0.357278973 -0.34388
22 8.30025 11 -0.283171015 0.357278973 -0.10117
23 6.288068 11 -0.69178706 0.357278973 -0.24716
24 10.16357 11 0.095215457 0.357278973 0.034018
25 4.954998 11 -0.962495073 0.357278973 -0.34388
26 8.30025 0 -0.283171015 -2.518381057 0.713133
27 5.187656 8 -0.915248953 -0.426991944 0.390804
28 11.067 10 0.278675995 0.095855334 0.026713
29 6.056108 11 -0.738891436 0.357278973 -0.26399
30 17.29219 11 1.542832277 0.357278973 0.551222
m 9.6946926 9.633333333 0.389051
s 4.924383236 3.825208782

Com base na planilha r = 0.389051, este sendo o valor observado do coeficiente de


correlação.

5
𝑁−2 30 − 2
T = r√ 2
= 0.389051√ = 2.234724
1−𝑟 1 − 0.3890512

Passo 3, RC = {-ꚙ; -tα} U {tα;ꚙ} , P(t<- tα) = 0.025 e, pois, tα = -2,048407 segundo
comando qt(0.025,28) no R. RC = {-ꚙ; -2,048407 } U {2,048407;ꚙ}. P-valor observado
= 2.P(t28< -2.234724) = 0.0335951 ~3,33%, segundo comando pt(-2.234724,28) no R.

Passo 4: tobs = 2,234724 ∈ RC = {-ꚙ; -2,048407 } U {2,048407;ꚙ} e p-valor observado


= 3,33% < 5%. Deve-se rejeitar a hipótese nula, concluindo-se, pois, pela correlação
entre remuneração e anos de estudo.

Você também pode gostar