1.1 Introdução
A Estatística é uma ciência que tem como objetivo a tomada de decisão em situações
de incerteza. Esta ciência divide-se basicamente em duas partes. A primeira parte é
conhecida como Estatística Descritiva, e trata da coleta, organização e descrição de
dados. A segunda é a Estatística Inferencial, e se preocupa em fazer afirmações e/ou
testar hipóteses sobre características numéricas em situações de incerteza.
Para iniciar o estudo da Estatística Inferencial é necessário compreender os seguintes
conceitos básicos:
1
Dois novos conceitos estreitamente relacionados com os de população e amostra são
os de Parâmetro e Estatística, tendo em vista que:
Definição 1.3 (Parâmetro). É uma medida numérica que descreve uma caracterís-
tica da população, ou ainda, que é obtida a partir de todos os dados populacionais
(através de um censo).
Definição 1.4 (Estatística). É uma medida que descreve uma característica numérica
da amostra, ou ainda, que é obtida a partir de dados amostrais, e que será usada para
extrair informações sobre a população.
Os parâmetros não apresentam incerteza sobre seu real valor. Por outro lado, as
estatísticas podem apresentar diferentes valores, se obtidas a partir de diversas amostras.
1.2 Amostragem
Definição 1.8 (Amostragem). É a obtenção da amostra.
Para isto, existem várias técnicas de amostragem que podem ser utilizadas, as principais
são:
2
(i) Amostragem Aleatória Simples
Este tipo de amostragem consiste em selecionar a amostra através de um sorteio,
sem restrição. A amostragem aleatória simples tem a seguinte propriedade: qual-
quer subconjunto da população, com o mesmo número de elementos, tem a mesma
probabilidade de fazer parte da amostra.
Exemplo 5: Com o objetivo de estudar algumas características dos alunos de uma
certa disciplina, vamos extrair uma amostra aleatória simples de tamanho cinco. A
listagem dos alunos da disciplina é apresentada a seguir.
População: alunos da disciplina
Analigia Anderson Anna Carolina Arthur Bruna
Camila Carlos Cesar Carlos Raiff Chrystiano Cicero
Daniela Danilo Davi Diego Ewerton
Fabiana Fabiano Felipe Herusca Isabele
Jordanye Jose Orlando Kllydevan Lindembergue Luanna
Luiz Gustavo Maecio Magna Maira Marcia
Maria do Socorro Marina Matheus Nailton Nilman
Oscar Osnes Patricia Raquel Reinaldo
Renato Roberta Rodrigo Azevedo Rodrigo de Brito Ronaldo
Soter Stella Taise Thiago Ygor
Um procedimento simples seria enumerar todos os elementos da população e através
de sorteio retirar uma amostra de tamanho 5 desta população. Existem vários meca-
nismos de sorteio, o importante é que haja aleatoriedade no processo. (Usar tabela
de números aleatórios, considerando valores da quinta coluna, de baixo para cima.)
3
(iii) Amostragem Estratificada
A técnica da amostragem estratificada consiste em dividir a população em subgrupos,
que denominaremos estratos. Os estratos possuem as seguintes características: são
internamente homogêneos e externamente heterogêneos. Podemos ter dois tipos de
amostragem estratificada, a proporcional e a uniforme.
População
Servidores: S1 S2 S3 S4 S5 S6 S7 S8 S9 S10
Professores: P1 P2 P3 P4 P5 P6 P7 P8 P9 P10
Alunos: A1 A2 A3 A4 A5 A6 A7 A8 A9 A10
A11 A12 A13 A14 A15 A16 A17 A18 A19 A20
A21 A22 A23 A24 A25 A26 A27 A28 A29 A30
4
1.2.1 Tamanho de uma Amostra Aleatória Simples
Definição 1.9 (Erro Amostral). É a diferença entre o valor que a estatística pode
acusar e o verdadeiro valor do parâmetro que se deseja estimar.
5
Definição 1.10 (Amostra Aleatória Simples - AAS). Variáveis aleatórias X1 , X2 , ..., Xn
constituem uma amostra aleatória simples de tamanho n, ou simplesmente amostra
aleatória (a.a.) de uma variável aleatória (v.a) X, quando satisfazem as seguintes
condições:
1) As variáveis aleatórias X1 , X2 , ..., Xn são independentes, e
2) Cada uma das variáveis aleatórias Xi , i = 1, 2, ..., n têm a mesma distribuição
de probabilidade da variável X.
Exemplo 10: Considere uma população formada pelos seguintes elementos {1, 3, 5, 5, 7}.
Considere a variável X: valor assumido pelo elemento na população. Assim, a distribuição
de probabilidade de X é dada por:
X=x 1 3 5 7
P (X = x)
Observações:
1) E(X) =
2) V ar(X) =
6
1.3 Distribuições Amostrais
Definição 1.11. Dada uma amostra aleatória X1 , X2 , ..., Xn de uma população X,
definiremos uma estatística T como qualquer função de X1 , X2 , ..., Xn , ou seja T =
f (X1 , X2 , ..., Xn ).
X = x̄ Total
P (X = x̄)
S 2 = s2 Total
P (S 2 = s2 )
Observações:
7
1) Note que E(X) = E(X1 ) = E(X2 ) = E(X) = 4, 2, e que V ar(X) = V ar(X)/2 =
2, 08;
2) Podemos observar que E(S 2 ) = 4, 16 = σ 2 .
Seria tudo isso uma coincidência? Resposta: Não!!!! Veremos adiante a justificativa
destes fatos.
Teorema 1.1. Seja X uma variável aleatória com média µ e variância σ 2 , e seja
(X1 , X2 , ..., Xn ) uma amostra aleatória de X. Então, a média amostral (X) terá média
e variância dadas respectivamente por
E(X) = µ
e
σ2
V ar(X) = .
n
Um teorema bem mais forte do que este é o que se refere à distribuição de probabilidade
da variável X. Este teorema é conhecido como o Teorema Central do Limite e pode ser
enunciado da seguinte forma:
Teorema 1.2 (Teorema Central do Limite). Para amostras aleatórias (X1 , X2 , ..., Xn ),
retiradas de uma população com média µ e variância σ 2 finita, a distribuição amostral
da média X aproxima-se, para n suficientemente grande, de uma distribuição normal,
com média µ e variância σ 2 /n.
X ≈ N (µ, σ 2 /n)
X −µ
Z= √ ≈ N (0, 1)
σ/ n
.
Observações:
1) No teorema acima não fizemos nenhuma suposição sobre a natureza das dis-
tribuições das variáveis X1 , X2 , ..., Xn , ou seja, independentemente de como se comportam
essas variáveis, sejam elas discretas ou contínuas, o teorema continua válido.
2) Se as variáveis X1 , X2 , ..., Xn têm distribuição normal, então X terá também dis-
tribuição normal e não apenas uma aproximação.
8
a) A probabilidade de, ao entrar em uma loja, observar que este produto está sendo
vendido por um preço entre 91 e 110 reais;
9
Retira-se uma amostra aleatória de tamanho n, dessa população. Considere a v.a. Sn :
Sn
número de indivíduos com a característica na amostra. Seja, p̂ = . Então, utilizando o
n
Sn
Teorema Central do Limite para a variável p̂ = , temos que:
n
µ ¶
p(1 − p)
p̂ ≈ N p, .
n
Exemplo 15: Suponha que uma pequena amostra piloto de tamanho 10, extraída de
uma população, forneceu os valores X̄ = 15 e S 2 = 16. Fixando-se ² = 0, 5 e γ = 0, 95,
calcule o valor de n.
P (|p̂ − p| ≤ ²) = γ.
Daí,
−² ² ∼
P (|p̂ − p| ≤ ²) = P (−² ≤ p̂ − p ≤ ²) = P q ≤Z≤ q = γ,
p(1−p) p(1−p)
n n
p̂ − p
onde Z = q . Logo, podemos obter zγ/2 da N (0, 1), tal que P (−zγ/2 ≤ Z ≤
p(1−p)
n
zγ/2 ) = γ, de modo que
²
zγ/2 = q ,
p(1−p)
n
2 2
zγ/2 1/4 zγ/2
n '= = .
²2 4²2
1.4.1.1 Introdução
Neste capítulo iremos estudar as propriedades de um estimador e a estimação intervalar.
Não iremos abordar os métodos de estimação pontual, mas justificaremos porque X e p̂
são bons estimadores para a média e a proporção, respectivamente. Nosso objetivo será
construir intervalos de confiança para a média e para a proporção populacional a partir das
distribuições de X e p̂, respectivamente.
12
Definição 1.13 (Vício de um Estimador). O vício de um estimador é dado por
B(θ̂) = E(θ̂) − θ.
Definição 1.14 (Estimador não Viciado). Um estimador θ̂ é dito ser não viciado
para o parâmetro θ se B(θ̂) = 0. Ou seja, se E(θ̂) = θ.
(n − 1) 2
Pode-se mostrar que este estimador é viciado para σ 2 e E(σ̂ 2 ) = σ . Portanto,
n
σ2
seu vício B(σ̂ 2 ) = − . Logo, através de um simples ajuste em σ̂ 2 podemos obter um
n
estimador não viciado para σ 2 . Este estimador é
n
2 n 1 X
S = σ̂ 2 = (Xi − X)2 .
n−1 n − 1 i=1
13
Observação: Se o estimador θ̂ é não viciado para θ e deseja-se verificar sua con-
sistência, basta observar a segunda condição da definição acima. Ou seja, um estimador θ̂
não viciado é consistente para θ se limn→∞ V ar(θ̂) = 0.
Até aqui discutimos apenas sobre estimadores pontuais, àqueles que fornecem como esti-
mativa um único valor numérico para o parâmetro de interesse. Para amostras diferentes
de uma mesma população podemos encontrar valores diferentes para a estimativa de um
parâmetro levando-se em consideração o mesmo estimador, isto porque o estimador é uma
variável aleatória. Assim, em muitas situações gostaríamos de construir uma estimativa
mais informativa para o parâmetro de interesse que inclua uma medida de precisão do valor
obtido. Esse método de estimação, denominado intervalo de confiança, incorpora à
estimativa pontual do parâmetro informações a respeito de sua variabilidade. Intervalos de
confiança são obtidos através da distribuição amostral de seus estimadores.
14
1.4.2.1 Intervalo de Confiança para a Média de uma População com Variância
Conhecida
Considere uma amostra aleatória X1 , X2 , ..., Xn de uma população X, que tem média
µ desconhecida e variância σ 2 conhecida. Daqui por diante faremos as seguintes considera-
ções: 0 < γ < 1 e zγ/2 é um número tal que P (0 < Z < zγ/2 ) = γ/2 onde Z ∼ N (0, 1).
Pelo Teorema Central do Limite, a média amostral X ≈ N (µ, σ 2 /n). Assim, temos
que
X −µ
Z= √ ≈ N (0, 1).
σ/ n
ou seja, µ ¶
X −µ
P −zγ/2 < √ < zγ/2 = γ,
σ/ n
e assim, µ ¶
σ σ
P −zγ/2 √ < X − µ < zγ/2 √ = γ,
n n
de onde obtemos µ ¶
σ σ
P X − zγ/2 √ < µ < X + zγ/2 √ = γ.
n n
Portanto, o intervalo de confiança para µ, com coeficiente de confiança γ, é dado por
µ ¶
σ σ
IC(µ, γ) = X − zγ/2 √ ; X + zγ/2 √ ,
n n
Observe que a expressão IC(µ, γ) envolve a quantidade X que é uma variável aleatória
e, portanto, o intervalo obtido também é aleatório. Desta forma, podemos interpretar o
intervalo acima da seguinte maneira: se obtivermos várias amostras de mesmo tamanho
e para cada uma calcularmos os correspondentes intervalos de confiança com coeficiente
de confiança γ, esperamos que a proporção de intervalos que contenham o valor de µ seja
igual a γ.
Exemplo 19: Suponha que os comprimentos de jacarés adultos de uma certa raça
siga o modelo normal com média µ desconhecida e variância igual a 0,01 m2 . Uma amostra
de dez animais foi sorteada e forneceu média 1,69 m. Encontre um intervalo com 95% de
confiança para o parâmetro desconhecido µ.
15
Observação: A amplitude do intervalo de confiança é dada pela diferença entre o
σ
extremo superior e o extremo inferior, isto é, 2zγ/2 √ . O erro envolvido na estimação é
n
σ
dado pela semi-amplitude, ou seja, zγ/2 √ .
n
Exemplo 20: A vida média de baterias automotivas de uma certa marca está sendo
estudada. Baseado em estudos similares, com outras marcas, é possível admitir que a vida
útil dessas baterias segue uma distribuição normal com desvio padrão de 4,5 meses. De
qual tamanho deverá ser a amostra, para que a amplitude do intervalo de 90% de confiança
para a vida média seja de 3 meses?
Outra solução possível, é baseada no fato que a expressão p(1 − p) tem valor máximo
igual a 1/4, quando 0 ≤ p ≤ 1. Nesse caso, podemos obter um intervalo de confiança
substituindo p(1 − p) por 1/4:
à r r !
1 1
IC2 (p, γ) = p̂ − zγ/2 ; p̂ + zγ/2 .
4n 4n
16
Observação: Ao aceitarmos IC1 , estamos levando em consideração que a variância de
p̂(1 − p̂)
p é bem aproximada por . Se preferirmos IC2 , estaremos substituindo a variância
n
por um valor seguramente maior do que o real. Assim, estamos nos assegurando que o
coeficiente de confiança será de, no mínimo, γ. Ao utilizarmos IC2 , estamos aceitando uma
menor precisão para p̂, o que se reflete numa maior amplitude do intervalo de confiança,
quando comparado ao intervalo IC1 .
Exemplo 21: Numa pesquisa de mercado, 400 pessoas foram entrevistadas sobre
determinado produto, e 60% delas preferiram a marca A. Construa um intervalo de confiança
para p com coeficiente de confiança γ = 0, 95.
Exemplo 22: Em uma linha de produção de certa peça mecânica, colheu-se uma
amostra de 100 itens, constatando-se que 4 peças eram defeituosas. Construir um IC para
a proporção de itens defeituosos na população com confiança de 90%.
17
1.4.2.3 Intervalo de Confiança para a Média de uma População com Variância
Desconhecida
Até aqui consideramos a média de uma população desconhecida e a variância conhecida.
Esta situação não é muito realista, pois se não conhecemos a média, como podemos co-
nhecer a variância de uma população? Desta forma, uma situação mais próxima da realidade
seria o caso em que, tanto a média como a variância, são desconhecidas. Iremos considerar
a siuação em que X ∼ N (µ, σ 2 ) com µ e σ desconhecidos.
Para isso, iremos utilizar a distribuição t de Student, que é definida como:
Definição 1.17. Uma v.a. T é dita ter distribuição t de Student com n graus de
liberdade, se sua f.d.p. é da forma
µ ¶−(n+1)/2
Γ[(n + 1)/2] t2
fn (t) = √ 1+ , −∞ < t < ∞,
Γ(n/2) nπ n
R∞
onde Γ (p) = 0
xp−1 e−x dx, p > 0, é conhecida como a função gama.
Observações:
(ii) Essa distribuição leva este nome em homenagem ao estatístico inglês W.S. Gosset,
que publicou sua pesquisa sob o pseudônimo de “Student”;
18
onde γ = 1 − α, e tα é um número tal que P (−tα ≤ T(n−1) ≤ tα ) = γ.
Logo, o intervalo de confiança para µ com nível de confiança 1 − α, é dado por
µ ¶
S S
X − tα √ ; X + tα √ .
n n
Exemplo 23: Numa grande empresa uma amostra aleatória de 20 empregados forneceu
a idade média igual a 32,8 anos e desvio padrão 5,3 anos. Estimar a idade média de todos
os empregados da empresa com uma confiança de 99%.
19
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus de Campina Grande
UNIDADE ACADÊMICA DE ESTATÍSTICA - UAEst
Disciplina: Introdução à Estatística Período 2015.1
Professores: Amanda Gomes e Manoel Santos-Neto
1a LISTA DE EXERCÍCIOS
20
6 - Seja X ∼ N (900, 642). retiramos uma amostra de tamanho 30. Determinar:
a) P (X ≤ 894). Resp.: 0,0968
b) P (896 ≤ X ≤ 903). Resp.: 0,54726
7 - Qual deverá ser o tamanho de uma amostra retirada de uma população X ∼ N (200, 350)
para que P (|X − 200| < 5) = 0, 95? Resp.: 54
12 - Seja X uma população normal com média µ e variância σ 2 , de que são extraídas
todas as amostras possíveis de tamanho 2. Dos estimadores abaixo:
b1 = 12 X1 + 12 X2
µ
b2 = 14 X1 + 34 X2 .
µ
a) Qual ou quais dos estimadores acima são não-viesados para µ. Resp.: Os dois
b) Qual dos dois estimadores acima é o melhor? Justifique. Resp.: µ
b1
21
14 - De uma população normal com variância igual a 16, levantou-se uma amostra,
obtendo-se as observações: 10, 5, 10, 15. Determinar, com confiança de 87%,
um IC para a média da população.
Resp.: (6,98; 13,02)
15 - A experiência com trabalhadores de uma certa indústria indica que o tempo necessário
para que um trabalhador, aleatoriamente selecionado, realize uma tarefa é distribuído
de maneira aproximadamente normal, com desvio padrão de 12 minutos. Uma
amostra de 25 trabalhadores forneceu x̄ = 140 min. Determinar os limites de con-
fiança de 95% para a média µ da população de todos os trabalhadores que fazem
aquele determinado serviço. Qual o erro cometido ao estimarmos este intervalo de
confiança?
Resp.: (135,3; 144,7)
16 - Em uma pesquisa de opinião, entre 600 pessoas pesquisadas, 240 responderam “sim”
a determinada pergunta. Estimar a porcentagem de pessoas com essa mesma opinião
na população, dando um intervalo de 95% de confiabilidade.
Resp.: (36,08%; 43,92%)
250, 265, 267, 269, 271, 275, 277, 281, 283, 284,
287, 289, 291, 293, 293, 298, 301, 303, 306, 307,
307, 309, 311, 315, 319, 322, 324, 328, 335, 339.
22
20 - Construa um IC para a média com confiança de 95% considerando a distribuição
amostral abaixo:
Classes ni
0–5 2
5 – 10 3
10 – 15 5
15 – 20 2
23
Relação de Exercícios do Livro texto para o 1 ◦ Estágio
Capítulo 11 (Estimação)
Problema Página
15, 16, 17 e 18 308
20 e 21 309
23 e 24 317
27, 28, 29 e 30 318
44 e 45 322
24
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus de Campina Grande
UNIDADE ACADÊMICA DE ESTATÍSTICA
Disciplina: Introdução à Estatística Período 2015.1
Professores: Amanda Gomes e Manoel Santos-Neto
Aluno(a): .
2 Teste de Hipóteses
2.1 Introdução
Até o presente momento consideramos o problema de estimarmos um parâmetro desco-
nhecido da população tanto pontualmente como através de um intervalo de confiança.
Apresentaremos agora, outra maneira de tratar o problema de fazer uma afirmação sobre
um parâmetro desconhecido. Em vez de procurarmos uma estimativa do parâmetro, fre-
quentemente nos parecerá conveniente admitir um valor hipotético para ele e, depois, utilizar
a informação da amostra para confirmar ou rejeitar esse valor hipotético.
A construção de um teste de hipóteses, para um parâmetro populacional, pode ser
colocada do seguinte modo: existe uma variável X associada a dada população e tem-se
uma hipótese sobre determinado parâmetro θ dessa população. Por exemplo, afirmamos
que o verdadeiro valor de θ é θ0 . Colhe-se uma amostra aleatória de elementos dessa
população, e com ela deseja-se comprovar ou não tal hipótese.
Iniciamos a análise explicitando claramente qual a hipótese que está sendo colocada à
prova e a chamamos de hipótese nula, e escrevemos
H0 : θ = θ0 .
Convém explicitar a hipótese que será considerada aceitável, caso H0 seja rejeitada.
A essa hipótese chamamos de hipótese alternativa. Formularemos, então, duas hipóteses
básicas:
H0 : hipótese nula
H1 : hipótese alternativa
25
1. Teste bilteral
½
H0 : θ = θ0
H1 : θ 6= θ0
Qualquer que seja a decisão tomada, estamos sujeitos a cometer erros. Neste caso, os
possíveis erros serão
Erro de tipo I: rejeitar a hipótese nula quando essa é verdadeira. Chamamos de α a
probabilidade de cometer esse erro, isto é,
Erro de tipo II: não rejeitar a hipótese nula quando essa é falsa. A probabilidade de
cometer esse erro é denotada por β, logo
26
Exemplo 2: Identifique as hipóteses que estão sendo testadas em cada caso:
a) A força de rompimento de uma fibra têxtil é uma variável aleatória distribuída
normalmente. As especificações exigem que a força média de rompimento seja igual a 150
psi. O fabricante gostaria de detectar qualquer afastamento significante desse valor.
P (θ̂ ∈ RC | H0 verdadeira) = α,
27
2.2.4 Procedimento Geral para a Construção de um Teste de Hipóteses
(iii) Fixado o nível de significância do teste (α) e supondo H0 verdadeira, podemos cons-
truir a região crítica do teste como:
½ µ ¶ ¾
σ σ
a) RC = x̄; P X ≤ µ0 − z 1−α √ ou X ≥ µ0 + z 1−α √ =α
2 n 2 n
¸ ¸ · ·
σ σ
= −∞; µ0 − z 1−α √ ∪ µ0 + z 1−α √ ; ∞ .
2 n 2 n
28
A região crítica também pode ser escrita em termos de valores padronizados, ou seja
n ³ ´ o i i h h
RCp = z; P |Z| ≥ z 1−α = α = −∞; −z 1−α ∪ z 1−α ; ∞ .
2 2 2
½ µ ¶ ¾ · ·
σ σ
b) RC = x̄; P X ≥ µ0 + z 1−2α √ = α = µ0 + z 1−2α √ ; ∞ . Ou então,
2 n 2 n
n ³ ´ o h h
RCp = z; P Z > z 1−2α = α) = z 1−2α ; ∞ .
2 2
½ µ ¶ ¾ ¸ ¸
σ σ
c) RC = x̄; P X ≤ µ0 − z 1−2α √ = α = −∞; µ0 − z 1−2α √ . Ou en-
2 n 2 n
tão, n ³ ´ o i i
RCp = z; P Z ≤ −z 1−2α = α) = −∞; −z 1−2α .
2 2
(iv) Estatística
Pn de teste: dada uma amostra de tamanho n, a estatística de teste será
i=1 xi
x0 = , ou então, considerando o intervalo com valores padronizados, a
n
estatística de teste será:
x 0 − µ0
z0 = √ .
σ/ n
Exemplo 3: Seja X uma população normal com variância 36. Dessa população,
toma-se uma½ amostra de tamanho 16, obtendo-se x̄ = 43. Ao nível de 10%, testar as
H0 : µ = 45
hipóteses:
H1 : µ 6= 45
29
2.4 Teste de Hipótese para a Proporção
Consideraremos uma população X onde X = 1 com probabilidade p e X = 0 com pro-
babilidade 1 − p. Assim, a estatística de teste será a proporção amostral p̂. Pelo T.C.L.
sabemos que µ ¶
p(1 − p)
p̂ ≈ N p, .
n
30
2.5 Teste de Hipótese sobre a Média de uma População com
Variância Desconhecida
Consideraremos agora, o caso em que queremos testar hipóteses sobre a média de uma
população com distribuição normal, porém, com variância desconhecida. Para isso, teremos
que estimar a variância através da estatística S 2 . Além disso, utilizaremos o fato de que
(X − µ)
√ ∼ t(n−1) .
S/ n
(X − µ)
Assim, a estatística do teste será T = √ .
S/ n
Assim, podemos aplicar o teste de hipóteses seguindo os seguintes passos:
31
2.6 Teste de Hipótese sobre a Igualdade Médias de Duas Popu-
lações Normais Independentes com Variâncias Conhecidas
Sejam X e Y duas populações independentes uma da outra e normalmente distribuidas,
2
X ∼ N (µX , σX ) e Y ∼ N (µY , σY2 ),
2
onde µX e µY são desconhecidos e σX e σY2 são conhecidos.
Sejam X1 , X2 , ..., XnX e Y1 , Y2 , ..., YnY amostras de X e de Y , respectivamente.
Desejamos testar hipóteses sobre a igualdade das médias:
H1 : µX 6= µY ou
H0 : µX = µY versus H1 : µX > µY ou
H 1 : µX < µ Y ,
ou equivalentemente
H 1 : µX − µY =
6 0 ou
H 0 : µX − µY = 0 versus H1 : µX − µY > 0 ou
H1 : µX − µY < 0.
(X − Y ) − (µX − µY ) X −Y
Z= q 2 2
= q 2 2
∼ N (0, 1)
σX σY σX σY
nX
+ nY nX
+ nY
32
(iii) Fixado o nível de significância do teste (α) e supondo H0 verdadeira, podemos cons-
truir a região crítica do teste como:
½ µ q 2 q 2 ¶ ¾
σX 2
σY σX 2
σY
a) RC = x − y; P X − Y ≤ −z 1−α nX + nY ou X − Y ≥ z 1−α nX + nY = α =
2 2
¸ q 2 ¸ · q ·
σ σ2 σ2 σ2
−∞; −z 1−α nXX + nYY ∪ z 1−α nXX + nYY ; ∞ .
2 2
A região crítica também pode ser escrita em termos de valores padronizados, ou seja
n ³ ´ o i i h h
RCp = z; P |Z| ≥ z 1−α = α = −∞; −z 1−α ∪ z 1−α ; ∞ .
2 2 2
½ µ q 2 ¶ ¾ · q 2 ·
σ 2
σY σ 2
σY
b) RC = x̄ − ȳ; P X − Y ≥ z 1−2α nXX + nY
=α = z 1−2α nXX + nY
;∞ .
2 2
Ou então, n ³ ´ o h h
RCp = z; P Z > z 1−2α = α) = z 1−2α ; ∞ .
2 2
½ µ q 2 ¶ ¾ ¸ q ¸
σ 2
σY 2
σX 2
σY
c) RC = x̄ − ȳ; P X − Y ≤ −z 1−2α nXX + nY
=α = −∞; −z 1−2α nX
+ nY
.
2 2
Ou então,
n ³ ´ o i i
RCp = z; P Z ≤ −z 1−2α = α) = −∞; −z 1−2α .
2 2
P X P Y
(iv) A estatística de teste será x̄0 − ȳ0 = n1X ni=1 xi − n1Y ni=1 yi , ou então, considerando
o intervalo com valores padronizados, a estatística de teste será:
x0 − y 0
z0 = q 2 2
.
σX σY
nX
+ nY
33
2.7 Teste de Hipótese sobre a Igualdade Médias de Duas Po-
pulações Normais Emparelhadas
Definição 2.1 (Populações Emparelhadas). Dizemos que duas populações são
dependentes (ou emparelhadas) se existir alguma relação de modo que cada valor em
uma população estiver emparelhado com um valor correspondente na outra população.
34
(X − Y ) − (µX − µY ) D − µD
T = q = Sd
∼ t(n−1) ,
2 Sd √
n
n
D
T = SD
,
√
n
q r hP i
1
Pn 1 n 1
Pn 2
SD = n−1 i=1 (Di − D)2 ou SD = n−1 i=1 Di2 − n
( i=1 Di ) ,
1
Pn
eD= n i=1 Di .
(iii) Fixado o nível de significância do teste (α) e supondo H0 verdadeira, podemos cons-
truir a região crítica do teste como:
n ³ ´ o i i h h
SD SD SD SD
a) RC = d; P D ≤ −tα √ n
ou D ≥ t √
α n = α = −∞, −t √
α n ∪ t √
α n , ∞ .
A região crítica também pode ser escrita em termos de valores padronizados, ou seja
P
(iv) A estatística de teste será d0 = n1 ni=1 di , ou então, considerando o intervalo com
valores padronizados, a estatística de teste será:
d0
t0 = Sd
.
√
n
35
Exemplo 9: Quinze homens adultos, com idades entre 35 e 50 anos, participaram
de um estudo para avaliar o efeito da dieta e de exercícios no nível de colesterol no
sangue. O colesterol total foi medido em cada indivíduo inicialmente e depois de três
meses de participação em um programa de exercícios aeróbicos e mudanças para uma
dieta de baixo teor de gordura. Os dados são apresentados na tabela a seguir.
36
2a LISTA DE EXERCÍCIOS
2 - Um exame padrão de inteligência tem sido usado por vários anos com média de 80
pontos e desvio padrão de 7 pontos. Um grupo de 25 estudantes é ensinado, dando-se
ênfase à resolução de testes. Se esse grupo obtem média de 83 pontos no exame, há
razões para se acreditar que a ênfase dada melhorou o resultado do teste ao nível de
10%?
3 - A força de rompimento de uma fibra têxtil é uma variável aleatória distribuída normal-
mente. As especificações exigem que a força média de rompimento seja igual a 150
psi. O fabricante gostaria de detectar qualquer afastamento significante desse valor.
Uma amostra de 15 espécimes de fibra forneceu força média de rompimento 152, 18
psi e variância 16, 63 psi2 . O que se pode concluir, ao nível de 5% de significância?
5 - Estamos desconfiados de que a média das receitas municipais per capita das cidades
pequenas (0-20.000 habitantes) é maior do que a das receitas do estado, que é de 1229
unidades. Para comprovar ou não essa hipótese, sorteamos dez cidades pequenas,
e obtivemos os seguintes resultados: 1230; 582; 576; 2093; 2621; 1045; 1439; 717;
1838; 1359.
obs: Para facilitar os cálculos, informamos que a soma das observações é 13500, e a
soma dos quadrados das observações é 22335650.
a) Mostre que o teste de hipótese usado, com α = 0, 05, levará à aceitação de que
a receita média das cidades pequenas é igual à do estado.
b) Você não acha estranha essa conclusão quando observa que a média da amostra
obtida é bem maior do que a média do estado? Como você explicaria isso?
6 - Uma companhia de cigarros anuncia que o índice médio de nicotina dos cigarros que
fabrica apresenta-se abaixo de 23 mg por cigarro. Um laboratório realiza seis análises
desse índice, obtendo: 27, 24, 21, 25, 26, 22. Sabe-se que o índice de nicotina se
distribui normalmente, com variância igual a 4,86 mg 2 . Pode-se aceitar, ao nível de
10%, a afirmação do fabricante?
7 - Um certo tipo de rato apresenta, nos três primeiros meses de vida, um ganho médio
de peso de 58g. Uma amostra de 10 ratos foi alimentada desde o nascimento até a
37
idade de 3 meses com uma ração especial, e o ganho de peso de cada rato foi: 55,
58, 60, 62, 65, 67, 54, 64, 62 e 68. Há razões para crer, ao nível de 5%, que a ração
especial aumenta o peso nos três primeiros meses de vida?
10 - Lança-se uma moeda 100 vezes e observa-se 40 caras. Baseado nesse resultado,
podemos afirmar, ao nível de 5%, que a moeda não é honesta?
11 - Um fabricante de droga medicinal afirma que ela é 90% eficaz na cura de uma alergia,
em um determinado período. Em uma amostra de 200 pacientes, a droga curou 150
pessoas. Testar ao nível de 1% se a pretensão do fabricante é legítima.
12 - Uma estação de televisão afirma que 60% dos televisores estavam ligados no seu
programa especial da última segunda-feira. Uma rede competidora deseja contestar
essa afirmação e decide usar uma amostra de 200 famílias para um teste. Qual
deve ser o procedimento adotado para avaliar a veracidade da afirmação da estação,
adimitindo-se que, das 200 famílias pesquisadas, 110 estavam assistindo ao programa?
Utilize um nível de 5%.
14 - Duas máquinas são usadas para encher garrafas de plástico com detergente para
lavagem de pratos. Os desvios padrão do volume de enchimento são conhecidos
como sendo σX = 0, 1 onça fluida e σY = 0, 15 onça fluida para as duas máquinas,
respectivamente. Duas amostras aleatórias de nX = 12 garrafas da máquina 1 e
nY = 10 garrafas da máquina 2 são selecionadas. Os volumes médios de enchimento
38
nas amostras são x̄ = 30, 61 onças fluidas e ȳ = 30, 34 onças fluidas. Suponha
a normalidade dos dados, e teste a hipótese de que ambas as máquinas enchem o
mesmo volume médio. Use α = 0, 05.
Solução 1 9,9 9,4 9,3 9,6 10,2 10,6 10,3 10,0 10,3 10,1
Solução 2 10,2 10,6 10,7 10,4 10,5 10,0 10,2 10,7 10,4 10,3
Os dados justificam a afirmação de que a taxa média de ataque seja a mesma para
ambas as soluções? Considere que ambas as populações tenham variâncias iguais a
0, 1(10−3 polegadas/min)2 e use α = 0, 05.
39
Peso
Indivíduo Antes Depois
1 195 187
2 213 195
3 247 221
4 201 190
5 187 175
6 210 197
7 215 199
8 246 221
9 294 278
10 310 285
20 - Dois diferentes testes analíticos podem ser usados para determinar o nível de impureza
em ligas de aço. Oito espécimes são testados usando ambos os procedimentos, sendo
os resultados mostrados na tabela a seguir. Há evidência suficiente para concluir que
ambos os testes fornecem o mesmo nível médio de impureza? Use α = 0, 01.
Gabarito
1) RC = [1823, 19; +∞) 11) RC = [0; 0, 8506]
2) RC = [81, 792; +∞) 12) RC = [0; 0, 5432]
3) RC = (−∞; 147, 74] ∪ [152, 26; +∞) 13) RC = (−∞; −1, 8594] ∪ [1, 8594; +∞)
4) RC = [5, 54; +∞) 14) RC = (−∞; −0, 1088] ∪ [0, 1088; +∞)
5) a) RC = [1620, 74; +∞) 15) RC = (−∞; −0, 4243] ∪ [0, 4243; +∞)
6) RC = [24, 152; +∞) 16) RC = (−∞; −2, 3199]
7) RC = [60, 76; +∞) 17) RC = (−∞; −0, 277] ∪ [0, 277; +∞)
8) RC = (−∞; 6, 25] ∪ [7, 75; +∞) 18) RC = (−∞; −14, 501]
9) RC = (−∞; 98, 0015] ∪ [101, 9985; +∞) 19) RC = [3, 7166; +∞)
10) RC = [0; 0, 402] ∪ [0, 598; 1] 20) RC = (−∞; −0, 2136] ∪ [0, 2136; +∞)
40
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus de Campina Grande
UNIDADE ACADÊMICA DE ESTATÍSTICA
Disciplina: Introdução à Estatística Período 2015.1
Professores: Amanda Gomes e Manoel Santos-Neto
41