Você está na página 1de 41

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus de Campina Grande

UNIDADE ACADMICA DE ESTATSTICA


Disciplina: Introduo Estatstica
Perodo 2015.1
Professores: Amanda Gomes e Manoel Santos-Neto
Aluno(a):

NOTAS DE AULA PARA O 1o ESTGIO

1
1.1

Introduo Inferncia Estatstica


Introduo

A Estatstica uma cincia que tem como objetivo a tomada de deciso em situaes
de incerteza. Esta cincia divide-se basicamente em duas partes. A primeira parte
conhecida como Estatstica Descritiva, e trata da coleta, organizao e descrio de
dados. A segunda a Estatstica Inferencial, e se preocupa em fazer afirmaes e/ou
testar hipteses sobre caractersticas numricas em situaes de incerteza.
Para iniciar o estudo da Estatstica Inferencial necessrio compreender os seguintes
conceitos bsicos:
Definio 1.1 (Populao). A populao um conjunto formado por todos os elementos que possuem pelo menos uma caracterstica em comum observvel.
Exemplo 1: Se o problema a ser pesquisado est relacionado com a qualidade de
um certo produto produzido numa indstria, a populao pode ser composta por todas as
peas produzidas numa determinada hora, turno, dia ou ms, dependendo dos objetivos;
Exemplo 2: Se o objetivo de um estudo pesquisar o nvel de renda familiar de uma
certa cidade, a populao seria todas as famlias desta cidade. Mas, se o objetivo fosse
pesquisar apenas a renda mensal do chefe da famlia, a populao a ser pesquisada seria
composta por todos os chefes de famlia desta cidade.
Definio 1.2 (Amostra). A Amostra apenas uma parte da populao, ou seja,
qualquer subconjunto no vazio da populao.
Vrios motivos levam a necessidade de se observar apenas uma parte da populao,
como, por exemplo: a falta de tempo, recursos financeiros e/ou humanos. A amostra deve
ser obtida atravs de tcnicas de amostragem, as quais tem como objetivo principal garantir
a representatividade da populao, ou seja, fazer com que a amostra seja um retrato fiel
da populao.
Exemplos de amostra podem ser considerados por conjuntos formados por apenas uma
parte dos elementos populacionais descritos nos exemplos 1 e 2.
1

Dois novos conceitos estreitamente relacionados com os de populao e amostra so


os de Parmetro e Estatstica, tendo em vista que:
Definio 1.3 (Parmetro). uma medida numrica que descreve uma caracterstica da populao, ou ainda, que obtida a partir de todos os dados populacionais
(atravs de um censo).
Exemplo 3: Identificando a populao pela varivel aleatria X, seriam parmetros
a Mdia de X () e a sua Varincia ( 2 ).
Definio 1.4 (Estatstica). uma medida que descreve uma caracterstica numrica
da amostra, ou ainda, que obtida a partir de dados amostrais, e que ser usada para
extrair informaes sobre a populao.
Exemplo 4: mdia amostral (X), varincia amostral (S 2 ), etc.
Os parmetros no apresentam incerteza sobre seu real valor. Por outro lado, as
estatsticas podem apresentar diferentes valores, se obtidas a partir de diversas amostras.
Definio 1.5 (Inferncia Estatstica). o ato de generalizar resultados da parte
(amostra) para o todo (populao).
Basicamente a inferncia estatstica trabalha com a estimao de parmetros e com
testes de hipteses sobre a populao baseados na amostra.
Definio 1.6 (Estimador). Um estimador uma estatstica empregada para estimar
ou inferir o valor de um parmetro desconhecido.
Um exemplo de estimador a mdia amostral X.
Notao: b
Definio 1.7 (Estimativa). o valor assumido pelo estimador em uma particular
amostra.

1.2

Amostragem

Definio 1.8 (Amostragem). a obteno da amostra.


Para isto, existem vrias tcnicas de amostragem que podem ser utilizadas, as principais
so:
2

(i) Amostragem Aleatria Simples


Este tipo de amostragem consiste em selecionar a amostra atravs de um sorteio,
sem restrio. A amostragem aleatria simples tem a seguinte propriedade: qualquer subconjunto da populao, com o mesmo nmero de elementos, tem a mesma
probabilidade de fazer parte da amostra.
Exemplo 5: Com o objetivo de estudar algumas caractersticas dos alunos de uma
certa disciplina, vamos extrair uma amostra aleatria simples de tamanho cinco. A
listagem dos alunos da disciplina apresentada a seguir.
Populao: alunos da disciplina
Analigia
Camila
Daniela
Fabiana
Jordanye
Luiz Gustavo
Maria do Socorro
Oscar
Renato
Soter

Anderson
Carlos Cesar
Danilo
Fabiano
Jose Orlando
Maecio
Marina
Osnes
Roberta
Stella

Anna Carolina
Carlos Raiff
Davi
Felipe
Kllydevan
Magna
Matheus
Patricia
Rodrigo Azevedo
Taise

Arthur
Chrystiano
Diego
Herusca
Lindembergue
Maira
Nailton
Raquel
Rodrigo de Brito
Thiago

Bruna
Cicero
Ewerton
Isabele
Luanna
Marcia
Nilman
Reinaldo
Ronaldo
Ygor

Um procedimento simples seria enumerar todos os elementos da populao e atravs


de sorteio retirar uma amostra de tamanho 5 desta populao. Existem vrios mecanismos de sorteio, o importante que haja aleatoriedade no processo. (Usar tabela
de nmeros aleatrios, considerando valores da quinta coluna, de baixo para cima.)
(ii) Amostragem Sistemtica
Em muitas situaes podemos realizar uma amostragem atravs de uma maneira
sistemtica. Um procedimento simples para determinar a forma como a amostra ser
retirada o seguinte: suponha que de uma populao de tamanho N , queremos
retirar uma amostra de tamanho n. Assim, podemos retirar, sistematicamente, um
elemento a cada Nn elementos da populao, considerando a populao numerada de
1 N . Para garantir que cada elemento da populao tenha a mesma probabilidade
de pertencer amostra, deve-se sortear o primeiro elemento dentre os Nn elementos.
Observao: Quando o resultado de Nn no for um nmero inteiro, recomenda-se
arredondar o resultado para o menor inteiro mais prximo.
Exemplo 6: No exemplo anterior, utilize uma amostragem sistemtica para obter
uma amostra de tamanho n = 5. Use a tabela de nmeros aleatrios, considerando
a stima linha, da esquerda para a direita.

Observao: Se o interesse fosse selecionar uma amostra de tamanho n = 6, e


se considerssemos a primeira linha tabela de nmeros aleatrios, da direita para a
esquerda, teramos:
3

(iii) Amostragem Estratificada


A tcnica da amostragem estratificada consiste em dividir a populao em subgrupos,
que denominaremos estratos. Os estratos possuem as seguintes caractersticas: so
internamente homogneos e externamente heterogneos. Podemos ter dois tipos de
amostragem estratificada, a proporcional e a uniforme.
(a) Amostragem Estratificada proporcional: neste caso particular de amostragem
estratificada, a proporcionalidade do tamanho de cada estrato da populao
mantida na amostra com o objetivo de torn-la bem significativa, ou seja com
as mesmas caractersticas da populao.
Exemplo 7: Com o objetivo de levantar o estilo de liderana preferido pela
comunidade de uma escola, vamos realizar um levantamento por amostragem. A
populao composta por 10 servidores tcnico-administrativos, 10 professores
e 30 alunos, que identificaremos da seguinte maneira:
Populao
Servidores: S1
Professores: P1
Alunos:
A1
A11
A21

S2
S3
S4
P2
P3
P4
A2 A3 A4
A12 A13 A14
A22 A23 A24

S5
S6
S7
P5
P6
P7
A5 A6 A7
A15 A16 A17
A25 A26 A27

S8
S9
S10
P8
P9
P10
A8 A9 A10
A18 A19 A20
A28 A29 A30

Supondo que a preferncia quanto ao estilo de liderana possa ser relativamente


homognea dentro de cada categoria, vamos realizar uma amostragem estratificada, proporcional por categoria, para obter uma amostra global de tamanho
10, utilizando para isto a tabela de nmeros aleatrios. Para o estrato SERVIDORES, comece do incio da segunda linha; para o estrato PROFESSORES,
comece no incio da quinta coluna; e para o estrato ALUNOS, comece no incio
da ltima coluna. (Percorra a tabela da esquerda para a direita e de cima para
baixo).

(b) Amostragem Estratificada Uniforme: seleciona-se a mesma quantidade de elementos em cada estrato.
A amostragem estratificada uniforme costuma ser usada em situaes em que
o maior interesse obter estimativas separadas para cada estrato, ou ainda,
quando se deseja comparar os diversos estratos. No exemplo anterior, para selecionar uma amostra estratificada uniforme de tamanho 12, devemos selecionar
4 indivduos de cada estrato. (Utilize a tabela de nmeros aleatrios, seguindo
as mesmas orientaes do item (a) para cada estrato.)

1.2.1

Tamanho de uma Amostra Aleatria Simples

Definio 1.9 (Erro Amostral). a diferena entre o valor que a estatstica pode
acusar e o verdadeiro valor do parmetro que se deseja estimar.
Para determinar o tamanho da amostra, o pesquisador precisa especificar o erro amostral
tolervel, ou seja, o quanto ele admite errar na avaliao dos parmetros de interesse.
A especificao do erro amostral tolervel deve ser feita sob um enfoque probabilstico,
pois, por maior que seja a amostra, existe sempre o risco de o sorteio gerar uma amostra
com caractersticas bem diferentes da populao de onde ela est sendo extrada.
Uma frmula para o clculo do tamanho mnimo da amostra
Sejam:
N tamanho da populao;
n tamanho da amostra;
n0 uma primeira aproximao para o tamanho da amostra;
E0 erro amostral tolervel.
Um primeiro clculo do tamanho da amostra pode ser feito, mesmo sem conhecer o
tamanho da populao, atravs da seguinte expresso:
n0 =

1
, onde 0 < E0 < 1.
E02

Conhecendo o tamanho N da populao, podemos corrigir o clculo anterior, por


n=

N n0
.
N + n0

Exemplo 8: Planeja-se um levantamento por amostragem para avaliar diversas caractersticas da populao das N = 200 famlias moradoras de um certo bairro. Estas
caractersticas (parmetros) so especialmente do tipo percentagens, tais como, a percentagem de famlias que usam programas de alimentao popular, a percentagem de
famlias que moram em casas prprias, etc. Qual deve ser o tamanho mnimo de uma
amostra aleatria simples, tal que possamos admitir, com alta confiana, que os erros
amostrais no ultrapassem 4% (E0 = 0, 04)?

Exemplo 9: Considerando os objetivos e os valores fixados no exemplo anterior, qual


deveria ser o tamanho da amostra se a pesquisa fosse estendida para toda a cidade, que
contm 200.000 famlias residentes?

Definio 1.10 (Amostra Aleatria Simples - AAS). Variveis aleatrias X1 , X2 , ..., Xn


constituem uma amostra aleatria simples de tamanho n, ou simplesmente amostra
aleatria (a.a.) de uma varivel aleatria (v.a) X, quando satisfazem as seguintes
condies:
1) As variveis aleatrias X1 , X2 , ..., Xn so independentes, e
2) Cada uma das variveis aleatrias Xi , i = 1, 2, ..., n tm a mesma distribuio
de probabilidade da varivel X.
Exemplo 10: Considere uma populao formada pelos seguintes elementos {1, 3, 5, 5, 7}.
Considere a varivel X: valor assumido pelo elemento na populao. Assim, a distribuio
de probabilidade de X dada por:
X=x
P (X = x)

Observaes:
1) E(X) =
2) V ar(X) =
Considere todas as amostras possveis de tamanho 2, com reposio, da populao
cuja distribuio dada acima. Alm disso considere X1 o nmero selecionado na primeira
extrao e X2 o nmero selecionado na segunda extrao. Assim, podemos construir a
distribuio de probabilidades conjunta de (X1 , X2 ) e as distribuies marginais de X1 e
X2 . Observe que X1 e X2 so independentes e tm distribuies iguais distribuio de
X.

1.3

Distribuies Amostrais

Definio 1.11. Dada uma amostra aleatria X1 , X2 , ..., Xn de uma populao X,


definiremos uma estatstica T como qualquer funo de X1 , X2 , ..., Xn , ou seja T =
f (X1 , X2 , ..., Xn ).
Assim, dada uma amostra aleatria X1 , X2 , ..., Xn , um exemplo de estatstica seria a
mdia amostral
1
X = (X1 + X2 + + Xn ).
n
Sendo X1 , X2 , ..., Xn uma amostra aleatria da varivel X, uma pergunta natural
seria o que acontece com a estatstica T quando retiramos todas as amostras de uma
populao conhecida segundo um plano amostral adotado, ou seja qual a distribuio de T
quando X1 , X2 , ..., Xn assume todos os valores possveis. Essa distribuio ser chamada
de distribuio amostral da estatstica T .
Exemplo 11: Considerando o Exemplo 10, podemos construir a distribuio de algumas estatsticas, como por exemplo a distribuio de X = n1 (X1 + X2 + + Xn ) e
P
S 2 = ni=1 (Xi X)2 /(n 1), por exemplo.
Assim, teramos
X = x
P (X = x)

Total

S 2 = s2
P (S 2 = s2 )

Total

Observaes:
7

1) Note que E(X) = E(X1 ) = E(X2 ) = E(X) = 4, 2, e que V ar(X) = V ar(X)/2 =


2, 08;
2) Podemos observar que E(S 2 ) = 4, 16 = 2 .
Seria tudo isso uma coincidncia? Resposta: No!!!! Veremos adiante a justificativa
destes fatos.
1.3.1

Distribuio Amostral da Mdia

Teorema 1.1. Seja X uma varivel aleatria com mdia e varincia 2 , e seja
(X1 , X2 , ..., Xn ) uma amostra aleatria de X. Ento, a mdia amostral (X) ter mdia
e varincia dadas respectivamente por
E(X) =
e
V ar(X) =

2
.
n

Um teorema bem mais forte do que este o que se refere distribuio de probabilidade
da varivel X. Este teorema conhecido como o Teorema Central do Limite e pode ser
enunciado da seguinte forma:
Teorema 1.2 (Teorema Central do Limite). Para amostras aleatrias (X1 , X2 , ..., Xn ),
retiradas de uma populao com mdia e varincia 2 finita, a distribuio amostral
da mdia X aproxima-se, para n suficientemente grande, de uma distribuio normal,
com mdia e varincia 2 /n.
X N (, 2 /n)
Desta forma, temos que:
Z=

X
N (0, 1)
/ n

.
Observaes:
1) No teorema acima no fizemos nenhuma suposio sobre a natureza das distribuies das variveis X1 , X2 , ..., Xn , ou seja, independentemente de como se comportam
essas variveis, sejam elas discretas ou contnuas, o teorema continua vlido.
2) Se as variveis X1 , X2 , ..., Xn tm distribuio normal, ento X ter tambm distribuio normal e no apenas uma aproximao.
Exemplo 12: Seja X o preo, em reais, de um determinado produto. Admitindo que
X segue distribuio Normal, com mdia 100 e desvio padro 10, calcule:

a) A probabilidade de, ao entrar em uma loja, observar que este produto est sendo
vendido por um preo entre 91 e 110 reais;

b) A probabilidade de, pesquisando em 16 lojas distintas, encontrar preo mdio entre


91 e 110 reais.

Exemplo 13: Em uma certa cidade, a durao de conversas telefnicas, em minutos,


originrias de telefones pblicos, segue um modelo exponencial com mdia 3.
a) Qual a probabilidade de uma chamada selecionada aleatoriamente no ultrapassar
quatro minutos?

b) Observando-se uma amostra aleatria de 50 dessas chamadas, qual ser a probabilidade delas, em mdia, no ultrapassar quatro minutos?

1.3.2

Distribuio Amostral da Proporo

Considere uma populao em que a proporo de elementos portadores de certa caracterstica p. Assim, definiremos a varivel aleatria X como: X = 1, se o indivduo for
portador da caracterstica, e X = 0, se o indivduo no possui a caracterstica. Dessa
forma, E(X) = p e V ar(X) = p(1 p).
9

Retira-se uma amostra aleatria de tamanho n, dessa populao. Considere a v.a. Sn :


Sn
nmero de indivduos com a caracterstica na amostra. Seja, p =
. Ento, utilizando o
n
Sn
Teorema Central do Limite para a varivel p =
, temos que:
n

p(1 p)
p N p,
.
n
Desta forma, temos que:
pb p
Z=q
N (0, 1)
p(1p)
n

.
Exemplo 14: Suponha que 30% dos estudantes de uma escola sejam mulheres. Colhese uma amostra aleatria de 10 estudantes e calcula-se a proporo amostral de estudantes
do sexo feminino. Qual a probabilidade de que a proporo de estudantes do sexo feminino
na amostra (
p) esteja entre 20% e 50%?

Aplicao: Determinao do Tamanho de uma Amostra


Um dos problemas de se trabalhar com amostragem a determinao do tamanho da
amostra. Uma maneira simples a seguinte:
Suponha que estejamos estimando a mdia populacional e para isso usaremos a
mdia amostral, X, baseada numa amostra de tamanho n. Suponha ainda que se queira
determinar o valor de n de modo que

P (X ) = ,
com 0 < < 1 e sendo > 0 o erro amostral mximo que podemos suportar, ambos
valores fixados.
Como X N (, 2 /n), ento

P X = P X = P



n
n
Z
= ,

X
. Logo, podemos obter z/2 da N (0, 1), tal que P (z/2 Z z/2 ) =
/ n
, de modo que

n
,
z/2 =

de onde obtemos finalmente


2
2 z/2
n=
.
2
onde Z =

10

Observao: Na prtica, no se conhece o valor da varincia populacional 2 . A fim


de resolver este problema, utiliza-se uma pequena amostra piloto para estimar o valor da
varincia populacional ou ento baseia-se em alguma informao prvia sobre a mesma.
Normalmente, usa-se a estatstica
P
(Xi X)2
2
S =
,
(n 1)
que a varincia amostral.
Exemplo 15: Suponha que uma pequena amostra piloto de tamanho 10, extrada de
= 15 e S 2 = 16. Fixando-se = 0, 5 e = 0, 95,
uma populao, forneceu os valores X
calcule o valor de n.

No caso do clculo do tamanho


da amostra na estimao da proporo populacional

p(1p)
(p), temos que p N p, n
e assim, para e previamente fixados, teremos:
P (|
p p| ) = .
Da,

P (|
p p| ) = P ( p p ) = P q

p(1p)
n

Z q

p(1p)
n

= ,

p p
. Logo, podemos obter z/2 da N (0, 1), tal que P (z/2 Z
onde Z = q
p(1p)
n

z/2 ) = , de modo que


z/2 = q
de onde obtemos finalmente
n=

p(1p)
n

2
z/2
p(1 p)

Observao: Sendo p um valor desconhecido, podemos estim-lo pela proporo


amostral (
p) ou usar o fato de que
1
p(1 p) = p p2 .
4
11

Assim, temos que


n '=

2
z/2
1/4

2
z/2

42

Exemplo 16: Suponha que quisssemos encontrar o tamanho necessrio da amostra,


n, para que a probabilidade de cometer um erro mximo de 10% no Exemplo 14 fosse de
94%. Neste caso, teramos:

1.4
1.4.1

Estimao de Parmetros
Estimao Pontual de Parmetros

1.4.1.1 Introduo
Neste captulo iremos estudar as propriedades de um estimador e a estimao intervalar.
No iremos abordar os mtodos de estimao pontual, mas justificaremos porque X e p
so bons estimadores para a mdia e a proporo, respectivamente. Nosso objetivo ser
construir intervalos de confiana para a mdia e para a proporo populacional a partir das
distribuies de X e p, respectivamente.
1.4.1.2 Propriedades de Estimadores
Considere uma amostra aleatria X1 , X2 , ..., Xn de uma v.a. que descreve alguma
caracterstica de interesse da populao. Seja um parmetro desta populao e um
estimador para , ou seja = T (X1 , X2 , ..., Xn ). Algumas definies so necessrias:
Definio 1.12 (Estimativa). Estimativa o valor assumido pelo estimador em uma
particular amostra.
12

Definio 1.13 (Vcio de um Estimador). O vcio de um estimador dado por


= E()
.
B()
Definio 1.14 (Estimador no Viciado). Um estimador dito ser no viciado
= 0. Ou seja, se E()
= .
para o parmetro se B()
Exemplo 17: Justifique porque X e p so no viciados para e p, respectivamente,
onde = E(X) e p a proporo populacional.

Observao: Considere uma populao com N elementos. Assim, a varincia populacional 2 definida como:
N
1 X
2
=
(Xi )2 ,
N i=1
N
1 X
onde, =
Xi a mdia populacional.
N i=1

Um possvel estimador para 2 , baseado numa amostra aleatria de tamanho n extrada


dessa populao,
n
1X
2

=
(Xi X)2 .
n i=1
Pode-se mostrar que este estimador viciado para 2 e E(
2) =

(n 1) 2
. Portanto,
n

2
. Logo, atravs de um simples ajuste em
2 podemos obter um
n
estimador no viciado para 2 . Este estimador

seu vcio B(
2) =

n
1 X
S =

2 =
(Xi X)2 .
n1
n 1 i=1
2

Definio 1.15 (Estimador Consistente). Um estimador consistente se, medida que o tamanho da amostra aumenta, seu valor esperado converge para o parmetro
de interesse e sua varincia converge para zero. Ou seja, consistente se as duas
propriedades abaixo so satisfeitas:
= ;
(i) limn E()
= 0.
(ii) limn V ar()
13

Observao: Se o estimador no viciado para e deseja-se verificar sua consistncia, basta observar a segunda condio da definio acima. Ou seja, um estimador
= 0.
no viciado consistente para se limn V ar()
Definio 1.16 (Eficincia de um Estimador). Dados dois estimadores 1 e 2 ,
no viciados para o parmetro , dizemos que 1 mais eficiente que 2 se V ar(1 ) <
V ar(2 ).
Exemplo 18: Considere X1 , X2 , ..., Xn uma amostra aleatria de uma distribuio
N (, 2 ). Considere os
estimadores

1 = X e
2 = mediana(X1 , X2 , ..., Xn ). Sendo

2
, verifique:
E(
2 ) = e V ar(
2 ) =
2n
a) se
1 e
2 so estimadores consistentes;
b) quem mais eficiente para estimar :
1 ou
2 ?

1.4.2

Estimao Intervalar

At aqui discutimos apenas sobre estimadores pontuais, queles que fornecem como estimativa um nico valor numrico para o parmetro de interesse. Para amostras diferentes
de uma mesma populao podemos encontrar valores diferentes para a estimativa de um
parmetro levando-se em considerao o mesmo estimador, isto porque o estimador uma
varivel aleatria. Assim, em muitas situaes gostaramos de construir uma estimativa
mais informativa para o parmetro de interesse que inclua uma medida de preciso do valor
obtido. Esse mtodo de estimao, denominado intervalo de confiana, incorpora
estimativa pontual do parmetro informaes a respeito de sua variabilidade. Intervalos de
confiana so obtidos atravs da distribuio amostral de seus estimadores.

14

1.4.2.1 Intervalo de Confiana para a Mdia de uma Populao com Varincia


Conhecida
Considere uma amostra aleatria X1 , X2 , ..., Xn de uma populao X, que tem mdia
desconhecida e varincia 2 conhecida. Daqui por diante faremos as seguintes consideraes: 0 < < 1 e z/2 um nmero tal que P (0 < Z < z/2 ) = /2 onde Z N (0, 1).
Pelo Teorema Central do Limite, a mdia amostral X N (, 2 /n). Assim, temos
que
Z=

X
N (0, 1).
/ n

Portanto, podemos escrever:

P z/2 < Z < z/2 = ,


ou seja,

e assim,

de onde obtemos

z/2

X
< z/2
<
/ n

= ,

z/2 < X < z/2


n
n

X z/2 < < X + z/2


n
n

= ,

= .

Portanto, o intervalo de confiana para , com coeficiente de confiana , dado por

,
IC(, ) = X z/2 ; X + z/2
n
n

Observe que a expresso IC(, ) envolve a quantidade X que uma varivel aleatria
e, portanto, o intervalo obtido tambm aleatrio. Desta forma, podemos interpretar o
intervalo acima da seguinte maneira: se obtivermos vrias amostras de mesmo tamanho
e para cada uma calcularmos os correspondentes intervalos de confiana com coeficiente
de confiana , esperamos que a proporo de intervalos que contenham o valor de seja
igual a .
Exemplo 19: Suponha que os comprimentos de jacars adultos de uma certa raa
siga o modelo normal com mdia desconhecida e varincia igual a 0,01 m2 . Uma amostra
de dez animais foi sorteada e forneceu mdia 1,69 m. Encontre um intervalo com 95% de
confiana para o parmetro desconhecido .

15

Observao: A amplitude do intervalo de confiana dada pela diferena entre o

extremo superior e o extremo inferior, isto , 2z/2 . O erro envolvido na estimao


n

dado pela semi-amplitude, ou seja, z/2 .


n
Exemplo 20: A vida mdia de baterias automotivas de uma certa marca est sendo
estudada. Baseado em estudos similares, com outras marcas, possvel admitir que a vida
til dessas baterias segue uma distribuio normal com desvio padro de 4,5 meses. De
qual tamanho dever ser a amostra, para que a amplitude do intervalo de 90% de confiana
para a vida mdia seja de 3 meses?

1.4.2.2 Intervalo de Confiana para a Proporo Populacional


De maneira anloga ao caso da mdia, podemos construir um intervalo de confiana
para a proporo populacional.
Pelo Teorema Central do Limite, sabemos que

p(1 p)
p N p,
.
n
Assim, um intervalo de confiana para p com nvel de confiana dado por

!
r
r
p(1 p)
p(1 p)
IC(p, ) = p z/2
; p + z/2
.
n
n
Como p desconhecido, o intervalo ainda no pode ser calculado diretamente. Uma possvel
soluo substituirmos p(1 p) por p(1 p). Portanto, o intervalo ser:

!
r
r
p(1 p)
p(1 p)
; p + z/2
IC1 (p, ) = p z/2
.
n
n
Outra soluo possvel, baseada no fato que a expresso p(1 p) tem valor mximo
igual a 1/4, quando 0 p 1. Nesse caso, podemos obter um intervalo de confiana
substituindo p(1 p) por 1/4:

r !
r
1
1
; p + z/2
IC2 (p, ) = p z/2
.
4n
4n
16

Observao: Ao aceitarmos IC1 , estamos levando em considerao que a varincia de


p(1 p)
p bem aproximada por
. Se preferirmos IC2 , estaremos substituindo a varincia
n
por um valor seguramente maior do que o real. Assim, estamos nos assegurando que o
coeficiente de confiana ser de, no mnimo, . Ao utilizarmos IC2 , estamos aceitando uma
menor preciso para p, o que se reflete numa maior amplitude do intervalo de confiana,
quando comparado ao intervalo IC1 .
Exemplo 21: Numa pesquisa de mercado, 400 pessoas foram entrevistadas sobre
determinado produto, e 60% delas preferiram a marca A. Construa um intervalo de confiana
para p com coeficiente de confiana = 0, 95.

Exemplo 22: Em uma linha de produo de certa pea mecnica, colheu-se uma
amostra de 100 itens, constatando-se que 4 peas eram defeituosas. Construir um IC para
a proporo de itens defeituosos na populao com confiana de 90%.

17

1.4.2.3 Intervalo de Confiana para a Mdia de uma Populao com Varincia


Desconhecida
At aqui consideramos a mdia de uma populao desconhecida e a varincia conhecida.
Esta situao no muito realista, pois se no conhecemos a mdia, como podemos conhecer a varincia de uma populao? Desta forma, uma situao mais prxima da realidade
seria o caso em que, tanto a mdia como a varincia, so desconhecidas. Iremos considerar
a siuao em que X N (, 2 ) com e desconhecidos.
Para isso, iremos utilizar a distribuio t de Student, que definida como:
Definio 1.17. Uma v.a. T dita ter distribuio t de Student com n graus de
liberdade, se sua f.d.p. da forma
[(n + 1)/2]

fn (t) =
(n/2) n
onde (p) =

R
0

xp1 ex dx,

t2
1+
n

(n+1)/2
, < t < ,

p > 0, conhecida como a funo gama.

Observaes:
(i) Notao: T t(n) ;
(ii) Essa distribuio leva este nome em homenagem ao estatstico ingls W.S. Gosset,
que publicou sua pesquisa sob o pseudnimo de Student;
(iii) O grfico de fn (t) simtrico em torno de 0. Ele se assemelha ao grfico da distribuio normal padro, em verdade, mostra-se que
1
2
lim fn (t) = et /2 .
2

(iv) Em virtude da importncia desta distribuio, ela se encontra tabulada. A tabela


fornece o valor de tc , tal que P (t Tn t ) = 1 , para alguns valores de
0 < < 1, onde Tn tem distribuio t de Student com n graus de liberdade.
Nosso objetivo agora estudar a situao em que X : N (, 2 ) com e desconhecidos. Assim, considerando uma amostra aleatria X1 , ..., Xn de X, pode-se mostrar
que
(X )
t(n1) ,
S/ n
n

1 X
onde S =
(Xi X)2 .
n 1 i=1
2

Assim, dado 0 < < 1, teremos


(X )

t = ,
P
S/ n
18

onde = 1 , e t um nmero tal que P (t T(n1) t ) = .


Logo, o intervalo de confiana para com nvel de confiana 1 , dado por

S
S
X t ; X + t
.
n
n
Exemplo 23: Numa grande empresa uma amostra aleatria de 20 empregados forneceu
a idade mdia igual a 32,8 anos e desvio padro 5,3 anos. Estimar a idade mdia de todos
os empregados da empresa com uma confiana de 99%.

Exemplo 24: Por analogia a produtos similares, o tempo de reao de um novo


medicamento pode ser considerado como tendo distribuio normal. Vinte pacientes foram
sorteados, receberam o medicamento e tiveram seu tempo de reao anotado. Os dados
foram os seguintes (em minutos): 2,9; 3,4; 3,5; 4,1; 4,6; 4,7; 4,5; 3,8; 5,3; 4,9; 4,8; 5,7;
5,8; 5,0; 3,4; 5,9; 6,3; 4,6; 5,5 e 6,2. Obtenha um intervalo de confiana para o tempo
mdio de reao. Use = 0, 95.

19

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus de Campina Grande


UNIDADE ACADMICA DE ESTATSTICA - UAEst
Disciplina: Introduo Estatstica
Perodo 2015.1
Professores: Amanda Gomes e Manoel Santos-Neto

1a LISTA DE EXERCCIOS
1 - Considerando a populao de alunos do exemplo 5, faa uma amostragem estratificada proporcional de tamanho 8, usando o sexo como varivel estratificadora. Utilize,
para isto, a tabela de nmeros aleatrios. Para o estrato SEXO FEMININO, utilize a
sexta coluna; para o estrato SEXO MASCULINO, utilize a segunda linha. (Percorra
a tabela da esquerda para a direita e de baixo para cima).
2 - Numa pesquisa para estudar a preferncia do eleitorado a uma semana da eleio
presidencial, qual o tamanho de uma amostra aleatria simples de eleitores, que
garanta, com alta confiana, um erro amostral no superior a 2%?
3 - Numa empresa com 1000 funcionrios, deseja-se estimar a percentagem de funcionrios favorveis a um certo programa de treinamento. Qual deve ser o tamanho
de uma amostra aleatria simples, que garanta, com alto nvel de confiana, um erro
amostral no superior a 5%?
4 - Considere as seguintes situaes:
a) Em uma pesquisa, feita pela EMPETUR com 1015 pousadas escolhidas aleatoriamente, 269 (ou 26,5%) possuam Home-page na Internet para divulgao e prestao
de servios ao turista.
b) Outra pesquisa feita entre as 50 Agncias de Viagens de uma certa localidade
mostra que 42 (ou 84%) prestam servios pela Internet.
Identifique em qual das situaes ns temos um exemplo de Parmetro e outro de
Estatstica (no sentido de medida). Justifique sua resposta.
5 - Considere a distribuio de probabilidade de uma populao apresentada na seguinte
tabela:
Valor da varivel X Probabilidade
2
1/3
1/3
3
4
1/3
Baseado nesta distribuio populacional:
a) Calcule a distribuio da mdia amostral (X) de todas as amostras aleatrias de
tamanho 2 dessa populao.
b) Com base na distribuio amostral calcule a mdia e a varincia de X. Resp.: 3
e 1/3

20

6 - Seja X N (900, 642). retiramos uma amostra de tamanho 30. Determinar:


a) P (X 894). Resp.: 0,0968
b) P (896 X 903). Resp.: 0,54726
7 - Qual dever ser o tamanho de uma amostra retirada de uma populao X N (200, 350)
para que P (|X 200| < 5) = 0, 95? Resp.: 54
8 - A capacidade mxima de um elevador de 500 kg. Se a distribuio dos pesos dos
usurios suposta N(70, 100). Qual a probabilidade de 7 passageiros ultrapassarem
este limite? Resp.: 0,352
9 - Uma fbrica de peas especifica em sua embalagens que a proporo de defeitos
de 4%. Um cliente dessa fbrica inspeciona uma amostra de 200 peas. Baseado
nesses dados, qual a porcentagem de amostras em que o cliente espera encontrar
uma proporo de defeitos maior que 5%? Resp.: Em 24% das amostras
10 - Um distribuidor de sementes determina, atravs de testes, que 5% das sementes no
germinam. Ele vende pacotes de 200 sementes com garantia de 90% de germinao.
Qual a probabilidade de um pacote no satisfazer a garantia? Resp.: 0,06%
11 - O tempo mdio para estudantes completarem o processo de matrcula em uma universidade tem sido de 55 minutos com desvio padro 8,7 minutos. Determine a
probabilidade de que o tempo mdio para 25 estudantes selecionados aleatoriamente
seja de, no mximo, 50,2 minutos. Suponha que os tempos de matrcula sejam
distribudos normalmente. Resp.: 0,289%
12 - Seja X uma populao normal com mdia e varincia 2 , de que so extradas
todas as amostras possveis de tamanho 2. Dos estimadores abaixo:

b1 = 12 X1 + 12 X2

b2 = 14 X1 + 34 X2 .
a) Qual ou quais dos estimadores acima so no-viesados para . Resp.: Os dois
b) Qual dos dois estimadores acima o melhor? Justifique. Resp.:
b1
13 - Suponha um experimento consistindo de n provas de Bernoulli, com probabilidade de
sucesso p. Seja X o nmero de sucessos, e considere os estimadores:
(i) p1 =
(ii) p2 =

X
n

1, se a primeira prova resultar sucesso


0, c.c.

a) Determine a esperana e a varincia de cada estimador. Resp.: E(


p1 ) = p =
E(
p2 ), V ar(
p1 ) = p(1 p)/n e V ar(
p2 ) = p(1 p)
b) Verifique se p1 e p2 so consistentes.
c) Por que p2 no um bom estimador para p?

21

14 - De uma populao normal com varincia igual a 16, levantou-se uma amostra,
obtendo-se as observaes: 10, 5, 10, 15. Determinar, com confiana de 87%,
um IC para a mdia da populao.
Resp.: (6,98; 13,02)
15 - A experincia com trabalhadores de uma certa indstria indica que o tempo necessrio
para que um trabalhador, aleatoriamente selecionado, realize uma tarefa distribudo
de maneira aproximadamente normal, com desvio padro de 12 minutos. Uma
amostra de 25 trabalhadores forneceu x = 140 min. Determinar os limites de confiana de 95% para a mdia da populao de todos os trabalhadores que fazem
aquele determinado servio. Qual o erro cometido ao estimarmos este intervalo de
confiana?
Resp.: (135,3; 144,7)
16 - Em uma pesquisa de opinio, entre 600 pessoas pesquisadas, 240 responderam sim
a determinada pergunta. Estimar a porcentagem de pessoas com essa mesma opinio
na populao, dando um intervalo de 95% de confiabilidade.
Resp.: (36,08%; 43,92%)
17 - Colhida uma amostra de 30 peas, forneceu os seguintes pesos:
250, 265, 267, 269, 271, 275, 277, 281, 283, 284,
287, 289, 291, 293, 293, 298, 301, 303, 306, 307,
307, 309, 311, 315, 319, 322, 324, 328, 335, 339.

Por meio da construo do intervalo de confiana, responder se esta amostra satisfaz


a espectativa pela qual o peso mdio deve ser 300 Kg.
Sugesto: Adote uma confiana de 95%.
Resp.: satisfaz, (288,33; 304,93)
18 - Sendo = 0, 5, determinar o nmero de elementos necessrios para construir um
intervalo de 95% de confiana para a mdia adimitindo-se que nossa estimativa tenha
um erro de 10%.
Resp.: 97
19 - Em 50 lances de uma moeda, foram obtidas 30 caras. A partir de um intervalo de
confiana de 96%, pode-se dizer que a moeda honesta?
Resp.: sim, (0,46; 0,74)

22

20 - Construa um IC para a mdia com confiana de 95% considerando a distribuio


amostral abaixo:
Classes ni
05
2
5 10 3
10 15 5
15 20 2

Resp.: (7,26; 13,58)

23

Relao de Exerccios do Livro texto para o 1 Estgio


Livro: "Estatstica Bsica". Wilton O. Bussab e Pedro A. Morettin. 5a. Edico.
Captulo 10 (Introduo Inferncia Estatstica)
Problema
7e8
9
12 e 13
17 e 18
21, 22, 24, 25, 26 e 28

Pgina
274
275
276
281
283

Captulo 11 (Estimao)
Problema
15, 16, 17 e 18
20 e 21
23 e 24
27, 28, 29 e 30
44 e 45

Pgina
308
309
317
318
322

24

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus de Campina Grande


UNIDADE ACADMICA DE ESTATSTICA
Disciplina: Introduo Estatstica
Perodo 2015.1
Professores: Amanda Gomes e Manoel Santos-Neto
Aluno(a):

NOTAS DE AULA PARA O 2o ESTGIO

2
2.1

Teste de Hipteses
Introduo

At o presente momento consideramos o problema de estimarmos um parmetro desconhecido da populao tanto pontualmente como atravs de um intervalo de confiana.
Apresentaremos agora, outra maneira de tratar o problema de fazer uma afirmao sobre
um parmetro desconhecido. Em vez de procurarmos uma estimativa do parmetro, frequentemente nos parecer conveniente admitir um valor hipottico para ele e, depois, utilizar
a informao da amostra para confirmar ou rejeitar esse valor hipottico.
A construo de um teste de hipteses, para um parmetro populacional, pode ser
colocada do seguinte modo: existe uma varivel X associada a dada populao e tem-se
uma hiptese sobre determinado parmetro dessa populao. Por exemplo, afirmamos
que o verdadeiro valor de 0 . Colhe-se uma amostra aleatria de elementos dessa
populao, e com ela deseja-se comprovar ou no tal hiptese.
Iniciamos a anlise explicitando claramente qual a hiptese que est sendo colocada
prova e a chamamos de hiptese nula, e escrevemos
H0 : = 0 .
Convm explicitar a hiptese que ser considerada aceitvel, caso H0 seja rejeitada.
A essa hiptese chamamos de hiptese alternativa. Formularemos, ento, duas hipteses
bsicas:
H0 : hiptese nula
H1 : hiptese alternativa
Geralmente, a hiptese H0 a hiptese a ser testada. Caso rejeitemos H0 , a hiptese H1
ser considerada aceitvel.

2.2
2.2.1

Definies Bsicas
Tipos de Testes

Iremos considerar os seguintes tipos de testes:


25

1. Teste bilteral

H0 : = 0
H1 : 6= 0
2. Teste unilateral direita

H0 : = 0
H1 : > 0
3. Teste unilateral esquerda

H0 : = 0
H1 : < 0
2.2.2

Tipos de Erros

Qualquer que seja a deciso tomada, estamos sujeitos a cometer erros. Neste caso, os
possveis erros sero
Erro de tipo I: rejeitar a hiptese nula quando essa verdadeira. Chamamos de a
probabilidade de cometer esse erro, isto ,
= P (erro do tipo I) = P (rejeitar H0 |H0 verdadeira)
Erro de tipo II: no rejeitar a hiptese nula quando essa falsa. A probabilidade de
cometer esse erro denotada por , logo
= P (erro do tipo II) = P (no rejeitar H0 |H0 falsa)

Exemplo 1: Um pesquisador acredita que descobriu uma vacina contra resfriado.


Ele ir conduzir uma pesquisa de laboratrio para verificar a veracidade da afirmao. De
acordo com o resultado, ele lanar ou no a vacina no mercado. As hipteses que pode
testar so:
1) A vacina no eficaz;
2) A vacina eficaz.
Descreva os dois tipos de erro que podem ser cometidos nesta situao.

26

Exemplo 2: Identifique as hipteses que esto sendo testadas em cada caso:


a) A fora de rompimento de uma fibra txtil uma varivel aleatria distribuda
normalmente. As especificaes exigem que a fora mdia de rompimento seja igual a 150
psi. O fabricante gostaria de detectar qualquer afastamento significante desse valor.

b) Sempre que o aumento mdio da temperatura da gua em uma cmara compressora


superar 5 C, o processo de resfriamento deve ser recalibrado. Este processo , entretanto,
caro e, portanto, deve ser feito apenas se for realmente necessrio.

c) Um criador tem constatado uma proporo de 10% do rebanho com verminose. O


veterinrio alterou a dieta dos animais e acredita que a doena diminuiu de intensidade.

2.2.3

Regio Crtica do Teste

Nosso interesse ao realizar um teste de hiptese decidir se a hiptese H0 ou no aceitvel.


b que ser usada para estabelecer o que
Tal deciso deve ser baseada em uma estatstica ,
chamamos de regio crtica do teste.
b leva
Regio Crtica: um conjunto de valores para os quais a estatstica de teste, ,
rejeio da hiptese H0 . Esta regio construda de modo que
P ( RC | H0 verdadeira) = ,
onde fixado a priori.
A regio crtica define o conjunto de valores amostrais para os quais a estatstica de
teste deixa evidente a no veracidade da hiptese H0 , a uma determinada probabilidade, ,
de se cometer o Erro Tipo I. Caso o valor observado da estatstica pertena a essa regio,
rejeitamos H0 ; caso contrrio, no rejeitamos H0 . Um fato importante a ressaltar que a
regio crtica sempre construda sob a hiptese de H0 ser verdadeira.
A probabilidade de se cometer um erro de tipo I um valor arbitrrio e recebe o
nome de nvel de significncia do teste. O resultado da amostra tanto mais significante
para rejeitar H0 quanto menor for esse nvel . Usualmente, o valor de fixado em 5%,
1% ou 0,1%.
A determinao do valor de j mais difcil, pois usualmente no especificamos
valores fixos para o parmetro sob a hiptese alternativa.

27

2.2.4

Procedimento Geral para a Construo de um Teste de Hipteses

Passo 1. Fixe qual a hiptese H0 a ser testada e qual a hiptese alternativa H1 .


Passo 2. Use a teoria estatstica e as informaes disponveis para decidir qual estatstica (estimador) ser usada para testar a hiptese H0 . Obtenha as propriedades dessa
estatstica (distribuio, mdia, desvio padro).
Passo 3. Fixe a probabilidade de cometer o erro de tipo I e use este valor para
construir a regio crtica (regra de deciso). Lembre que essa regio construda a partir
da estatstica definida no passo 2, usando o valor do parmetro hipotetizado por H0 .
Passo 4. Use as observaes da amostra para calcular o valor da estatstica do teste
(valor observado da estatstica).
Passo 5. Se o valor da estatstica calculado com os dados da amostra no pertencer
regio crtica, no rejeite H0 ; caso contrrio, rejeite H0 .

2.3

Teste de Hiptese sobre a Mdia de uma Populao com


Varincia Conhecida

Vamos aplicar o procedimento geral para o caso em que queremos testar uma hiptese
sobre a mdia de uma populao que tem varincia conhecida.
(i) Definio das hipteses:

H 0 : = 0
a)
H1 : 6= 0

H 0 : = 0
b)
H1 : > 0

H 0 : = 0
c)
H1 : < 0
(ii) Escolha da Estatstica para o teste

Pn

i=1 Xi
Neste caso, utilizaremos a estatstica X =
. Assim, pelo T.C.L. sabemos
n
que
X
N (0, 1).
/ n

(iii) Fixado o nvel de significncia do teste () e supondo H0 verdadeira, podemos construir a regio crtica do teste como:

a) RC = x; P X 0 z 1 ou X 0 + z 1
=
2
2
n
n

= ; 0 z 1
0 + z 1 ; .
2
2
n
n
28

A regio crtica tambm pode ser escrita em termos de valores padronizados, ou seja
n

o i
i
h
h
RCp = z; P |Z| z 1 = = ; z 1 z 1 ; .
2

b) RC = x; P X 0 + z 12
= = 0 + z 12 ; . Ou ento,
2
2
n
n
n

o h
h
RCp = z; P Z > z 12 = ) = z 12 ; .
2

c) RC = x; P X 0 z 12
= = ; 0 z 12 . Ou en2
2
n
n
to,

o i
i
n

RCp = z; P Z z 12 = ) = ; z 12 .
2

(iv) Estatstica
Pn de teste: dada uma amostra de tamanho n, a estatstica de teste ser
i=1 xi
x0 =
, ou ento, considerando o intervalo com valores padronizados, a
n
estatstica de teste ser:
x 0 0
.
z0 =
/ n
(v) Concluso: se x0 RC ou z0 RCp , rejeitamos H0 , caso contrrio, no rejeitamos
H0 .
Exemplo 3: Seja X uma populao normal com varincia 36. Dessa populao,
toma-se uma
amostra de tamanho 16, obtendo-se x = 43. Ao nvel de 10%, testar as
H0 : = 45
hipteses:
H1 : 6= 45
Exemplo 4: A associao dos proprietrios de indstrias metalrgicas est muito preocupada com o tempo perdido com acidentes de trabalho, cuja mdia, nos ltimos tempos,
tem sido da ordem de 60 horas/homem por ano e desvio padro de 20 horas/homem.
Tentou-se um programa de preveno de acidentes, aps o qual foi tomada uma amostra
de nove indstrias e medido o nmero mdio de horas/homem perdidas por acidente, que
foi de 50 horas. Voc diria, no nvel de 1%, que h evidncia de melhoria?

29

2.4

Teste de Hiptese para a Proporo

Consideraremos uma populao X onde X = 1 com probabilidade p e X = 0 com probabilidade 1 p. Assim, a estatstica de teste ser a proporo amostral p. Pelo T.C.L.
sabemos que

p(1 p)
p N p,
.
n
Assim, podemos aplicar o teste de hipteses seguindo os seguintes passos:
1. Retirada uma amostra aleatria de tamanho n dessa populao queremos testar
hipteses do tipo:

H0 : p = p0
a)
H1 : p 6= p0

H0 : p = p0
b)
H1 : p > p 0

H0 : p = p 0
c)
H1 : p < p 0
2. Portanto, dado um nvel de significncia a regio crtica do teste ser respectivamente:
"
#
"
#
r
r
p0 (1 p0 )
p0 (1 p0 )
a) RC = 0, p0 z 1
p0 + z 1
,1 .
2
2
n
n
"
#
r
p0 (1 p0 )
b) RC = p0 + z 12
,1 .
2
n
"
#
r
p0 (1 p0 )
c) RC = 0, p0 z 12
.
2
n
Onde z um valor tabelado tal que P (0 Z z ) = e Z N (0, 1).
3. A estatstica de teste p avaliada em uma amostra particular.

Exemplo 5: Uma firma de semicondutores produz aparelhos lgicos. O contrato com


o cliente exige uma frao de defeituosos no mais que 5%. Uma amostra de 200 aparelhos
resultou em 12 defeituosos. Existe razo para o cliente desconfiar da firma, ao nvel de 5%
de significncia?

30

2.5

Teste de Hiptese sobre a Mdia de uma Populao com


Varincia Desconhecida

Consideraremos agora, o caso em que queremos testar hipteses sobre a mdia de uma
populao com distribuio normal, porm, com varincia desconhecida. Para isso, teremos
que estimar a varincia atravs da estatstica S 2 . Alm disso, utilizaremos o fato de que
(X )
t(n1) .
S/ n
Assim, a estatstica do teste ser T =

(X )
.
S/ n

Assim, podemos aplicar o teste de hipteses seguindo os seguintes passos:


1. Queremos testar hipteses do tipo:

H 0 : = 0
a)
H1 : 6= 0

H 0 : = 0
b)
H1 : > 0

H 0 : = 0
c)
H1 : < 0
2. Fixado um nvel de significncia , a regio crtica do teste ser dada respectivamente
por:

S
S
a) RC = , 0 t
0 + t , .
n
n

S
b) RC = 0 + t2 , .
n

S
c) RC = , 0 t2 .
n
Onde t um valor tabelado tal que P (|T | < t ) = 1 e T t(n1) .
3. A estatstica de teste dada por X avaliada em uma amostra particular.
Exemplo 6: Um teste de resistncia ruptura feito em seis cordas acusou resistncia
mdia de 3530kg com desvio-padro de 66kg. O fabricante afirma que seu produto tem
resistncia mdia de 3650 kg. Pode-se justificar a alegao do fabricante, ao nvel de 1%?
Exemplo 7: Um fabricante afirma que seus cigarros contm no mais que 30 mg de
nicotina. Uma amostra de 25 cigarros fornece mdia de 31,5 mg e desvio padro de 3 mg.
Ao nvel de 5%, testar a afirmao do fabricante.

31

2.6

Teste de Hiptese sobre a Igualdade Mdias de Duas Populaes Normais Independentes com Varincias Conhecidas

Sejam X e Y duas populaes independentes uma da outra e normalmente distribuidas,


2
)
X N (X , X

Y N (Y , Y2 ),

2
onde X e Y so desconhecidos e X
e Y2 so conhecidos.

Sejam X1 , X2 , ..., XnX e Y1 , Y2 , ..., YnY amostras de X e de Y , respectivamente.


Desejamos testar hipteses sobre a igualdade das mdias:

H0 : X = Y

versus

H1 : X 6= Y ou
H1 : X > Y ou

H 1 : X < Y ,

versus

6 0 ou
H 1 : X Y =
H1 : X Y > 0 ou

H1 : X Y < 0.

ou equivalentemente
H 0 : X Y = 0

(i) Definio das hipteses:

H 0 : X Y = 0
a)
H1 : X Y 6= 0

H 0 : X Y = 0
b)
H 1 : X Y > 0

H 0 : X Y = 0
c)
H 1 : X Y < 0
(ii) Escolha da Estatstica para o teste
Neste caso, utilizaremos a estatstica X Y . Da, temos que

X Y N

2
2
X Y , X + Y
nX
nY

Assim, se a hiptese nula H0 : X = Y for verdadeira, a estatstica de teste


Z=

(X Y ) (X Y )
X Y
q 2
q
=
N (0, 1)
2
2
2
X
Y
X
Y
+
+
nX
nY
nX
nY

segue distribuio normal padro.

32

(iii) Fixado o nvel de significncia do teste () e supondo H0 verdadeira, podemos construir a regio crtica do teste como:

q 2
q 2
2
2
Y
Y
X
X
a) RC = x y; P X Y z 1 nX + nY ou X Y z 1 nX + nY = =
2
2

q 2
q

2
2
2
; z 1 nXX + nYY z 1 nXX + nYY ; .
2

A regio crtica tambm pode ser escrita em termos de valores padronizados, ou seja
n

o i
i
h
h
RCp = z; P |Z| z 1 = = ; z 1 z 1 ; .
2

q 2

b) RC = x y; P X Y z 12 nXX +
2

Ou ento,

2
Y
nY

q 2

= z 12 nXX +
2

2
Y
nY

; .

o h
h
n

RCp = z; P Z > z 12 = ) = z 12 ; .
2

q 2

c) RC = x y; P X Y z 12 nXX +
2

2
Y
nY

= ; z 12
2

2
X
nX

Ou ento,

o i
i
n

RCp = z; P Z z 12 = ) = ; z 12 .
2

P X
P Y
xi n1Y ni=1
yi , ou ento, considerando
(iv) A estatstica de teste ser x0 y0 = n1X ni=1
o intervalo com valores padronizados, a estatstica de teste ser:
x0 y 0
z0 = q 2
.
2
Y
X
+ nY
nX
(v) Concluso: se x0 y0 RC ou z0 RCp , rejeitamos H0 , caso contrrio, no
rejeitamos H0 .

Exemplo 8: A gerente de uma indstria de suco de laranja enlatado est interessada


em comparar o desempenho de duas linhas de produo diferentes de sua fbrica. Como a
linha X relativamente nova, ela suspeita que sua produo em nmero de caixas, por dia,
seja maior do que o nmero de caixas produzidas pela linha mais velha, Y . Selecionamse aleatoriamente 10 dias de dados de cada linha, econtrando-se x = 824, 9 caixas por
dia e y = 818, 6 caixas por dia. Devido experincia com a operao com esse tipo de
2
equipamento, sabe-se que X
= 40 e Y2 = 50. Verifique se a gerente tem razo, usando
= 5%.

33

2
Y
nY

2.7

Teste de Hiptese sobre a Igualdade Mdias de Duas Populaes Normais Emparelhadas

Definio 2.1 (Populaes Emparelhadas). Dizemos que duas populaes so


dependentes (ou emparelhadas) se existir alguma relao de modo que cada valor em
uma populao estiver emparelhado com um valor correspondente na outra populao.
Exemplo 9: A eficcia de uma dieta testada usando pesos de indivduos, medidos
antes e depois do tratamento. Cada valor antes emparelhado com o valor depois, pois
cada par de medidas ates/depois se refere mesma pessoa.
Sejam, ento, X e Y duas populaes normais emparelhadas,
2
X N (X , X
)

Y N (Y , Y2 ),

e sejam X1 , X2 , ..., Xn e Y1 , Y2 , ..., Yn amostras aleatrias de X e de Y , respectivamente.


Sejam Di = Xi Yi , i = 1, 2, ..., n, as diferenas entre cada par de observaes, onde
as diferenas Di seguem distribuio aproximadamente normal, com mdia
D = E(X Y ) = E(X) E(Y ) = X Y ,
de modo que um teste sobre a igualdade de X e Y pode ser obtido realizando-se um
teste t de amostra nica sobre D . Especificamente, testar

H0 : X = Y

versus

H1 : X 6= Y ou
H1 : X > Y ou

H 1 : X < Y ,

versus

H1 : D = X Y 6= 0 ou
H1 : D = X Y > 0 ou

H1 : D = X Y < 0.

equivalentemente a testar
H0 : D = X Y = 0

(i) Definio das hipteses:

H 0 : D = 0
a)
H1 : D 6= 0

H 0 : D = 0
b)
H 1 : D > 0

H 0 : D = 0
c)
H 1 : D < 0
(ii) Escolha da Estatstica para o teste
Neste caso, a estatstica apropriada X Y = D. Da, temos que
34

T =

(X Y ) (X Y )
D D
q
=
t(n1) ,
Sd
2

Sd
n

Assim, se a hiptese nula H0 : D = 0 for verdadeira, a estatstica de teste


T =

D
SD

segue distribuio t-Student com (n 1) graus de liberdade, onde


q
SD =
eD=

1
n

1
n1

Pn
i=1

Pn

i=1 (Di

D)2

ou

1
n1

SD =

hP

n
i=1

Di2

1
n

i
Pn
2
( i=1 Di ) ,

Di .

(iii) Fixado o nvel de significncia do teste () e supondo H0 verdadeira, podemos construir a regio crtica do teste como:

o i
i h
h
n

SD
SD
SD
SD

ou
=

=
,
t

t
,

.
a) RC = d; P D t
D

t
n
n
n
n
A regio crtica tambm pode ser escrita em termos de valores padronizados, ou seja
RCp = {t; P (|T | < t ) = 1 } = ]; t ] [t ; [ ;
n

o h
h
SD
SD

b) RC = d; P D t2
=

=
t
,

. Ou ento,
2 n
n
RCp = {t; P (T t2 ) = } = [t2 ; [ ;

o i
i
n

SD
SD

=
,
t
c) RC = d; P D t2
2 n . Ou ento,
n
RCp = {t; P (T t2 ) = } = ]; t2 ] ;
onde t um valor tabelado tal que P (|T | < t ) = 1 e T t(n1) .
P
(iv) A estatstica de teste ser d0 = n1 ni=1 di , ou ento, considerando o intervalo com
valores padronizados, a estatstica de teste ser:
t0 =

d0
Sd

(v) Concluso: se d0 RC ou t0 RCp , rejeitamos H0 , caso contrrio, no rejeitamos


H0 .

35

Exemplo 9: Quinze homens adultos, com idades entre 35 e 50 anos, participaram


de um estudo para avaliar o efeito da dieta e de exerccios no nvel de colesterol no
sangue. O colesterol total foi medido em cada indivduo inicialmente e depois de trs
meses de participao em um programa de exerccios aerbicos e mudanas para uma
dieta de baixo teor de gordura. Os dados so apresentados na tabela a seguir.
Nvel de Colesterol no Sangue
Indivduo Antes
Depois
1
265
229
2
240
231
3
258
227
4
295
240
5
251
238
6
245
241
7
287
234
8
314
256
9
260
247
10
279
239
11
283
246
12
240
218
13
238
219
14
225
226
15
247
233
Os dados justificam a afirmao de que a dieta com baixo teor de gordura e um
programa de exerccios aerbicos so valiosos para uma reduo mdia nos nveis de
colesterol no sangue? Use = 0, 05.

36

2a LISTA DE EXERCCIOS
1 - A tenso de ruptura de cabos fabricados por uma empresa apresenta distribuio
normal, com mdia 1800 kg e desvio padro de 100 kg. Mediante uma nova tcnica
de produo, proclamou-se que a tenso de ruptura teria aumentado. Para testar essa
declarao, ensaiou-se uma amostra de 50 cabos, obtendo-se como tenso mdia de
ruptura 1850 kg. Pode-se aceitar a proclamao ao nvel de 5%?
2 - Um exame padro de inteligncia tem sido usado por vrios anos com mdia de 80
pontos e desvio padro de 7 pontos. Um grupo de 25 estudantes ensinado, dando-se
nfase resoluo de testes. Se esse grupo obtem mdia de 83 pontos no exame, h
razes para se acreditar que a nfase dada melhorou o resultado do teste ao nvel de
10%?
3 - A fora de rompimento de uma fibra txtil uma varivel aleatria distribuda normalmente. As especificaes exigem que a fora mdia de rompimento seja igual a 150
psi. O fabricante gostaria de detectar qualquer afastamento significante desse valor.
Uma amostra de 15 espcimes de fibra forneceu fora mdia de rompimento 152, 18
psi e varincia 16, 63 psi2 . O que se pode concluir, ao nvel de 5% de significncia?
4 - Sempre que o aumento mdio da temperatura da gua em uma cmara compressora
superar 5 C, o processo de resfriamento deve ser recalibrado. Este processo ,
entretanto, caro e, portanto, deve ser feito apenas se for realmente necessrio. Em
8 experimentos independentes com a cmara, foi obtida uma mdia 5, 65 C e um
desvio padro 0, 81 C. Estes dados sugerem a necessidade de recalibrao? (Use
= 0,05)
5 - Estamos desconfiados de que a mdia das receitas municipais per capita das cidades
pequenas (0-20.000 habitantes) maior do que a das receitas do estado, que de 1229
unidades. Para comprovar ou no essa hiptese, sorteamos dez cidades pequenas,
e obtivemos os seguintes resultados: 1230; 582; 576; 2093; 2621; 1045; 1439; 717;
1838; 1359.
obs: Para facilitar os clculos, informamos que a soma das observaes 13500, e a
soma dos quadrados das observaes 22335650.
a) Mostre que o teste de hiptese usado, com = 0, 05, levar aceitao de que
a receita mdia das cidades pequenas igual do estado.
b) Voc no acha estranha essa concluso quando observa que a mdia da amostra
obtida bem maior do que a mdia do estado? Como voc explicaria isso?
6 - Uma companhia de cigarros anuncia que o ndice mdio de nicotina dos cigarros que
fabrica apresenta-se abaixo de 23 mg por cigarro. Um laboratrio realiza seis anlises
desse ndice, obtendo: 27, 24, 21, 25, 26, 22. Sabe-se que o ndice de nicotina se
distribui normalmente, com varincia igual a 4,86 mg 2 . Pode-se aceitar, ao nvel de
10%, a afirmao do fabricante?
7 - Um certo tipo de rato apresenta, nos trs primeiros meses de vida, um ganho mdio
de peso de 58g. Uma amostra de 10 ratos foi alimentada desde o nascimento at a
37

idade de 3 meses com uma rao especial, e o ganho de peso de cada rato foi: 55,
58, 60, 62, 65, 67, 54, 64, 62 e 68. H razes para crer, ao nvel de 5%, que a rao
especial aumenta o peso nos trs primeiros meses de vida?
8 - De uma populao normal levantaram-se os seguintes dados:
Classes
1`3
3`5
5`7
7`9
9 ` 11
11 ` 13
13 ` 15

ni
1
5
13
14
10
5
2

Testar, ao nvel de 5%, se a mdia dessa populao igual a 7.


9 - Uma mquina automtica que empacota o alimento A programada para colocar
100g de peso. Para verificar a preciso da mquina, uma amostra de 60 pacotes do
referido alimento fornece peso mdio de 98g e desvio padro de 6g. O que se pode
concluir ao nvel de 1%?
10 - Lana-se uma moeda 100 vezes e observa-se 40 caras. Baseado nesse resultado,
podemos afirmar, ao nvel de 5%, que a moeda no honesta?
11 - Um fabricante de droga medicinal afirma que ela 90% eficaz na cura de uma alergia,
em um determinado perodo. Em uma amostra de 200 pacientes, a droga curou 150
pessoas. Testar ao nvel de 1% se a pretenso do fabricante legtima.
12 - Uma estao de televiso afirma que 60% dos televisores estavam ligados no seu
programa especial da ltima segunda-feira. Uma rede competidora deseja contestar
essa afirmao e decide usar uma amostra de 200 famlias para um teste. Qual
deve ser o procedimento adotado para avaliar a veracidade da afirmao da estao,
adimitindo-se que, das 200 famlias pesquisadas, 110 estavam assistindo ao programa?
Utilize um nvel de 5%.
13 - Esto sendo estudadas as taxas de queima de dois diferentes propelentes slidos
usados no sistema de escapamento das aeronaves. Sabe-se que ambos os propelentes
tm aproximadamente o mesmo desvio padro da taxa de queima, ou seja, X =
Y = 3 cm/s. Duas amostras aleatrias de nX = 20 e nY = 20 espcimes so
testadas. As taxas mdias de queima das amostras so 18,02 cm/s e 24,37 cm/s.
Teste a hiptese de que ambos os propelentes tm a mesma taxa mdia de queima.
Use = 0, 05.
14 - Duas mquinas so usadas para encher garrafas de plstico com detergente para
lavagem de pratos. Os desvios padro do volume de enchimento so conhecidos
como sendo X = 0, 1 ona fluida e Y = 0, 15 ona fluida para as duas mquinas,
respectivamente. Duas amostras aleatrias de nX = 12 garrafas da mquina 1 e
nY = 10 garrafas da mquina 2 so selecionadas. Os volumes mdios de enchimento
38

nas amostras so x = 30, 61 onas fluidas e y = 30, 34 onas fluidas. Suponha


a normalidade dos dados, e teste a hiptese de que ambas as mquinas enchem o
mesmo volume mdio. Use = 0, 05.
15 - O dimetro de bastes de ao, fabricados em duas mquinas diferentes, est sendo
investigado. Duas amostras aleatrias de tamanhos nX = 15 e nY = 17 so selecionadas, obtendo-se as mdias x = 8, 73 e y = 8, 68, respectivamente. Sabendo que
2
X
= 0, 35 e Y2 = 0, 40, e que os dados sejam retirados de uma populao normal,
podemos dizer que h evidncia que justifique a afirmao de que as duas mquinas
produzam bastes com diferentes dimetros mdios? Use = 0, 05.
16 - Dois catalisadores podem ser usados em um processo qumico em batelada. Doze
bateladas foram preparadas usando o catalisador 1, resultando em um rendimento
mdio de 86,20. Quinze bateladas foram preparadas usando o catalisador 2, resultando em um rendimento mdio de 89,38. Considere que as medidas de rendimento
sejam distribudas aproximadamente de forma normal, com desvios padro de 2,91 e
2,07, respectivamente. H evidncia que justifique a afirmao de que o catalisador
2 produza um rendimento maior do que o catalisador 1? Use = 0, 01.
17 - Na fabricao de semicondutores, o ataque qumico por via mida frequentemente
usado para remover silicone da parte posterior das pastilhas antes da metalizao.
A taxa de ataque uma caracterstica importante nesse processo e sabido que ela
segue uma distribuio normal. Duas solues diferentes para ataque qumico tm
sido comparadas, usando duas amostras aleatrias de 10 pastilhas para cada soluo.
As taxas observadas de ataque (103 polegadas/min) so dadas a seguir:
Soluo 1
Soluo 2

9,9 9,4
10,2 10,6

9,3 9,6
10,7 10,4

10,2 10,6 10,3 10,0 10,3 10,1


10,5 10,0 10,2 10,7 10,4 10,3

Os dados justificam a afirmao de que a taxa mdia de ataque seja a mesma para
ambas as solues? Considere que ambas as populaes tenham varincias iguais a
0, 1(103 polegadas/min)2 e use = 0, 05.
18 - Dois fornecedores fabricam uma engrenagem de plstico em uma impressora a laser. A
resistncia de impacto (medida em libras-p) dessas engrenagens uma caracterstica
importante. Uma amostra aleatria de 10 engrenagens do fornecedor 1 resulta em
x = 289, 3, enquanto a outra amostra aleatria de 16 engrenagens do fornecedor 2
resulta em y = 321, 5. Sabendo que X = 22, 5 e Y = 21, h evidncia justificando
a afirmao de que o fornecedor 2 fornece engrenagens com maiores resistncias
mdias de impacto? Use = 0, 05 e considere que ambas as populaes sejam
normalmente distribudas.
19 - Dez indivduos participaram de um programa de modificao alimentar para estimar a
perda de peso. Seus pesos antes e depois da participao no programa so mostrados
na lista a seguir. H evidncia para justificar a afirmao de que esse programa
particular de modificao alimentar seja efetivo na reduo do peso mdio? Use
= 0, 05.
39

Peso
Indivduo Antes
1
195
2
213
3
247
4
201
5
187
6
210
7
215
8
246
9
294
10
310

Depois
187
195
221
190
175
197
199
221
278
285

20 - Dois diferentes testes analticos podem ser usados para determinar o nvel de impureza
em ligas de ao. Oito espcimes so testados usando ambos os procedimentos, sendo
os resultados mostrados na tabela a seguir. H evidncia suficiente para concluir que
ambos os testes fornecem o mesmo nvel mdio de impureza? Use = 0, 01.
Espcime
1
2
3
4
5
6
7
8

Teste 1 Teste 2
1,2
1,4
1,3
1,7
1,5
1,5
1,4
1,3
1,7
2,0
1,8
2,1
1,4
1,7
1,3
1,6

Gabarito
1) RC = [1823, 19; +)
2) RC = [81, 792; +)
3) RC = (; 147, 74] [152, 26; +)
4) RC = [5, 54; +)
5) a) RC = [1620, 74; +)
6) RC = [24, 152; +)
7) RC = [60, 76; +)
8) RC = (; 6, 25] [7, 75; +)
9) RC = (; 98, 0015] [101, 9985; +)
10) RC = [0; 0, 402] [0, 598; 1]

40

11)
12)
13)
14)
15)
16)
17)
18)
19)
20)

RC
RC
RC
RC
RC
RC
RC
RC
RC
RC

= [0; 0, 8506]
= [0; 0, 5432]
= (; 1, 8594] [1, 8594; +)
= (; 0, 1088] [0, 1088; +)
= (; 0, 4243] [0, 4243; +)
= (; 2, 3199]
= (; 0, 277] [0, 277; +)
= (; 14, 501]
= [3, 7166; +)
= (; 0, 2136] [0, 2136; +)

UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus de Campina Grande


UNIDADE ACADMICA DE ESTATSTICA
Disciplina: Introduo Estatstica
Perodo 2015.1
Professores: Amanda Gomes e Manoel Santos-Neto

Relao de Exerccios para o 2 Estgio


Livro: "Estatstica Bsica". Wilton O. Bussab e Pedro A. Morettin. 5a. Edico.
Captulo 12 (Testes de Hipteses)
Problema
3
8
10, 12 e 13
22
25 e 27
35

Pgina
330
334
337
350
351
353

Captulo 13 (Inferncia para Duas Populaes)


Problema
6
16 e 19

Pgina
365
380

41