Você está na página 1de 67

UNIVERSIDADE FEDERAL FLUMINENSE

PLO UNIVERSITRIO DE VOLTA REDONDA


DEPARTAMENTO DE ENGENHARIA DE PRODUO

Estatstica II

CAROLINA COND MARQUES


ORIENTADORA: ELIANE DA SILVA CHRISTO

Volta Redonda
2010

DICE
Captulo 1 Inferncia Estatstica .................................................................................. 2
Captulo 2 Distribuio de Amostragem da Mdia .................................................... 3
Captulo 3 Estimador ou Estatstica ............................................................................ 6
Captulo 4 Estimao Pontual ...................................................................................... 6
Captulo 5 Estimao Intervalar .................................................................................. 7
Intervalo de Confiana para Mdia quando a Varincia conhecida, IC para Mdia
quando a Varincia desconhecida, IC para Proporo Populacional, Determinao do
tamanho necessrio da Amostra para estimar a Mdia, Determinao do tamanho
necessrio da Amostra para estimar a Proporo, IC para Varincia Populacional, IC
para Diferena de duas Mdias, IC para Diferena de duas Propores, Exerccios
Captulo 6 Teste de Hiptese .......................................................................................22
Teste da Mdia Populacional para Varincia conhecida, Teste da Mdia Populacional
para Varincia desconhecida, Teste da Proporo Populacional, Teste da Igualdade de
Varincias, Teste da Varincia (usando Distribuio Quiquadrado), Teste da Diferena
entre duas Mdias usando Distribuio Normal Padronizada e usando Distribuio t de
Student, Exerccios
Captulo 7 Teste Quiquadrado ....................................................................................37
Teste de Aderncia, Teste de Independncia, Teste de Homogeneidade, Exerccios
Captulo 8 Anlise de Varincia A OVA ...............................................................46
Estimativa dos Tratamentos entre a Varincia da Populao, Estimativa dos
Tratamentos dentro da Varincia da Populao, Comparando Estimativas da Varincia,
Tabela ANOVA, Exerccios
Captulo 9 Regresso Linear .......................................................................................51
Mtodo dos Mnimos Quadrados, Coeficiente de Determinao, Coeficiente de
Correlao, Exerccios
Apndices........................................................................................................................58
Tabela da Distribuio Normal-Padro, Tabela da Distribuio t, Tabela da Distribuio
Quiquadrado, Tabela da Distribuio F
Bibliografia ....................................................................................................................66

Captulo 1 - I FER CIA ESTATSTICA


Aprendendo o desconhecido a partir do conhecido
A Estatstica Inferencial compreende as tcnicas por meio das quais so tomadas
decises sobre uma populao, decises baseadas unicamente na observao de uma
amostra. Devido ao fato de que tais decises so tomadas em condies de incerteza,
requer-se, na estatstica inferencial, o uso de conceitos de probabilidade.
- Parmetros da populao: medidas caractersticas da populao
- Estatsticas da amostra: medidas caractersticas de uma amostra
Em estudos anteriores foram apresentados vrios modelos probabilsticos utilizados em
problemas reais como a distribuio normal, binomial por exemplo.
Estes modelos probabilsticos dependem de grandezas que foram consideradas
conhecidas, os parmetros. No modelo normal os parmetros so a mdia e a varincia
enquanto no modelo binomial o parmetro a probabilidade de sucesso.
Nos problemas reais estes parmetros devem ser determinados antes da construo do
modelo. Como os parmetros muitas vezes no so observveis (por exemplo, se a
populao for muito grande exigindo um trabalho exaustivo e de custo elevado, ou se os
ensaios forem destrutivos) as informaes sobre os mesmos podem ser obtidas atravs
de valores das variveis em questo, uma vez que estes so observveis.
Cada um dos valores possveis de uma varivel denominado observao da mesma,
estatstica.
Portanto, a soluo tentar obter os parmetros a partir de uma amostra de n (n < N)
observaes das variveis. Pode-se assim, obter possveis valores do parmetro e
verificar hipteses se os mesmos so verdadeiros ou no. Ao contrrio da populao, as
observaes so variveis aleatrias e variam de amostra para outra. Assim, pode-se
falar de populao das mdias amostrais ou distribuio das mdias amostrais.
Resumo
Inferncia estatstica: tirar concluses a respeito da populao, baseando-se em uma
amostra da mesma.

Captulo 2 - DISTRIBUIO DE AMOSTRAGEM DA MDIA


Parmetro
(medida que descreve certa
caracterstica dos elementos
da populao)

Simbologia

X =

Mdia

Frmula para o clculo

Varincia

Desvio-padro

X 1 + X 2 + ... + X n 1
=



1
( X i )2
 i =1

i =1

1 
( X i )2
 i =1
Tabela 2.1 Distribuio de Amostragem da Mdia (Parmetro)

Estatstica
(medida que descreve certa
caracterstica dos elementos
da amostra)

Simbologia

Mdia

Varincia

S2

Desvio-padro

Frmula para o clculo

X 1 + X 2 + ... + X n 1 n
= Xi
n
n i =1
n
1
( X i X )2

n 1 i =1

1 n
( X i X )2
n 1 i =1
Tabela 2.2 - Distribuio de Amostragem da Mdia (Estatstica)

A distribuio de amostragem da mdia a distribuio de probabilidade para os


possveis valores da mdia da amostra X baseados em um particular tamanho da
amostra.
Para qualquer tamanho dado n de amostra tomada de uma populao com mdia , o
valor da amostra X ir variar de amostra para amostra.
A distribuio de amostragem da mdia descrita atravs da determinao do valor
esperado E( X ), ou mdia da distribuio e atravs do desvio padro da distribuio das
mdias , usualmente chamado de erro padro da mdia. Em geral, o valor esperado e
o erro padro da mdia so descritos como:
E( X ) = ;

x=

Exemplo: Suponha que a mdia de uma populao bastante grande seja = 50,0 e o
desvio padro = 12,0. Determinamos a distribuio de amostragem das mdias das
amostras de tamanho n = 36, em termos de valor esperado da seguinte forma:
E( X ) = = 50,0

x=

,


,


= 2,0

Observaes:
1) Ao fazer amostras de uma populao finita (amostragem sem reposio), deve-se
incluir um fator de correo finita na frmula do erro padro da mdia:

x =

 
2) Se o desvio padro da populao for desconhecido, o erro padro da mdia pode
ser estimado, usando-se o desvio padro da amostra como um estimador do
desvio padro da populao:
sx =

A frmula para o erro padro estimado da mdia quando se inclui o fator de


correo finita :
sx =




O erro padro da mdia fornece a base principal para a inferncia estatstica no que diz
respeito a uma populao com mdia desconhecida. Um teorema em estatstica que
conduz o uso do erro padro da mdia o seguinte:

Teorema do Limite Central: medida que se aumenta o tamanho da amostra, a


distribuio de amostragem da mdia se aproxima da forma da distribuio normal,
qualquer que seja a forma da distribuio da populao. Na prtica, a distribuio de
amostragem da mdia pode ser considerada como aproximadamente normal sempre que
o tamanho da amostra for n 30.
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. p. 127

Seja X uma populao de mdia a varincia

,ou seja, N( ; ). Seja (x1, x2, ...,

xn) uma amostra aleatria ento x1, x2, ..., xn so independentes. Ento:

= E( X ) = ; x =
x

Ento se X ~ N( ; ) , temos X ~ N( ;
Varivel ormal Padronizada: Zx =

Exemplo: Um auditor toma uma amostra aleatria de tamanho n = 36 de uma


populao de 1000 contas a receber. No se conhece o desvio padro da populao, mas
o desvio padro da amostra S = $ 43,00. Se o verdadeiro valor da mdia da populao
de contas a receber = $ 260,00, qual a probabilidade de que a mdia da amostra
seja menor ou igual a $ 250,00?
Soluo

a distribuio de amostragem descrita pela mdia e pelo erro padro:


E( X ) = = $ 260,00
Sx =








= 7,17

ota: S usado como estimador de

Zx =

X



, ,
,

,
,

j que n = 36 (> 30)


= - 1,39

Portanto, P ( X 250,00) = P(Z -1,39)


E P(Z -1,39) = 0,5000 - P(-1,39 Z 0) = 0,5000 0,4177 = 0,0823
Logo, a probabilidade de que a mdia seja menor ou igual a $ 250,00 igual a 8,23%.

Captulo 3 - ESTIMADOR OU ESTATSTICA


Dada uma amostra aleatria, estimador ou estatstica qualquer varivel aleatria
funo dos elementos amostrais. Observe:
: Parmetro
: estimador ou estatstica (ex: X , S, Sx , ...)

Estimativa: o valor numrico de um estimador.

Qualidade de um estimador:
Sejam os estimadores 1 e 2 de um mesmo parmetro. Qual o melhor estimador?
Para resolver esse problema leva-se em considerao alguns conceitos sobre qualidade
de um estimador, j que nunca pode-se conhecer o valor do parmetro e sendo assim
no se pode afirmar que 1 mais correto que 2 , ou vice versa.
1) ESTIMADOR JUSTO ou NO VIESADO
Diz-se que justo se o seu valor esperado for
E() =
Exemplo: E( X ) =
2) ESTIMADOR EFICIENTE
Varincia mnima
Um estimador 1 ser mais eficiente que 2 se e somente se:

( 1) < ( 2)

Captulo 4 - ESTIMAO PO TUAL


Na estimao por ponto calcula-se um nico valor (estimativa) para o parmetro
populacional. Assim, temos:
X=

X 1 + X 2 + ... + X n 1 n
= X i uma estimativa pontual de
n
n i =1

1 n
( X i X ) 2 uma estimativa pontual de
S =
n 1 i =1

qualidade de

, ou seja S um estimador de

Captulo 5 - ESTIMAO I TERVALAR


Os mtodos de estimao por intervalo que sero estudados so baseados no
pressuposto de que possa ser usada a distribuio normal de probabilidade. Tal
pressuposio garantida sempre que:
A) Populao normalmente distribuda e conhecido, mesmo que n < 30
B) n 30 (Teorema do Limite Central), independente de ser conhecido ou no.

Um Intervalo de Confiana para a mdia um intervalo estimado, construdo com


respeito mdia da amostra, pelo qual pode ser especificada a probabilidade de o
intervalo incluir o valor da mdia da populao. O grau de confiana associado a um
intervalo de confiana indica a percentagem de tais intervalos que incluiriam o
parmetro que se est estimando.

X Zx x

ou

X ZxSx

1 - grau de confiana
grau de significncia

5.1 - Intervalo de Confiana para Mdia populacional quando a Varincia


conhecida
Neste caso sabe-se da distribuio amostral da mdia que a mdia amostral X tem
distribuio normal e desvio padro 

Assim a varivel associada a X a normal padronizada Zx =

X



E o intervalo de confiana:
P ( X - Z/2 < < X + Z/2 ) = 1 -


Exemplo: Para uma dada semana, foi tomada uma amostra aleatria de 30 empregados
horistas selecionados de um grande nmero de empregados de uma fbrica, a qual
apresentou um salrio mdio de X = $ 180,00 com um desvio padro da populao de

= $ 14,00. Estime o salrio mdio para todos os empregados horistas da fbrica


admitindo-se um grau de confiana de 95%.
Soluo

1  = 0,95
  = 0,05 "
/2 = 0,025
Logo, obtemos da tabela da Distribuio Normal Padro (Apndice) Z/2 = 1,96.
Temos ento, X Z/2 x = X 1,96 x
P ( X - Z/2 < < X + Z/2 ) = 1 -


P ( 180,00 1,96, < < 180,00 + 1,96, ) = 0,95






P (180,00 1,96(2,56) < < 180,00 + 1,96(2,56) ) = 0,95


P ( 174,98 < < 185,02 ) = 0,95

Concluso: podemos dizer que o nvel do salrio mdio para todos os empregados est
entre $ 174,98 e $ 185,02, com um grau de confiana de 95% nesta estimativa.
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. p. 129

5.2 - Intervalo de Confiana para Mdia populacional quando a Varincia


desconhecida
Neste caso deve-se estimar a varincia populacional
um estimador de qualidade de

. Ento S2, a varincia amostral,

S =  ( X X )

Sendo o tamanho da amostra menos que 30, ou seja n 30, define-se a varivel
padronizada tx =

X
#


Esta varivel tem uma distribuio de probabilidade t de Student com = n 1 graus


de liberdade.
9

ota: quanto maior o grau de liberdade, mais a distribuio se aproxima da distribuio


normal.

E temos o intervalo de confiana:


P ( X - t/2

< < X + t/2

)=1-

Exemplo: A vida mdia de operao para uma amostra de n = 10 lmpadas X = 4000


horas com o desvio padro da amostra S = 200 horas. Supe-se que o tempo de
operao das lmpadas, em geral, tenha distribuio aproximadamente normal . Estime
a vida mdia de operao para a populao de lmpadas da qual foi extrada a amostra,
usando um intervalo de confiana de 95%.
Soluo

1  = 0,95
  = 0,05 "
/2 = 0,025

; graus de liberdade g.l. = n 1 = 10 - 1 = 9

Logo, obtemos da tabela da Distribuio t (Apndice), o valor de t/2 = 2,262.


ota: como desconhecemos o desvio padro da populao , sabendo apenas o desvio
padro amostral S e n < 30, usamos a varivel t de Student.

Temos ento, X t/2 Sx = X 2,262 Sx


P ( X - t/2

< < X + t/2

)=1-

P (4000 2,262  < < 4000 + 2,262  ) = 0,95






P ( 4000 2,26(63,24) < < 4000 + 2,26(63,24) ) = 0,95


P (3857 < < 4142 ) = 0,95

Concluso: a vida mdia para a populao de lmpadas est no intervalo de 3857 4142
horas.
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. p. 130

10

Resumo
Estimao por Intervalo da Mdia da Populao
Populao

Tamanho da amostra

Normalmente
distribuda

Grande (n 30)

X Z/2 x

X Z/2Sx *

Pequeno (n < 30)

X Z/2 x

X t/2Sx

conhecido

desconhecido

Tabela 5.1 Estimao por Intervalo da Mdia da Populao

* Z utilizado como uma aproximao de t.

5.3 - Intervalo de Confiana para a Proporo populacional


A distribuio de probabilidade aplicvel propores a distribuio de probabilidade
binomial. Contudo, a construo de um intervalo de confiana para uma proporo
populacional desconhecida, usando a distribuio binomial, acarreta clculos
extenuantes. Assim, utiliza-se a distribuio normal como aproximao da binomial
para a construo de intervalos de confiana para as propores.
Suponha uma certa populao com proporo p de objetos defeituosos. Neste caso, o
estimador no tendencioso de p a proporo amostral f. Para grandes amostras (n
30), a proporo amostral f tem distribuio aproximadamente normal e a varivel
normal padronizada :
Zx =

% &

'()*')

Sendo o erro padro estimado da proporo : sf =

%( %)


Desse modo, o intervalo de confiana fica sendo:


P (f - Z/2

%( %)


p f + Z/2

%( %)


)=1-

Exemplo: Um administrador de uma universidade coleta dados sobre uma amostra


aleatria de mbito nacional de 230 alunos de curso de Engenharia e encontra que 54 de

11

tais estudantes tm diploma tcnico. Usando um intervalo de confiana de 90%, estimar


a proporo nacional de estudantes que possuem diploma tcnico.
Soluo

1  = 0,90
  = 0,10 "
/2 = 0,05

logo Z/2 = 1,65

Temos ento, f Z/2 sf = f 1,65 sf


f=





= 0,235

Ou seja, a proporo amostral de alunos que tm diploma tcnico igual a 23,5%.


%( %)

Sendo o erro padro sf =

(,)(,)



= 0,028

Temos o intervalo de confiana associado:


P ( 0,235 (1,65)(0,028) p 0,235 + (1,65)(0,028) ) = 0,90
P ( 0,235 0,046 p 0,235 + 0,046 ) = 0,90
P ( 0,189 p 0,281 ) = 0,90

Concluso: a proporo de estudantes no pas que estudam Engenharia e j possuem


diploma tcnico est no intervalo entre 18,9% 28,1%.
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. p. 149

5.4 - Determinao do Tamanho necessrio da Amostra para estimar a Mdia


Suponhamos que se conhece o tamanho desejado do intervalo de confiana bem como o
grau de confiana a ele associado. Se conhecido, sendo baseado no uso da
distribuio normal:

Z/2 =

X



Ento, o tamanho necessrio da amostra :


n = ,
-

12

Onde: Z o valor usado para o grau de confiana especfico (Tabela da Distribuio


Normal Padro Apndice)

o desvio padro da populao


e = X o fator de erro permitido no intervalo

No caso da amostragem sem reposio de uma populao finita de tamanho N, tem-se


que:

Z/2 =


.*

 .*)

E sendo e = X o erro de estimativa, explicitando-se n, tem-se que:


/

n = ( )01/
ota: Ao determinar o tamanho da amostra, qualquer resultado fracionrio sempre
arredondado.

Exemplo: Um analista do departamento pessoal deseja estimar o nmero mdio de


horas de treinamento anual para os funcionrios da empresa, com um fator de erro de
3,0 horas (para mais e para menos) e com 90% de confiana. Baseado em dados de
outras divises, ele estima o desvio padro das horas de treinamento em = 20,00
horas. Qual o tamanho mnimo necessrio da amostra?
Soluo
n = , = , , = 121
0

Concluso: o tamanho mnimo da amostra deve ser 121 horas de treinamento.


Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. P. 129

13

5.5 - Determinao do Tamanho necessrio da Amostra para estimar a Proporo


Considere uma populao com uma proporo p de objetos que apresentam certas
caractersticas de interesse. Para um intervalo de confiana de 100(1-)% construdo a
partir de uma grande amostra (n 30) extrada com uma proporo f de objetos com a
caracterstica considerada, extrada com reposio, tem-se que:
Z/2 =

% &

'()*')

onde f p = e o erro de estimativa.


Explicitando-se n, tem-se: n = / %( %)
0

Exemplo: Com objetivo de estimar a proporo de itens defeituosos numa produo,


um Engenheiro de Produo deseja extrair uma amostra de itens. Uma amostra piloto de
40 itens apresentou 4 defeituosos. Qual deve ser o tamanho da amostra definitiva para
que o erro de estimao seja no mximo 3% a um nvel de confiana de 95%?
Soluo

f =  = 0,1;


e = 0,03

1  = 0,95
  = 0,05 "
/2 = 0,025

logo Z/2 = 1,96

n = / %( %) = ,2 ,( ,) = 384,16


0

,

Concluso: o tamanho da amostra deve ser 385.

5.6 - Intervalo de Confiana para Varincia populacional


Se uma varivel aleatria x admite distribuio normal de probabilidades com mdia e
varincia
3 (4 1)
5

14

Tem distribuio Quiquadrado (n

1)

O Intervalo de Confiana escrito em funo da varivel (n 1) assume a forma:


P( (1 /2) (/2) ) = 1
Substituindo-se o valor do no intervalo, obtm-se:
P( 1 /2
P(

6 ( 7/)

P(

3 (41)

6( 7/)

( )


3 (41)

/2 ) = 1

6(7/)

)=1

3 (41) ) = 1
6(7/)

Exemplo: Uma mquina produz uma grande quantidade de peas e o nmero de peas
defeituosas da produo se distribui normalmente com varincia (x) = 16. Com o
objetivo de diminuir a variabilidade do processo, foi providenciada uma reforma na
mquina. Uma amostra aleatria de 51 peas produzidas aps a reforma forneceu
varincia 14. Construa um intervalo de confiana de 98% para a nova varincia
populacional.
Soluo

n = 51 peas, logo gl (grau de liberdade) = n 1 = 50


Varincia amostral s = 14
1 = 98% ; = 0,02 ; /2 = 0,01
Da Tabela de Distribuio Quiquadrado (Apndice), temos:
(1 /2) = (0,99) = 76,2
(/2) = (0,01) = 29,7
Teremos ento o seguinte intervalo de confiana para a varincia:
P(

3 (41)

6( 7/)

3 (41) ) = 1
6(7/)

P ( 14(51 1) 14(51 1) ) = 0,98


,

2,

P ( 9,186 23,569) = 0,98


Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia, Administrao,
Cincias Contbeis. p. 149

15

5.7 Intervalo de Confiana para Diferena de duas Mdias


Consideramos duas populaes normais, ou seja, N (1 ; 1) e N (2 ; 2)
independentes e com 1 e 2 conhecidas. Assim, ao selecionarmos amostras das duas
populaes de tamanho n1 e n2, pelo Teorema do Limite Central, sabemos:

X 1 ~ N( 1;  )


Logo,

X - X ~ ( - ;

Assim, o Intervalo de confiana:


P( ( X - X ) - Z/2






e



X ~ N( ;  )
-  )

< ( - ) < ( X - X ) + Z/2








)=1

Observao: Caso e no sejam conhecidos, e a amostra n < 30, devemos


aproximar o valor da varincia populacional pela varincia amostral s e s e substituir
a varivel Normal Padronizada, Z, pela varivel t de Student.

Exemplo: Duas populaes normais independentes, com distribuies x1 e x2,


apresentam (x1) = 5 e (x2) = 2. Uma amostra aleatria de 12 elementos da primeira
populao apresentou x1 = 34. Uma amostra aleatria de 8 elementos da segunda
populao apresentou x2 = 9,4. Calcule o intervalo de confiana de 98% para a
diferena - .
Soluo

P( ( X - X ) - Z/2



P [ (34 9,4) Z/2




1  = 0,98
  = 0,02 "
/2 = 0,01

+






=

< ( - ) < ( X - X ) + Z/2




< ( - ) < (34 9,4) + Z/2




+


+

=




)=1

] = 0,98

; logo, temos Z/2 = 2,325

P [ 24,6 2,325(1,607) < ( - ) < 24,6 + 2,325(1,607) ] = 0,98


Assim, o intervalo de confiana para a diferena - ser:
P [ 20,864 < ( - ) < 28,336 ] = 0,98
Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia, Administrao,
Cincias Contbeis. p.140, 141

16

5.8 Intervalo de Confiana para a diferena entre duas Propores


A distribuio amostral da proporo em duas populaes pode ser amostrada,
considerando-se amostras de tamanho n1 da primeira populao e amostras de tamanho
n2 da segunda populao. Obtm-se:
(f) = p

(f) = p

(f) = %?

(f) = %?

q = (1- f)

q = (1- f)
Se x = f - f , ento temos:
(x) = (f) - (f) = p - p e

(x) = (f) + (f) = %? + %? , portanto (x) =


fq


Aplicando-se a mudana de varivel de x para Z:

fq
n

C D

Z =  = (E E) (F F)

GH GH
1


Logo, o Intervalo de Confiana:


P [ (f - f) - Z/2
EI
J

EI
J

< p - p < (f - f) + Z/2


EI
J

EI
J

]=1

Exemplo: Duas mquinas produzem o mesmo tipo de pea, que so misturadas para
embalagem posterior. Uma amostra de 40 peas da primeira mquina apresentou 1 pea
defeituosa, enquanto uma amostra de 36 peas da segunda mquina apresentou 2 peas
defeituosas. Calcule, ao nvel de 98%, um intervalo de confiana para a diferena das
propores de peas defeituosas na produo dessas mquinas.
Soluo

f =



= 0,025

f =



= 0,055

q = (1 f) = 0,975

q = (1- f) = 0,945

n = 40

n = 36

17

1  = 0,98
  = 0,02 "
/2 = 0,01

; logo, temos Z/2 = 2,325

Portanto, o intervalo de confiana ser:


P [ (f - f) - Z/2
EI
J

EI
J

< (p - p) < (f - f) + Z/2


EI
J

EI
J

]=1

P [ - 0,03 2,325 (0,0453) < (p - p) < - 0,03 + 2, 325 (0,0453) ] = 0,98


P [ - 0,135 < (p - p) < 0,0753 ] = 0,98
Concluso: A diferena das propores de peas defeituosas na produo dessas
mquinas varia de -13,5% 7,53%.
Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia, Administrao,
Cincias Contbeis. p.145

Exerccios
5.1) Deseja-se estimar a mdia do valor de vendas, por estabelecimento varejista,
durante o ltimo ano, de um determinado produto. O nmero de estabelecimentos
varejistas bastante grande. Determinar o intervalo de confiana de 95% dado que os
valores de venda,so considerados normalmente distribudos, sendo X = $ 3425, = $
200, e n = 25.
Resposta: $3346,60 $3503,40

5.2) O dimetro mdio de uma amostra de n = 12 bastes cilndricos includos em um


carregamento de 2,350 mm com desvio padro de 0,050mm. A distribuio dos
dimetros de todos os bastes includos no carregamento aproximadamente normal.
Determinar o intervalo de confiana de 99% para estimar o dimetro mdio de todos os
bastes includos no carregamento.
Resposta: 2,307 2,393 mm
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. p. 140

5.3) Procurando dimensionar a ajuda de custo para seus 50 vendedores, uma empresa

acompanhou os gastos de 15 vendedores e verificou despesa mdia de 20 u.m. Se a


empresa acredita que o desvio padro para o gasto 2 u.m., determine um intervalo de
confiana de 98% para o gasto mdio dos vendedores desta empresa.

18

Resposta: 18,98 21,02 u.m.


Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia, Administrao,
Cincias Contbeis. p. 114

5.4) Uma amostra de 5 elementos selecionados de uma populao normal de 200


elementos apresentou os valores: 120, 98, 106, 145, 92. Calcule o intervalo de confiana
de 95% para a mdia da populao.
Resposta: 85,94 138,46
Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia, Administrao,
Cincias Contbeis. p. 121

5.5) Uma empresa de pesquisa de mercado faz contato com uma amostra de 100
homens em uma grande comunidade e verifica que uma proporo de 0,40 na amostra
prefere lminas de barbear da marca YY em vez de qualquer outra marca. Determine o
intervalo de confiana de 95% para proporo de todos os homens na comunidade que
preferem a lmina de barbear YY.
Resposta: 0,30 0,50; ou 30% 50%

5.6) Para uma amostra de 30 empregados de uma grande empresa, o salrio mdio
horrio foi X = $ 7,50 com s = $ 1,00. Em uma segunda grande empresa, o salrio
mdio horrio para uma amostra de 40 empregados foi X = $ 7,05 com s = $ 1,20.
Estimar a diferena dos salrios mdios horrios das duas empresas, usando um
intervalo de confiana de 90%.
Resposta: $ 0,02 $ 0,88 por hora
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. p. 152

5.7) Um pequeno fabricante comprou um lote de 200 pequenas peas eletrnicas de um


saldo de estoques de uma grande firma. Para uma amostra aleatria de 50 destas peas,
constatou-se que 5 eram defeituosas. Estimar a proporo de todas as peas que so
defeituosas no carregamento, utilizando um intervalo de confiana de 95%.
Resposta: 0,03 0,17; ou 3% 17%
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. p. 152

19

5.8) Um guarda de trnsito vistoriou 200 carros em um bairro de certa cidade e


constatou que 25 motoristas no estavam usando o cinto de segurana no momento da
vistoria. Determine um intervalo de confiana de 95% para a proporo de motoristas
que usam regularmente o cinto de segurana neste bairro.
Resposta: 0,8292 0,9208; ou 82,92% 9,08%
Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia, Administrao,
Cincias Contbeis. p. 132

5.9) O departamento de controle de qualidade amostrou aleatoriamente 60 lmpadas


produzidas antes e depois de um ajuste nas mquinas de sua linha de produo, obtendo
antes do ajuste 4 defeituosas e depois 3 defeituosas. Ao nvel de confiana de 95%,
pode-se afirmar que a diferena das propores de lmpadas defeituosas produzidas
aps o ajuste antes do ajuste apresentam diferena significativa?
Resposta: No. (- 0,100 < p - p < 0,067)
Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia, Administrao,
Cincias Contbeis. p. 146

5.10) Para um produto particular, a mdia de vendas por estabelecimento no ltimo ano,
em uma amostra de n = 10 estabelecimentos foi X = $ 3425 com s = $ 200. Supe-se
que as vendas por estabelecimento sejam normalmente distribudas. Estimar (a)
varincia e (b) o desvio padro das vendas deste produto em todos os estabelecimentos,
no ultimo ano, utilizando um intervalo de confiana de 90%.
Resposta: (a) 21278 < < 108271 ; (b) 145,9 < < 329,0
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. p. 153, 154

5.11) Deseja-se conhecer a permanncia mdia de pacientes em um hospital, a fim de


estudar uma possvel obra de ampliao do mesmo. Dispe-se de dados referentes
permanncia expressos em dias de 600 pacientes, obtendo-se os seguintes resultados X
= 12,3 dias, s = 8 dias. Pede-se: (a) Encontre o intervalo de confiana de 95% para a
permanncia mdia. (b) Qual a probabilidade de risco de > 13?
Resposta: (a) 11,6599 12,9401 dias; (b) 0,01618; ou 1,62%

5.12) Em um parque existe uma populao muito grande de esquilos. De uma amostra
aleatria de 40 destes esquilos achou-se que 4 esto infectados com o bacilo da peste.
20

Pede-se: (a) Determine um intervalo de confiana de 95% para a verdadeira proporo


de esquilos infectados na populao. (b) de que tamanho deveria ser tomada a amostra
para estimar a dita proporo com um erro no maior que 5% com um nvel de
confiana de 99%?
Resposta: (a) 0,007 0,192; ou 0,7% 19,2%; (b) 238

5.13) As caixas de cereal produzidos em uma fbrica devem ter um contedo de 16 o.


Um inspetor tomou uma amostra que forneceu os seguintes pesos em o:
15,7; 15,7; 16,3; 15,8; 16,1; 15,9; 16,2; 15,9; 15,8; 15,66
Diga se razovel que o inspetor, utilizando um coeficiente de confiana de 95%
ordene que o fabricante seja multado.
Resposta: 15,746 a 16,065 o. O inspetor no deve multar o fabricante j que o valor esperado
est dentro do intervalo de confiana das amostras analisadas.

5.14) Uma amostra de 800 eleitores indicou uma preferncia de 25% para um
determinado candidato. Pede-se: (a) Determine um intervalo de 98% de confiana para
a proporo de todos os eleitores que tm preferncia por esse candidato. (b) determine
o tamanho necessrio da amostra para se obter um intervalo de confiana de 98% para a
proporo na populao com uma amplitude de 2%.
Resposta: (a) 0,214 0,286; ou 21,4% 28,6% (b) 2537

5.15) Uma fundio produz blocos para motor de caminhes. Os blocos tm furos para
as camisas e deseja-se verificar qual o dimetro mdio no processo do furo. A empresa
retirou uma amostra de 36 blocos e mediu os dimetros de 36 furos (1 a cada bloco). A
amostra acusou mdia de 98,0 mm e desvio padro de 4,0 mm. Construa um intervalo
de confiana de 99%. Se o processo deveria ter mdia de 100 mm, h evidncia (com o
mesmo nvel de confiana) de que a mdia do processo no est no valor ideal?
Explique.
Resposta: 96,2828 a 99,7171 mm. A mdia est por baixo do valor ideal com uma confiana de
99%.

5.16) Duas mquinas so usadas para encher garrafas de plstico com detergente para
lavagem de pratos. Os desvios-padro do volume de enchimento so conhecidos como
sendo 1 = 0,10 ona fluida e 2 = 0,15 ona fluida para as duas mquinas,
respectivamente. Duas amostras aleatrias de n1 = 12 garrafas da mquina 1 e n2 = 10
garrafas da mquina 2 so selecionadas. Os volumes mdios de enchimento nas
amostras so X 1 = 30,87 onas fluidas e X 2 = 30,68 onas fluidas. Suponha
21

normalidade. Construa um intervalo bilateral de confiana de 90% para a diferena nas


mdias do volume de enchimento. Interprete esse intervalo.
Resposta: 0,099 < ( - ) < 0,281

5.17) Uma amostra aleatria de dez recm nascidos em uma maternidade deu os
seguintes valores de peso, em quilogramas, no momento do nascimento:
2,8; 3,2; 4,1; 3,5; 3,4; 3,0; 3,2; 3,2; 2,7; 2,3
Suponha que o peso de recm nascidos uma varivel aleatria normal X.
(a) Supondo que o desvio padro de X seja conhecido e igual a 0,5 kg, determine
um intervalo de confiana de 95% para o valo da mdia dos pesos de recm
nascidos nessa maternidade.
(a) Se o desvio padro de X um valor desconhecido, determine um intervalo de
confiana de 95% para esse valor mdio.
(b) Repita os itens (a) e (b) para um intervalo de confiana de 99%.
(c) Compare os intervalos obtidos nos itens anteriores e verifique se o intervalo
aumenta ou diminui (i) quando o desvio padro desconhecido e (ii) quando o
nvel de confiana aumenta.
Resposta: (a) 2,8201 3,4399 kg ; (b) 2,7723 3,4877 Kg ; (c) 2,72 3,53 Kg ; 2,62 3,63
Kg; (d) O IC aumenta quando o desvio padro desconhecido e tambm quando o nvel de
confiana aumenta.

5.18) Os seguintes nmeros so as notas de 15 estudantes do curso de Estatstica II:


6,5; 4,0; 5,0; 6,0; 7,5; 3,5; 8,0; 4,5; 7,0; 5,5; 4,0; 5,5; 8,5; 6,5; 5,5
Supondo que a populao de notas est normalmente distribuda, construa um intervalo
de confiana de 95% para a varincia e desvio padro .
Resposta: 1,2187 < < 5,6542; 1,1040 < < 2,3779

22

Captulo 6 - TESTE DE HIPTESE


Quando quisermos avaliar um parmetro populacional, sobre o qual no possumos
nenhuma informao com respeito a seu valor, no resta outra alternativa a no ser
estim-lo atravs do intervalo de confiana.
No entanto, se tivermos alguma informao com respeito ao valor do parmetro que
desejamos avaliar, podemos testar esta informao no sentido de aceita-la como
verdadeira ou rejeit-la.
- Ho Hiptese nula: informao respeito do valor do parmetro que queremos avaliar
- Ha Hiptese alternativa: afirmao respeito do valor do parmetro que aceitamos
como verdadeiro caso Ho seja rejeitada.
Portanto, o Teste de Hiptese uma regra de deciso que permite aceitar ou rejeitar
como verdadeira uma hiptese nula Ho, com base na evidncia amostral
Isto significa que utilizaremos uma amostra desta populao para verificar se a amostra
confirma ou no o valor do parmetro informado pela hiptese Ho.

Na realizao de um teste de hiptese, dois erros podem ser cometidos:


ERRO TIPO I: aquele que se comete ao rejeitar uma hiptese que correta. A
probabilidade desse erro simbolizada por e definido pelo nvel de significncia
exigido no teste.
ERRO TIPO II: o erro que se comete ao aceitar uma hiptese que incorreta. A
probabilidade desse erro simbolizada por .
A medida que diminui o aumentado e vice-versa, por isso difcil controlar os
dois erros simultaneamente. Na prtica, comum usar apenas e teremos os testes de
significncia.

Construo de um Teste de Hiptese


a) Formular as hipteses Ho e Ha
b) Escolher a varivel teste
c) Arbitrar o nvel de significncia
d) Determinar as regies de aceitao e rejeio de Ho
e) Concluso: aceitar ou rejeitar Ho

23

6.1 - Teste da Mdia Populacional para conhecida


No caso de um teste da mdia de uma populao, com a varincia conhecida, as
hipteses so:
Ho: = o
Ha: o (Teste bilateral)
< o (Teste unilateral esquerdo)
> o (Teste unilateral direito)

A varivel teste a normal padronizada:

Zx =

Zx=

com reposio

sem reposio




K*
K*)

Exemplo: Uma amostra aleatria de 40 elementos retirados de uma populao normal


com desvio padro = 3 apresentou um valor mdio igual X = 60. Teste, ao nvel de
significncia de 5%, a hiptese de que a mdia populacional seja igual a 59.
Soluo

Hipteses Ho: = 59
Ha: > 59
Utilizamos a varivel Normal Padronizada Z, j que o desvio padro conhecido.
Assim, calculando Zc, temos:
Zc =

X



 2
L
MN

= 2,108

Ao nvel de 5% de significncia, ou seja, sendo = 0,05 , obtemos na tabela da


Distribuio Normal Padro (Apndice), o valor de Z = 1,64.

24

Definimos assim uma regio de aceitao (RA) e uma regio crtica (RC) para a
hiptese nula, Ho:

Figura 6.1 - Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia,
Administrao, Cincias Contbeis. p. 159

Concluso: o valor de Zc = 2,108 > Z = 1,64 , est na regio crtica para a hiptese
nula, Ho. Portanto, ao nvel de significncia de 5%, rejeita-se Ho, ou seja, a mdia
populacional superior a 59.
Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia, Administrao,
Cincias Contbeis. p. 159, 160

6.2 - Teste da Mdia Populacional para desconhecida


A distribuio t de Student apropriada para o uso como estatstica de teste de hiptese
quando a amostra pequena (n < 30), a populao est normalmente distribuda e
desconhecido.
As hipteses so:
Ho: = o
Ha: o (Teste bilateral)
< o (Teste unilateral esquerdo)
> o (Teste unilateral direito)

A varivel teste padronizada:


tx =

com reposio

tx =

sem reposio

O


K*
K*)

com = n 1 graus de liberdade.


25

Exemplo: Uma amostra de 12 elementos retirados ao acaso de uma populao normal


apresentou X = 100 e Sx = 5. Teste ao nvel de significncia de 5%, a hiptese de que a
mdia populacional seja 102.
Soluo

Hipteses Ho: = 102


Ha: < 102
Utilizamos a varivel t j que a amostra pequena (n = 12), a populao normalmente
distribuda e o desvio padro desconhecido. Assim, calculando tc, temos:
tc =

X
O


 
P
)Q

= - 1,39

Ao nvel de 5% de significncia, ou seja, sendo = 0,05 , obtemos da tabela de


Distribuio t de Student (Apndice), o valor de t = - 1,79.
Definimos, portanto, as regies de aceitao (RA) e regio crtica (RC) para a hiptese
nula Ho:

Figura 6.2 - Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia,
Administrao, Cincias Contbeis. p. 160

Concluso: o valor de tc = - 1,39 > t = - 1,79, est na regio de aceitao para a


hiptese Ho. Portanto, ao nvel de significncia de 5%, aceita-se Ho, ou seja, aceita-se a
hiptese de que a mdia populacional seja 102 .
Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia, Administrao,
Cincias Contbeis. p. 160

26

6.3 - Teste da Proporo Populacional


As hipteses so:
Ho: p = p0
Ha: p p0 (Teste bilateral)
p < po (Teste unilateral esquerdo)
p > po (Teste unilateral direito)
onde p0 o valor de p sob a hiptese Ho.
Sob a hiptese nula a proporo amostral f, no caso de grandes amostras (n 30) tem
distribuio aproximadamente normal com mdia e desvio padro sf =

%( %)


A estatstica teste a varivel normal padronizada associada a f:


Zx =

% &

com reposio

'()*')

Exemplo: Uma mquina est regulada quando produz 3% de peas defeituosas. Uma
amostra aleatria de 80 peas selecionadas ao acaso apresentou 3 peas defeituosas.
Teste ao nvel de 2% a hiptese de que a mquina est regulada.
Soluo

A hiptese a ser testada que a mquina est regulada, ou seja p = 0,03.


A probabilidade obtida a partir das amostras :
f=

=

= 0,0375

Hipteses Ho: p = 0,03


Ha: p > 0,03
Calculamos o valor da varivel teste Zc:
Zc =

% &

'()*')

, ,

N,NL(N,RS)
TN

= 0,393

Ao nvel de significncia de 2%, obtemos da tabela da Distribuio Normal Padro o


valor de Z = 2,055.

27

Definimos, assim, uma regio de aceitao (RA) e uma regio crtica (RC) para a
hiptese nula, Ho:

Figura 6.3 - Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia,
Administrao, Cincias Contbeis. p. 164

Concluso: O valor Zc = 0,393 situa-se esquerda do valor de Z = 2,055 obtido na


tabela. Portanto est na regio de aceitao da hiptese nula. Assim, aceita-se Ho, ou
seja, p = 0,03, ao nvel de significncia de 2% a mquina est regulada.
Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia, Administrao,
Cincias Contbeis. p. 163, 164

6.4 - Teste de Igualdade de Varincias


Em muitas aplicaes deseja-se verificar se duas populaes tm varincias iguais
(populaes homocedsticas) ou varincias diferentes (populaes heterocedsticas).
Suponha que uma varivel normalmente distribuda, tenha varincia 1 numa
populao 1 e 2 em outra populao 2.
ota: Por uma questo de referncia, considera-se ndice 1 para a maior varincia e
ndice 2 para a menor.

Em algumas aplicaes deseja-se saber se 1 > 2.


As hipteses so Ho: 1 = 2 (Homocedasticidade)
Ha: 1 > 2 (Heterocedasticidade)
A distribuio F a distribuio de probabilidade apropriada para a razo das varincias
de duas amostras tomadas independentemente de populaes normalmente distribudas.
Portanto, teste se baseia na razo de varincias amostrais: Fc = U
U

com (n - 1) graus de liberdade no numerador e (n - 1) graus de liberdade no


denominador, para uma amostra de tamanho n da populao 1 e n da populao 2 e
sendo S12 e S22 as estimativas de 1 e 2 respectivamente.

28

A hiptese Ho ser rejeitada num nvel de significncia se Fc > F,(n1 - 1),(n2 - 2) e aceita
caso contrrio.
*sendo Fc o valor calculado atravs das varincias amostrais e F,(n1 - 1),(n2
obtido da tabela da Distribuio F (Apndice).

- 2)

o valor

Exemplo: projetado um novo processo de moldagem para reduzir a variabilidade dos


dimetro de fundio. Para uma amostra de n1 = 10 fundies com o processo antigo,
teve-se s1 = 5,8 mm. Para uma amostra de n2 = 8 fundies com o novo processo, tevese s2 = 4,2 mm. Considerando-se = 5%, pode-se afirmar que a variao do processo
antigo maior que no novo processo?
Soluo

Processo antigo: n1 = 10; s1 = 5,8 mm;

s12 = 33,64

Novo processo: n2 = 8;

s22 = 17,64

s2 = 4,2 mm;

Hipteses Ho: 1 = 2
Ha: 1 > 2
Varivel Teste: Fc = = , = 1,91
Regra de deciso

,

= 5%

gl 1: 1 = n1 1 = 10 1 = 9; gl2: 2 = n2 1 = 8 1 = 7
logo, Ftabelado = 3,68
Concluso: Fc = 1,91 < Ftabelado= 3,68, portanto aceita-se Ho. Ou seja, a um nvel de
significncia de 5%, no existe diferena na variabilidade dos dois processos.

6.5 - Teste da Varincia (usando a Distribuio Quiquadrado)


Para uma populao normalmente distribuda, a razo
( )


segue uma distribuio de probabilidade , existindo uma Distribuio Quiquadrado


diferente de acordo com (n 1) graus de liberdade.

29

Portanto, a estatstica usada para testar um valor hipottico da varincia da populao


=

( )


Exemplo: A mdia da vida til para uma amostra de n = 10 lmpadas x = 4000 horas,
com um desvio padro de s = 200 horas. Supe-se que a vida til das lmpadas, em
geral, seja normalmente distribuda. Suponha que, antes de ser coletada a amostra, foi
feita a hiptese de que o desvio padro no era maior do que = 150. Com base nos
resultados amostrais, teste tal hiptese ao nvel de significncia de 1%.
Soluo

Hipteses

Ho: 22500 ( = 150)


Ha: > 22500

Varivel teste =

( )


 ( )


= 16

Da tabela da Distribuio Quiquadrado, obtemos o valor de ( = 1% ; gl = 10- 1 = 9) = 21,67.


Concluso: Como calculado =16 < tabelado = 21,67, aceita-se Ho, ao nvel de
significncia de 1%. Ou seja, o desvio padro no maior que = 150.

6.6 - Teste da Diferena entre duas Mdias (usando Distribuio ormal Padronizada)
O melhor estimador para 1 e 2 X 1 e X 2, respectivamente.

A distribuio amostral de X 1 e X 2 normal e Zc =


As hipteses so Ho: 1 = 2

V X  X W (  )

1


Ha: 1 2

30

Figura 6.4 Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia,
Administrao, Cincias Contbeis. p. 139

O teste da diferena entre duas mdias , portanto, um teste bilateral e assim temos uma
regio de aceitao (- Z/2 < Zc < Z/2) e duas regies crticas ( Zc < - Z/2 e Zc > Z/2).
Tomamos a deciso comparando-se esses valores de Zc e Z/2.

Exemplo: A mdia de salrios semanais de uma amostra de n1 = 30 empregados em


uma grande indstria X 1 = 180,00 , com desvio padro amostral de s1 = 14,00. Para
uma outra grande empresa, uma amostra de n2 = 40 empregados apresentou mdia X 2 =
170,00 , com desvio padro de s2 = 10,00. Teste a hiptese de que no existe diferena
entre os valores dos salrios semanais mdios nas duas firmas, usando nvel de
significncia de 5%.
Soluo

Hipteses Ho: 1 = 2
H a: 1 2
Sendo,

X 1 = 180,00

X 2 = 170,00

s1 = 14,00

s2 = 10,00

n1 = 30

n2 = 40

Nota: como n1 e n2 so suficientemente grandes, o desvio padro amostral se aproxima


do desvio padro populacional.

Zc =

V X  X W

1


= =  = 3,327

)M1 )N
LN

MN

= 5%, logo temos da tabela Normal Padro (Apndice): Z/2 = 1,96


Concluso: Como Zc = 3,327 > Z/2, rejeita-se Ho num nvel de significncia de 5%. Ou
seja, as duas firmas apresentam diferena entre os valores mdios dos salrios semanais.
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. P. 176

31

6.7 - Teste da Diferena entre duas Mdias (usando Distribuio t de Student)


No caso anterior, se no for conhecido ou os tamanhos das amostras (n1 e n2) for
menor que 30, use aproximao de (x) por s(x), utilizando a distribuio t de Student.

tc =

X X X Y ( )

O1O
 

Assim como no caso anterior, sendo este um teste bilateral, temos uma regio de
aceitao (- t/2 < tc < t/2) e duas regies crticas ( tc < - t/2 e tc > t/2). Tomamos a
deciso comparando-se esses valores de tc e t/2.

Exemplo: Para uma amostra aleatria de n1 = 10 lmpadas, a vida til mdia foi
X 1 = 4000 horas, com s1 = 200. Para outra marca de lmpadas, cuja vida til tambm
supe-se ser normalmente distribuda, uma amostra n2 = 8, apresentou mdia X 2 =
4300 horas, e desvio padro amostral s2 = 250. Teste a hiptese de que no existe
diferena entre a mdia de vida til das duas marcas de lmpadas, usando nvel de
significncia de 1%.
Soluo

Ho: 1 = 2

Hipteses

Ha: 1 2
Sendo,

tc =

VX

X 1 = 4000

X 2 = 4300

s1 = 200

s2 = 250

n1 = 10

n2 = 8

X W

O1O
 

 

QNN QPN
1 T
)N

= - 2,76

A tabela da Distribuio t (Apndice) nos fornece t (/2 = 0,005 ; gl = 16) = 2,921


Obs: graus de liberdade gl = n1 + n2 2 = 10 + 8 -2 =16
Concluso: Como tc encontra-se na regio de aceitao (- t/2 < tc = - 2,76 < t/2).
Conclui-se que, aceita-se Ho, ao nvel de significncia de 1%. Ou seja, a mdia da vida
til das duas marcas de lmpadas so iguais.
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. P. 177

32

Exerccios
6.1) O fabricante de um novo automvel compacto afirma que o consumo mdio de
gasolina de 35 milhas por galo, em estrada. Em 40 provas, o carro fez uma mdia de
34,5 milhas por galo com um desvio padro de 2,3 milhas por galo. Pode-se afirmar
que o fabricante est mentindo, ao nvel de significncia de 5%?
Resposta: No se pode afirmar que o fabricante est mentindo. Aceita-se Ho
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. P. 173

6.2) O valor mdio de vendas por estabelecimento varejista, durante o ltimo ano, de
um particular produto, foi de X = $ 3425 para uma amostra de n = 25 estabelecimentos.
Com base em dados de vendas de outros produtos similares, supe-se que a distribuio
das vendas seja normal e que o valor do desvio padro da populao seja = $ 200. Foi
afirmado que o verdadeiro valor de vendas por estabelecimento no mnimo de $ 3500.
Testar esta afirmao ao nvel de significncia de (a) 5% e (b) 1%.
Resposta: (a) Rejeita Ho; (b) Aceita Ho
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. P. 172

6.3) Uma populao normal apresenta historicamente o valor mdio de 60 unidades.


Um analista, duvidando que este valor persista na atualidade, levantou uma amostra
aleatria de 20 elementos, obtendo valor mdio de 55 unidades com desvio padro de 2
unidades. Teste ao nvel de significncia de 5% a hiptese de que a mdia histrica
verdadeira.
Resposta: Rejeita-se Ho
Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia, Administrao,
Cincias Contbeis. p.161

6.4) Um projeto de investimento est sendo avaliado pelo mtodo pay-back. Uma
simulao envolvendo vrios cenrios futuros forneceu os seguintes tempos de retorno
do investimento (em anos): 2,8; 4,3; 3,7; 6,4; 3,2; 4,1; 4,4; 4,6; 5,2; 3,9. Teste ao
nvel de 10% a hiptese de que o tempo mdio de retorno seja de 4 anos.
Resposta: Aceita-se Ho
Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia, Administrao,
Cincias Contbeis. p.162

33

6.5) A proporo de mulheres que ocupam cargo administrativo nas empresas


tradicionalmente de 15%. Um levantamento efetuado entre 200 administradores revelou
que 40 eram mulheres. Teste ao nvel de significncia de 5% a hiptese de que a
proporo de mulheres que ocupam cargo administrativo no tenha aumentado.
Resposta: Rejeita-se Ho, a proporo de mulheres aumentou.
Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia, Administrao,
Cincias Contbeis. p.165

6.6) Uma agncia de viagens tem um tradicional plano de frias que oferecido a todos
os possveis clientes que procuram a agncia. O ndice de respostas positivas
historicamente 20%. Este ano, uma amostra aleatria de 50 potenciais clientes mostrou
que 15 adquiriram o plano de frias. Teste ao nvel de 6% a hiptese de que o percentual
de respostas positivas no tenha aumentado este ano.
Resposta: Rejeita-se Ho, o nmero de respostas favorveis aumentou.
Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia, Administrao,
Cincias Contbeis. p.166

6.7) Deseja-se testar a diferena entre duas mdias da renda de duas comunidades. Para
uma amostra de n = 30 famlias na primeira comunidade, a renda mdia anual $15500
com desvio padro amostral de s = 1800. Para uma amostra de n = 40 famlias na
segunda comunidade, a renda mdia anual $14600 e s = 2400. Teste a hiptese ao
nvel de significncia de 1%.
Resposta: Aceita-se Ho, as duas comunidades apresentam montante mdio de renda iguais.

6.8) Com objetivo de testar a eficincia de dois mtodos de aprendizagem, eles foram
aplicados durante um ano em duas escolas da mesma organizao. Ao final do curso,
selecionou-se uma amostra aleatria de 10 alunos de cada escola e a mesma tarefa foi
proposta a estes alunos. No primeiro grupo, o tempo mdio para concluir a tarefa foi
2h46min, enquanto no segundo grupo a mdia foi de 2h31min, com desvio padro de
23min e 16min respectivamente. Supondo que a distribuio do tempo de realizao das
tarefas so normais, possvel afirmar que o segundo mtodo mais eficiente que o
primeiro ao nvel de significncia de 5%?
Resposta: Aceita-se Ho. Os mtodos tm a mesma eficincia.
Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia, Administrao,
Cincias Contbeis. p.172

34

6.9) Um rgo de defesa do consumidor testa regulamente o peso de botijes de gs


para uso domstico. Eles devem apresentar um peso mdio lquido de 13kg, com desvio
padro no superior a 250g. Uma amostra aleatria realizada no depsito de uma
companhia engarrafadora de gs revelou entre 26 botijes um desvio padro de 305g.
Testar a hiptese de os botijes estarem dentro das especificaes, contra a alternativa
de os botijes estarem fora de especificao, ao nvel de 5%.
Resposta: Aceita-se Ho. Ao nvel de significncia de 5%, o produto est dentro da especificao.
Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia, Administrao,
Cincias Contbeis. p.182, 183

6.10) Uma amostra aleatria de 20 elementos selecionados de uma populao normal


apresentou s(x) = 1,3. Teste ao nvel de significncia de 5% a hiptese (x) = 4, contra
a alternativa (x) < 4.
Resposta: Rejeita Ho, a varincia da populao menor que 4.
Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica para os cursos de Economia, Administrao,
Cincias Contbeis. p.180

6.11) O peso dos camundongos em um laboratrio uma varivel que se distribui


normalmente com mdia 25,0 g e desvio padro igual a 0,8 g. Uma alimentao
balanceada dada aos camundongos durante certo perodo. Supe-se que a alimentao
no muda a varincia dos pesos. Uma amostra de 25 camundongos selecionada e
verifica-se que o peso mdio dessa amostra igual a 25,2 g. testar a hiptese de que
houve aumento do peso mdio ao nvel de significncia de 5%.
Resposta: Aceita Ho, os pesos se mantiveram igual a um nvel de significncia de 5%.

6.12) O rtulo de uma garrafa indica que ela contm 1,5 litros de um refrigerante. Um
rgo de fiscalizao deseja testar esta afirmao e multar o fabricante se constatar que
o valor mdio da quantidade de refrigerante for inferior a 1,5 litros. Com esta finalidade,
o rgo faz uma amostra aleatria de 30 garrafas e obtm uma mdia amostral de 1,482
litros e um desvio padro amostral de 0,025 litros. Verificar se a afirmao do fabricante
pode ser rejeitada ao nvel de 10% e de 5%.
Resposta: Rejeita-se a afirmao do fabricante a um nvel de significncia de 10% e de 5%.

6.13) O fabricante de uma droga medicinal reivindicou que ela era 90% eficaz em curar
uma alergia, em um perodo de 8 horas. Se a droga aplicada a 200 doentes curando a
170 deles, pode-se considerar correta a reivindicao do fabricante?
35

Resposta: Rejeita Ho, a afirmao do fabricante no correta a um nvel de significncia de 5%.

6.14) Acredita-se que duas marcas de cigarros, a e b, so semelhantes quanto ao


contedo de nicotina. Um laboratrio fez 5 determinaes do contedo de nicotina(em
miligramas) para cada marca, com os seguintes resultados:
Marca A: 31; 35; 28; 34; 33
Marca B: 27; 26; 30; 28;25
Com base nestas observaes, pode-se manter a hiptese de que as duas marcas
apresentam igual contedo de nicotina? Considere que a varincia populacional igual
a varincia amostral.
Resposta: Rejeita Ho, as duas marcas no apresentam o mesmo contedo de nicotina a um nvel
de 5%.

6.15) Examinaram-se duas classes constitudas de 40 e de 50 alunos, respectivamente.


Na primeira, o grau mdio foi 74, com desvio padro 8, enquanto, na segunda, a mdia
foi 78, com desvio padro 7. H uma diferena significativa entre os aproveitamentos
das duas classes, no nvel de significncia de (a) 5% e (b) 1%?
Resposta: (a) Rejeita Ho, h diferena significativa entre os aproveitamentos das duas classes
com um nvel de significncia de 5% e a segunda classe , provavelmente, melhor. (b) No h
diferena significativa entre as classes num nvel de significncia de 1%.

6.16) Para testar o efeito de um novo medicamento no tratamento da diabete ele


ministrado a 9 pacientes cujos contedos de acar no sangue, em jejum, forma
determinados antes e depois de algum tempo de iniciado o tratamento. Obteve-se os
seguintes resultados, em mg/ 100ml:

Paciente
Antes
Depois

1
120
116

2
110
112

3
118
114

4
128
120

5
126
130

6
124
123

7
132
124

8
139
130

9
125
118

Tabela 6.1 Pacientes antes e depois do tratamento

Pode-se concluir, com base nesta experincia, a um nvel de significncia de 5%, que o
medicamento eficaz na reduo do acar no sangue?
Resposta: Rejeita Ho, as mdias de acar so diferentes antes e depois, a um nvel de
significncia de 5%. Conclui-se que o medicamento eficaz na reduo do acar no sangue.

36

6.17) Uma mquina que empacota bolsas de caf automaticamente est regulada para
empacotar bolsas cujos pesos esto distribudos normalmente com mdia e varincia
400. A mquina foi regulada para = 500 gramas. Decide-se escolher uma amostra de
16 bolsas a cada 30 minutos com o objetivo de verificar se a produo est controlada
ou no , isto , se = 500 gramas ou no. Se uma dessas amostras tem mdia 492
gramas, deve-se deter a produo para verificar se a mquina est corretamente
regulada?
Resposta: Aceita Ho, a produo no seria interrompida. Conclui-se que a mquina esteja
corretamente regulada.

6.18) Criou-se dois grupos de animais, com 50 animais em cada grupo, com duas dietas
diferentes. Ao final de 5 meses o peso mdio do grupo 1 foi 149,2 gramas, com um
desvio padro de 8 gramas; o segundo grupo apresentou um peso mdio de 152,3
gramas, com desvio padro de 10 gramas. Devemos aceitar a hiptese de que uma dieta
melhor que a outra?
Resposta: A segunda dieta melhor que a primeira, a um nvel de significncia de 5%.

37

Captulo 7 - TESTE QUIQUADRADO


O Teste Quiquadrado como um procedimento de Teste de Hiptese
Os procedimentos correspondem a trs testes que utilizam a Distribuio Quiquadrado
e se relacionam todos com a comparao de freqncias, obtidas em amostras, de certas
categorias, com freqncias esperadas baseadas, em cada caso, em hipteses
particulares. Deste modo, os procedimentos so Testes de Hiptese e, portanto, possuem
relao com a anlise dos resultados de uma amostra.
- Teste de Aderncia
- Teste de Independncia
- Teste de Homogeneidade

7.1 - Teste de Aderncia


O teste de Aderncia um teste no paramtrico que utilizado para verificar se uma
varivel apresenta determinada distribuio de probabilidade (Distribuio Normal,
Binomial, Poison).
As hipteses so:
Ho: os resultados ocorrem com as freqncias previstas pelo modelo probabilstico.
Ha: os resultados ocorrem com freqncias diferentes das previstas pelo modelo.
Sendo observada uma amostra de n valores da varivel em estudo, a varivel teste o
valor quiquadrado para testar a diferena entre padres obtidos e esperados de
freqncia:

c =

Z (%[ %0)
%0

onde fo e fe so as freqncias observadas e esperadas, respectivamente.


Obtemos crtico da tabela da Distribuio do Quiquadrado (Apndice) observando o
nvel de significncia e os graus de liberdade, = k - m - 1, sendo k = nmero de
categorias dos dados e m = nmero dos valores de parmetros estimados com base na
amostra.
Regra de deciso: A hiptese Ho rejeitada num nvel de significncia se calculado >
crtico e aceita caso contrrio.

Exemplo: Um distribuidor regional de sistemas de ar condicionado dividiu sua regio


em quatro territrios. A um presumvel comprador da agncia de distribuio informou38

se que as instalaes do sistema estariam mais ou menos igualmente distribudas entre


os quatro territrios. O presumvel comprador toma uma amostra aleatria de 40
instalaes realizadas no ano anterior, com base nos arquivos da companhia, e verifica
que a quantidade instalada em cada uma das quatro reas a apresentada na primeira
linha da tabela (fo), enquanto a hiptese de que as instalaes esto distribudas de igual
maneira, dada na segunda linha, a distribuio uniforme esperada (fe).

D
8

Total

Freqncia observada fo

A
6

Territrio
B
C
12
14

Freqncia esperada fe

10

10

10

40

10

40

Tabela 7.1 Instalaes do sistema nos diferentes territrios

Pode-se afirmar que as freqncias esto igualmente distribudas entre os quatro


territrios a um nvel de significncia de 5%?
Soluo
Hipteses
Ho: a quantidade de instalaes est igualmente distribuda entre os quatro territrios;
Ha: a quantidade de instalaes no est igualmente distribuda entre os quatro
territrios.
Calcula-se o valor do quiquadrado:
c =

Z (%[ %0)
%0

( )


( )


( )


(= )




=  = 4,0

Sendo o nvel de significncia proposto, = 5%, e calculando-se os graus de liberdade,


obtemos da tabela da Distribuio do Quiquadrado (apndice) o valor de crtico.
gl: = k m 1 = 4 0 1 = 3
ota: a hiptese nula de que as frequncias so igualmente distribudas, nenhuma
estimao de parmetro envolvida, e m = 0.
2crtico ( = 3; = 0,05) = 7,81
Concluso: Como calculado = 4,0 < 7,81, aceita-se Ho num nvel de significncia de 5%.
Ou seja, pode-se afirmar que as freqncias esto igualmente distribudas entre os
quatro territrios.
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. P. 195, 196, 197

39

7.2 - Teste de Independncia


Os Testes de Independncia envolvem duas variveis, e o que se testa a hiptese de
que as duas variveis so estatisticamente independentes. A independncia implica que
o conhecimento da categoria na qual se classifica uma observao com respeito a uma
varivel no afeta a probabilidade de estar em uma das diversas categorias das outras
variveis.
As hipteses so: Ho: as duas variveis so independentes
Ha: as duas variveis no so dependentes
Como intervm duas variveis, as freqncias observadas so colocadas em uma Tabela
de Contingncia. As dimenses de tal tabela so definidas pela expresso r x k, onde r
indica o nmero de linhas e k indica o nmero de colunas.
A varivel teste ser:
c =

Z (%[ %0)
%0

sendo fo e fe so as freqncias observadas e esperadas, respectivamente.


onde a freqncia esperada equivalente fe =

\]


ota: recomenda-se fazer uma tabela de contingncia para frequncias esperadas


Com = (r 1)(k 1) graus de liberdade e o nvel de significncia proposto,
encontramos o valor de crtico na tabela da Distribuio do Quiquadrado (Apndice).
Regra de deciso: Rejeita-se Ho, ao nvel de significncia se calculado > crtico e
aceita-se caso contrrio para (r 1)(k 1) graus de liberdade.

Exemplo: A tabela seguinte apresenta a reao dos estudantes expanso do programa


de atletismo do colgio, segundo o nvel do curso, em que a diviso inferior indica
estudante de primeiro ou segundo ano e diviso superior indica estudante de terceiro
ou de ultimo ano.
Nvel do Curso

Reao

Total

Diviso inferior Diviso superior


A favor

20

19

39

Contra

10

16

26

Total

30

35

65

Tabela 7.2 Frequncia observada da reao dos estudantes expanso do programa de atletismo

Testar a hiptese de que o nvel do curso e a reao expanso do programa de


atletismo so variveis independentes, utilizando nvel de significncia de 5%.
40

Soluo
Ho: o nvel do curso e a reao expanso do programa de atletismo so independentes.
Ha: o nvel do curso e a reao expanso do programa de atletismo no so
independentes.
Calculando-se a freqncia esperada atravs de fe =
por exemplo: fe =

(2)()


freqncia esperada:

\]


= 18, e assim consecutivamente, constri-se a tabela da

Nvel do Curso

Reao

Total

Diviso inferior

Diviso superior

A favor

18

21

39

Contra

12

14

26

Total

30

35

65

Tabela 7.3 Frequncia esperada da reao dos estudantes expanso do programa de atletismo

Calcula-se ento o valor do quiquadrado:


calculado =

Z (%[ %0)
%0

( =)
=

(2 )


( )


( )


= 1,03

Sendo o nvel de significncia = 5%, e graus de liberdade: = (r 1)(k 1)


= (2 1)(2 1) = 1; obtemos da tabela da Distribuio do Quiquadrado (Apndice), o
valor de crtico
crtico = ( = 1; = 0,05) = 3,84
Concluso: Portanto, sendo calculado = 1,03 < 3,84, um nvel de significncia de 5%,
aceita-se Ho. Ou seja, as duas variveis, nvel do curso e reao expanso do programa
de atletismo, so independentes.
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. p. 211, 212

7.3 - Teste de Homogeneidade


O Teste de Homogeneidade corresponde ao teste das diferenas entre K propores
amostrais. O teste quiquadrado pode ser utilizado para testar a diferena entre K
propores amostrais, utilizando para a anlise das freqncias uma estrutura tabular de
2 x K. A hiptese nula a de que no existe diferena entre as diversas propores
populacionais (ou, que as diferentes propores amostrais poderiam ter sido extradas,
ao acaso, da mesma populao).
41

Observe as hipteses:
Ho: 1 = 2 = 3 = ... = k (sendo a probabilidade de cada proporo amostral)
Ha: nem todas as probabilidades so iguais
As informaes so contidas na Tabela de Contingncia. As dimenses de tal tabela so
definidas pela expresso r x k, onde r indica o nmero de linhas e k indica o numero de
colunas.
A varivel teste ser:
=

Z (%[ %0)
%0

onde a freqncia esperada equivalente fe =

\]


, e n o total geral, ou seja, o

total do somatrio de todas as linhas da tabela de contingncia (que por sua vez, igual
ao somatrio de todas as colunas).
ota: recomenda-se fazer uma tabela de contingncia para frequncias esperadas
Com = (r 1)(k 1) graus de liberdade e o nvel de significncia proposto,
encontramos o valor de crtico na tabela da Distribuio do Quiquadrado (Apndice)
Regra de deciso: Rejeita-se Ho, ao nvel de significncia se calculado > crtico e
aceita-se caso contrrio para (r 1)(k 1) graus de liberdade.

Exemplo: Foi realizada uma pesquisa de opinio dentre os votantes de 4 municpios


para comparar as propores de votantes a favor do candidato A para o governo do
estado. Foi selecionada uma amostra aleatria de 300 pessoas em cada municpio,
obtendo-se os resultados apresentados na tabela a seguir:
Eleitores
a favor de A
outro candidato
Total

1
126
174
300

Municpios
2
3
103
109
197
191
300
300

4
98
202
300

Total
436
764
1200

Tabela 7.4 Frequncia observada da pesquisa de opinio dentre os votantes de cada municpio

Considerando os dados da amostra pode-se dizer que h evidncia de que a proporo


de votantes a favor do candidato A nos 4 municpios, num nvel de significncia de 5%,
diferente?

42

Soluo
Hipteses: Ho: 1 = 2 = 3 = 4 (sendo a proporo de votantes no candidato A em
cada municpio)
Ha: nem todas as cidades tem a mesma proporo de votantes no cadidato A
Calculando-se a freqncia esperada atravs de fe =
por exemplo: fe =

()()

freqncia esperada:



Eleitores
a favor de A
outro candidato
Total

\]


= 109, e assim consecutivamente, constri-se a tabela da

Municpios
2
3
109
109
191
191
300
300

1
109
191
300

Total
436
764
1200

4
109
191
300

Tabela 7.5 Frequncia esperada da pesquisa de opinio dentre os votantes de cada municpio

Calcula-se ento o valor do quiquadrado:

calculado =

( 2)
2

Z (%[ %0)

%0
(2 2)
2

( 2)

2
(2 2)
2

( 2)

2
( 2)
2

(2 2)
2

(2= 2)
2

= 6,43

Sendo o nvel de significncia proposto = 5% e os graus de liberdade:


= (r 1)(k 1) = (2 1)(4 1) = 3
crtico ( = 0,05; = 3) = 7,81
Concluso: Portanto, sendo calculado = 6,43 < 7,81, aceita-se Ho, num nvel de
significncia de 5%. Ou seja, a proporo de votantes no candidato A a mesma para os
quatro municpios.
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. p. 213, 214

Exerccios
7.1) Em 200 lanamentos de uma moeda, foram observadas 115 caras e 85 coroas. Teste
a hiptese de que a moeda legal utilizando um nvel de significncia de (a) 5% e (b)
1%.
Resposta: Rejeita-se a hiptese de que a moeda legal a um nvel de significncia de 5%. No
se tem o mesmo resultado a um nvel de significncia de 1%.

43

7.2) A tabela abaixo apresenta as freqncias observadas, ao lanar-se um dado 120


vezes. Testar a hiptese de o dado ser honesto.
Face
Freqncia observada

1
25

2
17

3 4
15 23

5
24

6
16

Tabela 7.5 Frequncia observada no lanamento de um dado

Resposta: Aceita Ho, o dado honesto a um nvel de significncia de 5%.

7.3) Historicamente, um fabricante de televisores vende 40% de aparelhos com telas


pequenas, 40% com telas mdias e 20% de aparelhos com telas grandes. Com o fim de
estabelecer programas apropriados de produo para o prximo ms, toma uma amostra
aleatria de 100 vendas durante o atual perodo e encontra que 55 dos televisores
adquiridos eram pequenos, 35 do tamanho mdio e 10 grandes. Teste a hiptese de que
o padro histrico de vendas prevalece, usando nvel de significncia de 1%.
Resposta: c = 11,25. Rejeita-se Ho.
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. P. 197

7.4) Em geral, 20% dos clientes em potencial visitados pelo vendedor de uma firma
fazem uma compra. Durante o perodo de testes, um novo vendedor faz 30 visitas
possveis clientes e realiza trs vendas. Teste a hiptese nula de que este padro de
vendas no difere do padro histrico, usando nvel de significncia de 5%
Resposta: c = 1,30. Aceita-se Ho.
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. P. 198

7.5) Foi realizado um estudo sobre os clientes de determinada loja e comparou-se a


relao entre duas variveis, idade e sexo. Dada a tabela abaixo, com a freqncia
observada, teste a hiptese de independncia entre as duas variveis ao nvel de
significncia de 1%.
Idade

Sexo

Menos de 30
30 e mais
Total

Masculino
60
80
140

Total
Feminino
50
10
60

110
90
200

Tabela 7.6 Frequncia observada de idade e sexo de clientes

Resposta: c = 27,8. Rejeita-se a hiptese nula de independncia a um nvel de significncia de


1%.
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. P. 199, 20

44

7.6) Um gerente de um departamento de pessoal estima que uma proporo de = 0,40


dos empregados de uma grande empresa participar de um novo programa de
investimento em aes. So feitos contatos com uma amostra aleatria de n = 50
empregados, sendo que 10 deles indicam sua inteno de participar. Teste , atravs do
uso do quiquadrado o valor hipottico da proporo da populao, ao nvel de
significncia de 5%
Resposta: Rejeita-se Ho

7.7) Nas experincias que Mendel realizou com ervilhas, ele observou 315 redondas e
amarelas, 108 redondas e verdes, 101 enrugadas e amarelas e 32 enrugadas e verdes. De
acordo com a sua teoria da hereditariedade, os nmeros deveriam estar na proporo
9:3:3:1. H evidncia para se duvidar de sua teoria, ao nvel de significncia de (a) 1% e
(b) 5%?
Resposta: (a) Aceita Ho; (b) Aceita Ho

7.8) Em um determinado dia, o gerente de um supermercado observou o nmero de


clientes que escolheram cada um dos 8 caixas disponveis na sada. Os resultados esto
dados na tabela a seguir:
CAIXA
Freqncia

I
80

II
100

III
130

IV
145

V
120

VI
110

VII
60

VIII
55

TOTAL
800

Tabela 7.7 Frequncia observada da escolha entre os caixas de um supermercado

Diga se o gerente pode afirmar que existe preferncia por um dos caixas num nvel de
significncia igual a 0,05.
Resposta: Rejeita Ho, existe evidncia de que h preferncia por um dos caixas.

7.9) Uma amostra de peas forneceu a seguinte tabela de contingncia sobre a qualidade
da pea por linha de produo. O gerente afirma que a qualidade da pea independe da
linha de produo, realize um teste de hiptese para verificar se o gerente est certo.
Linha
Primeira
Segunda
Terceira

Qualidade
Aceitvel
368
285
176

Qualidade
Defeituosa
32
15
24

Tabela 7.8 Frequncia observada da qualidade da pea por linha de produo

Resposta: Os dados mostram evidncia de que o gerente no est certo na sua afirmao a um
nvel de significncia de 5%.

45

7.10) Dois pesquisadores selecionaram amostras de uma mesma cidade com o objetivo
de estimar o nmero de pessoas que correspondem aos grupos classificados segundo o
salrio familiar por ms: A, B, C (os intervalos em reais so os mesmos para cada
grupo). Os resultados obtidos foram:
Pesquisador
P1
P2
Total

A
20
30
50

Grupo
B
100
80
180

Total
C
150
150
300

270
260
530

Tabela 7.9 Frequncia observada do nmero de pessoas em cada grupo de salrio familiar

Os dados apresentam evidncia de que as amostras de um dos pesquisadores so


suspeitas?
Resposta: Pode-se dizer que, a um nvel de significncia de 5% os dois pesquisadores
selecionaram as amostras corretamente.

7.11) Ao fazer um certo cruzamento, um geneticista esperava uma segregao de 4 A


para 1 B. Em uma amostra ao acaso de 500 ele observou 380 A e 120 B. Os dados
verificam a relao esperada? Use nvel de significncia de 1%.
Resposta: A um nvel de significncia de 1% os dados verificam a relao esperada.

7.12) Determinado veculo utilitrio est sofrendo pesadas crticas de seus proprietrios,
com relao grande freqncia de defeitos no pneu traseiro esquerdo. Preocupado com
sua imagem, e procurando defender-se de eventuais pedido de indenizao, o fabricante
do veculo resolveu coletar informaes sobre 152 ocorrncias de defeitos,
classificando-as por posio do pneu. Os resultados esto na tabela a seguir. Usando
nvel de significncia de 5%, h razo para acreditar que a probabilidade de defeito
diferente para algumas posies?
Posio do pneu
Freqncia

Dianteiro
esquerdo
35

Dianteiro
direito
32

Traseiro
esquerdo
57

Traseiro
direito
28

Total
152

Tabela 7.10 Frequncia observada de defeitos por posio de pneu

Resposta: H uma evidncia de que as freqncias de ocorrncia dos defeitos dependem da


posio do pneu a um nvel de significncia de 5%

46

Captulo 8 - A LISE DE VARI CIA


A Anlise de Varincia ou AOVA empregada para testar a igualdade entre k mdias
de uma mesma populao.
ota: Utilizada para mdias amostrais obtidas de populaes normalmente distribudas.
Todavia, descobriu-se que o procedimento de teste no grandemente afetado por
violaes da hiptese de normalidade, quando as populaes so unimodais e os
tamanhos das amostras so aproximadamente iguais.
Assumimos que uma amostra aleatria simples de tamanho ni tenha sido selecionada de
cada uma das k populaes ou tratamentos.

8.1 - Estimativa dos Tratamentos Entre a varincia da populao


A estimativa dos tratamentos entre a varincia da populao chamada de quadrado
da mdia devido ao tratamento, e denotada por MSTR (Mean Square due to
Treatments):
MSTR =

b )
c
d)  (C` a
] 

Sendo,

ni = nmero de observaes para o tratamento i;


e` = mdia da amostra para o tratamento i;
fb = mdia global dos tratamentos;
k = nmero de tratamentos.

O numerador SSTR = ]g 4 (e` fb) chamado de soma dos quadrados devido aos
tratamentos e denotado por SSTR (Sum of Squares due to Treatments). O
denominador, (k 1) representa os graus de liberdade associados SSTR. Ento temos:
MSTR =

UUhi
] 

Sendo a hiptese nula Ho verdadeira, o MSTR fornece uma estimativa sem vis da
varincia da populao .

47

8.2 - Estimativa dos Tratamentos Dentro da varincia da populao


Esta estimativa de tratamentos dentro da varincia da populao chamada de
quadrado da mdia devido aos erros e denotada por MSE (Mean Square due to Error).
A frmula para MSE :
MSE =

c
d)( )
j

Sendo:

ni = nmero de observaes para o tratamento i;


si2 = varincia da amostra para o tratamento i;
 = nmero total de observaes;
k = nmero de tratamentos.

Onde o numerador SSE = ]g(4 1)3 a soma dos quadrados devido aos erros
(Sum of Squares due to Error). O denominador de MSE (N k) corresponde aos graus
de liberdade associados ao SSE.

Hipteses Ho: 1 = 2 = 3 = ... = k


Ha: Nem todas as mdias so iguais

8.3 - Comparando as estimativas da Varincia


Teste F
Considere que Ho seja verdadeira. O MSTR e MSE fornecem duas estimativas
independentes, sem vis, de . Para populaes normais, a distribuio amostral da
razo de duas estimativas independentes de segue uma distribuio F. Portanto, se a
hiptese nula verdadeira, a distribuio amostral de MSTR/MSE uma distribuio F
com os graus de liberdade iguais a (k 1) para numerador e ( k) para denominador.
Varivel teste: Fc =

kUhi
kUl

Sendo o nvel de significncia dado, e os graus de liberdade: = (k 1) do


numerador e = ( k) do denominador, obtemos da tabela de Distribuio F
(Apndice) o valor de F
Regra de Deciso: Rejeitar Ho se Fc > F.

48

8.4 - Tabela A OVA


Os resultados dos clculos precedentes podem ser exibidos convenientemente em uma
tabela denominada Tabela de Anlise de Varincia. A soma dos quadrados associados
fonte de variao denominada total chamada de soma total dos quadrados (SST)
onde:
SST = SSTR + SSE

Fonte de
variao
Tratamento
Erro
Total

Graus de
liberdade
k-1
N-k
N-1

Soma dos
quadrados
SSTR
SSE
SST

Quadrado
mdio
MSTR
MSE

F
MSTR
MSE

Tabela 8.1 Tabela de Anlise de Varincia

Exemplo: Com o objetivo de comparar trs tipos de cimento em termos da resistncia


compresso do concreto, foi realizado um experimento completamente aleatorizado,
com cinco corpos de prova de cada tipo de cimento. Os resultados forma o seguintes:
Cimento
A
B
C

Resistncia compresso
12
10
8
21
23
17
9
12
20

9
20
10

15
30
11

Tabela 8.2 Resistncia compresso do concreto nos trs tipos de cimento

Faa uma ANOVA e verifique se h evidncia de que existe diferena real entre as
resistncias mdias dos trs tipos de cimentos, num nvel de significncia de 5%.
Soluo
e` A = 10,8;
e` B = 22,2;

e` C = 12,4;

sA = 2,77;

sA2 = 7,7

sB = 4,87;

sB2 = 23,7

sC = 4,4;

sC2 = 19,3

E ainda, nA = nB = nC = 5
,= 1 , 1,
A mdia global dos tratamentos: fb =
= 15,1


SSTR = ]g 4 (e` fb) = 5(10,8-15,1) + 5(22,2-15,1) + 5(12,4-15,1)

= 92,4 + 252,1 + 36,4 = 380,9


MSTR =

UUhi
m 

=,2
 

= 190,5
49

SSE =]g(4 1)3 = (5-1)7,7 + (5-1)23,7 + (5-1)19,3 = 202,8


MSE =

UUl

,=

 

,=


= 16,9

Calculando o valor da varivel teste:


Fc =

kUhi
kUl

2,
,2

gl do numerador:

= 11,3
1 = (k - 1) = 2

gl do denominador: 2 = (N k) = 12
sendo = 0,05, temos F = 3,89
Concluso: Como F = 11,3 > F, rejeita-se Ho ao nvel de significncia de 5%, ou seja, a
ANOVA apia a concluso de que as mdias de resistncia compresso dos trs tipos
de cimento no so iguais.

Exerccios
8.1) Quinze pessoas que participaram de treinamento so colocadas, de forma aleatria,
sob trs diferentes tipos de avaliao. Os graus obtidos no teste de concluso do mtodo
de instruo so apresentados na tabela abaixo, juntamente com o grau mdio de
desempenho associado a cada tipo de ensino. Usar procedimento da anlise da varincia
para testar a hiptese nula de que as trs mdias amostrais foram obtidas da mesma
populao, a um nvel de significncia de 5%.
Mtodo da
instruo
A
B
C

Graus de prova
86
90
82

79
76
68

81
88
73

70
82
71

84
89
81

Total de
graus
400
425
375

Mdia
dos graus
80
85
75

Tabela 8.3 Graus obtidos no teste de concluso dos trs mtodos de intruo

Resposta: Aceita Ho
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. p. 222

8.2) Os valores da resistncia trao (Mpa) de corpos de prova de plstico preparados


por dois processos diferentes so:

50

Processo 1
6,1
7,1
7,8
6,9
7,6
8,2

Processo 2
9,1
8,2
8,6
6,9
7,5
7,9

Tabela 8.5 Valores da resistncia trao

Os dados apresentam evidncia suficiente para concluir que as elasticidades mdias


(populacionais) para os dois processos so iguais? Use a ANOVA.
Resposta: Os valores da resistncia trao dos corpos de prova de plstico preparados por dois
processos diferentes so iguais a um nvel de significncia de 5%.

8.3) Trs turmas da Estatstica II so ministradas por trs professores. As notas finais da
matria so dadas na tabela seguinte:
Professor
A
7,5 9,0
B
9,0 8,0
C
7,0 8,0

8,0
5,0
5,5

4,5
9,0
9,0

8,0
5,0
7,0

7,5
8,5
7,0

6,5
7,5
8,5

6,0
7,5
4,0

4,5
3,0
6,0

9,5
8,0
7,0

3,5
6,0
5,5

7,5
1,5

9,5

8,0

Tabela 8.6 Notas finais de Estatstica II

Resposta: No existe diferena significativa entre as notas mdias dadas pelos 3 professores a
um nvel de significncia de 5%.

8.4) Cinco observaes foram selecionadas de trs populaes. Os dados obtidos foram
os seguintes:
Observao
1
2
3
4
5
Mdia da amostra
Varincia da amostra

Amostra 1
32
30
30
26
32
30
6,0

Amostra 2
44
43
44
46
48
45
4,0

Amostra 3
33
36
35
36
40
36
6,5

Tabela 8.8 Observaes obtidas de trs populaes

a) Calcule a estimativa de entre os tratamentos.


b) Calcule a estimativa de dentro dos tratamentos.
c) Com o nvel de significncia = 0,05, podemos rejeitar a hiptese nula de que
as mdias das trs populaes so iguais? Explique.
d) Crie a tabela ANOVA para esse problema.

51

Resposta: (a) SSTR = 570, MSTR = 285; (b) SSE = 66, MSE = 5,5; (c) Fc = 51,82. Rejeita-se a
hiptese nula de que as mdias das trs populaes sejam iguais
Anderson, Sweeney e Williams (2002). Estatstica aplicada Administrao e Economia. p. 383

8.5) A fim de testar se o tempo mdio necessrio para misturar um lote de matrias o
mesmo para mquinas produzidas por trs diferentes fabricantes, a Jacob Chemical
Company obteve os seguintes resultados sobre o tempo (em minutos) necessrio para
misturar os materiais. Use esses dados para testar se o tempo mdio populacional para
misturar um lote de materiais difere em relao aos trs fabricantes. Use = 0,05.
Fabricante 1
20
26
24
22

Fabricante 2
28
26
31
27

Fabricante 3
20
19
23
22

Tabela 8.9 Tempo mdio amostral de cada fabricante

Resposta: Fc = 10,63. Rejeita-se a hiptese nula de que o tempo mdio necessrio para misturar
um lote de materiais seja o mesmo para cada fabricante.
Anderson, Sweeney e Williams (2002). Estatstica aplicada Administrao e Economia. p. 384

8.6) Nova York, Boston e o Vale do Silcio na Califrnia esto entre as regies que
apresentam os maiores salrios no setor de tecnologia nos Estados Unidos. Os dados
amostrais seguintes apresentam os salrios anuais individuais expressos em milhares de
dlares:
Nova York
82
79
72
89
79
85

Boston
85
80
74
78
75
80
86
74

Vale do Silcio
82
91
94
88
85

Tabela 8.10 Salrios anuais em cada regio

Use = 0,05, teste as diferenas de significncia entre a mdia populacional de salrios


no setor de tecnologia correspondentes a essas trs localidades. Se existe diferena, qual
localidade parece ter a mdia de salrio mais elevada para o setor de tecnologia?

52

Resposta: Fc = 4,99. Rejeita-se a hiptese nula de que as mdias entre as trs localidades sejam
iguais. A localidade com mdia de salrio mais elevada o Vale do Silcio.
Anderson, Sweeney e Williams (2002). Estatstica aplicada Administrao e Economia. p. 384

8.7) Os dados referentes s quantidades de clcio (parte mdia por milho) de gua
medidas em trs locais ao longo do rio So Francisco esto apresentados na tabela
abaixo:
Local 1
Local 2
Local 3

42
37
32

37
40
28

41
39
34

39
38
32

43
41
30

41
39
33

Tabela 8.11 Quantidade de clcio na gua

Efetue uma anlise de varincia para testar, ao nvel de significncia de 0,01, se as


diferenas entre as mdias obtidas nos trs locais so significativas.
Resposta: Fc = 36,71. Rejeita-se a hiptese nula de que as mdias sejam iguais.

8.8) Um tcnico de laboratrio quer comparar a resistncia ruptura de trs marcas de


fios, e inicialmente, tinha planejado repetir cada medio seis vezes. Entretanto, no
dispondo de tempo suficiente, ele limita sua anlise aos seguintes resultados (em
quilogramas):
Fio 1
Fio 2
Fio 3

18,0
21,1
16,5

16,4
17,8
17,8

15,7
18,6
16,1

19,6
20,8

16,5
17,9

18,2
19,0

Tabela 8.12 Resistncia ruptura nas trs marcas de fios

Supondo que esses dados constituem amostras aleatrias de trs populaes normais
com o mesmo desvio padro, efetue uma anlise de varincia para testar, ao nvel de =
0,01 de significncia se as diferenas entre as mdias amostrais so significantes.
Resposta: Fc = 4,06. Aceita-se a hiptese nula de que as mdias so iguais, num nvel de
significncia de 0,01.

53

Captulo 9 - REGRESSO LI EAR


O objetivo principal da Anlise de Regresso Linear predizer o valor de uma varivel
(a varivel dependente), dado que seja conhecido o valor de uma varivel associada (a
varivel independente). A equao de regresso a frmula algbrica pela qual se
determina o valor previsto da varivel dependente.

9.1 - Mtodo dos Mnimos Quadrados


O Mtodo dos Mnimos Quadrados serve para ajustar uma linha de regresso
Y = a + bX
Sendo b =

p qb
no J a
a  ap

e a = rb sfb

Uma vez que tenha sido formulada a equao de regresso, pode-se utiliza-la para
estimar o valor da varivel dependente, dado o valor da varivel independente.

9.2 - Coeficiente de Determinao


O coeficiente de determinao indica a proporo da varincia na varivel dependente
que estatisticamente explicada pela equao de regresso (isto , pelo conhecimento
da varivel independente associada a X).
r2 =

t o 1 u no J qb
q  qb

9.3 - Coeficiente de Correlao


O sinal de coeficiente de correlao indica a direo da relao entre X e Y, enquanto o
valor absoluto do coeficiente indica a extenso da relao.
r = (sinal de b) v

54

Exerccios
9.1) A tabela abaixo apresenta dados de amostra referentes ao nmero de horas de
estudo fora de classe para determinados alunos de um curso de Estatstica de trs
semanas, bem como os graus obtidos em um exame aplicado no fim do curso.
Estudante amostrado
Horas de estudo, X
Grau no exame, Y

1
20
64

2
16
61

3
34
84

4
23
70

5
27
88

6
32
92

7
18
72

8
22
77

Tabela 9.1- Nmeros de horas de estudo fora da classe, Grau obtido no exame

Pede-se: (a) Determinar a equao de regresso para predizer o grau no exame, dado o
nmero de horas de estudo, e traar a linha de regresso no diagrama de disperso.
(b) Utilizar a equao de regresso para estimar o grau no exame obtido por um
estudante que dedicou 30 horas de estudo fora de classe.
Resposta: (a) Y = 40 + 1,5X ; (b) Yx = 85
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. P. 312

9.2) Suponha que um analista toma uma amostra aleatria de 10 carregamentos recentes
por caminho feitos por uma companhia e anota a distncia em quilmentros e o tempo
de entrega ao meio-dia mais prximo. Os dados so verificados na tabela:
Carregamento
amostrado
Distncia em km,
X
Tempo de entrega
em dias, Y

10

825

215

1070

550

480

920

1350

325

670

1215

3,5

1,0

4,0

2,0

1,0

3,0

4,5

1,5

3,0

5,0

Tabela 9.2 Distncia, Tempo de entrega

Desenhe o diagrama de disperso para os dados acima e obtenha a equao da reta


correspondente.
Resposta: Y = 0,11 + 0,0036X
Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao. P. 307

9.3)
Idade
Presso

56
147

42
125

72
160

36
118

63
149

47
128

55
150

49
145

38
115

42
140

68
152

60
155

Tabela 9.3 Idade, Presso sangunea

A tabela mostra idade e presso sangunea, correspondentes a uma amostra de 12


mulheres. Determine:
55

a)
b)
c)
d)

O coeficiente de correlao entre X e Y.


A reta de regresso linear de Y em X.
A presso sangunea de uma mulher de 45 anos de idade.
Calcule r e interprete.

Resposta: (a) r = 0,8961; (b) Y = 80,7777 + 1,1380X; (c) X = 45, Y = 131,988; (d) r =0,8029

9.4) Um gerente de vendas reuniu os seguintes dados considerando os anos de


experincia e as vendas anuais:
Vendedor
1
2
3
4
5
6
7
8
9
10

Anos de Experincia
1
3
4
4
6
8
10
10
11
13

Vendas anuais ($1000)


80
97
92
102
103
111
119
123
117
136

Tabela 9.4 Anos de experincia, Vendas anuais

a) Desenhe o diagrama de disperso para os dados acima, com os anos de


experincia como a varivel independente.
b) Determine a equao da reta de regresso linear e use essa equao para prever
as vendas anuais para um vendedor com nove anos de experincia.
Resposta: Y = 80 + 4X; Para X = 9, temos Y = 116
Anderson, Sweeney e Williams (2002). Estatstica aplicada Administrao e Economia. p. 438

9.5) A altura usualmente funciona como elemento que permite boa previso do peso
para pessoas da mesma idade e sexo. Na lista a seguir so mostrados a idade e o peso de
14 homens de idade entre 19 e 26 anos:
Peso (kg)
Altura (cm)

83,9 99
185 180

63,8 71,3
173 168

65,3 79,6 70,3 69,2


175 183 184 174

56,4 66,2
164 169

88,7 59,7 64,6 78,8


205 161 177 174

Tabela 9.5 Peso, Altura

a) Desenhe o diagrama de disperso para os dados acima.


b) Calcule o coeficiente de correlao correspondente.
c) Suponha que queremos obter um modelo de regresso linear para estimar o peso
de um homem nesta faixa etria. Qual a varivel independente deste modelo?

56

d) Obtenha a equao da reta correspondente. Utilizando a equao obtida, estime


o peso de um jovem medindo respectivamente 192 e 150 cm.
Resposta: (b) r = 0,69; (c) X altura, Y peso; (d) Reta de regresso: Y = -60,6216 + 0,7547X. Para
X = 192, temos Y = 84,2718 e para X = 150, temos Y = 52,5764

9.6) Uma importante aplicao da anlise de regresso na contabilidade a estimao


do custo. Ao coletar dados sobre volume e custo e usar o mtodo dos mnimos
quadrados para desenvolver uma regresso estimada relacionando volume e custo, um
contador pode estimar o custo associado a um volume de manufatura em particular.
Considere a seguinte amostra de volumes de produo e os dados de custos totais
referente a uma operao de manufatura:
Volume de produo
(unidades)
400
450
550
600
700
750

Custos totais (R$)


4000
5000
5400
5900
6400
7000

Tabela 9.6 Volume de produo, Custos totais

a) Com esses dados desenvolva uma equao de regresso estimada que possa ser
usada para prever o custo total de determinado volume de produo.
b) Calcule o coeficiente de determinao.
c) O programa de produo da empresa mostra que 500 unidades devem ser
produzidas no prximo ms. Qual o custo total estimado para essa operao?
Resposta: (a) Y = 1247,24 + 7,60X; (b) r = 0,9587; (c) Para X = 500, temos Y = 5047,24
Anderson, Sweeney e Williams (2002). Estatstica aplicada Administrao e Economia. p. 446

57

9.7) Certa empresa, estudando a variao da demanda de seu produto em relao


variao de preo de venda, obteve a tabela:
Preo (X)
38
42
50
56
59
63
70
80
95
110

Demanda (Y)
350
325
297
270
256
246
238
223
215
208
Tabela 9.7 - Preo, Demanda

a)
b)
c)
d)
e)

Determine o coeficiente de correlao.


Estabelea a equao da reta ajustada.
Verifique a qualidade da reta ajustada.
Estime o valor da demanda para um preo de X = 60.
Monte a tabela ANOVA.

Resposta: (a) r = -0,90; (b) Y = -1,87X + 386,78; (c) r = 0,81; (d) Para X =60, temos Y = 274,58

58

Apndice

Tabela 1 Distribuio Normal - Padro

59

Apndice

Anderson, Sweeney e Williams (2002). Estatstica aplicada Administrao e Economia. p. 532

60

Apndice

Anderson, Sweeney e Williams (2002). Estatstica aplicada Administrao e Economia. p. 533

61

Apndice

Anderson, Sweeney e Williams (2002). Estatstica aplicada Administrao e Economia. p. 534

62

Apndice

63

Apndice

64

Apndice
Tabela 4 Distribuio F

65

Apndice
Tabela 4 Distribuio F

66

BIBLIOGRAFIA

Anderson, Sweeney e Williams (2002). Estatstica aplicada Administrao e


Economia. Editora Pioneira Thomson Learning

Kazmier, Leonard J. (2004). Estatstica aplicada Economia e Administrao.


Editora Pearson Education do Brasil.

Da Silva, E.M., Da Silva, E.M., Gonalves, V., Murolo, A.C. (1997). Estatstica
para os cursos de Economia, Administrao, Cincias Contbeis. Editora Atlas.

Barbetta, P. A., Reis, M. M., Bornia, A.C. (2010). Estatstica para Cursos de
Engenharia e Informtica. Editora Atlas.

Christo, Eliane da Silva. Notas de aula e lista de exerccio de Estatstica II

Meza, Ldia ngulo. Lista de exerccios de Estatstica II

67

Você também pode gostar