Você está na página 1de 172

Curso preparatrio para a

prova de Certificao
CQE ASQ
Mdulo: Estatstica II
Instrutor: Paulo Simas
Tecnologia da Informao - UMSA
Maio/2010
Disciplina: Estatstica II
Paulo Afonso Loureno Simas
Engenheiro Mecnico - PUC-BH (1985)
Eng de Qualidade Certificado - CQE-ASQ (2003)
MBA Gesto Empresarial (2007)
paulo.simas@usiminasmecnica.com.br
3829-3766 8395-9961
Usiminas Mecnica (1993-2000)
Especialista de Mtodos e Processos
Usiminas Mecnica ( 2001..)
Analista de Sistemas
Analista de SGI e Auditor nos 4 Sistemas
SGQ; SGMA; SGSSO; SGSI
Facilitador CCQ
Escopo Stat:
VI. Quantitative Methods and Tools (43 Questions)

D. Statistical Decision-Making

Point estimates and confidence intervals
Hypothesis testing
Paired-comparison tests
Goodness-of-fit tests
Analysis of variance (ANOVA)
Contingency tables


E. Relationships Between Variables

Linear regression
Simple linear correlation
Time-series analysis
Agenda
Primeiro Dia: 27/05/2010
8:00: Introduo
8:30: Estimativas (medias e
propores)
10:00: Intervalo
10:30: Estimativa (desvio
Padro/varincia)
12:00: Almoo
13:30: Exerccios
14:30 Correo
15:30: Intervalo
16:00: Testes de hipteses
para a mdia e a proporo
Segundo Dia: 28/05/2010
8:00: Testes de hipteses
para 2 mdias/propores
10:00: Intervalo
10:30: Testes de hipteses
para a varincia e Testes de
aderncia e independncia
12:00: Almoo
13:30:Exerccios
14:30: Correo
15:30: Intervalo
16:00: Regresso Linear
Simples
Agenda
Terceiro Dia: 11/06/2009
8:00: Regresso Linear Mltipla
10:00: Intervalo
10:30: Sries Temporais
12:00: Almoo
13:30: Exerccios
15:30: Intervalo
16:00 Correo
1) If an answer is obvious it must be a trick question.
FACT: Just because an answer is obvious to you doesnt mean it is obvious to
everyone.

2) Guessing wrong can hurt your score more than leaving an answer blank.
FACT: There is no penalty for guessing, and you have a 25% chance of getting it right.

3) The passing score for all ASQ exams is 70%.
FACT: The passing score for each ASQ exam is established as a minimum performance
standard during the cut-score process.

4) Taking a section refresher course or buying ASQ exam prep material is a sure
way to pass.
FACT: Section refresher courses and the self-directed products are excellent ways to
prepare for the examinations, but using them does not guarantee that you will pass.

5) If you do poorly on one area of the body of knowledge, you automatically fail the
test.
FACT: Your total score on the examination determines whether you pass or fail, not your
score on any one portion of the test.

6) ASQ limits the number of people who pass.
FACT: Anyone who meets or exceeds the passing score (cut point) passes the
examination. ASQ does not set a passing rate.
Top 10 Myths of Certification

7) The grading of the constructed response portion of the certified quality manager
exam is very subjective.
FACT: The constructed response portion of the exam is designed to test the candidates
ability to respond to realworld situations.

8) It takes a long time to receive exam results.
FACT: ASQ works very hard to provide exam results as quickly as possible and is very
aware that the examinees are anxious to learn whether they have passed or failed.

9) Test questions are deliberately tricky.
FACT: ASQ goes through an extensive process to ensure that examination questions
are as accurate, clear, and concise as possible.

10) I cant learn from my mistakes if I dont get my scored test back.
FACT: Because of its policy to reuse examination questions, ASQ cannot release copies
of the examinations.
Top 10 Myths of Certification

Ingls
Veja como o seu ingls e qual a modalidade mais fcil de usar agora. Eu optei pelo seguinte:
Eu lia o texto escrito em Ingls e pronunciava em Portugus. Uma espcie de traduo simultnea. Durante
os dias que estudamos junto, eu lia o texto dos livros e os outros escutavam. No quiseram ler, pois ficaram
receosos de retardar o processo. Eu achei bom, pois assim aperfeioei mais rpido.

Tempo de estudo
Cada um tem necessidade de uma quantidade de estudo. eu precisei de muito. Aps as aulas, eu
passava os Sbados e Domingos reescrevendo as questes e resolvendo-as, conferindo-as em seguida. Eu
precisava sedimentar novamente os conceitos bsicos de cada disciplina. Fiz 80% dos exerccios do
Stevenson (copiados e resolvidos). Busquei na Internet tudo que dizia respeito ao CQE. Encontrei outros
materiais e usei-os para estudo tambm.

Relax
importante que vocs vejam o limite de cada um. Eu no conseguia estudar aps o expediente.
Ento ia para casa, verificava a situao por l (tenho uma filha que estava com 15 anos e um filho de 10
anos.), rezava o tero com eles, ia para a ginstica, e depois que tudo se acalmava, por volta das 9:00 horas
da noite, eu voltava a estudar um pouco, se achasse que iria render alguma coisa. No se esforcem
demasiadamente, pois o cansao da mente e do estado emocional podem prejudicar muito. O resultado do
estudo, a vida familiar, seu humor e mais.

Sala de estudos
Ns pedimos uma sala reservada para ns a partir de Setembro, sendo que tnhamos esta sala
exclusiva, aonde deixamos a maior parte do material, e vnhamos de segunda a sbado estudar nela. Aos
Sbados, s vezes era necessrio pegar as chaves e informar vigilncia, pois ficvamos sozinhos aqui.
Nosso tempo de estudo variou. Eu tirei frias a partir de 27 de Outubro e misturei com os dias de aula,
ficando at a segunda-feira aps a prova por conta. Outros obtiveram 1 ms de liberao da chefia. Outros
conseguiram frias de 15 dias antes da prova. E outros nada.
Estudos para o CQE
Simulados
Devem ser feitos no dia marcado, no horrio marcado. No fiquem adiando. No busquem os
simulados dos anos anteriores. Como isto trabalho voluntrio, em horrios extras, os simulados tm muitas
questes repetidas de um ano para outro. Venham para o simulado, para us-lo como experincia. Vocs
tero que ler as questes, entend-las, resolv-las e marcar o gabarito. Se vocs j tiverem os resultados ou
resolvidos esses simulados, eles no expressaro a condio real da prova, e vocs tero resultados menos
realistas. Aps os simulados no existe condies psicolgicas de se continuar a estudar, o ideal ir
descansar.

Simulados Extras
Eles preparam 3 simulados. Ns fizemos 5. Os dois extras foram feitos buscando-se mais
informaes, questes que outras turmas haviam preparado, e simulado da ABCQ. O problema foi no
simulado de outra turma, anterior nossa, que baixaram da internet as questes do site da ASQ, sendo que
tinham questes de CRE, CQM, CQA e CQE. Com isto, tivemos um tempo de preocupao (desespero)
quando vimos questes to difceis para os estudos que estvamos fazendo. Tragam o material para os
simulados, pois vocs devem aprender a us-lo e o que eles contm.

Gabarito
Minha turma foi quase unnime em marcar o gabarito enquanto resolvia a prova. Foi uma
experincia vlida, porm este sistema foi adotado deste os simulados.
Estudos para o CQE
Material
Resumos, livros, dicionrios. Aps os estudos, por volta de Outubro, comecem a fazer seus
resumos. Podem utilizar-se de resumos de outros, mas importante que vocs faam os prprios. Cada um
tem sua dificuldade ou facilidade. O resumo de um pode parecer bobagem para uns e no ser entendido por
outros. Se forem fazer o dicionrio, faam os prprios dicionrios. Existem palavras que a gente l 2 ou 3
vezes e aprende, existem palavras que a gente l uma infinidade de vezes e depois se desespera escreve
para todo lado e acaba aprendendo e existem palavras que por mais que a gente se desespera, jamais
aprende. Volto a repetir, cada um tem a sua dificuldade ou facilidade.
(Ns tnhamos: Foundations, Pizdek, Primer, Questes da ABCQ, Stevenson)

Calculadora
Tenham uma calculadora boa em mos. No necessrio nada sofisticado. Precisa ser Cientfica
e ter funes Estatsticas. O uso na prova pouco, porm de grande valia se ela tiver as funes para
acelerar/facilitar os resultados. No permitido uso de calculadora programvel. Vejam com o Paulo Rogrio
sobre o uso de tais calculadoras com antecedncia. muito importante que vocs arrumem a calculadora
com bastante antecedncia, pois precisam estar acostumados com ela para us-la no dia.
Estudos para o CQE
Bibliografia
ASQs FOUNDATIONS IN QUALITY

JURANS QUALITY HANDBOOK
1 Parte:

Introduo

Estimativas (Mdias e Propores)

Estimativas (Desvio Padro/Varincia)
Slide 12








Clculo das Probabilidades
Grandes reas da Estatstica
Coleta de Dados
Estatstica
Descritiva
Estatstica
Inferencial
Organizao
Apresentao
Sintetizao
Mtodos para
tomada de
decises
Amostragem
Planejamento de
Experimentos
QUESTES
At que ponto, podemos confiar nos resultados ou estimativas de
estatsticas amostrais?
Qual o tamanho ideal ou mnimo para uma amostra representativa?
Precisamos de mecanismos para quantificar em quanto podemos acreditar
no resultados de uma amostra!
Grau de confiana
Tamanho da amostra
Estimativa
Preciso
Distribuio Amostral da Mdia:
Mdia
1 1 2 2 4 2,25
2 5 3 3 6 4,25
3 2 4 4 3 3,25
4 9 8 5 9 7,75
5 4 0 1 0 1,25
6 2 3 4 2 2,75
7 4 5 6 7 5,5
8 5 6 8 9 7
9 8 6 6 5 6,25
10 9 6 7 8 7,5
11 0 2 8 0 2,5
12 8 8 4 8 7
13 9 9 7 8 8,25
14 8 7 4 5 6
15 9 6 4 2 5,25
16 3 7 9 4 5,75
17 3 1 2 2 2
18 2 4 4 6 4
19 8 9 3 4 6
20 2 7 9 7 6,25
21 3 3 4 5 3,75
22 3 6 7 8 6
23 9 8 9 6 8
24 3 0 1 2 1,5
25 7 9 6 8 7,5
Amostras aleatrias
0 1 2 3 4 5 6 7
f
r
e
q
u

n
c
i
a

8 9
Distribuio dos 100 dados
f(x)
1

X
Distribuio amostral das 25 mdias
TEOREMA CENTRAL DO LIMITE
Na medida em que o tamanho da amostra aumenta, a distribuio
amostral das mdias amostrais tende para uma distribuio
normal;
Populao
original
Mdias
amostrais
n=5
Mdias
amostrais
n=30
Compreendendo o Teorema Central do Limite...
Uma varivel x pode
possuir uma distribuio
normal ou no, com mdia
() e desvio-padro (o).
Se amostras de tamanho (n)
so extradas aleatoriamente
dessa populao.
Na medida em que o tamanho
da amostra aumenta, a
distribuio das mdias
amostrais tende para uma
distribuio normal.
n
x
o
o =
Neste caso, a mdia das
mdias amostrais ser a
mdia da populao E
o desvio-padro das mdias
amostrais chamado de
erro padro, dado por:
X

O Teorema Central do Limite em projeto de elevadores


Em projetos de elevadores fundamental considerar o
peso das pessoas para que no haja sobrecarga e
futuras falhas. Dado que a populao brasileira tem
peso distribudo normalmente entre 72 kg e d.p. 12 kg,
determine a probabilidade de que:
a) uma pessoa escolhida aleatoriamente pese mais de
78 kg.
6915 , 0
50 , 0
12
72 78 X
z
z
= |
=

=
o

=
Logo, a probabilidade de uma pessoa pesar
mais de 78 kg de 30,85%.
b) Levando em considerao que uma empresa desenvolveu
um elevador de grande porte (25 pessoas) e a capacidade
mxima de carga de 1950Kg. Qual a probabilidade de que
25 pessoas que entrem aleatoriamente no elevador, ao
mesmo tempo, propiciem um peso mdio maior que 78kg?
Agora estamos lidando com a mdia para um grupo de 25 valores, e no
mais com um valor individual.
kg
X
72 = =
4 , 2
25
12
= = =
n
X
o
o
50 , 2
4 , 2
72 78
=

=
x
X
x
Z
o

99379 , 0 =
z
|
Logo, a probabilidade ser de 0,62%.
Concluses sobre o Teorema Central do Limite.
O Teorema Central do Limite demonstra que se n grande (n>30) a
distribuio amostral das mdias ser aproximadamente normal,
qualquer que seja a varivel x;
Se a prpria distribuio original tem distribuio normal, ento as
mdias amostrais tero distribuio normal para qualquer tamanho
amostral (n).
No caso de amostragem sem reposio ou quando o tamanho n da
amostra superior a 5% do tamanho N da populao finita, ajustamos o
erro-padro da mdia amostral para:
1
.

=
N
n N
n
X
o
o
Um estimador uma estatstica amostral utilizada para obter uma
aproximao de um parmetro populacional. Uma estimativa um valor
especfico, ou um intervalo de valores, usado para aproximar um
parmetro populacional.
Estimadores
Estimativa pontual Estimativa intervalar
um valor nico (nmero)
usado para aproximar um
parmetro populacional
Intervalo que tem uma
probabilidade de conter o
verdadeiro valor da
populao.
Intervalo de Confiana para Mdia:
ESTIMADOR
ESTIMATIVA INTERVALAR (Intervalo de confiana)
Fornece uma faixa de possveis valores que o parmetro de interesse (u) pode
assumir, com um grau de confiana conhecido.
O grau de confiana a probabilidade
(1-o) expressa em valor percentual do
intervalo de confiana conter o
verdadeiro valor do parmetro
populacional.
X
0
Z
-1,96 -1,96
o/2=0,025
o/2=0,025
Grau de confiana de 95%
Para um grau de confiana
95%, o valor crtico de
igual a 1,96
2
o
Z
Um Intervalo de confiana uma amplitude de valores que tem a probabilidade de
conter o verdadeiro valor da populao.
Interpretao do conceito de intervalo de confiana para uma
X
50
40 30 20 80 70 60
Nmero da
amostra
1
2
3
4
...
45
46
47
...
98
99
100
=50
Se em um estudo, forem
retiradas vrias
amostras aleatrias de
tamanho n da populao
e que, para cada
amostra, seja construdo
um intervalo de 100(1-o)
de confiana para u.
Os intervalos obtidos
sero diferentes, mas
100(1-o)% destes
intervalos contero entre
os seus intervalos o
valor verdadeiro do
parmetro.
Intervalo de Confiana de uma Mdia populacional
(Grandes amostras n>30 ou quando o conhecido)
1) Colete uma amostra aleatria de tamanho n>30 da populao ou
uma amostra de qualquer tamanho se o conhecido;
2) Calcule os valores de e (os).
3) Determine o valor do coeficiente de confiana (1 - o);
4) Encontre o valor de crtico de

5) Calcule a margem de erro (E)

6) Calcule os limites do intervalo de confiana


7) Interprete o resultado obtido.
X
2
o
Z
n
Z x
o
o
.
2

E x E x + < <
n
Z E
o
o
.
2
=
a diferena ou erro mximo provvel (1-o) entre a mdia amostral
observada e a verdadeira mdia populacional . A margem de erro E
tambm chamada de erro mximo da estimativa e pode ser
calculada por:
n
Z E
o
o
.
2
=
Obs.: a frmula da margem de erro exige o conhecimento do desvio-padro
populacional o. Sendo praticamente impossvel termos o valor do o sem ter o valor
da Mdia populacional, podemos substituir o valor de o pelo desvio-padro
amostral s.
n
s
Z E .
2
o
=
Intervalo inferior
Intervalo superior
X
= X E
Margem de erro - Preciso do Intervalo
Um dos principais produtos de uma indstria siderrgica a folha
de flandres. Havia uma preocupao com a possibilidade de
haver um nmero de folhas fora da faixa de especificao de
dureza (LIE = 58,0 HR e LSE = 64,0 HR). A partir desta
informao a empresa decidiu estimar a dureza mdia das folhas
de flandres () coletando uma amostra aleatria de 50 folhas.
61,0 60,2 60,3 60,3 60,0 61,0 60,3
60,0 60,0 60,9 61,0 61,2 59,2 60,9
60,0 60,5 59,8 59,3 61,0 59,6 59,8
59,6 60,1 58,0 59,8 58,9 57,6 58,0
60,5 60,1 61,6 61,1 59,7 58,3 61,6
59,5 59,0 60,3 58,7 59,6 54,2 60,3
61,0 59,7 59,9 59,9 60,0 58,6 59,9
Medidas de dureza (HR) das folhas-de-flandres fabricadas pela
siderrgica
61 , 0
21 , 60
=
=
s
X
Para um grau de confiana de 95%, determine a margem de erro (E) e o intervalo
de confiana para mdia populacional ().
61 , 0
21 , 60
=
=
s
X
Resoluo:
n = 50
n
s
x Z E
2
o
=
Margem de erro:
17 , 0 169 , 0
50
61 , 0
. 96 , 1 = = = E
Grau de confiana de 95% implica em:
1 - o = 95%
o = 5% = 0,05
96 , 1
025 , 0
2
= = Z Z
o
Dados:
E x E x + < <
Intervalo de confiana
17 , 0 21 , 60 17 , 0 21 , 60 + < <
[60,04 ; 60,38]HR
Interpretao:
Se fssemos selecionar muitas
amostras (n=50) da produo de
folhas e construssemos um
intervalo de 95% de confiana para
cada amostra, 95% desses
intervalos conteriam a mdia
populacional .
(Pequenas amostras n s 30 e desvio padro da populao desconhecida)
1) Colete uma amostra aleatria de tamanho n < 30 da populao;
2) Calcule os valores de e s.
3) Determine o valor do coeficiente de confiana (1 - o);
4) Encontre o valor de crtico de

5) Calcule a margem de erro (E)

6) Calcule os limites do intervalo de confiana


7) Interprete o resultado obtido.
X
1 ;
2
n
t
o
n
t x
n
o
o
.
1 ;
2

E x E x + < <
n
t E
n
o
o
.
1 ;
2

=
INTERVALO DE CONFIANA DE MDIA POPULACIONAL
O conceito de nvel de confiana pode ser utilizado para o clculo do
tamanho da amostra, necessrio para fazermos inferncias confiveis.
Se a amostra empregada for muito pequena, a
margem de erro ser grande, o que
impossibilita ou inviabiliza a tomada de deciso.
Por outro lado, se a amostra for muito grande,
o intervalo obtido pode ser mais estreito do que
o necessrio. (gastos desnecessrios);
Como o tamanho
da amostra afeta o
erro de
amostragem?
2
2 /
.
|
.
|

\
|
=
E
s Z
n
o
n
s
Z E .
2
o
=
CLCULO DO TAMANHO DA AMOSTRA:
500 1000 1500 2000
2500 3000
Tamanho da amostra
M
a
r
g
e
m

d
e

e
r
r
o

(
E
)


0,5
1
1,5
3
2
2,5
Tamanho de amostra e margens de erro
mantendo fixos (S=10 e 95% de confiana)
Os ganhos em preciso conseguidos com aumentos fixos dos tamanhos das
amostras no so constantes;
Tamanho de amostra 5.000 podem ser um perda de tempo e dinheiro porque
elas fornecem pouca preciso adicional;
Em um estudo para a determinao do perfil dos veteranos de uma Faculdade, a
caracterstica de maior interesse tem s=0,3. Qual deve ser o tamanho da amostra
para que tenhamos 95% de confiana em que o erro da estimativa da
correspondente a esta caracterstica no supere 0,05?
2
2 /
.
|
.
|

\
|
=
E
s Z
n
o
139
05 , 0
) 3 , 0 ).( 96 , 1 ( .
2
2
2 /
= |
.
|

\
|
=
|
.
|

\
|
=
E
s Z
n
o
E = 0,05
s = 0,3
o =0,05
Refaa o clculo supondo que se deseja ter 98% de confiana.
PROPORO
A estimativa de propores populacionais muito semelhante de
mdias populacionais;
Estimadores
Estimativa pontual de uma
proporo
Estimativa intervalar de
uma proporo
21% das peas defeituosa;
45% dos eleitores votariam
novamente no Presidente Lula
Entre 18 e 23% das peas so
defeituosas;
A proporo de votos para
reeleio do Presidente est
entre 15 a 25%.
A mdia de uma distribuio amostral de propores amostrais
sempre igual a verdadeira proporo da populao.
Intervalo de Confiana para Proporo:
Estimativa pontual
n
X
p =

O estimador da proporo amostral:


Sendo X o nmero de elementos da amostra (n) que
apresenta a caracterstica de estudo;
O erro-padro da estimativa:
n
q p
p EP
.
) ( =
p q

1

=
Sendo:
Suposio: A proporo populacional igual a proporo amostral!
Estimativa intervalar
(

+
n
q p
Z p
n
q p
Z p
.
. ;
.
.
2 2
o o
intervalo de 100(1-o)% de confiana;
supondo amostras grandes (n>40) [aproximao da Binomial para Normal];
Se amostra finita e n > 5% de N:
(

1
.
.
.
2
N
n N
n
q p
Z p
o
Tamanho da amostra
(

=
2
2
2

E
q p
Z n
o
Para o clculo do tamanho da amostra:
Se no tivermos noo do nmero de defeituosos, isto , p desconhecido:
Devemos perceber que p varia de 0 a 1 (de nenhum defeituoso at
100% defeituoso)
21 , 0 q

. p

3 , 0 p

16 , 0 q

. p

2 , 0 p

09 , 0 q

. p

1 , 0 p

0 q

. p

0 p

: para
) p

1 .( p

. p

= ==> =
= ==> =
= ==> =
= ==> =
=
21 , 0 q

. p

7 , 0 p

24 , 0 q

. p

6 , 0 p

25 , 0 q

. p

5 , 0 p

24 , 0 q

. p

4 , 0 p

= ==> =
= ==> =
= ==> =
= ==> =
Assim, consideramos
P = 0,5 por nos
garantir a maior
relao para o
tamanho da amostra
Exemplo:
Nos Estados Unidos, os pesquisadores de opinio so
atormentados por uma diversidade de fatores de confuso, como
secretrias eletrnicas. Em uma pesquisa junto a 1068 americanos,
673 informaram ter secretria eletrnica. Com base nesses
resultados amostrais determine:
a) A estimativa pontual da populao p:
b) a estimativa intervalar de 95% da proporo populacional

630 , 0
1068
673
= = =
n
X
p
0290 , 0
1068
) 370 , 0 ).( 630 , 0 (
. 96 , 1
.
2
= = =
n
q p
Z E
o
659 , 0 601 , 0
0290 , 0 630 , 0 0290 , 0 630 , 0

< <
+ < <
+ < <
p
p
E p p E p
Intervalo
de
confiana
Entre os americanos, a
percentagem daqueles
que possuem secretria
eletrnica estimada em
63%, com uma margem
de erro de + 2,9 pontos
percentuais.
Concluses
Intervalos de confiana so muito mais informativos do que as
estimativas pontuais;
Toda estimativa intervalar est associada a um grau de confiana;
Referncia Bibliogrfica
Triola.; - Introduo a Estatstica
Quando se tem n<30 e no se conhece o desvio-padro da populao
usamos a distribuio t.
1. Uma mquina automtica de suco industrial regulada de modo que
a quantidade suprida de cada vez, tenha distribuio aproximadamente
normal com desvio-padro de 35ml. Determine um intervalo de 96% de
confiana para a quantidade mdia de toda produo, sabendo que uma
amostra de 30 embalagens teve um contedo mdio de 290 ml.
Exerccios:
2. Uma amostra aleatria de 40 empregados tomada de uma linha de
produo de 500. A mdia de horas-extras trabalhadas por semana
cinco horas com desvio-padro de uma hora. Construa um intervalo de
99% de confiana para a mdia das horas extras trabalhadas para a
toda a linha de produo.
3. Um fabricante de cintos de segurana deseja estimar a probabilidade
dos cintos resistirem a um esforo. Como o teste destrutvel , ele deseja
manter o tamanho da amostra o menor possvel. Determine o nmero de
observaes que devem ser feitas para estimar a probabilidade a menos
de 0,04 com 95% de confiana, se ele cr (baseando-se em experimentos
anteriores) que a percentagem de defeituosos no supere a 6%.
4. Especifique quais so e como influenciam as 3 variveis que
determinam a margem de erro de um intervalo de confiana.
5. Qual o tamanho da amostra necessria para estimar o tempo mdio que
um vendedor de uma loja de mveis gasta com cada cliente, a menos de 2
minutos do verdadeiro valor, para obter um nvel de confiana de 99% de
confiana? Suponha o desvio da populao igual a 12 minutos. (obs.:
sempre arredondamos a resposta para o prximo nmero inteiro superior.)
6. A Polcia Rodoviria faz mensalmente uma pesquisa para avaliar a
velocidade desenvolvida nas rodovias durante o perodo de 2 s 4 horas
da madrugada. Num perodo de observao e em um trecho especfico,
100 carros passaram por um aparelho de radar a uma velocidade mdia de
115 Km/h, com desvio padro de 10 Km/h.
a) Estime a verdadeira mdia (estimativa pontual) da populao;
b) Construa um intervalo de 98% de confiana para a mdia da populao.
7. Uma amostra aleatria de 40 contas no-comerciais na filial de um
banco acusou saldo mdio de R$140,00 com desvio-padro de R$30,00.
a) Construa um intervalo de 95% confiana para a verdadeira mdia.
b) Construa um intervalo de 99% confiana para a verdadeira mdia.
c) A que concluso podemos chegar com os resultados das letras
anteriores?
8. Um grupo de pesquisa de mercado constatou que 25% dos 200
fregueses recentemente entrevistados num grande shopping center de Belo
Horizonte residem a mais de 5 Km deste local.
a) Construa um intervalo de 95% de confiana para a percentagem efetiva
de fregueses que moram a mais de 5 km do Shopping Center;
b) Qual o erro provvel mximo associado ao intervalo?
9. A Biblioteca da faculdade deseja estimar a percentagem de livros de
seu acervo que so publicados at 1995. Qual deve ser o tamanho da
amostra aleatria para se ter 90% de confiana de ficar menos de 5% da
verdadeira proporo?
10. Uma amostra aleatria de 40 homens trabalhando num grande projeto
de construo revelou que 6 homens no estavam usando capacetes
protetores. Construa um intervalo de 98% confiana dos que no esto
usando capacetes nesse projeto.
INTERVALO DE TOLERNCIA
Limites de Tolerncia so similares a Capabilidade de
Processo, isto , eles mostram os limites prticos de
variabilidade do processo e portanto podem ser valiosas
informaes na determinao dos limites de tolerncia na
engenharia.
Existem dois tipos de determinao dos limites de tolerncia:
-Os que assumem a distribuio Normal
-Os que no requerem qualquer distribuio.


Intervalo de Tolerncia:
Intervalo de Tolerncia:
Mtodo Distribuio Frmula dos limites
Amostra de n elementos sabendo-
se a mdia e o desvio padro
Normal
Amostra de n elementos sabendo-
se a mdia e o range
Normal
N amostras de n elementos cada
uma e sabendo-se a mdia das
mdias e o range
Normal
Definida a proporo da populao,
e amostra de n observando o maior
e o menor valores
Nenhuma A probabilidade que ao
menos P% da populao
estar entre os extremos
amostrais
R K x
1

Ks x
R K x
2

Identificao de K, K
1
e K
2
:

Fazer uso das tabelas de Fatores de Tolerncia para
Distribuio Normal (Juran, Apndice II, Tabelas U, V e W)



Intervalo de Tolerncia:
INTERVALO DE TOLERNCIA
Alguns valores de K (proporo populacional 95% e nvel de
confiana 95%)
n One Sided K Two Sided K
3 9.916 7.655
4 6.370 5.145
5 5.079 4.202
6 4.414 3.707
7 4.007 3.399
8 3.732 3.188
9 3.532 3.031
10 3.379 2.911
11 3.259 2.815
12 3.162 2.736
13 3.081 2.670
14 3.012 2.614
15 2.954 2.566
INTERVALO DE CONFIANA PARA A VARINCIA
A varincia amostral s
2
a melhor estimativa pontual da varincia
populacional o
2
(populao normal).
Embora s
2
seja a melhor estimativa pontual de o
2
, no h indicao
de quo bom realmente seja. Para compensar esta deficincia,
estabelecemos uma estimativa intervalar mais reveladora:





Lembrete: a distribuio Qui-Quadrado no simtrica!!!!
2
2
2
2
2
) 1 ( ) 1 (
E D
s n s n
_
o
_

s s

INTERVALO DE CONFIANA PARA O DESVIO PADRO


O intervalo de confiana para o desvio padro dado pela raiz
quadrada de cada componente do intervalo de confiana da varincia.
2
E
2
2
D
2
s ) 1 n ( s ) 1 n (
_

s o s
_

Exemplo:
A varincia amostral para um conjunto de 25
amostras foi calculado ser 36. Calcule o
intervalo de 90% de confiana para a varincia
populacional.

Slide 49
38 , 62 72 , 23
85 , 13
36 ) 1 25 (
42 , 36
36 ) 1 25 (
s ) 1 n ( s ) 1 n (
2
2
2
2
2
2
2
1 n , 2 / 1 1 n , 2 /
s o s

s o s

_

s o s
_

o o
95 , 0 2 / 1
05 , 0 2 /
25 n
36 s
2
= o
= o
=
=
Exerccios: Folha 1
Slide 50
2 Parte:

Testes de hipteses para a mdia e a
proporo
Slide 51
TESTE DE HIPTESE
Hiptese, em estatstica, uma afirmao sobre uma propriedade
(parmetro) de uma populao.
O objetivo da estimao
estimar (calcular) algum
parmetro populacional.
O objetivo do teste de hiptese
decidir se determinada
afirmao sobre um parmetro
populacional verdadeira.
Inferncia estatstica
Inspeciona-se uma amostra de 142 peas de uma grande remessa,
encontrando-se 8% de peas defeituosas. O fornecedor garante que
no haver mais de 6% de peas defeituosas em cada remessa. O
que devemos responder com o auxlio do teste de hiptese se a
afirmao do fornecedor verdadeira !
O problema:
Teste de Hiptese:
Estabelecer a hiptese nula ( pressupem-
se que no h diferena entre o que se
afirma e que realmente acontece).
Hiptese Nula
o
H Hiptese Alternativa
1
H
a afirmao que deve ser verdadeira
se a hiptese nula falsa.
A forma simblica de uma
hiptese nula pode ser:
>
s
=

:
:
:
o
o
o
H
H
H
Algum valor

Algum valor

Algum valor
A forma simblica de uma
hiptese alternativa pode ser:
<
>
=

:
:
:
1
1
1
H
H
H
Algum valor

Algum valor

Algum valor
ESTABELECENDO HIPTESES:
Se o leitor ou consumidor est fazendo a
pesquisa e deseja usar o teste de hiptese
para apoiar sua afirmao, ento essa
afirmao deve ser formulada de maneira
que se torne a hiptese alternativa, no
podendo assim, conter a situao de
igualdade!

A Hiptese alternativa

Hiptese de pesquisa
3 : =
o
H
3 :
1
= H
A Telemar afirma que pelo menos 88%
dos telefones pblicos em Belo Horizonte
esto em bom estado.
88 , 0 : > p H
o
Um fabricante de pneu alega que seus
pneus suportam 64 mil Km no mnimo.
000 . 64 : >
o
H
000 . 64 :
1
< H
88 , 0 :
1
< p H
O tempo mdio para fazer um teste
crtico para a gesto de custos de um
grande laboratrio. Supem-se que um
certo tipo de teste pode ser feito em trs
minutos.
Hipteses
EXEMPLOS DE HIPTESES NULAS E ALTERNATIVAS
O teste consiste em verificar se uma estatstica amostral observada
pode razoavelmente provir de uma populao com um parmetro
alegado;
X
0
Z
Estatsticas amostrais como
esta so bastante provveis se
Ho verdadeira;
Estatsticas amostrais como
esta so bastante
improvveis se Ho
verdadeira;
CARACTERSTICAS DE UM TESTE DE HIPTESE:
Inspeciona-se uma amostra de 142 peas de uma grande remessa,
encontrando-se 8% de peas defeituosas. O fornecedor garante
que no haver mais de 6% de peas defeituosas em cada
remessa. O que devemos responder com o auxlio do teste de
hiptese se a afirmao do fornecedor verdadeira !
O problema:
n
q p
p EP
.
) ( = 02 , 0
142
) 94 , 0 ).( 06 , 0 (
) ( = = p EP
% 6 : s p H
o
% 6 :
1
> p H
0 , 1
02 , 0
06 , 0 08 , 0
.

+ =

=
n
q p
p p
Z
0,1587
f(x)
X 0,08
0 1
Z
A probabilidade de obter uma discrepncia
superior a 8% com uma amostra de 142 de
uma populao com 6% de cerca de 16%;
ENTENDENDO A BASE DO TESTE DE HIPTESE:
Assim podemos dizer:
Isto pode sugerir que a discrepncia pode ser devida apenas ao acaso, mas no
podemos afirmar, em definitivo, que a populao tenha realmente uma
percentagem de 6% de defeituosos. Em vista da distribuio amostral de tal
populao e da estatstica observada, podemos afirmar que a afirmativa parece
verdadeira.
Suponhamos agora que tivssemos
encontrado uma proporo amostral,
digamos de 19%.
5 , 6
02 , 0
06 , 0 19 , 0
+ =

=
x
p p
Z
o
f(x)
X
0 6,5
Z
A probabilidade pequena. Assim, parece
pouco provvel que tal estatstica amostral
provenha de uma populao com um
parmetro com populao alegada de 6%.
Procedimentos para o teste de hiptese de uma e p:
1- Formular as hipteses nula e alternativa colocando-as na forma simblica;
Obs.:Das duas expresses, a hiptese nula (Ho) a que contm a condio
de igualdade. A hiptese alternativa (H1) e a outra afirmao;
2- Escolher o nvel de significncia (o) com base na gravidade do erro tipo 1.
Tomar um valor de (o) pequeno se as consequncias da rejeio de uma Ho
verdadeira so srias. (valores comuns para o: 0,05 e 0,01);
4- Determinar a estatstica de teste. Incluir a estatstica de teste no grfico;
5- Rejeitar Ho se a estatstica de teste esta na regio crtica. No rejeitar Ho se a
estatstica de teste no est na regio crtica;
6- Formule a deciso estatstica em termos do problema original.
3- Determinar os valores crticos e a regio crtica. Esboar um grfico e incluir
os valores crticos e a regio crtica;
Conceitos importante para o Teste de Hiptese:
Estatstica de teste = uma estatstica amostral da mdia ou da
proporo;
Regio Crtica = o conjunto de todos os valores da estatstica
de teste que levam rejeio da hiptese nula;
Valor Crtico = O valor crtico e o valor ou valores que separa(m)
a regio crtica dos valores da estatstica de teste que no levam a
rejeio da hiptese nula;
Regio Crtica e o nvel de significncia num teste bilateral
No rejeitamos Ho
Rejeitamos Ho Rejeitamos Ho
Regio Crtica
Regio Crtica
o/2
o/2 0
Decidimos rejeitar
a hiptese nula
No rejeitamos a
hiptese nula
A hiptese nula
verdadeira
A hiptese nula
falsa
Erro tipo I (o)
Erro tipo II (|)
Ok
Ok
Erros do tipo: I e II
O valor verdadeiro na realidade
A probabilidade de um erro tipo I acontecer igual ao nvel de significncia (o) de
um teste de hiptese. Valores comuns predeterminados: (o=0,05 e o=0,01)
(o) nvel de significncia ou a
probabilidade do erro tipo I
(|) nvel de significncia ou a
probabilidade do erro tipo II
Erro Tipo I: Risco do Produtor
Teste Bilateral = quando a regio crtica est situada nas duas regies
extremas (caudas) sob a curva;
o/2 o/2
Teste Unilateral a esquerda =
quando a regio crtica est situada na
extrema esquerda sob a curva;
o
Teste Unilateral a direita =
quando a regio crtica est situada
na extrema direita sob a curva;
o
Erro Tipo II: Risco do Consumidor
Exemplo de um Teste de Hiptese Para Mdia
Um fabricante de pneu americano alega que seus pneus suportam
uma quilometragem de 40.000 milhas no mnimo. Suponhamos que
os resultados de um teste tenham sido: amostra n=49, mdia
amostral 38.000 milhas. Sabe-se que quilometragem de todos os
pneus tem desvio-padro de 3.500 milhas. Realize o teste de
hiptese para testar a afirmao do fabricante.
000 . 40 :
1
< H
000 . 40 : >
o
H
500
49
500 . 3
= = =
n
X
o
o
0 , 4
500
000 . 40 000 . 38
=

=
x
X
x
Z
o

Adotando: (o=0,05) temos que Z = - 1,65


Portanto a Ho deve ser rejeitada se:
Z < Z0,05
Single Sample Test
X
0 -4,0
Z
-1,65
1- O valor de Z = - 4,0 menor que
-1,65 , o que rejeitaria a hiptese nula;
CONCLUSES
2- A evidncias suficientes para garantir
a rejeio da afirmao que a mdia
maior ou igual 40 mil Milhas
3- Poderemos, estar correndo um erro
tipo I. No h maneiras de se estar
absolutamente certo se Ho verdadeiro
ou no.
Qual a verdadeira mdia dos pneus?
- Uma forma de responder a
esta pergunta usar os dados
amostrais para estimar a mdia
da quilometragem. Usando um
nvel de confiana de 95%,
temos:
38.000+1,96.(500)
n
X
x
o
. 96 , 1
(38.000+980) milhas
Exemplo para o teste de uma afirmao de uma proporo:
Um estudo sobre a eficcia do air-bag em automveis, constatou
que, em 821 colises com carros de tamanho mdio equipados
com air-bag, 46 resultaram na hospitalizao do motorista. Ao
nvel de significncia de 0,01, teste a afirmao de que a taxa de
hospitalizao nos casos de air-bag inferior taxa de 7,8%.
078 , 0 : > p H
o
078 , 0 :
1
< p H
35 , 2
821
) 922 , 0 ).( 078 , 0 (
078 , 0 05603 , 0
.

=
n
q p
p p
Z
922 , 0 078 , 0 1 1 = = = p q
05603 , 0
821
46
= = p
078 , 0 = p
01 , 0 = o
Implica num valor
crtico de Z= -2,33
A estatstica de teste est dentro da regio crtica.
Rejeitamos Ho. Assim temos evidncias suficientes para
afirmar que a taxa de hospitalizao inferior a 7,8%.
Portanto a Ho deve ser
rejeitada se:
01 , 0
Z Z <
Exemplo para o teste de uma afirmao de uma proporo:
Em um teste de gosto de consumidores, 100 bebedores regulares de
Pepsi recebem amostras cegas de Coca e Pepsi; 48 deles preferiram a
Coca-cola no teste. Se os diretores da Coca-cola afirmam que seu
refrigerante preferido por 50% dos bebedores de Pepsi, teste esta
afirmao ao nvel de significncia de 0,05.
50 , 0 : = p H
o
50 , 0 :
1
= p H
40 , 0
100
) 5 , 0 ).( 5 , 0 (
5 , 0 48 , 0
.

=
n
q p
p p
Z
025 , 0
2
=
o
Implica num valor
crtico de Z
0,025
=+1,96
No h evidencia
suficiente para
rejeitar a afirmao
de que 50 % dos
bebedores de Pepsi
preferem coca
Concluso
Portanto a Ho deve ser
rejeitada se:
025 , 0
Z Z >
025 , 0
Z Z < ou
Z=0
Dados
amostrais
indicam
Z= - 0,4
p=0,5
-1,96 +1,96
48 , 0
100
48
= = p
5 , 0 5 , 0 1 p 1 q = = =
50 , 0 = p
Pontos importantes e concluses:
Para o teste de hiptese da Mdia, o tamanho da amostra (n) sempre deve ser > que
30;
Para o teste de hiptese da Mdia de pequenas amostras, a distribuio t de
student deve ser usada;
Nos testes bilaterais, o nvel de significncia (o) dividido igualmente entre as duas
caudas que constituem regies crticas;
Quando a hiptese alternativa (H1) = de algum valor, temos um teste bilaterais.
Quando H1 tem sinal (>) temos um teste unilateral a direita e quando H1 recebe sinal
(<) temos um teste unilateral a esquerda ;
A interpretao do texto bastante importante na realizao dos experimentos de teste
de hiptese. Se mencionar igual trata-se de uma afirmao nula, se no mencionar,
a afirmao ser a hiptese alternativa;
Exerccios:
1. Um fabricante de fio de arame alega que seu produto tem uma resistncia
mdia ruptura superior a 10 Kg, com desvio padro de 0,5 kg. O INMETRO
resolve testar essa afirmativa, extraindo uma amostra de 50 peas de arame, a
qual acusou resistncia mdia de 10,4 kg. Que concluso o INMETRO pode
chegar?
2. Uma rede de pizzaria compra as peas de salame utilizadas na produo de
pizzas de uma grande indstria produtora de alimentos derivados de carne. Pizzas
de boa qualidade exigem um teor mdio de gordura nas peas de salame igual a
40%. Experincias anteriores com este fornecedor revelam que o teor mdio de
gordura tem variabilidade igual a um d.p. de 2,0%. Um teste com 36 peas de
salame um teor mdio de gordura de 41%. Faa o teste de hiptese adotando
nvel de significncia 0,05.
3. O tempo mdio necessrio para paradas de manuteno de uma certa
mquina copiadora igual a 93 minutos. Uma companhia alega que o seu novo
modelo foi projetado para ter uma manuteno mais fcil e consequentemente
mais rpida. Um teste com 73 mquinas de um novo modelo resultou num tempo
de reparo mdio de 88,8 minutos. Sabendo-se que os arquivos de manuteno
registram um desvio-padro de 26,6 minutos, utilize o nvel de significncia de
(o=0,025) para testar a alegao da companhia.
4. Em uma certa indstria, cerca de 15% dos trabalhadores possuam doenas
provocadas pela radiao. A companhia afirmou ao sindicato que faria a
medicao de seus trabalhadores e depois do tratamento cerca de 140
trabalhadores foram novamente avaliados. Constatou-se cerca de 19
trabalhadores com altos ndices de radiao. Utilize (o=0,025) para checar a
alegao da companhia de que o tratamento teve sucesso.
5. Uma empresa fornece uma grande variedade de parafusos montadora Fiat.
Um dos tipos de parafusos mais importantes utilizados na montagem dos
automveis o de comprimento igual 3,5 polegadas. Para este tipo, o
fornecedor alega que um lote enviado contm parafusos com tamanho mdio
igual 3,5 polegadas e desvio-padro de 0,01 polegada. Voc o diretor
responsvel pelo controle de qualidade de peas de terceiros da FIAT e determina
aos seus estagirios que tirem uma amostra aleatria de 40 parafusos para
verificar o comprimento. O resultado encontrado no teste foi uma mdia de 3,49
polegadas. Utilize um nvel de significncia igual (o=0,05).
6. Um engenheiro de produo recm contratado pela Cera Inglesa deseja
estimar a percentagem do estoque de todos os tipos de produtos que chegaram
na central de distribuio de Belo Horizonte no incio do ano passado e que ainda
no foi distribuda. Qual deve ser o tamanho da amostra aleatria a ser tomada
para se ter 99% de confiana de ficar menos de 3% da verdadeira proporo?
7. Uma amostra aleatria com 69 compradores de novos veculos GOLF mostrou
que a quilometragem mdia percorrida durante o primeiro ano de utilizao do
veculo foi de 7.500 km com desvio-padro de 1150 km.
A) Construa um intervalo de 90% confiana para a verdadeira quilometragem
mdia.
B) Construa um intervalo de 99% confiana para a verdadeira quilometragem
mdia.
C) A que concluso podemos chegar com os resultados das letras anteriores?
8. O tempo mdio, por operrio para executar uma tarefa tem sido igual a 100
minutos, com um desvio padro de 15 minutos. Introduziu-se uma modificao para
diminuir esse tempo, e, aps certo perodo, sorteou-se uma amostra de 36
operrios, medindo-se o tempo de execuo de cada um. O tempo mdio da
amostra foi de 85 minutos. Estes resultados trazem evidncias estatsticas da
melhora desejada?
Exemplos: solues
Slide 74
3 Parte:

Testes de hipteses para 2 mdias /
propores

Testes de hipteses para a varincia e
Testes de aderncia e independncia

Slide 75
Exemplos de Comparaes
Tcnicos de uma
indstria que opera
com duas linhas de
produo desejam
avaliar a similaridade
de produo das
linhas a fim de
identificar possveis
pontos de melhoria
em uma delas;

A rea de marketing
de uma empresa
prestadora de
servios deseja fazer
uma nova pea
publicitria
comparando o
servio prestado ao
das concorrentes.
Teste de Hiptese sobre 2 Mdias Amostrais:
Two Sample Test
Tipos de Amostras
Independentes

se a amostra extrada de
uma das populaes no
tem qualquer relao com
a amostra extrada da
outra populao; como
por exemplo o peso de
Homens e de Mulheres.

H1 M1
H2 M2
H3 M3
Dependentes ou Emparelhadas

quando uma amostra possui
alguma relao com a outra;
como por exemplo o peso do
indivduo antes e aps um
tratamento para
emagrecimento.

H1a H1d
H2a H2d
H3a H3d
Comparao de Duas Mdias
Dados Emparelhados
Dez cobaias (porcos) foram submetidas a um
tratamento com um novo tipo de rao, por um
ms. Deseja-se saber se a nova rao foi efetiva
para o aumento de peso dos animais.
Trata-se de dados emparelhados, pois o que se
pretende medir o peso atual peso anterior de
um mesmo indivduo da populao

depois
-
antes
= A
H
0
: A > 0
H
1
: A < 0
O teste a ser usado ser t de Student:
t = d. - A
s
d
/\n
Porque ?
A distribuio t-Student assemelha-se a distribuio normal
em relao forma, sendo menos alta na regio prxima a
mdia e mais alta nas extremidades, sendo aplicvel para n <
30. A medida que n sobe t tende para z.
Comparao de Duas Mdias
Dados Emparelhados
H
0
: A > 0
H
1
: A < 0
d. = 4.3
S
d
= 4.9
t
calc
= (d.- A) / (S
d
/ \n)
t
calc
= (4.3- 0) / (4.9/ \10)
t
calc
= 2.77
Considerando
o = 0,05 e t
(n-1)
tem-se
t
crtico
= -1.833
Sendo t
calc
>

t
crtico
, no h evidncia para
rejeitar H
0
Antes Aps Diferena
300 315 15
310 312 2
315 320 5
320 320 0
310 313 3
312 315 3
325 330 5
310 307 -3
315 319 4
311 320 9
Mdia 312,8 317,1 4,3
D.P. 6,7 6,2 4,9
Escolha dos Testes
Comparao de
2 mdias
Dados
Emparelhados
H
0
: A = 0
H
1
: A = 0
Calcula-se
t de Student
No
Desconhecidos
o
1
= o
2

Conhecidos
o
1
= o
2

Z = (X
1
-X
2
)
o \(1/n
1
+1/n
2
)
2
) 1 ( ) 1 (
2
2
2
1 2
+
+
=
n m
s m s n
s
|
.
|

\
|
+

=
m n
s
Y X
1 1
.
2
Calcula-se
t como sendo...
Calcula-se t de Student
Usando Aspin-Welch
Sim
Desconhecidos
o
1
= o
2

Comparao de Duas Mdias
Dados No Emparelhados
Dois diferentes mtodos de execuo de uma
tarefa foram testados, resultando nos dados
abaixo, expressos em minutos. Deseja-se saber
se o mtodo 2 mais rpido que o mtodo 1.
Trata-se de dados no emparelhados, e
razovel supor que as varincias sejam iguais.
Comparao de Duas Mdias
Dados No Emparelhados
H
0
: 1 = 2
H
1
: 1 > 2
X
1
= 55, S
1
= 2,7 e n
1
= 5
Y
2
= 53, S
2
= 2,2 e m
2
= 5
S = 2.5
t
calc
= 1.26
Considerando
o = 0,05 e t
(n1+m2-2);0,05
tem-se t
crtico
= 1.86
Sendo t
calc
<

t
crtico
, no h evidncia
para rejeitar H
0
Mtodo 1 Mtodo 2
54 50
55 54
58 56
51 52
57 53
Mdia 55 53
D.P. 2,7 2,2
2
) 1 ( ) 1 (
2
2
2
1
2
+
+
=
n m
s m s n
s
|
.
|

\
|
+

=
m
1
n
1
. s
Y X
t
2
calc
Escolha de t crtico = f(H
1
)
A regio crtica para um teste
com nvel de significncia (o),
depende da hiptese alternativa;
|
.
|

\
|
+

=
m n
s
Y X
T
o
1 1
.
2
2 1 1
: > H
2 ; 0 +
>
m n
t T
o
2 1 1
: < H
2 ; 0 +
<
m n
t T
o
2 1 1
: = H
2 ; 2 / 0 +
>
m n
t T
o
Hiptese alternativa
Regio Crtica
2 ; 2 / 0 +
<
m n
t T
o
Caractersticas do teste de comparao para propores:
Proporo populacional

Tamanho da amostra

Nmero de sucessos na
amostra
proporo amostral
Para a populao 1
1
p
1
n
1
x
1
1
1

n
x
p =
Proporo populacional

Tamanho da amostra

nmero de sucessos na
amostra
proporo amostral
Para a populao 2
2
p
2
n
2
x
2
2
2

n
x
p =
Tm-se dois conjuntos de dados amostrais independentes
escolhidos de maneira aleatria;
Em ambas as amostras verificam-se as condies de:
(Condio para uso da Distribuio Normal) 5 .
5 .
>
>
q n
p n
Teste de hiptese s/ 2 propores amostrais:
Caractersticas do teste de comparao para propores:
O teste de hiptese feito para duas propores populacionais
utiliza a seguinte estimativa combinada do valor comum a p1 e p2 :
2 1
2 1
n n
x x
p
+
+
=
p q =1
Para p1 = p2 tm-se a seguinte
estimativa combinada
A estatstica de teste para duas propores ser igual :
2 1
2 1
. .

n
q p
n
q p
p p
Z
o
+

=
Exemplo da aplicao do teste de hiptese para
comparao de duas propores
Uma empresa nacional de linha branca deseja comparar o
desempenho dos motores fabricados pelo seu fornecedor (1) com o
desempenho dos motores vendidos por um outro fornecedor (2) ao seu
concorrente. A varivel escolhida para a realizao da comparao foi a
proporo de motores que funcionam sem a necessidade de reparos por
um perodo de um ms, quando submetidos a condies especficas de
stress. No estudo foram tomados 100 motores de cada fornecedor,
sendo encontrados: X1=66 e X2=73 motores que funcionaram sem a
necessidade de reparos. A equipe da empresa realizar o teste de
hiptese adotando o nvel de significncia o = 0,05.
1- Estabelecer as Hipteses nula e alternativa:
2 1
: p p H
o
=
2 1 1
: p p H =
A empresa quer comparar o
desempenho dos motores dos dois
fornecedores;
Os parmetros de interesse so as propores de motores dos
fornecedores: p1 e p2 que funcionam sem a necessidade de reparo
2- Determinao do nvel de significncia e da regio crtica:
A partir da tabela de
distribuio normal
padronizada
96 , 1
025 , 0
2
= =
=
Z Z Z
crtico o
Portanto, a Ho deve ser
rejeitada se Z
teste
>1,96
ou Z
teste
<-1,96
3- Verificao se o teste baseado em Z vlido (pr requisito):
4- Determinao da estimativa combinada de p1 e p2:
Amostra 1
5 .
5 .
>
>
q n
p n
5
100
34
. 100
5
100
66
. 100
>
>
Amostra 2
5 .
5 .
>
>
q n
p n
5
100
27
. 100
5
100
73
. 100
>
>
Okkk !!!
695 , 0
100 100
73 66
2 1
2 1
=
+
+
=
+
+
=
n n
x x
p
305 , 0 695 , 0 1 1 = = = p q
5- Determinao da estatstica de teste apropriada:
08 , 1
100
) 305 , 0 ).( 695 , 0 (
100
) 305 , 0 ).( 695 , 0 (
100
73
100
66
. .

2 1
2 1
=
+
+
=
+

=
n
q p
n
q p
p p
Z
teste
6- Decidir se a hiptese nula deve ser rejeitada ou no:
Como Z
teste
= -1,08 no est na regio crtica, no h
evidncia para rejeitar a hiptese nula ao nvel de
significncia de 5%.
No h evidncias para concluir que o desempenho
dos motores produzidos pelo fornecedor 1 diferente
do desempenho do motor produzido pelo fornecedor 2.
Os Engenheiros de Produto da Cervejaria Schincariol querem realizar um
teste para avaliar se os consumidores da Nova Schin do interior de Minas
Gerais e de Belo Horizonte, diferem ou no na proporo de aprovao
da nova cerveja. Para isto, tomou-se uma amostra aleatria de 50
consumidores na capital e 50 consumidores no interior do estado. Na
capital, 18 aprovaram a nova cerveja e no interior apenas 25 aprovaram.
Realize o teste ao nvel de 0,01 de significncia.
1- Estabelecer as Hipteses nula e alternativa:
2 1
: p p H
o
=
2 1 1
: p p H =
A empresa quer comparar se existe
diferena na proporo de aprovao
da nova cerveja.
TESTE DE HIPTESE PARA DUAS PROPORES
2- Determinao do nvel de significncia e da regio crtica:
A partir da tabela de
distribuio normal
padronizada
58 , 2
005 , 0
2
= = = Z Z Z
crtico o
Portanto, a Ho deve ser rejeitada
se Z
teste
>+2,58 ou Z
teste
<-2,58.
3- Verificao se o teste baseado em Z vlido (pr requisito):
Amostra 1
5 .
5 .
>
>
q n
p n
5
50
32
. 50
5
50
18
. 50
>
>
Amostra 2
5 .
5 .
>
>
q n
p n
5
50
25
. 50
5
50
25
. 50
>
>
Okkk !!!
4- Determinao da estimativa combinada de p1 e p2:
43 , 0
50 50
25 18
2 1
2 1
=
+
+
=
+
+
=
n n
x x
p
57 , 0 43 , 0 1 1 = = = p q
5- Determinao da estatstica de teste apropriada:
41 , 1
50
) 57 , 0 ).( 43 , 0 (
50
) 57 , 0 ).( 43 , 0 (
50
25
50
18
. .

2 1
2 1
=
+

=
+

=
n
q p
n
q p
p p
Z
teste
6- Decidir se a hiptese nula deve ser rejeitada ou no:
Como Z
teste
= -1,41 no est na regio crtica, no h
evidncia para rejeitar a hiptese nula ao nvel de
significncia de 1%.
No h evidncias para concluir que haja diferena na
proporo dos consumidores que aprovam a Nova
Schin na capital e no interior.
Testes de Hipteses para a varincia amostral
Estatstica de teste:
Lembrete: A distribuio Qui-Quadrado no simtrica!!!!
2
2
2
) 1 (
o
_
s n
=
Graus de liberdade = n-1
Suposio:
Populao distribuda normalmente
Testes de hipteses para a varincia :
Exemplo:
O departamento de desenvolvimento de ao da R&D tentou
desenvolver uma nova liga de ao com menor variabilidade da
tenso elstica. O departamento da R&D declara que o novo material
ter uma variao de tenso dentro de 4 Sigmas menor ou igual a 60
psi 95% das vezes. Uma amostra de 8 elementos foi testada e
rendeu um desvio padro de 8 psi. Pode uma reduo na variao
da tenso elstica ser validada com 95% de confiana?
Testes de hipteses para a varincia :
2
0
2
0 0
2
0
2
0 0
: H
: H
o < o
o > o
O melhor range de variao esperado 60 psi. Isto nos leva a ter
um sigma de 15 psi (uma aproximao de 4 sigma de largura
acobertado por 95,44% das ocorrncias).
A hiptese nula :
A hiptese alternativa:

A hiptese nula :
A hiptese alternativa:

Testes de hipteses para a varincia :
2 2
0 0
2 2
0 0
15 : H
15 : H
< o
> o
99 , 1
15
8 ) 1 8 (
s ) 1 n (
X
2
2
2
0
2
x 2
=

=
o

=
Da tabela de Qui-quadrado: porque a hiptese alternativa <
este um teste unilateral. Usando gl = n-1 = 7, o valor crtico
para qui-quadrado com 95% de confiana 2,17.
A estatstica de teste calculada :
Testes de hipteses para a varincia :
Uma vez que 1,99 menor que 2,17, ela cai na regio crtica e a
hiptese nula deve ser rejeitada.

Existe evidncia suficiente para rejeitarmos a Hiptese nula.
A declarao do departamento da R&D foi suportada.
Comparao de duas varincias amostrais
Estatstica de teste:
Lembrete: A distribuio F no simtrica!!!!
2
2
2
1
s
s
F =
Graus de liberdade do numerador = n
1
-1
Suposies:
Populaes independentes;
:Ambas distribudas normalmente
Graus de liberdade do denominador = n
2
-1
Exemplo:
Um laboratrio de materiais est estudando o efeito de
envelhecimento de um determinado produto. Eles querem saber se
existe melhoria na consistncia de concentrao aps o
envelhecimento por um ano (assuma um nvel de confiana de 95%).
Os dados obtidos so listados abaixo:
No Incio 1 ano depois
Numero de testes 9 7
Desvio Padro (psi) 900 300
Hiptese Nula:
Hiptese Alternativa:
6 v
8 v
: H
: H
2
1
2
2
2
1 1
2
2
2
1 0
=
=
o > o
o s o
A hiptese alternativa relativa melhoria na variao, portanto
temos um teste unilateral. A partir da distribuio F, ovalor
crtico de F 4,15.
A regio de rejeio da hiptese nula maior ou igual a 4,15.
9
300
900
s
s
F
2
2
2
2
2
1
= = =
Fazendo o clculo da estatstica de teste:

Uma vez que o valor calculado de F est na regio crtica, a
hiptese nula deve ser rejeitada.
Existe evidncia suficiente para indicar a reduo da varincia e
aumento da consistncia da concentrao aps o
envelhecimento por um ano.
TESTE DE ADERNCIA
No teste de aderncia, a hiptese testada refere-se forma da
distribuio da populao.
Este teste baseia-se na estatstica:
_
v
2
2 2
1 1
=

=
= =

( ) O E
E
O
E
n
i i
i
i
i
i
k
i
k
onde:
_
2
v
a estatstica do teste, com v graus de liberdade;
O
i
a frequncia observada de uma determinada classe;
E
i
a frequncia esperada desta classe, segundo o modelo testado =
n
i
p
i
;
n o nmero de elementos da amostra;
k nmero de classes ou valores considerados;
pi probabilidade de se obter um valor da varivel na classe esperada,
segundo o modelo.
Testes de Ajuste Goodness of Fit:
Passos para conduzir um teste de aderncia:
1- Formule as hipteses nula e a alternativa.
2- Se o parmetro da distribuio dada nas hipteses nula e alternativa
no for conhecido, ento deve ser calculado.
3- Calcular a freqncia esperada para cada uma das categorias k
como a distribuio hipottica fosse a distribuio verdadeira.
4- Calcular a estatstica de teste.
5- Rejeite H
0
se o valor calculado for maior que o valor tabelado (ou
seja, no adere ao modelo).


v = k-1-m, onde m o nmero de parmetros do modelo estimados
independentemente a partir da amostra.
_ _
v v o ; ; ; calc
2 2
>
Exemplo:
um dado de jogar honesto e balanceado, fornecidos o nmero de
vezes que cada um dos lados saiu?
Um dado foi jogado 48 vezes com os seguintes resultados:
Face Nmero Sadas Face Nmero Sadas
1 12 2 7
3 2 4 7
5 12 6 8

Quando o dado jogado, a expectativa que cada um dos lados
deveria sair um nmero igual de vezes.
bvio que existiro sadas aleatrias desta expectativa terica uma
vez que o dado seja honesto.
H
0
: as sadas do dado seguem uma distribuio uniforme
H
1
: as sadas do dados no seguem uma distribuio uniforme.
Faces f
e
f
0
(f
e
f
0
)
2
/ f
e
1 8 12 2,000
2 8 7 0,125
3 8 2 4,500
4 8 7 0,125
5 8 12 2,000
6 8 8 0,000
Total 48 48 8,750

=
=

= _
k
1 i
e
2
e 0 2
750 , 8
f
) f f (
O valor do qui-quadrao calculado 8,75. O valor de qui-
quadrado crtico 11,07.
O qui-quadrado calculado no excede o qui-quadrado crtico.
Portanto, a hiptese de um dado honesto seguindo uma
distribuio uniforme no pode ser rejeitada.
As sadas aleatrias a partir de uma expectativa terica
podem tranquilamente ser explicadas pela causa comum.
TESTE DE INDEPENDNCIA
Os testes de independncia so realizados atravs de Tabelas de
Contingncia.
Tabela de contingncia a representao tabular das freqncias
observadas.
Exemplo: 100 pessoas foram entrevistadas sobre um projeto
de lei; o resultado colocado em forma de uma tabela de
contingncia:
Opinio
Sexo Favorvel Desfavorvel Indiferente Totais
Homens 33 12 15 60
Mulheres 7 20 13 40
Totais 40 32 28 100
TESTE DE INDEPENDNCIA
O teste de independncia:
H
0
: as variveis so independentes;
H
1
: as variveis no so independentes.

O teste ser feito usando _2, semelhante ao teste de aderncia.




_
2
v
= a estatstica do teste, com v graus de liberdade;
r = nmero de linhas;
s = nmero de colunas;
Oij = frequncia observada na interseo da linha i com a coluna j;
Eij = frequncia esperada na interseo da linha i com a coluna j;
n = nmero de elementos da amostra.
_
v
2
2
1 1
=

= =

( ) O E
E
ij ij
ij
j
s
i
r
TESTE DE INDEPENDNCIA
Rejeita-se H
0
se _
2
calc
> _
2
crt
.
v = (L-1).(c-1)
macete para clculo do v: na tabela anterior, risque uma
linha e uma coluna, conte o que sobrou


Exerccios: Folha 2

Slide 111
4 Parte:

Regresso Linear Simples

Slide 112
CORRELAO ENTRE DUAS VARIVEIS
Problema: O diretor de vendas de varejo nacional necessita
analisar se h relao entre o investimento em propaganda e as
vendas da empresa. O departamento de vendas preparou uma
tabela com as vendas (em milhes) e os investimentos em
propaganda (em milhes) dos ltimos dez anos.
480 400 270 195 210 470 490 520 335 430 Vendas
25 35 17 8 20 37 42 35 21 30 Propagandas
Objetivo: analisar a possibilidade de definir um modelo que represente a
relao entre as duas variveis.
$
Correlao e regresso linear entre 2 variveis :
EXEMPLOS DE CORRELAO ENTRE DUAS VARIVEIS
A temperatura na cidade pode influenciar as taxas de criminalidade?
Correlao entre a quantidade de acidentes de trabalho numa
construtora e o tempo de experincia do trabalhador!
A Correlao entre a tenso na rede eltrica (volts) e a variao no
corte (mm);
A correlao entre o n. de horas de treinamento em ferramentas da
qualidade e o n. de peas defeituosas produzidas por um trabalhador;
A correlao uma tcnica estatstica que tem por objetivo investigar
se h ou no correlao linear entre duas ou mais variveis;

Existe correlao entre duas variveis quando uma delas est, de
alguma forma, relacionada com a outra;

Os dados analisados num teste de correlao so emparelhados e
aleatrios;

Para estudar o comportamento conjunto de duas variveis X e Y, sero
apresentadas duas tcnicas: o Diagrama de Disperso e o Coeficiente
de Correlao de Pearson.
CORRELAO:
Consiste de um mtodo grfico que ajuda a avaliar se existe ou no
alguma associao (relao) entre as variveis em estudo, mas no nos
fornece o valor numrico dessa relao.
OBJETIVO: Alguma correlao ou relao entre duas variveis
significa: qual alterao devemos esperar em uma das variveis, como
consequncia de alteraes sofridas pela outra varivel;.
y
x
.
.
.
.
.
. .
No h correlao entre x e y
.
.
.
.
.
.
.
.
.
.
y
x
.
.
Correlao no linear entre x e y
.
.
.
. .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
DIAGRAMA DE DISPERSO
INTERPRETAO DO DIAGRAMA DE DISPERSO:
y
x
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Correlao positiva
entre x e y
y
x
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Forte Correlao positiva
entre x e y
y
x
Correlao positiva perfeita entre x e y
.
.
.
.
.
.
.
.
.
.
.
.
.
y
x
. .
Correlao negativa
entre x e y
. .
.
.
. .
. .
.
.
y
x
.
.
Forte Correlao negativa
entre x e y
.
.
.
. . .
.
. .
.
.
.
.
.
y
x
Correlao negativa perfeita entre x e y
.
.
.
.
.
.
.
.
.
.
.
.
.
.
INTERPRETAO DO DIAGRAMA DE DISPERSO:
Diagrama de Disperso:
Grfico 1- Diagrama de disperso das
notas de Estatstica versus
Matemtica
0
2
4
6
8
10
12
0 2 4 6 8 10 12
Notas de Matemtica
N
o
t
a
s

d
e

E
s
t
a
t

s
t
i
c
a
Pode-se notar que as variveis
Notas em Estatstica e Notas em
Matemtica esto correlacionadas
positivamente, isto , medida que
aumenta-se a nota em Matemtica,
aumenta-se tambm a nota em
Estatstica.
3 6 5 9 3 2 9 10 6 7 Estatstica (Y)
2 6 7 8 4 3 10 9 5 6 Matemtica (X)
Exemplo 1: Suponha que dez alunos foram submetidos a um teste de
Estatstica e de Matemtica, obtendo-se as seguintes notas :
EXEMPLO DE DIAGRAMA DE DISPERSO
Exemplo 2: A tabela seguinte fornece o Peso (Kg) de alunos e a respectiva
Altura alcanada no teste de salto em altura (Cm).
51 52 48 54 55 50 Altura (Y)
49 47 51 46 45 50 Peso (X)
O grfico indica que as variveis
Peso e Altura obtida no teste de
salto em altura encontram-se
correlacionadas negativamente, isto
, medida que o peso aumenta, o
valor obtido para o teste de salto
em altura diminui.

Grfico 2- Diagrama de disperso do
peso versus resultado do teste de salto
em altura
47
48
49
50
51
52
53
54
55
56
44 46 48 50 52
Peso (Kg)
A
l
t
u
r
a

(
C
m
)
Observaes importantes e concluses sobre diagramas:
As concluses tiradas de diagramas de disperso tendem a ser
subjetivas, o clculo do coeficiente de correlao linear pode propiciar
uma melhor avaliao do tipo de relacionamento;
OUTLIER - observao extrema, que no condizente com o
restante da massa de dados. Pode ser fruto de um registro incorreto.
Deve ser analisado detalhadamente e eliminado do conjunto;
A existncia de uma correlao entre as variveis consideradas no
implica necessariamente na existncia de uma relao de causa-efeito
entre X e Y;
Construindo diagramas de disperso no software Excel;

O coeficiente de correlao linear r mede o grau (intensidade)
da relacionamento (linear) entre as variveis X e Y em uma
amostra;

Clculo do coeficiente de correlao:




=
2 2 2 2
) ( ) ( ) ( ) (
) )( (
y y n x x n
y x xy n
r
nmero de pares de dados analisados
soma de todos os valores de x e soma de todos os valores de y
elevar cada valor de x ao quadrado e somar os resultados
somamos os valores de x e elevamos o resultado ao quadrado;
multiplicamos cada valor x pelo valor correspondente de y e somamos
os produtos
( )


xy
x
x
y x
n
2
2
,
COEFICIENTE DE CORRELAO
O valor de r est sempre entre 1 e 1;

r mede a intensidade, ou o grau de um relacionamento linear. No
serve para medir a intensidade de um relacionamento no linear.

Se o valor de r estiver prximo de 0, conclumos que no h
correlao linear significativa entre x e y.
Se o valor de r estiver prximo de +1 ou 1, conclumos que h
correlao linear.
PROPRIEDADES DO COEFICIENTE DE CORRELAO
Os pesquisadores tem estudado os ursos,
anestesiando-os a fim de obterem medidas
vitais como idade, peso, comprimento e etc.
Como os usos so bastante pesados e difceis
de serem levantados, os pesquisadores tem
dificuldade em pesar o urso na selva. Ser que
possvel medirmos o peso de um urso a
partir do outras medidas mais fceis?
53 67,5 72 72 73,5 68,5 73 37
80 344 416 348 262 360 332 34 peso (lbs)
Comprimento (in)
Comprimento e pesos de ursos
Resoluo:




=
2 2 2 2
) ( ) ( ) ( ) (
) )( (
y y n x x n
y x xy n
r
nmero de pares de dados analisados
soma de todos os valores de x e soma de todos os valores de y
elevar cada valor de x ao quadrado e somar os resultados
somamos os valores de x e elevamos o resultado ao quadrado;
multiplicamos cada valor x pelo valor correspondente de y e somamos
os produtos
( )


xy
x
x
y x
n
2
2
,
2 2
) 176 . 2 ( ) 520 . 728 ( 8 ) 5 , 516 ( ) 75 , 525 . 34 ( 8
) 2176 ).( 5 , 516 ( ) 879 . 151 ( 8


= r
897 , 0
184 . 093 . 1 75 , 9433
128 . 91
= = r
Interpretao do coeficiente de correlao linear:
Se o valor de r estiver prximo
de 0, conclumos que no h
correlao linear significativa entre
x e y.
obs.: o valor de r deve estar sempre entre 1 e +1, inclusive.
Se o valor de r estiver
prximo de +1 ou 1,
conclumos que h correlao
linear.
Como r=0,897 (e est prximo de 1), dizemos que
existe correlao entre a altura do urso e o seu peso!
Interpretao do coeficiente de correlao linear:
Com os dados abaixo sobre crimes violentos e a temperatura mdia
entre 21 e 2 horas das noites de sbado de uma comunidade, avalie se
h correlao entre as variveis.
Crimes violentos/1000
residentes
5
2,2
4,1
5,4
2,8
3
3,6
2,5
2
Temperatura C
22
18
19
24
23
20
21
20
17
Regresso linear Simples
Proposio: A anlise de regresso uma tcnica estatstica que tem por
objetivo investigar e modelar o relacionamento entre duas variveis (regresso
simples) ou mais variveis (regresso mltipla).
Iniciaremos estudando a relao entre duas variveis (regresso simples).
Objetivo: Descrever, utilizando dados amostrais, a relao entre duas
variveis, quando verificamos que existe correlao linear significativa entre
elas:
traando seu grfico e,
- determinando a equao da reta que representa aquela relao (reta
de regresso).
Mtodo dos Mnimos Quadrados
Definio: Dada uma coleo de dados amostrais emparelhados (duas
variveis), a reta de regresso tem sua equao de regresso dada por:

Esta definio expressa uma relao entre x (varivel independente ou
preditora) e (varivel dependente ou resposta).
b ax y + =

y y
y
A partir dos dados amostrais, no podemos achar os parmetros populacionais,
mas estim-los como a

e b:

e


( ) ( )( )
( ) ( )
2
2

=
x x n
y x xy n
a
n
x a y
b


=
Exemplo 1: O diretor de vendas de uma rede de varejo nacional precisa analisar a
relao entre o investimento em propaganda e as vendas da empresa. Os dados
esto na tabela abaixo:






Varivel explicativa(x) : Investimento em propagandas;
Varivel resposta (y) : Vendas da empresa.
Propagandas (X) 30 21 35 42 37 20 8 17 35 25
Vendas (Y) 430 335 520 490 470 210 195 270 400 480
Regresso Linear Simples
Na resoluo de problemas de regresso o primeiro passo traar o diagrama de disperso
correspondente.
Diagrama de Disperso
0
100
200
300
400
500
600
0 10 20 30 40 50
Investimento em Propagandas
V
e
n
d
a
s

d
a

E
m
p
r
e
s
a

Regresso Linear Simples
O objetivo da regresso linear colocar no diagrama de disperso uma
linha que melhor se ajuste ou que melhor represente a relao entre as
duas variveis.
Diagrama de Disperso
0
100
200
300
400
500
600
0 10 20 30 40 50
Investimento em Propagandas
V
e
n
d
a
s

d
a

E
m
p
r
e
s
a
Regresso Linear Simples
Interpretao dos Parmetros do Modelo de
Regresso
Obtida uma reta de regresso, o primeiro passo na sua interpretao verificar
o sinal de a. Se for positivo, indica que, quanto maior o valor de x, maior o valor
de y; se for negativo, indica que quanto maior o valor de x, menor o valor de y.

a

a inclinao da reta de regresso. Ele indica a mudana na mdia de y para
cada aumento de uma unidade em x.

b o intercepto do modelo. Se o domnio do modelo inclui x=0, b fornece a
mdia de y quando x=0. Caso contrrio, b no possui interpretao.

A reta de regresso para o Exemplo 1 :

a = 9,74 indica que para cada aumento de uma unidade no investimento em
propagandas h um aumento de 9,74 unidades na mdia de vendas da empresa.


x y 74 , 9 07 , 117 + =
Exemplo 2: Abaixo esto mostrados os comprimentos e os pesos de oito ursos
cinzentos:
Comprimento x (in.) 53,0 67,5 72,0 72,0 73,5 68,5 73,0 37,0
Peso y (lb) 80 344 416 348 262 360 332 34

Com base nestes dados, parece haver alguma relao entre o comprimento
de um urso e o seu peso? Em caso afirmativo, qual esta relao?
Regresso Linear Simples
Com os dados da tabela anterior, determine a equao de regresso da reta
que relaciona comprimentos e pesos dos ursos dessa espcie.
x y x . y x
2
y
2

53,0 80 4.240 2809,00 6.400
67,5 344 23.220 4556,25 118.336
72,0 416 29.952 5184,00 173.056
72,0 348 25.056 5184,00 121.104
73,5 262 19.257 5402,25 68.644
68,5 306 24.660 4692,25 129.600
73,0 332 24.236 5329,00 110.224
37,0 34 1.258 1369,00 1.156
Total 516,5 2176 151.879 34.525,75 728.520

x

y

xy

2
x

2
y
Regresso Linear Simples
Regresso Linear
Definies:
Desvio total: distncia vertical
y y
Desvio explicado: distncia vertical
y y
Desvio no-explicado: distncia vertical , tambm chamado de resduo y y
y
= valor observado
y
= mdia dos valores observados
y = valor predito pela equao de regresso
Regresso Linear Simples:
140
220
300
380
460
540
0 9 18 27 36 45
Investimento
V
e
n
d
a
s
a: Desvio Total: Valor Real Mdia

a
c
c: Desvio No Explicado: Valor Real Predito
Chamado RESDUO ou ERRO.
b
b: Desvio
Explicado: Valor
Predito Mdia
Regresso Linear
Definies:
Variao total: soma dos quadrados dos desvios totais
2
) ( y y

Variao explicada: soma dos quadrados dos desvios explicados


2
) ( y y

2
) ( y y

Variao no-explicada: soma dos quadrados dos desvios no-


explicados
Relaes entre os desvios
(desvio total) = (desvio explicado) + (desvio no-explicado)
y y =
y y
+
y y
(variao total) = (variao explicada) + (variao no-explicada)
De maneira anloga:
2
) ( y y

=
2
) ( y y

+
2
) ( y y

Definio: Valor da variao de y que explicado pela reta de regresso.


Coeficiente de Determinao
total variao
explicada variao
2
= r

=
2
2
2
) (
)

(
y y
y y
r
Obs. Podemos calcular r
2
tanto pela definio acima, como simplesmente
elevando ao quadrado o coeficiente de correlao linear r
r
2
sempre assumir valores entre 0 e 1
ou
Exemplo:
Coeficiente de Determinao
Diagrama de disperso: mdia no 2o grau e ndice na universidade - reta
ajustada
80 82 84 86 88 90 92 94 96 98 100
0.90
1.22
1.54
1.86
2.18
2.50
2.82
3.14
3.46
3.78
4.10
Y = -13.520 + (.180 * X)
Mdias dos estudantes no 2o grau

n
d
i c
e

d
o
s

e
s
t
u
d
a
n
t
e
s

n
a

u
n
i v
e
r
s
i d
a
d
e
r
2
= 0,9
2
= 0,81
Ou seja 81% da variao pode ser explicada pela reta
Erro padro da estimativa
uma medida das diferenas entre os valores observados e os valores
preditos obtidos atravs da reta de regresso
2
) (
2

=

n
y y
s
e
2
2


=

n
xy a y b y
s
e
ou
Intervalo de predio para um y individual
Dado um valor fixo x
0
, o intervalo de predio para um determinado y :
E y y E y + s s

+ + =
2 2
2
0
2
) ( (
) ( 1
1
x x n
x x n
n
s t E
e o
Anlise de Resduos
Os resduos so as diferenas entre os valores observados
da varivel dependente e os valores preditos da varivel
dependente, atravs do modelo de regresso, para um
determinado valor da varivel independente. Para tornar a
anlise mais confivel, sem que as grandezas dos resduos
venham a prejudic-la recomenda-se padronizar os
resduos: calcula-se o desvio padro dos resduos e divide-se
cada um deles pelo desvio padro.
Para fazer a anlise de resduos precisamos construir pelo
menos dois diagramas de disperso:
- um que relacione os resduos padronizados com os prprios
valores preditos da varivel independente;
- outro que relacione os resduos padronizados com os
valores da varivel independente
Anlise de Resduos
Se o modelo de regresso adequado os resduos
padronizados no podem apresentar quaisquer padres, eles
devem distribuir-se de forma aleatria nos dois diagramas,
atendendo os seguintes critrios:
- a quantidade de resduos padronizados positivos deve ser
aproximadamente igual quantidade de negativos.
- a grandeza dos resduos padronizados positivos deve ser
aproximadamente igual a dos negativos, para todos os
valores preditos da varivel dependente, e para todos os
valores da varivel independente.
- no pode haver padres no aleatrios (tendncias
crescentes ou decrescentes, curvas, etc.) em nenhum dos
diagramas.
Somente se todas estas condies forem satisfeitas que
podemos considerar o modelo de regresso apropriado. Se
houver dois ou mais modelos apropriados escolhemos o
mais simples, ou aquele que apresentar o mais alto
coeficiente de determinao. Os diagramas deveriam ser
como a figura abaixo:
Anlise de Resduos
0.700 1.050 1.400 1.750 2.100 2.450 2.800 3.150 3.500 3.850
-3.0
-2.4
-1.8
-1.2
-0.6
0.0
0.6
1.2
1.8
2.4
Resduos de ndi ce (Y)
Valores preditos
R
e
s

d
u
o
s

P
a
d
r
o
n
i z
a
d
o
s
Anlise de Resduos
Exemplo:
Resduos padronizados: mdia no 2o grau e ndice na universidade
Questo: as variveis so relacionadas?
No coeficiente angular | = 0.
Sim coeficiente angular | = 0.
Teste de hipteses:
H0: | = 0
H1: | = 0
Como o desvio padro da populao desconhecido, usamos t
de Student,com (n-2) graus de liberdade.



sb desvio padro da distribuio amostral do coeficiente
angular.
Teste de hipteses para o Coeficiente Angular
t
b
s
b
s
b b
= =

=
(
~
valor amostral) - (valor esperado)
desvio padrao
0
| | n x x
s s
e b
/ ) (
1
.
2 2


=
b
s t b . t.s - b
t.s b : para confiana de intervalo
b
b
+ s s

|
|
Questo: as variveis so relacionadas?
No coeficiente de correlao = 0.
Sim coeficiente de correlao = 0.
H0: = 0
H1: = 0 ou > 0 ou < 0.
O teste feito com t de Student:





Intervalo de confiana para o coeficiente de correlao:
Teste de hipteses para o Coeficiente de Correlao
( ) . t r
n
r
n calc
=

2
2
2
1
t t
t
crit n
n
. ;
; /
=
= =

2
2 2
o
o

para < 0 ou > 0


t para 0
crit.
(

+
|
.
|

\
|

+
s s
(

|
.
|

\
|

+
3
r 1
r 1
ln
2
1
tanh
3
r 1
r 1
ln
2
1
tanh
2 / 2 /
n
Z
n
Z
o o

Exerccios: Folha 3

Slide 149
5 Parte:

Regresso Linear Mltipla

Sries Temporais

Slide 150
Para y = b
1
x
1
+ b
2
x
2
Onde est a reta de regresso ?
Regresso Linear Mltipla:
Os clculos necessrios regresso mltipla
so complexos e envolvem a resoluo de
sistemas lineares ou matrizes
Basicamente os softwares apresentam 3
componentes para a regresso mltipla:
A Equao de Regresso;
R
2
Ajustado e
Significncia Global da Equao.
CONCEITOS E DEFINIES
Equao de Regresso Mltipla: expressa um
relacionamento linear entre uma varivel
dependente Y e duas ou mais variveis
independentes (x
1
, x
2
, x
3
, ..., x
k
).
Modelo Matemtico:
Y = b
0
+ b
1
x
1
+ b
2
x
2
+ ... + b
k
x
k
Valor Predito
de Y
K = nmero de
variveis
independentes
Intecepto
X
i
= variveis
independentes
b
i
= Coeficientes
CONCEITOS E DEFINIES
Coeficiente de Determinao Mltipla (R
2
):
a medida de ajustamento da equao de
regresso mltipla aos dados amostrais.
Limitao de R
2
: na medida em que se
incluem novas variveis R
2
aumenta, ou seja, a
simples incluso de todas as variveis
disponveis levar R
2
para prximo de 1.
Entretanto a melhor equao nem sempre
inclue todas as variveis.

CONCEITOS E DEFINIES
Coeficiente de Determinao Ajustado: o
coeficiente de determinao R
2
modificado de
modo a levar em conta o nmero de variveis e
o tamanho da amostra. o melhor nmero
para comparar diferentes equaes.
Modelo Matemtico:
R
2

Ajustado
= 1 - (n 1 ) (1 R
2
)
[n (k+1)]
Nmero de dados
Nmero de Variveis Independentes
CONCEITOS E DEFINIES
Significncia Global: O valor P.
Os Softwares, via de regra, apresentam o valor P,
que uma medida da significncia global da equao
de regresso.
Assim como R
2
, P uma medida da aderncia da
equao aos dados amostrais.
Quanto menor o valor de P, melhor a aderncia da
equao, ou seja, melhor o modelo.
P indica a probabilidade
de se estar rejeitando
H
0
de forma indevida.
CONCEITOS E DEFINIES
J calculamos o coeficiente de correlao entre
a altura do urso e seu peso (r = 0.897), da
r
2
=0.8046.
O que fazer para melhorar a estimativa do
peso, sem o uso de uma balana ?
NOSSO AMIGO URSO
Os bilogos resolveram testar mais variveis,
alm da altura. Foram escolhidas as seguintes
variveis:
Altura (j avaliada) [ H ]
Trax [ T ]
Comprimento da Cabea [ CC ]
Largura da Cabea [ LC ]
Idade [ I ]
Dimetro do Pescoo [ DP ]
Utilizando-se um Software apropriado, foram
obtidos os dados a seguir:
NOSSO AMIGO URSO
Como varivel nica, Trax melhor que a altura
para predizer o peso dos ursos.
Quanto mais variveis consideradas, maior o valor
de R
2
A melhor equao de regresso definida por I,
DP, H e T, porque:
Maior R2;
Menor P;
Alm de ser mais simples.
Variveis > H T CC e H I e DP e H e T I e CC e LC e DP e H e T
R2 0,805 0,983 0,828 0,999 0,999
R2 Ajustado 0,773 0,980 0,759 0,997 0,996
Significncia Global0,002 0,000 0,012 0,000 0,046
NOSSO AMIGO URSO
Sabe-se que o nvel de resistncia de um
ao correlacionado com seu teor de
Carbono, conforme demonstrado no
diagrama de disperso.
82,8% da variao da resistncia
explicada pela equao de regresso.
y = 1170x + 315,3
R
2
= 0,8285
340
350
360
370
380
390
400
410
420
0,000 0,020 0,040 0,060 0,080 0,100
Teor de C (%)
R
e
s
i
s
t

n
c
i
a

(
M
P
a
)
O que pode
ser feito para
melhorar a
estimativa da
Resistncia ?
UM CASO PRTICO
O conhecimento tcnico determina que o Mangans
tem efeito semelhante ao Carbono.
Os mesmos dados foram submetidos a regresso
mltipla tendo C como X
1
e Mn como X
2
.
O poder de
explicao da
regresso
subiu de
82,8% para
96,2%.
y = 1188,9x + 268,59
R
2
= 0,9624
340
350
360
370
380
390
400
410
420
0,00 0,05 0,10 0,15
C+Mn/6
R
e
s
i
s
t

n
c
i
a

(
M
P
a
)
UM CASO PRTICO
A partir deste conhecimento,
o projetista vai poder
determinar qual a
combinao necessria entre
C e Mn, que reflita em menor
custo, mas que atenda s
exigncias mnimas de
Resistncia, com maior nvel
de preciso.
UM CASO PRTICO
1. Use o bom senso e consideraes de ordem
prtica para incluir ou excluir variveis.
2. Inclua um nmero relativamente pequeno de
variveis independentes (x).
3. Escolha uma equao em que a incluso de
uma nova varivel provoque pequeno
incremento em R
2
.
4. Para um mesmo nmero de variveis
independentes (x) escolha aquela que tenha o
R
2
maior.
5. Escolha a equao cujo valor de Significncia
Global (P) seja o menor.
ESCOLHA DE VARIVEIS
Srie temporal: conjunto de observaes ordenadas no
tempo.
Exemplos:
a.Consumo mensal de energia em uma residncia
b.Preo semanal de um produto
c.Valor anual de um ndice de produo industrial

Idia bsica: observaes passadas da srie contm
informaes sobre o seu padro de comportamento futuro.
CONCEITO
Sries Temporais:
Definio: tipo mais simples de srie temporal, em que os
valores da srie flutuam aleatoriamente em torno de um
valor fixo (nvel da srie), sem apresentar qualquer
tendncia.
SRIES GLOBALMENTE CONSTANTES
Suavizao Exponencial
Forma de modelar a srie temporal
Supe que a srie constante
Cada valor uma mdia ponderada dos valores
anteriores da srie
Pesos decaem medida que o tempo de observao
fica mais distante do presente
SRIES GLOBALMENTE CONSTANTES
A srie composta por dois fatores: o nvel (como na
srie globalmente constante) e a tendncia.
SRIES COM TENDNCIA LINEAR
SRIES COM TENDNCIA LINEAR
MTODOS PARA ISOLAR A TENDNCIA:
TREND ANALYSIS:
o melhor processo. A tendncia dos dados dada pela curva de
regresso.
MOVING AVERAGE:
"Este processo, que objetiva suavizar as variaes na varivel estudada
tem a grande vantagem de no exigir a determinao de nenhuma
curva a qual a tendncia deva se adaptar.

Limitao: quase impossvel remover completamente variaes cclicas
e irregulares.

Ideal: mdias com perodos de tempo longo.

Problema: quanto mais dados, menos sensvel a mdia se torna a
observaes recentes (s vezes necessrio ponderao)
Alm do nvel e da tendncia, algumas sries possuem um fator
sazonal. Este fator capta caractersticas da srie que se repetem a
intervalos regulares de tempo.
Exemplo: A venda de um artigo em uma loja funo no somente
da venda no ms anterior e de uma expectativa de aumento ou
decrscimo (tendncia da procura), mas tambm da venda desse
produto na mesma poca, em anos anteriores.
SRIES SAZONAIS
Tipos de Efeito Sazonal
1. Efeito aditivo: a amplitude do fator sazonal independe do nvel local da
srie.
SRIES SAZONAIS
2. Efeito Multiplicativo: a amplitude do fator sazonal varia proporcionalmente
ao nvel da srie.
Tipos de Efeito Sazonal
SRIES SAZONAIS
Exerccios: Folha 4

Slide 174