Você está na página 1de 113

UNIVERSIDADE DE CAXIAS DO SUL

PROFESSORA: CNTIA PAESE GIACOMELLO
















Probabi li dade e Estat stica













Prof. C nti a Paese Gi acomel lo 2
ndice

1 Introduo_____________________________________________________1
1.1 Amostragem ________________________________________________________ 2
1.2 Tipos de variveis ____________________________________________________ 4
2 Sries estatsticas _______________________________________________5
3 Grficos _______________________________________________________6
4 Distribuies de freqncias______________________________________12
4.1 Construo de distribuio de freqncia para dados contnuos ______________ 12
4.2 Grficos das distribuies de freqncia _________________________________ 13
4.3 Construo de distribuio de freqncia para dados discretos ______________ 15
4.4 Construo de uma distribuio de freqncia acumulada___________________ 17
4.5 Distribuies de freqncia para dados nominais e por postos _______________ 18
4.6 Grficos para distribuies de freqncia ________________________________ 19
5 Medidas de tendncia central _____________________________________20
5.1 Mdia_____________________________________________________________ 20
5.2 Mediana___________________________________________________________ 23
5.3 Moda _____________________________________________________________ 25
5.4 Relao entre as medidas de tendncia central ___________________________ 26
6 Medidas de variabilidade ________________________________________28
6.1 Amplitude _________________________________________________________ 28
6.2 Varincia __________________________________________________________ 29
6.3 Desvio padro ______________________________________________________ 29
6.4 Coeficiente de variao ______________________________________________ 30
7 Medidas de assimetria e curtose __________________________________31
8 Introduo probabilidade_______________________________________33
8.1 Experimento aleatrio _______________________________________________ 33
8.2 Espao amostral ____________________________________________________ 34
8.3 Eventos ___________________________________________________________ 34
8.4 A probabilidade de um evento _________________________________________ 34
8.5 Clculo das probabilidades ____________________________________________ 37
9 Distribuies de probabilidade ____________________________________43
10 Teoria elementar da amostragem ________________________________56
10.1 Amostragem com e sem reposio ____________________________________ 56
10.2 Distribuies amostrais _____________________________________________ 56
Prof. C nti a Paese Gi acomel lo 3
11 Estimao ___________________________________________________62
12 Testes de hipteses ___________________________________________68
12.1 Teste de hipteses para mdias ______________________________________ 70
12.2 Testes de duas amostras para mdias _________________________________ 72
12.3 Teste para propores _____________________________________________ 72
12.4 Teste do qui-quadrado (k amostras para propores) ____________________ 73
13 Anlise de varincia (ANOVA - Analysis of Variance) _________________79
13.1 Formulrio para soluo ____________________________________________ 83
13.2 Exemplo de soluo no Excel ________________________________________ 85
14 Regresso e correlao ________________________________________90
Regresso ______________________________________________________________ 91
14.1 Aplicaes da regresso ____________________________________________ 91
14.2 Classificao das regresses_________________________________________ 91
14.3 Modelo linear _____________________________________________________ 91
Correlao ______________________________________________________________ 94
14.4 Objetivo da correlao _____________________________________________ 94
14.5 O coeficiente r de Pearson (correlao)________________________________ 94
14.6 Coeficiente de determinao ________________________________________ 94
14.7 Exemplo de soluo no Excel ________________________________________ 96
14.8 Outros modelos __________________________________________________ 100
15 Tabelas ____________________________________________________106


Prof. C nti a Paese Gi acomel lo 1
1 1 I In nt tr ro od du u o o

Estuda-se estatstica para aplicar seus conceitos como auxlio nas tomadas de deciso
diante de incertezas, justificando cientificamente as decises.
Os princpios estatsticos so utilizados em uma grande variedade de situaes no
governo, nos negcios e na indstria, bem como no mbito das cincias sociais, biolgicas
e fsicas.
Estatstica a cincia ou mtodo cientfico que estuda os fenmenos multicausais,
coletivos ou de massa e procura inferir as leis que os mesmos obedecem.
Mtodo estatstico um processo para se obter, apresentar e analisar caractersticas ou
valores numricos para uma melhor tomada de deciso em situaes de incerteza. Os
passos da metodologia estatstica so os seguintes:
Definio cuidadosa do problema
Formulao de um plano para coleta das unidades de observao
Coleta, resumo e apresentao das unidades de observao ou de seus valores
numricos
Anlise dos resultados
Divulgao de relatrio com as concluses, de tal modo que estas sejam facilmente
entendidas por quem as for usar na tomada de decises.

Em geral, aceita a diviso da estatstica em dois grandes grupos: estatstica descritiva e
indutiva.
Descritiva: corresponde aos procedimentos relacionados com a coleta, elaborao,
tabulao, anlise, interpretao e apresentao dos dados. Isto , inclui as tcnicas que
dizem respeito sintetizao e descrio de dados numricos. Tais mtodos podem ser
grficos e envolvem a utilizao de recursos computacionais. O objetivo da estatstica
descritiva tornar as coisas mais fceis de entender, relatar e discutir.
Indutiva (ou inferencial): parte de uma ou mais amostras (subconjuntos da populao) e
conclui sobre a populao. Utiliza tcnicas como a teoria das probabilidades, inferncia
estatstica, amostragem.

Com maior freqncia utilizamos o estudo da amostra do que da populao, no s por
serem menos dispendiosas e consumirem menos tempo no processamento dos dados, mas
tambm porque muitas vezes no dispomos de todos os elementos da populao.

Prof. C nti a Paese Gi acomel lo 2
Definies:
Populao: coleo completa de todos os elementos (valores, pessoas, medidas,...) a
serem estudados.
Amostra: subcoleo de elementos extrados da populao.
Censo: coleo de dados relativos a todos os elementos de uma populao.
Amostragem: coleo de dados relativos a elementos de uma amostra.

Exemplo:
Populao Amostra




Parmetro: medida numrica que descreve uma caracterstica de uma populao
Estatstica: medida numrica que descreve uma caracterstica de uma amostra


1.1 Amostragem
O objetivo da amostragem permitir fazer inferncias sobre uma populao aps inspeo
de apenas parte dela. Fatores como custo, tempo, ensaios destrutivos e populaes
infinitas tornam a amostragem prefervel a um estudo completo (censo).
Os principais tipos de amostragem utilizados so os probabilsticos, onde todos os
indivduos da populao tm a mesma chance de serem selecionados. Os planos de
amostragem probabilstica so delineados de tal modo que se conhece todas as
combinaes amostrais possveis e suas probabilidades, podendo-se ento determinar o
erro amostral.
Os mtodos mais comuns de amostragem probabilstica so:
Amostragem aleatria simples: os elementos de uma populao so escolhidos de
tal forma que todos tenham a mesma chance de serem escolhidos. Pode-se utilizar
uma tabela de nmeros aleatrios ou um programa de gerao de nmeros
aleatrios.
Amostragem estratificada: subdivide-se a populao em, no mnimo, dois estratos
(subpopulaes) que compartilham a mesma caracterstica e em seguida escolhe-se
uma amostra de cada. Exemplo: homens e mulheres.
Amostragem sistemtica: escolhe-se um ponto de partida e ento,
sistematicamente, selecionam-se os outros. Por exemplo: o 3, 403, 803,
1203,... indivduos
Prof. C nti a Paese Gi acomel lo 3
Amostragem por conglomerados: divide-se a populao em conglomerados (reas),
em seguida sorteiam-se algumas reas e analisam-se todos os elementos dos
conglomerados escolhidos. Por exemplo: bairros.


Fonte: Triola, Mri o. 1999, 11.

Amostragens no probabilsticas so utilizadas quando a populao em estudo muito
pequena ou de difcil obteno. Neste caso a anlise de uma amostra poderia causar
distores. Uma pessoa familiarizada com a populao pode indicar melhor as unidades
amostrais. Este tipo de amostragem no permite avaliar o erro amostral. EX: doena rara.
Prof. C nti a Paese Gi acomel lo 4
1.2 Tipos de variveis
Alguns conjuntos de dados consistem em nmeros, enquanto outros so no numricos.
Utiliza-se a nomenclatura de dados (ou variveis) qualitativos e quantitativos.













Exerccios:
Identifique cada nmero como discreto ou contnuo
1. Cada cigarro Camel tem 16,13 mg de alcatro
2. O altmetro de um avio da American Airlines indica uma altitude de 21.359 ps
3. Uma pesquisa efetuada com 1015 pessoas indica que 40 delas so assinante de um
servio de informao on-line.
4. O tempo total gasto anualmente por um motorista de txi de Nova York ao dar
passagem a pedestres de 2367 segundos.

Apresente dois exemplos de dados discretos ou contnuos de sua empresa / pesquisa.
Quantitativas Qualitativas
Discretas Contnuas
Variveis
Prof. C nti a Paese Gi acomel lo 5
2 2 S S r ri ie es s e es st ta at t s st ti ic ca as s
Consiste no agrupamento dos dados estatsticos em tabelas.
Em qualquer srie estatstica so observados trs elementos fundamentais:
O fato, isto , o que est sendo observado
O espao geogrfico
A poca
Estes elementos criam classificaes para as sries: especficas, temporais ou geogrficas.

Sries temporais (ou histricas)
Os dados esto reunidos de acordo com o tempo, que varia. Os outros dois fatores - local
e fato - permanecem inalterados.










Sries geogrficas
Os dados esto reunidos de acordo com o local, que varia. Os outros dois fatores - fato e
data - permanecem inalterados.








Prof. C nti a Paese Gi acomel lo 6
Sries especficas
Os dados esto reunidos de acordo com o evento, que varia. Os outros dois fatores - local
e data - permanecem inalterados.










As sries podem ainda apresentar-se sob a forma mista, resultante da combinao dos
fatores.










3 3 G Gr r f fi ic co os s
Os grficos consistem em uma forma de apresentao dos dados, usualmente utilizada
pois facilita a interpretao dos resultados.
So elementos complementares de um grfico:
Ttulo geral, poca e local
Escalas e respectivas unidades de medida
Indicao das convenes adotadas (legenda)
Fonte de informao dos dados

Prof. C nti a Paese Gi acomel lo 7
Principais tipos de grficos: (Fonte: Site da Microsoft www.microsoft.com.br)

Colunas
Um grfico de colunas mostra as alteraes
de dados em um perodo de tempo ou
ilustra comparaes entre itens. As
categorias so organizadas na horizontal e
os valores so distribudos na vertical, para
enfatizar as variaes ao longo do tempo.

Grficos de colunas empilhadas mostram o relacionamento de itens individuais com o todo
. O grfico de colunas em perspectiva 3D
compara pontos de dados ao longo dos dois
eixos.
Nesse grfico 3D, voc pode comparar o
desempenho das vendas de quatro
trimestres na Europa com o desempenho de
outras duas divises.
Vendas por local




Barras
Um grfico de barras ilustra comparaes
entre itens individuais. As categorias so
organizadas na vertical e os valores na
horizontal para enfocar valores de
comparao.


Grficos de barras empilhadas mostram o
relacionamento de itens individuais com o
todo.

Vendas por produto



Prof. C nti a Paese Gi acomel lo 8
Linha
Um grfico de linhas mostra
tendncias nos dados em
intervalos iguais.
A unio dos pontos faz sentido
pois a varivel contnua.
Meses usualmente so
tratados como variveis
contnuas

Valor de venda do produto X



Pizza
Um grfico de pizza mostra o tamanho
proporcional de itens que constituem uma srie
de dados para a soma dos itens. Ele sempre
mostra somente uma nica srie de dados, sendo
til quando voc deseja dar nfase a um
elemento importante.
Totaliza a informao (100%). Cada faixa do
grfico proporcional informao.



Para facilitar a visualizao de fatias pequenas, voc pode
agrup-las em um nico item do grfico de pizza e
subdividir esse item em um grfico de pizza ou de barras
menor, ao lado do grfico principal.


Diagrama de Disperso (Disperso XY)
Um grfico xy (disperso) mostra a
relao existente entre os valores
numricos em vrias sries de dados ou
plota dois grupos de nmeros como uma
srie de coordenadas xy. Esse grfico
mostra intervalos irregulares ou clusters
de dados e usado geralmente para
dados cientficos.
Relao entre tempo e temperatura

Prof. C nti a Paese Gi acomel lo 9


Histograma
um grfico de colunas, porm utilizado
para apresentar distribuies de
freqncias.
Apresenta as classes ao longo do eixo
horizontal e as freqncias (absolutas ou
relativas) ao longo do eixo vertical. As
fronteiras das barras coincidem com os
pontos extremos dos intervalos de classe.
Distribuio da quantidade produzida
0.00
0.05
0.10
0.15
0.20
0.25
0.30
3 a 8 8 a 13 13 a 18 18 a 23 23 a 28 28 a 33
Safras (alq.)
%

d
a
s

r
v
o
r
e
s


rea
Um grfico de rea enfatiza a
dimenso das mudanas ao longo do
tempo. Exibindo a soma dos valores
plotados, o grfico de rea mostra
tambm o relacionamento das partes
com um todo.
Nesse exemplo, o grfico de rea
enfatiza o aumento das vendas em
Washington e ilustra a contribuio
de cada estado para o total das
vendas.


Superfcie
Um grfico de superfcie til quando
voc deseja localizar combinaes
vantajosas entre dois conjuntos de dados.
Como em um mapa topogrfico, as cores e
os padres indicam reas que esto no
mesmo intervalo de valores.
Esse grfico mostra as vrias combinaes
de temperatura e tempo que resultam na
mesma medida de resistncia trao.

Prof. C nti a Paese Gi acomel lo 10


Radar
Um grfico de radar compara os
valores agregados de vrias sries de
dados.

Nesse grfico, a srie de dados que
cobre a maior parte da rea, Marca A,
representa a marca com o maior
contedo de vitamina.




Aes
O grfico de alta-baixa-fechamento usado muitas vezes para ilustrar preos de aes.
Esse grfico tambm pode ser usado com dados cientficos para, por exemplo, indicar
mudanas de temperatura. Voc deve organizar seus dados na ordem correta para criar
esse e outros grficos de aes.

Um grfico de aes que mede o volume tem dois eixos de valores: um para as colunas,
que medem o volume, e outro para os preos das aes. Voc pode incluir volume em um
grfico de alta-baixa-fechamento ou de abertura-alta-baixa-fechamento.


Prof. C nti a Paese Gi acomel lo 11
Bolhas
Um grfico de bolhas um tipo de grfico xy (disperso). O tamanho do marcador de
dados indica o valor de uma terceira varivel.
Para organizar seus dados, coloque os valores de x em uma linha ou coluna e insira os
valores de y e os tamanhos das bolhas correspondentes nas linhas ou colunas adjacentes.

O grfico nesse exemplo mostra que a Empresa A tem a maioria dos produtos e a maior
fatia do mercado, mas no necessariamente as melhores vendas.

Cone, cilindro e pirmide
Os marcadores de dados em forma de cone, cilindro e pirmide podem dar um efeito
especial aos grficos de colunas e de barras 3D.


Rosca
Como um grfico de pizza, o grfico de
rosca mostra o relacionamento das partes
com o todo, mas pode conter mais de uma
srie de dados. Cada anel do grfico de
rosca representa uma srie de dados.




Prof. C nti a Paese Gi acomel lo 12
4 4 D Di is st tr ri ib bu ui i e es s d de e f fr re eq q n nc ci ia as s
Distribuio de freqncia uma tabela resumida na qual os dados so organizados em
grupos de classe ou categorias convenientemente estabelecidas e numericamente
ordenadas.
As distribuies de freqncias so series hetergrafas, isto , sries na qual o fenmeno
ou fato apresenta graduaes ou subdivises. Embora fixo, o fenmeno varia de
intensidade.
Nas distribuies de freqncia, os dados so agrupados segundo um critrio de
magnitude, em classe ou pontos, permanecendo constante o fato, local e tempo, de tal
forma que se possa determinar a percentagem ou nmero, de cada classe. um tipo de
apresentao que condensa uma coleo de dados conforme as freqncias ou repeties
de seus valores.

A construo da distribuio de freqncia depende do tipo de dado com os quais se est
lidando: contnuos ou discretos.

4.1 Construo de distribuio de freqncia para dados contnuos
Os principais estgios so:
1. Estabelecer a quantidade de classes ou intervalos de grupamento dos dados. O
nmero de classes deve variar entre 5 e 15. Aconselha-se utilizar n onde n o
nmero de observaes.
2. Determinar a amplitude das classes. Aconselha-se fazer amplitude / n
o
de classes.
(OBS: amplitude = maior valor menor valor)
3. Enquadrar os dados nas classes, mediante contagem e apresentar os resultados em
uma tabela ou grfico

Exemplo:
Os dados a seguir representam o tempo (em minutos) que 45 operadores de mquina
demoraram para fazer o setup de uma mquina.
6,5 4,0 7,1 8,3 5,4 7,6 9,0 15,7 16,7
6,4 5,0 8,5 5,7 7,7 7,2 12,4 7,1 5,5
9,7 4,4 7,0 6,3 8,3 6,9 5,7 7,6 7,9
7,9 6,0 8,2 10,4 9,9 3,9 9,8 8,2 5,6
7,9 6,4 7,4 7,0 13,0 8,7 6,4 6,7 7,4

1 Nmero de classes 45 valores 45 =6,7 7 classes
2 Amplitude das classes 16,7 3,9 = 12,8 (Maior valor = 16,7; Menor valor =
3,9). Logo, tem-se a amplitude das classes 12,8 / 7 = 1,83 2

Prof. C nti a Paese Gi acomel lo 13
3 Escrever as classes e contar os valores

Tempo
(minutos)
Nmero de
operadores
% de
operadores
3 | 5 4 8,9%
5 | 7 15 33,3%
7 | 9 18 40,0%
9 | 11 4 8,9%
11 | 13 2 4,4%
13 | 15 0 0,0%
15 | 17 2 4,4%
Total 45 100%

3 | 5 equivale a 3 < x 5
Ou seja, so contados no
intervalo todos os valores
superiores a 3 e inferiores ou
iguais a 5.


A freqncia absoluta (f
i
) corresponde ao nmero de operadores
A freqncia relativa (f
ri
) corresponde ao percentual de operadores

4.2 Grficos das distribuies de freqncia
Histograma de freqncias
Anlise dos tempos para fazer o setup da mquina
4
15
18
4
2
0
2
0
2
4
6
8
10
12
14
16
18
20
3 | 5 5 | 7 7 | 9 9 | 11 11 | 13 13 | 15 15 | 17
Tempo (minutos)
N

m
e
r
o

d
e

o
p
e
r
a
d
o
r
e
s

Uma alternativa ao histograma de freqncias o polgono de freqncias, construdo
mediante a conexo dos pontos mdios dos intervalos do histograma, com linhas retas.
Prof. C nti a Paese Gi acomel lo 14
Anlise dos tempos para fazer o setup da mquina
4
15
18
4
2
0
2
0
2
4
6
8
10
12
14
16
18
20
3 | 5 5 | 7 7 | 9 9 | 11 11 | 13 13 | 15 15 | 17
Tempo (minutos)
N

m
e
r
o

d
e

o
p
e
r
a
d
o
r
e
s

OBS: uma vez que a rea do polgono deve ser 100%, deve-se ligar o primeiro e o ltimo
pontos mdios com o eixo horizontal, de modo a cercar a rea da distribuio observada.

Exerccios:
1. A tabela de dados representa o peso de 30 sacos de arroz da marca A selecionados
aleatoriamente em um supermercado. Construa a distribuio de freqncias e
apresente em um grfico. (para facilitar os dados j esto ordenados)
922 930 936 950 954 954 958 965 968 974
977 979 987 989 1001 1006 1008 1010 1013 1017
1018 1034 1034 1035 1042 1044 1044 1048 1070 1116


2. Construa a distribuio de freqncia e o polgono de freqncias.
6,2 9,0 12,2 14,7 7,9 9,8 8,0 13,3 13,3 8,9
8,8 8,3 11,8 11,8 14,7 8,5 7,7 11,4 11,2 10,6









Prof. C nti a Paese Gi acomel lo 15
4.3 Construo de distribuio de freqncia para dados discretos
Na construo de uma distribuio de freqncia utilizando dados contnuos, perde-se
certa quantidade de informao porque os valores individuais perdem sua identidade
quando so agrupados em classes. Isso pode ou no ocorrer com dados discretos,
dependendo da natureza dos dados e os objetivos do analista.

Consideremos os seguintes dados relativos ao nmero de acidentes dirios em um grande
estacionamento, durante o perodo de 50 dias.
1 6 3 6 2 4 5 3 7 9
5 4 5 3 4 5 6 0 8 4
4 1 9 5 7 5 5 4 5 8
4 5 3 2 6 7 4 3 1 4
0 0 5 4 2 6 6 2 8 7

Note que os dados esto entre 0 e 9.
Podemos construir uma distribuio de freqncia sem perda dos valores originais,
utilizando os prprios valores.


Classe
Freqncia
dias
% dos
dias
0 3 0,06
1 3 0,06
2 4 0,08
3 5 0,10
4 10 0,20
5 10 0,20
6 6 0,12
7 4 0,08
8 3 0,06
9 2 0,04
50 1,00
0
2
4
6
8
10
12
0 1 2 3 4 5 6 7 8 9
N

m
e
r
o

d
e

d
i
a
s


No houve perda de informao, ou seja, poderamos construir a tabela original a partir da
distribuio de freqncias.
Prof. C nti a Paese Gi acomel lo 16
Por outro lado, poderamos usar como classes 0-1, 2-3, 4-5, 6-7 e 8-9.

Classe
Freqncia
dias
% dos
dias
0-1 6 0,12
2-3 9 0,18
4-5 20 0,40
6-7 10 0,20
8-9 5 0,10
50 1,00
0
5
10
15
20
25
0-1 2-3 4-5 6-7 8-9
N

m
e
r
o

d
e

d
i
a
s


De modo geral prefere-se uma distribuio de freqncia sem perda de informao
quando:
Os dados so constitudos de valores inteiros.
H menos de, digamos, 16 classes.
H suficientes observaes para originar uma distribuio significativa

Por outro lado, prefere-se uma distribuio de freqncia com perda da informao
quando:
Esto em jogo inteiros e no inteiros
S existem inteiros, porm em nmero muito alto para permitir uma distribuio
til.
A perda da informao de importncia secundria (por exemplo, o
arredondamento do peso de um caminho ou da renda anual para a unidade mais
prxima)
Prof. C nti a Paese Gi acomel lo 17
4.4 Construo de uma distribuio de freqncia acumulada
Uma distribuio de freqncia acumulada tem por objetivo indicar o nmero ou
percentual de itens menores do que, ou iguais a, determinado valor.
No caso dos acidentes podemos construir distribuies acumuladas para a distribuio com
e sem perda da informao.

Sem perda da informao
Classe N dias % dias
Freqncias
acumuladas
0 3 0,06 0,06
1 3 0,06 0,12
2 4 0,08 0,20
3 5 0,10 0,30
4 10 0,20 0,50
5 10 0,20 0,70
6 6 0,12 0,82
7 4 0,08 0,90
8 3 0,06 0,96
9 2 0,04 1,00
50 1,00

Com perda da informao
Classe N dias % dias
Freqncias
acumuladas
0-1 6 0,12 0,12
2-3 9 0,18 0,30
4-5 20 0,40 0,70
6-7 10 0,20 0,90
8-9 5 0,10 1,00
50 1,00
Podemos, pela primeira tabela, concluir que 90% dos dados correspondem a valores
menores ou iguais a 7. ou seja, Em 90% dos dias o nmero de acidentes no excede 7.



Prof. C nti a Paese Gi acomel lo 18
0.0
0.2
0.4
0.6
0.8
1.0
0 1 2 3 4 5 6 7 8 9
0.0
0.2
0.4
0.6
0.8
1.0
0-1 2-3 4-5 6-7 8-9


Os polgonos de freqncias acumuladas so tambm chamados de ogivas.
0,0
0,2
0,4
0,6
0,8
1,0
0 1 2 3 4 5 6 7 8 9
N. acidentes
%

d
o
s

d
i
a
s


4.5 Distribuies de freqncia para dados nominais e por postos
As distribuies de freqncias para dados nominais se assemelham s distribuies de
freqncia normais, porm apresentam as categorias em lugar das classes.
Por exemplo:
Vendas
absolutas
Vendas
relativas
Limo 600 0,375
Laranja 400 0,250
Melo 300 0,188
Melancia 200 0,125
Abacaxi 100 0,063
Total 1600 1,000

Usa-se o grfico de barras ou colunas para representar dados nominais.

Prof. C nti a Paese Gi acomel lo 19
4.6 Grficos para distribuies de freqncia
A distribuio de freqncia muitas vezes utilizada para determinar o formato da
distribuio. A distribuio dos dados pode ser simtrica ou no.








Exerccio:
Construa a distribuio de freqncia e desenhe o histograma dos dados a seguir. Qual
o formato da distribuio?
20,7 18,7 26,2 21,7 18,8 20,6 20,7 20,2
18,5 21,3 19,3 18,3 25,1 18,8 24,3 28,4
23,3 25,3 20,4 18,3 24,0 21,2 19,4 20,6
18,9 26,6 22,4 18,9 22,6 21,4 27,0 23,6
28,3 20,3 21,7 18,2 20,3 19,2 24,7 18,4





Distribuies discretas
Simtrica Assimtrica esquerda Assimtrica direita
Prof. C nti a Paese Gi acomel lo 20
5 5 M Me ed di id da as s d de e t te en nd d n nc ci ia a c ce en nt tr ra al l
As medidas de tendncia central so usadas para indicar um valor que tende a representar
melhor um conjunto de nmeros. As trs medidas mais usadas so a mdia, a mediana e a
moda.

5.1 Mdia
5.1.1 Mdia aritmtica
A mdia aritmtica o resultado da diviso da soma de todos os valores da amostra pela
quantidade total de valores.





OBS: x l-se X barra e significa mdia.

=
n
i
i
x
1
l-se somatrio de x
i
, i variando de 1 a n.

=
+ + + =
n
i
n i
x ... x x x
1
2 1


Se um estudante faz quatro provas, obtendo as notas 70, 60, 80 e 75, sua mdia : 71,25.

Algumas propriedades da mdia
A mdia de um conjunto de dados pode ser sempre calculada.
Para um dado conjunto de nmeros, a mdia nica.
A mdia sensvel a (ou afetada por) todos os valores do conjunto, assim, se um
nmero se modifica, a mdia tambm se modifica.
Somando-se uma constante a cada valor do conjunto, a mdia ficar aumentada do
valor constante. Analogamente, extraindo-se um valor constante de cada valor do
conjunto, a mdia tambm ficar diminuda desse valor.
A soma dos desvios dos nmeros de um conjunto a contar da mdia zero.

n
x
x
n
i
i
=
=
1
ou simplesmente
n
x
x

=
Prof. C nti a Paese Gi acomel lo 21
5.1.2 Mdia ponderada
A frmula anterior para calcular a mdia aritmtica supe que cada observao tenha a
mesma importncia. A mdia ponderada considera que as informaes no tem a mesma
importncia, ou seja, devem ser levados em conta o peso das informaes.





Onde w
i
o peso da observao de ordem i.

Consideremos que um professor informe a classe de que haver dois exames parciais,
valendo cada um 30% da nota e um exame final valendo 40%. Um aluno obtm
desempenho 70 na primeira avaliao, 65 na segunda e 80 no exame final.
Mdia ponderada = 50 72
00 1
40 0 80 30 0 65 30 0 70
1
1
,
,
, x , x , x
w
x w
n
i
i
n
i
i i
=
+ +
=

=
=

5.1.3 Mdia geomtrica
A mdia geomtrica utilizada quando se deseja fazer a mdia de taxas de juro, por
exemplo. Neste caso, multiplicam-se os n termos e em seguida extra-se a raiz de ordem
n.
A mdia geomtrica o resultado da raiz de ordem n do produto de todos os valores da
amostra.



OBS:
n
n
i
i
x ... x x x x
3 2 1
1
=

=
l-se produtrio de x
i
, i variando de 1 a n.

5.1.4 Mdia harmnica
A mdia harmnica de um conjunto de n nmeros a recproca da mdia aritmtica dos
recprocos dos nmeros.
Mdia geomtrica =
n
n
i
i
x

=1

Mdia ponderada =

=
=
n
i
i
n
i
i i
w
x w
1
1

Prof. C nti a Paese Gi acomel lo 22


5.1.5 Relao entre as mdias aritmtica, geomtrica e harmnica
A mdia geomtrica de um conjunto de nmeros positivos menor ou igual sua mdia
aritmtica, mas maior ou igual sua mdia harmnica.
Em smbolos: x G H
O sinal de igualdade vale somente quando todos os nmeros forem iguais.
Exemplo: o conjunto 2,4 e 8 tem mdia aritmtica 4,67, mdia geomtrica 4 e mdia
harmnica 3,43.


5.1.6 Clculo da mdia para uma distribuio de freqncia
A mdia de uma distribuio de freqncia calculada com base valor e na freqncia de
cada classe.
n
x f
x
i i
=

Onde f
i
a freqncia da classe i.
Para dados com perda da informao, utiliza-se em lugar de x
i
o ponto mdio do intervalo.

Exemplo:
Classe
Ponto mdio
(x
i
)
N dias (f
i
) f
i
x
i

0-1 0,5 6 3,0
2-3 2,5 9 22,5
4-5 4,5 20 90,0
6-7 6,5 10 65,0
8-9 8,5 5 42,5
n = 50 223
46 4
50
223
,
n
x f
x
i i
= = =



Mdia harmnica =

=

x
n
x n
n
i i
1 1 1
1
1

Prof. C nti a Paese Gi acomel lo 23

Classe (x
i
) N dias (f
i
) f
i
x
i

0 3 0
1 3 3
2 4 8
3 5 15
4 10 40
5 10 50
6 6 36
7 4 28
8 3 24
9 2 18
50 222
44 4
50
222
,
n
x f
x
i i
= = =



Se fizssemos a mdia a partir da tabela original obteramos o valor de 4,44.

5.2 Mediana
A principal caracterstica da mediana dividir o conjunto de nmeros em dois grupos
iguais: a metade ter valores inferiores ou iguais mediana e a metade ter valores
superiores ou iguais mediana.
Para calcular a mediana inicia-se ordenando os valores em ordem crescente. Em seguida
conta-se at a metade deles. Em geral a mediana ocupa a posio (n+1)/2.
Para nmero mpar de valores a mediana o valor do meio. Para amostras com nmero
par de unidades, a mediana a mdia dos dois valores centrais.

Exemplos:
Amostra Nmero de elementos Dados ordenados Mediana
2 3 3 4 2 5 1 4 5 9 elementos mpar 1 2 2 3 3 4 4 5 5 3
2 4 3 1 7 3 8 9 2 4 10 elementos par 1 2 2 3 3 4 4 7 8 9 3,5
3 4 2 3 1 5 3 2
6 7 3 2 5 2 3 6 2 1

Prof. C nti a Paese Gi acomel lo 24
Uma medida semelhante mediana o quartil. Os quartis dividem o conjunto ordenado de
dados em quatro grupos iguais. 25% dos valores so inferiores ao primeiro quarti (Q
1
),
25% esto entre Q
1
e a mediana, 25% esto entre a mediana e o terceiro quartil (Q
3
).
OBS: o segundo quartil corresponde mediana (Q
2
=mediana).



LI Q
1
Q
2
=mediana Q
3
LS
LI = Limite inferior LS=Limite superior

5.2.1 Clculo da mediana para uma distribuio de freqncia
Da mesma forma que para dados apresentados em srie, a mediana o ponto que divide
as informaes ao meio.

A mediana pode ser obtida por interpolao, e dada pela frmula.
c
f
f
n
L Mediana
mediana

) (
2
1
1
|
|
|
|

\
|

+ =


onde: L
1
= limite inferior da classe mediana, isso , da classe que contm a mediana
n = nmero de itens dos dados (freqncia total)
(f)
1
=soma de todas as freqncias das classes anteriores mediana
f
medi ana
= freqncia da classe mediana
c = amplitude do intervalo da classe mediana

Exemplo:
No caso dos acidentes, temos 50 observaes, logo a mediana deve estar localizada na
posio (50+1)/2 = 25,5, ou seja, a classe que contm a mediana a classe 4-5.
O limite inferior da classe mediana 4. Antes da classe mediana ((f)
1
) haviam passado
15 dados. A classe mediana contm 20 observaes e a amplitude da classe mediana 1.
Ento
5 4 5 0 4 1
20
15
2
50
4 , , x Mediana = + =
|
|
|
|

\
|

+ =
Prof. C nti a Paese Gi acomel lo 25
5.3 Moda
A moda o valor que aparece com maior freqncia na amostra. Um conjunto de dados
pode no apresentar moda, apresentar uma moda, duas modas (bimodal), trs modas
(trimodal) ou mais modas (polimodal).

Exemplo:
A moda do conjunto 2 3 4 3 2 3 5 1 2 3, pois o trs o valor que mais vezes aparece.

5.3.1 Clculo da moda para uma distribuio de freqncia
Quando no h perda da informao, a moda idntica ao valor da classe modal, que a
classe com maior freqncia.
Quando h perda da informao, a moda representa o(s) valor(es) de X
correspondente(m) ao(s) ponto(s) de ordenada(s) mxima(s) da curva e pode ser
calculada pela frmula:

c L Moda
|
|

\
|
+

+ =
2 1
1
1

onde: L
1
=limite inferior da classe modal (isto , a classe que contm a moda)

1
=excesso da freqncia modal sobre a da classe imediatamente anterior

2
= excesso da freqncia modal sobre a da classe imediatamente posterior
c = amplitude da classe modal

Exemplo:
No caso dos acidentes....
Classe N dias (f
i
)
0-1 6
2-3 9
4-5 20
6-7 10
8-9 5
n = 50
52 4 52 0 4 1
10 11
11
4 , , Moda = + = |

\
|
+
+ =
Classe modal
Prof. C nti a Paese Gi acomel lo 26
A distribuio pode ter mais de uma moda, sendo bimodal ou de modas mltiplas. OBS: as
duas modas no precisam, necessariamente, ter a mesma freqncia. Isso acontece
quando h um deslocamento da distribuio.







5.4 Relao entre as medidas de tendncia central
Para as curvas de freqncia unimodal moderadamente inclinadas (assimtricas) vigora a
relao emprica
Mdia Moda = 3 (Mdia Mediana)







Exerccios:
1. Para os seguintes conjuntos de dados, determine os valores da mdia aritmtica,
mdia geomtrica, mdia harmnica, mediana e moda.
a) 12 15 16 15 12 15 15 5 7 14


b) 2 6 3 6 3 3 4


c) 2 8 3 10 2 1 6 9 4 3


d) 38 38 70 92 22 17

Moda Classe modal Classes modais Classes modais
Mediana
Mdia
Moda
Mediana
Mdia
Moda
Mediana
Mdia
Moda
Prof. C nti a Paese Gi acomel lo 27
2. Determine Q
1
, Q
2
e Q
3
nos conjuntos de dados que seguem:
a) 15 15 4 7 16 16 4 11 7
8 19 7 6 12 17 16 9 20
16 14 3 12 4 9 8 3 16


b) 4 12 4 7 4 9 11 12 5 8 9 4


3. Qual seria o efeito sobre a mdia de um conjunto de dados se se adicionasse 10:
a) a um dos nmeros? b) a cada um dos nmeros?


4. Joo possui 5 imveis localizados nesta cidade. Ele deseja saber qual o valor
mdio, por metro quadrado, das suas propriedades. Sabendo que imveis no centro
valem R$ 450,00/m
2
e imveis em bairros valem R$ 300,00/m
2
, calcule o valor
mdio por m
2
do seu capital.
Apartamento de 80 m
2
no centro
Pavilho de 450 m
2
no bairro
Casa de 280 m
2
no centro
Apartamento de 120 m
2
no bairro
Casa de 320 m
2
no bairro

Prof. C nti a Paese Gi acomel lo 28
6 6 M Me ed di id da as s d de e v va ar ri ia ab bi il li id da ad de e
As medidas de variabilidade ou disperso indicam se os valores esto relativamente
prximos ou no uns dos outros.
Na anlise de um conjunto de dados necessrio que sejam observados tanto as
informaes relativas localizao (medidas de tendncia central) quanto as informaes
de disperso (medidas de variabilidade).
Exemplo:






Exemplo:
Duas mquinas esto sendo comparadas. A seguir est descrita a produo de cada uma
durante 5 dias.
Produo Mdia
Mq 1 10 10 10 10 10 10
Mq 2 5 18 8 3 16 10
Voc acha que a programao da produo para as duas mquinas pode ser a mesma
durante 1 semana? Por qu?


Consideraremos quatro medidas de disperso: amplitude, varincia, desvio padro e
coeficiente de variao. Todas elas, exceto a amplitude, tm na mdia o ponto de
referncia. Em cada caso, o valor zero indica ausncia de variao; a disperso aumenta
proporo que aumenta o valor da medida (intervalo, varincia, etc.).
6.1 Amplitude
Tambm conhecida como intervalo.
A amplitude de um grupo de dados , de modo geral, mais simples de calcular e de
entender. Consiste na diferena entre o maior e o menor valor, ou seja, entre os valores
extremos.

Amplitude = X
max
- X
mn


Pequena variabilidade
Grande variabilidade
Prof. C nti a Paese Gi acomel lo 29
A maior limitao da amplitude o fato de s levar em conta os valores extremos de um
conjunto, nada informado sobre os outros valores.

Exemplo:
1. Calcule a amplitude dos seguintes conjuntos de dados. Voc acha que a disperso
dos conjuntos igual?
a) 15 15 12 14 16 16 4 15
b) 5 4 5 4 6 5 16 4


6.2 Varincia
Calcula-se a varincia de uma amostra elevando-se as diferenas de cada um dos valores
em relao mdia, somando-se estas diferenas e dividindo-se por n-1.
1
2
2

=

n
) x x (
s
i
x


Quando se deseja a varincia populacional, deve-se substituir n-1 por n na frmula.
Usualmente iremos utilizar a varincia amostral.

Exemplo:
Clculo da varincia do conjunto de dados 2,4,6,8, e 10.

x
i
x
x x
i
( x x
i
)
2

2 6 -4 16
4 6 -2 4
6 6 0 0
8 6 2 4
10 6 4 16
Somas 0 40
10
1 5
40
1
2
2
=

=

n
) x x (
s
i
x



6.3 Desvio padro
O desvio padro simplesmente a raiz quadrada da varincia. Assim se a varincia 81, o
desvio padro ser 9.
Prof. C nti a Paese Gi acomel lo 30
( )
1 1
2
2
2

(
(

n
n
x
x
n
) x x (
s
i
i
i
x


Como anteriormente, a substituio de n-1 por n produz as frmulas para a populao.
A unidade na qual o desvio padro expresso a mesma dos dados originais, ou seja, se
os dados so em Reais, o desvio padro tambm vai ser em reais (e a varincia em
reais
2
).

Exemplo:
Clculo do desvio padro do conjunto de dados 20, 5, 10, 15 e 25.
Usando a frmula normal:
x
i
x
x x
i
( x x
i
)
2

20 15 5 25
5 15 -10 100
10 15 -5 25
15 15 0 0
25 15 10 100
Somas 0 250
91 7 5 62
1 5
250
1
2
, ,
n
) x x (
s
i
x
= =

=



Usando a frmula simplificada:

= + + + + = 75 25 15 10 5 20
i
x

= + + + + = 1375 25 15 10 5 20
2 2 2 2 2 2
i
x
( )
91 7
1 5
250
1 5
5
75
1375
1
2
2
2
,
n
n
x
x
s
i
i
x
=

(
(




6.4 Coeficiente de variao
O coeficiente de variao uma medida de variao til para comparar conjuntos de
dados diferentes. Ele usualmente expresso em percentual.

O coeficiente de variao dado pelo quociente entre o desvio padro e a mdia dos
dados.
Prof. C nti a Paese Gi acomel lo 31
X
S
Mdia
padro Desvio
CV
x
= =


Exemplo:
Entre os conjuntos de dados a seguir apresentados, qual apresenta maior variabilidade?
Conjunto A Conjunto B
12 3
25 4
16 5
23 2
Soluo: 3187 0
19
06 6
,
,
MdiaA
A Padro Desvio
CVA = = =
3688 0
5 3
29 1
,
,
,
MdiaB
B Padro Desvio
CVB = = =
Ento o conjunto que possui maior variabilidade o conjunto B.

Exerccios:
1. O desvio padro pode ser zero? Explique. Pode ser negativo? Explique.


2. Calcule a mdia e o desvio padro para as vendas dirias.
R$ 8100 R$ 9000 R$ 4580 R$ 5600 R$ 7680 R$ 4800 R$ 10640


3. Consideremos os seguintes dados correspondentes a preos de propostas.
26,5 27,5 25,5 26,0 27,0 23,4 25,1 26,2 26,8
Calcule a amplitude, a varincia, o desvio padro, a mdia, moda, mediana e os
quartis

7 7 M Me ed di id da as s d de e a as ss si im me et tr ri ia a e e c cu ur rt to os se e
As medidas de assimetria e curtose indicam qual o formato da distribuio dos dados em
relao distribuio normal (descrita adiante).
Assimetria o grau de desvio, ou afastamento da simetria, de uma distribuio. Ela
retorna a distoro de uma distribuio. O valor enviesado caracteriza o grau de assimetria
de uma distribuio em torno de sua mdia. Um valor positivo indica uma distribuio com
uma ponta assimtrica que se estende em direo a valores mais positivos. Um valor
Prof. C nti a Paese Gi acomel lo 32
negativo indica uma distribuio com uma ponta assimtrica que se estende em direo a
valores mais negativos. No excel a funo correspondente distoro.
Assimetria =

\
|

3
2 1 s
x x
) n )( n (
n
i







A curtose o grau de achatamento de uma distribuio e caracteriza uma distribuio em
cume ou plana se comparada distribuio normal (chamada mesocrtica). A curtose
positiva indica uma distribuio relativamente em cume (chamada leptocrtica). A curtose
negativa indica uma distribuio relativamente plana (chamada platicrtica). A funo
correspondente no excel chama-se CURT, e calcula a curtose de um conjunto de dados de,
no mximo, 30 valores.
Curtose =
) n )( n (
) n (
s
x x
) n )( n )( n (
) n ( n
i
3 2
1 3
3 2 1
1
2
4

\
|

+










Simtrica
a=0
Assimtrica negativa
a<0
Assimtrica positiva
a>0
Mesocrtica
c=0
Platicrtica
c<0
Leptocrtica
c>0
Prof. C nti a Paese Gi acomel lo 33
8 8 I In nt tr ro od du u o o p pr ro ob ba ab bi il li id da ad de e

As origens da probabilidade remontam ao sculo XVI. As aplicaes iniciais referiam-se
quase todas a jogos de azar. Os jogadores aplicavam o conhecimento da teoria das
probabilidades para planejar estratgias de apostas.
Atualmente a utilizao das probabilidades ultrapassou de muito o mbito desses jogos.
Hoje os governos, as empresas, as organizaes profissionais incorporam a teoria das
probabilidades em seus processos dirios de deliberaes.
Independentemente de qual seja a aplicao em particular, a utilizao das probabilidades
indica que existe um elemento de acaso, ou de incerteza, quanto ocorrncia ou no de
um evento futuro. Assim que, em muitos casos, pode ser virtualmente impossvel afirmar
por antecipao o que ocorrer, mas possvel dizer o que pode ocorrer.
H numerosos exemplos de tais situaes no campo dos negcios e do governo. A previso
da procura de um novo produto, o clculo dos custos da produo, a previso das safras,
a compra de aplices de seguros, a avaliao da reduo de impostos sobre a inflao. As
probabilidades so teis pois ajudam a desenvolver estratgias.
O ponto central em todas as situaes a possibilidade de quantificar quo provvel
determinado evento.
As probabilidades so utilizadas para exprimir a chance de ocorrncia de determinado
evento. O estudo das probabilidades importante pois elas so a base para o estudo
estatstico.

8.1 Experimento aleatrio
Experimentos aleatrios so aqueles que, mesmo repetidos vrias vezes sob condies
semelhantes, apresentam resultados imprevisveis.
Caractersticas dos experimentos aleatrios:
1. Podem ser repetidos indefinidamente sob as mesmas condies.
2. No se pode adiantar um resultado particular, mas pode-se descrever todos os
resultados possveis
3. Se repetidos muitas vezes apresentaro uma regularidade em termos de
freqncia de resultados.
Exemplos: lanamento de uma moeda, lanamento de um dado, aposta na loteria, ....

Ao descrever um experimento aleatrio deve-se especificar no somente que operao ou
procedimento deva ser realizado, mas tambm o que dever ser observado. (Note a diferena
entre o 2
o
e o 3
o
)
Joga-se um dado e observa-se o nmero obtido na face superior.
Joga-se uma moeda 4 vezes e o observa-se o nmero de caras obtido.
Prof. C nti a Paese Gi acomel lo 34
Joga-se uma moeda 4 vezes e observa-se a seqncia de caras e coroas.
Um lote de 10 peas contm 3 defeituosas. As peas so retiradas uma a uma
(sem reposio) at que a ltima defeituosa seja encontrada. Conta-se o
nmero de peas retiradas.
Uma lmpada nova ligada e observa-se o tempo gasto at queimar.
Lana-se uma moeda at que ocorra uma cara e conta-se ento o nmero de
lanamentos necessrios.
Lanam-se dois dados e anota-se o total de pontos obtidos.
Lanam-se dois dados e anota-se o par obtido.

8.2 Espao amostral
O espao amostral (S) de um experimento aleatrio o conjunto de todos os possveis
resultados do experimento.
n(S) o nmero de elementos do conjunto S, ou o nmero de resultados possveis.

Exemplo: um experimento o lanamento de uma moeda. Os possveis resultados so
cara ou coroa, ento, S={cara, coroa}.
Em dois lanamentos de uma moeda, sendo interessante observar a ordem dos resultados,
os possveis resultados so: 1) cara e cara, 2) cara e coroa, 3) coroa e cara e 4) coroa e
coroa. O espao amostral S={(Ca,Ca), (Ca,Co), (Co,Ca) e (Co,Co)}. n(S)=4

8.3 Eventos
Chama-se de evento qualquer subconjunto do espao amostral S de um experimento
aleatrio, ou seja, qualquer resultado do espao amostral.
n(A) o nmero de resultados associados ao evento A.

Exemplo: no lanamento de uma moeda S={cara, coroa}. Um evento de interesse A pode
ser obter cara no lanamento de uma moeda e n(A)=1.
No lanamento de um dado, o evento de interesse (A) pode ser obter face par e n(A)=3.

8.4 A probabilidade de um evento
Seja A um evento. A probabilidade deste evento ocorrer dada por P(A), que um
nmero entre 0 e 1. Quanto mais prxima a probabilidade estiver de 1, maior ser sua
chance de ocorrncia. A um evento impossvel atribui-se probabilidade 0, enquanto que
um evento certo tem probabilidade 1.
H trs maneiras diferentes de calcular ou estimar probabilidades: o mtodo clssico,
quanto o espao amostral tem resultados igualmente provveis. O mtodo emprico, que
Prof. C nti a Paese Gi acomel lo 35
se baseia na freqncia relativa de ocorrncia de um evento num grande nmero de
provas repetidas e o mtodo subjetivo, que utiliza estimativas pessoais de probabilidade,
baseadas num certo grau de crena. Em geral vamos utilizar o mtodo clssico de clculo
de probabilidades.

Quando os resultados so equiprovveis, a probabilidade de cada resultado funo do
nmero de resultados possveis:
possveis resultados de total mero n
A evento ao associados resultados de nmero
) A ( P =

Exemplo:
Experimento: lanar um dado e observar a face superior
Espao amostral: S={1,2,3,4,5,6} n(S)=6
Evento A: face par n(A)=3
P(A)= 3/6 = = 0,5 ou 50%

OBS: existe uma pequena diferena entre probabilidade e chance de um evento. A probabilidade
relaciona o nmero de resultados de A com o nmero de resultados total, enquanto que chance
compara o nmero de resultados de A com o nmero de resultados de outro evento (B ou C).
Em uma urna com 5 bolas brancas, 3 vermelhas e 2 azuis,
A probabilidade de selecionar uma bola branca P(branca)=5/10=0,5 ou 50%
E a chance de selecionar uma bola branca 5:5, que semelhante a 1:1, o que significa que existe a
mesma chance de retirar uma bola branca ou uma bola de outra cor.

Exerccios:
1. Escreva o espao amostral no lanamento de um dado. Ache a probabilidade
associada a cada evento.


2. Extrai-se uma carta de um baralho de 52 cartas. Determine a probabilidade de:
a) um valete
b) uma carta vermelha
c) um dez de paus
d) uma figura
e) uma carta de ouros
f) um nove vermelho

Prof. C nti a Paese Gi acomel lo 36
3. Complete a tabela com os valores calculados da probabilidade dos eventos
ocorrerem

Experimento Evento P(Evento)
Lanar uma moeda uma vez Cara

Lanar um dado uma vez Face 3

Extrair uma carta de um baralho com
52 cartas
6 vermelho

Extrair uma carta de um baralho de 52
cartas
Valete de ouros


4. Encontre n(S), n(A) e P(A) no lanamento de dois dados
Experimento: Lanar dois dados e observar a seqncia dos resultados
S={(1,1), (1,2), (1,3),.....,(6,4),(6,5),(6,6)}
N(S)=36
a. A: apaream faces iguais
b. A: a segunda face o dobro da primeira
c. A: apaream somente nmeros mpares
d. A: apaream faces iguais ou a segunda face o quadrado da primeira
e. A: a soma das faces igual a 7


5. H 50 bolas numa urna: 20 azuis, 15 vermelhas, 10 pretas e 5 verdes. Misturam-se
as bolas. Determine a probabilidade da bola escolhida ser:
a) Verde
b) Azul
c) Verde ou azul
d) No-vermelha
e) Vermelha ou verde
f) Amarela
g) No-amarela


Prof. C nti a Paese Gi acomel lo 37
6. Um motorista tem uma marca num de seus pneus, e 20% do pneu visvel. Ao
parar, qual a probabilidade da marca ficar na parte visvel?



7. Um motor tem 6 velas, e uma est defeituosa, devendo ser substituda. Duas esto
em posio de difcil acesso, o que torna difcil a substituio.
a) Qual a probabilidade de a vela defeituosa estar em posio difcil?
b) Qual a de no estar em posio difcil?



8. Os dados compilados pela gerncia de um supermercado indicam que 915 dentre
1500 clientes compradores de domingo gastam mais de R$ 40,00 em suas compras.
Estime a probabilidade de um comprador em qualquer domingo gastar mais de R$
40,00.


9. Uma pesquisa de trfego levada a efeito das 5 s 6 horas da manh num trecho de
uma rodovia federal revelou que, de 200 carros que pararam para uma verificao
rotineira de segurana, 25 tinham pneus em ms condies. Estime a probabilidade
de um carro que pare naquele trecho ter seus pneus em boas condies



8.5 Clculo das probabilidades
Muitas aplicaes da estatstica exigem a determinao da probabilidade de combinaes
dos eventos. H duas caractersticas de combinaes. Pode ser necessrio determinar a
probabilidade de ambos os eventos acontecerem P(A e B) ou a probabilidade de um deles,
A ou B, ou seja, P(A ou B).

Em um prdio com 2 elevadores, poderamos perguntar: Qual a probabilidade de ambos
elevadores estarem em servio? Ou ento, Qual a probabilidade de um ou outro elevador
estar em servio?

Ambos implica P(A e B)
Um ou outro implica P(A ou B)

Prof. C nti a Paese Gi acomel lo 38
Regra da adio:
A regra da adio leva em conta a ocorrncia do evento A ou do evento B ou de ambos os
eventos e denotada por P(AB).




P(A ou B) = P(A) + P(B) P(A e B)
Quando os eventos so mutuamente excludentes (no tem elementos em comum), ento a
probabilidade de ambos nula e o termo P(A e B) ser zero.
Se A e B so mutuamente excludentes P(A ou B) = P(A) + P(B)

OBS: Para apresentar os eventos utilizam-se os Diagramas de Venn [apresentados por John Venn
(1834-1923)], que representam os espaos amostrais e os eventos como crculos, quadrados, ou outra
figura geomtrica conveniente.


Exerccios:
1. Numa urna existem 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso.
Qual a probabilidade do nmero ser par ou maior que 4?


2. Numa urna existem 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso.
Qual a probabilidade do nmero ser um nmero primo ou maior que 8?
A B

Prof. C nti a Paese Gi acomel lo 39
Regra da multiplicao
Considerando-se dois eventos A e B de um mesmo espao amostral, a probabilidade de A e
B ocorrerem P(AB) dada por:





A probabilidade de A e B igual probabilidade de A, dado B, vezes
a probabilidade de B.
P(A e B) = P(A|B) P(B)
Onde P(A|B) a probabilidade de A ocorrer dado que B tenha ocorrido.

Quando a probabilidade de B ocorrer no depender de A ter ocorrido, dizemos que A e B
so independentes, e P(B| A)=P(B)
Se A e B so independentes P(A e B)=P(A)P(B)

Exemplo 1: Deve-se inspecionar uma grande caixa de peas. Os registros indicam que 2%
das caixas acusam contedo inferior ao estipulado. Escolhidas duas caixas aleatoriamente,
qual a probabilidade de ambas acusarem contedo inferior, admitindo-se que a remessa
inspecionada semelhante as anteriores (isto , 2% de deficientes)?
P(ambas deficientes)=P(deficiente)P(deficiente)
=0,02 x 0,02
=0,0004 ou seja, 0,04% de probabilidade das caixas serem defeituosas.

Exemplo 2: Suponha que 20 canetas esto expostas numa papelaria. Seis so vermelhas e
14 azuis. Do conjunto de 20, iremos escolher 2 canetas aleatoriamente. Qual a
probabilidade de que as duas canetas selecionadas sejam vermelhas?
Neste caso os eventos no so independentes, pois a cor da primeira caneta
selecionada vai determinar a probabilidade da segunda caneta ser vermelha.
Seja A=a segunda caneta selecionada vermelha
B=a primeira caneta selecionada vermelha
Desejamos P(A e B) = P(A|B) P(B) = 0789 0
380
30
20
6
19
5
, = |

\
|
= |

\
|
|

\
|

A B

Prof. C nti a Paese Gi acomel lo 40

Regras de probabilidade
P(A ou B), Para eventos no mutuamente excludentes:
P(A ou B ou ambos) = P(A) + P(B) P(A e B)
para eventos mutuamente excludentes:
P(A ou B) = P(A) + P(B)
P(A e B), para eventos independentes:
P(A e B) = P(A) . P(B)
Para eventos dependentes
P(A e B) = P(B).P(A/B) ou P(A).P(B/A)


Outra forma de apresentar os eventos atravs de tabelas de contingncia (tabelas com
cruzamento de classificaes).
Por exemplo:
Vermelha Preta Totais
s 2 2 4
No s 24 24 48
Totais 26 26 52


Exerccios

1. Uma urna contm 6 bolas vermelhas e 4 azuis. Em duas bolas consecutivas, sem
reposio, determine a probabilidade de retirar a primeira azul e a segunda
vermelha.


2. Uma urna contm 6 bolas vermelhas e 4 azuis. Em duas bolas consecutivas, com
reposio, determine a probabilidade de retirar a primeira azul e a segunda
vermelha.



3. Em um lote de 12 peas, quatro so defeituosas. Retira-se uma pea e inspeciona-
se. Qual a probabilidade:
a. Da pea ser defeituosa
b. Dela no ser defeituosa


Prof. C nti a Paese Gi acomel lo 41


4. Uma loja dispe de pneus novos e recapados. Entre 100 pneus, sabe-se que 30 so
recapados.
a. Se um cliente levar um pneu, qual a probabilidade de que ele seja recapado?

b. Se um cliente levar dois pneus, qual a probabilidade de que ambos sejam
recapados?


c. Se um cliente levar 4 pneus, qual a probabilidade de que todos sejam
recapados?




5. Um dado lanado 3 vezes. Calcule a probabilidade de que se obtenha face 6 nos 3
lanamentos.





6. Uma urna contm 50 bolas numeradas de 1 a 50. Sero selecionadas 5 bolas, sem
reposio. Qual a probabilidade de que uma pessoa que tenha feito um jogo
anotando os 5 nmero acerte todos?




Prof. C nti a Paese Gi acomel lo 42
7. Nos ltimos anos, as empresas de cartes de crdito intensificaram esforos no
sentido de abrir mais contas para alunos de faculdade. Suponha que uma amostra
de 200 alunos em sua faculdade apresentou as seguintes informaes em termos
de o aluno possuir carto de crdito bancrio e/ou carto de crdito de viagem e
entretenimento:

CC de viagem e entretenimento
Sim No
Totais
Sim 60 60 120
CC bancrio
No 15 65 80
Totais 75 125 200

a. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o
aluno possua um carto de crdito bancrio?
b. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o
aluno no possua um carto de crdito bancrio?
c. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o
aluno possua um carto de crdito bancrio e um carto de viagem e
entretenimento?
d. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o
aluno no possua um carto de crdito bancrio nem carto de viagem e
entretenimento?
e. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o
aluno possua um carto de crdito bancrio ou possua um carto de viagem
e entretenimento?
f. Suponha que um aluno possui um carto de crdito bancrio. Qual a
probabilidade de que ele possua um carto de viagem e entretenimento?
g. Suponha que o aluno no possui um carto de viagem e entretenimento.
Qual a probabilidade de que ele ou ela possua um carto de crdito
bancrio?
h. Os dois eventos, possuir um carto de crdito bancrio e possuir um carto
de viagem e entretenimento, so estatisticamente independentes? Explique.

Prof. C nti a Paese Gi acomel lo 43

9 9 D Di is st tr ri ib bu ui i e es s d de e p pr ro ob ba ab bi il li id da ad de e

O histograma usado para apresentar dados amostrais (Amostra=conjunto de
observaes extradas de uma populao)
Por exemplo, 50 valores de satisfao dos clientes so interpretados como uma amostra
da satisfao de todos os clientes.
O uso de mtodos estatsticos permite que se analise essa amostra e se tire alguma
concluso sobre a satisfao dos clientes.
Uma distribuio de probabilidade um modelo matemtico que relaciona um certo valor
da varivel em estudo com a sua probabilidade de ocorrncia.

H dois tipos de distribuio de probabilidade
1. Distribuies Contnuas: Quando a varivel que est sendo medida expressa
em uma escala contnua, como por exemplo, o peso de peas produzidas, dimetro, etc.
2. Distribuies Discretas: Quando a varivel que est sendo medida s pode
assumir certos valores, como por exemplo os valores inteiros 0, 1, 2, etc.

No caso de distribuies discretas, a probabilidade que a varivel X assuma um valor
especfico x
o
dada por: P {X = x
o
} = P(x
o
)
No caso de variveis contnuas, as probabilidades so especificadas em termos de
intervalos:

Relembrando: uma varivel aleatria uma funo com valores numricos, cujos
valores so determinados por fatores de chance.
Uma varivel aleatria considerada discreta se toma valores que podem ser
contados.
Uma varivel aleatria considerada contnua quando pode tomar qualquer valor
em determinado intervalo.

{ } P a x b f x dx
a
b
=

( )
Prof. C nti a Paese Gi acomel lo 44
Os grficos a seguir apresentam exemplos de distribuies de probabilidades discreta e
contnua.


Exemplo:
Distribuio de probabilidade para a varivel aleatria nmero de caras em duas jogadas
de uma moeda.

Resultado
Nmero de
caras
Valor da V.A.
Prob. do
resultado
Nmero de
caras
Valor da V.A
Prob. do
resultado
Cara Cara 2 x = 0
Cara Coroa 1 x =
Coroa Cara 1 x =
1 + =
Coroa Coroa 0 x = 2
Soma = 1 Soma = 1


O valor esperado, ou esperana matemtica, de uma varivel aleatria E(x), que consiste
no valor esperado para ela, ou seja, o valor mdio da varivel.

=
=
n
i
i i
x p ) x ( E
1
se X v.a. discreta
ou


= dx f(x) . x ) X ( E se X v.a. contnua
E a varincia de X dada por
2 2
)] X ( E [ ) X ( E ) X ( Var = .
O desvio padro ) X ( Var
Prof. C nti a Paese Gi acomel lo 45
Neste exemplo, o valor esperado 0 . + 1 . + 2 . = 1.
E a varincia Var(X)=E(X
2
)-[E(X)]
2
= E(X
2
) - 1= (0
2
. + 1
2
. + 2
2
.) 1 =1,5-1=0,5 E
o desvio padro = 0,71

Exemplo: um investidor julga que tem 0,4 de probabilidade de ganhar $ 25.000 e 0,6 de
perder $ 15.000. Seu ganho esperado de:
E(X) = 0,4 (25.000) + 0,6 (-15.000) = $ 1.000.
E a varincia Var(X)=E(X
2
)-[E(X)]
2
= E(X
2
) 1.000
2

=(0,4.25.000
2
+ 0,6.(-15.000)
2
)-1.000
2

=(0,4 x 625.000.000 + 0,6 x 225.000.000)-1.000
2

= 250.000.000+ 135.000.000 1.000
2

= 385.000.000 1.000.000
= 384.000.000
Desvio padro = $ 19.595,92


Exerccios:
1. O nmero de chamadas telefnicas recebidas por uma mesa e suas respectivas
probabilidades para um intervalo de 3 minutos so:
Nmero de chamadas 0 1 2 3 4 5 Total
Freqncia relativa 0,60 0,20 0,10 0,04 0,03 0,03 1,00
Em mdia, quantas chamadas podem ser esperadas num intervalo de trs minutos?

2. Um bilhete de loteria tem 0,00001 de chance de dar um prmio de $ 100.000,
0,00002 de chance de dar um prmio de $ 50.000 e 0,004 de chance de um prmio
de $ 25. Qual seria o preo justo de venda do bilhete?

3. Uma confeitaria estabeleceu um registro de vendas para certo tipo de bolo.
Determine o nmero esperado de bolos encomendados.
N bolos/dia 0 1 2 3 4 5 6 7 8 9 Total
Freqncia relativa 0,02 0,07 0,09 0,12 0,20 0,20 0,18 0,10 0,01 0,01 1,00

Prof. C nti a Paese Gi acomel lo 46
9.1.1 Distribuies discretas mais importantes
As principais distribuies discretas so a Distribuio de Bernoulli, Distribuio
Binomial e Distribuio Poisson.

Distribuio de Bernoulli
A distribuio de Bernoulli consiste em uma distribuio adequada varivel aleatria de
Bernoulli, que por sua vez uma v.a. que assume apenas os valores 0 e 1, com funo de
probabilidade tal que:
P(0) = P(X=0) = 1-p
P(1) = P(X=1) = p

Ento, E(X)=p e Var(X)=p(1-p)

Distribuio Binomial
Seja um processo composto de uma seqncia de observaes independentes, onde o
resultado de cada observao pode ser um sucesso ou uma falha.
Se a probabilidade de sucesso constante e igual a p, a distribuio do nmero de
sucessos seguir o modelo Binomial.
A distribuio Binomial usada com freqncia no controle de qualidade. o modelo
apropriado quando a amostragem feita sobre uma populao infinita ou muito grande.

A distribuio binomial possui quatro propriedades essenciais:
1. As observaes possveis podem ser obtidas atravs de dois diferentes
mtodos de amostragem. Cada observao pode ser considerada como se
tivesse sido selecionada a partir de uma populao infinita sem reposio ou
a partir de uma populao finita com reposio.
2. Cada observao pode ser classificada em uma de duas categorias
mutuamente excludentes e coletivamente exaustivas, usualmente chamadas
sucesso ou falha.
3. A probabilidade de uma observao ser classificada como sucesso (p)
constante de observao para observao. Assim sendo, a probabilidade de
fracasso 1-p tambm constante.
4. O resultado (isto , sucesso ou fracasso) de qualquer observao
independe do resultado de qualquer outra observao.

Em aplicaes de controle da qualidade, x em geral representa o nmero de defeituosos
observados em uma amostra de n itens.
Prof. C nti a Paese Gi acomel lo 47
x n x
) p ( p
x
n
) x ( P

|
|

\
|
= 1 e
)! x n ( ! x
! n
x
n

=
|
|

\
|

onde
|
|

\
|
x
n
representa o nmero de combinaes de n objetos tomados x de cada vez
P(X) = probabilidade de X sucessos uma vez que n e p so conhecidos
n = tamanho da amostra
p = probabilidade de sucesso 1-p = probabilidade de falha
X = nmero de sucessos na amostra (X=0, 1, 2, ..., n)
A mdia de uma varivel aleatria com distribuio binomial = np e a varincia
dada por
2
= np(1-p) onde p proporo de sucessos na amostra
n
x
p =

Exemplo:
Um processo industrial opera com mdia de 1% de defeituosos. Baseado em amostras de
100 unidades, calcule as probabilidades de uma amostra apresentar 0 , 1 , 2 , 3 e 4
defeituosos. Plote a distribuio de probabilidade correspondente.
Como a varivel aleatria pode apresentar apenas duas possibilidades, ser boa ou
defeituosa, a distribuio que melhor se ajusta a distribuio binomial, com
parmetros p=0,01 e n=100.
Ento, a probabilidade de uma amostra de tamanho n = 100 apresentar 0
defeituosos

x n x
) p ( p
x
n
) x ( P

|
|

\
|
= 1 P(x=0) = P(0) = =
|
|

\
|
0 100 0
01 0 1 01 0
0
100
) , ( , 0,366
P(x=1) = P(1) =
=
|
|

\
|
1 100 1
01 0 1 01 0
1
100
) , ( ,
0,370
P(x=2) = P(2) = =
|
|

\
|
2 100 2
01 0 1 01 0
2
100
) , ( , 0,185
P(x=3) = P(3) = =
|
|

\
|
3 100 3
01 0 1 01 0
3
100
) , ( , 0,061
P(x=4) = P(4) = =
|
|

\
|
4 100 4
01 0 1 01 0
4
100
) , ( , 0,015

Prof. C nti a Paese Gi acomel lo 48
0
0,1
0,2
0,3
0,4
x=0 x=1 x=2 x=3 x=4
P
(
x
)


Exerccios:
1. Um processo opera segundo uma chance de falha de 2%. Coletando amostras de 25
unidades, qual a probabilidade de uma amostra selecionada apresentar 2
defeituosos ou menos.





2. Imagine que para o processo anterior, fossem coletadas amostras de 50 unidades e
o critrio para parar o processo e procurar causas especiais fosse X=1 ou mais.
Calcule a percentagem de vezes que o processo seria interrompido logo aps a
amostragem.





Distribuio de Poisson

A aplicao tpica da distribuio de Poisson no controle da qualidade como um modelo
para o nmero de defeitos (no-conformidades) que ocorre por unidade de produto (por
m
2
, por volume ou por tempo)
Diz-se que existe um processo de Poisson se pudermos observar eventos discretos numa
rea de oportunidade um intervalo contnuo (de tempo, de comprimento, de rea, ...) de
maneira tal que, se encurtarmos a rea de oportunidade ou intervalo suficientemente:
1. A probabilidade de se observar exatamente um sucesso no intervalo
estvel
Prof. C nti a Paese Gi acomel lo 49
2. A probabilidade de se observar mais de um sucesso no intervalo zero
3. A ocorrncia de um sucesso em qualquer intervalo estatisticamente
independente da ocorrncia em qualquer outro intervalo

A distribuio de Poisson tem um parmetro (lambda) que a mdia ou o nmero
esperado de sucessos por unidade. A varincia desta distribuio
2
=. O nmero de
sucessos X da varivel aleatria de Poisson varia de 0 a .

A expresso matemtica para a distribuio de Poisson para se obterem X sucessos, dado
que sucessos so esperados :
! x
e
) x ( P
x


= onde x=0,1,2,....
onde P(X) = probabilidade de X sucessos, dado o conhecimento de
= nmero esperado de sucessos
e = constante matemtica (aproximadamente 2,71828)
X = nmero de sucessos por unidade

Exemplo:
Suponha que o nmero de defeitos no cordo de solda de uma carroceria siga uma
distribuio de Poisson com = 2.
Ento a probabilidade de uma carroceria apresentar mais de 3 defeitos ser:
P(X> 3) = 1 P(x3) = 1-[ P(x=0) + P(x=1) + P(x=2) + P(x=3)]
Onde
! x
e
) x ( P
x


=
!
e
) ( P
0
2
0
0 2
= = 0,135
P(x=1) =
!
e
) ( P
1
2
1
1 2
= = 0,271
P(x=2) = P(2) = 0,271 P(x=3) = P(3) = 0,180
Logo,
P(X> 3) = 1 P(x3) = 1-[ P(x=0) + P(x=1) + P(x=2) + P(x=3)]
= 1 [0,135+0,271+0,271+0,180]
= 1 [0,857]
=0,143 14%
A probabilidade de uma carroceria apresentar mais de trs defeitos 14%.

Exemplo 2:
Prof. C nti a Paese Gi acomel lo 50
Se chegam em mdia 2 carros por minuto em um posto de gasolina, qual a probabilidade
de que cheguem exatamente 5 carros em dois minutos?
Neste caso o tempo diferente do tempo correspondente ao . Ento deve-se transformar
o para que ele corresponda ao tempo de 2 minutos. Chegam em mdia 2 carros por
minuto chegam em mdia 4 carros em 2 minutos
= 4
! x
e
) x ( P
x


=
! 5
4
) 5 (
5 4
=
e
P = 0,1563 = 15,63%

Exerccios:
1. O setor financeiro de uma loja de departamentos est tentando controlar o nmero
de erros cometidos na emisso das notas fiscais. Suponha que esses erros sigam o
modelo de Poisson com mdia = 0,03. Qual a probabilidade de uma nota
selecionada ao acaso conter 1 ou mais erros?


2. Em uma indstria automotiva, defeitos superficiais de pintura ocorrem a uma taxa
de 0,15 defeitos/unidade. Encontre a probabilidade que uma unidade escolhida ao
acaso apresente 1 ou mais defeitos superficiais.



3. Em uma empresa industrial ocorrem, em mdia, 3 acidentes por ms. Qual a
probabilidade de que em um determinado ms, ocorra apenas um acidente?



4. Dez por cento das ferramentas produzidas por um certo processo de fabricao
revelaram-se defeituosas. Determinar a probabilidade de, em uma amostra de 10
ferramentas escolhidas ao acaso, exatamente duas serem defeituosas mediante o
emprego da distribuio de Poisson.


5. Se a probabilidade de um indivduo sofrer uma reao nociva, resultante da injeo
de um determinado soro 0,001, qual a probabilidade de, entre 2000 indivduos,
a) exatamente 3 sofrerem aquela reao? b) Mais de 2 sofrerem a reao?

Prof. C nti a Paese Gi acomel lo 51

9.1.2 Distribuies contnuas
A distribuio mais importante e mais utilizada na prtica a Distribuio Normal.
Outros modelos importantes de distribuies contnuas so: Uniforme, Exponencial, Gama,
Qui-Quadrado, t de Student e F de Snedecor.

Distribuio Normal
A Distribuio Normal essencialmente importante na estatstica por trs razes
principais:
1. Inmeros fenmenos contnuos parecem segu-la ou podem ser aproximados por
meio dela
2. Podemos utiliz-la para aproximar vrias distribuies de probabilidade discretas
3. Ela oferece a base para a inferncia estatstica clssica, devido sua afinidade
com o teorema do limite central

Os parmetros da distribuio Normal so a mdia e o desvio padro. Trata-se de uma
distribuio simtrica, unimodal, em forma de sino.

A funo de probabilidade da distribuio normal dada por:
2
2
1
2
1
|
|

\
|
=


x
exp ) x ( f


onde: e = constante matemtica (aproximada por 2,71828)
= constante matemtica (aproximada por 3,14159)
= mdia aritmtica da populao
= desvio padro da populao
X = qualquer valor da varivel aleatria contnua onde - < X <
Prof. C nti a Paese Gi acomel lo 52




















Para simplificar a notao de uma v.a.c. com distribuio normal, com mdia e varincia

2
utiliza-se:
X~ N(,
2
)
A distribuio Normal acumulada obtida calculando a probabilidade de X ser menor que
um dado valor a:


= =
a
dx ) x ( f ) a ( F ) a x ( P Funo densidade acumulada
Essa integral no pode ser resolvida em forma fechada, mas a soluo est apresentada
em tabelas onde se entra com a varivel reduzida ou varivel padronizada Z e
encontra-se F(Z) ou vice-versa.
) Z ( F
a
Z P ) a x ( P =
)
`



Valor tabelado (Procurar na tabela da distribuio Normal padronizada)


99,73%
95,44%
68,26%
-1 +1
-2 +2
-3 +3
Prof. C nti a Paese Gi acomel lo 53
Exemplo:
O peso de um produto uma caracterstica muito importante. Sabe-se que o peso segue
um modelo normal com mdia 1000 gramas e desvio padro 40 gramas. Se a especificao
tcnica estabelece que o peso deve ser maior que 950 gramas, qual a probabilidade de
que um pacote selecionado aleatoriamente satisfaa a especificao?
OBS: este esquema equivale
P(x>950) = 8944 0 5000 0 3944 0 25 1
40
1000 950
, , , ) , Z ( P Z P = + = > =
)
`


>






A probabilidade de que um pacote selecionado aleatoriamente satisfaa a especificao
de 89%.

Exemplo 2: Sabe-se que X representa medies feitas em um processo que segue o
modelo Normal com mdia 100 e desvio padro 10. Se forem feitas 4000 medies,
quantas estaro entre 95 e 112?

P(95<x<112)=
)
`


< <

10
100 112
10
100 95
Z P
= P(-0,5<Z<1,2)
=0,1915+0,3849
=0,5764 Aproximadamente 58% estaro entre 95 e 112.

Se forem feitas 4000 medies, aproximadamente 2305 estaro entre 95 e 112. (4000 x
57,64%)

=1000
=40

X=950
=0
=1

Z=-1,25
=100
=10

Valores tabelados
T
a
b
e
l
a
d
o

Prof. C nti a Paese Gi acomel lo 54
Exerccios:
1. A resistncia trao do papel usado em sacolas de supermercado uma
caracterstica de qualidade importante. Sabe-se que essa resistncia segue um
modelo Normal com mdia 40 psi e desvio padro 2 psi. Se a especificao
estabelece que a resistncia deve ser maior que 35 psi, qual a probabilidade que
uma sacola produzida com este material satisfaa a especificao?





2. O dimetro do eixo principal de um disco rgido segue a distribuio Normal com
mdia 25,08mm e desvio padro 0,05mm. Se as especificaes para esse eixo so
25,00 0,15mm (isto , varia de 24,85 a 25,15mm), determine o percentual de
unidades produzidas em conformidades com as especificaes.





3. A resistncia trao de isoladores cermicos apresenta distribuio Normal com
mdia 95 Kg e desvio padro 4 Kg. Se so produzidas 10.000 unidades desses
isoladores, quantos apresentaro resistncia inferior a 85 Kg? E quantos
apresentaro resistncia superior a 90 Kg?





4. A sada de uma bateria segue o modelo Normal com mdia 12,15 V e desvio padro
0,2 V. Encontre o percentual que ir falhar em atender s especificaes 12 V
0,5 V.



Prof. C nti a Paese Gi acomel lo 55
5. A vida til de lavadora de pratos automticas de 1,5 anos, com desvio padro 0,3
anos. Se os defeitos se distribuem normalmente, qual a probabilidade de uma
lavadora necessitar conserto antes de expirar o perodo de 1 ano de garantia?




6. O tempo necessrio, em uma oficina, para o conserto de transmisso para certo
carro normalmente distribudo com mdia 45 min e desvio padro 8 min. O
mecnico planeja comear o conserto do carro 10 min aps o cliente deix-lo na
oficina, comunicando que o carro estar pronto em 1 h. Qual a probabilidade de
que o cliente tenha que esperar caso o mecnico esteja enganado e o cliente fique
esperando?



7. Sabe-se que o contedo de uma lata de cerveja 350 ml e que tem distribuio
aproximadamente normal com mdia 350 ml e desvio padro 10 ml.
a. Que % de latas tem menos que 345 ml de contedo?
b. Que % de latas tem mais que 360 ml de contedo?



8. Uma fbrica de pneus fez um teste para medir o desgaste de pneus e verificou que
ele seguia o comportamento de uma curva normal com mdia 48.000 km e desvio
padro de 2.000 km. Calcule a probabilidade de um pneu escolhido ao acaso:
a. Dure mais que 47.000 km?
b. Dure entre 45.000 e 51.000 km?
c. At que quilometragem duram 90% dos pneus?



9. Descreva um exemplo de aplicao da distribuio normal na sua profisso. Qual
seria a mdia dos dados e o desvio padro?


Prof. C nti a Paese Gi acomel lo 56
1 10 0 T Te eo or ri ia a e el le em me en nt ta ar r d da a a am mo os st tr ra ag ge em m

A teoria da amostragem o estudo das relaes existentes entre uma populao e as
amostras dela extradas. muito utilizada para a estimao das grandezas desconhecidas
da populao (parmetros) atravs de conhecimento das grandezas correspondentes nas
amostras (estatsticas amostrais).
A teoria da amostragem tambm til para determinar se as diferenas observadas entre
duas amostras so devidas a uma variao casual ou so verdadeiramente significativas.
Por exemplo: queremos testar se os tempos de processamento da matria prima de dois
sistemas de produo so diferentes ou no. A resposta a esta questo implica o uso de
testes de hiptese, que ser visto mais adiante.
Denomina-se inferncia estatstica a inferncia de parmetros (da populao) com base
nos resultados obtidos na amostra.
Para que as concluses sejam vlidas, necessrio que a amostra selecionada seja
representativa da populao. Para isso podem ser utilizados os mtodos de amostragem
probabilsticos apresentados no captulo 1: aleatria, sistemtica, estratificada ou por
conglomerados. O mtodo mais utilizado o por amostragem aleatria.

10.1 Amostragem com e sem reposio
Quando selecionamos uma amostra devemos analisar se esta amostragem com ou sem
reposio. Na amostragem com reposio o mesmo elemento pode ser escolhido mais de
uma vez. Na amostragem sem reposio cada elemento s pode ser selecionado uma nica
vez.
Exemplo: uma urna contm dez bolas, numeradas de 0 a 9. Retira-se a primeira bola,
anota-se o nmero, 3 por exemplo, e no se recoloca a bola na urna. Os outros nmeros
que podem ser sorteados so 0, 1, 2, 4, 5, 6, 7, 8 e 9. Este sistema o sistema sem
reposio. Entretanto, se tivssemos recolocado a bola 3 na urna, ento todos os nmeros
poderiam ser selecionados na segunda extrao, inclusive o 3. Este sistema chamado
sistema com reposio.
Em geral, quando uma amostragem sem reposio, dizemos que a populao finita.
Quando uma amostragem com reposio, ento dizemos que a populao infinita, pois
a populao nunca ser exaurida. Para fins prticos a amostragem de uma populao finita
muito grande pode ser considerada infinita.

10.2 Distribuies amostrais
Consideremos todas as amostras possveis de tamanho n que podem ser retiradas de uma
populao dada (com ou sem reposio). Para cada amostra podemos calcular uma
grandeza estatstica, por exemplo, a mdia. Deste modo obtemos a distribuio amostral
da mdia. Da mesma forma podemos calcular a distribuio amostral do desvio padro, da
varincia, das propores, ...
Prof. C nti a Paese Gi acomel lo 57

Distribuio amostral das mdias
Uma distribuio amostral de mdias uma distribuio de probabilidade que indica quo
provveis so diversas mdias amostrais. A distribuio funo da mdia, do desvio
padro da populao e do tamanho da amostra. Para cada combinao da mdia, desvio
padro e tamanho da amostra haver uma nica distribuio amostral de mdias.

Sejam:
x
= mdia da populao =
x

= mdia da distribuio amostral


x
= desvio padro da populao =
x
= desvio padro da distribuio amostral
N = tamanho da populao
n = tamanho da amostra

Admita-se que todas as amostras possveis de tamanho n sejam retiradas de uma
populao finita de tamanho N>n. Ento:
Populao Finita: =
x
e
1

=
N
n N
n
x


Se a populao for infinita, ou se amostragem for tomada com reposio, os resultados
sero:
Populao Infinita:
=
x
e
n
x

=

A frmula do desvio padro nos diz que a quantidade de disperso na distribuio amostral
depende de dois fatores:
- a disperso da populao
- o tamanho da amostra (utilizando raiz quadrada)
Por exemplo, em qualquer populao, o aumento do tamanho das amostras extradas
resultar em menor variabilidade entre as possveis mdias amostrais. E se o mesmo
tamanho de amostra usado com diferentes populaes, as populaes com maior
quantidade de disperso
x
tendero a gerar maior quantidade de variabilidade entre as
mdias de amostras extradas delas.

Para amostras grandes n>30 a distribuio amostral das mdias aproximadamente
normal, com mdia
x

e desvio padro
x
, independente da populao, desde que a
varincia e a mdia da populao sejam finitas e o tamanho da populao seja, no
mnimo, o dobro da amostra. Este resultado para populao infinita um caso especial do
Prof. C nti a Paese Gi acomel lo 58
teorema do limite central da teoria avanada de probabilidade, que mostra que a preciso
da aproximao melhora quando n cresce. Isto indicado, algumas vezes, dizendo-se que
a populao assintoticamente normal. No caso da populao ser normalmente
distribuda, a distribuio amostral das mdias tambm o ser, mesmo para pequenos
valores de n (n<30).
Teorema do limite central
1. Se a populao sob amostragem tem distribuio normal, a
distribuio das mdias amostrais tambm ser normal para
todos os tamanhos de amostra.
2. Se a populao bsica no normal, a distribuio de mdias
amostrais ser aproximadamente normal para grandes
amostras.

Exemplos:
Calcule o desvio padro da distribuio amostral de mdias onde o desvio padro da
distribuio populacional 2 e o tamanho da amostra 40.
3162 0
40
2
,
n
x
x
= = =



Determine a mdia das distribuies de mdias amostrais, sendo que a mdia populacional
678.
678 = =
x x


A mdia de uma distribuio amostral de mdias 50 e seu desvio padro 10 (desvio
padro da distribuio amostral das mdias). Suponha normal a distribuio amostral.
Que percentagem das mdias amostrais estar entre 45 e 55?
O procedimento anlogo ao visto no captulo referente distribuio normal,
entretanto deve-se utilizar o valor de
x
= 50 e
x
=10.
Ento P(45<
x
<55)=0,3830

Um fabricante de baterias alega que seu artigo de primeira categoria tem uma vida
esperada (mdia) de 50 meses. Sabe-se que o desvio padro correspondente de 4
meses. Que percentagem de amostras de 36 observaes acusar vida mdia no intervalo
de 1 ms em torno de 50 meses, admitindo ser de 50 meses a verdadeira vida mdia das
baterias?
Sabemos que, como n>30, a distribuio das mdias amostrais ser
aproximadamente normal com mdia igual mdia populacional e desvio padro
igual ao desvio padro populacional dividido pela raiz quadrada do tamanho da
Prof. C nti a Paese Gi acomel lo 59
amostra. Alm disso vamos pressupor populao infinita, pois a produo de baterias
no termina (teoricamente!)











A soluo envolve a determinao do nmero de desvios padres que 49 e 51 distam
da mdia (amostral).
Determinemos primeiro o desvio padro da distribuio amostral:
67 0
36
4
,
n
x
x
= = =

para n=36
Ento devemos trabalhar com x N(50;0,67)
P(49< x <51)
x
x x
z

= 5 1
67 0
50 49
,
,
=


5 1
67 0
50 51
,
,
+ =


P(49< x <51)=P(-1,5<z<1,5) = 0,4332+0,4332=0,8664
Ento o percentual de amostras que apresentar problemas entre 49 e 51 meses
de 87%.



49 50 51
Meses
x

???
Prof. C nti a Paese Gi acomel lo 60
Distribuio amostral das propores
Sendo a probabilidade de ocorrncia de um evento p (sucesso) e a probabilidade de no
ocorrncia 1-p (fracasso).
Consideram-se todas as amostras possveis de tamanho n de uma populao infinita e,
para cada amostra, determina-se a proporo de sucessos. Assim obtm-se a distribuio
amostral das propores.
A mdia da distribuio amostral sempre igual proporo p p = onde
p = proporo populacional
p = mdia da distribuio amostral das propores
Quando a populao muito grande ou infinita, o desvio padro da distribuio amostral
se calcula
n
) p ( p
p

=
1

e pode-se fazer uma aproximao para a distribuio normal quando n>30.


Exemplos:
Determine a mdia da distribuio de propores amostrais, quando a proporo na
populao 72,3%
p =p=72,3%

Determine o desvio padro da distribuio amostral de propores para n=100 e uma
proporo populacional de 60%
049 0
100
6 0 1 6 0 1
,
) , ( ,
n
) p ( p
p
=

=

Verificou-se que 2% das ferramentas produzidas por uma certa mquina so defeituosas.
Qual a probabilidade de que, em uma remessa de 400 dessas ferramentas, 3% ou mais
revelarem-se defeituosas?
p =p=0,02 e
n
) p ( p
p

=
1
= 007 0
400
98 0 02 0
,
, * ,
=
Como n>30 pode-se utilizar a distribuio normal, ento
P(p>0,03)=P( % , , ) , z ( P )
,
, ,
z 636 7 07636 0 43 1
007 0
02 0 03 0
= = > =

>

Prof. C nti a Paese Gi acomel lo 61
Exerccios:
1. Determine a mdia da distribuio das propores amostrais quando a proporo na
populao ....
a. 30%
b. 99%
c. 54%

2. Calcule o desvio padro da distribuio amostral de mdias para cada um dos
seguintes casos:
a.
x
=6, n=6
b.
x
=6, n=20
c.
x
=6, n=40
d.
x
=6, n=100


3. Certas vlvulas fabricadas por uma companhia tm vida mdia de 800 horas e
desvio padro de 60 horas. Determinar a probabilidade de uma amostra aleatria
de 16 vlvulas, retiradas do grupo, ter vida mdia a) entre 700 e 810 horas;
b)inferior a 785 horas; c) superior a 820 horas; d) entre 770 e 830 horas.



4. Um fabricante faz a remessa de 1000 lotes de 100 lmpadas eltricas cada um. Se
5% das lmpadas so normalmente defeituosas, em quantos lotes pode-se esperar
que existam; a) menos de 90 lmpadas boas; b) 98 ou mais lmpadas boas


Prof. C nti a Paese Gi acomel lo 62
1 11 1 E Es st ti im ma a o o

A estimao o processo que consiste em utilizar dados amostrais para estimar
parmetros populacionais.
As estatsticas amostrais so utilizadas como estimadores de parmetros populacionais.
Assim, uma mdia amostral usada como estimativa da mdia populacional, a proporo
de defeituosos de uma caixa utilizada para estimar a proporo de defeituosos na
produo toda, etc.
Tais estimativas chamam-se estimativas pontuais, porque originam apenas uma nica
estimativa do parmetro. Em virtude da variabilidade amostral, usual incluir uma
estimativa intervalar para acompanhar a estimativa pontual. Esta nova estimativa
proporciona um intervalo, ou mbito, de possveis valores do parmetro populacional.

Estimativa pontual: estimativa nica de um parmetro populacional
Estimativa intervalar: intervalo de valores possveis, o qual se admite que esteja
contendo o parmetro.

Um intervalo de confiana d um intervalo de valores, centrado na estatstica amostral, no
qual julgamos, com um risco conhecido de erro, estar o parmetro da populao.

Exemplos:
Tipo de estimativa
Parmetro
populacional
Pontual Intervalar
Mdia Um carro de motor 1.0 anda, em
mdia, 14 km com um litro de
combustvel
Um carro de motor 1.0 anda, em
mdia, entre 12 e 16 km com 1
litro de combustvel

Proporo A proporo de peas defeituosas
de 2%
A proporo de peas defeituosas
est entre 1,5 % e 2,5 %

Desvio padro O desvio padro da temperatura
numa piscina no aquecida da
ordem de 2
o
C
O desvio padro da temperatura
numa piscina no aquecida est
entre 1
o
C e 3
o
C

Os intervalos de confiana podem ser unilaterais (por exemplo, a proporo de defeitos
maior de 3%) ou bilaterais (a proporo de defeitos est entre 2% e 4%).

Prof. C nti a Paese Gi acomel lo 63
A capacidade de estimar parmetros populacionais por meio de dados amostrais est
ligada diretamente ao conhecimento da distribuio amostral da estatstica que est sendo
usada como estimador.
Os intervalos de confiana para os parmetros so construdos de forma que se considera
uma variao em torno do valor amostral e, assim, pode-se escrever que o parmetro
situa-se entre dois limites:
Valor do parmetro = estimativa pontual erro de amostragem
O erro de amostragem depende da distribuio amostral do parmetro, do nvel de
confiana adotado e do tamanho da amostra.
A tabela a seguir apresentada resume as informaes necessrias para intervalos de
confiana.

Populao
Infinita Finita
Estimativa de mdias
Pontual x x
Intervalar
x
conhecido
n
z x
x

N
n N
n
z x
x



x
desconhecido
n
s
t x
x

1

N
n N
n
s
t x
x

Estimativa das propores
Pontual
p =
n
x
p =
n
x

Intervalar
n
) p ( p
z p

1

1
1

N
n N
n
) p ( p
z p

Onde:
z representa o valor tabelado da distribuio Normal, com nvel de confiana .
t representa o valor tabelado da distribuio t de Student, com nvel de confiana e GL
graus de liberdade
1

N o tamanho da populao
n o tamanho da amostra


1
O valor da distribuio t de Student depende do nmero de graus de liberdade
Prof. C nti a Paese Gi acomel lo 64
Exemplo:
Intervalo de confiana para a mdia quando se conhece a varincia de populao
x
Seja uma amostra de tamanho 36 de uma populao infinita, sabe-se que
x
=3 e x =24,2

Confiana
desejada
Z
(tabelado)
Frmula Clculo E Intervalo
90% 1,65
n
z x
x


36
3
65 1 2 24 , ,
24,20,825 23,375 a 25,025
95% 1,96
n
z x
x


36
3
96 1 2 24 , ,
24,20,980 23,220 a 25,180
99% 2,58
n
z x
x


36
3
58 2 2 24 , ,
24,21,290 23,110 a 25,690


Tamanho da amostra
Uma das perguntas mais freqentes em estatstica : Qual o tamanho da amostra que
devemos tomar?
O tamanho da amostra depender do grau de confiana desejado (z), da quantidade de
disperso entre os valores individuais (
x
), e de certa quantidade especfica de erro
tolervel (e).
O tamanho da amostra que voc afinal selecionar depender de
seu oramento, da importncia econmica das decises e da
variabilidade na populao. Desses trs problemas, dois so de
ordem gerencial, cabendo a voc a deciso; apenas o terceiro
(variabilidade) est fora do seu controle.(Brenda Landy, citada no
livro Pesquisa de Marketing Naresh Malhotra. - 2001)

A frmula do erro pode ser resolvida em relao a n. Assim, para o caso de estimao de
mdias, tem-se:
n
z e
x

=
e
z n
x

=
2
|
|

\
|
=
e
z n
x



E, para estimao de propores
n
p) p(1
z e

=

2
|
|

\
|

=
n
p) p(1
z e
2

2
2
e
p) - p(1 z
n =

Prof. C nti a Paese Gi acomel lo 65
Que tamanho de amostra ser necessrio para produzir um intervalo de 90% de confiana
para a verdadeira mdia da populao, com erro de 1,0 em qualquer dos sentidos, se o
desvio padro da populao 10?
Sabemos que
x
=10 e e=1 e queremos um intervalo 90% de confiana para a
mdia, o que implica utilizar um valor de z=1,65.
2
|
|

\
|
=
e
z n
x

25 272
1
10
65 1
2
, , n = |

\
|
= tamanho da amostra 273.

As companhias de seguro esto ficando preocupadas com o fato de que o nmero
crescente de telefones celulares resulte em maior nmero de colises de carros. Esto, por
isso, pensando em cobrar prmios mais elevados para os motoristas que utilizam celulares.
Desejamos estimar, com uma margem de erro de trs pontos percentuais, a percentagem
de motoristas que falam ao celular enquanto dirigem. Supondo que se pretende um nvel
de confiana de 95% nos resultados, quantos motoristas devem ser investigados?
Suponha que no tenhamos nenhuma informao sobre p.
2
2
e
p) - p(1 z
n = 11 , 1067
03 ,
96 ,
= =
2
2
0
0,5) - 0,5(1 1
n tamanho da amostra 1068.

Exerccios:

1. Os dados a seguir representam a temperatura coletada aleatoriamente em 15
cidades do estado. Determine o intervalo de confiana 90% para a temperatura
mdia. No dispomos da varincia populacional, mas sabemos que a populao
infinita. Dispomos apenas das seguintes informaes.

23 40 30 21 34
20 38 26 23 38
33 32 24 21 24


2. Uma amostra aleatria de 40 contas no comerciais na filial de um banco acusou
saldo mdio dirio de R$ 140 com desvio padro de R$ 30.
a. Construa um intervalo de 90% de confiana para a verdadeira mdia
b. Construa um intervalo de 95% de confiana para a verdadeira mdia
c. Construa um intervalo de 99% de confiana para a verdadeira mdia


Prof. C nti a Paese Gi acomel lo 66
3. Uma firma emprega diversos vendedores. Numa amostra aleatria de 15 notas de
despesa numa semana de dezembro, um auditor constatou uma despesa mdia de
R$ 220, com desvio padro de R$ 20.
a. Qual a estimativa pontual da despesa mdia?
b. Construa um intervalo de 99% de confiana para a quantia de despesa
mdia por vendedor.
c. Admitindo-se 200 vendedores, qual seria a estimativa pontual mdia para o
total de despesas?
d. Construa um intervalo de 99% de confiana para a quantia de despesa total.



4. Uma amostra aleatria de 40 homens trabalhando num grande projeto de
construo revelou que 6 no usavam capacetes protetores.
a. Construa um intervalo de 95% de confiana para a verdadeira proporo dos
que no esto utilizando capacetes neste projeto.
b. Se h 1000 operrios no projeto, converta o percentual em nmero de
capacetes necessrios para que todos estejam seguros.



5. Uma amostra aleatria de 1000 fregueses da parte da manh de um supermercado
revelou que apenas 10 no incluem leite em suas compras.
a. Qual seria a estimativa pontual da percentagem dos que compram leite?
b. Construa um intervalo de 90% de confiana para a verdadeira proporo dos
que compram leite.



6. Qual o tamanho de amostra necessrio para estimar o tempo mdio de que um
vendedor de uma loja de mveis gasta com cada cliente, admitindo erro de 1
minuto, para mais ou para menos, para obter um nvel de confiana de 99%.
Suponha x=12 minutos.



Prof. C nti a Paese Gi acomel lo 67
7. Determine o nmero de observaes necessrio para estimar o tempo mdio de
servio de atendimento a chamadas de um bombeiro hidrulico, se o erro mximo
deve ser de 0,6 hora para um nvel de confiana de 95%, sabendo que o tempo de
atendimento tem um desvio padro de 1 hora. Suponha normalidade na populao.





8. Um engenheiro deseja estimar a quantidade de acar existente nos alimentos
produzidos pela empresa. Ele coletou uma amostra de 18 unidades do alimento e
verificou mdia 24 gr de acar, com desvio padro de 5 gr. Construa o intervalo
de confiana de 90% para a quantidade de acar presente nos alimentos.






9. Numa pesquisa com funcionrios de uma empresa questionou-se a satisfao com a
poltica desenvolvida pela diretoria. De 300 funcionrios, 36 estavam insatisfeitos.
Construa uma estimativa para a proporo de funcionrios insatisfeitos, com 95%
de confiana.






10. O IBOPE est interessado em estimar a proporo de residncias que assistem ao
programa do Fausto. Qual o nmero mnimo de residncias que se deve analisar
para ter 95% de confiana e margem de erro mxima de 0,03 para a estimativa?

Prof. C nti a Paese Gi acomel lo 68
1 12 2 T Te es st te es s d de e h hi ip p t te es se es s
Os testes de hipteses so tambm conhecidos como testes de significncia.
A finalidade dos testes de hipteses avaliar afirmaes sobre os valores de parmetros
populacionais.
Os testes de hipteses e a estimao so dois ramos principais da inferncia estatstica.
Enquanto o objetivo da estimao estimar algum parmetro populacional, o objetivo dos
testes de hipteses decidir se determinada afirmao sobre um parmetro populacional
verdadeira. Por exemplo, podemos querer determinar se so verdadeiras as afirmaes:
- o tempo mdio de realizao do teste 80 minutos
- trs por cento da populao (de determinado item) defeituosa
- os percentuais de no conformes dos dois processos so iguais

Utilizam-se duas hipteses, sendo chamadas de hiptese nula (H
0
) e hiptese alternativa
(H
1
)
A hiptese nula H
0
uma afirmao que diz que o parmetro
populacional tal como especificado (isto , a afirmao
verdadeira)
A hiptese alternativa H
1
uma afirmao que oferece uma
alternativa alegao (isto , o parmetro maior (ou menor)
que o valor alegado)

Exemplo: O estudo de uma amostra de tamanho 55 peas indicou que o dimetro mdio
de 27,5 mm. Ento:
H
0
: o dimetro mdio da populao (de peas) 27,5 mm
H
1
: o dimetro mdio da populao (de peas) diferente de 27,5 mm

Os testes de hiptese utilizam a significncia adotada pelo pesquisador. A significncia a
probabilidade de uma hiptese nula ser rejeitada, quando verdadeira. Que coincide com o
erro tipo I.

Ao testar uma hiptese, h dois tipos de erros que podemos cometer:
= P {rejeitar H
0
/ H
0
verdadeira} = erro do tipo I
= P {aceitar H
0
/ H
0
falsa} = erro do tipo II

O procedimento usual fixar o valor de e verificar o valor de . O risco uma funo
do tamanho da amostra, e controlado indiretamente. Quanto maior o tamanho da
amostra, menor ser o risco .
Prof. C nti a Paese Gi acomel lo 69

Se H
0

Verdadeira Falsa
Aceitar H
0
Deciso correta Erro tipo II ()
Ao
Rejeitar H
0
Erro tipo I () Deciso correta

Basicamente os testes de hiptese envolvem as seguintes etapas:
1. Estabelecer as hipteses nula e alternativa;
2. Identificar a distribuio amostral adequada;
3. Escolher um nvel de significncia (e assim os valores crticos);
4. Calcular a estatstica do teste e compar-la com os valores crticos;
5. Rejeitar a hiptese de nulidade se a estatstica do teste excede o(s) valor (es)
crtico(s); caso contrrio, aceit-la.

Os testes de hiptese podem ser unilaterais ou bilaterais. Nos testes unilaterais a hiptese
alternativa H
1
do tipo >33 ou <33, por exemplo. Nos testes bilaterais a hiptese
alternativa do tipo 33. A hiptese nula permanece igual nos dois casos. A rea de
rejeio dividida quando o teste bilateral.







Exerccios
1. Para cada um dos seguintes casos, trace uma curva normal, indicando a rea de
rejeio na figura.
a) H
0
: =10, H
1
: 10, =0,02
b) H
0
: =120, H
1
: 120, =0,05
c) H
0
: =2000, H
1
: 2000, =0,01
d) H
0
: =2000, H
1
: >2000, =0,01
e) H
0
: =2000, H
1
: <2000, =0,01

/2 /2
Rejeitar H
0
Rejeitar
H
0

Rejeitar
H
0

Rejeitar H
0

H
1
: <33 H
1
: >33 H
1
: 33
Prof. C nti a Paese Gi acomel lo 70
2. Um fornecedor de mancais comprometeu-se a enviar para uma firma lotes que no
contenham mais de 2% de defeituosos. O comprador extrai amostras ao receber a
remessa, para verificar a qualidade. Indique H0 e H1.



3. Um engenheiro acredita que o tempo para produo de um motor de 5 horas. Ele
analisa uma amostra para verificar se est certo ou no. Escreva H0 e H1




12.1 Teste de hipteses para mdias

x
conhecido
Quando se conhece o desvio padro da populao, a distribuio amostral adequada a
distribuio normal. Se a populao normal, a distribuio amostral ser normal para
todos os tamanhos de amostra. Se a populao no normal, ou se sua forma
desconhecida, pode-se usar um teste de uma amostra s para tamanhos de amostras
superiores a 30 observaes. Assim, pequenas amostras de populao no normais no
podem ser tratadas por este processo.

Suponha que X uma varivel aleatria com mdia desconhecida e varincia
2
x

conhecida. E queremos testar a hiptese de que a mdia igual a um certo valor
especificado
0
. O teste de hiptese pode ser formulado como segue:
H
0
: =
0

H
1
:
0

Para testar a hiptese, toma-se uma amostra aleatria de n observaes e calcula-se a
estatstica
n
x
z
x
o
teste


=
E H
0
rejeitada se |Z
teste
| > Z
/2
(obtido em uma tabela da
distribuio normal).

Prof. C nti a Paese Gi acomel lo 71
Exemplo:
Uma mquina de usinagem deveria produzir entalhes com 0,85 mm de profundidade. O
engenheiro desconfia que os entalhes que esto sendo produzidos so diferentes que o
especificado.
Uma amostra de 8 valores foi coletada e indicou 847 0, X = . Sabendo que o desvio padro
=0,010, teste a hiptese do engenheiro usando um nvel de significncia =0,05.
85 0
8 010 0
850 0 847 0
850 0
850 0
1
,
/ ,
, ,
Z
, : H
, : H
teste
o
=


Como 96 1 85 0
025 0
, Z , Z
, teste
= > = H
0
no pode ser rejeitada.
Concluso: no podemos afirmar que os entalhes sejam diferentes que o especificado, ao
nvel de significncia de 0,05.


x
desconhecido
Quando no se conhece o desvio padro da populao, deve-se estim-lo a partir dos
dados amostrais usando o desvio padro amostral. Quando isso ocorre (na maioria das
situaes reais
x
desconhecido), a distribuio t a distribuio amostral adequada.
Suponha que X uma varivel aleatria Normal com mdia e varincia
2

desconhecidas. Para testar a hiptese de que a mdia igual a um valor especificado
o
,
formulamos:
o
o
: H
: H

=
1
0

Esse problema idntico quele da seo anterior, exceto que agora a varincia
desconhecida.

Como
X
no conhecido, usa-se a distribuio de Student para construir a estatstica do
teste:
n
s
x
t
x
o
teste

=


E a hiptese nula H
0
rejeitada se |t
teste
|>t
/2
, onde t
/2, n-1
um valor limite da
distribuio de Student tal que a probabilidade de se obter valores externos a t
/2
.
Prof. C nti a Paese Gi acomel lo 72
12.2 Testes de duas amostras para mdias
Os testes de duas amostras so usados para decidir se as mdias de duas populaes so
iguais. Exigem-se amostras independentes, ou seja, uma de cada populao. Eles so
freqentemente utilizados para comparar dois mtodos de ensino, duas cidades, duas
marcas, duas fbricas, ....
OBS: dados provenientes de antes-depois so dependentes, no podendo, portanto, serem
tratados por este mtodo.

x
conhecido
Quando h duas populaes com mdias desconhecidas, digamos
a
e
b
e desvios
padres conhecidos,
a
e
b
, o teste para verificar a hiptese que as mdias sejam iguais
o seguinte:
2 1 1
2 1

=
: H
: H
o

2
2
2
1
2
1
2 1
n n
X X
Z
teste

+

=
E rejeita-se H
0
se |Z
teste
| > Z
/2


x desconhecido
Similarmente, quando ,
a
e
b
, no so conhecidos, o teste para verificar a hiptese que
as mdias sejam iguais :
2
2
2
1
2
1
2 1
n
S
n
S
X X
t
x x
teste
+

=
E rejeita-se H
0
se |t
teste
| > t
/2, n1+n2-2


12.3 Teste para propores
Este tipo de teste apropriado quando os dados sob anlise consistem de contagem ou
freqncias de itens em duas ou mais classes. A finalidade de tal teste avaliar
afirmaes sobre a proporo (ou percentagem) de uma populao. O teste se baseia na
premissa de que uma proporo amostral ser igual verdadeira proporo populacional,
a menos da variabilidade amostral. O teste foca na diferena entre o nmero esperado de
ocorrncias (supondo-se verdadeira uma afirmao) e o nmero efetivamente observado.
A diferena ento comparada com a variabilidade prescrita por uma distribuio amostral
baseada na hiptese de que H
0
realmente verdadeira.
Prof. C nti a Paese Gi acomel lo 73
Quando a finalidade da amostragem julgar a validade de uma alegao acerca de uma
proporo populacional, apropriado o teste para propores.Onde:
H
0
: p = p
0

H
1
: p p
0


O valor da estatstica de teste dado por
n / ) p ( p
p
n
x
z
teste
0 0
0
1

=
e deve ser comparada com o valor crtico de Z (retirado de uma tabela da distribuio
normal)

Exemplo:
Um fabricante afirma que uma remessa de pregos contm menos de 1% de defeituosos.
Uma amostra aleatria de 200 pregos acusa 4 defeituosos. Teste a afirmao ao nvel
0,01.
H
0
: p = 1%
H
1
: p > 1% pois desejamos evitar a aceitao de uma remessa com mais de
1% de defeituosos, mas nada h contra aceitar o fato da remessa apresentar
qualidade superior acordada.

n / ) p ( p
p
n
x
z
teste
0 0
0
1

= = 42 1
200 01 0 1 01 0
01 0
200
4
,
/ ) , ( ,
,
z
teste
=

=
Na tabela da distribuio normal, z
0,01
=2,33
Aceita-se H
0
, e pode-se dizer que a quantidade de pregos defeituosos 1% ou
menos, ao nvel de significncia 0,01.


12.4 Teste do qui-quadrado (k amostras para propores)
A finalidade de um teste de k amostras avaliar se as propores de k amostras
independentes provenham de populaes que contenham a mesma proporo de
determinado item. Conseqentemente, tem-se:
H
0
: As propores populacionais so todas iguais
H
1
: As propores populacionais no so iguais
Ou seja, estamos testando se as duas variveis so ou no associadas, por exemplo, se
queremos testar se a proporo de mulheres e de homens que trabalham no horrio
Prof. C nti a Paese Gi acomel lo 74
noturno em uma fbrica so iguais, automaticamente estaremos testando se sexo e turno
de trabalho so variveis associadas.

Este teste baseia-se na distribuio qui-quadrado, onde o valor calculado deve ser
comparado com o valor tabelado. A deciso de aceitar ou rejeitar H
0
depender da
comparao deste valor com o valor tabelado da distribuio qui-quadrado.

Por exemplo, tem-se a distribuio de peas produzidas por turno e se essas peas so
boas ou apresentam algum tipo de defeito. No turno da manh foram produzidas 967
peas, onde 183 apresentaram algum tipo de defeito.

Turno de produo
Manh Tarde Noite
Total
Peas com algum defeito 183 30 11 224
Peas boas 784 264 308 1356
Total 967 294 319 1580

O teste baseia-se na pressuposio que, se as duas variveis fossem independentes, ento
o valor esperado de cada clula poderia ser encontrado fazendo-se:

geral _ total
) coluna _ total ( x ) linha _ total (
Esperada _ Frequncia =
Neste caso, a tabela com as freqncias esperadas seria:

Tabela de freqncias esperadas
Turno de produo
Manh Tarde Noite
Total
Peas com algum defeito 137,1 41,7 45,2 224
Peas boas 829,9 252,3 273,8 1356
Total 967 294 319 1580

1 137
1580
967 224
,
x
esperada _ Freq = =

Prof. C nti a Paese Gi acomel lo 75
O teste de independncia qui-quadrado obtido utilizando-se a estatstica


=
E
) E O (
2
2

Se o valor obtido for maior que o valor crtico obtido na tabela
2
ento diz-se que as
variveis NO so independentes. Se o valor encontrado for menor, ento diz-se que as
variveis so independentes.
O valor dos GRAUS DE LIBERDADE obtido atravs do clculo:
graus de liberdade = (colunas-1)(linhas-1)
No exemplo apresentado:
88 51
8 273
8 273 308
7 41
7 41 30
1 137
1 137 183
2 2 2
2
,
,
) , (
...
,
) , (
,
) , (
=

+ +

=
e o valor crtico encontrado na tabela para (2-1)x(3-1)=2 graus de liberdade e nvel de
significncia 0,05 5,991.

Tem-se valor calculado > valor tabelado ento diz-se que as variveis NO so
independentes. OU SEJA, a proporo de peas boas produzidas depende do turno de
trabalho. A proporo de peas boas no turno da manh 81%, na tarde 90% e na noite
97%.

Exerccios:
1. Um fornecedor apresenta uma caixa, e afirma que o peso mdio desta caixa de
368 gramas. De experincias anteriores sabe-se que o desvio padro da populao
vale 15 g e que os valores se comportam segundo a distribuio Normal. Para
verificar se a afirmao verdadeira, verifica-se uma amostra de 25 caixas, pesa-se
e calcula-se o peso mdio da amostra, achando 372,5 g. Qual a concluso a
respeito da afirmao do fornecedor, ao nvel de significncia 0,01?



2. Uma agncia de empregos alega que os candidatos diretoria por ela colocados
nos ltimos seis meses tm salrios de R$ 9000, em mdia. Uma agncia
governamental extraiu uma amostra aleatria daquele grupo, encontrando salrios
mdios de R$ 8000, com desvio padro de R$ 1000, com base em 50 empregados.
Teste a afirmao da agncia, contra a alternativa, de que o salrio mdio
inferior a R$ 9000, ao nvel de significncia 0,05.
Prof. C nti a Paese Gi acomel lo 76
3. O gerente de marketing de uma fbrica de automveis est interessado em
determinar a proporo de novos proprietrios de carros compactos que teriam
adquirido um air-bag inflvel para o lado do passageiro se o mesmo estivesse
disponvel a um custo adicional de $ 300,00. Por informaes anteriores, o gerente
acredita que a proporo 30%. Suponha que feito um levantamento com 200
novos proprietrios de carros compactos e 79 indiquem que teriam comprado os
air-bags inflveis. No nvel de significncia de 0,05, h evidencias de que a
proporo da populao diferente de 0,3?






4. Suponha que o diretor de produo de uma fbrica de tecidos precise determinar se
uma nova mquina est produzindo um tipo de tecido de acordo com as
especificaes do fabricante. As especificaes indicam que o tecido devia ter uma
resistncia de rompimento superior a 70 libras (1 libra = 433,59 gramas) e um
desvio padro de 3,5 libras. Uma amostra de 36 peas revela uma mdia aritmtica
da amostra igual a 69,7 libras. H evidncias de que a mquina no est atendendo
s especificaes, em termos da mdia da resistncia de rompimento? (utilize um
nvel de significncia de 0,05)





5. Uma rede de postos de gasolina afirma que, em seus estabelecimentos no se
vende gasolina adulterada. Sabe-se que, de acordo com os padres de qualidade, a
gasolina no pode conter mais de 240 ml de lcool por litro. O rgo de fiscalizao
colheu 25 medies do produto nos postos dessa rede, obtendo a partir delas uma
mdia de 240,75 ml de lcool/litro. Admitindo-se que a quantidade de lcool
presente na gasolina tem uma distribuio normal com desvio-padro de 2,5
ml/litro. Ao nvel de significncia 5%, pode-se afirmar que a gasolina adulterada?



Prof. C nti a Paese Gi acomel lo 77
6. Um psiclogo de indstrias deseja estudar os efeitos da motivao nas vendas, em
determinada empresa. Foi selecionada uma amostra aleatria de 24 indivduos, 12
de cada grupo. Os dados a seguir representam o volume de vendas (em milhares
de reais) alcanado durante o primeiro ms de emprego. H evidncias de que o
volume mdio de vendas seja diferente entre os grupos? (utilize nvel de
significncia 0,05)
Por hora Comisso
256 207 224 285
212 219 261 225
239 228 254 237
216 225 228 232
222 241 273 277
236 230 234 245





7. No caso judicial EUA versus Cidade de Chicago, foram postas em dvida as prticas
honestas de emprego. Um grupo minoritrio (A) e um grupo majoritrio (B) fizeram
o exame para capito do corpo de bombeiros, com os seguintes resultados:
Aprovados Reprovados
Grupo A 10 14
Grupo B 417 145
Com os resultados acima, e com nvel de significncia de 5%, teste a afirmao de
que o sucesso no teste independente do grupo.




8. Solicitou-se a quatro amostras de 30 funcionrios de uma grande empresa que
opinassem sobre a nova direo da empresa. Ao nvel de significncia 0,01, o que
se pode concluir?
Estagirios Treinees Tcnicos Gerentes
Aprovam 5 4 20 27
Desaprovam 25 26 10 3

Prof. C nti a Paese Gi acomel lo 78
9. Um estudo de usurios e no usurios do cinto de segurana resultou nos dados
amostrais aleatrios resumidos na tabela a seguir. Teste a afirmao de que a
quantidade de fumo independente do uso do cinto de segurana. Uma teoria
plausvel que as pessoas que fumam mais esto menos preocupadas com a sua
sade e segurana, sendo assim, menos propensas a usar cintos. Com nvel de
significncia 0,01, os dados amostrais apiam esta teoria?
Nmero de cigarros fumados por dia
0 1-14 15-34 35 ou +
Usam cinto de segurana 175 20 42 6
No usam cinto de segurana 149 17 41 9








10. A tabela abaixo apresenta dados relativos ao time vencedor em diferentes esportes.
Com o nvel de 0,05 de significncia, teste a afirmao de que as vitrias
casa/visitante so independentes do esporte.
Basquete Beisebol Hockey Futebol
O time da casa ganha 127 53 50 57
O time visitante ganha 71 47 43 42

Prof. C nti a Paese Gi acomel lo 79
1 13 3 A An n l li is se e d de e v va ar ri i n nc ci ia a ( (A AN NO OV VA A - - A An na al ly ys si is s o of f V Va ar ri ia an nc ce e) )

H situaes onde se deseja comparar vrias mdias, cada uma oriunda de um grupo
diferente. Esses grupos, tambm chamados tratamentos, poderiam ser 5 mquinas de
corte, ou 4 presses de operao, ou 4 layouts, 5 planos econmicos do governo, taxas
de cmbio em 3 diferentes pases, resultados da implantao de um novo sistema em duas
filiais, etc.

Exemplo:
Para verificar se existe diferena significativa entre os salrios mdios dos economistas da
Regio Sul, o sindicato da classe resolveu analisar os dados de algumas amostras. Assim
foram selecionados aleatoriamente 5 economistas de cada estado.

Econ.1 Econ.2 Econ.3 Econ.4 Econ.5
Rio Grande do Sul 370 420 280 340 410
Santa Catarina 280 350 430 290 405
Paran 325 400 295 350 380

Exemplo:
Uma classe com 24 crianas foi dividida em trs grupos. Cada grupo de crianas aprendeu
a ler de acordo com um mtodo (trs mtodos diferentes). Aps 3 meses as crianas
foram testadas, utilizando uma escala de 1 a 10. Os resultados foram

Mtodo A 5 0 3 5 4 5 8 2
Mtodo B 4 5 4 7 5 10 3 10
Mtodo C 3 5 0 3 3 9 4 9


Prof. C nti a Paese Gi acomel lo 80
Nesses casos, os dados foram tabelados conforme aparecem a seguir:

Tratamento Observaes
1 Y
11
, Y
12
... Y
1n1
2 Y
21
, Y
22
... Y
2n2
: :
: :
: :
k Y
k1
, Y
k2
... Y
knk


Os resultados poderiam ser representados por um modelo aditivo:
i
ij i ij
n ..., , 1 = j
k ,....., 1 i ; Y = + + =


Onde Y
ij
a observao j medida no tratamento i;
a mdia geral de todas as observaes;

i
o efeito do tratamento i;

ij
o erro aleatrio. (OBS: Para fins de testes de hiptese, supomos que o
erro aleatrio
ij
segue um modelo normal com mdia 0 e varincia
2

aproximadamente igual para todos os tratamentos)

Nosso objetivo ser testar a hiptese referente ao efeito dos tratamentos e estimar esses
efeitos, ou seja, verificar se existe diferena significativa entre os resultados apresentados
por cada grupo.

Existem dois tipos de problemas a serem abordados:
Modelo a nveis fixos: quando o efeito de cada tratamento fixo, como no caso em que
os tratamentos so 4 presses de operaes, ou 4 layouts fixados pelo engenheiro;
Modelo a nveis aleatrios: quando o efeito de cada tratamento aleatrio, como no
caso em que os tratamentos so k lotes de produo, ou k operadores escolhidos
aleatoriamente.

Prof. C nti a Paese Gi acomel lo 81
No modelo a nveis fixos, os efeitos dos tratamentos so definidos como desvios da mdia
geral, tais que:
j i, alguns para : H
..... : H
j i 1
k 2 1 0

= = =


Na H
o
(hiptese nula) supe-se que todas as mdias sejam iguais, ou seja, os
economistas tm o mesmo salrio nos trs estados (e as diferenas entre os seus salrios
so devidas ao acaso) ou os trs mtodos de ensino so equivalentes.
A H
1
(hiptese alternativa) indica que pelo menos uma das mdias difere, ou seja,
existem pelo menos dois estados com salrios diferentes entre si ou pelo menos dois
mtodos de ensino diferem.

O procedimento utilizado para comparar simultaneamente todos os grupos chamado de
Anlise de Varincia, que ser visto a seguir.

A anlise de varincia uma tcnica que pode ser
usada para determinar se as mdias de duas ou mais
populaes so iguais. O teste se baseia numa
amostra extrada de cada populao.

A Anlise de Varincia uma tcnica para investigar quanto de variabilidade em um
conjunto de observaes (dados) pode ser descrito por diferentes causas.

Os clculos associados Anlise de Varincia so apresentados em uma tabela, chamada
de Tabela de Anlise de Varincia ou Tabela ANOVA

Fonte de variao SQ GDL MQ Teste F
Entre grupos SQG k-1 MQG MQG/MQR
Dentro de grupos SQR N-k MQR
Total SQT N-1


onde k o nmero de nveis do fator.
N a quantidade total de observaes
Prof. C nti a Paese Gi acomel lo 82
A Anlise de Varincia se baseia na decomposio da variabilidade total. Mais
especificamente, os desvios das observaes individuais em relao mdia global podem
ser escritos como:

( ) ( ) ( )
Y Y Y Y Y Y
ij
i
ij
i
= +
..
.
..
.

(1)
onde:
( )
Y Y
i. ..

o desvio da mdia do tratamento i em relao mdia global;


( )
Y Y
ij
i

.
o desvio da observao individual em relao mdia do tratamento
correspondente;

Elevando ao quadrado ambos os termos da equao (1) e efetuando o somatrio, resulta:
( ) ( ) ( )
Y Y n Y Y Y Y
ij i
i i j
i
ij i
ij
= +
..
,
.
.. .
2 2 2
(2)
Na equao (2), identificamos as seguintes somas quadradas:
SQT = SQG + SQR
onde:
SQT a soma dos quadrados totais, decomposta em:
SQG soma dos quadrados dos grupos (tratamentos), associada exclusivamente a um
efeito dos grupos;
SQR soma dos quadrados dos resduos, devida exclusivamente ao erro aleatrio, medida
dentro dos grupos.
As divises das somas de quadrados (SQ) pelos graus de liberdade fornecem as mdias
quadradas (MQ), que so as estimativas de variabilidade de cada parcela.

Os graus de liberdade so obtidos atravs do nmero de nveis do fator e da quantidade
de repeties para cada nvel, ou seja, se o fator tem 5 nveis, ter 4 graus de liberdade
(k-1). Os graus de liberdade totais so obtidos atravs do total de observaes menos 1
(N-1) e os graus de liberdade dentro dos grupos ser a diferena entre eles (N-1)-(k-1) =
(N-k).

Para testar a hiptese referente ao efeito dos grupos, usamos a distribuio F :
MQR
MQG
F =

Prof. C nti a Paese Gi acomel lo 83
O valor resultante do teste F deve ser comparado com uma tabela de valores F, que indica
o valor mximo da estatstica no caso de H
o
ser verdadeira, a um determinado nvel de
confiana.
Como o valor tabelado de F contnuo e depende da combinao dos graus de liberdade
do numerador e do denominador, usual apresentar seus valores apenas para os nveis de
confiana 0,05 e 0,01. Os graus de liberdade para a determinao do valor F so os
mesmos apresentados na tabela da ANOVA.
Os valores constantes na tabela F so valores crticos: apresentam a linha divisria entre a
variao aleatria e a no aleatria. Ao fazer a anlise de varincia, utilizam-se as duas
estimativas amostrais da varincia para calcular uma razo F. Compara-se ento o nmero
resultante com o nmero tabelado. Se o valor calculado maior que o valor tabelado,
rejeita-se a hiptese nula. Se o valor calculado menor que o valor tabelado, a hiptese
nula no pode ser rejeitada.










13.1 Formulrio para soluo
Para o clculo das Somas Quadradas recomendado o uso do seguinte formulrio:
TC T N = ( .. )
2
( )
SQT Y TC
ij
=

2
( ) SQG T n TC
i i
=
.
2
( ) ( )
SQR Y T n SQT SQG
ij i i
= =

2 2
.

onde
TC o termo de correo
T.. a soma de todas as observaes
T
i
. a soma das observaes no grupo i

Valor tabel ado
Concl uir pelo
no-acaso
Rejeitar Ho
Concl uir pelo
acaso
Aceitar Ho
Nvel de signi ficncia = rea da cauda
0
Distribuio F
Prof. C nti a Paese Gi acomel lo 84
Resolvendo o exemplo dos mtodos de ensino atravs deste formulrio obtm-se:
Uma classe com 24 crianas foi dividida em trs grupos. Cada grupo de crianas aprendeu
a ler de acordo com um mtodo (trs mtodos diferentes). Aps 3 meses as crianas
foram testadas, utilizando uma escala de 1 a 10. Os resultados foram

Mtodo A 5 0 3 5 4 5 8 2
Mtodo B 4 5 4 7 5 10 3 10
Mtodo C 3 5 0 3 3 9 4 9

k = 3 (trs nveis do fator, mtodo A, B e C)
N = 24 (oito alunos por mtodo)
T.. = 5 + 0 + 3 + ... + 4 + 9 = 116 (somar todas as observaes)
T
A.
= 5 + 0 + 3 + 5 + 4 + 5 + 8 + 2 = 32 (somar as observaes do mtodo A)
T
B.
= 48 (somar as observaes do mtodo B)
T
C.
= 36 (somar as observaes do mtodo C)

TC = 116
2
/ 24 = 560,67
SQT = (5
2
+ 0
2
+ 3
2
+ ... + 4
2
+ 9
2
) 560,67 = 738 560,67 = 177,33
17,33 560,67 - 578,00 560,67
8
36
8
48
8
32
SQG
2 2 2
= =
|
|

\
|
+ + =

SQR = SQT SQG = 177,33 17,33 = 160,00

Ento a tabela da ANOVA ficaria:

Fonte de variao SQ GDL MQ Teste F
Entre grupos 17,33 2 8,67 1,14
Dentro de grupos 160,00 21 7,62
Total 177,33 23

O valor de F tabelado com 2 e 21 graus de liberdade no numerador e denominador,
respectivamente, e nvel de significncia de 0,05 F
0,05
3,49. Como F calculado < F
tabelado, conclumos que no h evidncias de que os mtodos de ensino alterem a
aprendizagem das crianas, ou seja, os mtodos de ensino devem ser equivalentes.

Prof. C nti a Paese Gi acomel lo 85

Utilizando o Excel
Clique em Ferramentas e depois em Anlise de Dados. (OBS: Se no seu
computador no aparecer Anlise de Dados porque este suplemento no est
ativado. V em Ferramentas, depois Suplementos. Disponibilize Anlise de
Dados e Anlise de Dados VBA.)

Selecione ANOVA Fator nico.
Preencha com as informaes que forem necessrias.



13.2 Exemplo de soluo no Excel
Uma classe com 24 crianas foi dividida em trs grupos. Cada grupo de crianas aprendeu
a ler de acordo com um mtodo (trs mtodos diferentes). Aps 3 meses as crianas
foram testadas, utilizando uma escala de 1 a 10. Os resultados foram

Mtodo A 5 0 3 5 4 5 8 2
Mtodo B 4 5 4 7 5 10 3 10
Mtodo C 3 5 0 3 3 9 4 9

Os dados devem agrupados em linhas ou colunas.
ou

No menu Ferramentas e Anlise de Dados, aps selecionar ANOVA fator nico.
Prof. C nti a Paese Gi acomel lo 86
Na janela da ANOVA informar as questes que forem solicitadas.

Os resultados estaro localizados na planilha chamada resultados.

Anova: fator nico
RESUMO
Grupo Contagem Soma Mdia Varincia
Mtodo A 8 32 4,0 5,714
Mtodo B 8 48 6,0 7,429
Mtodo C 8 36 4,5 9,714


ANOVA
Fonte da variao SQ gl MQ F valor-P F crtico
Entre grupos 17,33 2 8,67 1,14 0,340 3,47
Dentro dos grupos 160,00 21 7,62

Total 177,33 23

Tabelado
Calculado
Prof. C nti a Paese Gi acomel lo 87
Exerccios:
1. Suponha que o valor crtico de F na anlise de varincia seja 1,99 ao nvel de 0,05.
Com base na figura: a) Como voc interpretaria uma estatstica de teste maior que
1,99? b) Como voc interpretaria uma estatstica de teste menor que 1,99?










2. Duas turmas de pilotos de corrida de automveis esto sendo treinadas para uma
grande corrida no domingo. Cada turma faz cinco provas de troca dos quatro pneus
num carro. As turmas so equivalentes ou uma delas superior, ao nvel de
significncia 0,05? Complete a tabela da ANOVA e conclua a respeito.

Fonte de variao SQ GDL MQ Teste F
Entre grupos
Dentro de grupos 0,12
Total 0,22


3. Realiza-se um experimento para determinar-se as produes de cinco variedades de
trigo: A, B, C, D e E. So atribudos quatro lotes de terra para cada variedade e as
produes, em toneladas, esto apresentadas na tabela. Supondo-se que os lotes
possuem fertilidades semelhantes e que as variedades so atribudas aos lotes
aleatoriamente, determinar se existe diferena entre as produes ao nvel de
significncia 0,01.

A 20 12 15 19
B 17 14 12 15
C 23 16 18 14
D 15 17 20 12
E 21 14 17 18
1,99
0
Distribuio F
0,05
Prof. C nti a Paese Gi acomel lo 88
4. Uma empresa deseja testar quatro tipos diferentes de pneus: K, L, M e N. Suas
duraes, determinadas pelas bandas de rodagem, esto na tabela (em milhares de
quilmetros), onde cada tipo foi testado, aleatoriamente, em seis automveis
semelhantes. Determinar de existe diferena significante entre os pneus ao nvel de
significncia 0,05.

K 33 38 36 40 31 35
L 32 40 42 38 30 34
M 31 31 37 35 33 30
N 29 34 32 30 33 31


5. Um professor deseja testar trs mtodos diferentes de ensino I, II e III. Para isso so
escolhidos aleatoriamente trs grupos de cinco estudantes, e cada grupo instrudo
por um mtodo diferente. dada a mesma prova a todos os estudantes e os graus
obtidos constam na tabela. Determinar se existe diferena entre os mtodos de ensino
ao nvel de significncia 0,01.

I 75 62 71 58 73
II 81 85 68 92 90
III 73 79 60 75 81

6. A tabela apresenta os dados sobre a ferrugem acumulada sobre o ferro, que foi tratado
quimicamente com os produtos A, B ou C. Determinar se existe diferena significativa
nos tratamentos ao nvel de 0,05.

A 3 5 4 4
B 4 2 3 3
C 6 4 5 5

7. Um experimento mede os quocientes de inteligncia (QI) de estudantes do sexo
masculino de estaturas alta, mdia e baixa, cujos resultados aparecem na tabela.
Determinar se existe qualquer diferena nas contagens do QI em relao s diferentes
alturas ao nvel de significncia de 0,01.

Alta 110 105 118 90
Mdia 95 103 119 104
Baixa 108 112 104 93

Prof. C nti a Paese Gi acomel lo 89
8. A fim de produzir um tipo superior de rao para galinhas, adicionou-se rao
tradicional quatro quantidades diferentes de um mesmo produto qumico. Cada
quantidade de rao dada a 8 pintos e o peso das aves aps 3 meses anotado.
Concluir se houve diferena entre as quantidades do produto qumico ao nvel de
significncia 0,05.

20 mg 46 46 46 45 45 45 46 46
30 mg 48 48 47 47 47 47 47 48
40 mg 49 49 50 50 49 50 50 49
50 mg 52 53 52 52 52 52 53 53


9. Uma empresa deseja estudar trs tipos de enxerto para ver se todos apresentam o
mesmo crescimento anual. O que se pode concluir a respeito? (use nvel de
significncia 0,05)

Enxerto 1 Enxerto 2 Enxerto 3
14,4 10,8 11,1
14,8 12,2 9,5
12,7 11,2 10,8
12,2 12,8 12,7
10,9 13,0 10,9


10. Os dados abaixo do a vida observada dos pneus de quatro caminhes distribuidores
de sorvete, conforme a posio. Supondo comparveis os caminhes e os motoristas,
poderemos afirmar que a durao mdia independente da posio do pneu no
veculo? (use nvel de significncia 0,01). Disponha os clculos numa tabela ANOVA.
Qual a importncia da comparabilidade dos motoristas e veculos?

Dianteiro direito 17 19 20 24
Dianteiro esquerdo 25 27 18 22
Traseiro direito 22 21 19 26
Traseiro esquerdo 26 24 30 28



Prof. C nti a Paese Gi acomel lo 90
1 14 4 R Re eg gr re es ss s o o e e c co or rr re el la a o o

A anlise de regresso e de correlao compreende a anlise de dados amostrais para
saber se e como duas ou mais variveis esto relacionadas uma com a outra em uma
populao.

A anlise de correlao fornece o nmero
(coeficiente) que resume o grau de
relacionamento entre duas variveis.

A anlise de regresso apresenta como
resultado uma equao matemtica que
descreve um determinado relacionamento.

Os valores para a anlise de regresso e correlao provm de observaes e, para um
problema com duas variveis, cada observao d origem a dois valores, uma para cada
varivel. Uma das variveis ser a dependente e a outra independente.

Exemplos:
Famlia Renda Gastos Peso Altura Aluno
Notas 2
o

grau
Notas
faculdade
1 R$ 1550 R$ 1350 56 179 A 80 85
2 R$ 2000 R$ 1970 67 176 B 75 70
3 R$ 1000 R$ 550 89 180 C 95 95
... 58 170 D 60 65
n R$ 770 R$ 690 45 130 E 70 80

Uma maneira de apresentar os resultados atravs do diagrama de disperso.


Relao l inear
positiva perfeita
Relao l inear
negativa perfeita
X e y posi tivamente
correl acionados
X e y negati vamente
correl acionados
X e y no
correl acionados

Prof. C nti a Paese Gi acomel lo 91
Regresso
14.1 Aplicaes da regresso
1. Estimar valores de uma varivel com base em valores conhecidos de outra varivel.
(Situaes em que as duas variveis medem aproximadamente a mesma situao, mas
uma delas relativamente dispendiosa ou difcil de lidar, enquanto a outra no.)
2. Explicar valores de uma varivel em termos da outra, isto , pode-se suspeitar de
uma relao de causa e efeito.
3. Predizer valores de uma varivel.

OBS: OBS: OBS: OBS: A anlise da regresso apenas indica qual relacionamento matemtico pode existir, se
existir algum. Ou seja, nem a regresso, nem a correlao podem mostrar que uma varivel
tenda a causar certos valores de outra varivel, no garantido que exista relao de causa e
efeito.
... a correlao entre beber um copo de vinho por dia e a menor chance de infarto do
miocrdio um bom exemplo. Estudos recentes mostram que ela no se deve ao vinho e
ao lcool, mas sim ao betacaroteno, corante contido na uva. Para infelicidade de
muitos, tomar suco de uva d o mesmo resultado que beber vinho tinto. Jornal do
Brasil, 08/01/1999
14.2 Classificao das regresses
Quanto ao nmero de variveis: Simples (uma varivel independente explica bem o
fenmeno) ou Mltipla (mais de uma varivel independente so necessrias para explicar
bem o fenmeno)
Quanto qualidade da relao: Linear (os fenmenos podem ser bem explicados por
equaes de primeiro grau) ou No lineares (os fenmenos no podem ser bem explicados
por equaes de primeiro grau, exigindo funes de ordem superior).

14.3 Modelo linear
14.3.1 A equao da linha reta
Forma da equao linear:
bx a y + =

Duas caractersticas importantes so:
A ordenada da reta (valor de em y) determinado ponto (quando x=0) a
A inclinao da reta (coeficiente angular) b
O mtodo mais usado para ajustar uma linha reta a um conjunto de pontos conhecido
como mtodo dos mnimos quadrados.
Prof. C nti a Paese Gi acomel lo 92
n
x b y
a
) x ( ) x ( n
) y )( x ( ) xy ( n
b
2 2




=

=

14.3.2 Erro padro da estimativa linear
Uma vez que as estimativas a e b so funes de variveis aleatrias (x e y so variveis
aleatrias) necessrio verificar a preciso das estimativas, conhecendo o erro padro das
estimativas.
2 n
) xy b y a ( y
S
2
E

+
=



14.3.3 Intervalo de confiana para a estimativa
Para criar intervalos de confiana com base nos estimadores utiliza-se a equao:
E ervalo int
S t y

y =


Onde: y

obtido da equao.
t o valor da distribuio t de Student para n-2 graus de liberdade e nvel de
confiana determinado (tabelado)
e S
E
o erro padro da estimativa
Exemplo:
Seja y o consumo pessoal mdio e x o PIB do Brasil em anos consecutivos. Encontre o
Intervalo de confiana 90% para a estimativa quando o PIB for 10,0.

x y x
2
xy
7,0 10,1 49,00 70,70
7,3 10,6 53,29 77,38
7,8 11,3 60,84 88,14
8,6 12,4 73,96 106,64
8,1 11,9 65,61 96,39
8,3 11,9 68,89 98,77
8,2 11,5 67,24 94,30
8,6 12,1 73,96 104,06
9,0 13,1 81,00 117,90
9,6 14,1 92,16 135,36
9,1 14,6 82,81 132,86
x = 91,6 y = 133,6 x
2
= 768,76 xy = 1122,50

Prof. C nti a Paese Gi acomel lo 93
ideal que sempre se inicie o estudo de regresso com o grfico de disperso dos valores.
Consumo pessoal em funo do PIB
8,0
10,0
12,0
14,0
6,5 7,5 8,5 9,5 10,5
PIB
C
o
n
s
u
m
o

p
e
s
s
o
a
l


E o clculo de a e b fica:

668 , 1 b
2
(91,6) - (768,76) 11
(133,6) (91,6) - (1122,5) 11
= =
e 744 , 1
11
91,6 (1,668) - 133,6
a = =

x 668 , 1 744 , 1 y + = , ou PIB 668 , 1 744 , 1 Consumo + = ou seja, para cada unidade
acrescida do PIB, o consumo pessoal aumentar 1,668 unidades.

E o intervalo de confiana para y quando x=10 ser:

4653 , 0
2 11
)) 50 , 1122 ( 668 , 1 ) 6 , 133 )( 744 , 1 (( 28 , 1641
S
E
=

+
=

936 , 14 ) 10 ( 668 , 1 744 , 1 y = + =

) 4653 , 0 ( 833 , 1 936 , 14
int
=
ervalo
y
853 , 0 936 , 14
int
=
ervalo
y
Ou seja, quando o PIB estiver em 10,0 o Consumo Pessoal poder variar na faixa entre
14,083 e 15,789, com 90% de confiana.

Valor de t tabelado
Prof. C nti a Paese Gi acomel lo 94
Correlao
14.4 Objetivo da correlao
O objetivo da correlao determinar a fora do relacionamento entre duas observaes
emparelhadas, porque indica at que ponto os valores de uma varivel esto relacionados
com os valores da outra varivel.
O resultado da anlise de correlao chamado de coeficiente de correlao um valor
que quantifica o grau de correlao.
O mtodo mais comum de anlise de correlao envolve observaes em valores
numricos. Neste caso utiliza-se o coeficiente r de Pearson.

14.5 O coeficiente r de Pearson (correlao)
O coeficiente r de Pearson mede o grau de associao linear em duas variveis. Ele
possui duas propriedades importantes:
Seu sinal. Positivo indica correlao linear positiva, ou seja, medida que uma varivel
cresce, a outra cresce tambm. Sinal negativo indica correlao linear negativa, ou
seja, medida que uma varivel cresce, a outra decresce.
Sua grandeza indica quo prximos da reta esto os pontos individuais caso fosse
ajustada uma reta de regresso. O valor do coeficiente pode variar de 1 a 1.



-1

0

1
Correlao
negativa
forte
Inexistncia
de
correl ao
Correlao
positiva
forte

O clculo do valor do coeficiente r de Pearson pode ser obtido atravs da equao:
|
|

\
|

|
|

\
|

n
) y (
y
n
) x (
x
n
) y )( x (
xy
r
2
2
2
2


14.6 Coeficiente de determinao
O coeficiente de determinao ou de explicao (r
2
) indica quantos por cento a variao
explicada pela regresso representa da variao total.
r
2
= r.r e 0 r
2
1
Prof. C nti a Paese Gi acomel lo 95
Exemplo:
Prosseguindo o exemplo anterior, sendo y o consumo pessoal mdio e x o PIB do Brasil em
anos consecutivos.

x y x
2
y
2
xy
7,0 10,1 49,00 102,01 70,70
7,3 10,6 53,29 112,36 77,38
7,8 11,3 60,84 127,69 88,14
8,6 12,4 73,96 153,76 106,64
8,1 11,9 65,61 141,61 96,39
8,3 11,9 68,89 141,61 98,77
8,2 11,5 67,24 132,25 94,30
8,6 12,1 73,96 146,41 104,06
9,0 13,1 81,00 171,61 117,90
9,6 14,1 92,16 198,81 135,36
9,1 14,6 82,81 213,16 132,86
x = 91,6 y = 133,6 x
2
= 768,76 y
2
= 1641,28 xy = 1122,50

O clculo do coeficiente de correlao dado por:
=
|
|

\
|

|
|

\
|

=
11
) 6 , 133 (
28 , 1641
11
) 6 , 91 (
76 , 768
11
) 6 , 133 )( 6 , 91 (
5 , 1122
r
2 2
0,9446
Ou seja, existe uma correlao forte positiva entre os valores do PIB e do consumo
pessoal.
O valor do coeficiente de determinao : r
2
= 0,9446 x 0,9446 = 0,8923, o que significa
que 89% da variao total explicada por este modelo.


Utilizando o Excel
Maneira 1: A equao da forma y = a + bx para os valores dos pares (x,y) e
os coeficientes da reta so calculados utilizando o mtodo dos mnimos
quadrados.Aps colocar os valores em duas colunas (valores de x e valores de
y) v ao Assistente de Funo e escolha as funes INCLINAO para
determinar o valor de b e INTERCEPO para calcular o valor de a. Os
passos seguintes devem ser feitos seguindo as indicaes do programa. Para o
clculo da correlao utiliza-se no Assistente de Funo o CORREL. Em
Matriz1 devem ser colocadas as clulas referentes varivel x em Matriz2 as
clulas referentes varivel y.
Maneira 2: Selecionar Ferramentas e Anlise de dados e ento
Regresso. Informar o que for solicitado.

Prof. C nti a Paese Gi acomel lo 96
14.7 Exemplo de soluo no Excel
A velocidade mxima de automveis de frmula 1 com motores de mesma potncia
funo, entre outras variveis, do peso do veculo, no intervalo entre 700 e 800 Kg. Assim,
verificou-se qual a velocidade mxima atingida em uma reta de 1.200 m. Os resultados
foram:


Peso(Kg) 750 755 777 782 793
Veloc.Mx.(Km/h) 380 354 348 330 320

a) Construa o grfico dos dados
b) Qual a velocidade esperada para um veculo de 760 Kg?



GRFICO DOS DADOS (Diagrama de disperso)
Relao entre velocidade e peso dos veculos de F1
y = -1,181x + 1257,173
R
2
= 0,865
310
330
350
370
390
740 750 760 770 780 790 800
Peso
V
e
l
o
c
i
d
a
d
e

RESUMO DOS RESULTADOS

Estatstica de regresso
R mltiplo 0,930
R-Quadrado 0,865
R-quadrado ajustado 0,820
Erro padro 9,851
Observaes 5

S
e

R
Prof. C nti a Paese Gi acomel lo 97




ANOVA (teste de significncia para o modelo linear ajustado)
gl SQ MQ F F de significao
Regresso 1 1864,051 1864,051 19,207 0,022
Resduo 3 291,149 97,050
Total 4 2155,200







Coefici-
entes
Erro
padro
Stat t valor-P
95%
inferiores
95%
superiores
Inferior
95,0%
Superior
95,0%
Interseo 1257,173 207,862 6,048 0,009 595,662 1918,685 595,662 1918,685
Peso(Kg) -1,181 0,269 -4,383 0,022 -2,038 -0,323 -2,038 -0,323

A equao linear de relacionamento dos dados Velocidade =1257,173 1,181 Peso
Ento, a velocidade estimada para um veculo com 760 kg Velocidade=1257,173
1,181(760) = 359,61 km /hora





Se F de significao < 0,05, ento o
modelo linear ajustado aos dados
vlido. Se F > 0,05 o modelo no se
ajusta adequadamente aos dados.
Valores de a e b
Testes para a e b
Se valor-P < 0,05, ento a estimativa
vlida, caso contrrio significativamente
nula
Prof. C nti a Paese Gi acomel lo 98
Exerccios
1. Determinar o coeficiente de correlao dos dados a seguir:

X 1 2 3 6 9
Y 4 7 7 9 15
Se os dados forem correlacionados, estimar a reta de regresso:


2. A tabela a seguir apresenta os valores dos investimentos administrados on-line a partir
de 1998. Verifique se existe correlao entre os anos (x) e os investimentos (y), caso
exista correlao, apresente o intervalo de confiana de 95% para o valor dos
investimentos no ano de 2002 e 2003.

Ano Investimento
1998 374
1999 555
2000 908
2001 1010


3. Os grficos e a tabela indicam o nmero de anos de escolaridade das chefes de famlia
(x) e a participao feminina na renda familiar (y) em alguns anos


Nmero
de anos de
estudo
Participao na renda
(%)
1976 4,7 8,4
1990 5,7 16
1993 6,3 19
1996 6,6 21


a) Caso exista associao, quantos anos de estudo sero necessrios para que a
participao da mulher na renda familiar chegue a 50% ?
b) E qual ser a participao da mulher na renda familiar quando ela tiver 12 anos de
estudo?
c) Voc poderia estimar o ano em que a mulher ir participar com 50% da renda?


Prof. C nti a Paese Gi acomel lo 99
4. Aps uma regulagem eletrnica um veculo apresenta um rendimento ideal no que
tange o consumo de combustvel. Contudo, com o passar do tempo esse rendimento
vai se degradando. Os dados a seguir representam o rendimento medido ms a ms
aps a regulagem. Ajuste um modelo linear a estes dados. Calcule o coeficiente de
correlao. Interprete os resultados.

x: Meses aps a regulagem
1 2 3 4 5 6
y: Rendimento
10,7 10,9 10,8 9,3 9,5 10,4


x: Meses aps a regulagem
7 8 9 10 11 12
y: Rendimento
9,0 9,3 7,6 7,6 7,9 7,7


5. O gerente de uma indstria localizada em um pas tropical suspeita que h uma
correlao entre a temperatura do dia e a produtividade. Dados coletados
aleatoriamente ao longo de um perodo de seis meses revelaram o seguinte.

Temperatura 21,2 20,3 22,7 22,0 22,3 23,5 24,8 24,2 25,5 25,2 25,5 25,8
Produtividade 142 148 131 132 145 138 144 136 141 124 133 128

Temperatura 27,5 26,3 28,2 28,6 29,0 29,7 30,7 30,3 30,2 31,4 32,5 32,7
Produtividade 132 137 124 117 122 131 124 111 119 129 123 116

Plote um grfico de disperso e visualize a natureza da correlao entre temperatura e
produtividade. Depois estime a equao da reta de regresso e calcule o valor do
coeficiente de correlao. Interprete os resultados.
Estime a produtividade quando a temperatura estiver em 35 graus. Construa um
Intervalo de Confiana de 90% para esta produtividade.

6. Suponha que os valores obtidos para o desempenho de alunos em uma determinada
disciplina e as rendas familiares sejam os que seguem.
Aluno X
(renda)
Y
(desempenho)
1 750 5
2 690 8
3 400 4
4 900 9
5 200 2
6 1000 10
7 300 3
8 600 6
9 1200 10
Os dados so correlacionados? Justifique sua resposta. Se forem, estime a reta de
regresso.

Prof. C nti a Paese Gi acomel lo 100
7. A revista Exame Melhores e Maiores apresentou as maiores empresas do comrcio, por
vendas no ano anterior. Entre as que pertencem ao setor de comrcio varejista esto
destacadas as 11 maiores. Atravs da anlise da tabela e do grfico, o que voc pode
concluir?

Empresa
Nmero de
funcionrios
Vendas
(Milhes US$)
Carrefour 37.004 4.582,4
Po de Acar 39.642 3.976,4
Casas Bahia 11.508 1642,2
Sendas 16.990 1391,7
Ponto Frio 5.395 1223,6
Sonae 22.638 1083,9
Bompreo 13.225 1062,7
L. Americanas 12.485 900,6
McDonalds No informou 726,7
AgipLiquigs 3.804 693,1
Pernambucanas 10.787 619,1
Fonte: Revista Exame

Vendas no ano de 1999 das 11 maiores empresas do
Brasil do setor de comrcio varejista
y = -42,462 + 0,1015 x
R
2
= 0,801
-
500
1.000
1.500
2.000
2.500
3.000
3.500
4.000
4.500
5.000
- 5.000 10.000 15.000 20.000 25.000 30.000 35.000 40.000
Nmero de funcionrios
M
i
l
h

e
s

U
S
$



14.8 Outros modelos
Muitas vezes a forma funcional entre as variveis x e y no linear. Alguns modelos,
mesmo no sendo lineares, so facilmente linearizveis. Este procedimento busca facilitar
o clculo dos coeficientes da equao.
No entanto, o uso de softwares estatsticos, calculadoras e planilhas eletrnicas auxilia na
obteno dos coeficientes.
O valor de r
2
serve como uma forma de comparao entre os modelos. O modelo que
apresentar maior valor de r
2
o que apresenta melhor ajuste dos dados.
Prof. C nti a Paese Gi acomel lo 101

14.8.1 Funo exponencial -
x
ab y =



a>0 0<b<1 a>0 b>1 a<0 0<b<1 a<0 b>1

Utilizando as propriedades dos logaritmos pode-se chegar a Bx A Y + = onde
b log B e a log A , y log Y = = =

Pelo mtodo dos mnimos quadrados obtm-se A e B e depois convertem-se os valores
para a e b.
B A
10 b e 10 a = =


Exemplo
Uma empresa fabricante de brinquedos registrou suas vendas nos ltimos 10 anos,
obtendo os valores apresentados a seguir.

Ano (x) Vendas (y)
1 450
2 500
3 600
4 800
5 1.200
6 1.700
7 2.100
8 4.000
9 5.000
10 7.000

Vendas do brinquedo, por ano
0
2.000
4.000
6.000
8.000
10.000
0 1 2 3 4 5 6 7 8 9 10 11
Ano
V
e
n
d
a
s


O diagrama de disperso dos dados indica que a relao no linear.

Prof. C nti a Paese Gi acomel lo 102
Para ajustar uma funo exponencial, inicia-se com o clculo dos somatrios de Y, x, Y
2
,
x
2
e xY, onde Y = ln (y)

x y Y=ln(y) x
2
xY Y
2

1 450 6,11 1 6,11 37,32
2 500 6,21 4 12,43 38,62
3 600 6,40 9 19,19 40,92
4 800 6,68 16 26,74 44,68
5 1.200 7,09 25 35,45 50,27
6 1.700 7,44 36 44,63 55,33
7 2.100 7,65 49 53,55 58,52
8 4.000 8,29 64 66,35 68,79
9 5.000 8,52 81 76,65 72,54
10 7.000 8,85 100 88,54 78,39
Total: 55 23.350
73,25 385,00 429,64 545,39

Ento,
0,3245
) 55 ( ) 385 ( 10
) 25 , 73 )( 55 ( ) 64 , 429 ( 10
B
2
=

=
5399 , 5
10
) 55 ( 325 , 0 25 , 73
A =

=
3903 , 1 ) 3245 , 0 exp( ) B exp( b = = = e 42 , 254 ) 5399 , 5 exp( ) A exp( a = = =

Logo, a equao final ser
Vendas =(254,42)(1,3903)
ano


Observe como os valores estimados pela equao esto prximos dos valores reais,
observados na srie de dados.
0
1.000
2.000
3.000
4.000
5.000
6.000
7.000
8.000
1 2 3 4 5 6 7 8 9 10
Vendas
observadas
Vendas
estimadas pela
equao

Prof. C nti a Paese Gi acomel lo 103
14.8.2 Funo geomtrica ou de potncia -
b
ax y =



a>0 b mpar a>0 b par a<0 b mpar a<0 b par

Utilizando as propriedades dos logaritmos pode-se chegar a bX A Y + = onde
x log X e a log A , y log Y = = =

Pelo mtodo dos mnimos quadrados obtm-se A e b e depois convertem-se os valores
para a.
A
10 a =


Exemplo
Os dados a seguir apresentam a produo de veculos automotivos (y) ao longo do tempo
(x). Para estes dados ajuste um modelo de potncia

ano 59 60 61 62 63 64 65
produo 96,1 133,0 145,6 191,2 174,2 183,7 185,2

ano 66 67 68 69 70 71 72
produo 224,6 225,4 278,5 349,5 416,0 516,0 609,0

O diagrama de disperso dos dados sugere que um modelo potencial indicado.

Produo automobilstica anual
0,0
100,0
200,0
300,0
400,0
500,0
600,0
700,0
55 60 65 70 75
Ano
M
i
l
h
a
r
e
s

d
e

u
n
i
d
a
d
e

Prof. C nti a Paese Gi acomel lo 104
Clculo dos parmetros:

Ano Produo Y=ln(y) X=ln(x) Y
2
X
2
XY
59 96,1 4,565 4,078 20,843 16,626 18,616
60 133,0 4,890 4,094 23,916 16,764 20,023
61 145,6 4,981 4,111 24,809 16,899 20,476
62 191,2 5,253 4,127 27,597 17,033 21,681
63 174,2 5,160 4,143 26,628 17,166 21,379
64 183,7 5,213 4,159 27,179 17,296 21,682
65 185,2 5,221 4,174 27,263 17,426 21,796
66 224,6 5,414 4,190 29,315 17,553 22,684
67 225,4 5,418 4,205 29,353 17,679 22,781
68 278,5 5,629 4,220 31,690 17,804 23,753
69 349,5 5,857 4,234 34,299 17,928 24,797
70 416,0 6,031 4,248 36,369 18,050 25,621
71 516,0 6,246 4,263 39,014 18,170 26,625
72 609,0 6,412 4,277 41,111 18,290 27,421
Totais: 76,292 58,522 419,386 244,684 319,335

Assim,
7,970
) 522 , 58 ( ) 684 , 244 ( 14
) 292 , 76 )( 522 , 58 ( ) 335 , 319 ( 14
b
2
=

=
868 , 27
14
) 522 , 58 ( 970 , 7 292 , 76
A =

=
13 E 889 , 7 ) 868 , 27 exp( ) A exp( a = = =

Y=A+bX Y=-27,868+7,970X onde Y e X so, respectivamente, ln(x) e ln(y)

Ou ento, y=7,889E-13 x
7,970

Logo, a equao final ser
Produo de automveis =7,889E-13 (ano)
7,970


O grfico comparativo entre os valores observados para a produo e os estimados atravs
da curva Produo de automveis =7,889E-13 (ano)
7,970
:

Prof. C nti a Paese Gi acomel lo 105
0,0
100,0
200,0
300,0
400,0
500,0
600,0
700,0
59 60 61 62 63 64 65 66 67 68 69 70 71 72
Produo real
Produo estimada
pela equao


Exerccios
1. Aos dados a seguir ajuste um modelo exponencial e um polinomial. Estime a
quantidade de vendas para o ano de 2003, supondo que o comportamento dos dados
seja mantido. DICA: utilize os nmeros de 1 a 11 para os anos e calcule o valor de y quando x
for 14.

Ano 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Vendas 15 16 17 18 25 28 32 42 55 76 93


2. Se voc tivesse uma srie de dados como expressa no diagrama de disperso a seguir,
que modelo de regresso voc utilizaria? O que voc poderia dizer a respeito dos
valores dos parmetros?


3. Uma companhia de energia eltrica estimou o consumo mdio de energia das famlias
(kwh) de acordo com a renda (R$). Ajuste os seguintes modelos: y=ax
b
, y=ab
x
e
y=a+bx.
Renda 197 286 243 218 241 200 215 198 129 157 296 302
Consumo 1234 1432 1678 1300 1467 1245 1214 1200 770 890 2020 2100
Prof. C nti a Paese Gi acomel lo 106
1 15 5 T Ta ab be el la as s

Você também pode gostar