Escolar Documentos
Profissional Documentos
Cultura Documentos
Apostila PeE PDF
Apostila PeE PDF
Probabilidade e Estatstica
ndice
1 Introduo _____________________________________________________1
1.1 Amostragem ________________________________________________________ 2
1.2 Tipos de variveis ____________________________________________________ 4
2 Sries estatsticas _______________________________________________5
3 Grficos _______________________________________________________6
4 Distribuies de freqncias ______________________________________12
4.1 Construo de distribuio de freqncia para dados contnuos ______________ 12
4.2 Grficos das distribuies de freqncia _________________________________ 13
4.3 Construo de distribuio de freqncia para dados discretos ______________ 15
4.4 Construo de uma distribuio de freqncia acumulada___________________ 17
4.5 Distribuies de freqncia para dados nominais e por postos _______________ 18
4.6 Grficos para distribuies de freqncia ________________________________ 19
5 Medidas de tendncia central _____________________________________20
5.1 Mdia _____________________________________________________________ 20
5.2 Mediana ___________________________________________________________ 23
5.3 Moda _____________________________________________________________ 25
5.4 Relao entre as medidas de tendncia central ___________________________ 26
6 Medidas de variabilidade ________________________________________28
6.1 Amplitude _________________________________________________________ 28
6.2 Varincia __________________________________________________________ 29
6.3 Desvio padro ______________________________________________________ 29
6.4 Coeficiente de variao ______________________________________________ 30
7 Medidas de assimetria e curtose __________________________________31
8 Introduo probabilidade_______________________________________33
8.1 Experimento aleatrio _______________________________________________ 33
8.2 Espao amostral ____________________________________________________ 34
8.3 Eventos ___________________________________________________________ 34
8.4 A probabilidade de um evento _________________________________________ 34
8.5 Clculo das probabilidades ____________________________________________ 37
9 Distribuies de probabilidade ____________________________________43
10 Teoria elementar da amostragem ________________________________56
10.1 Amostragem com e sem reposio ____________________________________ 56
10.2 Distribuies amostrais _____________________________________________ 56
Estuda-se estatstica para aplicar seus conceitos como auxlio nas tomadas de deciso
diante de incertezas, justificando cientificamente as decises.
Os princpios estatsticos so utilizados em uma grande variedade de situaes no
governo, nos negcios e na indstria, bem como no mbito das cincias sociais, biolgicas
e fsicas.
Estatstica a cincia ou mtodo cientfico que estuda os fenmenos multicausais,
coletivos ou de massa e procura inferir as leis que os mesmos obedecem.
Mtodo estatstico um processo para se obter, apresentar e analisar caractersticas ou
valores numricos para uma melhor tomada de deciso em situaes de incerteza. Os
passos da metodologia estatstica so os seguintes:
Definio cuidadosa do problema
Formulao de um plano para coleta das unidades de observao
Coleta, resumo e apresentao das unidades de observao ou de seus valores
numricos
Anlise dos resultados
Divulgao de relatrio com as concluses, de tal modo que estas sejam facilmente
entendidas por quem as for usar na tomada de decises.
Exemplo:
Populao Amostra
1.1 Amostragem
O objetivo da amostragem permitir fazer inferncias sobre uma populao aps inspeo
de apenas parte dela. Fatores como custo, tempo, ensaios destrutivos e populaes
infinitas tornam a amostragem prefervel a um estudo completo (censo).
Os principais tipos de amostragem utilizados so os probabilsticos, onde todos os
indivduos da populao tm a mesma chance de serem selecionados. Os planos de
amostragem probabilstica so delineados de tal modo que se conhece todas as
combinaes amostrais possveis e suas probabilidades, podendo-se ento determinar o
erro amostral.
Os mtodos mais comuns de amostragem probabilstica so:
Amostragem aleatria simples: os elementos de uma populao so escolhidos de
tal forma que todos tenham a mesma chance de serem escolhidos. Pode-se utilizar
uma tabela de nmeros aleatrios ou um programa de gerao de nmeros
aleatrios.
Amostragem estratificada: subdivide-se a populao em, no mnimo, dois estratos
(subpopulaes) que compartilham a mesma caracterstica e em seguida escolhe-se
uma amostra de cada. Exemplo: homens e mulheres.
Amostragem sistemtica: escolhe-se um ponto de partida e ento,
sistematicamente, selecionam-se os outros. Por exemplo: o 3, 403, 803,
1203,... indivduos
Variveis
Quantitativas Qualitativas
Discretas Contnuas
Exerccios:
Identifique cada nmero como discreto ou contnuo
1. Cada cigarro Camel tem 16,13 mg de alcatro
2. O altmetro de um avio da American Airlines indica uma altitude de 21.359 ps
3. Uma pesquisa efetuada com 1015 pessoas indica que 40 delas so assinante de um
servio de informao on-line.
4. O tempo total gasto anualmente por um motorista de txi de Nova York ao dar
passagem a pedestres de 2367 segundos.
Sries geogrficas
Os dados esto reunidos de acordo com o local, que varia. Os outros dois fatores - fato e
data - permanecem inalterados.
As sries podem ainda apresentar-se sob a forma mista, resultante da combinao dos
fatores.
3 Grficos
Os grficos consistem em uma forma de apresentao dos dados, usualmente utilizada
pois facilita a interpretao dos resultados.
So elementos complementares de um grfico:
Ttulo geral, poca e local
Escalas e respectivas unidades de medida
Indicao das convenes adotadas (legenda)
Fonte de informao dos dados
Colunas
Um grfico de colunas mostra as alteraes
de dados em um perodo de tempo ou
ilustra comparaes entre itens. As
categorias so organizadas na horizontal e
os valores so distribudos na vertical, para
enfatizar as variaes ao longo do tempo.
Barras
Um grfico de barras ilustra comparaes
entre itens individuais. As categorias so
organizadas na vertical e os valores na
horizontal para enfocar valores de
comparao.
Pizza
Um grfico de pizza mostra o tamanho
proporcional de itens que constituem uma srie
de dados para a soma dos itens. Ele sempre
mostra somente uma nica srie de dados, sendo
til quando voc deseja dar nfase a um
elemento importante.
Totaliza a informao (100%). Cada faixa do
grfico proporcional informao.
freqncias. 0.30
0.25
% das rvores
0.20
Apresenta as classes ao longo do eixo 0.15
horizontal e as freqncias (absolutas ou 0.10
0.05
relativas) ao longo do eixo vertical. As 0.00
3a8 8 a 13 13 a 18 18 a 23 23 a 28 28 a 33
fronteiras das barras coincidem com os Safras (alq.)
pontos extremos dos intervalos de classe.
rea
Um grfico de rea enfatiza a
dimenso das mudanas ao longo do
tempo. Exibindo a soma dos valores
plotados, o grfico de rea mostra
tambm o relacionamento das partes
com um todo.
Nesse exemplo, o grfico de rea
enfatiza o aumento das vendas em
Washington e ilustra a contribuio
de cada estado para o total das
vendas.
Superfcie
Um grfico de superfcie til quando
voc deseja localizar combinaes
vantajosas entre dois conjuntos de dados.
Como em um mapa topogrfico, as cores e
os padres indicam reas que esto no
mesmo intervalo de valores.
Esse grfico mostra as vrias combinaes
de temperatura e tempo que resultam na
mesma medida de resistncia trao.
Aes
O grfico de alta-baixa-fechamento usado muitas vezes para ilustrar preos de aes.
Esse grfico tambm pode ser usado com dados cientficos para, por exemplo, indicar
mudanas de temperatura. Voc deve organizar seus dados na ordem correta para criar
esse e outros grficos de aes.
Um grfico de aes que mede o volume tem dois eixos de valores: um para as colunas,
que medem o volume, e outro para os preos das aes. Voc pode incluir volume em um
grfico de alta-baixa-fechamento ou de abertura-alta-baixa-fechamento.
O grfico nesse exemplo mostra que a Empresa A tem a maioria dos produtos e a maior
fatia do mercado, mas no necessariamente as melhores vendas.
Rosca
Como um grfico de pizza, o grfico de
rosca mostra o relacionamento das partes
com o todo, mas pode conter mais de uma
srie de dados. Cada anel do grfico de
rosca representa uma srie de dados.
Exemplo:
Os dados a seguir representam o tempo (em minutos) que 45 operadores de mquina
demoraram para fazer o setup de uma mquina.
6,5 4,0 7,1 8,3 5,4 7,6 9,0 15,7 16,7
6,4 5,0 8,5 5,7 7,7 7,2 12,4 7,1 5,5
9,7 4,4 7,0 6,3 8,3 6,9 5,7 7,6 7,9
7,9 6,0 8,2 10,4 9,9 3,9 9,8 8,2 5,6
7,9 6,4 7,4 7,0 13,0 8,7 6,4 6,7 7,4
Tempo Nmero de % de
(minutos) operadores operadores
3 | 5 equivale a 3 < x 5
3 | 5 4 8,9% Ou seja, so contados no
intervalo todos os valores
5 | 7 15 33,3%
superiores a 3 e inferiores ou
7 | 9 18 40,0% iguais a 5.
9 | 11 4 8,9%
11 | 13 2 4,4%
13 | 15 0 0,0%
15 | 17 2 4,4%
Total 45 100%
20 18
18
15
Nmero de operadores
16
14
12
10
8
6 4 4
4 2 2
2 0
0
3 | 5 5 | 7 7 | 9 9 | 11 11 | 13 13 | 15 15 | 17
Tempo (minutos)
20
18 18
Nmero de operadores 16
15
14
12
10
8
6
4 4 4
2 2 2
0 0
3 | 5 5 | 7 7 | 9 9 | 11 11 | 13 13 | 15 15 | 17
Tempo (minutos)
OBS: uma vez que a rea do polgono deve ser 100%, deve-se ligar o primeiro e o ltimo
pontos mdios com o eixo horizontal, de modo a cercar a rea da distribuio observada.
Exerccios:
1. A tabela de dados representa o peso de 30 sacos de arroz da marca A selecionados
aleatoriamente em um supermercado. Construa a distribuio de freqncias e
apresente em um grfico. (para facilitar os dados j esto ordenados)
922 930 936 950 954 954 958 965 968 974
977 979 987 989 1001 1006 1008 1010 1013 1017
1018 1034 1034 1035 1042 1044 1044 1048 1070 1116
8,8 8,3 11,8 11,8 14,7 8,5 7,7 11,4 11,2 10,6
5 4 5 3 4 5 6 0 8 4
4 1 9 5 7 5 5 4 5 8
4 5 3 2 6 7 4 3 1 4
0 0 5 4 2 6 6 2 8 7
Freqncia % dos
Classe
dias dias
0 3 0,06
12
1 3 0,06
10
2 4 0,08
Nmero de dias
8
3 5 0,10
6
4 10 0,20
4
5 10 0,20
2
6 6 0,12
0
7 4 0,08 0 1 2 3 4 5 6 7 8 9
8 3 0,06
9 2 0,04
50 1,00
Freqncia % dos
Classe dias dias
25
0-1 6 0,12
20
Nmero de dias
2-3 9 0,18 15
4-5 20 0,40 10
5
6-7 10 0,20
0
8-9 5 0,10 0-1 2-3 4-5 6-7 8-9
50 1,00
Por outro lado, prefere-se uma distribuio de freqncia com perda da informao
quando:
Esto em jogo inteiros e no inteiros
S existem inteiros, porm em nmero muito alto para permitir uma distribuio
til.
A perda da informao de importncia secundria (por exemplo, o
arredondamento do peso de um caminho ou da renda anual para a unidade mais
prxima)
Freqncias
Classe N dias % dias
acumuladas
0 3 0,06 0,06
1 3 0,06 0,12
2 4 0,08 0,20
3 5 0,10 0,30
4 10 0,20 0,50
5 10 0,20 0,70
6 6 0,12 0,82
7 4 0,08 0,90
8 3 0,06 0,96
9 2 0,04 1,00
50 1,00
Freqncias
Classe N dias % dias
acumuladas
50 1,00
Podemos, pela primeira tabela, concluir que 90% dos dados correspondem a valores
menores ou iguais a 7. ou seja, Em 90% dos dias o nmero de acidentes no excede 7.
0.8 0.8
0.6 0.6
0.4 0.4
0.2 0.2
0.0 0.0
0 1 2 3 4 5 6 7 8 9 0-1 2-3 4-5 6-7 8-9
1,0
0,8
% dos dias
0,6
0,4
0,2
0,0
0 1 2 3 4 5 6 7 8 9
N. acidentes
Vendas Vendas
absolutas relativas
Distribuies discretas
Exerccio:
Construa a distribuio de freqncia e desenhe o histograma dos dados a seguir. Qual
o formato da distribuio?
20,7 18,7 26,2 21,7 18,8 20,6 20,7 20,2
18,5 21,3 19,3 18,3 25,1 18,8 24,3 28,4
23,3 25,3 20,4 18,3 24,0 21,2 19,4 20,6
18,9 26,6 22,4 18,9 22,6 21,4 27,0 23,6
28,3 20,3 21,7 18,2 20,3 19,2 24,7 18,4
5.1 Mdia
x
i =1
i
x
x= ou simplesmente x =
n n
n
OBS: x l-se X barra e significa mdia. x
i =1
i l-se somatrio de x i , i variando de 1 a n.
x
i =1
i = x1 + x 2 + ... + x n
Se um estudante faz quatro provas, obtendo as notas 70, 60, 80 e 75, sua mdia : 71,25.
A frmula anterior para calcular a mdia aritmtica supe que cada observao tenha a
mesma importncia. A mdia ponderada considera que as informaes no tem a mesma
importncia, ou seja, devem ser levados em conta o peso das informaes.
w xi =1
i i
Mdia ponderada = n
w
i =1
i
Consideremos que um professor informe a classe de que haver dois exames parciais,
valendo cada um 30% da nota e um exame final valendo 40%. Um aluno obtm
desempenho 70 na primeira avaliao, 65 na segunda e 80 no exame final.
n
wx
i =1
i i
70x 0,30 + 65x 0,30 + 80x 0,40
Mdia ponderada = n
= = 72,50
1,00
w
i =1
i
A mdia geomtrica utilizada quando se deseja fazer a mdia de taxas de juro, por
exemplo. Neste caso, multiplicam-se os n termos e em seguida extra-se a raiz de ordem
n.
A mdia geomtrica o resultado da raiz de ordem n do produto de todos os valores da
amostra.
n
Mdia geomtrica = n
x i =1
i
n
OBS: x
i =1
i = x1x 2 x 3...x n l-se produtrio de x i , i variando de 1 a n.
x =
fx i i
Exemplo:
Ponto mdio
Classe N dias (f i ) f i xi
(x i )
n = 50 223
5.2 Mediana
A principal caracterstica da mediana dividir o conjunto de nmeros em dois grupos
iguais: a metade ter valores inferiores ou iguais mediana e a metade ter valores
superiores ou iguais mediana.
Para calcular a mediana inicia-se ordenando os valores em ordem crescente. Em seguida
conta-se at a metade deles. Em geral a mediana ocupa a posio (n+1)/2.
Para nmero mpar de valores a mediana o valor do meio. Para amostras com nmero
par de unidades, a mediana a mdia dos dois valores centrais.
Exemplos:
Amostra Nmero de elementos Dados ordenados Mediana
2 3 34 25 14 5 9 elementos mpar 1 2 23 3 4 45 5 3
3 4 23 15 32
6 7 32 52 36 21
LI Q1 Q 2 =mediana Q3 LS
Da mesma forma que para dados apresentados em srie, a mediana o ponto que divide
as informaes ao meio.
n
( f )1
Mediana = L1 + 2 c
f mediana
onde: L 1 = limite inferior da classe mediana, isso , da classe que contm a mediana
n = nmero de itens dos dados (freqncia total)
( f) 1 =soma de todas as freqncias das classes anteriores mediana
f mediana = freqncia da classe mediana
c = amplitude do intervalo da classe mediana
Exemplo:
No caso dos acidentes, temos 50 observaes, logo a mediana deve estar localizada na
posio (50+1)/2 = 25,5, ou seja, a classe que contm a mediana a classe 4-5.
O limite inferior da classe mediana 4. Antes da classe mediana (( f) 1 ) haviam passado
15 dados. A classe mediana contm 20 observaes e a amplitude da classe mediana 1.
Ento
50
15
Mediana = 4 + 2 x1 = 4 + 0,5 = 4,5
20
Exemplo:
A moda do conjunto 2 3 4 3 2 3 5 1 2 3, pois o trs o valor que mais vezes aparece.
1
Moda = L 1 + c
1 + 2
onde: L 1 =limite inferior da classe modal (isto , a classe que contm a moda)
1 =excesso da freqncia modal sobre a da classe imediatamente anterior
Exemplo:
No caso dos acidentes....
Classe N dias (f i )
0-1 6 Classe modal
2-3 9
4-5 20
6-7 10
8-9 5
n = 50
11
Moda = 4 + 1 = 4 + 0 ,52 = 4 ,52
11 + 10
Moda
Moda
Mediana Moda
Mediana
Mdia Mediana
Mdia
Mdia
Exerccios:
1. Para os seguintes conjuntos de dados, determine os valores da mdia aritmtica,
mdia geomtrica, mdia harmnica, mediana e moda.
a) 12 15 16 15 12 15 15 5 7 14
b) 2 6 3 6 3 3 4
c) 2 8 3 10 2 1 6 9 4 3
d) 38 38 70 92 22 17
8 19 7 6 12 17 16 9 20
16 14 3 12 4 9 8 3 16
b) 4 12 4 7 4 9 11 12 5 8 9 4
4. Joo possui 5 imveis localizados nesta cidade. Ele deseja saber qual o valor
mdio, por metro quadrado, das suas propriedades. Sabendo que imveis no centro
valem R$ 450,00/m 2 e imveis em bairros valem R$ 300,00/m 2 , calcule o valor
mdio por m 2 do seu capital.
Apartamento de 80 m 2 no centro
Pavilho de 450 m 2 no bairro
Casa de 280 m 2 no centro
Apartamento de 120 m 2 no bairro
Casa de 320 m 2 no bairro
Pequena variabilidade
Grande variabilidade
Exemplo:
Duas mquinas esto sendo comparadas. A seguir est descrita a produo de cada uma
durante 5 dias.
Produo Mdia
Mq 1 10 10 10 10 10 10
Mq 2 5 18 8 3 16 10
Voc acha que a programao da produo para as duas mquinas pode ser a mesma
durante 1 semana? Por qu?
6.1 Amplitude
Tambm conhecida como intervalo.
A amplitude de um grupo de dados , de modo geral, mais simples de calcular e de
entender. Consiste na diferena entre o maior e o menor valor, ou seja, entre os valores
extremos.
Amplitude = X max - X mn
Exemplo:
1. Calcule a amplitude dos seguintes conjuntos de dados. Voc acha que a disperso
dos conjuntos igual?
a) 15 15 12 14 16 16 4 15
b) 5 4 5 4 6 5 16 4
6.2 Varincia
Calcula-se a varincia de uma amostra elevando-se as diferenas de cada um dos valores
em relao mdia, somando-se estas diferenas e dividindo-se por n-1.
s 2
=
(x i x)2
x
n 1
Exemplo:
Clculo da varincia do conjunto de dados 2,4,6,8, e 10.
xi x xi x ( xi x )2
2 6 -4 16
4 6 -2 4
6 6 0 0 s 2
=
(x i x)2
=
40
= 10
x
n 1 5 1
8 6 2 4
10 6 4 16
Somas 0 40
Exemplo:
Clculo do desvio padro do conjunto de dados 20, 5, 10, 15 e 25.
Usando a frmula normal:
xi x xi x ( xi x )2
20 15 5 25
5 15 -10 100
sx =
(x i x)2
=
250
= 62,5 = 7,91
10 15 -5 25 n 1 5 1
15 15 0 0
25 15 10 100
Somas 0 250
x i = 20 + 5 + 10 + 15 + 25 = 75
x 2
i = 202 + 52 + 102 + 152 + 252 = 1375
i
x( )
2
x 2
i
n 1375 75
2
= 5 = 250
sx = = 7,91
n 1 5 1 5 1
O coeficiente de variao dado pelo quociente entre o desvio padro e a mdia dos
dados.
Exemplo:
Entre os conjuntos de dados a seguir apresentados, qual apresenta maior variabilidade?
Conjunto A Conjunto B
12 3
25 4
16 5
23 2
Desvio Padro A 6,06
Soluo: CVA = = = 0,3187
MdiaA 19
Desvio Padro B 1,29
CVB = = = 0,3688
MdiaB 3,5
Ento o conjunto que possui maior variabilidade o conjunto B.
Exerccios:
1. O desvio padro pode ser zero? Explique. Pode ser negativo? Explique.
n(n + 1) x i x
4
3(n 1) 2
Curtose =
(n 1)(n 2)(n 3)
s (n 2)(n 3)
8.3 Eventos
Chama-se de evento qualquer subconjunto do espao amostral S de um experimento
aleatrio, ou seja, qualquer resultado do espao amostral.
n(A) o nmero de resultados associados ao evento A.
Exemplo:
Experimento: lanar um dado e observar a face superior
Espao amostral: S={1,2,3,4,5,6} n(S)=6
Evento A: face par n(A)=3
P(A)= 3/6 = = 0,5 ou 50%
OBS: existe uma pequena diferena entre probabilidade e chance de um evento. A probabilidade
relaciona o nmero de resultados de A com o nmero de resultados total, enquanto que chance
compara o nmero de resultados de A com o nmero de resultados de outro evento (B ou C).
E a chance de selecionar uma bola branca 5:5, que semelhante a 1:1, o que significa que existe a
mesma chance de retirar uma bola branca ou uma bola de outra cor.
Exerccios:
1. Escreva o espao amostral no lanamento de um dado. Ache a probabilidade
associada a cada evento.
7. Um motor tem 6 velas, e uma est defeituosa, devendo ser substituda. Duas esto
em posio de difcil acesso, o que torna difcil a substituio.
a) Qual a probabilidade de a vela defeituosa estar em posio difcil?
b) Qual a de no estar em posio difcil?
9. Uma pesquisa de trfego levada a efeito das 5 s 6 horas da manh num trecho de
uma rodovia federal revelou que, de 200 carros que pararam para uma verificao
rotineira de segurana, 25 tinham pneus em ms condies. Estime a probabilidade
de um carro que pare naquele trecho ter seus pneus em boas condies
A B
OBS: Para apresentar os eventos utilizam-se os Diagramas de Venn [apresentados por John Venn
(1834-1923)], que representam os espaos amostrais e os eventos como crculos, quadrados, ou outra
figura geomtrica conveniente.
Exerccios:
1. Numa urna existem 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso.
Qual a probabilidade do nmero ser par ou maior que 4?
2. Numa urna existem 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso.
Qual a probabilidade do nmero ser um nmero primo ou maior que 8?
A B
Exemplo 1: Deve-se inspecionar uma grande caixa de peas. Os registros indicam que 2%
das caixas acusam contedo inferior ao estipulado. Escolhidas duas caixas aleatoriamente,
qual a probabilidade de ambas acusarem contedo inferior, admitindo-se que a remessa
inspecionada semelhante as anteriores (isto , 2% de deficientes)?
P(ambas deficientes)=P(deficiente)P(deficiente)
=0,02 x 0,02
=0,0004 ou seja, 0,04% de probabilidade das caixas serem defeituosas.
Exemplo 2: Suponha que 20 canetas esto expostas numa papelaria. Seis so vermelhas e
14 azuis. Do conjunto de 20, iremos escolher 2 canetas aleatoriamente. Qual a
probabilidade de que as duas canetas selecionadas sejam vermelhas?
Neste caso os eventos no so independentes, pois a cor da primeira caneta
selecionada vai determinar a probabilidade da segunda caneta ser vermelha.
Seja A=a segunda caneta selecionada vermelha
B=a primeira caneta selecionada vermelha
5 6 30
Desejamos P(A e B) = P(A|B) P(B) = = = 0,0789
19 20 380
Exerccios
1. Uma urna contm 6 bolas vermelhas e 4 azuis. Em duas bolas consecutivas, sem
reposio, determine a probabilidade de retirar a primeira azul e a segunda
vermelha.
2. Uma urna contm 6 bolas vermelhas e 4 azuis. Em duas bolas consecutivas, com
reposio, determine a probabilidade de retirar a primeira azul e a segunda
vermelha.
6. Uma urna contm 50 bolas numeradas de 1 a 50. Sero selecionadas 5 bolas, sem
reposio. Qual a probabilidade de que uma pessoa que tenha feito um jogo
anotando os 5 nmero acerte todos?
CC de viagem e entretenimento
Totais
Sim No
Sim 60 60 120
CC bancrio
No 15 65 80
Relembrando: uma varivel aleatria uma funo com valores numricos, cujos
valores so determinados por fatores de chance.
Uma varivel aleatria considerada discreta se toma valores que podem ser
contados.
Uma varivel aleatria considerada contnua quando pode tomar qualquer valor
em determinado intervalo.
Exemplo:
Distribuio de probabilidade para a varivel aleatria nmero de caras em duas jogadas
de uma moeda.
Nmero de Nmero de
Prob. do Prob. do
Resultado caras caras
resultado resultado
Valor da V.A. Valor da V.A
Cara Cara 2 x = 0
Cara Coroa 1 x =
1 + =
Coroa Cara 1 x =
Coroa Coroa 0 x = 2
Soma = 1 Soma = 1
O valor esperado, ou esperana matemtica, de uma varivel aleatria E(x), que consiste
no valor esperado para ela, ou seja, o valor mdio da varivel.
n
E( x ) = px
i =1
i i se X v.a. discreta
ou
E( X) = x. f(x) dx
se X v.a. contnua
Exemplo: um investidor julga que tem 0,4 de probabilidade de ganhar $ 25.000 e 0,6 de
perder $ 15.000. Seu ganho esperado de:
E(X) = 0,4 (25.000) + 0,6 (-15.000) = $ 1.000.
E a varincia Var(X)=E(X 2 )-[E(X)] 2
= E(X 2 ) 1.000 2
=(0,4.25.000 2 + 0,6.(-15.000) 2 )-1.000 2
=(0,4 x 625.000.000 + 0,6 x 225.000.000)-1.000 2
= 250.000.000+ 135.000.000 1.000 2
= 385.000.000 1.000.000
= 384.000.000
Desvio padro = $ 19.595,92
Exerccios:
1. O nmero de chamadas telefnicas recebidas por uma mesa e suas respectivas
probabilidades para um intervalo de 3 minutos so:
Em mdia, quantas chamadas podem ser esperadas num intervalo de trs minutos?
N bolos/dia 0 1 2 3 4 5 6 7 8 9 Total
Freqncia relativa 0,02 0,07 0,09 0,12 0,20 0,20 0,18 0,10 0,01 0,01 1,00
Distribuio de Bernoulli
A distribuio de Bernoulli consiste em uma distribuio adequada varivel aleatria de
Bernoulli, que por sua vez uma v.a. que assume apenas os valores 0 e 1, com funo de
probabilidade tal que:
P(0) = P(X=0) = 1- p
P(1) = P(X=1) = p
Distribuio Binomial
Seja um processo composto de uma seqncia de observaes independentes, onde o
resultado de cada observao pode ser um sucesso ou uma falha.
Se a probabilidade de sucesso constante e igual a p, a distribuio do nmero de
sucessos seguir o modelo Binomial.
A distribuio Binomial usada com freqncia no controle de qualidade. o modelo
apropriado quando a amostragem feita sobre uma populao infinita ou muito grande.
n
onde representa o nmero de combinaes de n objetos tomados x de cada vez
x
P(X) = probabilidade de X sucessos uma vez que n e p so conhecidos
n = tamanho da amostra
p = probabilidade de sucesso 1-p = probabilidade de falha
X = nmero de sucessos na amostra (X=0, 1, 2, ..., n)
A mdia de uma varivel aleatria com distribuio binomial = np e a varincia
x
dada por 2 = np(1-p) onde p proporo de sucessos na amostra p =
n
Exemplo:
Um processo industrial opera com mdia de 1% de defeituosos. Baseado em amostras de
100 unidades, calcule as probabilidades de uma amostra apresentar 0 , 1 , 2 , 3 e 4
defeituosos. Plote a distribuio de probabilidade correspondente.
Como a varivel aleatria pode apresentar apenas duas possibilidades, ser boa ou
defeituosa, a distribuio que melhor se ajusta a distribuio binomial, com
parmetros p=0,01 e n=100.
Ento, a probabilidade de uma amostra de tamanho n = 100 apresentar 0
defeituosos
n 100
P( x ) = p x (1 p)n x P(x=0) = P(0) = 0 ,010 (1 0 ,01)100 0 = 0,366
x 0
100 1
P(x=1) = P(1) = 0,01 (1 0,01)1001 = 0,370
1
100
P(x=2) = P(2) = 0,012 (1 0,01)100 2 = 0,185
2
100
P(x=3) = P(3) = 0,01 (1 0,01)
3 100 3
= 0,061
3
100
P(x=4) = P(4) = 0,014 (1 0,01)100 4 = 0,015
4
0,3
P(x)
0,2
0,1
0
x=0 x=1 x=2 x=3 x=4
Exerccios:
1. Um processo opera segundo uma chance de falha de 2%. Coletando amostras de 25
unidades, qual a probabilidade de uma amostra selecionada apresentar 2
defeituosos ou menos.
Distribuio de Poisson
e x
P( x ) = onde x=0,1,2,....
x!
onde P(X) = probabilidade de X sucessos, dado o conhecimento de
= nmero esperado de sucessos
Exemplo:
Suponha que o nmero de defeitos no cordo de solda de uma carroceria siga uma
distribuio de Poisson com = 2.
Ento a probabilidade de uma carroceria apresentar mais de 3 defeitos ser:
P(X> 3) = 1 P(x 3) = 1-[ P(x=0) + P(x=1) + P(x=2) + P(x=3)]
e x e 2 2 0
Onde P( x ) = P(0) = = 0,135
x! 0!
e 2 21
P(x=1) = P(1) = = 0,271
1!
P(x=2) = P(2) = 0,271 P(x=3) = P(3) = 0,180
Logo,
P(X> 3) = 1 P(x 3) = 1-[ P(x=0) + P(x=1) + P(x=2) + P(x=3)]
= 1 [0,135+0,271+0,271+0,180]
= 1 [0,857]
=0,143 14%
A probabilidade de uma carroceria apresentar mais de trs defeitos 14%.
Exemplo 2:
e x e 4 45
P( x ) = P (5) = = 0,1563 = 15,63%
x! 5!
Exerccios:
1. O setor financeiro de uma loja de departamentos est tentando controlar o nmero
de erros cometidos na emisso das notas fiscais. Suponha que esses erros sigam o
modelo de Poisson com mdia = 0,03. Qual a probabilidade de uma nota
selecionada ao acaso conter 1 ou mais erros?
4. Dez por cento das ferramentas produzidas por um certo processo de fabricao
revelaram-se defeituosas. Determinar a probabilidade de, em uma amostra de 10
ferramentas escolhidas ao acaso, exatamente duas serem defeituosas mediante o
emprego da distribuio de Poisson.
Distribuio Normal
A Distribuio Normal essencialmente importante na estatstica por trs razes
principais:
1. Inmeros fenmenos contnuos parecem segu-la ou podem ser aproximados por
meio dela
2. Podemos utiliz-la para aproximar vrias distribuies de probabilidade discretas
3. Ela oferece a base para a inferncia estatstica clssica, devido sua afinidade
com o teorema do limite central
95,44%
68,26%
-1 +1
-2 +2
-3 +3
Para simplificar a notao de uma v.a.c. com distribuio normal, com mdia e varincia
2
utiliza-se:
X~ N( , 2 )
A distribuio Normal acumulada obtida calculando a probabilidade de X ser menor que
um dado valor a :
a
P( x a) = F(a) = f (x)dx
Funo densidade acumulada
Essa integral no pode ser resolvida em forma fechada, mas a soluo est apresentada
em tabelas onde se entra com a varivel reduzida ou varivel padronizada Z e
encontra-se F(Z) ou vice-versa.
a
P( x a) = P Z = F(Z )
950 1000
P(x>950) = P Z > = P(Z > 1,25) = 0,3944 + 0,5000 = 0,8944
40
Tabelado
X=950 =1000 Z=-1,25 =0
=40 =1
Se forem feitas 4000 medies, aproximadamente 2305 estaro entre 95 e 112. (4000 x
57,64%)
4. A sada de uma bateria segue o modelo Normal com mdia 12,15 V e desvio padro
0,2 V. Encontre o percentual que ir falhar em atender s especificaes 12 V
0,5 V.
7. Sabe-se que o contedo de uma lata de cerveja 350 ml e que tem distribuio
aproximadamente normal com mdia 350 ml e desvio padro 10 ml.
a. Que % de latas tem menos que 345 ml de contedo?
b. Que % de latas tem mais que 360 ml de contedo?
8. Uma fbrica de pneus fez um teste para medir o desgaste de pneus e verificou que
ele seguia o comportamento de uma curva normal com mdia 48.000 km e desvio
padro de 2.000 km. Calcule a probabilidade de um pneu escolhido ao acaso:
a. Dure mais que 47.000 km?
b. Dure entre 45.000 e 51.000 km?
c. At que quilometragem duram 90% dos pneus?
Sejam:
x = mdia da populao =
x = mdia da distribuio amostral
x = desvio padro da populao =
x = desvio padro da distribuio amostral
N = tamanho da populao
n = tamanho da amostra
Nn
Populao Finita: x = e x =
n N 1
x =
Populao Infinita: e x =
n
A frmula do desvio padro nos diz que a quantidade de disperso na distribuio amostral
depende de dois fatores:
- a disperso da populao
- o tamanho da amostra (utilizando raiz quadrada)
Por exemplo, em qualquer populao, o aumento do tamanho das amostras extradas
resultar em menor variabilidade entre as possveis mdias amostrais. E se o mesmo
tamanho de amostra usado com diferentes populaes, as populaes com maior
quantidade de disperso x tendero a gerar maior quantidade de variabilidade entre as
mdias de amostras extradas delas.
Exemplos:
Calcule o desvio padro da distribuio amostral de mdias onde o desvio padro da
distribuio populacional 2 e o tamanho da amostra 40.
x 2
x = = = 0,3162
n 40
Determine a mdia das distribuies de mdias amostrais, sendo que a mdia populacional
678.
x = x = 678
Um fabricante de baterias alega que seu artigo de primeira categoria tem uma vida
esperada (mdia) de 50 meses. Sabe-se que o desvio padro correspondente de 4
meses. Que percentagem de amostras de 36 observaes acusar vida mdia no intervalo
de 1 ms em torno de 50 meses, admitindo ser de 50 meses a verdadeira vida mdia das
baterias?
Sabemos que, como n>30, a distribuio das mdias amostrais ser
aproximadamente normal com mdia igual mdia populacional e desvio padro
igual ao desvio padro populacional dividido pela raiz quadrada do tamanho da
???
49 50 51
Meses
x
p = proporo populacional
p(1 p)
p =
n
e pode-se fazer uma aproximao para a distribuio normal quando n>30.
Exemplos:
Determine a mdia da distribuio de propores amostrais, quando a proporo na
populao 72,3%
p =p=72,3%
Verificou-se que 2% das ferramentas produzidas por uma certa mquina so defeituosas.
Qual a probabilidade de que, em uma remessa de 400 dessas ferramentas, 3% ou mais
revelarem-se defeituosas?
3. Certas vlvulas fabricadas por uma companhia tm vida mdia de 800 horas e
desvio padro de 60 horas. Determinar a probabilidade de uma amostra aleatria
de 16 vlvulas, retiradas do grupo, ter vida mdia a) entre 700 e 810 horas;
b)inferior a 785 horas; c) superior a 820 horas; d) entre 770 e 830 horas.
4. Um fabricante faz a remessa de 1000 lotes de 100 lmpadas eltricas cada um. Se
5% das lmpadas so normalmente defeituosas, em quantos lotes pode-se esperar
que existam; a) menos de 90 lmpadas boas; b) 98 ou mais lmpadas boas
Exemplos:
Parmetro Tipo de estimativa
populacional Pontual Intervalar
Populao
Infinita Finita
Estimativa de mdias
Pontual x x
Intervalar x conhecido x x Nn
xz xz
n n N 1
x desconhecido sx sx Nn
xt xt
n n N 1
Estimativa das propores
Pontual x x
p = p =
n n
Intervalar p(1 p) p(1 p) N n
pz pz
n n N 1
Onde:
z representa o valor tabelado da distribuio Normal, com nvel de confiana .
t representa o valor tabelado da distribuio t de Student, com nvel de confiana e GL
graus de liberdade1
N o tamanho da populao
n o tamanho da amostra
1
O valor da distribuio t de Student depende do nmero de graus de liberdade
Prof. Cntia Paese Giacomello 63
Exemplo:
Intervalo de confiana para a mdia quando se conhece a varincia de populao x
Seja uma amostra de tamanho 36 de uma populao infinita, sabe-se que x =3 e x =24,2
Confiana Z
Frmula Clculo E Intervalo
desejada (tabelado)
x 3
90% 1,65 xz 24,2 1,65 24,2 0,825 23,375 a 25,025
n 36
x 3
95% 1,96 xz 24,2 1,96 24,2 0,980 23,220 a 25,180
n 36
x 3
99% 2,58 xz 24,2 2,58 24,2 1,290 23,110 a 25,690
n 36
Tamanho da amostra
Uma das perguntas mais freqentes em estatstica : Qual o tamanho da amostra que
devemos tomar?
O tamanho da amostra depender do grau de confiana desejado (z), da quantidade de
disperso entre os valores individuais ( x ), e de certa quantidade especfica de erro
tolervel (e).
O tamanho da amostra que voc afinal selecionar depender de
seu oramento, da importncia econmica das decises e da
variabilidade na populao. Desses trs problemas, dois so de
ordem gerencial, cabendo a voc a deciso; apenas o terceiro
(variabilidade) est fora do seu controle .(Brenda Landy, citada no
livro Pesquisa de Marketing Naresh Malhotra. - 2001)
A frmula do erro pode ser resolvida em relao a n. Assim, para o caso de estimao de
mdias, tem-se:
2
x x
e=z n=z n = z x
n e e
Exerccios:
23 40 30 21 34
20 38 26 23 38
33 32 24 21 24
Exemplo: O estudo de uma amostra de tamanho 55 peas indicou que o dimetro mdio
de 27,5 mm. Ento:
H 0 : o dimetro mdio da populao (de peas) 27,5 mm
H 1 : o dimetro mdio da populao (de peas) diferente de 27,5 mm
Verdadeira Falsa
Os testes de hiptese podem ser unilaterais ou bilaterais. Nos testes unilaterais a hiptese
alternativa H 1 do tipo >33 ou <33, por exemplo. Nos testes bilaterais a hiptese
alternativa do tipo 33. A hiptese nula permanece igual nos dois casos. A rea de
rejeio dividida quando o teste bilateral.
H 1 : <33 H 1 : 33 H 1 : >33
/2 /2
Exerccios
1. Para cada um dos seguintes casos, trace uma curva normal, indicando a rea de
rejeio na figura.
a) H 0 : =10, H 1 : 10, =0,02
b) H 0 : =120, H 1 : 120, =0,05
c) H 0 : =2000, H 1 : 2000, =0,01
d) H 0 : =2000, H 1 : >2000, =0,01
e) H 0 : =2000, H 1 : < 2000, =0,01
x conhecido
x o
z teste =
x E H 0 rejeitada se |Z teste | > Z /2 (obtido em uma tabela da
n
distribuio normal).
Uma amostra de 8 valores foi coletada e indicou X = 0,847 . Sabendo que o desvio padro
=0,010, teste a hiptese do engenheiro usando um nvel de significncia =0,05.
H o : = 0,850
H1 : 0,850
0,847 0,850
Z teste = = 0,85
0,010 / 8
Como Z teste = 0,85 > Z 0 ,025 = 1,96 H 0 no pode ser rejeitada.
x desconhecido
Esse problema idntico quele da seo anterior, exceto que agora a varincia
desconhecida.
x o
t teste =
sx
n
E a hiptese nula H 0 rejeitada se |t teste |>t /2 , onde t /2, n-1 um valor limite da
distribuio de Student tal que a probabilidade de se obter valores externos a t /2 .
x conhecido
X1 X 2
Z teste =
12 22
+
n1 n2
x desconhecido
X1 X 2
t teste =
S 2x1 S 2x 2
+
n1 n2
p0 (1 p0 ) / n
e deve ser comparada com o valor crtico de Z (retirado de uma tabela da distribuio
normal)
Exemplo:
Um fabricante afirma que uma remessa de pregos contm menos de 1% de defeituosos.
Uma amostra aleatria de 200 pregos acusa 4 defeituosos. Teste a afirmao ao nvel
0,01.
H 0 : p = 1%
H 1 : p > 1% pois desejamos evitar a aceitao de uma remessa com mais de
1% de defeituosos, mas nada h contra aceitar o fato da remessa apresentar
qualidade superior acordada.
x p 4 0,01
z teste = n 0
= z teste = 200 = 1,42
p0 (1 p0 ) / n 0,01(1 0,01) / 200
Este teste baseia-se na distribuio qui-quadrado, onde o valor calculado deve ser
comparado com o valor tabelado. A deciso de aceitar ou rejeitar H 0 depender da
comparao deste valor com o valor tabelado da distribuio qui-quadrado.
Por exemplo, tem-se a distribuio de peas produzidas por turno e se essas peas so
boas ou apresentam algum tipo de defeito. No turno da manh foram produzidas 967
peas, onde 183 apresentaram algum tipo de defeito.
Turno de produo
Total
Manh Tarde Noite
Turno de produo
Total
Manh Tarde Noite
224 x 967
Freq _ esperada = = 137,1
1580
(O E) 2
2 = E
Se o valor obtido for maior que o valor crtico obtido na tabela 2 ento diz-se que as
variveis NO so independentes. Se o valor encontrado for menor, ento diz-se que as
variveis so independentes.
O valor dos GRAUS DE LIBERDADE obtido atravs do clculo:
graus de liberdade = (colunas-1)(linhas-1)
No exemplo apresentado:
Tem-se valor calculado > valor tabelado ento diz-se que as variveis NO so
independentes. OU SEJA, a proporo de peas boas produzidas depende do turno de
trabalho. A proporo de peas boas no turno da manh 81%, na tarde 90% e na noite
97%.
Exerccios:
1. Um fornecedor apresenta uma caixa, e afirma que o peso mdio desta caixa de
368 gramas. De experincias anteriores sabe-se que o desvio padro da populao
vale 15 g e que os valores se comportam segundo a distribuio Normal. Para
verificar se a afirmao verdadeira, verifica-se uma amostra de 25 caixas, pesa-se
e calcula-se o peso mdio da amostra, achando 372,5 g. Qual a concluso a
respeito da afirmao do fornecedor, ao nvel de significncia 0,01?
2. Uma agncia de empregos alega que os candidatos diretoria por ela colocados
nos ltimos seis meses tm salrios de R$ 9000, em mdia. Uma agncia
governamental extraiu uma amostra aleatria daquele grupo, encontrando salrios
mdios de R$ 8000, com desvio padro de R$ 1000, com base em 50 empregados.
Teste a afirmao da agncia, contra a alternativa, de que o salrio mdio
inferior a R$ 9000, ao nvel de significncia 0,05.
7. No caso judicial EUA versus Cidade de Chicago, foram postas em dvida as prticas
honestas de emprego. Um grupo minoritrio (A) e um grupo majoritrio (B) fizeram
o exame para capito do corpo de bombeiros, com os seguintes resultados:
Aprovados Reprovados
Grupo A 10 14
Grupo B 417 145
Com os resultados acima, e com nvel de significncia de 5%, teste a afirmao de
que o sucesso no teste independente do grupo.
10. A tabela abaixo apresenta dados relativos ao time vencedor em diferentes esportes.
Com o nvel de 0,05 de significncia, teste a afirmao de que as vitrias
casa/visitante so independentes do esporte.
Basquete Beisebol Hockey Futebol
O time da casa ganha 127 53 50 57
O time visitante ganha 71 47 43 42
H situaes onde se deseja comparar vrias mdias, cada uma oriunda de um grupo
diferente. Esses grupos, tambm chamados tratamentos, poderiam ser 5 mquinas de
corte, ou 4 presses de operao, ou 4 layouts , 5 planos econmicos do governo, taxas
de cmbio em 3 diferentes pases, resultados da implantao de um novo sistema em duas
filiais, etc.
Exemplo:
Para verificar se existe diferena significativa entre os salrios mdios dos economistas da
Regio Sul, o sindicato da classe resolveu analisar os dados de algumas amostras. Assim
foram selecionados aleatoriamente 5 economistas de cada estado.
Exemplo:
Uma classe com 24 crianas foi dividida em trs grupos. Cada grupo de crianas aprendeu
a ler de acordo com um mtodo (trs mtodos diferentes). Aps 3 meses as crianas
foram testadas, utilizando uma escala de 1 a 10. Os resultados foram
Mtodo A 5 0 3 5 4 5 8 2
Mtodo B 4 5 4 7 5 10 3 10
Mtodo C 3 5 0 3 3 9 4 9
Tratamento Observaes
1 Y11 , Y12 ... Y1n1
2 Y21 , Y22 ... Y2n2
: :
: :
: :
k Yk1 , Yk2 ... Yknk
Yij = + i + ij ; i = 1,....., k
j = 1, ..., ni
Nosso objetivo ser testar a hiptese referente ao efeito dos tratamentos e estimar esses
efeitos, ou seja, verificar se existe diferena significativa entre os resultados apresentados
por cada grupo.
H 0 : 1 = 2 = ..... = k
H 1 : i j para alguns i, j
(Yij Y.. ) = (Y i. ) (
Y.. + Yij Y i . ) (1)
onde:
(Yij Y i. )
o desvio da observao individual em relao mdia do tratamento
correspondente;
MQG
F=
MQR
Distribuio F
Valor tabelado
TC = ( T .. )2 N
SQT = ( Yij2 ) TC
SQG = ( Ti 2. ni ) TC
SQR = ( Yij2 ) ( Ti .2 ni ) = SQT SQG
onde
TC o termo de correo
T.. a soma de todas as observaes
Ti. a soma das observaes no grupo i
Mtodo A 5 0 3 5 4 5 8 2
Mtodo B 4 5 4 7 5 10 3 10
Mtodo C 3 5 0 3 3 9 4 9
TC = 116 2 / 24 = 560,67
SQT = (5 2 + 0 2 + 3 2 + ... + 4 2 + 9 2 ) 560,67 = 738 560,67 = 177,33
322 482 362
SQG = + + 560,67 = 578,00 - 560,67 = 17,33
8 8 8
Total 177,33 23
Mtodo A 5 0 3 5 4 5 8 2
Mtodo B 4 5 4 7 5 10 3 10
Mtodo C 3 5 0 3 3 9 4 9
ou
Calculado
ANOVA
Fonte da variao SQ gl MQ F valor-P F crtico
Entre grupos 17,33 2 8,67 1,14 0,340 3,47
Dentro dos grupos 160,00 21 7,62
Total 177,33 23
Distribuio F
0,05
0
1,99
2. Duas turmas de pilotos de corrida de automveis esto sendo treinadas para uma
grande corrida no domingo. Cada turma faz cinco provas de troca dos quatro pneus
num carro. As turmas so equivalentes ou uma delas superior, ao nvel de
significncia 0,05? Complete a tabela da ANOVA e conclua a respeito.
Entre grupos
Dentro de grupos 0,12
Total 0,22
A 20 12 15 19
B 17 14 12 15
C 23 16 18 14
D 15 17 20 12
E 21 14 17 18
K 33 38 36 40 31 35
L 32 40 42 38 30 34
M 31 31 37 35 33 30
N 29 34 32 30 33 31
5. Um professor deseja testar trs mtodos diferentes de ensino I, II e III. Para isso so
escolhidos aleatoriamente trs grupos de cinco estudantes, e cada grupo instrudo
por um mtodo diferente. dada a mesma prova a todos os estudantes e os graus
obtidos constam na tabela. Determinar se existe diferena entre os mtodos de ensino
ao nvel de significncia 0,01.
I 75 62 71 58 73
II 81 85 68 92 90
III 73 79 60 75 81
6. A tabela apresenta os dados sobre a ferrugem acumulada sobre o ferro, que foi tratado
quimicamente com os produtos A, B ou C. Determinar se existe diferena significativa
nos tratamentos ao nvel de 0,05.
A 3 5 4 4
B 4 2 3 3
C 6 4 5 5
20 mg 46 46 46 45 45 45 46 46
30 mg 48 48 47 47 47 47 47 48
40 mg 49 49 50 50 49 50 50 49
50 mg 52 53 52 52 52 52 53 53
9. Uma empresa deseja estudar trs tipos de enxerto para ver se todos apresentam o
mesmo crescimento anual. O que se pode concluir a respeito? (use nvel de
significncia 0,05)
10. Os dados abaixo do a vida observada dos pneus de quatro caminhes distribuidores
de sorvete, conforme a posio. Supondo comparveis os caminhes e os motoristas,
poderemos afirmar que a durao mdia independente da posio do pneu no
veculo? (use nvel de significncia 0,01). Disponha os clculos numa tabela ANOVA.
Qual a importncia da comparabilidade dos motoristas e veculos?
Dianteiro direito 17 19 20 24
Dianteiro esquerdo 25 27 18 22
Traseiro direito 22 21 19 26
Traseiro esquerdo 26 24 30 28
Exemplos:
Notas 2 o Notas
Famlia Renda Gastos Peso Altura Aluno
grau faculdade
... 58 170 D 60 65
OBS: A anlise da regresso apenas indica qual relacionamento matemtico pode existir, se
existir algum. Ou seja, nem a regresso, nem a correlao podem mostrar que uma varivel
tenda a causar certos valores de outra varivel, no garantido que exista relao de causa e
efeito.
... a correlao entre beber um copo de vinho por dia e a menor chance de infarto do
miocrdio um bom exemplo. Estudos recentes mostram que ela no se deve ao vinho e
ao lcool, mas sim ao betacaroteno, corante contido na uva. Para infelicidade de
muitos, tomar suco de uva d o mesmo resultado que beber vinho tinto. Jornal do
Brasil, 08/01/1999
SE =
y 2
( a y + b xy )
n2
Para criar intervalos de confiana com base nos estimadores utiliza-se a equao:
yint ervalo = y t S E
x y x2 xy
7,0 10,1 49,00 70,70
7,3 10,6 53,29 77,38
7,8 11,3 60,84 88,14
8,6 12,4 73,96 106,64
8,1 11,9 65,61 96,39
8,3 11,9 68,89 98,77
8,2 11,5 67,24 94,30
8,6 12,1 73,96 104,06
9,0 13,1 81,00 117,90
9,6 14,1 92,16 135,36
9,1 14,6 82,81 132,86
x = 91,6 y = 133,6 x 2 = 768,76 xy = 1122,50
Consum o pessoal
14,0
12,0
10,0
8,0
6,5 7,5 8,5 9,5 10,5
PIB
E o clculo de a e b fica:
b= 11 (1122,5) - (91,6) (133,6)
= 1,668 133,6 - (1,668) 91,6
11 (768,76) - (91,6)2 e a= = 1,744
11
y = 1,744 + 1,668 x , ou Consumo = 1,744 + 1,668 PIB ou seja, para cada unidade
acrescida do PIB, o consumo pessoal aumentar 1,668 unidades.
Ou seja, quando o PIB estiver em 10,0 o Consumo Pessoal poder variar na faixa entre
14,083 e 15,789, com 90% de confiana.
-1 0 1
Correlao Inexistncia Correlao
negativa de positiva
forte correlao forte
xy n
( x )( y )
r=
x y
( x ) 2
( y) 2
2 2
n n
x y x2 y2 xy
7,0 10,1 49,00 102,01 70,70
7,3 10,6 53,29 112,36 77,38
7,8 11,3 60,84 127,69 88,14
8,6 12,4 73,96 153,76 106,64
8,1 11,9 65,61 141,61 96,39
8,3 11,9 68,89 141,61 98,77
8,2 11,5 67,24 132,25 94,30
8,6 12,1 73,96 146,41 104,06
9,0 13,1 81,00 171,61 117,90
9,6 14,1 92,16 198,81 135,36
9,1 14,6 82,81 213,16 132,86
x = 91,6 y = 133,6 x 2 = 768,76 y 2 = 1641,28 xy = 1122,50
Utilizando o Excel
Maneira 1: A equao da forma y = a + b x para os valores dos pares (x,y) e
os coeficientes da reta so calculados utilizando o mtodo dos mnimos
quadrados.Aps colocar os valores em duas colunas (valores de x e valores de
y) v ao Assistente de Funo e escolha as funes INCLINAO para
determinar o valor de b e INTERCEPO para calcular o valor de a. Os
passos seguintes devem ser feitos seguindo as indicaes do programa. Para o
clculo da correlao utiliza-se no Assistente de Funo o CORREL. Em
Matriz1 devem ser colocadas as clulas referentes varivel x em Matriz2 as
clulas referentes varivel y.
Maneira 2: Selecionar Ferramentas e Anlise de dados e ento
Regresso. Informar o que for solicitado.
390
y = -1,181x + 1257,173
370 2
Velocidade
R = 0,865
350
330
310
740 750 760 770 780 790 800
Peso
Estatstica de regresso R
R mltiplo 0,930
R-Quadrado 0,865
Se
R-quadrado ajustado 0,820
Erro padro 9,851
Observaes 5
gl SQ MQ F F de significao
Testes para a e b
Valores de a e b Se valor-P < 0,05, ento a estimativa
vlida, caso contrrio significativamente
nula
X 1 2 3 6 9
Y 4 7 7 9 15
Se os dados forem correlacionados, estimar a reta de regresso:
Ano Investimento
1998 374
1999 555
2000 908
2001 1010
Nmero
Participao na renda
de anos de
(%)
estudo
1976 4,7 8,4
1990 5,7 16
1993 6,3 19
1996 6,6 21
a) Caso exista associao, quantos anos de estudo sero necessrios para que a
participao da mulher na renda familiar chegue a 50% ?
b) E qual ser a participao da mulher na renda familiar quando ela tiver 12 anos de
estudo?
c) Voc poderia estimar o ano em que a mulher ir participar com 50% da renda?
Temperatura 21,2 20,3 22,7 22,0 22,3 23,5 24,8 24,2 25,5 25,2 25,5 25,8
Produtividade 142 148 131 132 145 138 144 136 141 124 133 128
Temperatura 27,5 26,3 28,2 28,6 29,0 29,7 30,7 30,3 30,2 31,4 32,5 32,7
Produtividade 132 137 124 117 122 131 124 111 119 129 123 116
Nmero de Vendas
Empresa
funcionrios (Milhes US$)
Carrefour 37.004 4.582,4
Po de Acar 39.642 3.976,4
Casas Bahia 11.508 1642,2
Sendas 16.990 1391,7
Ponto Frio 5.395 1223,6
Sonae 22.638 1083,9
Bompreo 13.225 1062,7
L. Americanas 12.485 900,6
McDonalds No informou 726,7
AgipLiquigs 3.804 693,1
Pernambucanas 10.787 619,1
Fonte: Revista Exame
3.500 R 2 = 0 ,80 1
M ilh e s US$
3.000
2.500
2.000
1.500
1.000
500
-
- 5.000 10.000 15.000 20.000 25.000 30.000 35.000 40.000
Nm e r o d e fu ncion r ios
a = 10 A e b = 10 B
Exemplo
Uma empresa fabricante de brinquedos registrou suas vendas nos ltimos 10 anos,
obtendo os valores apresentados a seguir.
4 800 6.000
5 1.200 4.000
6 1.700 2.000
7 2.100 0
8 4.000
0 1 2 3 4 5 6 7 8 9 10 11
9 5.000 An o
10 7.000
x y Y=ln(y) x2 xY Y2
1 450 6,11 1 6,11 37,32
2 500 6,21 4 12,43 38,62
3 600 6,40 9 19,19 40,92
4 800 6,68 16 26,74 44,68
5 1.200 7,09 25 35,45 50,27
6 1.700 7,44 36 44,63 55,33
7 2.100 7,65 49 53,55 58,52
8 4.000 8,29 64 66,35 68,79
9 5.000 8,52 81 76,65 72,54
10 7.000 8,85 100 88,54 78,39
Total: 55 23.350 73,25 385,00 429,64 545,39
Ento,
10( 429 ,64 ) ( 55 )( 73 ,25 )
B= = 0,3245
10( 385 ) ( 55 ) 2
73,25 0 ,325( 55 )
A= = 5 ,5399
10
b = exp( B ) = exp( 0 ,3245 ) = 1,3903 e a = exp( A ) = exp( 5 ,5399 ) = 254 ,42
Observe como os valores estimados pela equao esto prximos dos valores reais,
observados na srie de dados.
8.000
7.000
V endas
6.000
obs ervadas
5.000
4.000
V endas
3.000
estim adas pela
2.000
equa o
1.000
0
1 2 3 4 5 6 7 8 9 10
a = 10 A
Exemplo
Os dados a seguir apresentam a produo de veculos automotivos (y) ao longo do tempo
(x). Para estes dados ajuste um modelo de potncia
ano 59 60 61 62 63 64 65
produo 96,1 133,0 145,6 191,2 174,2 183,7 185,2
ano 66 67 68 69 70 71 72
produo 224,6 225,4 278,5 349,5 416,0 516,0 609,0
500,0
400,0
300,0
200,0
100,0
0,0
55 60 65 70 75
An o
Assim,
14( 319 ,335 ) ( 58 ,522 )( 76 ,292 )
b= = 7,970
14( 244 ,684 ) ( 58 ,522 ) 2
76 ,292 7 ,970( 58 ,522 )
A= = 27 ,868
14
a = exp( A ) = exp( 27 ,868 ) = 7 ,889 E 13
7,970
Ou ento, y=7,889E-13 x
600,0
Produo real
500,0
Produo estimada
400,0
pela equao
300,0
200,0
100,0
0,0
59 60 61 62 63 64 65 66 67 68 69 70 71 72
Exerccios
1. Aos dados a seguir ajuste um modelo exponencial e um polinomial. Estime a
quantidade de vendas para o ano de 2003, supondo que o comportamento dos dados
seja mantido. DICA: utilize os nmeros de 1 a 11 para os anos e calcule o valor de y quando x
for 14.
Ano 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Vendas 15 16 17 18 25 28 32 42 55 76 93
2. Se voc tivesse uma srie de dados como expressa no diagrama de disperso a seguir,
que modelo de regresso voc utilizaria? O que voc poderia dizer a respeito dos
valores dos parmetros?
3. Uma companhia de energia eltrica estimou o consumo mdio de energia das famlias
(kwh) de acordo com a renda (R$). Ajuste os seguintes modelos: y=ax b , y=ab x e
y=a+bx.
Renda 197 286 243 218 241 200 215 198 129 157 296 302
Consumo 1234 1432 1678 1300 1467 1245 1214 1200 770 890 2020 2100