Escolar Documentos
Profissional Documentos
Cultura Documentos
MATERIAL DE ESTUDO
para acompanhamento na sala de aula
PROBABILIDADE E ESTATÍSTICA
Agosto, 2017.
APRESENTAÇÃO DA DISCIPLINA
UNIDADE I – INTRODUÇÃO
I.1 Definição:
O Que é Estatística?
É um conjunto de métodos para planejar experimentos, obter dados, organizá-los,
resumi-los, analisá-los, interpretá-los e deles extrair conclusões.
2
UNIDADE II – NOÇÔES DE PLANEJAMENTO DE EXPERIMENTOS
3
Definição do Problema e objetivo da pesquisa.
Organização da pesquisa
Coleta dos dados
Análise estatística do problema
Conclusões
“Um plano de amostragem consiste em obter uma regra de ação que, aplicada a uma
série de lotes, permite aceitar lotes de certa qualidade, com um risco calculado”.
(definição dada em controle de qualidade)
4
“A amostragem é, sem dúvida, uma das operações mais complexas e passíveis
de introduzir erros, principalmente nas indústrias da mineração e metalurgia”.
“Uma boa amostragem não é obtida tendo-se como base apenas o juízo de valor
e a experiência prática do operador”.
5
chamada é de ordem k = 3 (pois 90/30 = 3). Seriam escolhidos: 3, 6, 9, …, 90 (1.k, 2.k,
3.k, ...., 30.k). Em outro exemplo imagine que se queira escolher as famílias residentes
a cada k casas, até compor o total necessário. Assim, começando por uma
extremidade de uma rua do bairro, poderiam ser tomadas das casas de ordem 5, o
que corresponderia a entrevistar a primeira família, pular 4 casas novamente e
entrevistar a segunda família, e assim por diante.
6
PRIMEIRA LISTA DE EXERCÍCIOS
2. Suponha que em uma escola se queira tomar uma amostra sistemática de alunos
do ensino fundamental. A quantidade de alunos no ensino fundamental é de 5000
alunos. Considere um tamanho de amostra de 200. Explique como faria todo o
levantamento da amostra.
3. Suponha que do total das empresas no setor de mármore do ES, 1500 estão com
certificação ambiental e 500 não. Para realizar um estudo sobre as empresas será
necessária uma coleta de amostra. Considere uma amostra de 150 empresas. Como
seria a distribuição da amostra se fosse realizada uma amostragem estratificada
proporcional ao tamanho do estrato?
3.1 Variáveis
7
engenharia, estado civil, etc. Assim, Dados Estatísticos são observações da realidade
que nos cerca. Podem ser fatos ou números.
De acordo com sua natureza os dados podem ser classificados como: dados
qualitativos ou quantitativos.
3.1.1 Dados qualitativos (ou categóricos): são aqueles nos quais as características
de um elemento são fornecidas por um nome ou por um rótulo. Por exemplo, a cor da
camisa de alunos pode ser branca, amarela, verde, vermelha, etc. O nome “branca”
está caracterizando o elemento observado (neste caso, o aluno). Os dados qualitativos
são classificados como:
8
diárias por ônibus do sistema Transcol, nº de crianças internadas porque foram
expostas a poluição atmosférica, etc.
Após os dados serem coletados eles devem ser organizados em uma planilha para
que se possa realizar a análise estatística. Abaixo é mostrado um exemplo de Planilha
para organização de dados coletados.
9
Polígono de frequências
Curvas de frequências e outros.
Classes Frequênci a %
Bacil lariophyceae 11 55,0
Cyanophyceae 5 25,0
Eugl enophyceae 4 20,0
Total 20 100,0
10
Exemplo: Nº de livros por aluno
Exemplo:
Figura 1. Título da figura.
12
10
Frequência
2
Bacillariophyceae Euglenophyceae
Cyanophyceae
Classes
11
A abertura angular de cada setor é proporcional à frequência observada para cada
valor.
Abaixo é mostrado um exemplo do gráfico de setores (pizza).
13%
A
40%
20% B
C
D
27%
12
Intervalo fechado: 1 |---| 8 = 1,2,3,4,5,6,7,8
Intervalo fechado à esquerda: 1|--- 8 = 1,2,3,4,5,6,7
Intervalo fechado à direita: 1 ---| 8 = 2, 3, 4, 5, 6, 7, 8
Amplitude=Li - li
Frequência simples ou absoluta (fi): é o nº de observações contidas em cada
classe.
Como montar uma tabela de frequência para dados contínuos?
Exemplo: Um gerente de uma loja mandou realizar um estudo a respeito do valor das
compras feitas por seus clientes. Foi colhida uma amostra aleatória de 50 compras
realizadas por seus clientes e o resultado foi o seguinte:
VALORES DAS COMPRAS (R$)
315,10 129,00 174,80 202,30 218,20 224,50 236,10 249,20 269,00 284,10
328,00 228,30 238,00 289,00 252,40 270,80 142,50 175,40 204,30 219,70
152,40 186,80 149,30 180,40 208,40 219,90 161,80 195,40 211,50 220,80
169,70 199,10 213,00 215,80 221,90 229,10 239,20 259,30 271,60 293,20
232,80 242,50 262,80 274,50 296,10 235,40 246,70 265,10 281,00 302,10
13
1. Determinar o número de classes = k n 50 7,07 7
2. Determinar a amplitude de cada classe
Maior valor Menor valor 328 129
Amplitude da classe 28,4 29
Número de classes 7
OBS.: A amplitude da classe foi arredondada para cima, pois o número de classes já
havia sido arredondado para baixo.
Para se formar as classes tomam-se o menor valor do conjunto de dados, 129, e soma
a ele a amplitude, 29, obtendo assim o limite superior da classe 158, os outros limites
são obtidos sempre se somando a amplitude, 29, até formar 7 classes. A frequência
observada é obtida contando-se a quantidade de elementos no intervalo, ou seja, de
129 a 159 (não incluindo esse extremo) existem 4 valores, e assim sucessivamente.
As outras frequências são obtidas da mesma forma que para dados não agrupados
em classe.
Classes Frequência observada
129 |-- 158 4
158 |-- 187 6
187 |-- 216 8
216 |-- 245 14
245 |-- 274 9
274 |-- 303 7
303 |-- 332 2
Total 50
3.2.5 Histogramas
Cada classe é representada por um retângulo.
A base do retângulo é o intervalo de classe.
A altura do retângulo é proporcional à frequência da classe.
A área do histograma é proporcional à soma das frequências, se usarmos a
frequência relativa a área sob a curva vale 1.
14
3.2.6 Polígono de Frequências
15
SEGUNDA LISTA DE EXERCÍCIOS
1) Classifique cada uma das variáveis abaixo e indique uma forma de representação
gráfica:
a) Tipos de defeitos em placas de aço.
b) Resistência de certo tipo de cimento.
c) Grau de satisfação da população em relação à reimplantação da Samarco no
Município de Anchieta (muito satisfeito, satisfeito, pouco satisfeito, insatisfeito).
d) Nº de amostras de água contaminadas em um lote coletado pela Cesan.
e) Tempo para fazer um teste (min)
f) Número de alunos aprovados por turma
g) Nível de escolaridade
h) Material particulado na atmosfera (µg/m 3)
i) Gastos com alimentação (R$)
j) Nº de acertos em uma prova objetiva
k) Religião
l) Valor de um imóvel (R$)
m) Nº de peças defeituosas por lote
n) Classificação em um concurso.
16
3) Considerando a distribuição de frequência da viscosidade para um produto químico
observado de hora em hora (amostra de 250 horas). Calcule a frequência observada,
frequência acumulada e a frequência relativa acumulada.
Viscosidade f i (%)
40 |-- 44 20
44 |-- 48 10
48 |-- 52 37
52 |-- 56 18
56 |-- 60 15
Total 100
17
3.3 Resumo de Dados
Medidas de Tendência Central são usadas para indicar um valor que tendem a
representar melhor, um conjunto de dados.
1. A média aritmética
Calcula-se a média aritmética determinando-se a soma dos valores do conjunto e
dividindo-se esta soma pelo número de valores do conjunto. Se os dados são de uma
X i
X i 1
n
onde a letra grega Σ é o símbolo do somatório e n é o número de elementos da
amostra.
Observe que na
figura ao lado, na
média, cada
indivíduo comeu um
frango cada um.
18
de todos os valores contidos na classe. Assim na determinação das medidas de
posição para dados agrupados em classe, cada classe será representada pelo seu
ponto central, ou seja, xi será o ponto médio da classe.
Calcula-se a média aritmética para dados agrupados multiplicando cada ponto médio
de classe pela respectiva frequência da classe somando-se os produtos e sendo,
então, a soma dividida pelo número total de observações. Assim,
X i i f
X i 1
n
f
i 1
i
Exemplo: Considere que uma pesquisa sobre os valores das compras efetuadas em
uma loja de vestuário Trinca localizada em um dos shoppings da cidade utilizou uma
amostra de 480 compras, escolhidas aleatoriamente. Encontre o valor médio de
compra para as duas situações abaixo:
2. A média ponderada
A média ponderada é uma média na qual cada valor se encontra ponderado de acordo
com sua importância no grupo total.
19
n
X w i i
Xw i 1
n
w
i 1
i
n
Onde, X w é a soma dos produtos de cada x pelo seu peso correspondente
i 1
i i
w
i 1
i é a soma dos pesos.
3. A média geométrica
Sejam X1, X2, X3, ..., Xn. A média geométrica de X é definida por:
20
A Média Geométrica é frequentemente usada quando discutimos taxas de
rendimento em investimento e também em padrões de poluição atmosférica, etc.
Exemplo de aplicação de médias:
4. A moda
21
Caso todos os valores tenham a mesma frequência de observação, teremos um
processo amodal.
Algumas propriedades:
Fácil de calcular;
Não é afetada por valores extremos;
Pode estar afastada do centro dos
valores;
Não utiliza todos os valores da
variável;
Nem sempre ela existe e pode existir
mais de uma moda.
h fm fa
mod a lmo
2 f m f a f p
Considere:
• lmo = limite inferior da classe modal;
• h = intervalo de classe;
• f m = frequência da classe modal;
• f a = frequência da classe anterior à classe modal;
• f p = frequência da classe posterior à classe modal.
22
3.3.2 Medidas de Posição Relativa
As medidas de posição relativa não são afetadas pelos valores observados. Serão
apresentadas as seguintes medidas:
Mediana
Quartis
Percentis
Após a ordenação dos valores, do menor para o maior, a mediana dividirá a série de
observações em 2 partes iguais, os quartis em 4 partes e os percentis em 100 partes.
1. Mediana
n
Pos 0,5
2
Se o valor de Pos for inteiro, a mediana é o elemento que ocupa a posição “Pos”. Se o
valor de Pos não for inteiro, a mediana será a média aritmética do elemento que ocupa
a posição inteira anterior e posterior a “Pos”.
Após a ordenação dos valores, do menor para o maior, a mediana dividirá a série de
observações em 2 partes iguais, ou seja, 50% menores valores se encontram abaixo
da mediana e 50% maiores valores se encontram acima da mediana.
23
Algumas propriedades
Fácil de calcular;
Não é afetada por valores
extremos;
É um valor único;
Não utiliza todos os valores da
variável.
n
Pos
2
Aplicar a fórmula à classe mediana:
h Pos Fant
Med lmed
f med
• h = Amplitude de classe;
Fant = Frequência acumulada até a classe anterior à que contém a mediana;
•
• lmed = Limite inferior da classe que contém a mediana;
24
2. Quartis
25%
25% 25%
25%
Q1 Q2 Q3
in
PosQi 0,5
4
3. Percentis
in
PosP 0,5 Sendo n o nº. de observações.
i
100
25
O percentil para dados em classe é dado por:
Exemplo
50
40
Idade (anos)
30
20
10
Grupo1 Grupo 2
GRUPO
26
medidas indicam se os valores estão relativamente próximos uns dos outros, ou
separados.
Pequena dispersão
Grande dispersão
1. Amplitude
A amplitude pode ser expressa pela diferença entre o maior e o menor número num
conjunto de dados.
B 1 2 4 6 6 9 10 10 6,0
C 0 6 7 7 7 6 8 7 6,0
As notas das três faculdades apontam para a mesma nota média, mas as notas estão
distribuídas diferentemente em cada Faculdade. Comparando as notas de A com B e
C, notamos que as notas de B são bem mais dispersas, indicando que B é mais
heterogênea em termos de notas obtidas. Em C observamos um ponto discrepante
27
dos demais, uma nota extremamente baixa, acarretando um valor para a média abaixo
da maioria das notas da turma.
Algumas Propriedades:
é sempre um número positivo;
se todos os valores de uma amostra forem iguais, a variância e o desvio padrão
serão zero;
a variância e o desvio padrão são medidas afetadas pelos valores extremos da
variável.
A variância e o desvio padrão avaliam a dispersão de um conjunto de valores em
relação à média aritmética. Para calcularmos a variância ou o desvio padrão, devemos
considerar os desvios de cada valor em relação à média. Depois construímos uma
espécie de média destes desvios. Assim:
Seja um conjunto de números: x1, x2, x3, x4 ,..., xn
x1 x , x2 x , x3 x , ..., xn x
n
(x x) 0
i 1
i
Como temos valores positivos e negativos a soma dos desvios é sempre zero.
Como estamos interessados nos tamanhos dos desvios e não no fato deles serem
positivos e negativos trabalhamos com os desvios ao quadrado. Tomamos a média
aritmética dos desvios ao quadrado, obtendo a variância. A unidade de medida da
variância equivale à unidade dos dados ao quadrado. Para retornarmos a unidade
original dos dados tiramos à raiz quadrada da variância obtendo assim o desvio
padrão.
Variância Populacional
n Onde
( xi )2 •µ (mi) é a média populacional
2 i 1
N • N é o tamanho da população
• (sigma) é o desvio padrão
Desvio Padrão Populacional
populacional
n
(x )i
2
i 1
28
Exemplo: Notas de 8 alunos: 4, 5, 5, 6, 6, 7, 7, 8
2
Nota Desvio = Nota - Média (Desvio)
4 -2 4
5 -1 1
5 -1 1
6 0 0
6 0 0
7 1 1
7 1 1
8 2 4
Soma 0 12
Variância Amostral
n
(x x) 2 Onde
s2 i 1
i
x 2
i nx 2
• x é a média amostral
n 1 n 1 • n é o tamanho da amostra
Desvio Padrão Amostral • s é o desvio padrão amostral
n
(x x)
i
2
x 2
nx 2
s i 1
i
n 1 n 1
Para o cálculo das medidas de variabilidade temos que ter o valor da média aritmética.
A média aritmética é igual a:
14 6 8 22 18 14 16 14 24 32 14 16
X 16,5
12
29
i xi x
xi ( xi x ) 2
1 14 14-16,5 = -2,5 6,25
2 6 6-16,5 = -10,5 110,25
3 8 8-16,5 = -8,5 72,25
4 22 22-16,5 = 5,5 30,25
5 18 18-16,5 = 1,5 2,25
6 14 14-16,5 = -2,5 6,25
7 16 16-16,5 = -0,5 0,25
8 14 14-16,5 = -2,5 6,25
9 24 24-16,5 = 7,5 56,25
10 32 32-16,5 = 15,5 240,25
11 14 14-16,5 = -2,5 6,25
12 16 16-16,5 = -0,5 0,25
Total 0 537
537
A Variância será a seguinte: s2 44,75
12
O desvio padrão é: s 44,75 6,7
(x x)
i
2
fi
x 2
f nx 2
s i 1
2 i i
n 1 n 1
(x x)
i
2
fi
x2
f nx 2
s i 1
i i
n 1 n 1
Onde
x é a média amostral
n é o tamanho da amostra
s é o desvio padrão amostral
fi é a frequência da classe
se os dados estão agrupados em classe xi é ponto médio da classe.
30
Exemplo: para o exemplo anterior calcule o desvio padrão amostral:
Valores ($) fi
$10,00 a $ 20,00 62
20,00 a $ 30,00 84
$ 30,00 a $ 40,00 123
$ 40,00 a $ 50,00 93
$ 50,00 a $ 60,00 52
$ 60,00 a $ 70,00 36
Total
se CV:
31
102, 305, 405, 550, 760, 567, 100, 459
IV.1 Introdução
32
Nos fenômenos aleatórios, os resultados não serão previsíveis, mesmo que haja um
grande número de repetições do mesmo fenômeno. Por exemplo: se considerarmos
um pomar com centenas de laranjeiras, as produções de cada planta serão diferentes
e não previsíveis, mesmo que as condições de temperatura, humidade, solo, etc.,
sejam as mesmas para todas as árvores. Nos experimentos aleatórios, mesmo que as
condições iniciais sejam as mesmas, os resultados finais de cada tentativa do
experimento serão diferentes e não previsíveis.
IV. 2 Definições
33
O Método Clássico: de atribuir probabilidade é apropriado quando todos os
resultados experimentais são igualmente prováveis. Se há n possibilidades igualmente
prováveis, das quais uma deve ocorrer, e s são consideradas como favoráveis ou
como um “sucesso”, então a probabilidade de um sucesso é s/n , ou seja,
Exemplo 1
E: Lançamento de um dado equilibrado
A: Obter a face 5
S = {1, 2, 3, 4, 5, 6}
Então
A = {5}
1
P ( A)
6
Exemplo 2
E: Retirar uma carta de um baralho de 52 cartas
B: Extrair um ás
“Bem misturado” significa que qualquer carta tem a mesma chance de ser extraída.
Como há s = 4 ases entre as n = 52 cartas, a probabilidade é dada por:
s 4 1
P( B)
n 52 13
N º de ocorrências de A
P( A)
N º de repetições do exp erimento
34
468
0,78 78%
600
Exemplo: Um investidor decide aplicar em ações porque seu “feeling” indica que a
probabilidade de ganho é de 60% ao ano.
Exemplos:
• A probabilidade de obter um número menor ou igual a 6 no lançamento de um
dado.
• Probabilidade de obter um número maior que 6 no lançamento de um dado.
35
A Onde A é o complementar de A.
A
P( A) 1 P( A )
Evento composto é qualquer evento que combina dois ou mais eventos simples. Ex.:
Lançamento de duas moedas, retirar um ÁS de um baralho e obter a face 6 no
lançamento de um dado.
S S
A B A B
36
IV. 5.1 Regra da Adição
A B
Neste caso, não existe uma carta no baralho que seja “ás” e “reis” ao mesmo tempo.
Então, a intercessão é nula.
Como existem 4 “ás” e 4 “reis” no baralho (uma de cada naipe), a probabilidade será
4 4 8
igual a:
52 52 52
Neste caso existe uma carta que é „ás” e “espadas” simultaneamente. Assim sendo,
existe intercessão.
A probabilidade será, então, igual a:
4 13 1 16
52 52 52 52
37
IV. 5.2 Probabilidade Condicional
É a probabilidade de ocorrência de um evento submetida à ocorrência de um outro
evento.
A sua notação é: P(A/B ) e se lê da seguinte maneira: Probabilidade de ocorrer o
evento “A” dado que ocorreu o evento “B”.
Neste caso, a ocorrência do evento “B” é um fato. Não existe incerteza a esse
respeito. A incerteza está restrita à ocorrência do evento “A”.
Expressão formal da probabilidade condicional:
P( A B)
P( A / B)
P( B)
P( A B)
P( B / A)
P( A)
Exemplo: Suponha que em uma sala de aula existam 14 meninas e 16 rapazes. Das
14 meninas, 6 estão vestidas com blusas brancas, enquanto que dos 16 rapazes, 10
estejam vestidos com blusas brancas.
38
A probabilidade condicional diminuiu o espaço amostral original. O espaço amostral
agora é constituído somente pelos alunos, do sexo Trinca ou do sexo Arranhão, que
estejam usando blusa branca.
Considere os eventos “A” e “B”. Diz-se que os eventos “A” e “B” são estatisticamente
independentes entre si se P(A) = P(A/B) ou P(B) = P(B/A).
Exemplo: Considere uma caixa contendo 10 peças, sendo 8 boas e 2 ruins. Retira-se,
aleatoriamente, duas peças. Vamos considerar dois casos:
1º caso: experimento com reposição;
2º caso: experimento sem reposição.
39
A probabilidade da 1ª peça ser boa é igual a 8/10. Como o experimento é com
reposição, a probabilidade da 2ª peça ser boa será também igual a 8/10 quer a 1ª
peça tenha sido boa ou não. Então:
P(2ª peça boa) = P(2ª peça boa/1ª peça foi boa)
Dessa forma, os eventos “1ª peça boa” e “2ª peça boa” são independentes entre si.
Neste caso, a probabilidade da 2ª peça ser boa vai depender da 1ª peça ter sido boa
ou não.
Se a 1ª peça foi boa, a P(2ª peça boa) é igual a 7/9.
Se a 1ª peça foi ruim, a P(2ª peça boa) é igual a 8/9.
Então, a probabilidade de “2ª peça boa” vai depender do que ocorreu com a 1ª peça.
Assim, esses eventos (“1ª peça boa” e “2ª peça boa”) são dependentes entre si.
Exemplo: Suponha que de cada 100 automóveis que trafegam pelas ruas, 70 sejam
de fabricação nacional e 30 sejam importados. Suponha também que 60% dos
automóveis nacionais sejam de cor clara e 40% de cor escura. Dos importados, 35%
são de cor clara e 65% de cor escura.
Determine a probabilidade de se escolher aleatoriamente um automóvel nacional e
escuro.
O que se deseja calcular é P(nacional escuro)
Usando a forma geral da multiplicação:
P(nacional escuro) = P(nacional) x P(escuro/nacional)
Aplicando os dados constantes do enunciado do problema:
P(nacional escuro) = 0,70 x 0,40 = 0,28
2) Suponha que quatro cartas são escolhidas aleatoriamente e sem reposição de um baralho
de 52 cartas. Qual a probabilidade de que todas as quatro cartas sejam reis?
40
3) Suponha que quatro cartas são retiradas aleatoriamente de um baralho de 52 cartas, após
cada retirada a carta é recolocada no maço e todas as cartas são embaralhadas
novamente antes da seleção da próxima carta. Qual a probabilidade de que todas as
quatro cartas sejam reis?
4) Uma urna contém 5 bolas brancas, 4 vermelhas e 3 azuis. Extraem-se 3 bolas sem
reposição. Achar a probabilidade de que:
a) nenhuma vermelha;
b) exatamente uma vermelha;
c) todas sejam da mesma cor.
5) A empresa M & tem M tem 15800 empregados, classificados de acordo com a tabela
abaixo:
IDADE Sexo
Homens Mulheres Total
< 25 anos 2000 800 2800
25 – 40 anos 4500 2500 7000
> 40 anos 1800 4200 6000
Total 8300 7500 15800
7) Em uma indústria há 10% pessoas que ganham mais de 20 salários mínimos (s.m.), 20%
que ganham entre 10 e 20 s.m. e 70% que ganham menos de 10 s.m. Três pessoas desta
industria são selecionadas com reposição. Determinar a probabilidade de que pelo menos uma
ganhe menos de 10 s.m.
Variável aleatória (v.a) é uma variável que tem um valor numérico único, para cada
resultado de um experimento.
Seja E um experimento e S o espaço amostral associado ao experimento. Uma função
X, que associe a cada elemento s S um número real X(s) é denominada variável
aleatória.
S R
X •
s•
X(s)
Variável aleatória
41
EXEMPLO:
E: lançamento de duas moedas
X: número de caras obtidas nas duas moedas
S = {(ca,ca),(ca,co),(co,ca),(co,co)}
X = 0: corresponde ao evento (co,co)
X = 1: corresponde ao evento (co,ca), (ca,co)
X = 2: corresponde ao evento (ca,ca)
2. 0 P( x) 1, x
Exemplo: E: lançamento de duas moedas.
X: Nº de caras obtidas.
X 0 1 2
P(x) 0,25 0, 5 0,25
42
EXEMPLO: Verifique se a seguinte função é dunção de probabilidade e determine as
probabilidades requeridas:
2x 1
f ( x) , x = 0, 1, 2, 3, 4.
25
a) P(X = 2)
b) P(X ≤ 1)
c) P(2 ≤ X < 4)
d) P( X > -10)
V. 1.2 Média (ou valor esperado) e variância de uma variável aleatória discreta
Valor esperado E(x) é uma medida de tendência da variável aleatória “x”. É igual à
média de um número infinito de observações desta variável.
E ( X ) xP( x)
É também chamada de esperança matemática ou média.
43
Ex 180.000 0,15 215.000,00 0,30 250.000,00 0,45 280.000,00 0,10
E x 232.000,00
Isso significa que se este imóvel fosse vendido um infinito nº de vezes, a média
dos seus valores de venda seria igual a $232.000,00. Uma outra interpretação
seria a de que se um nº infinito de imóveis desse mesmo tipo fosse vendido, o
valor médio do preço de venda seria $ 232.000,00.
2 x 2 Px
Podendo ser reescrita como:
2 E X 2 E (X ) 2
O desvio padrão ( ) da variável aleatória da v.a. discreta é dado por:
2 VAR ( X )
Nº DE RECLAMAÇÕES PROBABILIDADE
1 0,10
2 0,30
3 0,35
4 0,25
2 8, 45 2,75 0,8875
2
44
QUINTA LISTA DE EXERCÍCIOS
F(x) = P(X x) = p( x )
xi x
i
45
Temos então:
F (0) P( X 0) P( X 0) 1 / 4
F (1) P( X 1) P( X 0) P( X 1) 3 / 4
F (2) P( X 2) P( X 0) P( X 1) P( X 2) 4 / 4
Uma variável aleatória X contínua pode assumir qualquer valor no intervalo de sua
definição. EX.: medida da corrente de um fio delgado de cobre.
46
área embaixo de um ponto é igual a zero. Uma função densidade de probabilidade f(x)
pode ser usada para descrever uma distribuição de probabilidades de uma variável
aleatória contínua X.
b)
f ( x)dx 1 ;
c) P ( a X b)
f ( x)dx
a
= a área sob f(x) para quaisquer a, b, com
a b .
Obs.:
* 0 P(a X b) 1
* P( X x) 0
A média e a variância de uma v.a. contínua são definidas de modo similar a uma v.a.
discreta. A integração substitui a soma nas definições.
Definição: Suponha que X seja uma v. a. contínua com uma função densidade de
probabilidade f(x).
2 E X 2 E (X ) 2
47
E( X ) x f ( x)dx
2 2
Onde,
dF ( X )
f ( x) , desde que a derivada exista.
dx
2 x 3 se 0 x 2
1. Verificar se f ( x) é uma fdp.
0, se x 0 ou x 2
R: Não é uma fdp
2. Seja uma v.a. X a corrente em um fio delgado de cobre, medida em miliampères. Suponha
que a faixa de X seja [0, 20 mA] e considere que a função densidade de probabilidade de X
seja f ( x) 0,05 para 0 x 20 . Qual a probabilidade de que uma medida da corrente
seja menor 10 miliampères? R: 0,5
4. Suponha que o tamanho de uma partícula de contaminação possa ser modelado como
f ( x) 2 x 3 para 1 < X. Determine a média de X. R: 2
5. Seja X o tempo até que uma reação química esteja completa é aproximado pela função de
distribuição cumulativa abaixo:
0 se x 0
F(X ) 0 , 01x
1 e , se x 0
48
6. Seja X uma variável aleatória contínua, o tempo de falha de um componente eletrônico de
uma copiadora e a fdp de X, f (x) , foi dada:
f ( x) 2 x , para 0 < x < 1
e f ( x) 0 , para quaisquer outros valores de x.
Determine a probabilidade do tempo gasto ser de no máximo ¼ h, isto é, P( X 1 / 4) ? R =
1/16
O termo “binomial” designa situações em que os resultados de uma v.a. podem ser
agrupados em duas categorias (os dados são, pois, nominais). Exemplo: em
49
processos industriais as peças falham ou não falham; em medicina o paciente
sobrevive ou morre; em marketing o consumidor reconhece um produto ou não.
n n n!
P ( X k ) p k (1 p ) n k ;
k k x!( n x)!
Notação: X: B (n, p).
p: probabilidade de sucesso em uma das repetições;
(1-p): probabilidade de fracasso em uma das “n” repetições;
n: número de repetições;
k: nº de sucessos em “n” repetições, pode ser qualquer inteiro entre 0 e n,
inclusive;
P (X = k): é a probabilidade de obter “k” sucessos em “n” repetições.
Desvio padrão =
n p (1 p)
50
Exemplo 1: Uma partida tem a fração defeituosa p=0,04. Calcular a probabilidade de
aceitação da partida, com amostra de n = 50 peças, e sendo que a aceitação ocorrerá
se menos de uma estiver defeituosa. R: 0,3999
Exemplo 2: Cada amostra de ar tem 10% de chance de conter uma certa molécula
rara. Considere que as amostras sejam independentes com relação à presença da
molécula rara. Encontre a probabilidade de que nas próximas 18 amostras,
exatamente 2 contenham a molécula rara. R: 0,28
Consideram-se uma população com N elementos, dos quais r tem uma determinada
característica (a retirada de um desses elementos corresponde ao sucesso). Retira-se
dessa população, sem reposição, uma amostra de tamanho n.
r N r
k n k
P( X k ) , 0k n e k r
N
n
51
2 50 2 2 50 2
0 10 0 1 10 1
P( X 0) P( X 1) 0,637 0,326 0,963
50 50
10 10
Exemplo 2: Pequenos motores são guardados em caixas de 50 unidades. Um
inspetor de qualidade examina cada caixa, antes da posterior remessa, testando 5
motores. Se nenhum motor for defeituoso, a caixa é aceita. Se pelo menos um for
defeituoso, todos os 50 motores são testados. Há 6 motores defeituosos numa caixa.
Qual a probabilidade de que seja necessário examinar todos os motores dessa caixa?
Solução: X: nº de motores defeituosos da amostra.
N = 50; r = 6; n = 5
6 50 6
0 5 0
P(X 1) = 1 – P(X < 1) = 1 - P(X = 0) = 1 1 0,5127 0,4874
50
5
VI. 1. 3 Distribuição de Poisson
Exemplo: Número de defeitos por centímetro quadrado, clientes atendidos por hora,
chegada de navios por dia no porto de Vitória.
52
EXEMPLO 2: Suponha que uma vistoria em uma estrada constatou que, em média,
existem 10 imperfeições no seu leito a cada 1000 metros. Qual a probabilidade de, em
100 metros, serem encontradas 2 imperfeições?
Nesse caso, o “sucesso” é encontrar uma imperfeição no leito da estrada, e o período
ao longo do qual se deseja calcular a probabilidade, é o espaço de 100 metros.
Como calcular a Probabilidade:
Seja: = Nº. médio de sucessos no intervalo pretendido
x = Nº. de sucessos pretendidos. Então:
x e
P( X x)
x!
Onde:
t
e = 2,71828
“” é a razão de ocorrência do “sucesso” e o “t” é o período ao longo do qual se deseja
calcular a probabilidade.
No exemplo nº. 1:
= 60 clientes/hora = 60 clientes/60 minutos
t = 10 minutos.
60
Então: 10 10
60
104 e 10
P ( X 4) 0,0189
4!
No exemplo nº. 2:
= 10 imperfeições/1000 metros
t = 100 metros.
Então: = 10
100 1
1000
12 e 1
P ( X 2) 0,1839
2!
EXEMPLO: O número de chamadas telefônicas que chegam a uma central é
freqüentemente modelado como uma variável aleatória de Poisson. Considere que,
em média, há 10 chamadas por hora.
a) Qual a probabilidade de que haja exatamente 5 chamadas em uma hora? R: 0,03
b) Qual a probabilidade de que haja 3 ou menos chamadas em uma hora? R: 0,01
53
c) Qual a probabilidade de que haja exatamente 15 chamadas em duas horas? R:
0,05
d) Qual a probabilidade de que haja exatamente 5 chamadas em 30 minutos? R: 0,17
Seja X: Número de repetições necessárias para que A ocorra pela r-ésima vez.
x 1 r
P( X x) p (1 p) x r , xr
r 1
A variável aleatória X assim definida tem distribuição de Pascal.
54
10 1
P( X 10) 0,20 4 (1 0,20)104 0,035232
4 1
1) Ontem, 80% das ações mais negociadas na Bolsa de Valores Alpha caíram de preço.
Suponha que você tenha uma carteira com 20 dessas ações e que as ações que perderam
valor possuam distribuição binomial. Pede-se calcular:
a) quantas ações de sua carteira você espera que tenham caído de preço; R: 16
b) o valor do desvio padrão das ações que tem na carteira; R: 1,79
c) a probabilidade de que tenham caído de preço exatamente 15 dessas ações. R: 0,17
3) Um lote de equipamentos novos é recebido pela empresa que você trabalha como gerente.
10 equipamentos são inspecionados. O lote é rejeitado se pelo menos 2 equipamentos forem
defeituosos. Sabendo-se que 1% dos equipamentos é defeituoso, determinar a probabilidade
de a firma rejeitar o lote. R: 0,0043
4) Uma firma recebe 720 mensagens em seu fax em 8 horas de funcionamento. Qual a
probabilidade de que:
a) em seis minutos receba pelo menos 4 mensagens? R: 0,979
b) Em 4 min não receba nenhuma mensagem? R: 0,00248
6) Numa linha de montagem, 10% das peças são defeituosas.Qual a probabilidade da quinta
peça que se analisa ser a segunda defeituosa? R: 0,02916
7) Qual a probabilidade de que no 25º lançamento de um dado ocorra a face 4 pela 5ª vez? R:
0,0356
9) Uma firma compra lâmpadas por centenas. Examina sempre uma amostra de 15 lâmpadas
para verificar se estão boas. Se uma centena inclui 12 lâmpadas queimadas, qual a
probabilidade de se escolher uma amostra com pelo menos uma lâmpada queimada? R:
0,8747
10) Uma fábrica de motores para máquinas de lavar roupas separa de sua linha de produção
diária de 350 peças uma amostra de 30 itens para inspeção. O número de peças defeituosas é
de 14 por dia. Qual a probabilidade de que a amostra contenha pelo menos 3 motores
defeituosos? R: 0,108453
55
VI. 2 Distribuições Contínuas de Probabilidades
- Média +
Mediana
Moda
56
- Média +
Mediana
Moda
Desvio padrão pequeno
1 x
2
1
2
f ( x) e
2
57
O cálculo da probabilidade da variável aleatória assumir um valor dentro de um
determinado intervalo se dará através da integral da função densidade de
probabilidade ao longo do intervalo pretendido.
Seria mais prático usarmos tabelas, como já fizemos para outras distribuições.
Acontece que teríamos que construir infinitas tabelas, uma para cada par de valores
da média e do desvio padrão da distribuição.
58
Entre com o inteiro e 1º Entre com o 2º decimal
decimal do valor de Z do valor de Z
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0
0,1
0,2 Probabilidade para
.
. Z entre 0 e 1,14
.
1,0
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2
.
.
.
2,0 Leia, no cruzamento
2,1
. a Probabilidade
.
.
Exemplos:
1. Um estudo diário realizado sobre material particulado em suspensão feito em uma
determinada área da cidade nos finais de semana revelou que essa variável aleatória
é normalmente distribuída com uma média de 98 μg/m3 e um desvio padrão de 20
μg/m3. Qual a probabilidade de se ter uma medição cujo valor seja:
a) Entre 98 e 110? R: 0,2257
b) Maior do que 110? R: 0,2743
c) Entre 95 e 105? R: 0,1964
d) Menor que 110? R: 0,7257
b) P( X X ) 0,99 R: 59,3
59
A variável aleatória é o intervalo de tempo ou espaço entre dois eventos
consecutivos.
Função Densidade de Probabilidade é igual a:
x
1
f ( x) e
onde = tempo (ou espaço) médio
x
0
P( x x0 ) e , para valores de x xo
P(t 10 )
minutos)=0,3679
0 10 t
60
A probabilidade que se deseja calcular, neste caso, é P (t 8 minutos). Tem-se então
que:
8
p(t 8) 1 e 10
0,5507
P(t 8 )
)minutos)=0,5507
0 8 t
P(5 t 9)
99)=0,20
0 5 9 t
61
Esta área é igual a 1
1
b-a
a b X
1
f ( x)
ba
Para outros valores:
f ( x) 0
EXEMPLO: O valor de uma compra em uma loja de discos é uma variável aleatória
uniformemente distribuída no intervalo entre $ 10,00 e $ 35,00. Qual a probabilidade
de um cliente realizar uma compra cujo valor se situe entre $ 15,00 e $ 28,00?
Observem no gráfico a seguir os valores envolvidos no problema.
Probabilidade Desejada
1
35 - 10
10 15 28 35 X
1
p 28 15 0,52
35 10
Características:
62
1. Aplica-se a casos em que uma transformação log-natural resulte em uma
distribuição normal.
2. Como a função logaritmo não está definida para valores menores ou iguais à zero,
X somente poderá assumir valores maiores do que zero.
3. O formato da curva que representa a função densidade de probabilidade
apresentará assimetria à esquerda.
4. O modelo apresenta um parâmetro de localização µ e um de escala σ.
Diz-se que uma v.a. não negativa X possui distribuição lognormal se a v.a. Y = ln(X)
possui uma distribuição normal. A f.d. p. resultante de uma v.a. lognormal quando ln(X)
tiver distribuição normal com parâmetros µ e σ é:
1 Ln ( x )
2
2
f ( x) e 2
, para x ≥0.
x 2
Tenha cuidado neste caso. Os parâmetros µ e σ não são a média e o desvio padrão
de X e sim da variável Y = ln (X). A média e a variância de X são:
2
E( X ) x e 2
Var ( X ) 2 x e 2 2
e 1
2
63
Padronização:
Ln(x)
Z
Exemplo:
A distribuição lognormal é usada como modelo para diversas propriedades de
materiais. Um artigo sugere que a distribuição lognormal com µ = 0,375e σ = 0,25 é
um modelo plausível para X = módulo da elasticidade de sistemas de vigas de
madeira construídos de hem-fir grau número 2. O valor da média e variância de X são:
0, 252
0, 375
E( X ) x e 2
1,50
Var ( X ) 2 x e 2 0,375 0, 25 e 0, 25 1 0,1453
2 2
Aplicação:
A partir dos dados dos tempos de reparo para as falhas do Circuito de Via Reed
(equipamento utilizado em sinalização ferroviária), fornecidos pelas equipes de
manutenção corretiva, os seguintes parâmetros da distribuição log-normal foram
estimados e traçadas as curvas abaixo:
64
Após a análise da manutenibilidade, foram identificados diversos problemas que
estavam conduzindo a altos tempos de reparo, tornando-se preciso modificar o
sistema de manutenção. Como exemplo, de problemas identificados, podemos citar:
Algumas falhas, devido ao treinamento inadequado para as equipes de
manutenção, estavam conduzindo a tempos de reparo excessivamente altos.
Os procedimentos de diagnose não estavam corretos na grande maioria dos
reparos.
EXEMPLOS:
1. A concentração de poluentes produzidos por indústrias químicas é conhecida por
exibir comportamento que lembra uma distribuição log-normal. Isso é importante
quando considerarmos assuntos relacionados ao cumprimento das regulamentações
governamentais. Suponha que assumimos que a concentração de certo poluente, em
ppm, tem distribuição log-normal com parâmetros µ=3,2 e σ=1. Qual é a probabilidade
de que a concentração exceda oito partes por milhão? R: 0,8686
65
2. Em um estudo de Marketing, os dados referentes ao número de minutos diários que
100 indivíduos selecionados aleatoriamente passam em frente à TV foram tabulados;
após algumas análises chegou-se a conclusão de que o Ln (X) apresentava-se como
uma v.a. Y normalmente distribuída com média igual a 5 e desvio padrão de 1,5.
a) Qual a probabilidade de selecionarmos um indivíduo que assista no máximo 95 min
diários de televisão? R: 0,3821
b) Qual o tempo médio que um indivíduo passa diante da TV? R: E(X) = 457,14
x
1
f ( x; , ) x e , para x 0 x
0 x0
tem uma distribuição de Weibull com parâmetro de escala α >0 e parâmetro de forma
β > 0.
Quando α=1, a distribuição de Weibull é idêntica à distribuição exponencial.
66
Função densidade de probabilidade de Weibull para valores selecionados de β e α.
0 x0
F ( x; , ) x
P ( X x ) 1 e x0
A média e a variância da v.a. X que tem distribuição de Weibull é:
1
E (X ) 1
2
2 1
VAR ( X ) 1 2 1
2 2
Onde
67
Exemplo: O tempo de falha (em horas) de um mancal em um eixo mecânico é
satisfatoriamente modelado como uma v.a. de Weibull com α =1/2 e β = 5000 horas.
Determine o tempo médio até falhar.
1
E ( X ) 5000 1 5000 (3) 5000 2! 10000 horas
0,5
Determine a probabilidade de um mancal durar no mínimo 6000 horas.
0,5
6000
P( X 6000) 1 F ( x) e 5000
e 1, 2 0,301
2. Taxa de falha: É útil para determinarmos a taxa de falha (algumas vezes chamadas
de taxa de risco) e percebemos o desgaste ou deterioração do componente. Define-se
confiabilidade de um componente ou produto como a probabilidade de que ele
funcionará apropriadamente por, pelo menos, um tempo determinado, sob condições
experimentais específicas.
EXEMPLOS:
68
1. Suponha que X tem distribuição de Weibull com α =0,2 e β = 100 horas. Determine:
a) P(X <1000) R: 0,795
b) P(X>5000) R: 0,887
69
VII.1 Distribuição Amostral da Média
A média, bem como todas as demais estatísticas de uma amostra, são variáveis
aleatórias. Dessa forma, possuem distribuições de probabilidade como qualquer outra
variável aleatória. Uma distribuição amostral de médias é uma distribuição de
probabilidade que mostra a variabilidade das médias amostrais.
A média de uma distribuição amostral é sempre igual à média populacional
x
EXEMPLO: Uma amostra aleatória de 100 observações dos valores das vendas
realizadas em determinada loja apresentou uma média igual a $ 328,40 e um desvio
padrão de $ 87,43. Qual o valor estimado da média, da variância e do desvio padrão
amostrais?
A média amostral será igual a: a $ 328,40
O desvio padrão amostral será igual a: 87,43/10 = 8,743
Teorema do Limite Central
Informações
1. A variável aleatória x tem distribuição (que pode ser normal ou não), com média µ e
desvio padrão σ .
2. Amostras de tamanho n são extraídas aleatoriamente dessa população.
Conclusão
1. Na medida em que o tamanho da amostra aumenta a distribuição das médias
amostrais x , tende para uma distribuição normal.
2. A média das médias amostrais será a média populacional µ.
3. O desvio padrão das médias amostrais será
n
70
Regras práticas de uso comum
1. Para amostras de tamanho n>=30, a distribuição das médias amostrais pode ser
aproximada satisfatoriamente por uma distribuição normal. A aproximação melhora na
medida em que aumenta o tamanho da amostra n.
2. Se a própria distribuição original tem distribuição normal, então as médias
amostrais terão distribuição normal para qualquer tamanho amostral n.
p p
Onde:
p = proporção populacional
p = média da distribuição amostral das proporções.
71
p(1 p)
p
n
p(1 p) 0,10(0,90)
p 0,03
n 100
Usando a padronização temos:
P( pˆ 0,17) ?
0,17 0,10
z 2,33
0,03
2) A distribuição do peso de homens que viajam de avião de Vitória para São Paulo tem média
de 163 libras e desvio padrão de 18 libras, qual é a probabilidade do peso médio de 36
homens tomados aleatoriamente ser menor que 167 libras.R=0,9082
72
73
74