PROBABILIDADE E ESTATÍSTICA
APLICADA À MANUTENÇÃO
Prof. Dr. Manoel Marinho
• Programa detalhado
1.0. Introdução à estatística
1.1 – Definições. Motivação
1.2 – Distribuição de Frequências e Histogramas
1.3 – Medidas de Tendência Central e Separatrizes
1.4 –Assimetria e Curtose
1.5 – Medidas de Dispersão
1.6 – Correlação e Regressão Linear
2.0. Introdução à probabilidade
2.1 – Experimento Aleatório. Espaço Amostral. Eventos
2.2 – Probabilidade. Conceitos
2.3 – Probabilidade Condicional
2.4 – Eventos Independentes
2.5 – Teorema de Bayes
3.0. Variáveis aleatórias unidimensionais
3.1 – Introdução
3.2 – Variável Aleatória Discreta
3.3 – Variável Aleatória Continua
4.0. Algumas distribuições importantes
4.1 – Distribuições Discretas: Binominal, Poisson
4.2 – Distribuições Continuas: Normal, Exponencial, Weibull
5.0 – Aplicaçoes: Curva da Banheira
REFERENCIAS
1. MAGALHÃES, M. N. & LIMA, A. C. P. (2009) Noções de Probabilidade e Estatística. 7a ed. São Paulo:
Edusp.
2. MORETTIN, P. A. & BUSSAB, W. O. (2010) Estatística Básica. 6a ed. São Paulo: Saraiva.
3. MARTINS, G. A. & DOMINGUES, O. (2011) Estatística Geral e Aplicada. 4a ed. São Paulo: Atlas.
4. CRESPO, A. A. (2009) Estatística Fácil. 19a ed. São Paulo: Saraiva
5. DEVORE, JAY L. Probabilidade e Estatística Para Engenharia e Ciências - 8ª Ed. 2014. Cengage Learning
6. MONTGOMERY, DOUGLAS C. Estatística Aplicada e Probabilidade Para Engenheiros - 6ª Ed. [Link]
7. MEYER,PAUL L. Probabilidade Aplicações a Estatística. 2000. LTC
8. SPIEGEL , MURRAY R. Estatística - 4ª Ed. - Col. Schaum. [Link]
9. MORETTIN, PEDRO A. E TOLOI, CLÉLIA M. Modelos para Previsão de Séries Temporais,Edgard Blucher,
1981.
10. BOX, G.E.P. AND JENKINS, G.M. (1970). Time Series Analysis: Forecasting and Control. San Francisco:
Holden-Day. (Revised edition published 1976).
11. CORREA, SONIA MARIA BARROS BARBOSA. Probabilidade Estatística - 2a Ed – 2003.
MOTIVAÇÃO
Ideias Básicas
Probabilidade
• Latim probare = provar, testar
Estatística
• Grego stokhastikós = conjectura, adivinhação, sujeito às leis do acaso
Uso coloquial:
• “provável”, incerteza, desconhecimento, risco, dúvida.
• RISCO x INCERTEZA
Um pouco de História
Antiguidade
• 3500 A.C.: jogos de azar que utilizavam objetos criados a
partir de pedaços de ossos ou madeira (precursores dos
dados modernos).
• 2000 A.C.: dados cúbicos, com marcas quase idênticas
aos dados atuais.
• Os jogos de azar sempre foram muito populares desde
essa época e tiveram um papel importante para o
desenvolvimento da Teoria das Probabilidades.
Um pouco de História
Era Moderna
Um pouco de História
Era Moderna
Um pouco de História
Atualidades
1. 1 Definições. Fases do trabalho estatístico
A - Introdução e Importância da Estatística
B - Grandes áreas da Estatística
C - Fases do Método Estatístico
D - Séries Estatísticas
A - Introdução e Importância da Estatística
• A Estatística é uma parte da Matemática que fornece
métodos para a coleta, organização, descrição, análise
e interpretação de dados, viabilizando a utilização dos
mesmos na TOMADA DE DECISÕES.
B - Grandes áreas da Estatística
Para fins de apresentação, é usual se dividir a estatística em três
grandes áreas, embora não se trate de ramos isolados:
• Estatística Descritiva e Amostragem – Conjunto de técnicas que objetivam
coletar, organizar, apresentar, analisar e sintetizar os dados numéricos de uma
população, ou amostra;
• Estatística Inferencial – Processo de se obter informações sobre uma
população a partir de resultados observados na amostra;
• Probabilidade - Modelos matemáticos que explicam os fenômenos estudados
pela Estatística em condições normais de experimentação.
C - Séries Estatísticas
• Cronológicas - Tempo (fator temporal ou cronológico) – a que época
refere-se o fenômeno analisado;
• Geográficas - Local (fator espacial ou geográfico) – onde o fenômeno
acontece;
• Específicas - Fenômeno (espécie do fato ou fator especificativo) – o
que é descrito.
Exemplo de Série Cronológica
Exemplo de Série Geográfica
Exemplo de Série Específica
Unidade 2 – Distribuição de Frequência
Vamos considerar, nesta unidade, o estudo detalhado da distribuição de
frequência, que é a forma pela qual podemos descrever os dados estatísticos
resultantes de variáveis quantitativas. São objetivos desta unidade:
• Compor uma distribuição de frequência com ou sem intervalos de classe;
• Determinar o quadro de frequências, úteis para condensar grandes
conjuntos de dados, facilitando o sua utilização;
• Representar uma distribuição de frequência através de histograma, polígono
e ogiva.
l-inf l-sup ni Ni fi Fi xi
k Limite Limite Frequencia Freq. Simp Frequencia Freq. Relat Ponto
Classes Inferior Superior Simples Acumulada Relativa Acumulada Medio
1
2
3
4
5
...
GRÁFICOS REPRESENTATIVOS DE UMA
DISTRIBUIÇÃO DE FREQUÊNCIA:
HISTOGRAMA, POLÍGONO DE
FREQUÊNCIA E OGIVA
Histograma – é formado por um conjunto de retângulos justapostos,
cujas bases se localizam sobre o eixo horizontal, de tal modo que seus
pontos médios coincidem com os pontos médios dos intervalos de
classe.
• As larguras dos retângulos são iguais às amplitudes dos intervalos de
classe.
• As alturas dos retângulos devem ser proporcionais às frequências das
classes, sendo igual a amplitude dos intervalos.
1.3 – Medidas de Tendência Central
Nesta unidade, veremos as tendências características de cada
distribuição, destacando as medidas de posição central, que recebem
tal denominação pelo fato de os dados observados tenderem, em geral,
a se agrupar em torno dos valores centrais. São objetivos desta
unidade:
• Calcular as medidas de posição central; e,
• Diferenciar as medidas - moda, média e mediana.
Média Aritmética Simples e Ponderada
É o quociente da divisão da soma dos valores da variável pelo número deles.
A média (aritmética) é, de modo geral, a mais importante de todas as medidas
descritivas.
Dados não tabelados
Dados Tabelados Com intervalo de Classe
Moda (Mo): Dados agrupados em classes
É o valor que ocorre com maior frequência em um conjunto de dados, e que
é denominado valor modal. Baseado nesse contexto, um conjunto de dados pode
apresentar mais de uma moda. Nesse caso, dizemos ser multimodais; caso
contrário, quando não existe um valor predominante, dizemos que é amodal.
1º Processo: Fórmula de Czuber
• 2º Processo: Fórmula de Pearson
Mediana (Md): Dados agrupados em classes
A mediana é uma medida de posição. É, também, uma separatriz, pois divide
o conjunto em duas partes iguais, com o mesmo número de elementos. O valor da
mediana encontra-se no centro da série estatística organizada, de tal forma que o
número de elementos situados antes desse valor (mediana) é igual ao número de
elementos que se encontram após esse mesmo valor (mediana).
• Com intervalo de classe: localizada a classe mediana, calculamos o valor da
mediana pela fórmula:
Média Geométrica (MG):
A média geométrica de um conjunto de N números x1, x2,x3,......xn
é a raiz de ordem N do produto desses números:
Média Harmônica (Mh):
Sejam x1, x2, x3,......xn, valores de x, associados às freqüências
absolutas n1, n2, n3,......nn, respectivamente. A média harmônica
de X é definida por:
X>MG>MH
Separatrizes: Quartis, Decis e Percentis
São valores que ocupam determinados lugares de uma distribuição de frequência.
Podemos classificá-las em:
Quartis: dividem a distribuição em 4 partes iguais
Decis: dividem a distribuição em 10 partes iguais
Percentis: dividem a distribuição em 100 partes iguais.
𝒌 𝒌 𝒌 𝒌
𝒌 𝒌
1.4 Assimetria (AS)
• Esta medida refere-se à forma da curva de uma distribuição de frequência,
mais especificamente do polígono de frequência ou do histograma.
Denomina-se assimetria o grau de afastamento de uma distribuição da
unidade de simetria.
Simetria
AS= 0, SIMÉTRICA
AS>0, ASSIMETRICA À DIREITA
AS<0, ASSIMETRICA À ESQUERDA
1.4 Curtose (K)
Curtose é o grau de achatamento (ou afilamento) de uma distribuição em comparação
com uma distribuição padrão (chamada curva normal). De acordo com o grau de
curtose, classificamos três tipos de curvas de frequência:
Mesocúrtica: é uma curva básica de referência chamada curva padrão ou curva normal;
• Platicúrtica: é uma curva mais achatada (ou mais aberta) que a curva normal;
• Leptocúrtica: é uma curva mais afilada que a curva normal;
MESO PLATI LEPTO
K =0,263, MESO
K > 0,263, PLATI
K<0,263, LEPTO
1.5 – Medidas de Dispersão
A interpretação de dados estatísticos exige que se realize um número maior
de estudos, além das medidas de posição. Nesta unidade, veremos que as medidas
de dispersão servem para verificar a representatividade das medidas de posição,
que é o nosso principal objetivo.
• Dispersão: São medidas estatísticas utilizadas para avaliar o grau de variabilidade,
ou dispersão, dos valores em torno da média. Servem para medir a
representatividade da média, entre elas: Variância (S2), Desvio Padrão (S) e
Coeficiente de Variação (CV).
Variância (S2)
• A variância leva em consideração os valores extremos e os valores intermediários,
isto é, expressa melhor os resultados obtidos. A variância relaciona os desvios em
torno da média, ou, mais especificamente, é a média aritmética dos quadrados
dos desvios.
• Dados Agrupados Dados Desagrupados
• Para dados amostrais, o denominador é n-1;
• Para dados populacionais, usamos no denominador o valor de n.
Desvio Padrão (S)
O desvio-padrão é a medida mais usada na comparação de diferenças
entre conjuntos de dados, por ter grande precisão. O desvio padrão
determina a dispersão dos valores em relação à média e é calculado
por meio da raiz quadrada da variância.
Coeficiente de Variação (CV)
• Trata-se de uma medida relativa de dispersão útil para a comparação em termos
relativos do grau de concentração. O coeficiente de variação é a relação entre o
desvio padrão (S) e a média X.
Diz- se que uma distribuição tem:
• Baixa dispersão: CV ≤ 15%
• Média dispersão: 15%< CV<30%
• Alta dispersão: CV ≥ 30%
1.6 – Correlação e Regressão Linear
Formulações – Correlação Linear
xy
COV ( x, y )
COV ( x, y )
xy x y
*
n n n
S x .S y
1 ( x ) 2
1 ( y )
2
Sx . x
2
Sy . y
2
n n n n
xy 1,0;1,0
Formulações – Regressão Linear
Y a bX
b xy *
SY
a
y b* x
SX n
DIAGRAMA DE DISPERSÃO
Linear, Potencial, Exponencial, Logarítmica, Polinomial (2/6)
100 n y j yˆ j
EPM
n j 1 y j
em que n é o número de dados da
série, yj é o valor real e é o valor
previsto.
X1 X2 X3 X4 X5 Y
Vinho Claridade Aroma Corpo Sabor Afinação Qualidade
1 1 3,3 2,8 3,1 4,1 9,8
2 1 4,4 4,9 3,5 3,9 12,6
3 1 3,9 5,3 4,8 4,7 11,9
4 1 3,9 2,6 3,1 3,6 11,1
5 1 5,6 5,1 5,5 5,1 13,3
6 1 4,6 4,7 5 4,1 12,8
7 1 4,8 4,8 4,8 3,3 12,8
8 1 5,3 4,5 4,3 5,2 12
9 1 4,3 4,3 3,9 2,9 13,6
10 1 4,3 3,9 4,7 3,9 13,9
11 1 5,1 4,3 4,5 3,6 14,4
12 0,5 3,3 5,4 4,3 3,6 12,3
13 0,8 5,9 5,7 7 4,1 16,1
14 0,7 7,7 6,6 6,7 3,7 16,1
15 1 7,1 4,4 5,8 4,1 15,5
16 0,9 5,5 5,6 5,6 4,4 15,5
17 1 6,3 5,4 4,8 4,6 13,8
18 1 5 5,5 5,5 4,1 13,8
19 1 4,6 4,1 4,3 3,1 11,3
20 0,9 3,4 5 3,4 3,4 7,9
21 0,9 6,4 5,4 6,6 4,8 15,1
22 1 5,5 5,3 5,3 3,8 13,5
23 0,7 4,7 4,1 5 3,7 10,8
24 0,7 4,1 4 4,1 4 9,5
25 1 6 5,4 5,7 4,7 12,7
26 1 4,3 4,6 4,7 4,9 11,6
27 1 3,9 4 5,1 5,1 11,7
28 1 5,1 4,9 5 5,1 11,9
29 1 3,9 4,4 5 4,4 10,8
30 1 4,5 3,7 2,9 3,9 8,5
31 1 5,2 4,3 5 6 10,7
32 0,8 4,2 3,8 3 4,7 9,1
33 1 3,3 3,5 4,3 4,5 12,1
34 1 6,8 5 6 5,2 14,9
35 0,8 5 5,7 5,5 4,8 13,5
36 0,8 3,5 4,7 4,2 3,3 12,2
37 0,8 4,3 5,5 3,5 5,8 10,3
38 0,8 5,2 4,8 5,7 3,5 13,2
Claridade Aroma Corpo Sabor Afinação Qualidade
Dias Máquina 1 Máquina 2 Máquina 3 Máquina 4 Máquina 5 Máquina 6 Máquina 7 Máquina 8 Máquina 9 Máquina 10 Padrão
1 4,8 4,2 5,1 5,2 4,8 4,7 4,9 4,5 4,9 4,5 4,8
2 4,9 5,1 4,8 4,9 4,8 5,0 4,3 4,9 4,2 4,2 5,0
3 5,1 4,6 4,9 4,3 4,9 4,8 5,2 4,8 4,4 5,6 4,9
4 4,3 5,0 5,0 5,1 4,9 5,0 4,8 4,6 4,8 5,1 4,9
5 4,3 4,2 5,1 4,9 4,3 4,7 4,7 5,3 5,3 4,4 4,8
6 4,3 4,9 5,2 4,8 4,9 4,9 4,4 4,5 4,9 5,1 4,9
7 5,1 4,9 4,9 5,1 4,4 5,0 4,8 4,6 5,2 5,5 5,0
8 4,9 4,8 4,2 4,4 5,1 4,7 4,3 4,7 4,7 4,4 4,8
9 5,0 5,2 4,2 4,9 5,1 4,8 5,4 4,6 4,8 5,2 4,9
10 4,8 5,1 4,6 4,8 5,2 4,8 4,9 4,3 4,3 4,5 4,8
11 4,8 4,2 5,1 5,2 4,8 4,7 4,9 5,2 4,9 4,5 4,8
12 4,9 5,1 4,8 4,9 4,8 5,0 5,3 4,5 5,5 5,2 5,0
13 5,1 4,6 4,9 4,3 4,9 4,9 5,2 5,0 4,4 5,6 4,9
14 5,0 5,0 5,0 5,1 4,9 5,0 4,8 5,0 4,8 5,1 5,0
15 4,5 4,2 5,1 4,9 4,3 4,7 4,7 4,8 5,3 4,4 4,8
16 4,3 4,9 5,2 4,8 4,9 4,9 4,4 5,0 4,8 4,6 4,9
17 5,1 4,9 4,9 4,9 5,2 5,0 4,8 4,7 5,2 5,5 5,0
18 4,9 4,8 4,2 4,3 5,1 4,8 4,2 4,6 4,7 4,2 4,9
19 5,0 5,2 4,2 4,9 5,1 5,0 5,4 5,2 4,8 4,5 5,0
20 4,8 5,1 4,6 4,8 4,3 4,8 4,9 4,6 4,3 4,5 4,9
Unidade 2.0 - Introdução à probabilidade
2.1 – Experimento Aleatório. Espaço Amostral. Eventos
2.2 – Probabilidade. Conceitos
2.3 – Probabilidade Condicional
2.4 – Eventos Independentes
2.5 – Teorema de Bayes
Exercícios
2.1 – Experimento Aleatório. Espaço Amostral. Eventos
• O cálculo das probabilidades pertence ao campo da matemática, entretanto a
maioria dos fenômenos de que trata a Estatística são de natureza aleatória ou
probabilística. O conhecimento dos aspectos fundamentais do cálculo das
probabilidades é uma necessidade essencial para o estudo da Estatística Indutiva
ou Inferencial.
• A probabilidade é utilizada para exprimir a chance de ocorrência de determinado
evento. Ela fornece uma descrição matemática do conceito de aleatoriedade.
• Fenômeno ou Experimento Aleatório: Não existe uma definição satisfatória
de experimento aleatório. Por isto, é necessário ilustrar o conceito um grande
número de vezes para que a ideia fique bem clara. Convém lembrar que os
exemplos dados são de fenômenos para os quais modelos probabilísticos são
adequados e que por simplicidade, são denominados de experimentos aleatórios.
Ao descrever um experimento aleatório, deve-se especificar não somente que
operação ou procedimento deva ser realizado, mas também o que é que deverá
ser observado.
Exemplo 1.1:
• E1: Joga-se um dado e observa-se o número obtido na face superior.
• E2: Joga-se uma moeda 4 vezes e observa-se a sequência de caras e coroas.
• E3: Lançam-se dois dados e anota-se o total de pontos obtidos.
Para caracterizarmos matematicamente um experimento aleatório, necessitamos
definir para cada experimento E, um espaço amostral S e seus componentes, ou
eventos, associados a cada possível resultado do experimento.
• Espaço Amostral e Eventos
• Definição 1.1: Espaço amostral é o conjunto de todos os resultados possíveis de
um experimento aleatório. Denota-se por S.
• Exemplo 1.2
Determinar o espaço amostral dos experimentos anteriores.
• S1 = {1, 2, 3, 4, 5, 6}
• S2 = {cccc, ccck, cckc, ckcc, kccc, cckk, kkcc,ckck, kckc, kcck, ckkc, ckkk, kckk, kkck,
kkkc,kkkk}
• S3 = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
• Definição 1.2: Evento é qualquer subconjunto de um espaço amostral S.
• Exemplo 1.3
• Considerando-se o experimento E1, podemos considerar os eventos:
• a) S1 é o evento certo. b) {2,4,6} é o evento: o resultado é par.
S
Definição clássica de probabilidade
• Seja E um experimento aleatório e S um espaço amostral associado formado por
n resultados igualmente prováveis. Seja A Í S um evento com m elementos. A
probabilidade de A, denotada por P(A), Lê-se pe de A, é definida como sendo:
• Isto é, a probabilidade do evento A é o quociente entre o número m de casos
favoráveis e o número n de casos possíveis.
• Exemplo 2.1
• Calcular a probabilidade de no lançamento de um dado equilibrado obter-se: (a)
Um resultado igual a 4. (b) Um resultado ímpar.
• Solução: S = { 1, 2, 3, 4, 5, 6 } n = #(S) = 6
• a) A = { 4 } Þ m = #(A) = 1, então P(A) = m/n = 1/6
• b) B = { 1, 3, 5 } Þ m = #(B) = 3, então P(B) = m/n = 3/6
Definição axiomática de probabilidade
• Seja E um experimento aleatório com um espaço amostral associado S. A cada
evento A Í S associa-se um número real, representado por P(A) e denominado
probabilidade de A, que satisfaz as seguintes propriedades (axiomas):
Eventos independentes P(AПB) =P(A).P(B)
Exemplo 01) A probabilidade de um gato estar vivo daqui a 5 anos é 3/5. A
probabilidade de um cão estar vivo daqui a 5 anos é 4/5. Considerando os
eventos independentes, qual a probabilidade de somente o cão estar vivo daqui
a 5 anos?
Probabilidade condicional
Probabilidade condicional
Carlos diariamente janta um prato de sopa no mesmo restaurante.
A sopa é feita de forma aleatória por um dos três cozinheiros que
lá trabalham: 40% das vezes a sopa é feita por João; 40% das
vezes por José, e 20% das vezes por Maria. João salga demais a
sopa 10% das vezes; José o faz em 5% das vezes, e Maria 20%
das vezes. Como de costume, um dia qualquer Carlos pede a sopa
e, ao experimentá-la, verifica que está salgada demais. Qual o
funcionário que teve o pior desempenho? Com essa informação
teremos que demitir um dos funcionários. Quem?
Uma empresa fabrica motores a jato em duas fábricas A e B.
Um motor é escolhido ao acaso de um lote de produção. Nota-
se que o motor apresenta defeitos. De observações anteriores a
empresa sabe que 2% e 3% são taxas de motores fabricados
com algum defeito em A e B, respectivamente. Sabendo-se que
a fábrica A é responsável por 40% da produção, qual a
probabilidade do motor ter sido fabricado em A?