Escolar Documentos
Profissional Documentos
Cultura Documentos
Como já aprendemos quais são as fontes utilizadas para a obtenção de dados e como organizar e visualizar dados
qualitativos e realizar uma análise exploratória para dados quantitativos, passaremos a estudar conceitos de uma área da
Estatística denominada Probabilidade. Ela é a base da Inferência Estatística, em que tomamos decisões baseadas em dados
amostrais. Com a probabilidade, podemos quantificar os riscos inerentes na aplicação dos métodos da inferência estatística.
Com certeza, já ouvimos informações do tipo: a probabilidade de se ganhar na Mega-Sena apostando 1 jogo de seis dezenas
é de 1 em 50.063.860; a probabilidade de chuva no fim de semana é de 80%; de uma amostra de 20 peças, a probabilidade de
se encontrar 2 peças defeituosas é de 9%. Como obtemos essas informações?
Nessa aula, estudaremos conceitos básicos necessários para a compreensão da teoria de probabilidade, para que
consigamos calcular valores para probabilidades de fenômenos aleatórios.
Objetivos
Nesta aula, vamos conhecer os tipos de probabilidade, mas antes disso, vamos conhecer alguns conceitos importantes
relacionados a essa área do conhecimento.
Espaço amostral
Conjunto com todos os resultados possíveis do experimento aleatório em estudo. Indicamos o espaço amostral pela letra
grega Ω (ômega).
Eventos
Qualquer subconjunto do espaço amostral (indicado por letras maiúsculas do nosso alfabeto).
O cálculo de probabilidades pode ser efetuado por meio de três maneiras: da definição
clássica, da definição frequentista e de probabilidades subjetivas1 .
Cálculos de probabilidades
Definição clássica
A definição clássica de probabilidade se aplica quando os pontos amostrais do espaço amostral são equiprováveis, ou seja,
quando todos têm a mesma probabilidade de ocorrer. Então, se A é o evento de interesse, a probabilidade do evento A ocorrer,
representada por P (A) , é dada por:
ú á à ê
n mero de resultados favor veis ocorr ncia do evento A
P (A) =
ú ç
n mero de resultados do espa o amostral (Ω)
Exemplo
Vamos supor que em uma caixa com 6 peças, numeradas de 1 a 6, duas sejam selecionadas aletoriamente, sem reposição.
Suponha que a peça 6 seja defeituosa e as outras sejam boas. Qual a probabilidade de que a peça 6 apareça entre as peças
selecionadas?
Espaço amostral: Conjunto formado por todos os resultados possíveis do experimento aleatório, ou seja, todos os possíveis pares
(ordenados).
A = {1, 6; 2, 6; 3, 6; 4, 6; 5, 6; 6, 1; 6, 2; 6, 3; 6, 4; 6, 5}
O enunciado diz que a peça é selecionada aleatoriamente, e isso implica que cada um dos resultados possíveis é igualmente
provável de ocorrer. Portanto:
10 1
P (A) = = = 0, 3333 × 100 = 33, 33%
30 3
Essa probabilidade é conhecida como probabilidade a priori, pois para utilizá-la precisamos conhecer o número de resultados
pelos quais o evento ocorre e o número total de resultados possíveis. Mas, isso nem sempre ocorre! Na área da saúde, por
exemplo, é necessário dispor de dados para estimar probabilidades. Por exemplo, qual a probabilidade de um fumante ter câncer
no pulmão? Essa resposta é obtida com base em dados. Veremos, agora, como fazer isso.
Definição frequentista
Aqui, usamos a ideia de probabilidade empírica, ou seja, baseia-se em observações repetidas do experimento aleatório e a
probabilidade do evento A é obtida por meio da frequência relativa, ou seja:
ú
n mero de vezes que o evento A ocorreu
P (A) =
ú
n mero de repeti ções do experimento aleatório
Exemplo
Uma loja de varejo tem registrado em seus arquivos que dos 3.500 televisores, de determinada marca, vendidas em certo período,
500 precisaram de reparos dentro da garantia de um ano. Qual é a probabilidade de que um consumidor que compre uma
televisão dessa marca não precise utilizar a garantia?
3000
P (A) = × 100 = 85, 71%
3500
Para facilitar a compreensão de que estamos utilizando a frequência relativa como estimativa da probabilidade, vamos colocar
essas informações em uma distribuição de frequências.
Regras da probabilidade
03 ã
P (A n o ocorrer) = 1 − P (A)
Probabilidade condicional
Agora que já sabemos efetuar o cálculo de probabilidades por meio da definição clássica e pela frequência relativa, vamos
analisar situações em que podemos ter interesse em encontrar a probabilidade de ocorrência de um evento levando em conta que
outro evento já ocorreu. Esta probabilidade recebe o nome de probabilidade condicional. Vamos entender mais sobre ela por meio
de um exemplo?
Exemplo
A tabela a seguir apresenta a distribuição dos acidentes de trabalho de uma empresa durante os últimos 3 anos, de acordo com o
turno de trabalho dos funcionários e ao ambiente de trabalho ou condições inseguras.
Matutino 10 64 74
Vespertino 12 50 62
Noturno 4 60 64
Considerando que o acidente de trabalho tenha ocorrido no turno noturno, qual a probabilidade de que tenha ocorrido devido a
erro humano?
Este exemplo refere-se a um caso de probabilidade condicional, pois já sabemos que o acidente de trabalho ocorreu no turno
noturno.
60
P (ter ocorrido devido ao erro humano sabendo que ocorreu no turno noturno) = = 0, 9375%
64
É intuitivo concluir que, se sabemos que o acidente ocorreu no turno noturno, temos um grupo restrito de 64 funcionários, dos
quais 60 sofreram acidente por erro humano.
Vamos formalizar o cálculo da probabilidade condicional?
Dados dois eventos A e B, a probabilidade condicional de A, dado que B ocorreu, é representada por (P A|B) e calculada por:
P (A∩B)
P (A|B) =
P (B)
Lemos (P A|B) da seguinte maneira: probabilidade de A ocorrer sabendo que (indicado por | ) B ocorreu.
Da definição acima obtemos o teorema do produto, de grande aplicação no cálculo de probabilidades, dado por:
P (A ∩ B) = P (A|B) ⋅ P (B)
Ou
P (A ∩ B) = P (B|A) ⋅ P (A)
Pois
P (A∩B)
P (B|A) =
P (A)
Exemplo
Vamos utilizar os dados do Exemplo anterior para aplicar a fórmula da probabilidade condicional.
A : ter ocorrido devido a erro humano (definimos desta maneira, pois é a pergunta do exercício).
B : ocorreu no turno noturno (definimos desta maneira, pois é o evento que sabemos que ocorreu).
Utilizando a frequência relativa como estimativa de probabilidade, temos que dos 200 funcionários, 60 deles são do turno noturno
e sofreram acidentes por erro humano. Portanto:
60
P (A ∩ B) =
200
Vale lembrar que a conjunção e está associada à intersecção. E, para dados tabelados, o valor da intersecção está dentro da
tabela, no cruzamento dos eventos de interesse. Dos 200 candidatos, 64 deles são do turno noturno. Então:
64
P (B) =
200
60
P (A∩B)
200 60 200 60
P (A|B) = = = ⋅ = = 0, 9375
64 200 64 64
P (B)
200
Independência de eventos
Primeiramente, vamos fazer a análise do conceito de independência através de uma interpretação intuitiva. É natural pensar que
dois eventos A e B são independentes se a ocorrência de um deles não interferir na ocorrência do outro. Utilizando esta ideia na
fórmula da probabilidade condicional, temos que: P (A|B) = P (A) eP (B|A) = P (B) . Isto quer dizer que a probabilidade
condicional de um deles, sabendo que o outro ocorreu, é igual à respectiva probabilidade simples.
P (A ∩ B) = P (A|B) ⋅ P (B)
P (A ∩ B) = P (A) ⋅ P (B)
Então, dois eventos são independentes se a probabilidade de que ocorram juntos é igual a produto das probabilidades de que
ocorram em separado.
Exemplo
Um sistema tem quatro componentes que operam independentemente. Suponhamos que as probabilidades de falha dos
componentes A, B, C e D sejam 0,1; 0,2; 0,05 e 0,1; respectivamente. Calcule a probabilidade de o sistema funcionar no seguinte
caso:
Figura 1: Componentes em série. (Fonte: Blog da Qualidade <https://blogdaqualidade.com.br/confiabilidade-parte-2/> )
Quando os componentes estão ligados em série, todos devem funcionar para que o sistema funcione. Então:
P (A f ∩ Bf ∩ C f ∩ D f ) = 0, 9 × 0, 8 × 0, 95 × 0, 9 = 0, 6156
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
Em palavras: a probabilidade de ocorrer A ou B é dada pela probabilidade de A ocorrer, mais a probabilidade de B ocorrer,
menos a probabilidade de ocorrer A e B.
Quando somamos a probabilidade do evento A ocorrer com a probabilidade do evento B ocorrer, estamos somando a
probabilidade da intersecção duas vezes. Então, compensamos este fato subtraindo uma vez a probabilidade P (A ∩ B) .
Quando os eventos forem mutuamente exclusivos (disjuntos), ou seja, A ∩ B = ∅ , temos que P (A ∩ B) = 0 . Neste caso:
P (A ∪ B) = P (A) + P (B)
Exemplo
Uma determinada empresa candidatou-se à licitação de dois grandes projetos de construção. Levando em conta a experiência de
outras licitações, o presidente da empresa acredita que a probabilidade de ganhar o primeiro contrato é 0,6, que a probabilidade
de ganhar o segundo contrato é 0,5 e que a probabilidade de ganhar ambos é 0,3. Qual a probabilidade de que a empresa ganhe
pelo menos um dos dois contratos?
Apesar de não estar de forma explícita, precisamos encontrar a probabilidade da união de dois eventos. Como conseguimos
identificar isto? A pergunta é: qual a probabilidade de que a empresa ganhe pelo menos um dos dois contratos. A união representa
a ocorrência de, pelo menos, um dos eventos.
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
P (A ∪ B) = 0, 6 + 0, 5 − 0, 3 = 0, 8
Então:
P (A ∪ B) = 0, 3 + 0, 3 + 0, 2 = 0, 8
P (somente A) = P (A) − P (A ∩ B)
P (somente A) = 0, 6 − 03, = 0, 3
Encontrar a probabilidade de somente B ocorrer:
P (somente B) = P (B) − P (A ∩ B)
P (somente B) = 0, 5 − 03, = 0, 2
Para encontrar probabilidades deste tipo, precisamos levar em conta duas situações:
P (A ∩ B) = P (A) ⋅ P (B)
Agora, se os eventos A e B forem dependentes, precisamos calcular a probabilidade da interseção por meio do teorema do
produto:
P (A ∩ B) = P (A) ⋅ P (B|A)
Exemplo
Uma produção diária de 100 peças fabricadas contém 8 peças que não satisfazem as exigências dos consumidores. Extraindo-se
aleatoriamente duas peças, qual a probabilidade de:
a. nenhuma ser defeituosa, sendo que as extrações são feitas com reposição;
b. nenhuma ser defeituosa, sendo que as extrações são feitas sem reposição.
a. Nenhuma peça ser defeituosa significa as duas serem perfeitas. Vamos indicar os eventos P1 : primeira peça ser perfeita e
P2 : segunda peça ser perfeita. Como queremos encontrar a probabilidade da primeira ser perfeita e da segunda ser perfeita,
devemos utilizar o teorema do produto ou a regra do “e”. E, vamos considerar os dois eventos independentes, pois, as se
extrações são feitas com reposição, o segundo evento não é afetado pelo primeiro resultado. Então:
P (P 1 ∩ P 2 ) = P (P 1 ) ⋅ P (P 2 )
92 92 8464
P (P 1 ∩ P 2 ) = ⋅ = = 0, 8464
100 100 10000
b. Neste item, os eventos são dependentes, pois as extrações são feitas sem reposição. Portanto, a probabilidade do segundo
evento é afetada pelo primeiro resultado:
P (P 1 ∩ P 2 ) = P (P 1 ) ⋅ P (P 2 | P 1 )
92 91 8372
P (P 1 ∩ P 2 ) = ⋅ = = 0, 8457
100 99 9900
Para facilitar a compreensão dos cálculos de probabilidades abordados até aqui, vamos
resumir as regras de probabilidade no Quadro a seguir.
Tipo de evento
União (ou)
Intersecção (e)
Condicional (dado que)
(A ∪ B ) (A ∩ B ) (A|B) ou (B|A)
P (A|B) =
P (A ∪ B) = P (A ∩ B) = P (A∩B)
P (A ∪ B) = P (A ∩ B) = P (A|B) = P (A)
ou
P (B)
P (A) + P (B) P (A|B) ⋅ P (B) =
P (A)
Teorema de Bayes
Teorema de Bayes é uma generalização da probabilidade condicional quando estamos analisando mais de dois eventos. Para
compreender esse teorema, vamos relembrar o cálculo de uma probabilidade condicional para dois eventos, A e B:
Como obtemos o numerador da segunda igualdade? Vamos lembrar que, pelo teorema do
produto:
P (A ∩ B) = P (B|A) ⋅ P (A)
Vamos compreender a fórmula para o cálculo da probabilidade condicional em palavras: temos uma probabilidade inicial P (A)
e, dada a informação de que B ocorreu (ou dada a suposição de que B venha a ocorrer), obtemos a probabilidade a posteriori
P (A|B) . Portanto, atualizamos a probabilidade inicial multiplicando-a por:
P (B|A)
P (B)
Exemplo
Três máquinas A, B e C produzem, respectivamente, 40%, 35% e 25% da produção de uma empresa. Historicamente, as
proporções de peças defeituosas produzidas em cada máquina são: 2%, 1% e 3%, respectivamente. Uma peça é selecionada ao
acaso de um lote e verifica-se que ela é defeituosa. Qual a probabilidade de ter sido produzida pela máquina A?
Primeiramente: qual a informação fundamental que temos neste enunciado? A resposta é: uma peça é selecionada ao acaso de
um lote e verifica-se que ela é defeituosa. Ou seja, sabemos que a peça selecionada é defeituosa. Então, estamos interessados
em encontrar a seguinte probabilidade:
P (A|D) =?
Em palavras: qual a probabilidade de a peça selecionada ter sido produzida pela máquina A, sabendo que é uma peça defeituosa.
Temos uma probabilidade condicional!
P (A∩D)
P (A|D) =
P (D)
Mas, a probabilidade de ela ser defeituosa está associada à produção de 3 máquinas! Ou seja, ela é defeituosa e foi produzida por
A , ou ela é defeituosa e foi produzida por B ou ela é defeituosa e foi produzida por C .
D : a peça é defeituosa.
P (D) = P (D ∩ A) + P (D ∩ B) + P (D ∩ C)
Do enunciado:
ç
P (A) = 0, 40 → probabilidade da pe a ter sido produzida pela m quina A á
ç
P (B) = 0, 35 → probabilidade da pe a ter sido produzida pela m quina B á
ç
P (C) = 0, 25 → probabilidade da pe a ter sido produzida pela m quina C á
ç
P (D|A) = 0, 02 → probabilidade da pe a ser defeituosa sabendo que ela foi produzida por A
ç
P (D|B) = 0, 01 → probabilidade da pe a ser defeituosa sabendo que ela foi produzida por B
ç
P (D|C) = 0, 03 → probabilidade da pe a ser defeituosa sabendo que ela foi produzida por C
Escrevemos as probabilidades condicionais desta maneira, pela interpretação do seguinte trecho contido no enunciado:
historicamente, as proporções de peças defeituosas produzidas em cada máquina são: 2%, 1% e 3%, respectivamente.
P (D) = P (D ∩ A) + P (D ∩ B) + P (D ∩ C)
P (D∩A)
P (D|A) =
P (A)
Do teorema do produto:
P (D ∩ A) = P (D|A) ⋅ P (A)
Pronto! A probabilidade P (D ∩ A) é encontrada por P (D|A) ⋅ P (A) , e estas probabilidades foram fornecidas no enunciado
do problema.
Portanto:
P (D) = P (D ∩ A) + P (D ∩ B) + P (D ∩ C)
P (D) = 0, 02 ⋅ 0, 4 + 0, 01 ⋅ 0, 35 + 0, 03 ⋅ 0, 25 = 0, 019
A probabilidade que acabamos de encontrar foi obtida utilizando o teorema da probabilidade total.
P (A∩D)
P (D|A) =
P (A)
P (A ∩ D) = P (D|A) ⋅ P (A)
Portanto, encontramos P (A|D) por meio do seguinte cálculo:
Então:
P (D|A)⋅P (A)
P (A|D) =
P (D|A)⋅P (A)+P (D|B)⋅P (B)+P (D|C)⋅P (C)
0,02⋅0,4 0,008
= = = 0, 4211
0,02⋅0,4+0,01⋅0,35+0,03⋅0,25 0,019
Formalizando o Teorema de Bayes: Sejam C1 , C2 ,…,Ck eventos que formam uma partição do espaço amostral Ω . Seja um
evento A ⊂ Ω e sejam conhecidas P (Ci ) eP (A|Ci ) para todo i = 1,2,…,k. Então:
A fórmula pode parecer, em um primeiro momento, complexa. O objetivo de apresentá-la, é mostrar como podemos efetuar o
cálculo em qualquer tipo de situação que envolva o cálculo de uma probabilidade condicional, cujo espaço amostral está
particionado. Mas, o mais importante é entender o conceito, por meio do exemplo que utilizamos.
Comentário
Podemos calcular probabilidades que necessitem do uso do teorema da probabilidade total ou do teorema de Bayes, por meio de
tabelas. Algumas vezes as informações já estão dispostas na tabela e, em outras, temos que construí-la.
Exemplo
Vamos utilizar os dados do Exemplo acima para calcular a probabilidade P (A|D) , com os dados apresentados em uma tabela.
Podemos direcionar nosso raciocínio da seguinte maneira: precisamos construir a tabela com linhas e colunas. Então, colocamos
as informações de uma varável em linhas e as informações da outra variável em colunas. Como identificar quais são as variáveis?
Elas estão no enunciado: neste exemplo, temos peças que são produzidas por 3 máquinas. Então, podemos definir máquinas
como uma das variáveis, com 3 respostas: A, B e C . As peças produzidas podem ser defeituosas ou perfeitas. E, podemos
definir qualidade da peça como outra variável, com 2 respostas: perfeita ou defeituosa.
Máquinas
Qualidade da peça
A B C Total
Perfeita
Defeituosa
Sabemos que as máquinas A, B e C produzem, respectivamente, 40%, 35% e 25% da produção de uma empresa.
Podemos colocar esses valores em decimais.
Máquinas
Qualidade da peça
A B C Total
Quais as informações que estão dentro da tabela? É a interseção entre os eventos que aparecem no “cruzamento” de cada
uma das cédulas. Ou seja:
Exemplo
Já sabemos, da resolução do exemplo anterior, que estas informações não são obtidas diretamente no enunciado do problema.
Mas, como encontrar esta porcentagem? Por exemplo, em D ∩ A, queremos encontrar a porcentagem de peças defeituosas e
produzidas por A. A máquina A produz 40% das peças e 2% delas são defeituosas. Então, basta encontrar 2% de 40%, ou seja:
0, 02 ⋅ 0, 4 = 0, 008
Utilizamos este raciocínio para calcular as probabilidades em cada uma das cédulas, na linha Defeituosa. E, finalmente, como
encontramos as porcentagens na linha Perfeita? Basta fazer a diferença entre as linhas total e defeituosa, ou seja:
Máquinas
Qualidade da peça
A B C Total
0,008
P (A|D) = = 0, 4211
0,019
Atividade
1. Uma urna contém 5 bolas brancas e 6 pretas. Três bolas são retiradas, sem reposição. Calcular a probabilidade de:
Masculino 52 40 58
Feminino 38 32 80
b. Qual é a probabilidade de que ele seja do sexo masculino ou seja da área de biológicas?
c. Dado que foi sorteado um estudante da área de humanas, qual é a probabilidade de que ele seja do sexo feminino?
d. Qual a probabilidade de que o estudante seja do sexo feminino, sabendo que foi sorteado um estudante da área de
humanas?
3. Uma indústria emprega três planos analíticos para criar e desenvolver certo produto. Devido aos custos, os três planos são
usados em momentos variados. Na verdade, os planos 1, 2 e 3 são usados para 30%, 20% e 50% dos produtos, respectivamente.
O “índice de defeitos” é diferente para os três procedimentos:
Se selecionarmos um produto aleatoriamente e observarmos que ele apresenta defeitos, qual foi provavelmente o plano usado e,
em consequência, responsável pelo defeito?
Notas
Probabilidades subjetivas 1
Nossos estudos serão concentrados na definição clássica e frequentista. No método subjetivo, a probabilidade é estimada com
base no ponto de vista pessoal sobre a possibilidade de ocorrer determinado evento.
Fórmula 2
Note que o valor que aparece no denominador, quando calculamos a probabilidade condicional utilizando os valores diretamente
da tabela, é o total de casos do evento que sabemos que ocorreu. Neste exemplo, sabíamos que o funcionário era do turno
noturno e o total de funcionários desse turno é 64, justamente o valor que aparece no denominador do cálculo da probabilidade
condicional.
Ou seja:
BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatística Básica. 5. ed. São Paulo: Saraiva, 2002.
LEVINE, David M.; STEPHAN, David F.; SZABAT, Kathryn A. Estatística: Teoria e Aplicações Usando Microsoft Excel em Português.
7. ed. Rio de Janeiro: LTC, 2016.
MAGALHÃES, Marcos N.; LIMA, Antonio C. P de. Noções de Probabilidade e Estatística. 6. ed. São Paulo: Editora da Universidade
de São Paulo, 2004.
MONTGOMERY, Douglas C. Introdução ao Controle Estatístico de Qualidade. 7. ed. Rio de Janeiro: LTC, 2016.
MONTGOMERY, Douglas C.; RUNGER, George C. Estatística Aplicada e Probabilidade para Engenheiros. 5. ed. Rio de Janeiro:
LTC, 2014.
WALPOLE, R. E. et al. Probabilidade e Estatística para engenharia e ciências. 8. ed. São Paulo: Pearson Prentice Hall, 2009.
Próxima aula
Pesquise na internet, sites, vídeos e artigos relacionados ao conteúdo visto. Em caso de dúvidas, converse com seu professor
online por meio dos recursos disponíveis no ambiente de aprendizagem.
Leia os textos: