Você está na página 1de 8

TEOREMA DE BAYES

FÓRMULA DE BAYES
UNICARIOCA Sejam E1 , E2 , ... , En eventos mutuamente exclusivos tais que
E1 ∪ E2 ∪ ... ∪ En = S. Sejam P (Ei ) as probabilidades
PROCESSOS conhecidas dos diversos eventos (Ei), e B um evento qualquer
ESTOCÁSTICOS de S para o qual conhecemos todas as probabilidades
condicionais P ( B | Ei ). Então para cada i temos:

TEMA-02
TEOREMA DE BAYES
P( Ei ) × P( B / Ei )
P( Ei / B) =
 P( Ei ) × P( B / Ei )

TEOREMA DE BAYES TEOREMA DE BAYES


Sejam os eventos:
Exemplo-1: Suponhamos uma caixa (CAIXA-1) que contém 2
E1 = a 1ª caixa foi escolhida CX-01
bolas vermelhas e 1 branca, e uma segunda caixa (CAIXA-2) E2 = a 2ª caixa foi escolhida
que contém 2 bolas vermelhas e 2 bolas brancas. Escolhe-se B = a bola retirada é vermelha
uma das caixas ao acaso e retira-se dela uma bola. Se a bola Queremos determinar P (E1 | B). CX-02
retirada for VERMELHA, qual a probabilidade de que ela Temos então:
tenha vindo da PRIMEIRA CAIXA (CAIXA-1)? P(E1) = P (E 2) = 1/2
A probabilidade de sortear cada caixa é 1/2 = 50%
P ( B | E 1 ) = 2/3
A probabilidade de tirar uma bola vermelha dado que a caixa
sorteada foi a CAIXA-1 é 2/3  2 bolas vermelhas em 3
P ( B | E 2 ) = 2/4
CAIXA-1 CAIXA-2 A probabilidade de tirar uma bola vermelha dado que a caixa
sorteada foi a CAIXA-2 é 2/4  2 bolas vermelhas em 4

TEOREMA DE BAYES TEOREMA DE BAYES


P(E1) = P(E 2) = 1/2 P ( B | E 1 ) = 2/3 P ( B | E 2 ) = 2/4 Exemplo-2: Suponhamos uma caixa (CAIXA-1) que contém 2
P( E1 ) × P( B / E1 ) bolas vermelhas e 1 branca, e uma segunda caixa (CAIXA-2)
P( E1 / B) = = que contém 2 bolas vermelhas e 2 bolas brancas. Escolhe-se
P( E1 ) × P( B / E1 ) + P( E2 ) × P( B / E2 )
uma das caixas ao acaso e retira-se dela uma bola. Se a bola
retirada for VERMELHA, qual a probabilidade de que ela tenha
1 2
× vindo da SEGUNDA CAIXA (CAIXA-2) ?

P ( E1 / B ) = 2 3 = 4/7
1 2 1 2
× + ×
2 3 2 4
Se a bola retirada for VERMELHA, a probabilidade de que
CAIXA-1 CAIXA-2
ela tenha vindo da PRIMEIRA CAIXA (CAIXA-1)é 4/7 !

PROCESSOS ESTOCÁSTICOS - TEMA_02 1 MANUEL


TEOREMA DE BAYES TEOREMA DE BAYES
Sejam os eventos: P(E1) = P(E 2) = 1/2 P ( B | E 1 ) = 2/3 P ( B | E 2 ) = 2/4
E1 = a 1ª caixa foi escolhida
E2 = a 2ª caixa foi escolhida P( E2 ) × P( B / E2 )
P( E2 / B) = =
B = a bola retirada é vermelha P( E1 ) × P( B / E1 ) + P( E2 ) × P( B / E2 )
Queremos determinar P (E2 | B).
Temos então:
1 2
P(E1) = P(E 2) = 1/2 ×
A probabilidade de sortear cada caixa é 1/2 = 50%
P ( E2 / B ) = 2 4 = 3/7
P ( B | E 1 ) = 2/3
1 2 1 2
A probabilidade de tirar uma bola vermelha dado que a caixa × + ×
sorteada foi a CAIXA-1 é 2/3  2 bolas vermelhas em 3 2 3 2 4
P ( B | E 2 ) = 2/4 Se a bola retirada for VERMELHA, a probabilidade de que
A probabilidade de tirar uma bola vermelha dado que a caixa ela tenha vindo da SEGUNDA CAIXA (CAIXA-2) é 3/7 !
sorteada foi a CAIXA-2 é 2/4  2 bolas vermelhas em 4

TEOREMA DE BAYES TEOREMA DE BAYES


P(E1) = P (E 2) = 1/2 P ( B | E 1 ) = 2/3 P ( B | E 2 ) = 2/4 FILTRO BAYESIANO  é o processo de usar
P (E 1 | B ) = 4/7
MÉTODOS ESTATÍSTICOS para classificar
Se a bola retirada for VERMELHA, a probabilidade de que
ela tenha vindo da PRIMEIRA CAIXA (CAIXA-1)é 4/7 ! documentos por categorias. O filtro de BAYES foi

P (E 2 | B ) = 3/7 definido depois da publicação do documento de Paul


Se a bola retirada for VERMELHA, a probabilidade de que
Graham, A Plan of Spam, e transformou-se num
ela tenha vindo da SEGUNDA CAIXA (CAIXA-2) é 3/7 !

P (E 1 | B ) + P (E 2 | B ) = 4/7 + 3/7 = 7/7 = 1  100 % mecanismo popular para distinguir um e-mail ilegítmo

A BOLA SÓ PODE TER VINDO DE E1 OU E2 ! conhecido como SPAM de um e-mail legítimo.

TEOREMA DE BAYES TEOREMA DE BAYES


Muitos programas de e-mail modernos como o Mozilla As palavras particulares têm probabilidades
Thundebird utilizam a filtragem de spams por meio do particulares de ocorrer no e-mail do Spam e no e-mail
método Bayesiano. O filtro bayesiano utiliza o Teorema legítimo. Por exemplo, a maioria dos usuários de e-mail
de Bayes, no contexto do Spam e diz que: a encontrarão FREQUENTEMENTE a palavra VIAGRA
probabilidade que um email seja um Spam, em um e-mail de SPAM, mas a verão RARAMENTE
percebido em determinadas palavras dentro dele, é em um e-mail LEGÍTIMO. O filtro não sabe das
igual à probabilidade de encontrar aquelas probabilidades a priori, o usuário terá que orientá-lo,
determinadas palavras no e-mail de Spam, treinando o filtro a excluir automaticamente de
cronometrando a probabilidade que todo e-mail é acordo com as probabilidades em sua base de dados.
Spam, dividido pela probabilidade de encontrar aquelas http://www.thinkfn.com/wikibolsa/Filtro_bayesiano
palavras em qualquer e-mail. http://www.paulgraham.com/spam.html

PROCESSOS ESTOCÁSTICOS - TEMA_02 2 MANUEL


TEOREMA DE BAYES TEOREMA DE BAYES
Exemplo-3: A probabilidade de um e-mail enviado pelo
domínio D1 ser SPAM é 40% e a probabilidade de um e-mail
enviado pelo domínio D2 ser um SPAM é 70%. Sabendo que
o percentual de e-mail recebidos do domínio D1 é 20% e o
percentual de e-mail recebidos do domínio D2 é 80%, qual a
probabilidade de um e-mail ter vindo do domínio D1 dado
P ( palavra / Spam ) × P ( Spam )
P ( Spam palavra ) = que ele é um SPAM ? Ou seja, queremos calcular P(D1|S).
P ( palavra )

SPAM 40% NÃO SPAM SPAM 70% NÃO SPAM

DOMÍNIO-D1(20%) DOMÍNIO-D2 (80%)

TEOREMA DE BAYES TEOREMA DE BAYES

D1  20%  P (D1) = 20% QUEREMOS CALCULAR P(D1|S) P ( D1 ) × P ( S | D1 )


P ( D1 | S ) =
D2  80%  P (D2) = 80% P ( D1 ) × P ( S | D1 ) + P ( D2 ) × P ( S | D2 )
D1  SPAM = 40%  NÃO SPAM = 60%
P (D1) = 20% P (S|D1) = 40% P (D2) = 80% P (S|D2) = 70%
D2  SPAM = 70%  NÃO SPAM = 30%
SUBSTITUINDO TEMOS:
0,40 × 0,20 0,08 0,08
SPAM 40%
NÃO SPAM SPAM 70%
NÃO SPAM P( D1 | S ) = = = = 1/ 8
60%
30% 0,40 × 0,20 + 0,80 × 0,70 0,08 + 0,56 0,64
Se o e-mail é um SPAM a probabilidade de que ele tenha
DOMÍNIO-D1(20%) DOMÍNIO-D2 (80%)
vindo de D1 é 1/8 !
P (D1) = 20%
P (S|D1) = 40% Probabilidade de ser SPAM dado que veio de D1 A probabilidade de que o e-mail tenha vindo de D1 dado que
P (D2) = 80% ele é um SPAM é 1/8 !
P (S|D2) = 70% Probabilidade de ser SPAM dado que veio de D2

TEOREMA DE BAYES MODELOS SÃO ÚTEIS PARA SIMULAR A

P( Ei ) × P( B / Ei ) REALIDADE E ACHAR MELHORES SOLUÇÕES, NA


P( Ei / B) = MEDIDA EM QUE PODEMOS EXPERIMENTÁ-LAS,
 P( Ei ) × P( B / Ei ) TESTÁ-LAS !
MODELOS DE DADOS, DE REALIDADE VIRTUAL,
UMA FÓRMULA NÃO EXISTE POR SI SÓ !
DE TESTE DE STRESS EM UM SISTEMA...
ELA É O RESULTADO DE UM PROCESSO DE
MODELAGEM DE ALGUM PROBLEMA REAL ! UMA HONEYPOT OU UMA HONEYNET PODEM SER
CONSIDERADAS, NA ÁREA DE SEGURANÇA,
MODELOS DE CONTRA-INTELIGÊNCIA PARA
TÉCNICAS DE INVASÃO...

PROCESSOS ESTOCÁSTICOS - TEMA_02 3 MANUEL


EXISTEM TÉCNICAS DE INTELIGÊNCIA ARTIFICIAL PARA CRIAR MODELOS PRECISAMOS
DE IMAGINAÇÃO, RACIOCÍNIO,
QUE APLICADAS A GUIAS DE IMPORTAÇÃO
CRIATIVIDADE, TALENTO...
PERMITEM DETERMINAR SE EXISTE

SUBFATURAMENTO. O OBJETIVO É PAGAR


PRECISAMOS DE CERTOS
EXERCÍCIOS MENTAIS....
MENOS IMPOSTO DE IMPORTAÇÃO. EXEMPLO ?
TEOREMA DE BAYES
IMPORTAR UM SWITCH E INFORMAR QUE ESTÁ

IMPORTANDO UM HUB !!!!  MENOS IMPOSTO ! UM OUTRO APPROUCH !!!!

TEOREMA DE BAYES
S  SPAM
NOSSO PROBLEMA ! S = 40% S = 8% D1 e S
NS  NÃO SPAM 20%×40%
D1  20%  vem de D1
D2  80%  vem de D2
NS = 60%
D1  SPAM = 40%  NÃO SPAM = 60% D1 = 20%
NS = 12% D1 e NS
D2  SPAM = 70%  NÃO SPAM = 30% 20%×60%
S = 70% S = 56% D2 e S
80%×70%
NÃO SPAM
NÃO SPAM SPAM 70%
SPAM 40% 30%
60% D2 = 80%

NS = 24% D2 e NS
DOMÍNIO-D1(20%) DOMÍNIO-D2 (80%) NS = 30% 80%×30%
Se o e-mail é um SPAM, qual a probabilidade de que ele
SE o e-mail é SPAM, qual a probabilidade de que ele tenha
tenha vindo do domínio D1 ? P(D1|S) = ?
vindo de D1 ?  É uma PROBABILIDADE CONDICIONAL !

S  SPAM
S = 40% S = 8% D1 e S S = 40% S = 8% D1 e S
NS  NÃO SPAM D1 ∩ S

NS = 60% NS = 60%
D1 = 20% D1 = 20% D1 e NS
NS = 12% D1 e NS NS = 12% D1 ∩ NS

S = 56% D2 e S S = 56% D2 e S
S = 70% S = 70% D2 ∩ S

D2 = 80% D2 = 80%

D2 e NS
NS = 24% D2 e NS NS = 24% D2 ∩ NS
NS = 30% NS = 30%
SE o e-mail é SPAM, qual a probabilidade de que ele tenha Qual a probabilidade de que ele seja SPAM ? 8% + 56% = 64%
vindo de D1 ?  É uma PROBABILIDADE CONDICIONAL ! Qual a probabilidade que tenha vindo de D1 e seja SPAM ? 8%

PROCESSOS ESTOCÁSTICOS - TEMA_02 4 MANUEL


ÁRVORE DE PROBABILIDADE
S = 40% S = 8% D1 e S S = 40% S = 8% D1 e S

NS = 60% NS = 60%
D1 = 20% D1 = 20%
NS = 12% D1 e NS NS = 12% D1 e NS

S = 70% S = 56% D2 e S S = 70% S = 56% D2 e S

D2 = 80% D2 = 80%

NS = 24% D2 e NS NS = 24% D2 e NS
NS = 30% NS = 30%
DADO que é SPAM qual a probabilidade de que tenha vindo de D1 ? DADO que é SPAM qual a probabilidade de que tenha vindo de D1 ?
P= 8/(8+56) = 8/64 = 1/8 !  MESMO RESULTADO ! P= 8/64 = 1/8  MESMO RESULTADO DO TEOREMA DE BAYES !

TEOREMA DE BAYES ÁRVORE DE PROBABILIDADE


P( Ei ) × P( B / Ei ) A simplicidade é o último grau
P( Ei / B) =
 P( Ei ) × P( B / Ei ) de sofisticação !
ÁRVORE DE PROBABILIDADE APPLE  SIMPLICIDADE !

DADO  INFORMAÇÃO  CONHECIMENTO


ABDULFATTAH JANDALI  SÍRIA
MELHOR DECISÃO ! JOANNE SCHIEBLE  ALEMANHA
A simplicidade é o último grau de sofisticação ! STEVE JOBS !

ANÁLISE COMBINATÓRIA

UNICARIOCA ANÁLISE COMBINATÓRIA  Para obtenção da

PROCESSOS probabilidade de eventos complexos, a enumeração de

ESTOCÁSTICOS casos é muitas vezes difícil. Para facilitar essa etapa

TEMA-02 utiliza-se os conceitos básicos de análises combinatória.

VÍDEO-02
OBS  ANALISAREMOS OS CASOS SEM REPETIÇÃO !
TEOREMA DE BAYES

PROCESSOS ESTOCÁSTICOS - TEMA_02 5 MANUEL


ANÁLISE COMBINATÓRIA ANÁLISE COMBINATÓRIA

FATORIAL  UM BREVE RESUMO ! FATORIAL  UM BREVE RESUMO !


n (n+1)! = n! × (n+1)  FUNÇÃO RECURSIVA
n! = ∏ k ∀n ∈ Ν ∏ = PRODUTÓRIO Fazendo n=0 vem:
k =1
(0+1)! = 0! × (0+1)
EXEMPLOS
(1)! = 0 ! × 1
1! = 1
1 = 0! × 1
2! =1×2 = 2 1=0!
3! =1×2×3 = 6 0! = 1  FATORIAL DE 0 (ZERO) É 1 !
4! =1×2×3×4 = 24
5! =1×2×3×4×5 =120

ANÁLISE COMBINATÓRIA ANÁLISE COMBINATÓRIA


(n+1)! = n! × (n+1)  FUNÇÃO RECURSIVA FATORIAL  UM BREVE RESUMO !
(n+1)! = n! × (n+1)  FUNÇÃO RECURSIVA
0! = 1  FATORIAL DE 0 (ZERO) É 1 !
EXEMPLOS
Na matemática, um produto vazio ou produto nulo é o 2! = 1!×2
resultado da multiplicação de nenhum número. Seu 3! = 2!×3 = 1×2×3
4! = 3!×4 = 1×2×3×4
valor numérico é 1, o elemento neutro da 5! = 4!×5 = 1×2×3×4×5
multiplicação, assim como o valor da soma vazia (o 6! = 5!×6 = 1×2×3×4×5×6
resultado da soma de nenhum número) é 0, isto é, o ...................
10! = 9!×10 = 1×2×3×4×5×6×7×8×9×10
elemento neutro da adição. 9!

ANÁLISE COMBINATÓRIA ANÁLISE COMBINATÓRIA


ARRANJOS E PERMUTAÇÕES ARRANJOS
Consideremos que sejam dados n objetos distintos; A n,r = n × (n -1) × (n - 2) × ... × (n - r + 1)
queremos dispor r desses objetos em uma fileira. Como
onde: A n,r é o número de arranjos de n objetos r a r .
há n maneiras de escolher o 1º objeto, n - 1 maneiras de
n!
escolher o 2º, ... , e finalmente n - r + 1 maneiras de Anr =
escolher o último objeto, decorre que o número de (n − r )!
arranjos ou permutações distintas é dado pelas fórmulas EXEMPLO  Quantos arranjos de 2 objetos podemos fazer
que veremos a seguir. com 3 objetos. Temos n=3 r=2.
Se n = 4 e r = 2
3! 1× 2 × 3 6
1º objeto  n maneiras de escolher = 4 A32 = = = =6
2º objeto  n - r +1 maneiras de escolher = 4 - 2 +1 = 3 (3 − 2)! 1! 1

PROCESSOS ESTOCÁSTICOS - TEMA_02 6 MANUEL


ANÁLISE COMBINATÓRIA ANÁLISE COMBINATÓRIA
ARRANJOS  3 OBJETOS 2 A 2 PERMUTAÇÕES

A B C  3 OBJETOS No caso particular em que r = n temos:


An,n = n × (n -1) × (n - 2) ×... × 1) = n !
A B
 1º ARRANJO LEVA EM CONSIDERAÇÃO Assim, arranjos de n elementos n a n são chamados de
A ORDEM EM QUE OS
PERMUTAÇÕES.
 2º ARRANJO OBJETOS APARECEM !
B A
Pn = n != Ann = n !
C
 3º ARRANJO
A

 4º ARRANJO EXEMPLO permutação de 3 objetos 3 a 3.


C A

B C  5º ARRANJO Pn = 3!= 1× 2 × 3 = 6
C B
 6º ARRANJO

ANÁLISE COMBINATÓRIA ANÁLISE COMBINATÓRIA


PERMUTAÇÕES  3 OBJETOS COMBINAÇÕES
A B C  3 OBJETOS
Nos arranjos a ordem em que os objetos aparecem é
 1ª PERMUTAÇÃO importante. Por exemplo, ABC é um arranjo diferente de BCA.
A B C
Em muitos problemas, entretanto, não estamos interessados na
A C B  2ª PERMUTAÇÃO
ordem em que os objetos aparecem. Tais escolhas são

B A C  3ª PERMUTAÇÃO chamadas combinações. O número total de combinações de r

 4ª PERMUTAÇÃO objetos escolhidos dentre n é denotado por Cn,r.


C A B
n!
B C A
 5ª PERMUTAÇÃO
C nr =
 6ª PERMUTAÇÃO
r! (n − r )!
C B A
LEVA EM CONTA A ORDEM !

ANÁLISE COMBINATÓRIA ANÁLISE COMBINATÓRIA


COMBINAÇÃO  3 OBJETOS 2 A 2
EXEMPLO  Quantos combinações de 2 objetos
podemos fazer com 3 objetos. Temos n = 3 r = 2. A B C  3 OBJETOS

n! A B
 1ª COMBINAÇÃO
C nr =
r! (n − r )! A C
 2ª COMBINAÇÃO

C  3ª COMBINAÇÃO
3! 1× 2 × 3 B
C32 = = =3
2!(3 − 2)! 1× 2 ×1 NÃO LEVA EM CONSIDERAÇÃO A ORDEM EM QUE OS OBJETOS
APARECEM !

PROCESSOS ESTOCÁSTICOS - TEMA_02 7 MANUEL


ANÁLISE COMBINATÓRIA ANÁLISE COMBINATÓRIA
EXEMPLOS O número de maneiras de selecionar 5 cartas de espadas
01- Calcular a probabilidade de se obter cinco cartas de dentre as 13 cartas de espada (nº da casos favoráveis) é dado
espadas em uma mão de cinco cartas de um baralho de 52 por:
cartas.

8!
Solução  O número de mãos de 5 cartas que podem ser 13 ! 13 ! 13 × 12 × 11 × 10 × 9 ×
C 135 = = =
formadas de um baralho de 52 cartas distintas (nº de casos

8!
5 ! (13 − 5 )! 5 !× 8 ! 5 !×
possíveis) é dado por:
5 52 ! 52 !
C 52 = = 5 13×12×11×10× 9
5! ( 52 − 5 )! 5!× 47 ! C13 = = 1.287
1× 2 × 3× 4 × 5
5 52 × 51 × 50 × 49 × 48 × 47!
C 52 =
5!× 47! A probabilidade desejada P(E) será:
P(E) = nº casos favoráveis / nº de casos possíveis
5 52 × 51 × 50 × 49 × 48
C 52 = = 2 .598 . 960 P (E) = 1.287 / 2.598.960 = 0,0005 ou 0,05 % !
5!

ANÁLISE COMBINATÓRIA ANÁLISE COMBINATÓRIA


02 - Num lote de 12 peças, 4 são defeituosas; 2 peças são
01 - Calcular a probabilidade de se obter cinco espadas em
retiradas aleatoriamente. Calcule a probabilidade de ambas
uma mão de cinco cartas de um baralho de 52 cartas.
serem defeituosas.
Outra Solução  USANDO A REGRA DO PRODUTO !
Solução  o número de combinações de 2 peças que podem
Queremos tirar 5 cartas de espadas em uma mão de baralho. ser selecionadas dentre as 12 peças ( nº da casos possíveis)
é dado por:
13 12 11 10 9 12 ! 12 ! 12 × 11 132
P( E ) = × × × × 2
C 12 = = = = = 66
52 51 50 49 48 2! (12 − 2 )! 2 !× 10 ! 1× 2 2
O número de maneiras de selecionar 2 peças defeituosas
154.440 dentre as 4 peças defeituosas (nº de casos favoráveis) é dado
P( E ) = = 0,0005 ≅ 0,05% por:
311.865.200 4! 4!
2
REGRA DO PODUTO !  O MESMO RESULTADO ! C 4 = = = 6
SIMPLICIDADE !!!! 2 ! ( 4 − 2 )! 2 !× 2 !

ANÁLISE COMBINATÓRIA
Quem pensa pouco, erra muito !
A probabilidade desejada P(E) será:
P(E) = Nº CASOS FAVORÁVEIS / Nº DE CASOS POSSÍVEIS A simplicidade é o último grau de
P (E) = 6 / 66 = 0,091ou 9,1 % ! sofisticação.
Outra Solução  USANDO A REGRA DO PRODUTO !
Jamais o sol vê a sombra !
4 3 12 1
P( E ) = × = = = 0,091 = 9,1% Aprender é a única coisa de que a mente
12 11 132 11 nunca se cansa, nunca tem medo e nunca
4 DEFEITUOSAS EM 12 3 DEFEITUOSAS EM 11 se arrepende...
REGRA DO PRODUTO !  FEROZ !!!! LEONARDO DA VINCI
Anchiano -Toscana/Itália (1452) / Amboise-França (1519)
REGRA DO PRODUTO !  SIMPLICIDADE !

PROCESSOS ESTOCÁSTICOS - TEMA_02 8 MANUEL

Você também pode gostar