Você está na página 1de 38

17/10/2022 13:55 E-book

INFERÊNCIA BAYESIANA
CONCEITOS FUNDAMENTAIS
A u t o r ( a ) : M e . M a r c e l o Ta v a r e s d e L i m a

Revisor(a): Raquel Lívia Nascimento Rodrigues

Tempo de leitura do conteúdo estimado em 1 hora e 19 minutos.

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&c… 1/38
17/10/2022 13:55 E-book

Introdução
Prezado(a) estudante, seja muito bem-vindo(a) a esta disciplina de extrema
importância para sua formação. Dedique-se da melhor forma possível, para que
possa absorver todo o conteúdo apresentado a você.

Este texto apresentará os conceitos fundamentais da inferência bayesiana, os


quais estão relacionados, principalmente, com a teoria de probabilidades, o que,
talvez, você já tenha visto em disciplinas anteriores, ou mesmo nos seus estudos
escolares básicos (ensino fundamental e ensino médio).

Iniciaremos apresentando o tema probabilidade condicional e seus conceitos


relacionados, assim como exemplos de aplicação; depois, apresentaremos o
Teorema de Bayes e suas aplicações, seguindo para os fundamentos de
verossimilhança, e uma breve introdução aos conceitos de distribuição a priori e a
posteriori . Agora, convido você a se aprofundar mais no assunto! Vamos lá?

Tenha um excelente momento de estudo!

Probabilidade
Condicional

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&c… 2/38
17/10/2022 13:55 E-book

Caro(a) estudante, a ocorrência de eventos relacionados ou dependentes é muito


mais frequente do que percebemos ou imaginamos. Por exemplo, quando se
escolhe um curso universitário, a decisão final, geralmente, é influenciada por um
conjunto de outras informações que se têm a respeito do curso escolhido,
concorda?

O estudo de probabilidades condicionais tem relação direta com situações


semelhantes à situação descrita no exemplo. É o estudo da possibilidade de
ocorrência de eventos que são dependentes de um ou mais eventos relacionados
ao mesmo fenômeno ou à mesma situação, que, na teoria de probabilidades, é
conhecido como experimento aleatório ou fenômeno aleatório.

Estudante, observe, agora, a visão de Costa (2012, p. 11): “[...] dois eventos
associados a uma mesma experiência aleatória são ditos condicionados quando a
ocorrência prévia de um deles aumenta ou diminui a ocorrência do outro. A já
ocorrência de um deles modifica a ocorrência do outro”.

Para exemplificar, suponha que uma pessoa de saída para o trabalho está em
dúvida se leva ou não guarda-chuva. Ela vai até a janela de sua casa para olhar o
tempo. A chance de ela sair com guarda-chuva dependerá da informação que ela
obtiver ao observar o tempo por sua janela ou por outro acesso à área exterior de
sua residência. Se a pessoa perceber que o tempo está “ruim”, existirá como
consequência um aumento na probabilidade de sair com guarda-chuva. Avaliando
esse contexto, podemos considerar dois possíveis eventos: “tempo ruim” e “sair
com guarda-chuva”, os quais são relacionados ou condicionados.

Para que o conteúdo fique mais claro para você, estudante, vejamos outro
exemplo. Se temos a informação de que os ônibus de determinada linha passam
em um ponto com intervalos de, aproximadamente, 10 minutos, a probabilidade de
que um ônibus dessa linha passe no próximo minuto será, fortemente, influenciada
pelo conhecimento que se tem da passagem de um ônibus nos últimos cinco
minutos (COSTA, 2012).

Considerando o que foi apresentado, podemos perceber que, para falar de


probabilidade condicional, precisamos considerar, no mínimo, a ocorrência de dois
eventos relacionados ao mesmo espaço amostral. Lembrando que espaço
amostral é o conjunto de todos os resultados possíveis de um fenômeno ou

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&c… 3/38
17/10/2022 13:55 E-book

experimento aleatório. Ademais, as probabilidades associadas aos eventos


precisam ser maiores que zero, principalmente para o(s) evento(s) que ocorrer(em)
primeiro, cronologicamente.

Agora, vamos apresentar exemplos para definir o conceito de probabilidade


condicional e conceitos associados. Trata-se de uma estratégia para facilitar a
compreensão do conteúdo. Para isso, vamos considerar a situação descrita por
Bussab e Morettin (2017), na tabela a seguir, a qual apresenta dados de alunos
matriculados em quatro cursos de uma universidade em um ano de calendário não
especificado, de acordo com o sexo.

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&c… 4/38
17/10/2022 13:55 E-book

Curso Sexo Total

Homens (H) Mulheres (F)

Matemática pura (M) 70 40 110

Matemática aplicada
15 15 30
(A)

Estatística (E) 10 20 30

Computação (C) 20 10 30

Total 115 85 200

Tabela 1.1 - Distribuição de alunos segundo o sexo e a escolha de curso


Fonte: Bussab e Morettin (2017, p. 115).

#PraCegoVer : há uma tabela que apresenta quatro colunas. A primeira


coluna traz os nomes dos cursos; a segunda e a terceira coluna trazem,
respectivamente, a quantidade de alunos homens e mulheres matriculados; a
quarta e última coluna traz total de matriculados por curso. Na primeira
coluna, têm-se os seguintes cursos apresentados, nesta sequência, de cima
para baixo: Matemática pura (M); Matemática aplicada (A); Estatística (E);
Computação (C). Ao final da primeira coluna, tem-se a palavra “Total. Na
segunda e terceira coluna, nesta ordem respectivamente, de cima para baixo,
observa-se o sexo. Na segunda coluna está escrito “Homens (H)”; abaixo, há
os seguintes dados numéricos: 70; 15; 10; 20 e 115. Na terceira coluna está
escrito “Mulheres (M)”; abaixo, há os seguintes dados numéricos: 40; 15; 20;
10 e 85. Na última coluna está escrito “Total”; abaixo, há os seguintes dados
numéricos, de cima para baixo: 110; 30; 30; 30 e 200.

Considere que um estudante sorteado aleatoriamente seja aluno do curso de


Estatística. Então, a probabilidade desse estudante ser mulher será igual a 20/30 =

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&c… 5/38
17/10/2022 13:55 E-book

2/3. Esse resultado é verdade porque, de todos os 30 alunos matriculados em


Estatística, 20 são mulheres. Então, podemos escrever, em termos de
probabilidade condicional :

2
P (M ulher|Estat í stica) =
3

Com o exemplo apresentado, podemos definir que, para quaisquer dois eventos, os
quais iremos denominar A e B, pertencentes ao mesmo experimento aleatório e,
consequentemente, ao mesmo espaço amostral, além de P(B)>0, poderemos
definir probabilidade condicional de ocorrência do evento A, dado que o evento B
ocorreu, previamente, por

P (A∩B)
P (A|B) = (1.1),
P (B)

em que:

P(B) é a probabilidade de ocorrência do evento B e

P(A ∩ B) é a probabilidade de ocorrência simultânea dos eventos A e B.

Voltando ao exemplo da seleção do aluno de estatística, vamos considerar que o


evento B representa a escolha de “aluno de Estatística”; e o evento A, a escolha de
“aluno mulher”. A partir disso, poderemos perceber que

20/200
P (A|B) = =
2

3
≈ 0, 6667 ,
30/200

conforme já tinha sido obtido antes. Vale observar que P(A) = P (“aluno mulher”) =
85/200 = 17/40 (simplificando por cinco), a qual será igual a 0,425. Quando
estivermos sabendo que o estudante sorteado é “aluno de Estatística”, ou seja,
ocorreu o evento B, obteremos que P(A|B) = 2/3. Assim, poderemos dizer, então,
que P(A) é a probabilidade a priori do evento A, e, com a informação adicional
sobre a ocorrência de B, obtemos a probabilidade a posteriori P(A|B).

Estudante, agora que vimos uma parte do conteúdo, convido você a verificar a
atividade a seguir, para que você consiga compreender e fixar ainda mais o que
estudamos. Vamos lá?

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&c… 6/38
17/10/2022 13:55 E-book

praticar
Vamos praticar
Os fenômenos aleatórios são um fato na vida humana. Eles ocorrem sem que
sequer percebamos ou os reconheçamos como fenômenos aleatórios. Considere
que um casal deseja ter dois filhos. Pergunta-se: qual a probabilidade de ambos
serem do sexo feminino?

Diante do contexto exposto, apresente como se deve organizar a resolução, de


acordo com o conceito de probabilidade condicional.

Para o exemplo apresentado anteriormente, é possível observar que P(A|B)>P(A),


ou seja, a chance de o aluno sorteado ser mulher aumenta quando temos a
informação de que é um aluno matriculado no curso de Estatística. Da Equação
(1.1), é possível considerar um conceito conhecido como regra do produto de
probabilidades , conforme mostra a Equação (1.2), a seguir.

P (A ∩ B) = P (B) . P (A|B) (1.2)

Tendo como base o estudo de Figueiredo (2000, p. 12), “precisamos agora saber o
que deve existir entre os eventos A e B para que possamos fazer uso da relação”
(1.2). Para tanto, vamos considerar que, conforme dito antes, os eventos
apresentados pertencem ao mesmo espaço amostral. Dado isso, podemos
considerar os resultados a seguir, sem apresentação de provas.

1. Se A e B são independentes, então,


2. Quando os eventos A e B são dependentes,

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&c… 7/38
17/10/2022 13:55 E-book

Note que, conforme afirma, Figueiredo (2000), os itens (1) e (2) apresentados não
dão reais condições de análise da relação entre os eventos A e B, de maneira que
esta possa ser classificada como independente ou dependente. Ainda que “a
ligação entre A e B pode ser de natureza lógica quando A é realizado, então B
também é. Neste caso, existe simplesmente a inclusão A⊂B, o que podemos
traduzir por: P(A)≤P(B)” (FIGUEIREDO, 2000, p. 13).

Vale lembrar que é natural a possibilidade de extensão quanto à quantidade de


eventos , ou seja, é possível considerar três ou mais eventos para o estudo de
probabilidades condicionais.

Título: Eventos cronológicos dependentes

Os experimentos com realizações sucessivas de eventos relacionados geram dependência entre seus
possíveis resultados. Por isso, a partir da realização do segundo evento, as probabilidades são
condicionais, desde que a probabilidade de ocorrência do primeiro evento seja maior que zero. É
possível considerar mais de dois eventos nos cálculos de probabilidades condicionais; basta, apenas,
estender as definições apresentadas.

Estudante, note que a aplicação dos fundamentos de probabilidade condicional é


possível em diversas situações, desde simples exemplos didáticos, como o
lançamento de uma moeda ou de um dado, até exemplos reais mais complexos,
como a avaliação de testes clínicos.

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&c… 8/38
17/10/2022 13:55 E-book

Conhecimento
Teste seus Conhecimentos
(Atividade não pontuada)

Para que o conceito de probabilidade condicional seja utilizado, é necessário que


sejam considerados dois ou mais eventos aleatórios, ou seja, é preciso considerar
um conjunto de eventos, o que torna o experimento aleatório, de certa forma,
mais complexo do que o usual. Considere as definições e os conceitos de
probabilidade condicional e avalie as afirmativas a seguir.

I. Os eventos aleatórios considerados em cálculos de probabilidade condicional


devem ser mutuamente exclusivos.

II. Os eventos aleatórios considerados em probabilidade condicional pertencem


ao mesmo fenômeno aleatório.

III. Uma medida de probabilidade condicional possui todas as propriedades de


uma probabilidade não condicional.

IV. O maior valor possível para uma medida de probabilidade condicional é igual
a 0,5.

Assinale a alternativa que apresenta as afirmativas corretas.

a) I, II, III e IV.


b) II e III.
c) I, II e III.
d) II, III e IV.
e) I e IV.

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&c… 9/38
17/10/2022 13:55 E-book

Teorema de Bayes

Esse teorema, estudante, é uma das mais importantes relações que envolvem
probabilidades condicionais. De acordo com a história, o Teorema de Bayes foi
criado por Thomas Bayes, nascido em Londres (1702) e falecido em Kent (1761),
que era matemático e reverendo da Igreja Presbiteriana. O Teorema de Bayes deu
origem a uma linha de estudo da Estatística conhecida como Inferência Bayesiana.

Veja, agora, a visão de Bussab e Morettin (2017), que apresentam a versão mais
simples do Teorema de Bayes, dada pela Equação (4).

P (A∩B) P (A).P (B|A)


P (A|B) = = (1.4)
P (B) P (B)

onde,

P(A): probabilidade a priori ;

P(B|A): verossimilhança da hipótese A (a ser explicada posteriormente);

P(B): probabilidade total de ocorrência do evento B (a ser explicada


posteriormente);

P(A|B): probabilidade a posteriori à observação do evento B.

Para compreendermos melhor os conceitos associados, assim como sua


aplicação, vamos apresentar o Teorema de Bayes a partir de um exemplo descrito
por Bussab e Morettin (2017).

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 10/38
17/10/2022 13:55 E-book

#PraCegoVer : o infográfico apresentado é um infográfico estático, que possui a forma


de um quadro com três colunas e duas linhas. Na primeira coluna da primeira linha, há
o título “ A posteriori ” e o texto “Probabilidade de que a hipótese A seja verdadeira dada
a informação a partir da evidência (verossimilhança)”. Na segunda coluna da primeira
linha, há o título “ A priori ” e o texto: “Probabilidade de a hipótese ser verdadeira antes
da informação dos dados”. Na terceira coluna da primeira linha, há o título:
“Verossimilhança” e o texto: “Probabilidade de a evidência ser verdadeira dada a
hipótese estabelecida”. Na segunda linha e primeira coluna, há “P(A|B)”. Na segunda e
terceira colunas (que estão mescladas) da segunda linha, há “=P(A).P(B|A) / P(B)” e o
seguinte texto: “Probabilidade marginal da evidência (dados)”.

Vamos ao Exemplo 1.1. Considere a existência de cinco urnas, e cada uma delas
possui seis bolas. Duas dessas urnas (denominadas C1 ) possuem três bolas
brancas; outras duas urnas (denominadas C2 ) possuem duas bolas brancas; a
última das urnas (denominada C3 ) possui seis bolas brancas. Dado o cenário, uma
urna é selecionada aleatoriamente, e dela é retirada uma bola ao acaso.
Desejamos saber a probabilidade de a urna escolhida ser a C3 , tendo a informação
de que a bola sorteada é branca.

A probabilidade que se deseja obter é uma probabilidade condicional e pode ser


representada por P(C3 |B), em que B representa a seleção de uma bola branca.
Portanto, a partir do enunciado do problema, temos que:

P(C1 ) = 2/5 (duas urnas C1 em um total de cinco urnas);

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&c… 11/38
17/10/2022 13:55 E-book

P(B|C1 ) = 3/6 (três bolas brancas em um total de seis bolas em urna C1 );

P(C2 ) = 2/5 (duas urnas C2 em um total de cinco urnas);

P(B|C2 ) = 2/6 (duas bolas brancas em um total de seis bolas em urna C2 );

P(C3 ) = 1/5 (uma urna C3 em um total de cinco urnas);

P(B|C3 ) = 6/6 = 1 (todas as seis bolas são brancas na urna C3 ).

A partir da definição de probabilidade condicional, podemos, então, descrever a


probabilidade desejada como:

P (C 3 ∩B) P (C 3 ).P (B|C 3 )


P (C 3|B) = = (1.5).
P (B) P (B)

Para dar continuidade na resolução,


precisamos encontrar o valor de P(B)
. Vale lembrar que os eventos C1 , C2 e
C3 são mutuamente exclusivos e, por
isso, quando reunidos, compõem o
espaço amostral do experimento
relacionado ao problema. A partir
dessa informação, podemos, então,
decompor o evento B em três outros
eventos, também, mutuamente
exclusivos, de acordo com:
B = (C1 ∩ B) ∪ (C2 ∩ B) ∪ (C3 ∩ B)

(1.6).
A partir da nova representação do evento B, podemos calcular a probabilidade de
sua ocorrência, conforme apresentado a seguir:

P (B) = P (C 1 ∩ B) + P (C 2 ∩ B) + P (C 3 ∩ B) (mutuamente exclusivos);

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 12/38
17/10/2022 13:55 E-book

P (B) = P (C 1 ) . P (B|C 1 ) + P (C 2 ) . P (B|C 2 ) + P (C 3 ) . P (B|C 3 )

(prob. condicional);

P (B) =
2

5
×
3

6
+
2

5
×
2

6
+
1

5
× 1 =
8

15
.

Agora, podemos substituir na Equação (1.5) para obtermos a probabilidade


desejada. Teremos:

(1/5).1
P (C 3|B) = =
3

8
.
8/15

O método desenvolvido no Exemplo 1.1, agora, poderá ser generalizado do modo


apresentado na sequência (BUSSAB; MORETTIN, 2017).

Consideremos que um experimento aleatório seja realizado e que ele possua um


espaço amostral particionado de acordo com {C 1 , C 2 , … , C n } , denominado
partição do espaço amostral Ω, ou seja,

Ci ∩ Cj = ∅ , sempre que i ≠ j , (1.7)

C1 ∪ C2 ∪ … ∪ Cn = Ω . (1.8)

Vamos considerar que um evento qualquer A, pertencente a Ω, ocorra. Precisamos


supor que as probabilidades P(Ci ) e P(A|Ci ) para i = 1, 2, … , n sejam
conhecidas. Para ficar mais claro a você, estudante, teremos um resultado
ilustrado de acordo com a Figura 1.2.

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 13/38
17/10/2022 13:55 E-book

Figura 1.2 - Partição de um espaço amostral e ocorrência de um evento A


Fonte: Adaptada de Bussab e Morettin (2017, p. 126).

#PraCegoVer : a imagem apresenta um esquema de um espaço amostral particionado


em eventos mutuamente exclusivos, denominados partições, ou seja, em partes como
se fosse um quebra-cabeça, assim como a ocorrência dentro do mesmo espaço
amostral de um evento associado, denominado, genericamente, A. O fundo da figura é
azul-claro, e as divisões estão em azul-escuro.

Considerando, então, os elementos apresentados, podemos calcular a


probabilidade de ocorrência do evento Ci , supondo que o evento A tenha ocorrido
com a seguinte equação:

P (C i ).P (A|C i )
P (C i|A) = n
(1.9)
∑ P (C j ).P (A|C j )
j=1

para todo i = 1, 2, … , n .

Vamos compreender o que Bussab e Morettin (2017, p. 127) afirmam: “podemos


pensar C1 , … Cn como um conjunto de hipóteses, sendo somente uma delas
verdadeira. Dado que A ocorreu, a probabilidade inicial de Ci , P(Ci ), é modificada
de modo a se obter P(Ci |A)”. Essa última probabilidade é obtida a partir de (1.9).

SAIBA MAIS

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 14/38
17/10/2022 13:55 E-book

O problema de Monty Hall é um problema clássico


de aplicação do Teorema de Bayes. Ele foi proposto
por Steve Selvin em 1975 e publicado na revista
científica American Science . O problema descreve o
jogo em um programa de TV para a escolha de uma
dentre três portas. Duas delas têm bodes por detrás,
e a terceira tem um carro. O jogador deverá escolher
uma das portas, e se escolher a que contiver o carro,
leva esse prêmio. Vamos saber mais sobre o
assunto, estudante? Para isso, acesse:

ASSISTIR

O uso desse recurso permite que possamos afirmar que passamos de uma
probabilidade a priori P(Ci ) para uma probabilidade a posteriori P(Ci |A), a partir da
multiplicação da probabilidade a priori , pelo termo:

P (A|C i )
n
(1.10).
∑ P (C j ).P (A|C j )
j=1

Estudante, observe que, se considerarmos o evento A como fixado, poderemos


afirmar que as probabilidades obtidas a partir de P(A|Ci ) em (1.9) são
denominadas verossimilhanças das hipóteses {C1 , C2 , … , Cn }. Podemos
considerar o denominador (1.10) como uma média ponderada de P (A|Cj ), em
que os pesos serão as probabilidades P (Cj ) , as quais têm soma total igual a um.
Outra observação, agora feita sobre o numerador (1.10): afirmamos que ele
sempre será uma das parcelas do denominador P(A). A partir da definição desses
novos elementos, vamos apresentar mais um exemplo.

Veja o Exemplo 1.2 (BUSSAB; MORETTIN, 2017). Para selecionar seus


funcionários, uma empresa oferece aos candidatos um curso de treinamento
durante uma semana. No final do curso, os candidatos são submetidos a uma
prova, e 25% deles são classificados como bons (B); 50% como médios (M); e 25%

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 15/38
17/10/2022 13:55 E-book

como fracos (F). Para facilitar a seleção, a empresa pretende substituir o


treinamento por um teste contendo questões referentes a conhecimentos gerais e
específicos. Para isso, a empresa gostaria de conhecer qual a probabilidade de um
candidato aprovado no teste ter sido considerado fraco no curso, se o tivesse feito.
Assim, neste ano, antes do início do curso, os candidatos foram submetidos ao
teste e receberam o conceito de aprovado (A) ou reprovado (R). No final do curso,
foram obtidas as seguintes probabilidades condicionais:

P (A|B) = 0, 80 , P (A|M ) = 0, 50 , P (A|F ) = 0, 20

Desejamos encontrar a probabilidade P (F |A) . O uso do Teorema de Bayes


permitirá a obtenção e, para isso, podemos organizar as informações dadas em
um esquema visual a partir de uma árvore de probabilidades ou diagrama de
árvore. Para compreendermos melhor, veja a Figura 1.3, a seguir.

Figura 1.3 - Árvore de probabilidades do problema apresentado


Fonte: Adaptada de Bussab e Morettin (2017, p. 128).

#PraCegoVer : a imagem apresenta três retas partindo de um mesmo ponto, da


esquerda pra direita, representando as possíveis classificações no treinamento (B, M
ou F). Os respectivos valores de probabilidades, também, são apresentados com cada
uma das retas, sendo: 0,25; 0,50; 0,25. Em seguida, partindo de cada uma das três
retas, são desenhadas outras duas retas, representando a classificação no teste (A ou
R) e, assim como anteriormente, há os valores de probabilidades, também, descritos
com cada par de retas, sendo: 0,80; 0,20; 0;50; 0,50; 0,20; 0,80.

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 16/38
17/10/2022 13:55 E-book

Estudante, ao observarmos a Figura 1.3, poderemos organizar os dados para obter


P (F |A) , de acordo com o Teorema de Bayes:

P (F ) . P (A|F )
P (F|A) =
P (B) . P (A|B) + P (M ) . P (A|M ) + P (F ) . P (A|F )

(0, 25) . (0, 20)


P (F|A) = = 0, 10
(0, 25) . (0, 80) + (0, 50) . (0, 50) + (0, 25) . (0, 20)

Concluímos que 10% dos aprovados estariam classificados como fracos se


tivessem feito o curso. Cálculos análogos poderão ser feitos para se obter
P (B|A) e P (M |A). O Teorema de Bayes teve importância fundamental no
desenvolvimento de uma abordagem da inferência estatística denominada
inferência bayesiana (BUSSAB; MORETTIN, 2017).

REFLITA

No final do ano 2019, um surto de infecções pelo


novo coronavírus começou a matar chineses na
cidade de Wuhan. Rapidamente, as infecções se
espalharam pelo país e, também, pelo restante do
mundo. Com isso, a Organização Mundial da Saúde
declarou que estava acontecendo uma pandemia.
Desde então, os cientistas passaram a pesquisar a
doença causada pelo vírus, a qual foi chamada de
Covid-19. Os estudiosos passaram a fazer testagem
em massa nas pessoas e a elaborar vacinas para
combater o vírus. Caro(a) estudante, você já parou
para pensar que o estudo de testes diagnósticos foi
realizado a partir de métricas de sensibilidade,

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 17/38
17/10/2022 13:55 E-book

especificidade e valores preditivos que avaliam a


acurácia de testes como os aplicados para
diagnosticar a Covid-19?

O desenvolvimento da inferência bayesiana foi realizado a partir do conceito de


probabilidade subjetiva, o qual, segundo Bussab e Morettin (2017) tem
embasamento em informações anteriores e na opinião do(s) envolvido(s) com a
investigação. Outro conceito importante será o de verossimilhança, sobre a qual já
foi citado e dito que poderá ser considerada um conjunto de hipóteses. O que
achou deste conteúdo, estudante? Para você aprimorar ainda mais este tema,
vamos colocá-lo em prática?

praticar
Vamos praticar
Em uma determinada escola, 5% dos alunos homens têm mais de 1,80m de
altura, enquanto, entre as alunas mulheres, esse percentual é igual a 2%. Sabe-
se, também, que 60% dos estudantes são homens. Se um estudante for
selecionado aleatoriamente e tiver mais de 1,80m de altura, qual a probabilidade
de ser homem?

Utilize o Teorema de Bayes para resolver o problema. Você pode organizar as


informações da seguinte maneira: A: “aluno do sexo masculino” e B: “ter mais de
1,80m”. Portanto, P(A) = 0,60, P(B|A) = 0,05 e P(B|A ) = 0,02. c

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 18/38
17/10/2022 13:55 E-book

Fundamentação da
Verossimilhança

Caro(a) estudante, perceba que é na inferência estatística clássica que são


apresentados os fundamentos da função de verossimilhança, pois estes são
utilizados para o desenvolvimento de métodos importantes para a área. No
entanto, para a inferência bayesiana, os fundamentos de função de
verossimilhança também são importantes.

Considere, inicialmente, para o caso discreto, ou seja, para variáveis aleatórias


discretas Xi , i = 1, 2, … n , consideradas independentes e identicamente
distribuídas (i.i.d.), com função de probabilidade dada por f(x|θ), um evento
aleatório A = (X1 = x1 , X2 = x2 , … , Xn = xn ) e probabilidade conjunta
(marginal) ∏i f(xi |θ) . Se fixarmos o evento aleatório A e variarmos o parâmetro
θ no espaço paramétrico Θ, poderemos obter a função de verossimilhança dada
por:

L (θ) = L (θ|A) = ∏ f(xi |θ)


i
(1.11)

com domínio em Θ, em que para cada θ ∈ Θ poderemos expressar a


verossimilhança ou a plausabilidade quando se sabe que ocorreu o evento A
(PAULINO et. al ., 2018).

Observe, estudante, a afirmação de Paulino et al . (2018, p. 19): “[...] a


verossimilhança não é uma probabilidade; por exemplo, não faz sentido adicionar

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 19/38
17/10/2022 13:55 E-book

verossimilhanças”. Os autores afirmam, ainda, que, para fazer sentido, devemos


obter a razão de verossimilhanças para θ e θ* por

L(θ) ∏ f(xi |θ)


=
i


(1.12),
L(θ ) ∏ f(xi |θ )
i

a qual medirá o peso da evidência ou da plausabilidade para o parâmetro θ contra


o parâmetro θ* como consequência da observação do evento aleatório
A = (X1 = x1 , X2 = x2 , … , Xn = xn ) . Dado isso, podemos considerar a

função de verossimilhança definida “a menos de um fator constante (i.e.,


independente de θ) positivo” (PAULINO et al ., 2018, p. 19), de acordo com

L (θ) = K ∏ f(xi |θ), θ ∈ Θ


i
(1.13).

Para o caso de variáveis aleatórias contínuas Xi , i = 1, 2 … , n , também


consideradas i.i.d. e com função densidade de probabilidade f(x|θ), precisamos
determinar um limite aproximado para eventos aleatórios associados, a partir de
acréscimos arbitrariamente pequenos representados por dxi , dados por

A = (x1 < X1 < x1 + dx1 , x2 < X2 < x2 + dx2 , … , xn < Xn < xn + dxn )

(1.14),

o que, segundo Paulino et al. (2018), é considerado um acontecimento com


probabilidade elementar, ou seja, probabilidade a menos de infinitésimos de
2
segunda ordem (termos da ordem de (dxi ) ), permitindo que possamos obter a
verossimilhança dada por

∏ f (xi|θ) dxi = [∏ dxi ] ∏ f(xi |θ)


i i i
. (1.15)

Podemos observar que ∏i dxi não depende de θ, então, pode ser absorvido pelo
termo constante K em (1.13). Uma aplicação, extraída de Paulino et al . (2018), é
apresentada no Exemplo 1.3.

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 20/38
17/10/2022 13:55 E-book

Título : Comparação das distribuições a priori , verossimilhança e a posteriori


Texto : Curvas da distribuição normal com média populacional a prior i igual a 20 e desvio padrão
populacional igual a 6.

Veja, estudante, o Exemplo 1.3 (Paulino et al ., 2018). Consideremos uma amostral


aleatória de tamanho n = 5 das variáveis Xi , i = 1, 2, … , 5 , em que
Xi ∼ N (θ, σ )
2
e σ = 6 . Vamos admitir que a distribuição a priori para o
parâmetro θ seja θ , em que a eb . Poderemos escrever a
2
∼ N (a, b ) = 20 = 5

função de verossimilhança como

1 2
∏ f (xi|θ) ∝ exp{− ∑ (xi − θ) }
i 2σ
2 i

em que o símbolo “∝” indica proporcionalidade em relação ao parâmetro θ, ou seja,


a menos de fatores que não dependem de θ. Os livros de inferência bayesiana
fazem muito uso dessa notação; é importante, portanto, que você se familiarize
com ela. Outra importante relação trata-se de:

2 2 2
∑ (xi − θ)
i
= ∑ (xi − x̄) + n(x̄ − θ) ,

vem, então,

2
∏ f (xi|θ) ∝ exp{−
i
1
2
. n. (θ − x̄) } ,

2
já que o termo ∑ (xi − x̄) não depende de θ. Vamos considerar que se obteve
x̄ = 30. Então, teremos que a função de verossimilhança será dada por:

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 21/38
17/10/2022 13:55 E-book

2
∏ f (xi|θ) ∝ exp{−
i
1
.5. (θ − 30) } .
2.(36)

A distribuição a posteriori para θ, de acordo com Paulino et al . (2018), será dada


por

,
′ 2
θ|x̄ ∼ N (A , B )

onde,

1 n
.a+ .x̄ ′
2 2

e (1.16).
′ b σ 2 1
A = B =
1 n 1 n
+ +
2 2 2 2
b σ b σ

Portanto teremos que

1 n 1 5
.a + . x̄ .20 + .30
2 2
′ b σ 25 36
A = = = 27, 7639
1 n 1 5
+ +
2
σ
2 25 36
b

′ 1 1
2
B = = = 5, 5900
1 n 1 5
2
+ 2
+
b σ 25 36

Logo, θ|x̄ ∼ N (27, 7639; 5, 59) .

A função de verossimilhança tem papel de extrema importância na inferência


bayesiana, pois é por intermédio dela que os dados amostrais realizam a
transformação do conhecimento a priori sobre o parâmetro θ, ou seja, a
verossimilhança pode ser interpretada como uma expressão da informação sobre
o parâmetro θ fornecida pelos dados. A distribuição a posteriori , então, irá
incorporar, através do Teorema de Bayes, a informação disponível sobre o(s)
parâmetro(s) – a priori e, também, dos dados. Agora, vamos colocar em prática o
nosso conhecimento por meio da atividade apresentada a seguir.

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… i 22/38
17/10/2022 13:55 E-book

Conhecimento
Teste seus Conhecimentos
(Atividade não pontuada)

A verossimilhança tem importante papel na inferência bayesiana. Ela é,


praticamente, a ponte entre a distribuição a priori e a distribuição a posteriori .
Sem o seu uso apropriado, não podem ser feitas atualizações de probabilidades
e distribuições sobre os parâmetros. Considerando essas informações, avalie as
afirmativas a seguir e assinale (V) para a(s) verdadeira(s) e (F) para a(s) falsa(s).

I. ( ) A função de probabilidade conjunta, também, é conhecida como função de


probabilidade marginal.

II. ( ) O conjunto de todos os valores possíveis para o parâmetro de uma


distribuição de probabilidades é o espaço paramétrico.

III. ( ) Não faz sentido realizar operação de soma com verossimilhanças, pois
estas não são consideradas como medidas de probabilidade.

IV. ( ) Os dados amostrais realizam transformação do conhecimento a priori


através da função de verossimilhança.

Assinale a alternativa que contém a sequência correta.

a) F – F – F – F.
b) V – F – V – F.
c) F – V – F – V.
d) V – V – V – V.
e) V – V – F – F.

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 23/38
17/10/2022 13:55 E-book

Distribuições a priori
e a posteriori

Estudante, perceba que, diferentemente da teoria estatística clássica, a qual


considera dados hipotéticos e suposições para testar hipóteses, assim como para
construir intervalos de confiança para parâmetros estimados com uso de dados
amostrais, a inferência bayesiana recorre a conceitos fundamentados pelo
Teorema de Bayes e a dados para elaborar distribuições probabilísticas.

O conceito de probabilidade subjetiva surge novamente, então, para reforçar que o


conhecimento prévio sobre fenômenos de interesse é considerado de extrema
importância para o cálculo de probabilidades de ocorrências de eventos aleatórios
diversos e, também, para descrever distribuições de probabilidades para
caracterizar a incerteza de parâmetros desconhecidos.

Veja o que Bussab e Morettin (2017, p. 331) afirmam: “após obtidos os dados,
obtemos a função de verossimilhança, que incorpora a informação sobre θ
fornecida pelos dados”. A letra grega θ (theta) representa o parâmetro
desconhecido ou o vetor de parâmetros desconhecidos. De posse da função de
verossimilhança, é possível obter a distribuição a posteriori de θ a partir da
amostra observada. Para exemplificar, o parâmetro θ pode ser uma média, uma
variância ou uma mediana.

Além de ser utilizado para atualizar probabilidades de um evento, estudante, o


Teorema de Bayes também pode ser utilizado para obter informação sobre um
parâmetro desconhecido de uma distribuição de probabilidades, como a média µ
da distribuição normal.

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 24/38
17/10/2022 13:55 E-book

Imagine que tenhamos alguma informação anterior sobre o parâmetro θ, o qual,


até aqui, é desconhecido. Consideremos, ainda, que a informação que se tem está
relacionada com uma distribuição de probabilidades p (θ), conhecida como
distribuição a priori de θ.

Para simplificar, vamos supor que o parâmetro θ assuma valores θ1 , θ2 , …, θr , com


probabilidades a priori dadas por P(θ = θi ) = p(θi ), i = 1, 2, …,r. Vamos denominar
como y uma nova informação sobre o parâmetro θ. Se a distribuição probabilística
associada for discreta, teremos que o Teorema de Bayes poderá ser escrito como:

p(θ i ).P (y|θ i )


P (θi|y) = r , i = 1, 2, … , r (1.16).
∑ p(θ j ).P (y|θ j )
j=0

Nesse caso, as verossimilhanças são as quantidades P (y|θ1 ) , … , P (y|θr ) , e


as probabilidades a posteriori , a serem determinadas pelo Teorema de Bayes, são
P (θ1|y) , … , P (θr |y) . Depois de obtida a distribuição a posteriori de θ,

considerando a nova informação ( y ), é possível estimar o parâmetro


desconhecido θ. Para melhor compreender, considere o Exemplo 1.4.

Observe o Exemplo 1.4 (BUSSAB; MORETTIN, 2017). Vamos considerar que o


rendimento mensal (em porcentagem) do Índice da Bolsa de Valores de São Paulo
(Ibovespa) seja representado por y . Suponha que estamos interessados em,
apenas, saber se o rendimento é positivo ou negativo. Vamos representar por θ o
“estado do mercado” e considerar dois estados possíveis: mercado em alta (θ1 ) ou
mercado em baixa (θ2 ). Estudante, suponha que tenhamos uma informação prévia
( a priori ) sobre as probabilidades de θ1 e θ2 , de acordo com:

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 25/38
17/10/2022 13:55 E-book

Priori θ1 θ2

p (θ) 3/5 2/5

Tabela 1.3 - Distribuição a priori do parâmetro θ


Fonte: Bussab e Morettin (2017, p. 332).

#PraCegoVer : a tabela tem três colunas. A primeira tem a simbologia


matemática para representar a distribuição a priori ; a segunda coluna
apresenta o valor de probabilidade a priori para theta um; e a terceira coluna
apresenta o valor de probabilidade a priori para theta dois.

As verossimilhanças associadas serão dadas por P (y > 0|θ) e P (y ⟨0| θ) e


serão denotadas por p(y|θ) para simplificar a notação. No Teorema de Bayes, as
verossimilhanças são, supostamente, conhecidas, portanto, para auxiliá-lo ainda
mais, iremos supor que serão dadas de acordo com o apresentado na Tabela 1.4.

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 26/38
17/10/2022 13:55 E-book

y p(y|θ)

θ1 θ2

y > 0 2/3 1/3

y < 0 1/3 2/3

Tabela 1.4 - Verossimilhança para o problema do Ibovespa


Fonte: Bussab e Morettin (2017, p. 332).

#PraCegoVer : a tabela tem três colunas. A primeira tem a simbologia


matemática para representar a nova informação sobre o fenômeno
investigado – rendimento positivo ou negativo; a segunda coluna tem os
valores de verossimilhança considerando alta do mercado, que são dois
terços e um terço, respectivamente; a terceira coluna contém valores de
verossimilhança considerando baixa do mercado, que são um terço e dois
terços, respectivamente.

Estudante, perceba que, a partir do Tabela 1.4, poderemos identificar que


P (y > 0|θ1 ) = 2/3, P (y > 0|θ2 ) = 1/3, P (y < 0|θ1 ) = 1/3 e
P (y < 0|θ2 ) = 2/3 . De posse dessas informações, poderemos calcular as
probabilidades conjuntas p (y, θ) , ou seja, p (y, θ) = p (θ) . p(y|θ). Agora, note
que, na Tabela 1.5, é possível observar os valores obtidos.

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 27/38
17/10/2022 13:55 E-book

y p (y, θ) p (y)

θ1 θ2

y > 0 6/15 2/15 8/15

y < 0 3/15 4/15 7/15

p (θ) 9/15 6/15 1

Tabela 1.5 - Probabilidades conjuntas para o exemplo do Ibovespa


Fonte: Bussab e Morettin (2017, p. 332).

#PraCegoVer : a tabela tem quatro colunas e cinco linhas. A primeira coluna


possui quatro linhas e apresenta a simbologia matemática que representa a
nova informação para o fenômeno aleatório – rendimento positivo ou
negativo, e a probabilidade marginal para o parâmetro theta. A segunda
coluna contém cinco linhas; as duas primeiras linhas são cabeçalhos para a
distribuição conjunta entre a informação dos dados e o parâmetro theta um, e
as linhas seguintes são os valores de probabilidade conjunta considerando o
mercado em alta (rendimento positivo com probabilidade seis sobre 15) e
mercado em baixa (rendimento negativo com probabilidade três sobre 15),
além da marginal para theta, igual a nove sobre quinze. A terceira coluna
contém cinco linhas; as duas primeiras linhas são cabeçalhos e representam
a distribuição conjunta entre os dados e theta dois considerando os valores
de probabilidade conjunta para o mercado em baixa para rendimento positivo
com probabilidade dois sobre quinze e para rendimento negativo com
probabilidade quatro sobre quinze, além da marginal para theta igual a seis
sobre quinze. A quarta coluna possui os valores de probabilidades marginais
para a nova informação sobre o rendimento positivo, igual a oito sobre quinze,
e rendimento negativo, igual a sete sobre quinze, respectivamente.

Para exemplificar, vamos calcular a probabilidade de o Ibovespa ter rendimento


positivo e o mercado estar em alta (θ1 ).

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 28/38
17/10/2022 13:55 E-book

P (y > 0, θ = θ1 ) = P (θ = θ1 ) . P (Y > 0|θ = θ1 ) =


3

5
×
2

3
= 6/15 .

Os demais resultados de probabilidades conjuntas podem ser obtidos de forma


análoga. O Teorema de Bayes descrito por (1.16) fornece probabilidades a
posteriori para os parâmetros θ1 e θ2 considerando que uma nova informação é
dada ( y ). Então, temos que:

p(θ).p(y|θ)
p (θ|y) = (1.17).
p(y)

Para calcularmos (1.17), precisaremos, antes, calcular p (y) , denominada


probabilidade marginal preditora ou previsão (probabilidade total). Se utilizarmos o
mesmo argumento que estamos usando para calcular a probabilidade de
ocorrência de um evento dentro de um espaço amostral particionado em eventos
disjuntos, poderemos escrever:

p (y) = ∑
θ
p (y, θ) = ∑
θ
p (θ) . p(y|θ) (1.18).

Considerando o exemplo do rendimento do Ibovespa, teremos que:

P (y > 0) = P (θ1 ) . P (y > 0|θ1 ) + P (θ2 ) . P (y > 0|θ2 )

P (y > 0) =
3

5
×
2

3
+
2

5
×
1

3
=
8

15
.

De forma semelhante para o rendimento negativo, teremos:

P (y < 0) = P (θ1 ) . P (y < 0|θ1 ) + P (θ2 ) . P (y ⟨0| θ2 )

P (y < 0) =
3

5
×
1

3
+
2

5
×
2

3
=
7

15
.

Então, poderemos resumir os últimos resultados apresentados na Tabela 1.6, a


seguir.

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 29/38
17/10/2022 13:55 E-book

y p (y)

y > 0 8/15

y < 0 7/15

Tabela 1.6 - Previsões para o rendimento do Ibovespa


Fonte: Bussab e Morettin (2017, p. 333).

#PraCegoVer : a tabela apresenta duas colunas e três linhas. A primeira


coluna contém a simbologia matemática para representar a nova informação
sobre o rendimento positivo ou negativo, segunda e terceira linha,
respectivamente. A segunda coluna contém os valores de probabilidade para
cada resultado do rendimento – positivo ou negativo., iguais a oito sobre
quinze e sete sobre quinze, respectivamente.

Observe que os resultados apresentados na Tabela 1.6 (distribuição marginal de y


) são iguais aos resultados apresentados na Tabela 1.5, em relação à distribuição
conjunta de y e θ. Portanto, a partir de (1.17), teremos que:

P (θ 1 ).P (y>0|θ 1 ) (3/5)×(2/3)


P (θ = θ1|y > 0) = = =
3

4
.
P (y>0) 8/15

P (θ 2 ).P (y>0|θ 2 ) (2/5)×(1/3)


P (θ = θ2|y > 0) = = =
1

4
.
P (y>0) 8/15

P (θ 1 ).P (y⟨0|θ 1 ) (3/5)×(1/3)


P (θ = θ1|y < 0) = = =
3

7
.
P (y<0) 7/15

P (θ 2 ).P (y⟨0|θ 2 ) (2/5)×(2/3)


P (θ = θ2|y < 0) = = =
4

7
.
P (y<0) 7/15

Logo, caro(a) estudante, as probabilidades condicionais de alta e baixa de


mercado, considerando a informação sobre o retorno do rendimento do Ibovespa,
serão dadas de acordo com a Tabela 1.7, a seguir.

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 30/38
17/10/2022 13:55 E-book

y p(θ|y)

θ1 θ2

y > 0 3/4 1/4

y < 0 3/7 4/7

Tabela 1.7 - Probabilidades a posteriori


Fonte: Bussab e Morettin (2017, p. 334).

#PraCegoVer : a tabela apresenta três colunas e quatro linhas. A primeira


coluna contém a simbologia matemática que descreve os resultados do
rendimento – positivo ou negativo, terceira e quarta linha, respectivamente. A
segunda coluna contém os valores de probabilidade para a situação de
mercado em alta (theta um), com valores para rendimento positivo igual a três
quartos e para rendimento negativo igual a três sobre sete. A terceira coluna
contém os valores de probabilidade para o mercado em baixa, com valores de
probabilidades iguais a um quarto para rendimento positivo e quatro sobre
sete para rendimento negativo.

Vamos observar o que Bussab e Morettin (2017, p. 334) afirmam: “esse é um


exemplo do que se chama de modelo estático”. O que os autores querem dizer é
que não há consideração de variação de resultados entre períodos, no entanto é
completamente possível considerar um modelo dinâmico; basta considerar a
possibilidade de mudanças de resultados entre períodos.

REFLITA

A pesquisa clínica é uma área da ciência que faz

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 31/38
17/10/2022 13:55 E-book

A pesquisa clínica é uma área da ciência que faz


bastante uso dos fundamentos da inferência
bayesiana. Por exemplo, o estudo de testes
diagnósticos é uma área importante que avalia a
eficácia de testes e faz uso dos fundamentos do
Teorema de Bayes para calcular medidas de
acurácia, dentre outras.

Certamente, existem situações mais complexas nas quais se pode aplicar


métodos de inferência bayesiana, a fim de verificar e perceber o poder do seu uso.
Os exemplos trazidos neste texto, porém, têm a intenção de familiarizar você com
a metodologia. No entanto você poderá se aprofundar mais no assunto buscando
informações nas referências bibliográficas apresentadas.

- Analogia entre estatística clássica e


bayesiana -

1 2 3

Esquema clássico
A estatística clássica, apesar de parecer teruma trajetória mais curta, percorre por
raciocínios do tipo indutivos, comopara a elaboração de intervalos de confiança, os
quais, de certa maneira, nãotêm interpretação direta em termos de probabilidade.

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 32/38
17/10/2022 13:55 E-book

#PraCegoVer : o infográfico apresenta linha do tempo na vertical com título geral


“Analogia entre estatística clássica e bayesiana”. A primeira aba a ser aberta tem como
título e texto: “1) Esquema clássico: a estatística clássica, apesar de parecer ter uma
trajetória mais curta, percorre por raciocínios do tipo indutivo, como para a elaboração
de intervalos de confiança, os quais, de certa maneira, não têm interpretação direta em
termos de probabilidade”. Há um esquema para ilustrar, em que aparecem quatro
caixas com setas conectando umas nas outras, sendo uma em cima, que é a primeira
do esquema, com a escrita “Modelo Experimental”, levando às outras três embaixo,
nesta sequência, respectivamente: “Dados amostra”, “Raciocínio indutivo” e “Inferência
estatística”, que, então, volta à primeira caixa, “Modelo Experimental”. A segunda aba
tem como título e texto: “2) Esquema bayesiano: toda inferência é realizada a partir de
aplicações lógicas do cálculo de probabilidades. A inferência bayesiana apresenta
resultados que são obtidos por cálculos probabilísticos e, especificamente, do Teorema
de Bayes”. Há um esquema para ilustrar, em que aparecem seis caixas com setas
conectando umas nas outras, iniciando com “Modelo Experimental”, que vai até “Dados
amostra” e “Distribuição a priori ” e, então, entram, em sequência, respectivamente:
“Teorema de Bayes”, “Raciocínio indutivo” e “Inferência estatística”, que retorna para
“Modelo Experimental”. Já a terceira e última aba tem como título e texto: “3) Esquema
geral: alguns pontos são comuns, tanto para a estatística clássica quanto para a
bayesiana. O ponto de partida não poderia ser diferente e é o mesmo para ambos: a
elaboração do experimento (Modelo Experimental). Outro ponto semelhante trata-se da
produção de amostras para fazer a devida inferência. A partir desse ponto, cada
esquema tem seu próprio caminho”.

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 33/38
17/10/2022 13:55 E-book

Todo o conteúdo aqui apresentado representa pouco diante de tudo o que já foi
publicado sobre os fundamentos da inferência bayesiana. Prepare-se, portanto,
para desbravar esse mundo de métodos importantes e muito utilizados em
diversas áreas, como engenharia, medicina, dentre outras.

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 34/38
17/10/2022 13:55 E-book

Material
Complementar

FILME

O homem que mudou o jogo


Ano : 2011

Comentário : o filme é baseado na história real do técnico de


baseball do time Oakland A’s. O técnico contrata um estatístico
chamado Peter Brand para utilizar métodos estatísticos para
avaliar os jogadores quanto aos seus desempenhos e, com
isso, melhorar o desempenho geral do time.

Para conhecer mais sobre o filme, acesse o trailer disponível


em:

TRAILER

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 35/38
17/10/2022 13:55 E-book

LIVRO

Uma senhora toma chá...: como a


estatística revolucionou a ciência no
século XX
Autor : David Salsburg

Editora : Zahar

Ano : 2009

ISBN : 978-8537801161

Comentário : o autor descreve como a estatística transformou


a metodologia de pesquisa científica na história da
humanidade. Essa mudança trouxe maior credibilidade para as
investigações feitas nos diversos ramos de pesquisa, incluindo
a educação, a medicina, dentre outros.

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 36/38
17/10/2022 13:55 E-book

Conclusão
Prezado(a) estudante, neste texto você teve contato com os fundamentos da inferência
bayesiana, a qual faz uso de conceitos de probabilidade condicional, Teorema de Bayes,
verossimilhanças e distribuições a priori e distribuições a posteriori .

Foram apresentadas definições e, juntamente, exemplos de aplicação, com o intuito de


facilitar a compreensão desses novos conceitos aos quais você está tendo contato. É
importante que você seja ativo no seu processo de formação profissional, atuando
firmemente na aprendizagem a partir da leitura de todo o material apresentado.

Também, se possível, busque, nas referências apresentadas, complementação para a


teoria trazida no texto. Faça as atividades práticas e verifique se você absorveu
satisfatoriamente todo o conteúdo. O acompanhamento da disciplina com essa postura
levará você para um final de sucesso. Desejamos a você um excelente curso!

Referências
BUSSAB, W. O.; MORETTIN, P. A. Estatística
básica . 9. ed. São Paulo: Saraiva, 2017.
Disponível em: https://
Ânimabrasil.blackboard.com/webapps/ga-
bibliotecaSSO-
BBLEARN/homeMinhaBiblioteca . Acesso
em: 02 abr. 2021.

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 37/38
17/10/2022 13:55 E-book

COSTA, G. G. O. Curso de estatística inferencial e probabilidades : teoria e prática. São


Paulo: Atlas, 2012.

FIGUEIREDO, A.C. Probabilidade condicional : um enfoque de seu ensino-aprendizagem.


2000. 158 f. Dissertação (Mestrado em Educação Matemática) – Departamento de
Educação, Pontifícia Universidade Católica de São Paulo, São Paulo, 2000. Disponível
em:
https://sapientia.pucsp.br/bitstream/handle/11214/1/Auriluci%20C%20Figueiredo.pdf .
Acesso em: 09 abr. 2021.

O HOMEM que mudou o jogo | Trailer legendado | Em exibição nos cinemas. Por Sony
Pictures Brasil. [ S. I.: s. n. ], 31 jan. 2012. 1 vídeo (2 min). Disponível em:
https://www.youtube.com/watch?v=BumI-Yh0P1M . Acesso em: 02 maio 2020.

PAULINO, C. D. et al . Estatística bayesiana . 2. ed. Lisboa: Fundação Calouste


Gulbenkian, 2018.

SALSBURG, D. Uma senhora toma chá... : como a estatística revolucionou a ciência no


século XX. Rio de Janeiro: Zahar, 2009.

https://student.ulife.com.br/ContentPlayer/Index?lc=ah6S3dYyOO%2f9O%2f%2bKDvR7aw%3d%3d&l=Bjzsg1k27CxP54jKr1GmRQ%3d%3d&… 38/38

Você também pode gostar