Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTATÍSTICA
2010
Capítulo 6- O conceito de Probabilidade
2
Capítulo 6
O conceito de Probabilidade
6.1 Propósito
Apresentar o conceito de probabilidade de um evento nas suas perspectivas
clássica, frequencista e axiomática. Formalizar o conceito de independência entre eventos.
Introduzir a formulação de Bayes e suas aplicações para o cálculo de probabilidades.
6.2 Meta
Ao final deste capítulo o aluno estará capacitado a verificar se uma função dada é
uma probabilidade e a calcular a probabilidade de eventos diversos, incluindo-se a
determinação da dependência ou não entre eventos. Estará também capacitado a utilizar o
método de Bayes para calcular probabilidades baseado no conceito de probabilidade
condicional.
6.3 Introdução
Vimos anteriormente que a incerteza sobre muitos aspectos da realidade motivou o
desenvolvimento da estatística como um método para orientar decisões e resolver problemas. A
estatística se baseia no conceito de acaso, ou aleatoriedade, que é um conceito abstrato, uma
opção metodológica. Um modelo estatístico não está, necessariamente, imputando a aleatoriedade
como uma propriedade do fenômeno em estudo. A objetividade ou não do acaso é uma discussão
de natureza filosófico-científica.
3
causas finais dos fenômenos. Para ele, o objetivo da ciência é descobrir as relações entre os
fenômenos. Um de seus discípulos, Bruno de Finetti, 1906 -1985, apoiando-se nas idéias de
Thomas Bayes, 1701-1761, as quais se tornaram conhecidas graças a Richard Price, 1723-1791,
elaborou uma teoria probabilística e um método de inferência – a inferência bayesiana. Para de
Finetti, um evento é um caso único que ocorreu ou vai ocorrer, ou ainda não ocorreu, nem vai
ocorrer. Para ele, é somente isto que pode ser observado, não havendo espaço para nenhuma
outra noção. A um nível de informação (para um indivíduo, ou coletividade) um evento pode ser
certo, possível ou impossível.
George Matheron, 1930-2000, engenheiro, da Escola de Minas de Paris, que desenvolveu
importantes aplicações da teoria das funções aleatórias a problemas no espaço n-dimensional, ao
se referir à aleatoriedade dos fenômenos, prefere dizer que tudo se passa como se o fenômeno
fosse devido ao acaso. Mas se recusa a admitir que o acaso tenha uma ação decisiva sobre o
curso dos eventos. Rejeitando, assim, que a evolução genética, por exemplo, pudesse ser
explicada pela força do acaso. Identificar a incerteza sobre determinado evento com a
aleatoriedade é um equívoco comum, mesmo em exemplos típicos de livros introdutórios sobre
probabilidade, como os jogos de dados ou roleta. Pois se dispuséssemos de todos as condições
iniciais, assim como os modelos dinâmicos, poderíamos prever o resultado do jogo. Os jogos de
azar que motivaram, no século XVI, as primeiras fórmulas do cálculo de probabilidades, são
abstrações da realidade. Matheron prefere falar de modelo probabilístico e de sua correspondência
objetiva. Por outro lado, ainda que a repetição de um experimento, rigorosamente, não consiga
gerar exatamente os mesmos eventos, a diferença entre estes eventos é mínima, de medida nula
se utilizarmos a linguagem da teoria da medida. Portanto, a idéia de repetibilidade pode se aplicar,
contrariando assim a exclusividade de cada evento observado, que municia a argumentação do
enfoque Bayesiano.
Karl Popper, 1902-1994, tem uma importante contribuição para a definição de objetividade
de um enunciado científico. Desdobrando-os em singulares e universais. Os enunciados singulares
referem-se a eventos particulares cuja ocorrência pode ser comprovada ou não. Os enunciados
universais, por outro lado, referem-se a eventos cuja comprovação exigiria infinitas experiências ou
observações – leis da física, por exemplo, mas, ao contrário de um evento metafísico, pode, a
qualquer momento, ser desmentido por uma experiência, ou corroborado por ela. A linha de
demarcação entre os enunciados metafísicos e os objetivos ou empíricos é o critério de
falseabilidade, segundo o qual os enunciados científicos são aqueles que podem ser submetidos à
verificação. Neste sentido a objetividade é um conceito operatório regular, reproduzível e
mensurável segundo uma escala.
No leste europeu e na União Soviética, o materialismo dialético inspirou o pensamento
científico até a dissolução do regime. Andrei Nikolaevich Kolmogorov, 1903-1987, de origem
humilde, chegou à Universidade de Moscou em 1920 onde passou boa parte de sua carreira,
sendo considerado um dos maiores matemáticos e probabilistas do século XX. Concebeu uma
formulação matemática para a noção de evento e de probabilidade baseada na teoria da medida.
Esta formulação é consensual tanto para estatísticos objetivistas como subjetivistas. A formulação
matemática para a teoria das probabilidades é considerada também como a única teoria adequada
para tratar a incerteza, em oposição a outros métodos matemáticos e computacionais, como é o
caso da matemática nebulosa (fuzzy). Os princípios sobre os quais a teoria das probabilidades foi
edificada remontam a Galileu (1564-1642), que, embora, não se dedicando a esta teoria, formulou
sua essência. São eles a fórmula clássica para a probabilidade, os princípios da soma e do
produto, e a idéia de convergência.
4
Definição 6.2 Espaço amostral é a coleção dos resultados possíveis, numéricos ou não, da
realização de um experimento ou observação.
i) A, B ∈ X ⇒ A ∩ B ∈ X
ii ) A ∈ X ⇒ Ac ∈ X
∞
iii ) Ai ∈ X , i = 1, ∞ ⇒ U Ai ∈ X
i =1
#A
P( A) = ; A⊂Ω
#Ω
Aonde # é a cardinalidade do conjunto.
A motivação para esta definição é óbvia e pode ser facilmente verificada nos experimentos
relacionados a jogos de azar tais como dados, roleta, baralho, etc. A coerência da definição é
ainda assegurada pelo fato de que a imagem inversa de quaisquer subconjuntos de números
inteiros corresponde a um subconjunto do espaço amostral.
5
A definição clássica de probabilidade supõe que os resultados do experimento tenham
igual chance e que o número de resultados possíveis seja finito. Daí é óbvia a conclusão de que a
probabilidade de sortear uma determinada face no lançamento de um dado seja igual a 1/6, porém
para calcular a probablidade de um evento “A” mais complexo, a contagem dos elementos de
“A“ requer, em muitos casos, a ajuda da combinatória. Vimos no capítulo 2 a importância da
amostragem para levantar informações sobre uma dada população.
São óbvias as limitações da definição, algumas tentativas foram feitas para aumentar sua
abrangência através do conceito de definição geométrica de probabilidade, na qual se identificam
os eventos e o espaço amostral a figuras geométricas, de dimensão qualquer, e, ao invés de
contar elementos, o que seria impossível de toda forma, calcula-se a área ou o volume, definindo-
se a probabilidade de um evento como a razão entre sua área (volume) e a área (volume) do
espaço amostral. A primeira dificuldade da abordagem é a identificação entre o experimento e sua
formulação geométrica, o que pode ser não trivial para experimentos mais complexos, podendo
levar a diferentes valores de probabilidades para o mesmo evento.
O paradoxo de Bertrand
Uma corda é escolhida ao acaso em um círculo. Qual a probabilidade de que o seu comprimento
exceda o lado do triângulo eqüilátero inscrito no círculo?
Solução 1 – Devido à simetria podemos escolher qualquer direção para a corda. Determinando um
diâmetro perpendicular a esta corda, é óbvio que somente as cordas que interceptarem este
diâmetro entre um quarto e três quartos do seu comprimento excedem o lado do triângulo
eqüilátero. Portanto, a probabilidade seria igual a 1/2.
Solução 2 – Novamente recorrendo à simetria podemos fixar uma das extremidades da corda. A
tangente ao círculo neste ponto, juntamente com os lados do triângulo eqüilátero inscrito no
o
círculo, tendo por um dos vértices, justamente, o ponto de tangência, formam três ângulos de 60
cada. Ora, somente as cordas que estão contidas no ângulo do meio excederão em comprimento
ao lado do triângulo. Donde, a probabilidade igual a 1/3!
Solução 3 - A corda está especificada, desde que o seu ponto médio esteja. Considerando um
novo círculo concêntrico com o primeiro, com a metade do raio, sabe-se que toda corda, cujo ponto
médio pertença a este círculo, terá comprimento maior que o lado do triângulo eqüilátero. Levando
a um novo resultado: ½!
P( A) ≥ 0
P ( Ω) = 1
A ∩ B = ∅ ⇒ P( A ∪ B) = P( A) + P( B)
O conjunto de propriedades acima foi concebido como um conjunto axiomático de
propriedades que uma função deveria satisfazer para poder ser uma probabilidade. A ferramenta
principal para a construção de probabilidades nos casos em que o paradigma clássico não se
aplica é a variável aleatória, que será vista mais adiante.
6
O Problema da agulha de Buffon
Um plano é particionado por retas paralelas, a intervalos regulares iguais a 2a. Uma agulha de
comprimento 2l (l<a) é jogada casualmente sobre o plano. Qual é a probabilidade de que a agulha
intercepte uma das retas?
Solução – Seja x a distância do centro da agulha à reta mais próxima e ϕ o ângulo formado pela
agulha com a reta. Estas duas medidas determinam a posição da agulha. Os intervalos de
variação são respectivamente [0,a] e [0,π]. A condição necessária e suficiente para a agulha
interceptar a reta é que x l senϕ.
A probabilidade (geométrica) é então dada pela razão entre as áreas do evento sobre a área do
espaço amostral
∫ l sin ϕ dϕ
0 2l
P= =
aπ aπ
Apesar do enunciado ingênuo, o problema envolve a determinação do comprimento de bombas em
problemas de bombardeio.
a1) P( A) ≥ 0
a 2) P(Ω) = 1
∞ ∞
a3) Ai ∩ Aj = ∅ ⇒ P(U Ai ) = ∑ P( Ai )
i =1 i =1
6.5 Exercícios
7
2. Considere uma urna com bolas numeradas de 1 a 100 (números inteiros). Determine a
probabilidade de sortear um número que seja ou ímpar ou começado por cinco ou terminado por
três. O número cinco satisfaz e o número três também.
3. Sejam A, B e C três eventos relativos a um espaço amostral. Exprima os eventos abaixo, usando
operações de união, interseção e complementação.
5. Em um baralho com 52 cartas, 3 cartas são sorteadas ao acaso. Ache a probabilidade de que
exatamente um ás seja sorteado.
7. Em um jogo de poker determine a probabilidade para cada uma das situações seguintes, onde
cinco cartas estão com um jogador:
a) exatamente um par (duas cartas de igual valor + três cartas de valores distintos)
b) exatamente um trio (três cartas de igual valor + duas cartas de valores distintos)
c) full house (um par e um trio)
d) flush (todas as cartas do mesmo naipe, inclui-se o straight flush)
e) royal flush ( straight flush com a seqüência de 10, valete, rainha, rei e ás)
6.6 Respostas
1.
a) Ω = {(x,y)|1≤x≤6;1≤y≤6,xεΖ,yεΖ}
b) A = {(x,y)| 2≤x+y≤8;1≤x≤6;1≤y≤6,xεΖ,yεΖ}
c
c) A = {(x,y)| 8<x+y≤12;1≤x≤6;1≤y≤6,xεΖ,yεΖ}
2.
Vamos representar o evento formulado como uma união de eventos:
8
3.
c
a) (A∩C)∩B
c c c
b) A ∩B ∩C
c) ∅
d) (A∪C)∩B
4.
a)
Como um indivíduo só pode ter um tipo sanguíneo
P(O) = P(Ω) - P(A) - P(B) - P(AB) = 1 – 0,2 – 0,1 – 0,05 = 0,65
c c
b) P(B ∩ AB ) = P(A) + P(O) = 0,2 + 0,65 = 0,85
5.
O espaço amostral é constituído por todas as combinações de 52 cartas, 3 a 3.
O evento desejado – de que somente um às seja sorteado é dado pelo produto das combinações
4 48
1 2
= 0, 2042
52
3
de 4 ases, 1 a 1, pelas combinações das 48 cartas restantes 2 a 2. Aplicando-se então a definição
clássica de probabilidade tem-se o resultado.
6.
À probabilidade calculada anteriormente vamos somar (regra da soma) as probabilidades de
4 48 4 48
2 1
= 0,0130 3 0 = 0, 0002
52 52
3 3
sortear pelo menos dois ases e três ases, obtendo-se 0,2174.
7.
Considerando que um baralho tem 52 cartas existem 2.598.960 combinações diferentes de 52
cartas cinco a cinco. Há ainda 13 valores de face de 2 a 10 mais valete, rainha, rei e ás. Os naipes
são quatro: espadas, copas, ouro e paus.
a) O valor de um par pode ser sorteado de 13 maneiras diferentes, como existem 4 naipes as
seqüências podem ser compostas por combinações de 4 naipes dois a dois. Os três valores
distintos podem ser sorteados por combinações de 12 valores 3 a 3. Os naipes para estes
3
valores distintos podem ser sorteados de 4 maneiras distintas. Aplicando-se o princípio do
produto e a fórmula clássica da probabilidade, obtém-se o valor desejado
4 12
13 × × × 43
2 3 ≅ 0, 42
52
5
9
b)
Temos 13 valores para trios vezes combinações por 4 naipes diferentes. Restam combinações
2
4 12 4
13 × × ×
1 2 1 ≅ 0, 021
52
5
dos 12 valores restantes, 2 a 2, vezes as combinações de 4 naipes ao quadrado.
c)
Temos 13 valores para pares vezes combinações de 4 naipes , 2 a 2. Restam 12 valores para trios
vezes combinações de 4 naipes, 3 a 3.
4 4
13 × × 12 ×
2 3 ≅ 0, 0014
52
5
d)
Temos 4 escolhas de naipe vezes combinações de 13 valores 5 a 5
13
4×
5 ≅ 0, 0020
52
5
e)
Temos 4 escolhas de naipe
4
≅ 0, 000002
52
5
10
Definição 6.6 Probabilidade Condicional de um evento H dado que o evento D ocorreu
P( H ∩ D)
P( H | D) = ; se P( D) ≠ 0
P( D)
P( H | D) = P( H ); se P( D) = 0
Observe que foi colocada uma alternativa de definição para o caso de P(D) =0.
Contrariamente ao caso clássico, no qual P(D) =0 é equivalente a D=∅, para espaços amostrais
infinitos podemos ter P(D)=0 e D diferente de ∅.
Duas fórmulas úteis para o cálculo de probabilidades se deduzem da definição 7.6, a
fórmula do produto:
P( A ∩ D) = P( A | D) P( D) (6.1)
E a fórmula da soma, que para ser aplicada supõe uma partição do espaço amostral, isto
é, uma coleção finita de conjuntos Ai, disjuntos dois a dois, e cuja união é o espaço amostral. Para
esta partição e um evento A qualquer se tem que:
n n
P( A) = ∑ P( A ∩ Ai ) = ∑ P( A | Ai ) P( Ai ) (6.2)
i =1 i =1
Exemplo 6.2 Um restaurante popular apresenta apenas dois tipos de refeições: salada completa
ou um prato à base de carne; 20% dos fregueses do sexo masculino preferem salada; 30% das
mulheres escolhem carne; 75% dos fregueses são homens. Considere os seguintes eventos:
H: freguês é homem A: freguês prefere salada
M: freguês é mulher B: freguês prefere carne
Calcular:
a) P(H) , P(A|H) , P(B|M) ; b) P(A ∩H) , P(A)
O item a) visa verificar a compreensão dos dados do enunciado. É muito comum o iniciante
confundir a probabilidade condicional com a probabilidade da interseção. Obviamente P(H)=0,75,
já P(A|H)= 0,2 e P(B|M)=0,3 porque os porcentuais ou proporções em ambos os casos não se
aplicam sobre a totalidade dos clientes, mas sobre os homens e as mulheres, respectivamente.
O item b) visa verificar a compreensão das fórmulas 7.1 e 7.2. Pela 7.1, P(A
∩H)=P(A|H) P(H) = 0,2 x 0,75 = 0,150 .Analogamente para P(A∩M)=0,175. Dado que os eventos H
e M são uma partição do espaço amostral constituído pelos clientes do restaurante, podemos
aplicar a fórmula 7.2 para calcular P(A) = P(A ∩H) + P(A ∩M) = 0,150 + 0,175= 0,325 .
P(A|B) =P(A)
P(A∩B) =P(A)P(B)
11
É comum o estudante identificar eventos disjuntos como sendo independentes. Entretanto é
exatamente o contrário! Pois se A e B forem disjuntos, P(A∩ B)=0 e, no entanto P(A)P(B) ≠ 0 em
geral.
Exemplo 6.3
Basta verificar se P(A∩B) =P(A)P(B), como P(A∩B) = 0,04 ≠ P(A)P(B) = 0,1 X 0,12 = 0,012,
então concluímos que não são independentes.
P( D | H ) × P( H )
P( H | D) = (6.3)
P( D)
A dedução é imediata.
Os termos desta fórmula recebem denominações particulares que explicam a sua utilidade:
P(D|H) é a verossimilhança, ou o impacto dos dados sobre H. Um baixo valor desta probabilidade
reflete o fato de que as chances de H são baixas, e vice-versa.
P( D | H j ) × P( H j ) n
P( H j | D) = n
; aonde H i ∩ H j = ∅; U H i = Ω (6.4)
∑ P( D | H ) × P( H )
i =1
i i
i =1
Neste caso há várias hipóteses concorrentes sendo consideradas. A dedução é muito fácil,
bastando observar que o denominador é igual a P(D) e o numerador a P(D ∩ Hj).
Exemplo 6.4
Retomando o enunciado do exemplo 6.2 determine P(M|A)
12
Pela fórmula 7.4 , P(M|A) = P(A|M)xP(M) / (P(A|M)xP(M)+P(A|H)xP(H)) =
0,70x0,25 / (0,70x0,25 + 0,20x0,75) = 0,54
Uma forma usual de expressar uma probabilidade é através da razão de chances, muito
utilizada em apostas de torneios. Por exemplo, o time A tem o dobro das chances do time B. Esta
forma não implica na determinação das probabilidades respectivas de A ou B ganharem, mas
apenas da chance relativa entre elas. A razão de chances também pode ser enunciada para a
c
ocorrência de um evento A e o seu complemento A :
c
o(A)=P(A)/P(A ) (6.4)
6.10 Exercícios
d) P(A∪Na∪Nu) =
1 c
e) P(A-Nu | Bran ) =
c c
f) P(Nu | Bran ) =
2. Dois sinais de duração T < ½ cada, são transmitidos por um canal de rádio durante um
intervalo de tempo (0,1); cada um deles começa a ser transmitido com a mesma probabilidade em
qualquer instante do intervalo (0, 1-T). Se os sinais não se interceptarem eles são transmitidos
com sucesso, senão eles se interferem totalmente. Calcule a probabilidade de que eles sejam
transmitidos com sucesso.
3. Uma indústria tem três máquinas, A1, A2 e A3 que produzem, respectivamente, 50%%,
30% e 20% do número total de eixos que fabrica. A porcentagem de produtos defeituosos
oriundos destas máquinas é 3%%, 4% e 5% respectivamente. Tomando base estas informações,
calcule as seguintes probabilidades:
1
A – Nu é a notação para A∩Nuc
13
a) Se um eixo é escolhido ao acaso, qual é a probabilidade do mesmo não ser defeituoso?
b) Seja um eixo escolhido ao acaso e que é defeituoso. Qual a probabilidade de ter sido produzido
pela máquina A1 ou A3?
c) Se o eixo não for defeituoso, qual a probabilidade de ter sido produzido pela máquina A1?
4. Se 30% dos empregados de uma fábrica são fumantes, qual a probabilidade de que haja
exatamente dois fumantes para uma amostra aleatória simples com reposição com 5
observações? (considere todas as amostras possíveis)
6.11 Respostas
c c c
1. a) P(D ∩A ∩Na ) = P(Nu ∪ Bran ∪ Bras) = [P(Nu)+P(Bran)+P(Bras)] = 0,51
c c
b) P(D ∪Bras ) = 1 – P(D∩Bras) = 1
c c c c
c) P(D | Bras ) = P(D ∩ Bras ) / P(Bras ) = P(D) / P(Bras ) = 0,40 / 0,70 = 0,57
d) P(A∪Na∪Nu) = P(A) + P(Na) + P(Nu) = 0,05 + 0,04 + 0,01 = 0,10
c c c c c) c c
e) P(A-Nu | Bran ) = P[(A∩Nu )∩Bran ] / P(Bran ) = P(A∩Bran / P(Bran ) = P(A) / P(Bran ) =
0,05 / 0,80 = 0,063
c c c c c
f) P(Nu |Bran ) = P(Nu ∩Bran )| P(Bran ) = [1 – P(Nu∪Bran)] / (1 – P(Bran)) = 0,79/0,80=0,99
2.
Representando o espaço amostral dos instantes iniciais de duas chamadas em um sistema de
eixos coordenados pelo quadrado de lado 1 – T, aonde T é o instante inicial da chamada, e cada
eixo representam um usuário. O interesse é nas chamadas que não se interferem, ou seja, aquelas
que, quando uma começa a outra já terminou, o que pode ser derivado da condição:
|x – y| ≥ T que dá origem aos dois triângulos hachureados
x – y = T e –x + y = T
1 -T 1- 2T
T 1-2T
T 1-T
14
2
As áreas destes 2 triângulos correspondem a 2 x [(base x altura)/2] = base x altura = (1 – 2T)
2
A área do quadrado que corresponde ao tamanho do espaço amostral é (1 – T)
2 2
Então a probabilidade de duas chamadas serem transmitidas com sucesso é (1 – 2T) /(1 – T) .
3.
Denotando
A1: peça produzida pela máquina 1
A2: peça produzida pela máquina 2
A3: peça produzida pela máquina 3
D: peça defeituosa
a)
P(D) = P(A1∩D) + P(A2∩D) + P(A3∩D) = P(A1) x P(D| A1) + P(A2) x P(D| L2) + P(A3) x P(D| L3) =
0,5x0,03 + 0,3x0,04 + 0,2x0,05 = 0,037.
c
Logo P(D ) = 0,963 ou 96,3% .
b)
P( A1 ∩ D) P( A3 ∩ D)
P( A1 ∪ A3 | D) = P( A1| D) + P( A3 | D) = + =
P( D) P( D)
c)
P( D | A1) × P( A1) 0, 03 × 0,50
P( A1| D) = = = 0, 41
P( D) 0, 037
4.
O número de combinações possíveis é dado por:
5 5!
= = 10
2 2!3!
Para cada uma delas a probabilidade é:
(0,3)2 × (0, 7)3
O que dá 0,31.
5.
Completando os totais marginais
QI /Mão Direita Esquerda QI
Alto 190 10 200
Normal 1710 90 1800
Mão 1900 100 2000
15
b) P(QI alto | canhoto) = (10/2000) / (100/2000) = 0,1
6.12 Conclusão
O conceito axiomático de probabilidade só foi consolidado em meados do século XX o que
em termos de história da ciência é bastante recente. Por outro lado, sua interpretação ainda divide
a comunidade entre objetivistas e subjetivistas, levando a metodologias distintas de inferência.
Neste texto, estamos nos atendo à abordagem axiomática, embora tenhamos dado ênfase à seção
dedicada ao teorema de Bayes, que inspirou a escola subjetivista, também conhecida como
bayesiana.
6.13 Resumo
i) A, B ∈ X ⇒ A ∩ B ∈ X
ii ) A ∈ X ⇒ Ac ∈ X
∞
iii ) Ai ∈ X , i = 1, ∞ ⇒ U Ai ∈ X
i =1
#A
P( A) = ; A⊂Ω
#Ω
Aonde # é a cardinalidade do conjunto.
a1) P( A) ≥ 0
a 2) P(Ω) = 1
∞ ∞
a3) Ai ∩ Aj = ∅ ⇒ P(U Ai ) = ∑ P( Ai )
i =1 i =1
P( H ∩ D)
P( H | D) = ; se P( D) ≠ 0
P( D)
P( H | D) = P( H ); se P( D) = 0
16
Dois eventos A e B são independentes se e somente se (s.s.s)
P(A|B)=P(A)
P( D | H ) × P( H )
P( H | D) =
P( D)
P( D | H j ) × P( H j ) n
P( H j | D) = n
; aonde H i ∩ H j = ∅; U H i = Ω
∑ P( D | H ) × P( H )
i =1
i i
i =1
17