Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatística
Sumário
CAPÍTULO 4 – Probabilidade...........................................................................................05
Introdução.....................................................................................................................05
Síntese...........................................................................................................................21
Referências Bibliográficas.................................................................................................22
03
Capítulo 4 Probabilidade
Introdução
Você imagina qual é a probabilidade de, ao lançar um dado, obter o número 6? E qual e a
chance de 1 entre 10 alunos de uma escola apresentar problemas de aprendizado? A partir do
cálculo de probabilidades, é possível mensurar a possibilidade de um possível desfecho ou de
ocorrer uma determinada situação. O cálculo de probabilidades aplica-se a processos aleatórios
dos quais não conhecemos o resultado a priori. O produto de dois números conhecidos é um
processo determinístico a partir do qual é possível obter um valor absoluto. O mesmo não ocorre
com o resultado do boletim do tempo para o dia seguinte, em que passamos a pensar em termos
de probabilidades.
No âmbito do serviço social, podemos estar interessados na probabilidade de evasão escolar por
bairros de um determinado município, ou na probabilidade de o número de gestantes que fumam
ser maior ou menor que um determinado valor. Para dar início aos estudos de probabilidade,
faz-se necessário apresentar alguns conceitos básicos relacionados a conjuntos. Com auxílio
dos diagramas de Venn, será possível visualizar o que é um espaço amostral e o comportamento
de variáveis dentro desse espaço. Neste estudo, você conhecerá o conceito de probabilidade e
aprenderá a calcular as chances de ocorrência de eventos.
Bons estudos!
05
Estatística
Podemos ter experimentos aleatórios com resultados aos pares, por exemplo, no lançamento
concomitante de duas moedas; nesse caso, teremos como resultado um par ordenado, S =
{(C,C),(C,K),(K,C),(K,K)}. Veja que S contém todos os resultados possíveis.
Evento
Evento é um determinado resultado contido dentro de todos os possíveis resultados de um expe-
rimento aleatório. Um evento pode ser definido como subconjunto do espaço amostral (MON-
TGOMERY, 2003). Utilizando o exemplo do lançamento de um dado, poderíamos estar interes-
sados na probabilidade de um resultado em particular, o de sair um número par. Nesse caso, o
evento (E) seria: E = {2,4,6}. Veja como os possíveis resultados desse experimento ficam repre-
sentados no diagrama de Venn (Figura 1).
1
S
E
2
4
3
6
5
Figura 1 – Diagrama de Venn para os possíveis resultados no lançamento de um dado com ênfase no evento E.
Fonte: Elaborada pelo autor, 2015.
Probabilidade
Chama-se probabilidade (P) à chance de ocorrência de um evento. Esta pode ser obtida a partir
da observação de um determinado fenômeno por muitas vezes até que se descubra a probabi-
lidade do resultado esperado em relação a todos os resultados possíveis. No caso de eventos
equiprováveis, a probabilidade é calculada por meio da seguinte equação.
ne
P(E) =
n
3
P(E) = = 0,5 ou 50%
6
A probabilidade de obter um número ímpar após o lançamento de um dado não viciado é igual
a 0,5 ou 50%. E qual seria a probabilidade de se retirar uma carta de paus em um baralho de
52 cartas?
Nesse caso, ne é o número de cartas de paus do baralho (13) e n é o número total de cartas do
baralho (52), então teremos:
13
P(E) = = 0,25 ou 25%
52
Variável aleatória
Variável aleatória é o valor associado à medida de um parâmetro estudado em um experimento
aleatório. É uma característica numérica do resultado de um experimento (BARBETTA, 2014).
Ela pode ser discreta quando o experimento possui valores inteiros, como, por exemplo, o nú-
mero de integrantes de famílias de uma determinada localidade. Nesse caso, existem apenas
números inteiros para o evento em questão. Ou ela é contínua, em experimentos que possuem
uma infinidade de valores possíveis dentro de um determinado intervalo. Por exemplo, o peso de
um recém-nascido pode assumir qualquer valor dentro de um determinado intervalo do conjunto
dos números reais (dependendo apenas da precisão da balança).
07
Estatística
Outro exemplo é o lançamento de dois dados em que se deseja E={6,6}, esse evento será com-
posto pelos seguintes resultados:
Muito bem, agora sabemos o que são eventos compostos, mas, para o cálculo de probabilidade
de eventos compostos, precisamos primeiramente classificá-los quanto à sua dependência ou
independência.
Na primeira repetição do experimento, a probabilidade de sair uma bola azul ou amarela será de:
10
P(A) = P(B) = = 0,5 ou 50%
20
Vamos supor que na primeira realização do experimento retiramos uma bola da cor azul; note
que a quantidade de bolas azuis na caixa passará a ser 9. Portanto, na segunda repetição, a
probabilidade dos eventos se alterou para: P(A) = 9/19 = 0,47 e P(B) = 10/19 = 0,53, e essa
mudança de probabilidade acontecerá em todas repetições.
Contudo, no caso do sorteio com reposição, teremos eventos independentes, pois a proba-
bilidade de ocorrência de um não dependerá de outro. Utilizando o exemplo anterior, se, após
retirarmos uma bola da caixa, houver sua reposição antes de sortear a próxima bola, teremos
sempre a mesma proporção de bolas azuis e amarelas dentro da caixa. Assim sendo, a probabi-
lidade dos eventos não se altera pelo resultado do experimento anterior.
VOCÊ O CONHECE?
Andrei Nikolaevich Kolmogorov foi um cientista e matemático russo que axiomatizou a
teoria da probabilidade da mesma forma que a geometria foi axiomatizada por Eucli-
des (Euclides de Alexandria – 325 a.C a 265 a.C). Os axiomas foram publicados em
1933, no livro Fundamentos da teoria da probabilidade (VIALI, 2008).
Em probabilidade, veremos que a palavra “ou” denota união entre eventos, e a palavra “e”
denota intersecção entre eventos.
Dizemos que intersecção acontece quando um evento é composto pelos resultados que perten-
cem a um “e” outro evento. Representamos intersecção pelo símbolo “∩”. Para calcular a pro-
babilidade de intersecção de dois eventos, utilizamos a mesma equação do cálculo da probabi-
lidade, sendo que o número de elementos favoráveis será igual ao número de resultados contido
nos dois ou mais eventos sob intersecção.
n(A ∩ B)
P(A ∩ B) =
n
S
A B
2 5
4
3 1
União – Quando um evento é composto pelo resultado de um “ ou” outro evento – dizemos
que há união de conjuntos e o representamos pelo símbolo “U”. Para conhecer os elementos da
união, podemos somar os elementos dos dois ou mais conjuntos de interesse.
Para calcular a probabilidade da união de dois eventos de forma direta, utilizamos a equação:
Veja que, nessa equação, faz-se necessário restar o evento intersecção para não contar duas
vezes o mesmo evento. Utilizando o exemplo anterior, vamos supor que queremos saber a pro-
babilidade de obtermos um resultado par “ou” maior do que 3 (Figura 3).
09
Estatística
S
A B
2 5
4
3 1
Desse modo, obtivemos a probabilidade de obter um número par ou maior que três igual a 66%.
P(A') = 1 – P(A).
3
P(A') = 1 – P(A) = 1 – = 0,5 ou 50%.
6
1
S
A
2
4
3
6
5
Figura 4 – Diagrama de Venn para evento complementar A de números pares no lançamento de um dado.
Fonte: Elaborada pelo autor, 2015.
3. das duas marcas, há três opções de freio: tambor, disco e disco ventilado;
1. Marca
n1 = 2
HONDA YAMAHA p1 = 1/2
2. Motor
125cc 150cc 125cc 150cc n2 = 4
p2 = 1/4
3. Freio
Tambor Disco Tambor Disco Tambor Disco Tambor Disco n3 = 12
ventilado ventilado ventilado ventilado
Disco Disco Disco Disco p3 = 1/12
4. Cor
n4 = 48
p4 = 1/48
Figura 5 – Diagrama de árvore referente a diferentes opções para compra de uma moto.
Fonte: Elaborada pelo autor, 2015.
Vamos supor que se deseja conhecer a probabilidade de um cliente comprar uma moto com freio
a tambor, de 125cc da marca Honda. Para calcular essa probabilidade, basta verificar que, no
terceiro estágio da árvore, temos n3 = 12, logo:
1
P(Honda, 125cc e tambor) = = 0,083, ou seja, 8,3%.
12
Se quisermos saber qual é a probabilidade do evento: um cliente escolher uma moto vermelha,
independentemente das demais variáveis, P será:
11
Estatística
0.20
Frequência relativa
Frequência relativa
0.10
0.10
0.00
0.00
0 2 4 6 8 0 2 4 6 8
x x
(a) (b)
Figura 6 – Histograma (a) e probabilidade (b) de valores de X maiores ou iguais do que 4 (destacados em cinza).
Fonte: Elaborada pelo autor, 2015.
Para calcular a probabilidade de encontrarmos famílias com 4 ou mais integrantes, basta somar
as áreas dos retângulos que representam a frequência relativa a valores de x maiores ou iguais
a 4 – retângulos em cinza-escuro da Figura 6 (b).
P(x ≥ 4) = 0,75
De forma muito similar é possível obter probabilidades a partir de distribuições contínuas. Para
isso, basta calcular a área sob a curva e teremos a probabilidade desejada. No caso das dis-
tribuições discretas, a soma da área dos retângulos fornece a probabilidade desejada. Mas o
grande problema no caso de distribuições contínuas é saber como calcular a área de uma figura
irregular. Veja a seguir.
A distribuição normal
Pode-se dizer que a distribuição normal ou gaussiana é a distribuição mais importante da esta-
tística. Esta descreve um gráfico unimodal em forma de sino e simétrico em relação à sua média.
Figura 7 – Distribuição normal ou gaussiana, com curva unimodal e simétrica em relação à sua média.
Fonte: Elaborada pelo autor, 2015.
13
Estatística
σ = 0.5
0.5 σ=4
σ=1
0.4
Densidade f(x)
0.3
0.2
0.1
0.0
-4 -2 0 2 4
Figura 8 – Distribuições com diferentes valores de curtose, em que a linha pontilhada re-
presenta a distribuição normal padrão com desvio igual a 1 e curtose igual a 3.
Fonte: Elaborada pelo autor, 2015.
3σ 2σ σ σ 2σ 3σ
68,26%
95,46%
99,73%
Essa equação significa que, para cada valor de x calculado, obteremos um valor y correspon-
dente (f(x)) de tal modo que, ao plotar os resultados, obteremos uma curva normal. Vamos ver a
seguir porque isso é tão importante para nós. A equação possui apenas duas entradas: a média
(µ) e o desvio padrão (σ). A primeira indica a posição central da distribuição e a segunda indica
a dispersão em torno da média. A área total abaixo da curva normal é sempre igual a 1. Isso
não é fantástico? Sabendo que a área abaixo da curva normal é sempre um valor entre 0 e 1,
podemos realizar cálculos de probabilidade utilizando essa função. A área abaixo da curva nor-
mal para um determinado intervalo de valores da variável x é dado pela integral da função f(x)
nos intervalos entre x1 e x2.
Vamos supor que estamos interessados em sortear uma viagem de estudo para os alunos do
terceiro ano do ensino médio de uma escola. Qual é a probabilidade de sortear um aluno com
rendimento médio abaixo de uma determinada nota de corte? A Figura 10 apresenta a proba-
bilidade P(x<valor de corte) de sortear um aluno com rendimento médio abaixo da nossa nota
de corte.
0.4
0.3
Densidade f(x)
0.2
0.1
0.0
x
nota mais baixa nota de corte nota mais alta
Figura 10 – Área sob a curva normal para obter a probabilidade de sortear um alu-
no com rendimento médio abaixo da linha de corte P(x<nota de corte).
Fonte: Elaborada pelo autor, 2015.
15
Estatística
Como a aplicação do cálculo integral não parece muito prática para o cálculo de probabilida-
des, para tanto, usaremos a distribuição normal padrão.
x–m
Z=
σ
Esse procedimento é conhecido como padronização dos dados. Valores Z possuem distribuição
normal padrão e as áreas debaixo da curva são dadas pela Tabela Z (anexo).
O primeiro passo para identificar se nossos dados podem ser considerados normais é plotar
um histograma, polígono de frequência ou boxplot. Se o gráfico obtido for semelhante à curva
normal, podemos pensar em padronizar os dados. O segundo passo é aplicar um teste estatístico
que confirme se, de fato, é possível aproximar a distribuição de nossos dados pela distribuição
normal. Alguns desses testes são o Kolmogorov-Smirnov e Shapiro-Wilk. Mais detalhes sobre
testes estatísticos para verificação de normalidade podem ser encontrados em Devore (2011). É
importante lembrar que, se não for possível assumir a normalidade em nossos dados, tampouco
será possível realizar o cálculo de probabilidade pela curva normal e qualquer resultado obtido
não terá valia alguma.
O que acontece ao padronizar os nossos dados? O valor z fornece o número de desvios padrão
(σ) distantes da média. Vejamos, sabemos que a área total abaixo de nossa distribuição (similar
à normal) é 1, mas desconhecemos a área sob a curva em termos de desvios padrão distantes da
média. Sabemos também que a área abaixo da curva normal descrita pelos valores z novamente
é igual a 1, mas, nesse caso, os valores da área abaixo da curva em termos de desvios padrão
encontram-se tabelados. As médias das distribuições serão diferentes e o valor dos desvios tam-
bém, mas ambas as distribuições irão apresentar a mesma área relativa de um determinado
intervalo. Em outras palavras, as áreas são proporcionais e a densidade de probabilidade será
a mesma para ambas as distribuições. É por esse motivo que fazemos uso da padronização dos
dados para distribuições assumidas normais.
Vamos dar um exemplo adaptado de Devore (2011). Suponha que, a partir de uma pesquisa
sobre saúde infantil, obtivemos dados referentes ao peso, em gramas (g), das crianças de uma
determinada idade. Vamos calcular a probabilidade de sortear ao acaso uma criança com peso
menor a 6.000 g (µ = 5.000 g e σ = 500 g). Lembre-se de que consideramos a normalidade
dos dados já verificada.
0.4
0.3
Densidade f(x)
0.2
0.1
0.0
z2
-4 -2 0 2 4
z
Figura 11 – Área sob a função distribuição normal para P(Z<2) igual a 0,9772 ou 97,72%.
Fonte: Elaborada pelo autor, 2015.
Agora vamos supor que desejamos saber qual é a probabilidade de uma criança, escolhida
aleatoriamente, ter mais do que 5.500 g. Primeiramente, vamos calcular o valor de Z para x =
5.500 g:
Nosso objetivo é encontrar a probabilidade de Z assumir valores maiores do que 1, P(Z>1), en-
tão vamos encontrar a área sob a curva normal à direita de Z = 1 (Figura 12).
0.4
0.3
Densidade f(x)
0.2
0.1
0.0
z1
-4 -2 0 2 4
z
17
Estatística
A probabilidade de encontrarmos ao acaso uma criança com mais de 5.500 g é igual a 15,87%.
Agora vamos supor que crianças com peso entre 5.500 g e 6.000 g possuam tamanho ideal.
Qual é a probabilidade de encontrarmos ao acaso uma criança nesse intervalo de valores? Veja
que, nesse caso, temos interesse em descobrir a probabilidade de X assumir um valor em um
intervalo definido P(5.500<X<6.000).
0.4
0.4
0.3
0.3
Densidade f(x)
Densidade f(x)
Densidade f(x)
0.2
0.2
0.2
0.1
0.1
0.1
0.0
0.0
0.0
z2 z1 z1 z2
-4 -2 0 2 4 -4 -2 0 2 4
z z -4 -2 0 2 4
z
Pela tabela, encontramos que P(Z<1) = e P(Z<2) = 0,9772. Para encontrar P(1<Z<2), fazemos
a diferença entre as áreas:
Assim, a probabilidade de tomarmos ao acaso uma criança com peso ideal (entre 5.500 e
6.000 g) é de 13,59%.
Também é possível utilizar a área sob a curva normal padrão para identificar valores em X conhe-
cendo apenas a média e o desvio padrão. Por exemplo, um relatório apresentado por agentes de
saúde diz que a média de peso das crianças é 5.000 g (σ = 500 g) e que exames indicam que
as crianças com sobrepeso necessitam cuidados especiais. O relatório também diz que esse peso
corresponde a aproximadamente 2,3% das crianças mais pesadas. Qual seria o valor de corte
para seleção dessas crianças? O peso correspondente é igual 100% -2,3% = 97,7%. Veja que
estamos calculando o ponto que divide 97,7% dos valores inferiores dos 2,3% valores superio-
res. Recorremos à Tabela Z e buscamos o valor mais próximo a 97,7% ou 0,977. Encontramos
0,9772, e esse valor corresponde a 2 desvios padrão à direita da normal padrão. Agora pode-
mos encontrar o valor correspondente em gramas fazendo o caminho inverso à padronização:
Podemos concluir que crianças acima de 6.000 g deverão receber cuidados especiais.
Vimos que os dados raramente são normalmente distribuídos e que, para recorrer à curva nor-
mal, faz-se necessário assumir ou declarar que os dados são normais (THURMAN, 2012). Na
estatística paramétrica, presume-se que os dados apresentam algum tipo de distribuição e torna-
-se possível realizar inferências sobre seus parâmetros. No caso da distribuição normal, os parâ-
metros são a média e o desvio padrão.
19
Estatística
zp
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8621
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,8830
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9015
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9177
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9319
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9441
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9545
1,8 0,9641 0,9649 0,9656 0,9682 0,9671 0,9678 0,9686 0,9693 0,9699 0,9633
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9706
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9767
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9817
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9857
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9890
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9916
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
Tabela 1 – Valores da área sob a curva normal padrão – valores da área à esquerda de z.
Fonte: Adaptado de Instituto de Matemática de UFRJ, 2015.
• por fim, aprendeu que, quando as variáveis apresentam distribuições muito diferentes da
normal, é necessário o uso de estatística paramétrica ou realizar a transformação dos
dados utilizando, por exemplo, a metodologia Box-Cox.
21
Referências Bibliográficas
AGUIRRE, A. Uma nota sobre a transformação Box-Cox. Belo Horizonte: UFMG/Cede-
plar,1997.
AMARO, A.; SILVESTRE, C.; FERNANDES, L. Estatística descritiva. O segredo dos dados. 1. ed.
Lisboa: Editora Lulu, 2009. 114 p.