Você está na página 1de 12

Probabilidade e

Estatística

UNIDADE 3
3ª UNIDADE

DISCIPLINA: PROBABILIDADE E ESTATÍSTICA

Palavras do professor

Olá, aluno! Vamos iniciar mais uma unidade. Bom estudo!

Variáveis aleatórias discretas

Em nosso tópico anterior, já conhecemos a ideia de variável aleatória. Esse é um dos conceitos mais
importantes da estatística. Podemos definir de modo simples, que uma variável aleatória é uma variável
quantitativa cujo resultado depende de fatores aleatórios, ou seja, que nós não podemos controlar.

Um exemplo simples é o lançamento de um dado de seis faces. Sabemos todas as possibilidades de re-
sultados que podem acontecer {1, 2, 3, 4, 5 ou 6}, mas não temos como saber qual dos valores aparecerá
antes de jogarmos o dado.

Sempre que temos uma variável aleatória, temos associada a essa variável uma distribuição de probabi-
lidades. Essa distribuição é uma descrição da probabilidade de cada um dos resultados de uma variável
aleatória. Podemos fazer essa representação usando um gráfico, uma tabela ou uma fórmula.

Vamos saber mais sobre as variáveis aleatórias? Existem dois tipos. As discretas são aquelas que têm um
número finito de valores, como o exemplo do dado em que só temos seis possibilidades de resultados, ou
um conjunto infinito enumerável, que é aquele em que podemos contar como a quantidade de carros que
passam por dia na Avenida Boa Viagem em Recife – PE.

O outro tipo de variável aleatória é a contínua. Essas variáveis possuem infinitos valores e geralmente
está associada a alguma escala de medida. Alguns exemplos de variáveis aleatórias contínuas são o vo-
lume de água perdida por dia em um sistema de abastecimento, o tempo de resposta de um sistema ope-
racional ou a quantidade de combustível que você gasta para se deslocar de sua casa até o seu trabalho.
Como exemplo, vamos montar uma distribuição de probabilidades associada a uma variável aleatória
discreta no lançamento de um dado. Para montarmos essa distribuição, precisamos responder a duas
perguntas: quais resultados podem ocorrer? Qual a probabilidade de cada resultado acontecer?

1
Valores Possíveis Probabilidade
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
Total 1

A tabela acima responde as perguntas feitas no parágrafo anterior. Na coluna da esquerda, listamos
os resultados do lançamento do dado. Na coluna da direita, listamos as probabilidades de cada um dos
resultados acontecer.

Independente do tipo de variável aleatória, todas as distribuições de probabilidade possuem duas carac-
terísticas em comum:

a)
b)

A primeira condição diz que uma probabilidade nunca pode assumir um valor negativo. A condição se-
guinte diz que quando somamos as probabilidades de todos os possíveis resultados, esse valor deve ser
igual a 1.

As distribuições de probabilidades são muito parecidas com as distribuições de frequência que vimos
anteriormente. Mas as duas têm uma grande diferença. Na distribuição de frequências, representamos
os dados que já foram observados. Já em uma distribuição de probabilidades, demonstramos os valores
possíveis de acontecer. Dessa forma, nas distribuições de probabilidade, usamos suposições teóricas
para alocar as probabilidades a cada um dos resultados e as frequências são calculadas a partir de ob-
servações efetivamente realizadas.

Existe uma terceira forma de se representar uma distribuição de probabilidades. É a chamada distribuição
de probabilidade acumulada. Ela é definida assim:

Essa expressão quer dizer que calculamos a probabilidade de todos os valores de x menores ou iguais a x.

Valor Esperado e Variância

Quando falamos em análise exploratória de dados, discutimos algumas medidas que nos ajudam a sinte-
tizar os dados, que temos a nossa disposição ao precisarmos tratar com variáveis quantitativas. Algumas
das medidas que tratamos foram à média ou valor esperado, a variância e o desvio padrão. Essas mesmas
medidas nós podemos usar para tratar com variáveis aleatórias, e com o mesmo objetivo de sintetizar
características importantes da distribuição de probabilidade.

2
Para nosso estudo, vamos considerar uma variável aleatória X e sua distribuição de probabilidades:

Valores Probabilidade
Possíveis
x1 p1
x2 p2
x3 p3
... ...
xk pk
Total 1

Sabemos que, para que possamos caracterizar uma distribuição de probabilidades discreta, precisamos
indicar todos os resultados possíveis e a probabilidade de cada um deles acontecer. A tabela acima, nos
diz essa distribuição. A média ou valor esperado de uma variável aleatória é dado pela expressão:

Esse valor esperado é obtido quando multiplicamos cada um dos valores que nossa variável aleatória pode
assumir pela respectiva probabilidade desse valor acontecer em nosso experimento aleatório. Depois de
multiplicarmos todos os valores, somamos todos os resultados dessas multiplicações.

A variância dessa variável aleatória é dada por:

Para calcularmos a variância, o processo é um pouco mais demorado. Vamos lá! Precisamos primeiro
obter o valor esperado da variável aleatória. Depois, pegamos cada um dos possíveis valores de x e dele
subtraímos o valor esperado. Essa diferença será elevada ao quadrado para que resultados com sinais
diferentes, positivo e negativo, não atrapalhem nosso estudo da dispersão dos nossos dados. Por fim,
multiplicamos esse resultado pela probabilidade de cada x acontecer. Somamos todos os resultados e
teremos a variância de nossa variável aleatória.

A outra medida que usamos é o desvio padrão e ele é definido da seguinte forma:

É a raiz quadrada da variância que calculamos acima, assim podemos obter os dois com apenas uma
operação a mais.

Vamos voltar ao exemplo do lançamento de um dado e a observação da face que fica para cima. Lem-
bramos que se o dado for honesto, ou seja, não tenha sido manipulado de alguma forma para que um
resultado seja privilegiado, temos a seguinte variável aleatória X = número obtido no lançamento de um
dado comum. A sua distribuição de probabilidades é dada pela tabela abaixo:

Valores Possíveis Probabilidade


1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
Total 1

3
Vamos usar esses dados para calcular o valor esperado e variância dessa variável aleatória:

Sugerimos como exercício, que seja calculada a variância sem elevar o valor entre parênteses ao qua-
drado. Perceba a grande diferença entre os valores. É essa diferença que poderia levar a interpretações
erradas dos dados que temos a nossa disposição.

Variáveis aleatórias independentes

Antes de partirmos para estudar alguns modelos de distribuições de probabilidade, precisamos de um


conceito muito importante que é o de variáveis aleatórias independentes. Para estudarmos esse conceito,
vamos mais uma vez usar o exemplo do lançamento de um dado. Mas agora iremos lançar esse dado
duas vezes. Em cada um dos lançamentos, temos uma variável aleatória como já estudamos. Assim, X1
= número de pontos obtido no lançamento do dado na primeira vez, e X2 = número de pontos obtido no
lançamento do dado na segunda vez. Cada um dos lançamentos segue uma distribuição conforme a tabela
do exemplo acima.

Vamos, agora, definir uma nova variável aleatória S = X1 + X2. Essa variável aleatória representa a soma
dos valores obtidos nos dois lançamentos do dado. Para caracterizarmos essa variável aleatória, precisa-
mos expressar todos os possíveis resultados de S e a probabilidade de cada um deles acontecer.

O cálculo de cada uma dessas probabilidades desses resultados é deixado como exercício para você.

Quando o primeiro lançamento é realizado, o valor de x1 pertence ao conjunto {1, 2, 3, 4, 5, 6}, mas isso
não altera a função probabilidade da variável X2, isto é, a função probabilidade de X2 permanece a mes-
ma. Isso significa que o segundo lançamento é independente do primeiro. Com isso, podemos dizer que as
variáveis aleatórias X1 e X2 são independentes.

Já quando falamos da variável aleatória S, a função probabilidade é alterada dependendo do valor que
aparecer no primeiro lançamento. Por exemplo, se x1 = 2, a distribuição de probabilidades de S se torna:

Essa alteração na função probabilidade da variável aleatória S, mostra que essa variável não é indepen-
dente da variável aleatória X1.

Como regra geral, podemos colocar que duas variáveis aleatórias são independentes se o conhecimento
de uma não altera a função probabilidade da outra. Essa é uma condição muito importante dentro de um
experimento aleatório feito numa indústria. Para podermos estudar se um processo produtivo está em
estado de controle ou não, precisamos determinar se os eventos estudados são independentes.
4
Por exemplo, queremos estudar se uma máquina está produzindo peças fora de padrão. Existe um número
esperado de peças que a máquina pode produzir fora do modelo. Se retirarmos uma peça ao acaso e a
inspecionamos para saber se está no padrão ou não e depois retiramos outra para inspeção, precisamos
ter certeza que o fato da primeira peça estar dentro ou fora do padrão não interfere no fato da segunda
peça estar ou não também nos padrões.

Principais distribuições discretas

Até agora estudamos as distribuições de probabilidades de algumas variáveis aleatórias, usando nosso
conhecimento de probabilidade para construir esses modelos. Agora, vamos estudar alguns modelos pro-
babilísticos padrões desenvolvidos para serem usados em situações práticas. Nossa maior dificuldade a
partir daqui é determinar qual o modelo mais adequado para a situação que temos que analisar. Apenas
como lembrete, no caso de uma variável aleatória discreta, precisamos saber quais são os possíveis re-
sultados para essa variável e qual a probabilidade de cada resultado acontecer.

Distribuição de Bernoulli

Os experimentos mais simples que nos deparamos, são aqueles em que precisamos determinar a pre-
sença ou não de alguma característica. Esse tipo de experimento é chamado ensaio de Bernoulli. Alguns
exemplos são: lançar uma moeda e observar se ocorre cara ou não; em uma linha de produção podemos
observar se um item tomado ao acaso é defeituoso ou não; lançar um dado e verificar se o resultado é
cinco ou não.

No caso de o resultado do ensaio apontar a presença da característica que estamos estudando, dizemos
que ocorreu um sucesso em nosso estudo. Caso a característica não esteja presente, dizemos que houve
um fracasso. Isso quer dizer que nem sempre quando obtemos um sucesso quer dizer que algo bom acon-
teceu. Vai depender de como montamos nossa variável aleatória.

Para estudarmos esses ensaios de Bernoulli, montamos uma variável aleatória X definida por X = 1, se
houver um sucesso, e X = 0, se houver um fracasso. Isso nos permite montar a seguinte tabela:

Nessa tabela p = probabilidade de sucesso. Pode-se mostrar rapidamente usando a expressão para o cál-
culo do valor esperado e da variância de uma variável aleatória discreta que o valor esperado e a variância
para uma variável aleatória Bernoulli são dados pelas expressões:

E(X) = p e V(X) = p(1 – p)

5
Distribuição Binomial

A distribuição binomial é definida através de uma série de ensaios de Bernoulli. Precisamos de um número
fixo de tentativas ou de ensaios a serem realizados. Cada uma dessas tentativas deve ser independente
entre si, ou seja, a ocorrência de um resultado em determinada tentativa não pode alterar a função pro-
babilidade da tentativa seguinte; como temos uma série de ensaios de Bernoulli, cada tentativa deve ter
seus resultados classificados em apenas duas categorias que chamamos de sucesso e fracasso; a proba-
bilidade de sucesso deve ser a mesma em cada tentativa.

A nossa variável aleatória é montada de acordo com o número de sucessos obtidos na série de ensaios.
Assim, X = número de sucessos em n ensaios realizados. Alguns exemplos são:

a) lançar uma moeda cinco vezes e observar o números de caras nesses lançamentos;
b) tomar ao acaso dez itens de uma linha de produção e testar se são defeituosos.

Toda variável aleatória com distribuição binomial tem dois parâmetros a serem usados: n = número de
ensaios que são realizados e p = probabilidade de ocorrer um sucesso em cada ensaio. Representamos
uma variável aleatória com distribuição binomial como a soma de n variáveis aleatórias com distribuição
de Bernoulli. Assim,

X = X1 + X2 + ... +Xn

Cada um desses Xi terá valor 1 ou valor 0, dependendo se ocorrer sucesso ou fracasso. Com isso, a soma
dos Xi irá corresponder à quantidade de sucessos nos n ensaios que realizamos em nosso estudo. Vamos
exemplificar o estudo que fazemos das variáveis aleatórias com distribuição binomial usando um exemplo
presente em Barbetta P. A. Estatística para Cursos de Engenharia e Informática. Editora Atlas. 3ª edição.

Confira!

Exemplo 1: uma indústria processadora de suco classifica os carregamentos de laranja


que chegam as suas instalações em A, B ou C. Vamos supor a independência entre as
chegadas dos carregamentos. Isso significa que a classificação de um não altera a clas-
sificação dos demais carregamentos que chegam à instalação. Supomos também que
a probabilidade p de ser classificado na classe A, é a mesma para todo carregamento.
Para os próximos quatro carregamentos, seja X a variável aleatória que o número de
carregamentos classificados na classe A. Vamos calcular as probabilidades de X assu-
ma o x, isto é, a probabilidade de que x carregamentos sejam classificados na classe
A (x = 0, 1, 2, 3, 4).

Em cada carregamento, consideramos um sucesso (S) quando ele for classificado na


classe A e fracasso (F) quando for classificado em qualquer outra classe. Vamos estudar
como cada um dos valores de x pode se distribuir ao longo dos carregamentos.

Vejamos; aluno!

6
Para x = 0: Nesse caso, existe uma única possibilidade, precisamos ter quatro fracas-
sos para ter x = 0. Assim, a configuração fica (FFFF). Como cada um dos carregamentos
tem uma probabilidade 1 – p de ser classificado em uma classe diferente de A e os
eventos são independentes, temos que P(x = 0) = (1 – p)4.

Para x = 1: Nessa configuração, temos apenas um sucesso em todos os quatro carre-


gamentos. Ocorre que esse sucesso pode acontecer no primeiro carregamento, ou no
segundo, terceiro ou quarto carregamento. Assim, temos quatro configurações possí-
veis para essa situação: (SFFF); (FSFF); (FFSF); (FFFS). Todas levam a um mesmo valor de
probabilidade P(x = 1) = 4p(1 – p)3. A parcela p que aparece é por conta do sucesso que
ocorre. As outras três parcelas de 1 – p são por conta dos três fracassos que ocorrem e
o valor quatro é o número de configurações que podem ocorrer nessa situação.

Para x = 2: Agora temos dois sucessos e dois fracassos nos quatro carregamentos, ou
seja, dois dos carregamentos são classificados na classe A e os outros dois não estão
nessa classe. Vamos montar as possíveis configurações dessa situação: (SSFF); (SFSF);
(SFFS); (FSSF); (FSFS); (FFSS). Assim, a probabilidade de x = 2 tem duas parcelas de su-
cesso (p) e duas parcelas de fracasso (1 – p) e pode ocorrer de seis formas diferentes,
logo P(x = 2) = 6p2(1 – p)2.

Para x = 3: Aqui temos uma situação parecida com x = 1, a diferença é que agora te-
mos apenas um fracasso e três sucessos. Então, três dos quatro carregamentos serão
classificados na classe A. as configurações que temos para essa situação são: (SSSF);
(SSFS); (SFSS); (FSSS). A probabilidade dessa situação fica então: P(x = 3) = 4p3(1 – p).

Para x = 4: Nesse caso, temos quatro sucessos, ou seja, os quatro carregamentos


seriam classificados na classe A. Temos apenas uma configuração em que isso pode
acontecer (SSSS). A probabilidade desse caso é dada por: P(x = 4) = p4.

Podemos resumir essas probabilidades na tabela abaixo:

x P(x)
0 (1 - p)4
1 4p(1 - p)3
2 6p2(1 - p)2
3 4p3(1 - p)
4 p4

Precisamos chamar a atenção agora para um detalhe muito importante. Perceba que
para calcular a probabilidade do evento X = x, em que x é um possível valor da variável
aleatória X, precisamos saber de quantas maneiras esses sucessos podem aparecer em
todos os n ensaios que fazemos. Esse número de maneira que podemos combinar os x
sucesso em n ensaios, é chamado de coeficiente binomial.

7
Esse número de combinações tem uma representação e uma forma de cálculo especial.
Vamos representar o número de combinações pelo símbolo. Nessa representação quer
dizer que estamos combinando x elementos em uma sequência de n elementos com
x ≤ n. A forma de calcularmos essa combinação é:

Esse ponto de exclamação representa o chamado fatorial de um número. Ele é calcula-


do pelo produto n! = n(n – 1)(n – 2)...1. Como exemplo, o fatorial 3 é: 3! = 3 x 2 x 1 = 6.
Por definição o fatorial 0! = 1.

Vamos mostrar que os coeficientes que aparecem nas probabilidades do exemplo aci-
ma podem ser calculados pela fórmula da combinação.

x = 0:

Sugerimos a você que use a expressão do coeficiente binomial para confirmar os outros
valores obtidos no exemplo.

Assim, podemos criar uma expressão geral para o cálculo de probabilidades de variá-
veis aleatórias que sigam uma distribuição binomial com parâmetros n e p.

Exemplo 2: vamos voltar ao exemplo 1 para alguns cálculos utilizando a distribuição


binomial. Considere que, historicamente, 30% dos carregamentos são classificados na
classe A. Podemos tomar essa proporção como a probabilidade de sucesso em um
carregamento ser classificado na classe A. Assim, temos p = 0,3. Agora, nos próximos
quatro carregamentos vamos calcular a probabilidade de dois serem classificados na
classe A.

Nossa distribuição binomial tem os seguintes parâmetros n = 4 e p = 0,3. Estamos


interessados na probabilidade de x = 2. Assim,

Fazendo x = 2:

Pode-se mostrar rapidamente usando a expressão para o cálculo do valor esperado e


da variância de uma variável aleatória discreta que o valor esperado e a variância para
uma variável aleatória Binomial são dados pelas expressões:

E(X) = np e V(X) = np(1 – p)

Seria interessante que você realizasse esses cálculos para mostrar que as expressões
acima são válidas para a distribuição binomial.

8
Exemplo 3: Dados históricos de produção de uma indústria mostram que 5% dos itens
de um fornecedor apresentam algum tipo de defeito. Considerando um lote com 20
peças, calcule as seguintes probabilidades:

a) Haver algum item com defeito no lote;


b) Haver exatamente dois itens defeituosos no lote;
c) Haver mais de dois itens defeituosos no lote;
d) Qual é o número esperado de itens defeituosos no lote?
e) E de itens bons?

Solução: vamos definir nossa variável aleatória x = número de peças defeituosas no


lote. Em nosso exemplo, temos um experimento binomial com n = 20 e p = 0,05. Com
esses dados e usando a função probabilidade da distribuição binomial, podemos calcu-
lar as probabilidades pedidas no enunciado do exemplo.

a) Haver algum item com defeito no lote; nesse caso, isso quer dizer que estamos inte-
ressados em saber se há pelo menos um item com defeito em nosso lote P(x ≥ 1). Isso
é o mesmo que calcularmos 1 – P(x = 0). Esse recurso evita que tenhamos que calcular
todas as probabilidades para de x = 1 até x = 20 e somarmos os resultados.

Usando a fórmula da probabilidade para a binomial:

b) Haver exatamente dois itens defeituosos no lote; aqui podemos usar diretamente a
fórmula da binomial, pois queremos encontrar um valor de probabilidade para x e não
um intervalo. Queremos encontrar P(x = 2):

c) Haver mais de dois itens defeituosos no lote; nessa situação estamos interessados
em saber qual a probabilidade de x ser igual a 3 ou 4 ou 5 ou, ... ou 20. Precisaríamos
calcular todas essas probabilidades e somar todos os seus resultados. Contudo, pode-
mos usar uma forma alternativa que é usando o complementar completar do conjunto
que estamos trabalhando. Temos que

P(x > 2) = 1 – P(x ≤ 2). Novamente usando a fórmula da binomial:

d) Qual é o número esperado de itens defeituosos no lote? Para sabermos o número


esperado, podemos usar o valor esperado de nossa variável aleatória x. Assim, pode-
mos fazer:

Número esperado de peças defeituosas no lote = E(X) = np = 20 . 0,05 = 1 peça.

e) E de itens bons?

Já que no item anterior conseguimos estimar o número de peças defeituosas que espe-
ramos ter em nosso lote, podemos usar esse número para estimar, também, o número

9
de peças não defeituosas, ou seja, que estão boas para serem aproveitadas em nossa
produção. Já que esperamos ter uma peça defeituosa, também podemos esperar ter 19
peças não defeituosas no lote.

Distribuição de Poisson

Em várias situações nas empresas, estamos interessados no número de ocorrências de um determinado


evento em um período de tempo ou espaço específico. Por exemplo, podemos estar interessados no nú-
mero de clientes de uma rede de fast food atendidos por hora ou no número de defeitos que conseguimos
constatar em uma chapa de aço, recém saída do seu processo de formação.

Se nos estudos desses eventos, as duas propriedades abaixo forem verificadas, dizemos que nossa
variável aleatória X, que representa a quantidade de eventos em certo intervalo de medição, segue uma
distribuição de Poisson:

1. A probabilidade de ocorrência de um evento é a mesma para dois intervalos de mesmo com-


primento.
2. A ocorrência ou não ocorrência de um evento em um intervalo é independente da ocorrência ou
não ocorrência em qualquer outro intervalo.

Quando essas duas propriedades são verificadas, nossa variável aleatória X indica o número de ocorrên-
cia do evento em certo intervalo. A probabilidade de x ocorrências em um intervalo é dada pela expressão:

Não existe um limite superior para a aplicação da expressão acima. Assim, a função probabilidade é apli-
cável para valores de x = 0, 1, 2, 3, 4,... É claro que quanto maior o valor de x, menor será a probabilidade
p(x). Logo, em aplicações práticas, valores muito altos de x vão nos conduzir a valores de probabilidade
tão pequenos que serão desprezíveis em nossa análise.

Não será feita uma demonstração aqui, mas é possível provar que para uma variável aleatória x com
distribuição de Poisson:

E(X) = V(X) =

Ou seja, o valor esperado e a variância dessa variável aleatória têm o mesmo valor e esse valor é o mesmo
do parâmetro da distribuição.

Exemplo 1, retirado do livro: Estatística Aplicada à Administração e Economia. Sweeney, D. J. Cengage,


6ª Ed. Vamos supor que estamos interessados no número de carros que chegam a um caixa automático
de um banco, em um período de 15 minutos, nas manhãs de fins de semana. Se considerarmos que a
probabilidade de um carro chegar é a mesma para quaisquer dos dois períodos de mesma duração, e que
o fato de carros chegarem ou não chegarem a um período não interfere na chegada ou não de carros em
outro período. A função de probabilidade de Poisson pode ser aplicada nessa situação. Analisando dados
históricos de atendimento, um analista estimou que o número médio de carros que chegam ao caixa auto-
10
mático em um período de 15 minutos é 10. O gerente do banco pergunta ao analista qual a probabilidade
de cinco carros chegarem ao caixa em 10.

A nossa variável aleatória x = número de carros que chegam a um período qualquer de 15 minutos. Para
essa variável aleatória a função de probabilidade é:

A probabilidade de x = 5:

Exemplo 2: Suponha que as consultas em um banco de dados ocorrem de forma independente e aleató-
ria, com uma taxa média de = 3 consultas por minuto. Vamos calcular a probabilidade de que ocorram
menos de três consultas no próximo minuto.

Esse exemplo tem uma característica um pouco diferente do exemplo anterior, em que estávamos inte-
ressados em calcular a probabilidade de que x fosse igual a 5. Nesse exemplo, queremos a probabilidade
de que nossa variável aleatória x = número de consultas a um banco de dados não seja maior que três.
Como começamos a contar x a partir do 0, os únicos valores que podem ser usados para calcular as pro-
babilidade nesse caso são x = 0, x = 1 e x = 2.

Chegamos ao final do guia 3. Agora você pode aprofundar os estudos visitando a biblioteca virtual. Não
se esqueça de resolver as atividades e participe também do fórum da unidade!

11