Você está na página 1de 58

DISTRIBUIÇÕES CONTÍNUAS

 Considere a variável aleatória contínua X em que definimos a


função f(x) denominada função densidade de probabilidade e
que tem as seguintes propriedades:
 A probabilidade da variável aleatória X é sempre definida
num intervalo de valores dessa variável X, por exemplo,
(x1, x2).
 A probabilidade da variável aleatória X é medida pela área
sob a curva da função densidade f(x) num determinado
intervalo.
 A área total sob a curva f(x) é igual a um ou 100%.
 O valor f(x) da função densidade não mede a
probabilidade do valor x da variável aleatória X.
VA Contínua
 Para a variável aleatória contínua X que assume valores do
conjunto dos números reais há uma função matemática f(x) com
as seguintes premissas:
 A função densidade de probabilidade f(x) é sempre positiva,
para todo x pertencente a X.
 A área sob a função f(x) entre os limites menos infinito e mais
infinito da variável aleatória contínua X é igual a um ou 100%:


f ( x ) dx  1

 A probabilidade da VA contínua X dentro do intervalo (a, b) com


ambos limites incluídos é medida pela área definida pela função
f(x) entre os limites a e b:
b

P ( a  x  b )  f ( x ) dx
a
 Um ponto f(x) da função densidade não é a probabilidade do
valor x da variável aleatória X, pois, por exemplo, o ponto f(x=a)
da função densidade é zero.
 Como deve-se representar os limites do cálculo da probabilidade
de uma variável aleatória contínua dentro do intervalo (a, b),
P(aXb) ou P(a<X<b)?
 As duas podem representações podem ser utilizadas,
incluindo a representação com limites mistos, por exemplo:
P(aX<b) ou P(a<Xb)!
 Neste livro utilizaremos a representação P(aXb).
Valor Esperado e Variância
DISTRIBUIÇÃO UNIFORME
 Uma distribuição de variável aleatória contínua é a distribuição
uniforme cuja função densidade de probabilidade é constante
dentro de um intervalo de valores da variável aleatória X.
 Cada um dos possíveis valores que X com distribuição uniforme
pode assumir tem a mesma probabilidade de ocorrer.
DISTRIBUIÇÃO NORMAL

 A distribuição normal é uma das distribuições fundamentais da


moderna teoria estatística.
 A vantagem da distribuição normal reside na facilidade de defini-
la com apenas dois parâmetros, a média  e o desvio padrão 
da distribuição, por exemplo, a curva da distribuição normal f(x)
para =40, =10 e valores da variável aleatória no intervalo (10,
70) é mostrada na Figura 8.4.
 Uma das características importantes é que a partir desses dois
parâmetros será possível calcular, por exemplo, a percentagem
de valores que deverão estar acima ou abaixo de um
determinado valor da variável aleatória, ou entre esses dois
valores definidos etc.
 Analisando a fórmula da função densidade f(x) podemos verificar
que para cada par de parâmetros  e  há uma curva diferente
de f(x), ou que para qualquer outro par de parâmetros  e , a
curva f(x) será diferente.
 Portanto, não há apenas uma única distribuição normal, e sim
uma família de distribuições normais representadas como
N(,).
INFLUÊNCIA DOS PARÂMETROS

 O que ocorreria com a forma da distribuição normal N(40, 10) se


o valor da média for mudado de 40 para 50?
 A forma da distribuição permaneceria a mesma, porém com a
média deslocada de 40 para 50 e definindo a nova distribuição
normal N(50, 10).
 No intervalo C3:C4, é possível mudar os parâmetros da curva de
cor azul registrando novos valores.
 Entretanto, os parâmetros da curva vermelha são mudados
acionando um dos dois controles giratórios por vez, células E3 e
E4.
 Observe que ao variar o valor da média de 40 para 50,
mantendo constante o desvio padrão =10, a distribuição normal
mantém sua forma e se desloca para a direita.
 Da mesma maneira, para valores de média menores que 40, por
exemplo =30, a distribuição manterá sua forma e se deslocará
para a esquerda de =40.
Variando o Desvio Padrão
 Para analisar o comportamento da forma da distribuição normal
variando o desvio padrão, lembremos primeiro o significado do
desvio padrão apresentado no Capítulo 4.
 A terceira regra prática estabelece que, em todas as
distribuições, a porcentagem de valores contidos dentro de
três desvios padrões ao redor da média será próxima de
100%.
 Como a distribuição normal é simétrica ao redor da média, seja
qual for o valor do desvio padrão, praticamente 100% dos valores
da variável aleatória estarão contidos dentro de três desvios
padrões ao redor da média.
 Se na distribuição normal N(40, 10) o desvio padrão for mudado
para 15, a forma da curva N(40, 15) será mais aberta que a
anterior N(40, 10), diminuindo sua altura para manter a área de
100%. Da mesma maneira, pode-se verificar que para desvios
padrão menores que 10, a distribuição diminui sua base e
aumenta sua altura.
CÁLCULO DE PROBABILIDADE

 A probabilidade P(aXb) de a variável aleatória contínua X ser


igual ou maior que a e, ao mesmo tempo, menor ou igual a b é
obtida da área definida pela função f(x) entre os limites a e b,
sendo b>a.
 O procedimento de cálculo passa pela integração da função f(x)
no intervalo (a,b), procedimento bastante trabalhoso.
Resultados Importantes da DN
 A fórmula da função densidade f(x) mostra que para cada par de
parâmetros  e  há uma curva diferente de f(x), ou para
qualquer outro par de parâmetros  e  a curva f(x) será
diferente.
 Embora não haja apenas uma única distribuição normal e sim
uma família de distribuições normais representadas com N(,),
elas mantêm algumas propriedades em comum, como, por
exemplo, a porcentagem de resultados ao redor da média.
Um desvio padrão ao redor da média
 Qual a percentagem de valores dentro de um desvio padrão ao
redor da média 200 da variável aleatória X com distribuição
normal N(200, 10)?
 Nesse caso, um valor de X incluído no intervalo de um desvio
padrão ao redor da média deve estar no intervalo (190, 210).
 A probabilidade de um valor da variável aleatória X estar dentro
de um desvio padrão ao redor da média é P(190X210)=0,6827
ou 68,27%.
 Esse resultado mostra que 68,27% dos valores da variável X
com distribuição normal se distribuem no intervalo de um
desvio padrão ao redor da média.
 Ou que a probabilidade de um resultado do experimento com
distribuição N(200, 10) pertencer ao intervalo (190, 210) é
68,27%.
Dois desvios padrão ao redor da média
 Qual a percentagem de valores da variável X com distribuição
normal N(200, 10) localizados dentro de dois desvios padrão ao
redor da média?
 Um valor de X incluído no intervalo de dois desvios padrão ao
redor da média deve estar no intervalo (180, 220).
 A probabilidade de um valor da variável aleatória X estar dentro
de dois desvios padrão ao redor da média é
P(180X220)=0,9545 ou 95,45%
 Esse resultado mostra que 95,47% dos valores da variável X
com distribuição normal se distribuem no intervalo de dois
desvios padrão ao redor da média.
 Ou que a probabilidade de um resultado do experimento com
distribuição N(200, 10) pertencer ao intervalo (180, 220) é
95,45%.
Três desvios padrão ao redor da média
 Qual a percentagem de valores da variável X com distribuição
normal N(200, 10) localizados dentro de três desvios padrão ao
redor da média?
 Um valor de X incluído no intervalo de dois desvios padrão ao
redor da média deve estar no intervalo (170, 230).
 A probabilidade de um valor da variável aleatória X estar dentro
de três desvios padrão ao redor da média é
P(170X230)=0,9973 ou 99,73%
 Esse resultado mostra que 99,73% dos valores da variável X
com distribuição normal se distribuem no intervalo de três
desvios padrão ao redor da média.
 Ou que a probabilidade de um resultado do experimento com
distribuição N(200, 10) pertencer ao intervalo (170, 230) é
99,73%.
MODELO DA DISTRIBUIÇÃO NORMAL
 O gráfico da distribuição normal f(x) construído na planilha
Modelo Distribuição Normal inclui a representação dos
intervalos dos três tipos de desvios padrão.
 Com os controles giratórios, são informados os valores da média
na célula C3 e o desvio padrão na célula C4 e, ao mesmo
tempo, a planilha recalcula a tabela do intervalo B6:C31 de
acordo com o tipo de probabilidade escolhida na caixa de grupo:
 f(x). Fornecerá o valor da função f(x) para o valor x.
 Probabilidade acumulada até x. Fornecerá a probabilidade
acumulada de menos infinito até x.
 A variável aleatória desvio padrão normalizado Z de uma
distribuição normal padronizada é definida pela expressão:
X 
Z 

 A nova variável Z realiza cálculos de probabilidades com uma
única curva de distribuição denominada distribuição normal
padronizada N(0, 1).
 Depois da transformação da variável, a função densidade f(x)
passa a ser: Z 2
1
f (Z )  e 2
2
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3

O valor da probabilidade P(Z1,24) pode ser obtido


com a função DIST.NORMP do Excel para a
distribuição normal padronizada e também com a
Tabela Z.
Tabela Z
 A curva da distribuição Z tem a mesma forma que a curva da
distribuição X, com a mudança dos valores do eixo X para o
eixo Z.
 Sugerimos que você tente visualizar a mesma curva de
distribuição normal com os dois eixos X e Z.
 Como há diversos cálculos de probabilidade, a tabela
seguinte apresenta o resumo dos procedimentos de cálculo
de probabilidade utilizando a tabela da distribuição normal
padronizada Z.
OUTROS CÁLCULOS COM a DN
 O objetivo dos exemplos de distribuição normal apresentados
até este momento foi o cálculo da probabilidade de que ocorra
um determinado evento sendo conhecidos os parâmetros da
distribuição normal, a média e o desvio padrão.
 Há outros problemas com a distribuição normal, por exemplo, o
cálculo inverso e a determinação dos parâmetros da distribuição
normal a partir de constatações práticas.
Exemplo
 Jota afirma que está entre os 5% maiores vendedores da
empresa, pois seu total de vendas no ano passado foi de
$1.350.000. Considerando que as vendas de todos os
vendedores têm a distribuição normal N($1.250000, $100.000),
verificar se a afirmação do vendedor Jota é correta.

5% maiores
vendedores

-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3


Solução
 Os 5% maiores vendedores da empresa estão localizados no
final da cauda superior da distribuição normalizada.
 Qual o valor Z1 que verifica a relação P(ZZ1)=5%? Como a
tabela não tem registrada essa parte da área da curva,
deveremos procurar a probabilidade complementar 0,95 obtida
como resultado da diferença (1-0,05).
 Procurando no miolo da Tabela Z verificamos que o valor 0,95
não coincide com nenhum dos valores registrados na Tabela Z,
portanto, será necessário realizar uma interpolação.
 Como o valor 0,95 situa-se entre 0,9495 (Z=1,64) e 0,9505
(Z=1,65), interpolando entre esses valores obtém-se
Z=1,645, que corresponde à probabilidade P(Z1,645)=0,05.
 Com os dados disponíveis, a N($1.250000, $100.000) e o
valor Z=1,645, calculamos o valor de venda mínimo x
correspondente a 5% dos maiores vendedores, utilizando a
fórmula do desvio padrão normalizado Z:
x   x  $ 1 . 250 . 000
Z    1,645
 $ 100 . 000
 O valor de venda mínimo x correspondente a 5% dos maiores
vendedores é x=$1.414.500, com a fórmula:
x  1,645  $ 100 . 000  $ 1 . 250 . 000  $ 1 . 414 . 500
 Concluindo, para pertencer ao grupo dos 5% maiores
vendedores da empresa, seria necessário vender pelo menos
$1.414.500. Como o vendedor Jota vendeu $1.350.000, ele não
pertence ao grupo dos 5% maiores vendedores.
 Como exercício adicional, verifique que o salário de Jota está no
grupo dos 15,87% maiores vendedores da empresa, resultado
obtido pelo cálculo direto da probabilidade a partir do valor de
vendas anuais, P(X1.350.000)=0,1587.
 Como ajuda, o valor de vendas de Jota está a um desvio
padrão da média da distribuição.
 Os registros históricos da loja mostram que a demanda mensal
do sabonete especial Alfa tem distribuição normal com média
2.400 e desvio padrão 230.
 Como o valor médio do ticket de compra desses compradores é
o mais alto da loja, o gerente quer garantir que 99% dessas
vendas sejam atendidas.
 Calcular o estoque que a loja deve ter no início de cada mês.
 Como costuma ocorrer, o diretor de novos projetos necessita,
para ontem, a estimativa preliminar do valor do investimento do
lançamento do novo produto.
 Quando pergunta ao gerente de novos projetos da empresa, que
tem muita experiência na avaliação desse tipo de projeto
bastante freqüente na empresa, ele responde que a estimativa
do investimento se situa entre $1.500.000 e $2.000.000, com
50% de probabilidade de acerto.
 Qual o valor dos parâmetros dessa distribuição considerando
que a variável investimento tem distribuição normal?
 Para definir o preço unitário de um novo produto, o gerente do
produto costuma analisar dois cenários, um otimista e o outro
pessimista. No caso do novo detergente em cubos para máquina
de lavar louças ele definiu:
 O preço do cenário otimista de $25 por pacote,
considerando que a probabilidade de exceder esse valor
seja de 5%.
 O preço do cenário pessimista de $18 por pacote,
considerando que a probabilidade de reduzir esse valor
seja de 5%.
 Considerando que o preço unitário tenha distribuição normal,
qual o valor dos parâmetros dessa distribuição?
 O produto farmacêutico líquido é enchido em frascos por uma
máquina automática que pode ser ajustada em qualquer volume
entre 10 e 20 centímetros cúbicos.
 O volume do produto é uma variável aleatória com distribuição
normal com desvio padrão 0,4 centímetros cúbicos. A
especificação do controle de qualidade exige que pelo menos
98% dos frascos contenham 16 centímetros cúbicos ou mais.
 Em que volume a máquina deve ser ajustada?
DISTRIBUIÇÃO EXPONENCIAL
 A distribuição exponencial é uma distribuição contínua aplicada
em muitos problemas de empresas nas áreas de serviços e
manufaturas, em geral denominados problemas de fila de
espera.
 Quando os serviços prestados por uma empresa para clientes
externos ou internos são de duração variável, a distribuição
exponencial é indicada para analisar esses experimentos; por
exemplo, a duração do atendimento do caixa de um banco ou de
postos de saúde, o tempo de operação sem interrupção de um
equipamento etc.
 A distribuição exponencial é definida pelo único parâmetro 
denominado média, que estabelece a média de chegadas por
hora, por exemplo, ou de serviços por minuto ou alguma outra
unidade de tempo.
Modelo Distribuição Exponencial
DISTRIBUIÇÃO LOGNORMAL
 A distribuição normal está presente em muitas situações.
 Por exemplo, um cabo de aço trançado utilizado num
elevador, ou alguma outra aplicação de tração, é formado
por muitos fios de aço que adequadamente entrelaçados
conferem uma forte resistência ao cabo.
 A força ou capacidade do cabo Y é a soma das
capacidades individuais dos fios de aço yi:

Y  y1  y 2  y 3    y i    y n
n
Y  y
i 1
i
 Se o número de fios n que formam o cabo for adequadamente
grande, mesmo que a distribuição da capacidade dos fios de aço
não seja normal, a distribuição da capacidade do cabo será
normal, de acordo com o Teorema Central do Limite. Esse
exemplo mostra que uma variável aleatória Y definida como a
soma de n variáveis aleatórias yi pode ser descrita com uma
distribuição normal, atendendo a alguns requisitos.
 Outra situação freqüente aparece no caso de uma variável
aleatória X definida pelo produto de n variáveis aleatórias xi,
como mostra a fórmula: X  x1  x 2  x 3    x i    x n
n
X  x
i 1
i
 Um exemplo prático da multiplicação de variáveis aleatórias é a
determinação da taxa de retorno de um ativo durante um mês,
obtido como resultado da multiplicação da variação de preços
diários desse ativo. Aplicando o logaritmo natural aos dois
membros dessa fórmula:
ln X  ln x1  ln x 2  ln x 3    ln x i    ln x n
n
ln X   ln x
i 1
i

 Se os termos do segundo membro cumprem com os requisitos


necessários, a analogia com a soma anterior é clara, podendo-
se afirmar que a variável aleatória lnX tem distribuição normal.
 Se Y=lnX, pode-se dizer que a variável aleatória Y tem
distribuição normal e a variável aleatória X tem distribuição
lognormal.
 A distribuição lognormal é muito utilizada em engenharia de
confiabilidade para descrever falhas causadas por fadiga de
material, incertezas e taxas de falhas, além de uma variedade de
outros fenômenos.
 Ainda tem a propriedade de que se duas variáveis aleatórias têm
distribuição lognormal, a função gerada pelo produto dessas duas
variáveis também terá distribuição lognormal.
 Também é bastante utilizada em opções de ativos da teoria
moderna de finanças. Por exemplo, analisando a variável aleatória
retorno de um investimento em ações:
 A relação entre o resgate e a aplicação pode ser
maior que um, sem nenhuma limitação até onde o
próprio mercado permitir.
 Entretanto, a relação entre o resgate e a aplicação
pode ser menor que um até o limite de não resgatar
nada e perder a aplicação realizada, provocando
uma distribuição de retornos assimétrica.

Você também pode gostar