Você está na página 1de 44

Universidade Regional do Cariri (URCA)

Abril/2022

Aula 02
DISCIPLINA: ESTATÍSTICA
PROF: AMANDA DUARTE FEITOSA

1
Distribuição uniforme
A distribuição uniforme é um dos modelos discretos mais simples. Ela descreve uma variável
aleatória com um número finito de valores inteiros de a a b. Isto é, a distribuição inteira
depende somente de dois parâmetros a e b.

2
Experimentos de Bernoulli
Um experimento aleatório que tem somente dois resultados possíveis é chamado experimento
de Bernoulli, em homenagem a Jakob Bernoulli (1654-1705). Denominamos arbitrariamente um
dos eventos de “sucesso” (denotado X = 1) e o outro de “fracasso” (denotado X = 0). A
probabilidade de sucesso é denotada por p (a letra grega “pi”, que não deve ser confundida com
a constante matemática 3,14159).1 A probabilidade de fracasso é 1 – p, de modo que as
probabilidades somem 1, isto é, P(0) + P(1) = (1 – p) + p = 1.

3
A probabilidade de sucesso p pode ser qualquer valor entre 0 e 1.

O único parâmetro necessário para definir uma distribuição de Bernoulli é p. Um experimento


de Bernoulli tem média p e variância p(1 - p), como vemos nas definições de E(X) e V(X):

4
Características da distribuição binomial
Os experimentos ou ensaios de Bernoulli levam a um modelo importante e mais interessante. A
distribuição binomial ocorre quando um ensaio de Bernoulli é repetido n vezes.
Cada ensaio de Bernoulli é independente e a probabilidade de sucesso p permanece constante
em cada ensaio. Em um experimento binomial, estamos interessados em X = o número de
sucesso em n ensaios, tal que a variável aleatória binomial X seja a soma de n variáveis
aleatórias Xi de Bernoulli independentes:

5
6
Exemplo
Considere uma oficina especializada em trocas rápidas de óleo. É importante para esse tipo
de negócio assegurar que o tempo de trabalho em um carro não seja considerado “demorado”
por um cliente. Assim sendo, para estudar esse processo, podemos definir tempos de serviço
como demorado ou não demorado, e definir a variável aleatória X como o número de carros
que demoraram do total de carros atendidos. Além disso, supomos que os carros são
independentes entre si e que a probabilidade de um carro demorar permanece a mesma para
cada um. Baseado em nosso conhecimento do processo, sabemos que P(carro demorar) = p =
0,10. Agora, pense em cada carro como um ensaio de Bernoulli e vamos aplicar a distribuição
binomial. Suponha que gostaríamos de saber a probabilidade de que exatamente dois dos
próximos 12 carros atendidos demorarem. Nesse caso, n = 12, e queremos conhecer P(X = 2).

7
8
Como é o caso de qualquer distribuição discreta de probabilidade, as probabilidades
somam 1.
Isto é, P(0) + P(1) + P(2) + P(3) + P(4) = 0,4096 + 0,4096 + 0,1536 + 0,0256 + 0,0016 = 1

9
Eventos compostos
Um evento composto é expresso utilizando uma desigualdade. Considere o evento de que uma
amostra de quatro pacientes contenha, no máximo, dois pacientes sem cobertura médica. A
probabilidade desse evento seria expressa como P(X ≤ 2). Podemos adicionar os valores FDP
apresentados a seguir:

10
Diagramas para ilustrar eventos

11
Aplicações binomiais
A distribuição binomial conta com cinco características principais:

• Há um número fixo de ensaios (n).


• Há apenas dois resultados para cada ensaio: sucesso ou fracasso.
• A probabilidade de sucesso para cada ensaio (p) permanece constante.
• Os ensaios são independentes entre si.
• A variável aleatória (X) representa o número de sucessos.

12
Processos de Poisson
A distribuição de Poisson descreve o número de ocorrências de um evento dentro de uma
unidade de tempo (por exemplo, minuto ou hora) escolhida aleatoriamente ou espaço (por
exemplo, metros quadrados ou quilômetros lineares). Para se usar a distribuição de Poisson, os
eventos devem ocorrer aleatória e independentemente no espaço ou em tempo contínuo.
Referiremo-nos ao “tempo” contínuo desde que a aplicação mais comum para a Poisson seja
modelar chegadas por unidade de tempo. Cada ponto (•) é uma ocorrência do evento de
interesse.

13
Seja X o número de eventos por unidade de tempo. O valor de X é uma variável aleatória que
depende de quando a unidade de tempo foi observada. Em geral, chamamos a distribuição de
Poisson de modelo de chegadas (de clientes, de defeitos, de acidentes). As chegadas podem ser
adequadamente consideradas como eventos de Poisson, se os eventos forem independentes.
Por exemplo:
• X = número de clientes chegando ao caixa eletrônico de um banco em um dado minuto.
• X = número de infecções por vírus em servidores de um centro de processamento de dados
durante um período de 24 horas.
• X = número de chegadas de pacientes com asma em dada hora em um consultório.

14
O modelo de Poisson tem somente um parâmetro denotado por λ (a letra grega lambda)
representando o número médio de eventos por unidade de tempo ou espaço. A unidade de
tempo deve ser curta o suficiente para que a taxa média de chegadas não seja muito grande
(geralmente, λ < 20).
Por essa razão, a distribuição de Poisson algumas vezes é chamada de modelo de eventos raros.
Se a média for grande, podemos reescalar a unidade de tempo para obter uma média menor.
Por exemplo, λ = 90 eventos por hora é o mesmo que λ = 1,5 eventos por minuto. Entretanto, o
modelo de Poisson funciona para qualquer λ, desde que suas suposições sejam satisfeitas.

15
Características da distribuição de Poisson
A média da distribuição de Poisson é λ, e seu desvio padrão é a raiz quadrada da média. A
simplicidade das fórmulas de Poisson torna o modelo atraente (mais fácil do que a binomial, por
exemplo). Ao contrário da binomial, X não tem um limite evidente, isto é, o número de eventos
que podem ocorrer em uma dada unidade de tempo não é limitado. Entretanto, as
probabilidades Poisson se aproximam de zero conforme aumenta X, de modo que o intervalo de
valores efetivo é, em geral, pequeno. A constante e (a base do sistema logarítmico natural) é
aproximadamente 2,71828

16
17
18
19
Eventos compostos
As probabilidades acumuladas podem ser calculadas pela soma das probabilidades individuais
de X. Por exemplo, a probabilidade de que, no máximo, dois clientes cheguem em um dado
intervalo de tempo é a soma das probabilidades para diversos eventos:

Podemos, posteriormente calcular a probabilidade de pelo menos três clientes (o evento


complementar):

20
Aplicações da Poisson
A distribuição de Poisson tem quatro características principais.
• Um evento de interesse ocorre aleatoriamente no tempo ou no espaço.
• A taxa de chegada λ permanece constante.
• As chegadas são independentes umas das outras.
• A variável aleatória (X) representa o número de eventos dentro de um intervalo de tempo ou
espaço observado.

21
Exemplo
1. Encontre a média e o desvio padrão para cada distribuição de Poisson:
a. λ = 1
b. λ = 2
c. λ = 4
2. Calcule cada uma das probabilidades Poisson:
a. P(X = 2), λ = 0,1
b. P(X = 1), λ = 2,2
c. P(X = 3), λ = 1,6

3. Calcule a probabilidade para cada evento composto:


a. P(X ≤ 3), λ = 4,3
b. P(X > 7), λ = 5,2
c. P(X < 3), λ = 2,7

22
4. O número médio de itens pedidos (tais como, uma bebida ou uma sobremesa) por um cliente
de um restaurante, como complemento de sua refeição é de 1,4. Esses itens são chamados de
itens adicionais. Defina X como o número de pedidos adicionais feitos por um cliente selecionado
aleatoriamente. (a) Justifique o uso do modelo de Poisson. (b) Qual é a probabilidade de que um
cliente selecionado aleatoriamente solicite, pelo menos, dois itens adicionais? (c) Não solicite
nenhum item adicional?

23
DISTRIBUIÇÃO HIPERGEOMÉTRICA
A distribuição hipergeométrica é semelhante à binomial exceto que a amostragem é sem
reposição de uma população finita com N itens. As retiradas não são independentes, mas a
probabilidade de sucesso permanece constante de uma retirada para a outra. A distribuição
hipergeométrica tem três parâmetros: N (o número de itens na população), n (o número de
itens na amostra) e s (o número de sucessos na população). A distribuição de X (o número de
sucessos na amostra) é hipergeométrica.

24
25
DISTRIBUIÇÃO GEOMÉTRICA
A distribuição geométrica está relacionada com a Bernoulli. Ela descreve o número de ensaios
de Bernoulli até que o primeiro sucesso seja observado. Mas o número de ensaios não é fixo.
Definimos X como o número de ensaios até o primeiro sucesso, e p como a probabilidade
constante de um sucesso em cada ensaio. A distribuição geométrica depende somente de p (isto
é, um modelo uniparamétrico).
Ela é sempre assimétrica à direita. Pode ser mostrado que as probabilidades da geométrica
somam 1 e que a média e o desvio padrão são aproximadamente os mesmos quando p é
pequeno. As probabilidades diminuem conforme X aumenta, mas não rapidamente.

26
27
VARIÁVEL ALEATÓRIA CONTÍNUA
Uma distribuição de probabilidade pode ser descrita tanto por sua função densidade de
probabilidade (FDP) quanto por sua função de distribuição acumulada (FDA). Para uma variável
aleatória contínua, a FDP é uma equação que mostra a altura da curva f(x) para cada possível valor
de X. Qualquer FDP contínua deve ser não negativa e a área sob a FDP inteira deve ser 1. A média,
a variância e a forma da distribuição dependem da FDP e de seus parâmetros. A FDA é denotada
F(x) e mostra P(X ≤ x) a área acumulada à esquerda de um dado valor de X. A FDA é útil para
probabilidades, enquanto a FDP revela a forma da distribuição.
As curvas da FDP e FDA são suaves, sendo que a FDP representa a densidade de probabilidade dos
pontos ao longo do eixo X. A FDA mostra a probabilidade acumulada de velocidades, aproximando-
se gradualmente de 1, conforme X se aproxima de 90. Nessa ilustração, a distribuição é simétrica e
tem a forma de um sino (normal ou Gaussiana) com média de 75 e desvio padrão de 5

28
29
Probabilidades como áreas
Com variáveis aleatórias discretas, tomamos somas de probabilidades em grupos de pontos.
Mas funções de probabilidade contínuas são curvas suaves, de modo que a área em qualquer
ponto seria zero. Em vez de somar probabilidades, consideramos áreas sob curvas. Em termos
de cálculo, diremos que P(a < X < b) é a integral da função densidade de probabilidade f(x) no
intervalo de a até b. Como P(X =a) = 0, a expressão P(a < X < b) é igual a P(a ≤ X ≤ b).

30
Valor esperado e variância
A média e a variância de uma variável aleatória contínua são calculadas de maneira análoga a
E(X) e Var(X) para uma variável aleatória discreta, exceto que o símbolo da integral ∫ substitui o
símbolo Ʃ da soma.
As integrais são tomadas sob todos os valores de X. A média ainda é o ponto de equilíbrio ou
centro de gravidade da distribuição inteira, e a variância ainda é uma medida de
dispersão ao redor da média.
A média ainda é uma média de todos os valores de X ponderados
por suas respectivas probabilidades, e a variância ainda é uma média ponderada de todos os
quadrados dos desvios em relação à média. O desvio padrão é a raiz quadrada da variância.

31
32
Características da distribuição uniforme
A distribuição uniforme contínua talvez seja o modelo mais simples que possa ser imaginado. Se
X é uma variável aleatória que é uniformemente distribuída entre a e b, sua FDP tem altura
constante. A distribuição uniforme contínua é algumas vezes denotada resumidamente por U(a,
b).

33
34
Distribuição normal
A distribuição normal ou gaussiana, assim chamada em homenagem ao matemático alemão
Karl Gauss (1777-1855), tem sido mencionada várias vezes. Sua importância se deve ao papel
principal em nossa discussão de modelos contínuos. A distribuição normal de probabilidade é
definida por dois parâmetros.

35
36
O que é normal?
A distribuição normal é especialmente importante como distribuição amostral para estimação e
teste de hipóteses. Para ser considerada candidata à normalidade, uma variável aleatória deve:
• Ser medida em uma escala contínua.
• Possuir clara tendência central.
• Ter somente um pico (unimodal).
• Exibir caudas que se afinem.
• Ser simétrica em relação à média (caudas iguais).
Quando o intervalo de variação for grande, frequentemente tratamos a variável discreta como
contínua. Por exemplo, os pontos em exames são discretos (variam de 0 a 100), mas são
frequentemente tratados como dados contínuos.

37
Características de uma normal padrão
Uma vez que existe uma distribuição normal diferente para cada valor da média e desvio padrão,
frequentemente transformamos a variável subtraindo a média e dividindo pelo desvio padrão
para produzir uma variável padronizada (que agora estamos falando sobre a distribuição
populacional em vez dos dados amostrais).
Se X é normalmente distribuída a variável padronizada Z tem uma distribuição normal
padrão com média 0 e desvio padrão 1, denotada por N(0; 1). O pico de f(z) ocorre em 0 (a
média) e seus pontos de inflexão são em ± 1 (o desvio padrão). A forma da distribuição não é
afetada pela transformação z.

38
39
Ex: calcular P(0 < Z < 1,96)

40
P(0 < Z < 1,96) = 0,5000 − P(0 < Z < 1,96) = 0,5000 − 0,4750 =
0,0250

41
Uma área central tal como P(-1,96 < Z < +1,96)

P(-1,96 < Z < +1,96) = P(-1,96 < Z < 0) + P(0 < Z < 1,96)
= 0,4750 + 0,4750 = 0,9500

42
Exemplo
1. Encontre a área da distribuição normal padrão para cada uma das seguintes probabilidades,
mostrando seu raciocínio claramente e indicando qual tabela você usou.
a. P(-1,22 < Z < 2,15) b. P(-3,00 < Z < 2,00) c. P(Z < 2,00) d. P(Z = 0)
2. A produção diária da refinaria de Marathon’s Garyville, Lousiana, é normalmente distribuída com
média de 232 mil barris de óleo cru por dia, com desvio padrão de 7 mil barris. (a) Qual é a
probabilidade de se produzir em ao menos 232 mil barris? (b) E entre 232 mil e 239 mil barris? (c) E
menos que 239 mil barris? (d) E menos que 245 mil barris? (e) E mais que 225 mil barris?
3. Assuma que o número de calorias em um Egg McMuffin do McDonald’s é uma variável aleatória
normalmente distribuída com média de 290 calorias e desvio padrão de 14 calorias. (a). Qual é a
probabilidade de que uma determinada porção contenha menos de 300 calorias? (b) Mais de 250
calorias? (c) Entre 275 e 310 calorias?

43
4. O tempo exigido para verificar e preencher uma prescrição médica numa farmácia é
normalmente distribuído com uma média de dez minutos e um desvio padrão de três minutos.
Encontre o(s) tempo(s) para cada evento. Apresente o seu trabalho
a. 10% mais demorados; b. 50% centrado; c. 80% mais demorado; d. 10% mais demorado
5. O score de crédito de pessoas com 35 anos que procuram um financiamento na empresa
Americana tem distribuição normal com média de 600 e um desvio padrão de 100. a. Encontre
o score de crédito que define os 5% superiores. b Qual é o valor que 75% dos clientes têm score
de crédito maior? c. Em qual faixa estaria o percentual central de 80% dos scores de crédito?

44

Você também pode gostar