Escolar Documentos
Profissional Documentos
Cultura Documentos
Universidade de Brasília
Instituto de Ciências Exatas
Departamento de Estatística
INTRODUÇÃO À PROBABILIDADE
novembro de 2010
SUMÁRIO
1. Definições ................................................................................................................................................................ 1-2
2. Probabilidade ........................................................................................................................................................... 2-3
3. Operações entre Eventos .......................................................................................................................................... 3-5
4. Axiomas da Teoria das Probabilidades .................................................................................................................... 4-5
5. Álgebra das Probabilidades ..................................................................................................................................... 5-5
5.1. Propriedades para a probabilidade de ocorrência de A e B: ........................................................................... 5-5
5.2. Propriedades para a probabilidade da ocorrência de A ou B: ........................................................................ 5-5
5.3. Probabilidade Condicional ............................................................................................................................. 5-7
5.4. Teorema de Bayes ............................................................................................. Erro! Indicador não definido.
5.5. Exercícios ....................................................................................................................................................... 5-8
6. Distribuições de Probabilidade ................................................................................................................................ 6-9
6.1. Variáveis aleatórias ........................................................................................................................................ 6-9
6.2. Distribuição ou modelo de probabilidade ...................................................................................................... 6-9
6.3. Valor esperado ............................................................................................................................................... 6-9
6.4. Distribuição Binomial .................................................................................................................................. 6-10
6.5. Distribuição Normal ..................................................................................................................................... 6-11
6.6. Exercícios ..................................................................................................................................................... 6-14
Índice de Figuras
As origens matemáticas da probabilidade remontam ao século XVI. Aplicada inicialmente em estudos sobre
jogos de azar, jogadores ricos aplicavam o conhecimento da teoria das probabilidades para planejar estratégias de
apostas. Hoje em dia, a utilização da teoria das probabilidades ultrapassou de muito o contexto dos jogos. Governos,
empresas e organizações a incorporam em várias situações. Por exemplo, a previsão de demanda de um novo produto,
cálculo estimado dos custos de produção, previsão do malogro ou sucesso de safras agrícolas, compra ou venda de
apólices de seguro, contratação de um novo empregado, preparo de orçamentos, o impacto de algum pacote econômico
sobre a inflação.
É possível notar a importância da teoria de probabilidades no desenvolvimento de estratégias e tomadas de
decisão. Independente de qual seja a aplicação em particular, muitas vezes há presença de um elemento de imprecisão
(ou acaso, ou incerteza ou aleatoriedade) quanto à ocorrência ou não de algum evento futuro. Assim, em muitos casos, é
impossível afirmar o que ocorrerá, mas é possível avaliar o que pode ocorrer. Além disso, utilizando dados históricos,
experiência profissional e opiniões de especialistas, em geral é possível dizer quão provável é a ocorrência de
determinado evento futuro.
Assim, o ponto central deste capítulo é possibilitar a quantificação de quão provável é a ocorrência de um
determinado evento. Para isso, é preciso apresentar algumas definições importantes:
1. Definições
Experimento determinístico: as condições sob as quais se realiza o experimento determinam a priori o seu resultado.
Exemplo: Deixa-se cair um objeto de uma altura h, no vácuo. Ele atingirá o solo em um tempo t = raiz
quadrada (2h/g), onde g é a aceleração da gravidade. Repetido o experimento, nas mesmas condições, ele terá
sempre o mesmo resultado.
Experimento aleatório: não se pode definir a priori o resultado do experimento, o qual depende de elementos de
“chance”, “azar”, “aleatoriedade”. As condições do experimento determinam somente o comportamento
probabilístico do resultado. Exemplo: Lança-se uma moeda 100 vezes. As ocorrências de cara e coroa se
alternam de forma irregular e imprevisível. É impossível prever o resultado de cada lançamento, mas é possível
descrever o resultado esperado do experimento.
Exemplos:
a. Considere o lançamento de um dado, observando-se a face 5. Aqui o experimento é o lançamento do dado. O
conjunto de resultados possíveis desse experimento é formado pelas faces do dado, isto é, = {1,2,3,4,5,6}.
E={ocorrência da face 5} foi o evento observado.
b. Considere o seguinte experimento: em 10 lançamentos de uma moeda, observa-se o número de resultados “cara”. O
conjunto de valores possíveis são os números possíveis de resultados “cara” em 10 lançamentos da moeda, isto é,
= {0,1,2,3,4,5,6,7,8,9,10}.
c. Considere, novamente, o lançamento de um dado. O conjunto de resultados possíveis desse experimento é formado
pelas faces do dado, isto é, = {1,2,3,4,5,6}. Considere os seguintes eventos associados a esse experimento:
Note que os eventos E1, E2, E3, E4, E5 e E6 têm uma natureza distinta dos eventos A, B, C e D. Os eventos A,
B, C e D podem ser decompostos em eventos menores enquanto os eventos E1, E2, E3, E4, E5 e E6 são constituídos de
um único resultado e não podem ser decompostos.
Os eventos E1, E2, E3, E4, E5 e E6 são chamados eventos elementares e têm as seguintes características:
São constituídos de um único resultado;
d. Um casal planeja uma família com 3 filhos. Suponha que a probabilidade de nascer menina (M) ou menino (H) seja
a mesma, a cada nascimento. Nesse caso o espaço amostral tem 8 possíveis resultados (8 eventos elementares):
(M,M,M) (M,M,H) (M,H,H) (H,H,H) Note que existem 3 maneiras diferentes de combinar 2
(M,H,M) (H,M,H) meninas e 1 menino, constituindo 3 eventos distintos. O
(H,M,M) (H,H,M) mesmo vale para 1 menina e 2 meninos.
Evento impossível: um evento impossível de ocorrer é denotado por (phi = conjunto vazio).
Evento complementar: o complemento de um evento A consiste de todos os resultados do espaço amostral que não
façam parte do evento A. O complemento do evento A é denotado por Ac.
Eventos mutuamente exclusivos: dizemos que dois eventos são mutuamente exclusivos, ou excludentes, quando não
têm elementos em comum (não podem ocorrer simultaneamente).
Em outras palavras: A e B são eventos mutuamente exclusivos se e somente se AB=
Em algumas situações é útil representar graficamente um espaço amostral para facilitar a visualização dos
elementos. Esta representação é conhecida como diagrama de Venn. A Figura 1.1 apresenta exemplos de representação
de eventos através do diagrama. Os retângulos representam o espaço amostral.
Dois eventos que não são
mutuamente exclusivos
Ac Evento A A B (AB 0 existem
resultados comuns)
2. Probabilidade
A probabilidade é uma função matemática que representa uma medida da possibilidade de ocorrência de um
determinado evento pertencente a um espaço amostral. Denotaremos a probabilidade de ocorrência de um evento A
como P(A). Basicamente há três formas diferentes de calcularmos ou estimarmos probabilidades: o método clássico
(que calcula as probabilidades a partir de um modelo teórico), o método empírico (que considera os resultados de um
experimento probabilístico) e o método subjetivo (que calcula probabilidades a partir de opiniões).
O método clássico se aplica quando é possível associar ao experimento um modelo teórico que determine
probabilidades esperadas. Este método é particularmente simples quando todos os resultados possíveis (os eventos
elementares) são igualmente prováveis (equiprováveis). Quando os resultados são igualmente prováveis, a probabilidade
de ocorrência de um evento é a razão
Nº de resultados favoráveis ao evento
.
Nº total de possibilidades em
b. Uma urna contém 10 bolas, sendo que 3 são bolas brancas e 7 são bolas pretas. Caso uma bola seja escolhida
aleatoriamente, qual é a probabilidade de que a bola retirada seja branca? Neste exemplo, o espaço amostral pode ser
escrito como = {B,P}, onde B representa bolas brancas e P as bolas pretas. O evento “A = retirar uma bola branca”,
segundo o espaço amostral considerado é dado por A = {B}. Assim, a probabilidade do evento A é
No. de resultados associados ao evento A 3
P(A) = =
No. de possibilidades em 10
Como conseqüência da definição apresentada, é fácil mostrar que a probabilidade associada a um evento A possui as
seguintes propriedades:
1. É uma grandeza adimensional entre 0 e 1, isto é, 0 P(A) 1. Porque o número de resultados associados ao evento A
é sempre menor ou igual ao número de possibilidades no espaço amostral.
2. P() = 1. Por exemplo, se lançarmos uma moeda com certeza obteremos ou cara ou coroa.
3. P() = 0. Pois não existe nenhum resultado possível associado ao .
O método empírico baseia-se em resultados experimentais. As frequências relativas observadas são tomadas
como probabilidades associadas ao fenômeno em estudo.
Exemplos:
a. Qual a probabilidade de chover no dia 17 de dezembro? Embora o espaço amostral possa ser definido
como = {chove, não chove}, não é razoável concluir que a probabilidade de chover em dezembro vale 1/2. Isso
acontece porque a suposição de equiprobabilidade não tem sentido nesse caso. Suponha, no entanto, que observamos
durante 15 anos a ocorrência de chuva no dia 17 de dezembro com o seguinte resultado: choveu 10 vezes e não choveu
5. Com base no método da freqüência relativa, então, podemos estimar a probabilidade do evento através da razão:
No. de resultados observados associados ao evento
No. total de provas ou No. total observado
Assim, a estimativa da probabilidade de chover nesse dia é 10/15, o que na prática pode ser visto como uma proporção.
b. Experimentos ao final de uma linha de produção constataram, em uma amostra de 1000 peças produzidas, a
ocorrência de 25 peças defeituosas. Pode-se, então, inferir que a probabilidade de uma peça qualquer produzida ser
defeituosa é de 0,025 (25/1000=0,025=2,5%)
O método subjetivo - Existem situações práticas onde não há observações ou dados suficientes para o cálculo
das probabilidades. Por exemplo, um novo tipo de carro será lançado no mercado. Qual proporção do mercado
consumirá o produto? Nesses casos, são realizadas avaliações subjetivas do grau de viabilidade de um evento. É um
esforço para quantificar nossa crença a respeito de algo. Algumas desvantagens imediatas desse método são:
1. Em geral, difíceis de argumentar quando postas em dúvida. Uma forma de reduzir este problema é ouvir vários
especialistas reconhecidamente conceituados para apresentarem suas idéia, em busca de algum consenso.
2. Tendenciosidade. Não só noções préconcebidas como também o desejo pessoal podem distorcer a avaliação. Não
obstante, o treinamento, a experiência e a atitude profissional podem auxiliar a reduzir esse efeito.
Até aqui apresentamos definições de como determinar a probabilidade de um determinado evento. Muitas
aplicações da estatística exigem, porém, a determinação da probabilidade de combinações de eventos ou operações entre
eventos.
Intersecção de Eventos: Considere os eventos A e B de um certo espaço amostral. A intersecção dos eventos A e B é o
conjunto de resultados presentes simultaneamente em A e B e será denotada por A B. Suponha que temos 4 eventos:
A, B, C e D. Então A B C D representa o evento “ocorrência simultânea de A, B, C e D”. Portanto, a
intersecção de conjuntos está associada ao conetivo “e”.
União de Eventos: A união dos eventos A e B é a ocorrência de pelo menos um dos eventos A ou B (ou ambos).
Denotaremos por A B. Suponha que temos 4 eventos: A, B, C e D. Então A B C D representa o evento
“ocorrência de A ou B ou C ou D”. Portanto, a união de eventos está associada ao conetivo “ou”.
Observação 1: Suponha que o espaço amostral seja particionado em vários conjuntos, todos mutuamente
exclusivos dois a dois. Observe que a união de todos esses conjuntos forma o espaço amostral. Dizemos então que
esses eventos formam uma partição do espaço amostral.
Observação 2: Considere os eventos A e B=Ac. Nesse caso temos que A B = (espaço amostral ou o
evento certo) e A B = . Portanto A e Ac constituem uma partição de .
A seguir apresentaremos regras gerais e definições que formam parte da álgebra das probabilidades.
Independência entre eventos: Dois eventos A e B são independentes se e só se P(A B) = P(A) P(B).
Exemplos:
a. Jogam-se duas moedas honestas. Qual é a probabilidade de sair cara em ambas?
Uma forma de resolver é considerar o espaço amostral considerando-se combinações do par (resultado da moeda 1,
resultado da moeda 2). Assim, 1 = {(cara,cara), (cara, coroa), (coroa, cara), (coroa, coroa)} e os quatro eventos são
equiprováveis. Daí, temos que a probabilidade de sair duas caras é 1/4.
Outra forma é usar o fato das moedas serem independentes. Sejam A o evento “sai cara na moeda 1” e B o evento “sai
cara na moeda 2”. Sabe-se que P(A) = ½ e P(B)= ½. Assim, P({cara,cara}) = P(A B) = P(A) P(B) = ½ ½ = ¼.
Estendendo-se o resultado para 3 moedas, a probabilidade de sair 3 caras é ½ ½ ½.
b. Da Tabela 2.1, suponha que os eventos A = “bater o carro em um dia com chuva em São Paulo” e B = “Ser
assaltado em São Paulo” sejam independentes. A chance dos dois eventos ocorrerem simultaneamente é P(A B) =
1,4 1,7 2,38
P(A) P(B) = =
1000
. 100 100.000
Observação 5: É importante não confundir eventos independentes com eventos mutuamente exclusivos.
Segundo a definição de independência, dois eventos mutuamente exclusivos não podem ser independentes, a menos que
P(A) = 0 ou P(B) = 0. Da mesma forma, dois eventos independentes não podem ser mutuamente exclusivos a menos
que P(A) = 0 ou P(B) = 0.
AB
5.2. Propriedades para a probabilidade da ocorrência de A ou B:
Para dois eventos A e B, para o cálculo de P(A B), aplica-se a regra da adição: A B
P(A B) = P(A) + P(B) P(A B)
Note que, caso A e B sejam eventos mutuamente exclusivos, a regra de adição se reduz a
Exemplo:
Jogam-se duas moedas honestas. Qual é a probabilidade de sair pelo menos uma cara? Uma forma de resolver é
considerar o seguinte espaço amostral do experimento: 1 = {(cara,cara), (cara, coroa), (coroa, cara), (coroa, coroa)}.
Daí, temos que a probabilidade de sair pelo menos uma cara é 3/4.
Outra forma é usar a regra da adição. Sejam A o evento “sai cara na moeda 1” e B o evento “sai cara na moeda 2”.
Sabe-se que P(A) = ½ e P(B)= ½. Assim, P(A B) = P(A) + P(B) P(A B) = ½ ½ ¼ = 3/4.
Exemplos
Note que o exemplo é muito simples; os eventos elementares são equiprováveis e a probabilidade pode ser
obtida por uma contagem simples:
número de eventos elementare s favoráveis ao evento A 4 2
P( A) 0,67
número total de eventos elementare s 6 3
Pergunta-se:
Qual é a probabilidade do aluno selecionado ser mulher?
No. de resultados associados ao evento No. de mulheres
P(A) = = = 0,60.
No. de possibilidades em No. total de alunos na sala
No. de mulheres com idade abaixo de 27 anos No. total de alunos na sala
P(B|A) = ,
No. total de mulheres na sala No. total de alunos na sala
temos as relações que definem as probabilidades condicionais:
P(A B) P(A B)
P(B|A) = e P(A|B) =
P(A) P(B)
condição condição
Introdução à Probabilidade Cap 5-7/15
Universidade de Brasília MÉTODOS QUANTITATIVOS APLICADOS À GESTÃO E SUPORTE EMPRESARIAL
Instituto de Ciências Exatas
Departamento de Estatística INTRODUÇÃO À PROBABILIDADE
Consequências da definição:
Essa expressão relaciona P(A|B) com P(B|A) possibilitando que se “reverta” a condição sob a qual estamos
calculando as probabilidades. Essa aplicação importante do conceito de probabilidade condicional é conhecida como
Teorema de Bayes.
5.4. Exercícios
1. Dados coletados por um supermercado apontam que, em uma determinada segunda-feira, dos 1.500 clientes, 915
gastam mais de R$ 100,00 em suas compras. Estime a probabilidade de um comprador gastar mais do que R$ 100,00 em
uma segunda-feira qualquer. Quais são as hipóteses necessárias dessa estimativa?
2. Um corretor de seguros estima em 0,20 a probabilidade de vender uma apólice de seguro de vida a um casal jovem.
Caso essa estimativa esteja correta, enviando-se propostas de venda para 300 casais, quantos apólices ele esperaria
vender?
3. Uma firma exploradora de petróleo perfura um poço quando acha que há pelo menos 25% de chance de encontrar
petróleo. Assim, suponha que ele perfure dois poços A e B, aos quais atribui as probabilidades 0,30 e 0,80,
respectivamente.
a. Determine a probabilidade da empresa fracassar, isto é, de nenhum dos poços produzir petróleo com base
nas estimativas da firma.
b. Determine a probabilidade dos dois poços produzirem petróleo.
c. Determine a probabilidade de que, dentre os dois poços, pelo menos um produza petróleo.
4. Uma instituição de trânsito rodoviário estima que as probabilidades de ocorrerem 0, 1, 2, 3, 4, 5, 6 e 7 acidentes entre
1 e 6 horas da manhã são, respectivamente: 0,08; 0,15; 0,20; 0,25; 0,18; 0,07; 0,04 e 0,01.
Para um dia qualquer da semana naquele horário, qual é a probabilidade de ocorrer:
a. 3 ou menos acidentes
b. exatamente 3 acidentes
c. nenhum acidente
d. mais de 5 acidentes
e. mais de 8 acidentes
5. Os arquivos da polícia revelam que, das vítimas de acidente automobilístico que utilizam cinto de segurança, apenas
10% sofrem ferimentos graves, enquanto essa incidência é de 50% entre as vítimas que não utilizam cintos de
segurança. Estima-se que a 60% dos motoristas usam o cinto. A polícia acaba de ser chamada para investigar um
acidente em que houve um indivíduo gravemente ferido. Calcule a probabilidade desse motorista estar usando o cinto no
momento do acidente. Caso ele não tenha sofrido ferimentos graves, qual seria essa probabilidade?
6. Sua firma apresenta uma proposta para um projeto de construção. Suponha que, caso seu principal concorrente
apresente uma proposta, a chance de sua firma ganhar a concorrência é de apenas 0,25. Por outro lado, se o concorrente
não apresenta proposta, a chance de ganhar sobe para 0,67. Assumindo-se que a chance do concorrente participar da
concorrência seja de 0,50.
a. Qual é a probabilidade de sua firma ganhar a concorrência?
b. Se a sua firma ganhou a concorrência, qual é a probabilidade da principal concorrente ter participado?
6. Distribuições de Probabilidade
Existem muitos fenômenos que não podem ser determinados com certeza. Por exemplo, será que um time de
futebol ganhará o jogo? ou, será que ações de uma empresa vão subir de preço daqui a três anos? ou, quais são os riscos
em aplicar o dinheiro em Fundos de Ações? ou, quantos carros serão roubados durante esse mês?
Nesses casos, não é possível afirmar com certeza sobre a ocorrência dos eventos, mas podemos avaliar ou
predizer chances em observações repetidas um bom número de vezes. Em outras palavras, em um bom número de
observações, torna-se visível quais resultados são mais prováveis do que outros.
Quando uma variável está associada com chances, dizemos que ele é uma variável aleatória.
Exemplos:
a. Quando jogamos uma moeda, os resultados possíveis são cara ou coroa. Caso estivermos interessados no resultado
“cara”, podemos definir a variável aleatória C que assume os seguintes valores:
C = 1 caso o resultado é cara, e C = 0 caso o resultado é coroa.
b. Suponha que estamos interessados em avaliar o número de acidentes de carro durante esta semana. Não sabemos
quantos acidentes ocorrerão, mas podemos definir quais valores poderão ocorrer. Assim, definimos a variável aleatória
A que assume valores 0, 1, 2, 3, 4 e assim por diante.
c. Suponha que estamos interessados em estudar a renda mensal da população. Caso uma pessoa seja selecionada da
população, a renda desta pessoa pode ser qualquer valor entre R$ 0,00 e (digamos) R$ 500.000,00.
As variáveis aleatórias que serão consideradas podem ser de natureza discreta ou contínua. Note, por exemplo,
que nos casos a e b as variáveis aleatórias são contagens e no caso c a variável pode assumir qualquer valor contínuo.
Assim podemos definir:
Variável aleatória discreta: quando toma valores que podem ser contados; e
Variável aleatória contínua: quando pode tomar valores em um determinado intervalo.
Uma variável contínua pode assumir um número infinito de valores possíveis, pelo menos teoricamente.
Exemplos típicos: altura e peso de pessoas, tempo de ligação telefônica. A distinção da natureza entre as variáveis
aleatórias discretas e contínuas é fundamental na formulação e uso de modelos de probabilidade.
Suponha, por exemplo, o lançamento de um dado. Sabemos que a probabilidade de uma determinada face está
entre 0 e 1, mais precisamente 1/6. Suponha que F seja a variável aleatória que representa a face do dado, isto é, F = 1,
2, 3, 4, 5, ou 6. As probabilidades associadas a F estão distribuídas igualmente ao longo dos seus valores possíveis.
Uma distribuição ou modelo de probabilidade é a forma com que as probabilidades estão associadas à variável
aleatória. Caso a variável aleatória seja discreta, dizemos que a distribuição é discreta. Caso a variável seja contínua, a
distribuição também será contínua.
Dada uma distribuição de probabilidade, é comum que alguns resultados sejam mais freqüentes que outros. Do
ponto de vista prático, em geral, o problema não será calcular probabilidades individuais porque existem tabelas e
fórmulas para isso. O objetivo será estudar como utilizar as distribuições para resolver um dado problema.
Existe uma grande variedade de distribuições de probabilidade. Cada distribuição envolve hipóteses que
buscam eliminar detalhes em importância. Em geral, procura-se reduzir problemas complexos a dimensões menores.
Como conseqüência da simplificação, dentre um número reduzido de modelos probabilísticos (ou distribuições), é
possível escolher um que seja suficientemente próximo da realidade.
Apresentaremos nesse capítulo uns poucos, porém importantes, tipos de distribuições discretas e contínuas. A
validade da aplicação de um modelo a um certo problema depende do quão próximo a situação real está das condições
hipotéticas do modelo.
Para ilustrarmos o cálculo do valor esperado de uma variável aleatória, considere os seguintes exemplos:
Em média, o lucro esperado é a média ponderada do Lucro utilizando-se as probabilidades como pesos, ou seja,
Lucro esperado = 1.000.000,00 0,40 + ( 50.000,00) 0,60 = 370.000,00
Observe que, ao fechar um único negócio, o empresário ou ganha R$ 1.000.000,00 ou perde R$ 50.000,00. Entretanto,
caso ele participe de vários negócios, todos com a mesma distribuição de probabilidade do Lucro, então se espera que,
em média, (entre ganhos e perdas) ele tenha um lucro de R$ 370.000,00.
b. Ao ser indagado por um corretor de imóveis, um empreiteiro faz a seguinte avaliação sobre o término das obras:
Prazo para o término das obras 1 ano 1 ano e 6 meses 2 anos
Probabilidade 0,30 0,20 0,50
O prazo esperado para o término da obra é: 1 0,30 + 1,5 0,20 + 2 0,50 = 1,6 ano (ou 1 ano e 7 meses).
Características da Binomial
A média de uma distribuição binomial é o valor esperado da distribuição. Por exemplo, se uma moeda for
lançada 50 vezes, é razoável esperar, em média, 25 caras, ou, 50% dos 50 lançamentos.
O desvio padrão da distribuição binomial indica quanto os dados estão afastados da média. Assim como a
média, o desvio padrão também pode ser expresso ou em total de sucessos, ou em percentual.
A distribuição Normal é um destaque na estatística. Com freqüência ela representa com boa aproximação
vários fenômenos naturais. Ela também serve como aproximação de probabilidades Binomiais quando n é grande e p é
próximo de ½. O motivo mais importante, porém, é que as distribuições dos valores das médias e proporções, em
grandes amostras, tendem a ser distribuídas normalmente (veremos mais tarde no capítulo sobre Estimação).
As distribuições Normais remontam ao século XVIII, quando cientistas observaram que mensurações repetidas
de uma mesma quantidade (como distância da Terra à Lua, ou massa de um objeto) tendiam a variar. Estudando-se os
erros de medições, tomando-se um grande número de observações e dispondo-as numa distribuição de freqüência, elas
se apresentavam repetidamente com uma forma análoga à da Figura 6.1. Como essa distribuição estava um associada
aos erros de mensuração, ficou conhecida como distribuição “Normal dos erros” ou “Normal”. Mais tarde, Gauss
(1.777-1.855) deduziu matematicamente a curva normal que ficou um bom tempo conhecida como distribuição de
probabilidade de erros de medidas, ou Lei normal dos erros. Empiricamente, a forma dos histogramas dos erros de
medição dos pesquisadores da época se assemelhavam à distribuição de Gauss. Por isso a distribuição Normal também é
conhecida como “Gaussiana.
Pensava-se que o erro em geral sempre obedecia a Lei normal dos erros. Hoje, sabe-se que nem sempre isso
ocorre. Mesmo assim, ainda hoje, a Normal é a distribuição de probabilidades com maior aplicação prática e teórica nos
métodos estatísticos.
Características
Como pode ser observado pela Figura 6.2, o gráfico de uma distribuição Normal se assemelha a um sino, sendo
simétrico em torno da média. Note que o ponto de máximo da curva ocorre na média. A distribuição Normal (ou
distribuição Gaussiana) está definida para todos os valores, tanto positivos como negativos, ou seja, a curva se prolonga
indefinidamente em qualquer direção a partir da média.
Outra característica é que a Normal é especificada por dois parâmetros: a média da distribuição () e a
variância da distribuição (2). A notação usual para essa distribuição é X ~ N(, ). Diferentes combinações desses
2
dois parâmetros produzem, respectivamente, variações na posição (onde a curva se situa ou locação) e na forma (grau de
dispersão, “achatamento” do gráfico, ou curtose).
O parâmetro , que representa a média da distribuição, é um parâmetro de locação. Variando-se os valores da
média, a forma da distribuição se mantém inalterada. Há apenas mudança na localização da distribuição, como ilustra a
Figura 6.3.
(x) (x)
O desvio padrão
é um parâmetro de
dispersão. Quando maior
for o desvio padrão ,
mais espalhada estará a
distribuição; quando
menor for o desvio padrão
, mais concentrada estará
a distribuição. Assim,
variando o parâmetro de
dispersão , obtém-se
formas ilustradas na
Figura 6.4. Figura 6.4 Distribuições normais com a mesma média e desvios padrão diferentes
A área total sob a curva Normal representa a probabilidade total que vale 1 (um) - Figura 6.5a. Como a curva é
simétrica em relação à média, a área sob a curva à direita da média vale 0,5 e à esquerda também vale 0,5 (Figura 6.5b).
A probabilidade entre dois pontos a e b é a área sob a curva compreendida entre os pontos a e b (Figura 6.5c).
100% 50%
f(x) f(x) f(x)
x x a b x
Padronização
x
Felizmente, há uma alternativa que associa uma distribuição Normal em particular com
z
todas as demais. Todas as distribuição Normais podem ser padronizadas através da relação:
Agora a variável z representa o número de desvios padrões a contar da média, pois: x z
Como resultado da padronização, a distribuição Normal padronizada Z tem média zero e variância 1 com a
seguinte notação: Z ~ N(0,1). A forma gráfica está ilustrada na Figura 6.6. Note que z assume valores negativos se x
estiver abaixo da média, e positivos caso contrário. Todas as probabilidades da curva Normal podem ser determinada
através de uma única tabela: a da distribuição padronizada.
As probabilidades de qualquer distribuição normal podem ser achadas através da distribuição Normal
padronizada. A tabela é construída de modo que pode ser lida em valores padronizados z, fornecendo os valores de P( Z
z). A área sombreada da Figura 6.7 corresponde à área sob a curva que pode ser lida diretamente na Tabela 5.3.
f(x)
()
z
-3
6
2
8
4
6
,6
,4
,8
,2
,6
0
3
0,
1,
1,
2,
3,
-3
-2
-1
-1
-0
m z
Figura 6.7 Área abaixo da curva normal
correspondente à P(Z z)
Figura 6.6 Distribuição Normal Padrão
Exemplos:
a. Suponha que queremos calcular P( X 20), onde X é uma variável aleatória Normal com média 15 e desvio padrão 4.
x
Padronizando-se a variável aleatória X, podemos calcular P( Z z), onde z , isto é, z = (20 15) / 4 = 1,25.
Obteremos P( Z 1,25) através da Tabela 5.3 da seguinte forma:
Passo 1: procurar a linha referente a z = 1,2.
Passo 2: procurar a coluna referente a 0,05.
Passo 3: a intersecção entre a linha e a coluna representa o valor procurado que vale 0,89435.
b. Suponha que queremos calcular P( X > 20). Na Figura 6.8, observe que a área abaixo da curva referente a valores
acima de 20 é o complementar da área para valores abaixo de 20. Já que a área total vale 1, então P( X > 20) = 1 P( X
20) = 1 0,89435.
c. Suponha que queremos calcular P( a Z b ). A área sob a curva no intervalo [a,b] está representada na Figura
6.6(c). Observe que essa área pode ser obtida fazendo-se P( Z b) P( Z a). Logo, P( a Z b ) = P( Z b) P( Z
a).
Observe na Figura 6.7 que a distribuição Normal, padronizada ou não, é simétrica em torno da média. No caso
da Normal padronizada, a distribuição é simétrica em torno de 0. Logo, a metade esquerda é imagem reflexa da metade
direita. Então, por causa da simetria da Normal, temos as seguintes relações:
P( Z z) = P( Z z);
P( Z z) = P( Z z);
P( Z z) = 1 P( Z z).
Em alguns casos a distribuição Normal pode ser uma boa aproximação da Binomial. Em particular quando p
estiver próximo de ½ a distribuição Normal é uma boa aproximação da distribuição Binomial. A aproximação torna-se
melhor à medida que n aumenta.
A aproximação Normal da Binomial apresenta uma dificuldade conceitual porque a Normal é contínua e a
Binomial é discreta. Graficamente, porém não é difícil de perceber essa aproximação (ver Figura 6.9).
Exemplo:
Suponha que temos uma variável aleatória Y tenha distribuição
f(x) Binomial com n = 1.500 e p = 0,40. Qual é a probabilidade P( Y
500)?
Lembrando-se que a média e variância da distribuição Binomial são
x respectivamente np e np(1-p), temos: média = 600 e variância =
z 360.
6.6. Exercícios
1. Suponha que 2% de um certo modelo de carro acuse algum tipo de defeito dentro de 60 dias. Suponha que uma
concessionária vende 190 carros desse modelo.
a. Fazendo-se uma aproximação, quantos carros você esperaria receber para conserto
dentro de 60 dias?
b. Qual é a probabilidade de mais de 6 carros apresentarem defeito nesse período?
c. Qual é a probabilidade de nenhum apresentar defeito?
4. Suponha que depósitos efetuados no Banco BSB durante o mês de janeiro sejam distribuídos normalmente, com
média 10.000 u.m. (unidade monetária) e desvio-padrão de 1.500 u.m. Um depósito é selecionado, ao acaso, dos
depósitos referentes ao mês em questão. Encontrar a probabilidade de que o depósito seja:
a. 10.000 u.m. ou menos;
b. pelo menos 10.000 u.m.;
c. um valor entre 12.000 u.m. e 15.000 u.m.
d. maior que 20.000 u.m.
e. o banco resolve premiar os clientes com os maiores depósitos. Decide-se premiar todos os depósitos a partir de um
certo valor. Escolha um “valor de corte” para o valor dos depósitos de forma que sejam premiados 10% dos
correntistas.