Você está na página 1de 28

Renato Nogueirol Lobo

Probabilidade e
Estatística
Sumário
CAPÍTULO 3 – Como Aplicar a Teoria da Probabilidade?....................................................05

Introdução.....................................................................................................................05

3.1 Probabilidade: conceitos básicos................................................................................05

3.1.1 Conceitos básicos............................................................................................05

3.1.2 Variável aleatória.............................................................................................06

3.1.3 Resultado........................................................................................................07

3.1.4 Evento.............................................................................................................07

3.1.5 Probabilidade incondicional..............................................................................08

3.1.6 Probabilidade Condicional................................................................................08

3.1.7 Propriedades da probabilidade..........................................................................08

3.1.8 Avaliando testes de triagem...............................................................................09

3.2 Modelos teóricos.......................................................................................................10

3.2.1 Distribuição Binomial........................................................................................10

3.2.2 Distribuição Poisson..........................................................................................12

3.2.3 Distribuição Normal.........................................................................................14

3.2.4 Distribuição Multinominal..................................................................................18

3.3 Correlação e Regressão Linear...................................................................................19

3.3.1 Correlação Linear............................................................................................19

3.3.2 Regressão Linear.............................................................................................21

3.3.3 Coeficiente de Correlação.................................................................................22

3.3.4 Regressão........................................................................................................23

Síntese...........................................................................................................................26

Referências Bibliográficas.................................................................................................27

03
Capítulo 3 Como Aplicar a Teoria da
Probabilidade?

Introdução
Você já parou para analisar quais são suas chances de ganhar na Mega-sena? E num jogo de
dois dados? Se compararmos o número de possíveis resultados na Mega-sena, que é bastante
alto, ao número de possíveis resultados num jogo de dados, será fácil concluir que nossa chance
de ganhar num jogo de dados é muito maior. Para que você possa refletir sobre o assunto, a pro-
babilidade de ganhar na Mega-sena com uma única aposta é de 1 chance em 50 milhões.  Já
no caso dos dados, a probabilidade de, ao jogarmos dois dados, obtermos o valor 5 é de 11
chances em 100.

Neste capítulo, você irá conhecer, portanto, os conceitos básicos de probabilidade e os modelos
Binomial, Poisson e Normal. Iremos também investigar o que é correlação e regressão linear,
bem como o coeficiente de correlação. Preparado? Então vamos lá!

3.1 Probabilidade: conceitos básicos


Entenda a probabilidade como um número que reflete a possibilidade ou probabilidade de um
determinado evento ocorrer. Se você jogar um dado, há seis resultados possíveis, cada um deles
igualmente provável. Qual então é a probabilidade de obtermos um número específico? Uma vez
que existem seis resultados possíveis, a probabilidade é de 1/6. Esses resultados são chamados
de resultados favoráveis.

3.1.1 Conceitos básicos


A probabilidade pode ser expressa como um número entre 1 e 0, ou entre 0% e 100%. Um evento
com uma probabilidade de 1 pode ser considerado uma certeza: por exemplo, a probabilidade
de, ao lançarmos uma moeda, obtermos cara ou coroa é 1, porque não existem outras opções.
Um evento com uma probabilidade de 0,5 tem chances iguais de ocorrer ou não. No lançamento
de uma moeda, por exemplo, a probabilidade de obtermos cara é 0,5, porque há somente duas
opções e cara é uma delas.

A teoria da probabilidade paradoxal aplica cálculos precisos para quantificar medidas de in-
certeza de eventos aleatórios. O conceito pode ser ilustrado no contexto de um estudo sobre a
obesidade em crianças de 5-10 anos de idade que buscam atendimento médico em uma prática
pediátrica particular. A população (base de amostragem) inclui todas as crianças que procuraram
atendimento nos últimos 12 meses.

05
Probabilidade e Estatística

IDADE
5 6 7 8 9 10 TOTAL
(anos)

MENINOS 432 379 501 410 420 418 2560


MENINAS 408 513 412 436 461 500 2730
TOTAIS 840 892 913 846 881 918 5290

Quadro 1 - Número de casos de obesidade por idade encontrada em uma clinica pediátrica.
Fonte: Elaborado pelo autor, 2015.

Um bom exemplo ligado à área de produção é o seguinte: imagine que numa produção foram
retirados 260 parafusos para serem examinados e em cinco deles foram encontrados defeitos.
Com base nesta informação, podemos estimar que a probabilidade de que um parafuso seja
defeituoso é aproximadamente igual à frequência relativa, que é 5/260 = 0,019 ou 1,9%.

Outro tipo de probabilidade que usamos em produção é a estimativa subjetiva, com base nas
experiências de uma pessoa. Digamos que um engenheiro geológico examina uma extensa área
de propriedade particular, escolhendo o melhor local para perfurar um poço de petróleo. Ele
afirma que, com base em sua experiência anterior, a probabilidade de ser bem sucedido é de
30%. Esta é uma estimativa subjetiva de probabilidade e os interessados na perfuração da área
podem usá-la para tomar sua decisão.

Na probabilidade, a percentagem refere-se à possibilidade de que alguma coisa vai acontecer.


Como já mencionamos anteriormente, 0 significa a impossibilidade e 1 determina certeza. Em
outras palavras, a escala vai do menos provável até o mais provável. Conceitos de probabilidade
ajudam a definir risco, quantificando as perspectivas de resultados não intencionais e negativos.

3.1.2 Variável aleatória


Em probabilidade e estatística, uma variável aleatória, quantidade aleatória, variável aleatória
ou variável estocástica é uma variável cujo valor está sujeito a variações devidas ao acaso, ou
seja, à aleatoriedade, em um sentido matemático. A variável aleatória pode assumir um conjunto
de possíveis valores diferentes, cada um com uma probabilidade associada, em contraste com
outras variáveis ​​existentes.

Possíveis valores de uma variável aleatória podem representar os possíveis resultados de um


experimento ainda a ser realizado, ou os possíveis resultados de um experimento passado cujo
valor já existente é utilizado, por exemplo, devido a medições imprecisas ou incerteza quântica.
Eles também podem representar os resultados de um processo aleatório tais como a fiação quí-
mica em uma fieira ou a aleatoriedade subjetiva, a qual resulta do conhecimento incompleto de
uma amostra. A função matemática que descreve os possíveis valores de uma variável aleatória e
suas probabilidades associadas é conhecida como distribuição de probabilidade. Variáveis ​​alea-
tórias podem ser discretas ou contínuas. Os resultados de uma variável aleatória, em função de
distribuição de probabilidade da variável, são chamados de variantes aleatórias.

Por exemplo, o tempo não é uma variável aleatória, pois sabemos que amanhã terá 24 horas,
o mês de janeiro terá 31 dias e assim por diante. No entanto, a taxa de retorno esperada sobre
um fundo de investimento e o desvio padrão esperado desses retornos são variáveis aleatórias.
​​
Tentamos prevê-las nos baseando no histórico e em nosso conhecimento de economia, mas não
Laureate- International
poderemos Universities
dizer com certeza que as variáveis ​​obedecerão tudo o que previmos ou esperamos.

06
3.1.3 Resultado
Saiba que resultado refere-se a qualquer valor possível que uma variável aleatória pode tomar. Jo-
gadores de loteria têm uma probabilidade quase certa de perder seu dinheiro apostando, porém
há uma pequena chance de que eles se tornem milionários, pois para um único bilhete de loteria,
existe apenas um resultado. Quando um resultado particular acontece, chamamos de evento.

Estatisticamente, consideramos os resultados significativos como improváveis se tiverem ocorrido


por acaso. Sempre que uma análise estatística é realizada e os são resultados interpretados, há
uma possibilidade finita de que os resultados ocorram por acaso, sendo uma limitação inerente
a qualquer análise estatística. Os erros, como os de medição, por exemplo, podem causar uma
interpretação errônea dos resultados. A probabilidade de que o processo seja um encontro ao
acaso, entretanto, pode ser calculada e um limite mínimo de significância estatística pode ser
ajustado, sendo que os níveis estatisticamente significantes comuns são 5% e 1%.

Resultados significativos são necessários para muitos casos práticos de experimentação em vários
ramos da pesquisa estatística. A escolha do nível de significância estatística é influenciada por
certo número de parâmetros e as alterações nos diferentes tipos de experimentos. Na maioria
dos casos de consideração prática, a distribuição de parâmetros ou qualidade segue uma dis-
tribuição normal, no entanto, devemos tomar cuidado para visualizar outras distribuições dentro
da população dada.

3.1.4 Evento
Na teoria das probabilidades, um evento é um conjunto de resultados de uma experiência para o
qual uma probabilidade é atribuída. Um único resultado pode ser um elemento de muitos eventos
diferentes. Além disso, eventos diferentes em um experimento geralmente não possuem valores
igualmente prováveis, uma vez que eles podem incluir diferentes resultados.

Nosso cotidiano é cheio de eventos aleatórios! O lançamento de uma moeda, os jogos de dados,
a escolha de um “rei” no baralho de cartas e sorteios de loteria são exemplos de eventos deste
tipo. Entenda que os eventos podem ser:

• Independentes - em que cada evento não afeta outros eventos posteriores. Exemplo: se
você jogar uma moeda três vezes e obter cara, qual a chance de que o próximo lance
também seja cara? A chance é simplesmente 1/2, ou 50%, assim como qualquer outro
lance da moeda, pois o que aconteceu no passado não afetará o sorteio atual.

• Dependentes (também chamado de condicional) - em que um evento é afetado por


outros eventos. Exemplo: quando você tira duas cartas de um baralho, há menos cartas
disponíveis e, portanto, a probabilidade vai mudar.

• Incompatíveis – em que os eventos não podem acontecer ao mesmo tempo


Vamos verificar a possibilidade de que, ao tirarmos duas cartas de um baralho, uma delas seja
um “rei”. Para a primeira carta, a chance é de 4 em 52, mas para a 2º temos:

• Se a primeira carta era um rei, então é menos provável que a segunda também o seja, já
que apenas 3 das 51 cartas que ficaram são reis;

• Se a primeira carta não era um rei, então é pouco provável que a segunda seja um rei,
pois das 51 cartas que ficaram, apenas 4 são reis.

07
Probabilidade e Estatística

3.1.5 Probabilidade incondicional


Se selecionarmos uma criança por amostragem aleatória simples, então cada criança tem a
mesma probabilidade (ou igual oportunidade) de ser selecionada. A probabilidade é de

1/N

Em que:
N representa o tamanho da população = 5.290.

Assim, a probabilidade de que qualquer criança seja selecionada para o exemplo apresentado é
1/5.290 = 0,0002. Na maioria das situações de amostragem, não estamos preocupados com
a amostragem de um indivíduo específico, mas sim com a probabilidade de amostragem de
certos tipos de indivíduos. Por exemplo, qual é a probabilidade de selecionar um menino ou
uma criança de sete anos de idade? A fórmula seguinte pode ser usada para calcular
probabilidades de seleção de indivíduos com atributos específicos. Acompanhe!

P (característica) = número de pessoas com a característica / N

3.1.6 Probabilidade Condicional


Cada uma das probabilidades calculadas no item anterior, por exemplo, P (menino) e P (criança
de 7 anos de idade), é uma probabilidade incondicional, pois o denominador para cada um é
o tamanho total da população (N = 5290), refletindo o fato de que toda a amostra em toda a
população é elegível para ser selecionada. No entanto, por vezes, é de interesse concentrar o
foco em um subconjunto específico da população ou uma subpopulação.

Por exemplo, suponha que estamos interessados apenas nas meninas e queremos saber qual é a
probabilidade de selecionar uma menina de 9 anos a partir da sub-população de meninas? Há
um total de NG = 2.730 meninas (NG se refere à população de meninas), e a probabilidade
de selecionar uma de 9 anos a partir da subpopulação de meninas é escrita da seguinte forma:

P (9 anos / meninas) = número de pessoas com característica / NG

Em que: / meninas indica que estamos condicionando a questão a subgrupo específico.

A probabilidade condicional é calculada da mesma forma que se calculam as probabilidades


incondicionais, ou qualquer probabilidade. Nesse caso:

P (9 anos | meninas) = 461/2730 = 0,169.

Isto também significa que 16,9% das meninas têm 9 anos de idade. Note que isto não é o mesmo
que a probabilidade de selecionar uma menina de 9 anos de idade da população total, que é P
(garota de 9 anos de idade) = 461/5290 = 0,087.

3.1.7 Propriedades da probabilidade


A probabilidade tem duas propriedades que a definem:

1. A probabilidade em todo o caso existente é um número entre 0 e 1, ou 0 <P (E) <1.


Laureate- International Universities
Também podemos usar a probabilidade numa escala de 0% (impossível) e 100% (totalmente
possível). Portanto, não existe uma probabilidade negativa ou uma probabilidade superior
a 1 (ou 100%) .

08
2. A soma de todas as probabilidades de todos os eventos é igual a 1, desde que ambos os
eventos sejam mutuamente exclusivos e exaustivos.

As probabilidades empíricas são objetivamente elaboradas a partir de dados históricos. Se nós


montamos uma distribuição de resultado com base nos últimos vinte anos de dados e, em segui-
da, usar essa distribuição para fazer previsões, estaremos utilizando uma abordagem empírica.
Precisamos lembrar, no entanto, que o desempenho do passado não garante resultados futuros,
então uma abordagem puramente empírica significa desvantagens.

3.1.8 Avaliando testes de triagem


Os testes de seleção são muitas vezes utilizados para avaliar a probabilidade de que uma amostra te-
nha uma condição particular. Por exemplo, em um caso médico, o raciocínio é que se a doença é iden-
tificada precocemente um tratamento pode levar à cura ou melhora da qualidade de vida. A preventiva
médica é constituída frequentemente por testes laboratoriais que detectam marcadores específicos de
determinada doença. Por exemplo, o antigénio (PSA) específico para o câncer de próstata, mede as
concentrações sanguíneas de PSA, uma proteína produzida pela glândula da próstata.

Outros exemplos são os testes de pressão arterial, eletrocardiograma de rotina, exames de mama,
exames retais digitais, mamografias, exames de sangue e urina. Em cada um desses exemplos,
temos uma tabulação da população ou um quadro de amostragem que nos permite calcular as
probabilidades desejadas. Há casos, no entanto, em que uma tabulação completa não é acessí-
vel e os modelos de probabilidade podem ser usados para gerar apenas probabilidades. Existem
dois modelos de probabilidade particularmente úteis para esses casos:

• o modelo de distribuição binomial, que é útil para probabilidades em que temos uma
variável discreta;

• o modelo de distribuição normal, o que é útil para calcular a probabilidade em uma


variável contínua.

Estes modelos de probabilidade são extremamente importantes na estatística, e nós vamos dis-
cutí-los em seguida.

09
Probabilidade e Estatística

3.2 Modelos teóricos


Um modelo estatístico é um conjunto de suposições a respeito da geração dos dados observados
e dos dados semelhantes de uma população maior. Ele representa formas idealizadas do
processo de geração de dados que descrevem um conjunto de distribuições de probabilidade.

Um modelo é normalmente especificado por equações matemáticas que se relacionam


com uma ou mais variáveis aleatórias e, possivelmente, outras variáveis não aleatórias.
Todos os testes de hipóteses e todas as estimativas estatísticas são derivados de modelos, os
quais, de modo geral, são parte da fundação de inferência estatística.

3.2.1 Distribuição Binomial


Quando você jogar uma moeda, desde que não haja situações tendenciosas, haverá dois re-
sultados possíveis: cara ou coroa, sendo que cada resultado tem uma probabilidade fixa de ½.
Essas distribuições são chamadas de distribuições binomiais. Tomemos um exemplo simples: os
quatro resultados possíveis que poderiam ocorrer se você jogasse uma moeda duas vezes estão
listados a seguir no Quadro 2. Note que os quatro resultados são igualmente prováveis com
probabilidade 1/4. Lembre-se de que os lançamentos da moeda são independentes.

Por isso, a probabilidade de dar cara no primeiro lançamento e cara no segundo lançamento é
o produto de P (1) e P (2), que é 1/2 x 1/2 = 1/4. O mesmo se aplica para o cálculo da proba-
bilidade de uma cara e uma coroa, que é 1/2 x 1/2 = 1/4.

Possibilidades Moeda I Moeda II

1 Cara Cara
2 Coroa Coroa
3 Cara Coroa
4 Coroa Cara

Quadro 2 - Quatro resultados possíveis.


Fonte: Elaborado pelo autor, 2015.

Os quatro resultados possíveis podem ser classificados pelo número de caras que surgem. Pode-
ria ser duas vezes, uma ou nenhuma. As probabilidades destas possibilidades são mostradas no
Quadro 3 e na Figura 1. Uma vez que dois dos resultados representam o caso em que apenas
uma cara aparece nas duas jogadas, a probabilidade deste evento é igual a 1/4 + 1/4 =1/2.
Confira a seguir!

Numero de Caras Probabilidade

Duas 1/4

Uma 1/2
Laureate- International Universities
Nenhuma 1/4

Quadro 3 - As probabilidades de obter 0, 1, ou 2 caras.


Fonte: Elaborado pelo autor, 2015.

10
PROBABILIDADE
0,60

0,50

0,40

0,30 Probabilidade

0,20

0,10

0,00

Figura 1 - Probabilidades de obtermos cara nos lançamentos.


Fonte: Elaborado pelo autor, 2015.

A Figura 1 é uma distribuição de probabilidade discreta, pois mostra a probabilidade para


cada um dos valores, definindo “cara” como sucesso. Esse tipo de distribuição é uma
distribuição binomial. A distribuição binomial consiste das probabilidades de cada um dos
possíveis números de sucessos em n tentativas para eventos independentes que cada um tem
uma probabilidade de π de ocorrência. Para o exemplo da moeda, N = 2 e π = 0,5. A
fórmula para a distribuição binomial é mostrada a seguir:

Em que:
P (x) é a probabilidade de x sucessos em N tentativas;
N é o número de tentativas;
π é a probabilidade de sucesso em uma determinada tentativa.
Se aplicarmos isto ao exemplo das moedas, temos:

Se você jogar uma moeda duas vezes, qual é a probabilidade de obter uma ou mais caras? A
probabilidade de obtermos exatamente uma cara é 0,50. Já a probabilidade de obtermos duas
caras é de 0,25, ao passo que a probabilidade de obter uma ou duas caras é de 0,50 + 0,25
= 0,75. Se jogarmos uma moeda 12 vezes, qual seria a probabilidade de obtermos de 0 a 3
caras? A resposta é encontrada calculando a probabilidade de nenhuma cara, uma cara, duas

11
Probabilidade e Estatística

caras e três caras, as quais serão de: 0,0002, 0,0029, 0,0161, e 0,0537. A soma das probabi-
lidades é 0,073. O cálculo de probabilidades binomiais cumulativas pode ser bastante tedioso.

Considere o experimento de arremesso de moeda em que você jogou uma moeda doze vezes e
gravou o número de caras. Você pode esperar a metade das jogadas cair e, por conseguinte, o
número médio de caras seria 6. Em geral, a média de uma distribuição binomial com parâmetros
N (o número de ensaios) e π (a probabilidade de sucesso de cada ensaio) é:

μ=Nπ

Em que:

μ é a média da distribuição binomial.

A variância da distribuição binomial é dada por:

σ2 = N π (1-π)

Em que:

σ2 é a variância da distribuição binomial.

Vamos voltar para o experimento moeda de arremesso. A moeda foi jogada doze vezes, certo?
Então N = 12. Há uma probabilidade de 0,5 de obtermos cara. Portanto, π = 0,5. A média e
variância, por conseguinte, podem ser calculadas conforme a seguir:

μ = N π = (12) (0,5) = 6
σ2 = N π (1-π) = (12) (0,5) (1,0 - 0,5) = 3,0.

Não esquecendo que o desvio padrão (σ) é a raiz quadrada da variância (σ2). Um bom exemplo
da utilização da distribuição binomial em uma indústria é a fabricação de lâmpadas. Uma análise
feita no lote produzido no dia anterior detectou que 1% das lâmpadas produzidas nesse lote eram
defeituosas. Na produção de hoje, foi retirada uma amostra aleatória de 30 lâmpadas. O engenhei-
ro responsável pela produção precisa saber se há nesta amostra mais de uma lâmpada defeituosa.
Após o cálculo, utilizando a distribuição binomial teremos que a probabilidade será de 3,61%.

3.2.2 Distribuição Poisson


Na teoria da probabilidade e estatística, a distribuição de Poisson (em homenagem ao matemá-
tico francês Siméon Denis Poisson) é uma distribuição de probabilidade discreta que expressa a
probabilidade de um determinado número de eventos ocorrerem em um intervalo de tempo e/
ou espaço fixo. Estes eventos ocorrem com uma taxa média conhecida e independente do tempo
desde o último caso ocorrido.

A distribuição de Poisson também pode ser utilizada para eventos em outros intervalos especifi-
cados, tais como a distância, área ou volume. Por exemplo, o número de chamadas telefônicas
recebidas em um call center por hora, o número de eventos de luminosidade por segundo a partir
de uma fonte radioativa, ou o número de pedestres em uma rua em determinada hora do dia.

A distribuição foi introduzida pela primeira vez por Siméon-Denis Poisson (1781-1840) e publica-
da, com sua teoria da probabilidade, em 1837, em sua obra Pesquisa sobre a probabilidade de
Laureate- International Universities
decisões em Matéria Penal e Civil. O trabalho teorizou sobre o número de condenações injustas
de um dado país, concentrando-se em certas variáveis aleatórias
​​ (N) que contam, entre outras
coisas, o número de ocorrências discretas que, em algumas vezes, chamamos de eventos e ocor-
rem durante um intervalo de tempo determinado.

12
A aplicação prática desta distribuição foi feita por Ladislaus Bortkiewicz em 1898, quando lhe foi dada
a tarefa de investigar o número de soldados no exército prussiano mortos acidentalmente por chutes de
cavalo. Neste contexto, foi introduzida a distribuição de Poisson para o campo da engenharia.

A distribuição de Poisson pode ser usada para calcular as probabilidades de diferentes números
de “sucessos” com base em um número médio de sucessos. A fim de aplicar a distribuição de
Poisson, os vários eventos devem ser independentes. Tenha em mente que o termo “sucesso”
realmente não significa sucesso no sentido positivo tradicional, mas apenas que o resultado
desejado ocorreu.

Imagine que você sabia que o número médio de chamadas para um quartel dos bombeiros em
um dia de semana era igual a 8. Qual é a probabilidade de que em um determinado dia da
semana houvesse 11 chamadas ao invés de 8? Este problema pode ser resolvido com a seguinte
fórmula, baseada na distribuição de Poisson:

Em que:
e é a base dos logaritmos naturais (2,7183);
μ é a média do número de “sucessos”;
x é o número de “sucessos” em questão.

Para este exemplo,

Desde que a média seja 8 e a questão refira-se a 11 chamados.

Aplicações da Distribuição de Poisson:

• defeitos congênitos e mutações genéticas;


• doenças raras como a leucemia;
• acidentes de carro;
• fluxo de tráfego;
• número de erros de digitação em uma página;
• pelos encontrados em hambúrguer do McDonald;
• disseminação de um animal em extinção no continente africano;
• falha de uma máquina em um mês.

Média e variância de Distribuição de Poisson

Se μ é o número médio de sucessos ocorridos num determinado intervalo de tempo da distribuição


de Poisson, então a média e o desvio da distribuição são ambos iguais a μ. Na distribuição de
Poisson, apenas um parâmetro (μ) é necessário para determinar a probabilidade de um evento.

Você deve estar se perguntando: “mas qual é a diferença entre as distribuições de Poisson e bi-
nomial?”. Enquanto a distribuição binomial pode ser usada para encontrar a probabilidade de

13
Probabilidade e Estatística

um número designado de sucessos em “n” tentativas, a distribuição de Poisson é usada para


encontrar a probabilidade de um número designado de sucessos por unidade de intervalo. As
outras condições exigidas para se aplicar a distribuição binomial são também exigidas para se
aplicar a distribuição de Poisson, isto é, deve existir somente dois resultados mutuamente
exclusivos, os eventos devem ser independentes e o número médio de sucessos por unidade
de intervalo deve permanecer constante.

A distribuição de Poisson é frequentemente usada em pesquisa operacional na solução de proble-


mas administrativos. Alguns exemplos são o número de chamadas telefônicas para a polícia por
hora, o número de clientes chegando a posto de gasolina por hora, e o número de acidentes de
tráfego num cruzamento por semana. Um exemplo de produção, para melhor entendimento da
utilização da distribuição de Poisson é: uma fábrica de componentes eletrônicos produz uma média
de 5 peças com defeito por hora. Qual a probabilidade desta fábrica não produzir nenhuma peça
defeituosa em um intervalo de 1 hora? Fazendo o cálculo, temos que a probabilidade é de 0,67%

3.2.3 Distribuição Normal


A distribuição normal é a distribuição mais importante e mais amplamente utilizada nas estatís-
ticas. Às vezes é chamada de curva do sino ou curva de Gauss, em homenagem ao matemá-
tico Karl Friedrich Gauss. Embora Gauss tenha um papel importante na história da curva, foi
Abraham de Moivre que descobriu a distribuição normal. Distribuições normais podem diferir
em sua forma e desvio padrão. A Figura 2 mostra três distribuições normais. A verde, mais à es-
querda, a distribuição em vermelho no meio e a distribuição de preto, mais à direita. Estas, bem
como todas as outras distribuições normais, são simétricos com os valores relativamente mais no
centro da distribuição e menos nas caudas.

Figura 2 - Distribuições normais que diferem em média e desvio padrão.


Fonte: Elaborada pelo autor, 2015.

Laureate- International Universities

14
A densidade da distribuição normal ou a altura de um dado valor no eixo X é mostrada a seguir.
O símbolo que representa a base do logaritmo natural é π, constante.

A distribuição normal possui sete características, as quais estão listadas a seguir!

• 1. As distribuições normais são simétricas em torno de sua média.

• 2. A média, mediana e moda de uma distribuição normal são iguais.

• 3. A área abaixo da curva normal é igual a 1,0.

• 4. Distribuições normais são mais densas no centro e menos densa nas caudas.

• 5. Distribuições normais são definidas por dois parâmetros, a média (μ) e o desvio-padrão
(Đ).

• 6. 68% da área de uma distribuição normal está dentro de um desvio padrão da média.

• 7. Aproximadamente 95% da área de uma distribuição normal está dentro de dois desvios
padrão da média.

Já vimos que a distribuição binomial pode ser usada para resolver problemas, tais como: se uma
moeda honesta é jogada 100 vezes, qual é a probabilidade de obtermos 60 ou mais caras? A
probabilidade “x caras” de N tentativas é calculada usando a fórmula:

Em que:
x é o número de caras (60);
N é o número de jogadas (100);
π é a probabilidade de uma cara (0.5).

Portanto, para resolver esse problema, você pode calcular a probabilidade de 60 caras, a
probabilidade de 61 caras, 62 caras, assim por diante e somar todas estas probabilidades.
Imagine quanto tempo as pessoas levavam para calcular as probabilidades binomiais antes do
advento das calculadoras e computadores.

Abraham de Moivre, um estatístico do século VXIII e consultor para os jogadores de cartas,


muitas vezes foi chamado a fazer esses cálculos demorados. Moivre notou que, quando o
número de eventos aumentava, a forma da distribuição binomial aproximava-se de uma
curva muito suave. Moivre pensou que se conseguisse encontrar uma expressão matemática
para esta curva, ele seria capaz de resolver problemas tais como encontrar a probabilidade de
60 ou mais caras de 100 jogadas muito mais fácil. A curva que ele descobriu agora é
chamada de curva normal.

15
Probabilidade e Estatística

0 2 4 6 8 10 12

Figura 3 - A aproximação normal para a distribuição binomial para 12 jogadas.


Fonte: Elaborada pelo autor, 2015.

A curva suave é a distribuição normal. Note que ela se aproxima das probabilidades binomiais
representadas pelas alturas das linhas azuis. A importância da curva normal é que as distribuições
de diversos fenômenos naturais são aproximadamente uma distribuição normal. Uma das primei-
ras aplicações da distribuição normal é a análise de erros de medição feita em observações astro-
nômicas, erros que ocorreram por causa de instrumentos imperfeitos e observadores imperfeitos.

Galileu, no século XVII, observou que estes erros eram simétricos e que pequenos erros ocorriam
com maior frequência do que os grandes erros. Isso levou a várias distribuições hipotéticas de
erros, mas foi no início do século XIX que descobriu-se que esses erros seguiam uma distribuição
normal. Independente disso, os matemáticos Adrain em 1808 e Gauss em 1809 desenvolveram a
fórmula para a distribuição normal e mostraram que os erros se encaixam bem nesta distribuição.

Essa mesma distribuição foi descoberta por Laplace em 1778. Laplace mostrou que, mesmo que
uma distribuição não seja normalmente distribuída, os meios de amostras repetidas da distribui-
ção seriam quase uma distribuição normal, e que quanto maior for o tamanho da amostra mais
ela se aproxima de a uma distribuição normal.

Quételet (1840) foi o primeiro a aplicar a distribuição normal para características humanas. Ele
observou que as características tais como altura, peso e força foram distribuídas normalmente.
As áreas sob as porções de uma distribuição normal podem ser obtidas através de cálculo. A
Figura 4 mostra uma distribuição normal com uma média de 50 e um desvio padrão de 10. A
área sombreada entre 40 e 60 contém 68% da distribuição.

Laureate- International10 20 30
Universities 40 50 60 70 80 90

Figura 4 - A distribuição normal com uma média de 50 e desvio padrão de 10 e


68% da superfície está dentro de um desvio padrão (10) da média (50).
Fonte: Elaborada pelo autor, 2015.

16
A Figura 5, por sua vez, mostra uma distribuição normal com uma média de 100 e um desvio pa-
drão de 20. Tal como na Figura 4, 68% da distribuição está dentro de um desvio padrão da média

20 40 60 80 100 120 140 160 180

Figura 5 - A distribuição normal com uma média de 100 e desvio padrão de 20 e


68% da superfície está dentro de um desvio padrão (20) da média (100).
Fonte: Elaborada pelo autor, 2015.

As distribuições normais mostradas nas Figuras 4 e 5 são exemplos específicos da regra geral de
68%. A Figura 6 mostra uma distribuição normal com uma média de 75% e um desvio padrão
de 10. A área sombreada contém 95% e estende-se de 55,4 a 94,6. Para todas as distribuições
normais, 95% da superfície está dentro de 1,96 desvios padrão da média.

35 45 55 65 75 85 95 105 115

Figura 6 - Uma distribuição normal com uma média de 75 e um desvio padrão de


10 e 95% da superfície está dentro de 1,96 desvios padrão da média.
Fonte: Elaborada pelo autor, 2015.

Vamos supor que em uma indústria produtora de parafusos, porcas e arruelas, a espessura média
de arruelas tenha distribuição normal com média de 11,15mm e desvio padrão de 2,238mm.
Qual a porcentagem de arruelas com espessura entre 8,70mm e 14,70mm? Utilizando a
distribuição normal, temos que essa probabilidade é de 80,50%.

Outro exemplo é o de uma fazenda criadora de porcos. Imagine que o peso médio de 800
porcos dessa fazenda é de 64 kg, e o desvio padrão é de 15kg. Se este peso for distribuído de
forma normal, você pode utilizar os cálculos da distribuição normal para saber quantos porcos
pesarão entre 42kg e 73kg. Executando os cálculos, chegaremos ao número de 525 animais.

17
Probabilidade e Estatística

CASO

Fábrica de sacolas de papel

Um fabricante de sacolas de papel para supermercado está tendo problemas com a qualidade de
seu produto. A questão está relacionada à resistencia e a tração do papel das sacolas. Após uma
análise prévia, foi verificado que essa variável segue um modelo normal, com uma média de 40N
e um desvio padrão de 2N. Seus clientes necessitam de uma resitência à tração mínima de 35N.

Na proxima semana, haverá uma entrega de 100.000 sacolas. Para esse fato, qual deve ser a
probabilidade de produzir as sacolas com essa especificação? O fabricante deverá criar um pla-
no de ação para garantir essa probabilidade mínima e aumentar a confiabilidade para 95%, pois
sabemos que a variabilidade aceita em um processo estável é de, no máximo, 5%.

3.2.4 Distribuição Multinominal


A distribuição binomial permite calcular a probabilidade de obtenção de um determinado núme-
ro de resultados binários. Assim, o lançamento de uma moeda terá um resultado binário, pois
limita-se a duas possibilidades. A distribuição multinominal, por sua vez, pode ser usada para
calcular as probabilidades em situações em que existam mais do que dois resultados possíveis.

Por exemplo, imagine que dois jogadores de xadrez tenham jogado vários jogos. Ficou determi-
nado que a probabilidade de o jogador A ganhar é de 0,40. Já a probabilidade de o jogador B
vencer é de 0,35, enquanto a probabilidade de o jogo terminar em empate é de 0,25. A distri-
buição multinominal pode ser usada para responder a perguntas como: “Se os dois jogarem 12
jogos, qual é a probabilidade de que o jogador A ganhe 7 jogos, o jogador B ganhe 2 jogos, e
o restante dos jogos resulte em empate?”.

A fórmula a seguir dá a probabilidade de obtenção de um conjunto específico de resultados,


quando há três resultados possíveis para cada evento:

Em que:
P é a probabilidade;
n é o número total de eventos;
n1 é o número de vezes que ocorre Resultado 1;
n2 é o número de vezes que ocorre Resultado 2;
n3 é o número de vezes que ocorre Resultado 3;
P1 é a probabilidade do resultado 1;
P2 é a probabilidade do resultado 2;
P3 é a probabilidade do resultado 3.

Laureate- International Universities

18
Para o exemplo do xadrez:

n = 12 (12 jogos são disputados);


n1 = 7 (número vitórias do jogador A);
n2 = 2 (número vitórias do Jogador B);
n3 = 3 (número de empates);
p1 = 0,40 (probabilidade do jogador A ganha);
p2 = 0,35 (probabilidade Jogador B ganha);
P3 = 0,25 (probabilidade de um empate).
A fórmula para resultados k é:

Note-se que a distribuição binomial é um caso especial da multinominal quando k = 2.

Aqui, temos o seguinte exemplo: uma máquina de tubos metálicos cujos diâmetros podem ser
considerados uma variável aleatória normal com média 200mm e desvio padrão de 2mm. Veri-
fica-se que 15% dos tubos estão sendo rejeitados como grandes e 10% como pequenos. Quais
são as tolerâncias de especificação para esse diâmetro? Mantidas essas especificações, qual
deverá ser a regulagem média da máquina para que a rejeição por diâmetro grande seja nula?
Nesse caso, qual será a porcentagem de rejeição por diâmetro pequeno?

Como podemos verificar, a máquina deve ser regulada para valores entre 198mm e 202mm,
lembrando que existe uma tendência maior de obtermos peças com diâmetro maior, portanto
nada impede de, por segurança, colocarmos de 198mm a 201,50.

VOCÊ QUER VER?


Neste vídeo da Univesp TV, você pode rever as principais propriedades da distribuição
estatísticas, complementando os conhecimentos recém-adquiridos sobre o cálculo de
distribuição. Disponível em: <https://www.youtube.com/watch?v=j3Zbup0KMxY>.

3.3 Correlação e Regressão Linear


O uso da regressão linear ou correlação existe quando você precisa saber se uma variável de
medição está associada a outra variável de medição, ou então quando você quer medir a força
da associação entre essas variáveis, na equação que descreve o relacionamento entre elas,
podendo ser usada para prever valores desconhecidos. Um dos gráficos mais comuns coloca
uma variável de medição no x (horizontal) e a outra no eixo y (vertical).

3.3.1 Correlação Linear


O objetivo de uma análise de correlação linear é determinar se existe uma relação entre dois conjun-
tos de variáveis. Existem três tipos de correlação: correlação positiva, correlação negativa e nenhuma
correlação. Essas relações podem ser facilmente visualizadas usando diagramas de dispersão.

19
Probabilidade e Estatística

• Correlação positiva: com o aumento dos valores do eixo X, os valores do eixo Y tendem
a aumentar. Se fosse numa correlação positiva, todos os pontos cairiam sobre uma linha
reta. Esses pontos demonstrarão que o relacionamento entre as duas variáveis é perfeito.

0
0 2 4 6 x

Figura 7 - Correlação positiva.

Figura 7 - Correlação positiva.


Fonte: Elaborada pelo autor, 2015.

• Correlação negativa: com o aumento dos valores do eixo X, os valores do eixo Y tendem
a diminuir. Se fosse numa correlação negativa, todos os pontos caiririam sobre uma linha
reta. Esses pontos demonstrarão que o relacionamento entre as duas variáveis é perfeito.

0
0 2 4 6 x

Figura 8 - Correlação negativa.


Fonte: Elaborado pelo autor, 2015.

Laureate- International Universities

20
• Nenhuma correlação: parece não haver qualquer relação entre as duas variáveis.

10
9
8
7
6
5
4
3
2
1
0
1 1,5 2 2,5 3

Figura 9 - Nenhuma correlação.


Fonte: Elaborada pelo autor, 2015.

3.3.2 Regressão Linear


Técnica matemática para encontrar a linha reta que melhor se ajusta aos valores de uma fun-
ção linear, plotados em um gráfico de dispersão como pontos de dados. Se o melhor ajuste de
linha for encontrado, ele pode ser usado como base para estimar os valores futuros da função,
estendendo-o, mantendo a sua inclinação. A regressão linear é a análise preditiva mais básica e
comumente usada. Estimativas de regressão são usadas para descrever dados e para explicar a
relação entre uma variável dependente e uma ou mais variáveis independentes.

A seguir, apresentamos três exemplos práticos de correlação linear:

1. O gerente de produto responsável por uma determinada marca de cereal matinal infantil
gostaria de prever a demanda para o cereal durante o próximo ano. Para utilizar a análise
de regressão, a equipe sabe que as seguintes variáveis podem afetar as vendas:
» preço do produto;
» número de crianças de 5 a 12 anos de idade (o mercado-alvo);
» preço de produtos do concorrente;
» eficácia da publicidade (como medido pela publicidade exposição);
» as vendas anuais do ano em questão;
» as vendas anuais de períodos anteriores.

2. Um especulador de ouro está considerando uma grande compra de barras de ouro. Ele
gostaria de prever o preço do produto para dois anos a partir de agora. Seu horizonte de
planejamento, portanto, se dará por meio de análise de regressão. Em preparação, ele
produz a seguinte lista de variáveis independentes:
» taxa de juros;
» taxa de inflação;
» preço do petróleo;
» a demanda por jóias de ouro;
» a demanda por ouro industrial e comercial;
» a cotação da bolsa.

21
Probabilidade e Estatística

3. Um agente imobiliário gostaria de prever com precisão o preço de venda de casas. Ele
acredita que algumas variáveis afetam o preço de uma proriedade:
» tamanho da casa (número de pés quadrados);
» número de quartos;
» fachada do lote;
» condição;
» localização.

Em cada um desses exemplos, o principal motivo para utilizar a análise de regressão é a previsão.
No entanto, analisar a relação entre as variáveis também pode ser bastante útil na gestão da toma-
da de decisão. Por exemplo, o gerente de produto pode querer saber como o preço está relaciona-
do com a demanda do produto para tomar uma decisão sobre uma possível mudança nos preços.

VOCÊ QUER LER?


Vamos estudar mais alguns exemplos de Diagrama de Dispersão? Esse link o levará a
um estudo que apresenta um exemplo resolvido de utilização do diagrama, bem como
explicações a respeito de como efetuar cada etapa. Disponível em: <http://www.esalq.
usp.br/qualidade/mod3/pag1_3.htm>

3.3.3 Coeficiente de Correlação


O coeficiente de correlação r, chamado coeficiente de correlação linear, mede a força e a di-
reção de uma relação linear entre duas variáveis. A correlação linear coeficiente é, por vezes,
referida como o coeficiente de correlação de Pearson em homenagem a seu criador: Karl Pearson
(1910). A fórmula matemática para calcular r é:

Em que:
n é o número de pares de dados.

O valor de r é tal que -1 <r <1. Os sinais + e - são usados para correlações lineares positivas
e correlações lineares negativas, respectivamente. A associação entre duas variáveis pode ser
de dois tipos: correlacional e experimental. Numa relação experimental, os valores de uma das
variáveis são controlados pela atribuição ao acaso do objeto sendo estudado e observando o
que acontece com os valores da outra variável. Por exemplo, pode-se atribuir dosagens casuais
de certa droga e observar a resposta do organismo testado; pode-se atribuir níveis de fertilizante
ao acaso e observar as diferenças na produção de determinada cultura.

Na associação correlacional, por outro lado, não se tem nenhum controle sobre as variáveis
estudadas. Elas são observadas como ocorrem em seu ambiente natural, sem nenhuma interfe-
rência, isto é, as duas variáveis são aleatórias. Assim, a diferença entre as duas situações é que
na experimental nós atribuímos valores ao acaso de uma forma não tendenciosa, e na outra a
atribuição é feita pela natureza.

22 Laureate- International Universities


3.3.4 Regressão
Os estatísticos são muitas vezes chamados para desenvolver métodos para prever uma variável
a partir de outras variáveis. Por exemplo, pode-se querer prever a média de uma faculdade pela
frequência dos alunos. Na regressão linear simples, prevemos o valor de uma variável a partir
valores de uma segunda variável. A variável que estamos prevendo é referida como Y. A variável
na qual estamos nos baseando é chamada variável critério e é referida como X.

Quando existe apenas uma variável de previsão, o método é chamado de regressão simples. Na
regressão linear simples as previsões de Y, quando plotadas em função do X, formam uma linha
reta. Os dados de exemplo na Tabela 1 estão representados na Figura 10. Você pode ver que há
uma relação positiva entre X e Y, portanto podemos dizer que quanto maior o valor de X, mais
elevada a previsão de Y.

X Y

1.00 1.00
2.00 2.00
3.00 1.30
4.00 3.75
5.00 2.25

Tabela 1 - Os dados de exemplo.


Fonte: Elaborado pelo autor, 2015.

y 5

0
1 2 3 4 5
X

Figura 10 - Um gráfico de dispersão dos dados de exemplo.


Fonte: Elaborado pelo autor, 2015.

23
Probabilidade e Estatística

A regressão linear consiste em encontrar a linha reta que melhor se ajuste através de todos os
pontos, a qual é chamada de linha de regressão. A linha diagonal preta na Figura 11 é a linha de
regressão, e consiste no valor previsto em Y para cada valor possível de X. As linhas verticais dos
pontos para a linha de regressão representam os erros de predição. Como você pode ver, o ponto
vermelho está muito perto da linha de regressão e o erro é pequeno. Em contrapartida, o ponto
de amarelo está bastante distante da linha de regressão e, por conseguinte, o erro é grande.

y 5

4 3.75

2.00 2.25
2

1.30
1
1.00

0
1 2 3 4 5

Figura 11 - Um gráfico de dispersão dos dados de exemplo. A linha preta consiste nas previsões, os pontos
são os dados reais. Já as linhas verticais entre os pontos e a linha preta representam os erros de previsão.
Fonte: Elaborado pelo autor, 2015.

A Tabela 2 mostra os valores preditos (Y ‘) e os erros de previsão (Y-Y’). Por exemplo, o primeiro
tem um ponto Y de 1,00 e um Y ‘ de 1,21. Portanto, o erro de previsão é de -0,21.

X Y Y’ Y-Y’ (Y-Y’)2

1.00 1.00 1.210 -0.210 0.044


2.00 2.00 1.635 0.365 0.133
3.00 1.30 2.060 -0.760 0.578
4.00 3.75 2.485 1.265 1.600
5.00 2.25 2.910 -0.660 0.436

Tabela 2 - Dados de exemplo.


Fonte: Elaborado pelo autor, 2015.

O critério International
Laureate- mais comumente usado para a linha de melhor ajuste é a linha que minimiza a soma
Universities
dos quadrados dos erros de previsão. A última coluna da Tabela 2 mostra os quadrados dos erros
de predição, cuja soma é inferior ao que seria com qualquer outra linha de regressão. A fórmula
para uma linha de regressão é:

Y ‘= bX + A,

24
Em que:
Y ‘representa o valor previsto;
b é o declive da linha;
A é a ordenada Y.

A equação para a linha na Figura 11 é:


Y ‘= 0.425X + 0,785, para X = 1,
Y ‘= (0,425) (1) + 0,785 = 1.21

E para X = 2,
Y ‘= (0,425) (2) + 0,785 = 1,64.

A equação de regressão é mais simples se as variáveis ​​são uniformizadas, de modo que os seus meios
são iguais a 0 e desvios padrão são iguais a 1. Um bom exemplo de regressão linear é o consumo
de combustível em um carro. Após uma regulagem eletrônica, um veículo apresenta um rendimento
ideal no que tange a consumo de combustível. Contudo, com o passar do tempo, esse rendimento vai
se degradando. Os dados a seguir representam o rendimento medido mês a mês após a regulagem.

X 1 2 3 4 5 6

Y 10,7 10,9 10,8 9,3 9,5 10,4

X 7 8 9 10 11 12

Y 9,0 9,3 7.6 7,6 7,9 7,7

Tabela 3 - relação entre o tempo de manutenção e o rendimento em Km/l.


Fonte: Elaborado pelo autor, 2015.

X: meses após a regulagem


Y: rendimento em Km/l

VOCÊ QUER VER?


Ficou interessado em regressão linear e na correlação entre as variáveis? Quer assistir
a um vídeo que explique os cálculos? Então acesse o canal Falando Matemática Prof.
Allan e veja a videoaula Correlação e Regressão Linear. Disponível em: <https://www.
youtube.com/watch?v=5Nmzd9slQk0>.

25
Síntese Síntese
Concluímos este capítulo sobre a aplicação da teoria da probabilidade, bem como seus concei-
tos principais e características norteadoras. Agora você possui instrumentos teóricos para poder
solucionar problemas e situações que envolvam a probabilidade.

Neste capítulo, você teve a oportunidade de:

• conhecer os conceitos básicos de probabilidade


• aprender os modelos teóricos Binomial, Poisson e Nornal
• compreender os fundamentos básicos da correlação e regressão linear

• identificar os coeficientes de correlação e os parâmetros de regressão

26 Laureate- International Universities


Referências Bibliográficas
AMARAL, D.A. Gauss, Carl Friedrich (1777-1855). Disponível em: <http://www.fem.unicamp.
br/~em313/paginas/person/gauss.htm>. Acesso em: 30 dez. 2015.

BUSSAB, W. O.; MORETTIN, P. A. Estatística básica. 5 ed. São Paulo: Saraiva, 2002.

CORRELAÇÃO e Regressão Linear Simples. Produzido por Falando Matemática prof. Allan. 19
nov. 2014. Disponível em: <https://www.youtube.com/watch?v=5Nmzd9slQk0>. Acesso em:
30 dez. 2015.

DEVORE, J. L. Probabilidade e Estatística para Engenharia e Ciências. São Paulo: Thomp-


son, 2006.

ESTATÍSTICA - Aula 11 - Distribuições de probabilidade. Produzido por Univesp TV. 09 Mar.


2015. Disponível em: <https://www.youtube.com/watch?v=j3Zbup0KMxY>. Acesso em: 30
dez. 2015.

INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTRATÍSTICA (IBGE). Evolução da Mortalidade


– 2000 – Brasil. Disponível em: <http://www.ibge.gov.br/home/estatistica/populacao/tabuade-
vida/evolucao_da_mortalidade.shtm>. Acesso em: Acesso em: 30 dez. 2015.

LEVINE, D. M.; BERENSON, M. L; e STEPHAN, D. Estatística: teoria e aplicações usando o


Microsoft® Excel em português. 3. ed. Rio de Janeiro: LTC, 2005.

MAGALHÃES, A. N.; LIMA, A. C. P. Noções de probabilidade e estatística. 6. ed. São Paulo:


Edusp, 2005.

MONTGOMERY, D.C.; RUNGER, G. C. Estatística aplicada e probabilidade para enge-


nheiros. Rio de Janeiro: LTC, 2003.

MORGADO, A.C.O. et al. Análise Combinatória e Probabilidade. Rio de Janeiro: IMPA/


VITA, Coleção Vitae, 1991.

PIETRANTONIO, H. Modelos probabilísticos em segurança diária. Jun. 2009. Disponível


em: <http://sites.poli.usp.br/d/ptr5802/ModProb.pdf>. Acesso em: 30 dez. 2015.

REYES, A. E. L.; VICINO, S. R. Diagrama de dispersão. CIAGRI - DME-ESALQ/USP. Disponível


em: <http://www.esalq.usp.br/qualidade/mod3/pag1_3.htm>. Acesso em: 30 dez. 2015.

SANTOS, P.O.; MELLO, M. P.; MURARI, I.T. C. Introdução à Análise Combinatória. 3. ed.
Campinas: Unicamp, 2002.

UOL. Brasil tem mais de 204 milhões de habitantes, diz IBGE. 28 ago. 2015. Dispo-
nível em: <http://noticias.uol.com.br/cotidiano/ultimas-noticias/2015/08/28/brasil-tem-mais-
-de-204-milhoes-de-habitantes-diz-ibge.htm>. Acesso em: 30 dez. 2015.

27

Você também pode gostar