Explorar E-books
Categorias
Explorar Audiolivros
Categorias
Explorar Revistas
Categorias
Explorar Documentos
Categorias
Probabilidade e
Estatística
Sumário
CAPÍTULO 3 – Como Aplicar a Teoria da Probabilidade?....................................................05
Introdução.....................................................................................................................05
3.1.3 Resultado........................................................................................................07
3.1.4 Evento.............................................................................................................07
3.3.4 Regressão........................................................................................................23
Síntese...........................................................................................................................26
Referências Bibliográficas.................................................................................................27
03
Capítulo 3 Como Aplicar a Teoria da
Probabilidade?
Introdução
Você já parou para analisar quais são suas chances de ganhar na Mega-sena? E num jogo de
dois dados? Se compararmos o número de possíveis resultados na Mega-sena, que é bastante
alto, ao número de possíveis resultados num jogo de dados, será fácil concluir que nossa chance
de ganhar num jogo de dados é muito maior. Para que você possa refletir sobre o assunto, a pro-
babilidade de ganhar na Mega-sena com uma única aposta é de 1 chance em 50 milhões. Já
no caso dos dados, a probabilidade de, ao jogarmos dois dados, obtermos o valor 5 é de 11
chances em 100.
Neste capítulo, você irá conhecer, portanto, os conceitos básicos de probabilidade e os modelos
Binomial, Poisson e Normal. Iremos também investigar o que é correlação e regressão linear,
bem como o coeficiente de correlação. Preparado? Então vamos lá!
A teoria da probabilidade paradoxal aplica cálculos precisos para quantificar medidas de in-
certeza de eventos aleatórios. O conceito pode ser ilustrado no contexto de um estudo sobre a
obesidade em crianças de 5-10 anos de idade que buscam atendimento médico em uma prática
pediátrica particular. A população (base de amostragem) inclui todas as crianças que procuraram
atendimento nos últimos 12 meses.
05
Probabilidade e Estatística
IDADE
5 6 7 8 9 10 TOTAL
(anos)
Quadro 1 - Número de casos de obesidade por idade encontrada em uma clinica pediátrica.
Fonte: Elaborado pelo autor, 2015.
Um bom exemplo ligado à área de produção é o seguinte: imagine que numa produção foram
retirados 260 parafusos para serem examinados e em cinco deles foram encontrados defeitos.
Com base nesta informação, podemos estimar que a probabilidade de que um parafuso seja
defeituoso é aproximadamente igual à frequência relativa, que é 5/260 = 0,019 ou 1,9%.
Outro tipo de probabilidade que usamos em produção é a estimativa subjetiva, com base nas
experiências de uma pessoa. Digamos que um engenheiro geológico examina uma extensa área
de propriedade particular, escolhendo o melhor local para perfurar um poço de petróleo. Ele
afirma que, com base em sua experiência anterior, a probabilidade de ser bem sucedido é de
30%. Esta é uma estimativa subjetiva de probabilidade e os interessados na perfuração da área
podem usá-la para tomar sua decisão.
Por exemplo, o tempo não é uma variável aleatória, pois sabemos que amanhã terá 24 horas,
o mês de janeiro terá 31 dias e assim por diante. No entanto, a taxa de retorno esperada sobre
um fundo de investimento e o desvio padrão esperado desses retornos são variáveis aleatórias.
Tentamos prevê-las nos baseando no histórico e em nosso conhecimento de economia, mas não
Laureate- International
poderemos Universities
dizer com certeza que as variáveis obedecerão tudo o que previmos ou esperamos.
06
3.1.3 Resultado
Saiba que resultado refere-se a qualquer valor possível que uma variável aleatória pode tomar. Jo-
gadores de loteria têm uma probabilidade quase certa de perder seu dinheiro apostando, porém
há uma pequena chance de que eles se tornem milionários, pois para um único bilhete de loteria,
existe apenas um resultado. Quando um resultado particular acontece, chamamos de evento.
Resultados significativos são necessários para muitos casos práticos de experimentação em vários
ramos da pesquisa estatística. A escolha do nível de significância estatística é influenciada por
certo número de parâmetros e as alterações nos diferentes tipos de experimentos. Na maioria
dos casos de consideração prática, a distribuição de parâmetros ou qualidade segue uma dis-
tribuição normal, no entanto, devemos tomar cuidado para visualizar outras distribuições dentro
da população dada.
3.1.4 Evento
Na teoria das probabilidades, um evento é um conjunto de resultados de uma experiência para o
qual uma probabilidade é atribuída. Um único resultado pode ser um elemento de muitos eventos
diferentes. Além disso, eventos diferentes em um experimento geralmente não possuem valores
igualmente prováveis, uma vez que eles podem incluir diferentes resultados.
Nosso cotidiano é cheio de eventos aleatórios! O lançamento de uma moeda, os jogos de dados,
a escolha de um “rei” no baralho de cartas e sorteios de loteria são exemplos de eventos deste
tipo. Entenda que os eventos podem ser:
• Independentes - em que cada evento não afeta outros eventos posteriores. Exemplo: se
você jogar uma moeda três vezes e obter cara, qual a chance de que o próximo lance
também seja cara? A chance é simplesmente 1/2, ou 50%, assim como qualquer outro
lance da moeda, pois o que aconteceu no passado não afetará o sorteio atual.
• Se a primeira carta era um rei, então é menos provável que a segunda também o seja, já
que apenas 3 das 51 cartas que ficaram são reis;
• Se a primeira carta não era um rei, então é pouco provável que a segunda seja um rei,
pois das 51 cartas que ficaram, apenas 4 são reis.
07
Probabilidade e Estatística
1/N
Em que:
N representa o tamanho da população = 5.290.
Assim, a probabilidade de que qualquer criança seja selecionada para o exemplo apresentado é
1/5.290 = 0,0002. Na maioria das situações de amostragem, não estamos preocupados com
a amostragem de um indivíduo específico, mas sim com a probabilidade de amostragem de
certos tipos de indivíduos. Por exemplo, qual é a probabilidade de selecionar um menino ou
uma criança de sete anos de idade? A fórmula seguinte pode ser usada para calcular
probabilidades de seleção de indivíduos com atributos específicos. Acompanhe!
Por exemplo, suponha que estamos interessados apenas nas meninas e queremos saber qual é a
probabilidade de selecionar uma menina de 9 anos a partir da sub-população de meninas? Há
um total de NG = 2.730 meninas (NG se refere à população de meninas), e a probabilidade
de selecionar uma de 9 anos a partir da subpopulação de meninas é escrita da seguinte forma:
Isto também significa que 16,9% das meninas têm 9 anos de idade. Note que isto não é o mesmo
que a probabilidade de selecionar uma menina de 9 anos de idade da população total, que é P
(garota de 9 anos de idade) = 461/5290 = 0,087.
08
2. A soma de todas as probabilidades de todos os eventos é igual a 1, desde que ambos os
eventos sejam mutuamente exclusivos e exaustivos.
Outros exemplos são os testes de pressão arterial, eletrocardiograma de rotina, exames de mama,
exames retais digitais, mamografias, exames de sangue e urina. Em cada um desses exemplos,
temos uma tabulação da população ou um quadro de amostragem que nos permite calcular as
probabilidades desejadas. Há casos, no entanto, em que uma tabulação completa não é acessí-
vel e os modelos de probabilidade podem ser usados para gerar apenas probabilidades. Existem
dois modelos de probabilidade particularmente úteis para esses casos:
• o modelo de distribuição binomial, que é útil para probabilidades em que temos uma
variável discreta;
Estes modelos de probabilidade são extremamente importantes na estatística, e nós vamos dis-
cutí-los em seguida.
09
Probabilidade e Estatística
Por isso, a probabilidade de dar cara no primeiro lançamento e cara no segundo lançamento é
o produto de P (1) e P (2), que é 1/2 x 1/2 = 1/4. O mesmo se aplica para o cálculo da proba-
bilidade de uma cara e uma coroa, que é 1/2 x 1/2 = 1/4.
1 Cara Cara
2 Coroa Coroa
3 Cara Coroa
4 Coroa Cara
Os quatro resultados possíveis podem ser classificados pelo número de caras que surgem. Pode-
ria ser duas vezes, uma ou nenhuma. As probabilidades destas possibilidades são mostradas no
Quadro 3 e na Figura 1. Uma vez que dois dos resultados representam o caso em que apenas
uma cara aparece nas duas jogadas, a probabilidade deste evento é igual a 1/4 + 1/4 =1/2.
Confira a seguir!
Duas 1/4
Uma 1/2
Laureate- International Universities
Nenhuma 1/4
10
PROBABILIDADE
0,60
0,50
0,40
0,30 Probabilidade
0,20
0,10
0,00
Em que:
P (x) é a probabilidade de x sucessos em N tentativas;
N é o número de tentativas;
π é a probabilidade de sucesso em uma determinada tentativa.
Se aplicarmos isto ao exemplo das moedas, temos:
Se você jogar uma moeda duas vezes, qual é a probabilidade de obter uma ou mais caras? A
probabilidade de obtermos exatamente uma cara é 0,50. Já a probabilidade de obtermos duas
caras é de 0,25, ao passo que a probabilidade de obter uma ou duas caras é de 0,50 + 0,25
= 0,75. Se jogarmos uma moeda 12 vezes, qual seria a probabilidade de obtermos de 0 a 3
caras? A resposta é encontrada calculando a probabilidade de nenhuma cara, uma cara, duas
11
Probabilidade e Estatística
caras e três caras, as quais serão de: 0,0002, 0,0029, 0,0161, e 0,0537. A soma das probabi-
lidades é 0,073. O cálculo de probabilidades binomiais cumulativas pode ser bastante tedioso.
Considere o experimento de arremesso de moeda em que você jogou uma moeda doze vezes e
gravou o número de caras. Você pode esperar a metade das jogadas cair e, por conseguinte, o
número médio de caras seria 6. Em geral, a média de uma distribuição binomial com parâmetros
N (o número de ensaios) e π (a probabilidade de sucesso de cada ensaio) é:
μ=Nπ
Em que:
σ2 = N π (1-π)
Em que:
Vamos voltar para o experimento moeda de arremesso. A moeda foi jogada doze vezes, certo?
Então N = 12. Há uma probabilidade de 0,5 de obtermos cara. Portanto, π = 0,5. A média e
variância, por conseguinte, podem ser calculadas conforme a seguir:
μ = N π = (12) (0,5) = 6
σ2 = N π (1-π) = (12) (0,5) (1,0 - 0,5) = 3,0.
Não esquecendo que o desvio padrão (σ) é a raiz quadrada da variância (σ2). Um bom exemplo
da utilização da distribuição binomial em uma indústria é a fabricação de lâmpadas. Uma análise
feita no lote produzido no dia anterior detectou que 1% das lâmpadas produzidas nesse lote eram
defeituosas. Na produção de hoje, foi retirada uma amostra aleatória de 30 lâmpadas. O engenhei-
ro responsável pela produção precisa saber se há nesta amostra mais de uma lâmpada defeituosa.
Após o cálculo, utilizando a distribuição binomial teremos que a probabilidade será de 3,61%.
A distribuição de Poisson também pode ser utilizada para eventos em outros intervalos especifi-
cados, tais como a distância, área ou volume. Por exemplo, o número de chamadas telefônicas
recebidas em um call center por hora, o número de eventos de luminosidade por segundo a partir
de uma fonte radioativa, ou o número de pedestres em uma rua em determinada hora do dia.
A distribuição foi introduzida pela primeira vez por Siméon-Denis Poisson (1781-1840) e publica-
da, com sua teoria da probabilidade, em 1837, em sua obra Pesquisa sobre a probabilidade de
Laureate- International Universities
decisões em Matéria Penal e Civil. O trabalho teorizou sobre o número de condenações injustas
de um dado país, concentrando-se em certas variáveis aleatórias
(N) que contam, entre outras
coisas, o número de ocorrências discretas que, em algumas vezes, chamamos de eventos e ocor-
rem durante um intervalo de tempo determinado.
12
A aplicação prática desta distribuição foi feita por Ladislaus Bortkiewicz em 1898, quando lhe foi dada
a tarefa de investigar o número de soldados no exército prussiano mortos acidentalmente por chutes de
cavalo. Neste contexto, foi introduzida a distribuição de Poisson para o campo da engenharia.
A distribuição de Poisson pode ser usada para calcular as probabilidades de diferentes números
de “sucessos” com base em um número médio de sucessos. A fim de aplicar a distribuição de
Poisson, os vários eventos devem ser independentes. Tenha em mente que o termo “sucesso”
realmente não significa sucesso no sentido positivo tradicional, mas apenas que o resultado
desejado ocorreu.
Imagine que você sabia que o número médio de chamadas para um quartel dos bombeiros em
um dia de semana era igual a 8. Qual é a probabilidade de que em um determinado dia da
semana houvesse 11 chamadas ao invés de 8? Este problema pode ser resolvido com a seguinte
fórmula, baseada na distribuição de Poisson:
Em que:
e é a base dos logaritmos naturais (2,7183);
μ é a média do número de “sucessos”;
x é o número de “sucessos” em questão.
Você deve estar se perguntando: “mas qual é a diferença entre as distribuições de Poisson e bi-
nomial?”. Enquanto a distribuição binomial pode ser usada para encontrar a probabilidade de
13
Probabilidade e Estatística
14
A densidade da distribuição normal ou a altura de um dado valor no eixo X é mostrada a seguir.
O símbolo que representa a base do logaritmo natural é π, constante.
• 4. Distribuições normais são mais densas no centro e menos densa nas caudas.
• 5. Distribuições normais são definidas por dois parâmetros, a média (μ) e o desvio-padrão
(Đ).
• 6. 68% da área de uma distribuição normal está dentro de um desvio padrão da média.
• 7. Aproximadamente 95% da área de uma distribuição normal está dentro de dois desvios
padrão da média.
Já vimos que a distribuição binomial pode ser usada para resolver problemas, tais como: se uma
moeda honesta é jogada 100 vezes, qual é a probabilidade de obtermos 60 ou mais caras? A
probabilidade “x caras” de N tentativas é calculada usando a fórmula:
Em que:
x é o número de caras (60);
N é o número de jogadas (100);
π é a probabilidade de uma cara (0.5).
Portanto, para resolver esse problema, você pode calcular a probabilidade de 60 caras, a
probabilidade de 61 caras, 62 caras, assim por diante e somar todas estas probabilidades.
Imagine quanto tempo as pessoas levavam para calcular as probabilidades binomiais antes do
advento das calculadoras e computadores.
15
Probabilidade e Estatística
0 2 4 6 8 10 12
A curva suave é a distribuição normal. Note que ela se aproxima das probabilidades binomiais
representadas pelas alturas das linhas azuis. A importância da curva normal é que as distribuições
de diversos fenômenos naturais são aproximadamente uma distribuição normal. Uma das primei-
ras aplicações da distribuição normal é a análise de erros de medição feita em observações astro-
nômicas, erros que ocorreram por causa de instrumentos imperfeitos e observadores imperfeitos.
Galileu, no século XVII, observou que estes erros eram simétricos e que pequenos erros ocorriam
com maior frequência do que os grandes erros. Isso levou a várias distribuições hipotéticas de
erros, mas foi no início do século XIX que descobriu-se que esses erros seguiam uma distribuição
normal. Independente disso, os matemáticos Adrain em 1808 e Gauss em 1809 desenvolveram a
fórmula para a distribuição normal e mostraram que os erros se encaixam bem nesta distribuição.
Essa mesma distribuição foi descoberta por Laplace em 1778. Laplace mostrou que, mesmo que
uma distribuição não seja normalmente distribuída, os meios de amostras repetidas da distribui-
ção seriam quase uma distribuição normal, e que quanto maior for o tamanho da amostra mais
ela se aproxima de a uma distribuição normal.
Quételet (1840) foi o primeiro a aplicar a distribuição normal para características humanas. Ele
observou que as características tais como altura, peso e força foram distribuídas normalmente.
As áreas sob as porções de uma distribuição normal podem ser obtidas através de cálculo. A
Figura 4 mostra uma distribuição normal com uma média de 50 e um desvio padrão de 10. A
área sombreada entre 40 e 60 contém 68% da distribuição.
Laureate- International10 20 30
Universities 40 50 60 70 80 90
16
A Figura 5, por sua vez, mostra uma distribuição normal com uma média de 100 e um desvio pa-
drão de 20. Tal como na Figura 4, 68% da distribuição está dentro de um desvio padrão da média
As distribuições normais mostradas nas Figuras 4 e 5 são exemplos específicos da regra geral de
68%. A Figura 6 mostra uma distribuição normal com uma média de 75% e um desvio padrão
de 10. A área sombreada contém 95% e estende-se de 55,4 a 94,6. Para todas as distribuições
normais, 95% da superfície está dentro de 1,96 desvios padrão da média.
35 45 55 65 75 85 95 105 115
Vamos supor que em uma indústria produtora de parafusos, porcas e arruelas, a espessura média
de arruelas tenha distribuição normal com média de 11,15mm e desvio padrão de 2,238mm.
Qual a porcentagem de arruelas com espessura entre 8,70mm e 14,70mm? Utilizando a
distribuição normal, temos que essa probabilidade é de 80,50%.
Outro exemplo é o de uma fazenda criadora de porcos. Imagine que o peso médio de 800
porcos dessa fazenda é de 64 kg, e o desvio padrão é de 15kg. Se este peso for distribuído de
forma normal, você pode utilizar os cálculos da distribuição normal para saber quantos porcos
pesarão entre 42kg e 73kg. Executando os cálculos, chegaremos ao número de 525 animais.
17
Probabilidade e Estatística
CASO
Um fabricante de sacolas de papel para supermercado está tendo problemas com a qualidade de
seu produto. A questão está relacionada à resistencia e a tração do papel das sacolas. Após uma
análise prévia, foi verificado que essa variável segue um modelo normal, com uma média de 40N
e um desvio padrão de 2N. Seus clientes necessitam de uma resitência à tração mínima de 35N.
Na proxima semana, haverá uma entrega de 100.000 sacolas. Para esse fato, qual deve ser a
probabilidade de produzir as sacolas com essa especificação? O fabricante deverá criar um pla-
no de ação para garantir essa probabilidade mínima e aumentar a confiabilidade para 95%, pois
sabemos que a variabilidade aceita em um processo estável é de, no máximo, 5%.
Por exemplo, imagine que dois jogadores de xadrez tenham jogado vários jogos. Ficou determi-
nado que a probabilidade de o jogador A ganhar é de 0,40. Já a probabilidade de o jogador B
vencer é de 0,35, enquanto a probabilidade de o jogo terminar em empate é de 0,25. A distri-
buição multinominal pode ser usada para responder a perguntas como: “Se os dois jogarem 12
jogos, qual é a probabilidade de que o jogador A ganhe 7 jogos, o jogador B ganhe 2 jogos, e
o restante dos jogos resulte em empate?”.
Em que:
P é a probabilidade;
n é o número total de eventos;
n1 é o número de vezes que ocorre Resultado 1;
n2 é o número de vezes que ocorre Resultado 2;
n3 é o número de vezes que ocorre Resultado 3;
P1 é a probabilidade do resultado 1;
P2 é a probabilidade do resultado 2;
P3 é a probabilidade do resultado 3.
18
Para o exemplo do xadrez:
Aqui, temos o seguinte exemplo: uma máquina de tubos metálicos cujos diâmetros podem ser
considerados uma variável aleatória normal com média 200mm e desvio padrão de 2mm. Veri-
fica-se que 15% dos tubos estão sendo rejeitados como grandes e 10% como pequenos. Quais
são as tolerâncias de especificação para esse diâmetro? Mantidas essas especificações, qual
deverá ser a regulagem média da máquina para que a rejeição por diâmetro grande seja nula?
Nesse caso, qual será a porcentagem de rejeição por diâmetro pequeno?
Como podemos verificar, a máquina deve ser regulada para valores entre 198mm e 202mm,
lembrando que existe uma tendência maior de obtermos peças com diâmetro maior, portanto
nada impede de, por segurança, colocarmos de 198mm a 201,50.
19
Probabilidade e Estatística
• Correlação positiva: com o aumento dos valores do eixo X, os valores do eixo Y tendem
a aumentar. Se fosse numa correlação positiva, todos os pontos cairiam sobre uma linha
reta. Esses pontos demonstrarão que o relacionamento entre as duas variáveis é perfeito.
0
0 2 4 6 x
• Correlação negativa: com o aumento dos valores do eixo X, os valores do eixo Y tendem
a diminuir. Se fosse numa correlação negativa, todos os pontos caiririam sobre uma linha
reta. Esses pontos demonstrarão que o relacionamento entre as duas variáveis é perfeito.
0
0 2 4 6 x
20
• Nenhuma correlação: parece não haver qualquer relação entre as duas variáveis.
10
9
8
7
6
5
4
3
2
1
0
1 1,5 2 2,5 3
1. O gerente de produto responsável por uma determinada marca de cereal matinal infantil
gostaria de prever a demanda para o cereal durante o próximo ano. Para utilizar a análise
de regressão, a equipe sabe que as seguintes variáveis podem afetar as vendas:
» preço do produto;
» número de crianças de 5 a 12 anos de idade (o mercado-alvo);
» preço de produtos do concorrente;
» eficácia da publicidade (como medido pela publicidade exposição);
» as vendas anuais do ano em questão;
» as vendas anuais de períodos anteriores.
2. Um especulador de ouro está considerando uma grande compra de barras de ouro. Ele
gostaria de prever o preço do produto para dois anos a partir de agora. Seu horizonte de
planejamento, portanto, se dará por meio de análise de regressão. Em preparação, ele
produz a seguinte lista de variáveis independentes:
» taxa de juros;
» taxa de inflação;
» preço do petróleo;
» a demanda por jóias de ouro;
» a demanda por ouro industrial e comercial;
» a cotação da bolsa.
21
Probabilidade e Estatística
3. Um agente imobiliário gostaria de prever com precisão o preço de venda de casas. Ele
acredita que algumas variáveis afetam o preço de uma proriedade:
» tamanho da casa (número de pés quadrados);
» número de quartos;
» fachada do lote;
» condição;
» localização.
Em cada um desses exemplos, o principal motivo para utilizar a análise de regressão é a previsão.
No entanto, analisar a relação entre as variáveis também pode ser bastante útil na gestão da toma-
da de decisão. Por exemplo, o gerente de produto pode querer saber como o preço está relaciona-
do com a demanda do produto para tomar uma decisão sobre uma possível mudança nos preços.
Em que:
n é o número de pares de dados.
O valor de r é tal que -1 <r <1. Os sinais + e - são usados para correlações lineares positivas
e correlações lineares negativas, respectivamente. A associação entre duas variáveis pode ser
de dois tipos: correlacional e experimental. Numa relação experimental, os valores de uma das
variáveis são controlados pela atribuição ao acaso do objeto sendo estudado e observando o
que acontece com os valores da outra variável. Por exemplo, pode-se atribuir dosagens casuais
de certa droga e observar a resposta do organismo testado; pode-se atribuir níveis de fertilizante
ao acaso e observar as diferenças na produção de determinada cultura.
Na associação correlacional, por outro lado, não se tem nenhum controle sobre as variáveis
estudadas. Elas são observadas como ocorrem em seu ambiente natural, sem nenhuma interfe-
rência, isto é, as duas variáveis são aleatórias. Assim, a diferença entre as duas situações é que
na experimental nós atribuímos valores ao acaso de uma forma não tendenciosa, e na outra a
atribuição é feita pela natureza.
Quando existe apenas uma variável de previsão, o método é chamado de regressão simples. Na
regressão linear simples as previsões de Y, quando plotadas em função do X, formam uma linha
reta. Os dados de exemplo na Tabela 1 estão representados na Figura 10. Você pode ver que há
uma relação positiva entre X e Y, portanto podemos dizer que quanto maior o valor de X, mais
elevada a previsão de Y.
X Y
1.00 1.00
2.00 2.00
3.00 1.30
4.00 3.75
5.00 2.25
y 5
0
1 2 3 4 5
X
23
Probabilidade e Estatística
A regressão linear consiste em encontrar a linha reta que melhor se ajuste através de todos os
pontos, a qual é chamada de linha de regressão. A linha diagonal preta na Figura 11 é a linha de
regressão, e consiste no valor previsto em Y para cada valor possível de X. As linhas verticais dos
pontos para a linha de regressão representam os erros de predição. Como você pode ver, o ponto
vermelho está muito perto da linha de regressão e o erro é pequeno. Em contrapartida, o ponto
de amarelo está bastante distante da linha de regressão e, por conseguinte, o erro é grande.
y 5
4 3.75
2.00 2.25
2
1.30
1
1.00
0
1 2 3 4 5
Figura 11 - Um gráfico de dispersão dos dados de exemplo. A linha preta consiste nas previsões, os pontos
são os dados reais. Já as linhas verticais entre os pontos e a linha preta representam os erros de previsão.
Fonte: Elaborado pelo autor, 2015.
A Tabela 2 mostra os valores preditos (Y ‘) e os erros de previsão (Y-Y’). Por exemplo, o primeiro
tem um ponto Y de 1,00 e um Y ‘ de 1,21. Portanto, o erro de previsão é de -0,21.
X Y Y’ Y-Y’ (Y-Y’)2
O critério International
Laureate- mais comumente usado para a linha de melhor ajuste é a linha que minimiza a soma
Universities
dos quadrados dos erros de previsão. A última coluna da Tabela 2 mostra os quadrados dos erros
de predição, cuja soma é inferior ao que seria com qualquer outra linha de regressão. A fórmula
para uma linha de regressão é:
Y ‘= bX + A,
24
Em que:
Y ‘representa o valor previsto;
b é o declive da linha;
A é a ordenada Y.
E para X = 2,
Y ‘= (0,425) (2) + 0,785 = 1,64.
A equação de regressão é mais simples se as variáveis são uniformizadas, de modo que os seus meios
são iguais a 0 e desvios padrão são iguais a 1. Um bom exemplo de regressão linear é o consumo
de combustível em um carro. Após uma regulagem eletrônica, um veículo apresenta um rendimento
ideal no que tange a consumo de combustível. Contudo, com o passar do tempo, esse rendimento vai
se degradando. Os dados a seguir representam o rendimento medido mês a mês após a regulagem.
X 1 2 3 4 5 6
X 7 8 9 10 11 12
25
Síntese Síntese
Concluímos este capítulo sobre a aplicação da teoria da probabilidade, bem como seus concei-
tos principais e características norteadoras. Agora você possui instrumentos teóricos para poder
solucionar problemas e situações que envolvam a probabilidade.
BUSSAB, W. O.; MORETTIN, P. A. Estatística básica. 5 ed. São Paulo: Saraiva, 2002.
CORRELAÇÃO e Regressão Linear Simples. Produzido por Falando Matemática prof. Allan. 19
nov. 2014. Disponível em: <https://www.youtube.com/watch?v=5Nmzd9slQk0>. Acesso em:
30 dez. 2015.
SANTOS, P.O.; MELLO, M. P.; MURARI, I.T. C. Introdução à Análise Combinatória. 3. ed.
Campinas: Unicamp, 2002.
UOL. Brasil tem mais de 204 milhões de habitantes, diz IBGE. 28 ago. 2015. Dispo-
nível em: <http://noticias.uol.com.br/cotidiano/ultimas-noticias/2015/08/28/brasil-tem-mais-
-de-204-milhoes-de-habitantes-diz-ibge.htm>. Acesso em: 30 dez. 2015.
27