Escolar Documentos
Profissional Documentos
Cultura Documentos
Introdução.............................................................................................................................. 3
Conclusão ............................................................................................................................ 21
ii
Introdução
A Teoria das Probabilidades é o ramo da Matemática que estuda e desenvolve modelos que
podem ser utilizados para estudar experimentos ou fenómenos aleatórios. O estudo e
compreensão das probabilidades é útil porque ajuda a desenvolver estratégias. Assim alguns
motoristas parecem demonstrar uma tendência para correr a grandes velocidades se acham
que há pouco risco de serem apanhados, os investidores sentem-se mais inclinados a aplicar
seu dinheiro se as chances de lucros são boas, carregaremos capa ou guarda-chuva se houver
grande probabilidade de chuva; uma empresa pode sentir-se inclinada a negociar se houver
forte ameaça de greve; mais inclinado a investir num novo equipamento se há boa chance de
ganhar dinheiro; ou a contratar um novo funcionário que pareça promissor.
Duas séries estatísticas também podem ser estudadas para compreender a relação entre suas
variáveis, e neste trabalho vamos aprender isso.
3
1. Probabilidades (Noções): distribuições bidimensionais e noção intuitiva e frequencista
das probabilidades
1.1. Distribuições Bidimensionais
As distribuições estatísticas envolvendo o estudo da relação entre duas variáveis chamam-se
distribuições bidimensionais. A análise de regressão é a parte da estatística que investiga a
relação entre duas ou mais variáveis relacionadas de maneira não-determinística.
Exemplos:
a) O tráfego nas ruas que dão acesso a uma escola e o número de alunos que chegam
atrasados a essa escola.
b) O número de televisores vendido por uma loja de uma cidade e o número de
passageiros que viajam nos transportes públicos dessa cidade.
c) O número de pessoas que vivem num prédio e o custo da electricidade de todos os
andares do prédio.
d) O número de flores de um jardim e o número de abelhas no mesmo jardim.
e) O número de horas de estudo da disciplina de Matemática e a nota em Matemática.
Variáveis
Variável: características ou itens de interesse de cada elemento de uma população ou
amostra. Também chamada parâmetro, posicionamento, condição... (Kazmier, 1982, p.99)
Segundo Bussab e Morettin (2010), “a correlação pode ser classificada em negativa, nula e
positiva” (p.134).
a) Correlação positiva – as variáveis evoluem em geral no mesmo sentido: a um
aumento dos valores de uma variável, corresponde também um aumento nos valores
da outra variável.
Exemplo: altura e o peso das pessoas.
4
Exemplo: intensidade da chuva e a temperatura do ar.
5
Quanto maior a correlação, mais próxima de uma recta a 45º ou 135º será a distribuição.
A análise gráfica da relação entre variáveis é importante, mas os olhos nem sempre são um
bom juiz da intensidade de uma relação linear (Kazmier, 1982, p.111).
Nossos olhos podem ser enganados por uma mudança de escalas, ou pela quantidade de
espaço em branco em torno do aglomerado dos pontos. Deve-se, então, utilizar uma medida
numérica para suplementar o gráfico: Coeficiente de Correlação Linear (r) que veremos ao
longo deste trabalho, na dianteira.
Assim,
6
No eixo “x” são representados os valores da variável que é alterada por uma
modificação no processo (variável independente);
Exemplo:
7
a) Organize a informação da tabela através de um diagrama de dispersão ou nuvem de
pontos.
b) À medida que a classificação interna aumenta (valores de x), o que acontece à
classificação de exame (valores de Y) ?
c) Determine as médias da classificação interna e da classificação de exame e designe-as,
respectivamente, por 𝑥, 𝑦. Represente o ponto (centro de gravidade) no referencial.
d) Trace duas rectas paralelas aos eixos coordenados e que passem pelo centro de
gravidade. Em que quadrantes se situam os pontos desta distribuição?
e) Trace uma recta que passe pelo centro de gravidade e se aproxime o mais possível dos
pontos representados no referencial.
Resposta:
b) Olhando a nuvem de pontos acima vê-se que à medida que a classificação interna aumenta
(valores de x), classificação de exame (valores de Y) também aumenta (a correlação é linear
positiva).
8
8𝑥 10+10+11+12+12+13+15+16 99
1 𝑖
𝑥= = = = 12,375
𝑛 8 8
8𝑦 9+10+11+11+12+14+15+16 98
1 𝑖
𝑦= = = = 12,25
𝑛 8 8
d) Traçando duas rectas paralelas aos eixos coordenados e que passem pelo centro de
gravidade, tem-se:
9
Olhando a figura resultante, nota-se que os pontos desta distribuição situam-se no 1º e 3º
quadrantes.
e) Traçando uma recta que passe pelo centro de gravidade e se aproxime o mais possível dos
pontos representados no referencial, tem-se:
A equação de regressão tem por finalidade ESTIMAR valores de uma variável, com base em
valores conhecidos da outra.
ŷi x i + i
Onde:
ŷi valor estimado (variável dependente);
x i variável independente;
coeficiente de regressão (coeficiente angular);
10
coeficiente linear;
i resíduo.
As estimativas dos parâmetros e dadas por “a” e “b”, serão obtidas a partir de uma
amostra de n pares de valores (xi, yi) que correspondem a n pontos no diagrama de dispersão.
i =1 i 1
Para cada par de valores (xi , yi) podemos estabelecer o desvio:
ei yi yˆ i yi (a bxi ) ( Bussab & Morettin, 2010, p.165)
Exemplo: Determine o modelo de regressão linear para a relação Vendas (x 1000) X Lucro
(x100) abaixo:
Obs. 1 2 3 4 5 6 7 8
Vendas 201 225 305 380 560 600 685 735
Lucro 17 20 21 23 25 24 27 27
Resolução:
Para facilitar os cálculos da recta de regressão, acrescentamos três novas colunas na tabela
dada.
Obs. Vendas (Xi) Lucro (Yi) X i2 Yi2 X i .Yi
1 201 17 40401 289 3417
2 225 20 50625 400 4500
3 305 21 93025 441 6405
4 380 23 144400 529 8740
5 560 25 313600 625 14000
6 600 24 360000 576 14400
7 685 27 469225 729 18495
8 735 27 540225 729 19845
3691 184 2011501 4318 89802
11
n n n
n x i yi x i yi
889802 3691 184
a i =1 i 1 i 1
0,0159
82011501 3691
2 2
n
n
n x i2 x i
i =1 i 1
ŷ 0,0159 x + 15,66
Tem como objectivo encontrar o grau de relação entre duas variáveis, ou seja, um coeficiente
de correlação. Esta é a forma mais comum de análise, envolvendo dados contínuos, conhecido
como “r de Pearson”.
Quando uma delas está, de alguma forma, relacionada com a outra, isto é, quando a alteração
no valor de uma variável (dita independente) provoca alterações no valor da outra variável
(dita dependente) ( Bussab & Morettin, 2010, p.165).
S xy x i x y i y
rxy i 1
(Lopes, 2005, p.97)
SxSy n n
x x yi y
2 2
i
i 1 i 1
O coeficiente de correlação varia entre -1 a +1. Valores próximos dos extremos indicam uma
associação forte entre as variáveis. Alguns autores convencionam que:
0 rxy 0,2 ou 0,2 rxy 0 Associação muito baixa;
12
Se rxy for igual a -1 ou +1 diz-se que a relação é perfeita.
Esquematicamente:
valor de r
-0,5 0 +0,5
-1 +1
Negativa Negativa Negativa Positiva Positiva Positiva
forte moderada fraca fraca moderada forte
0
Exemplo:
Considere que o gerente de uma loja está interessado em analisar a relação entre o número de
anúncios mostrados durante o fim-de-semana na televisão local e as vendas na loja durante a
semana seguinte. Para isso, ele recolhe os seguintes dados:
Número de anúncios 2 5 1 3 4 1 5 3 4 2
Volume de vendas (US$) 50 57 41 54 54 38 63 48 59 46
Calcule o coeficiente de correlação linear para avaliar o tipo e a intensidade (magnitude) da
relação entre o número de anúncios e o volume de vendas.
Resolução:
n n
xi 30
y i
510
x i 1
3 e y i 1
51 ,
n 10 n 10
xi x yi y xi x yi y x i x 2 y i y 2
-1 -1 1 1 1
2 6 12 4 36
-2 -10 20 4 100
0 3 0 0 9
1 3 3 1 9
-2 -13 26 4 169
2 12 24 4 144
0 -3 0 0 9
1 8 8 1 64
-1 -5 5 1 25
Total 99 20 566
13
n
x i x y i y
99 99
rxy i 1
0.93
n n
20 566 106 .4
x x y y
2 2
i i
i 1 i 1
Trata-se de correlação positiva muito forte, cujo diagrama de dispersão para a relação número
de anúncios e volume de vendas correspondente é:
Portanto, o gráfico mostra uma tendência crescente, a relação entre as duas variáveis é
positiva.
14
1.2.1. Definição intuitita ou clássica de probabilidade ou Lei de Laplace ou ainda
definição apriori
Segundo Lopes (2005) “o cálculo de probabilidades é um conjunto de técnicas matemáticas
que visa determinar as chances de ocorrência de eventos regidos pelas leis do acaso” (p.67).
Onde:
Os «casos favoráveis a E»/os elementos de E (# E designa o número de elementos de E);
𝒏 – resultados possíveis incompatíveis e equiprováveis do experimento.
𝑃 𝐸 – probabilidade do evento E”. (Vunga, s.d., p.91).
Dicas:
Caso favorável é aquilo que se pretende verificar, é a “parte”, e aparece na
pergunta (nas alíneas);
Casos possíveis correspondem ao espaço amostral, ao total dos casos.
15
1.2.2. Definição frequencista de probabilidades
Define-se probabilidade - definição frequencista - de um acontecimento A e representa-se
por P(A), como sendo o valor obtido para a frequência relativa com que se observou A, num
grande número de realizações da experiência aleatória.
16
Fonte: Chistine (2006, p.123)
Observação: De salientar que as expressões provável e improvável podem ser substituídas
por muito provável e pouco provável, respectivamente. Dai que se dada uma expressão ou a
natureza de ocorrência de um fenómeno aleatório pode-se estimar ou associar um número
entre 0 e 1 que caracterize a sua forma de ocorrência.
P A B P A PB P A B
17
1. Uma urna contém uma ficha para cada anagrama da palavra CARRO. Escolhendo uma
ficha ao acaso, determine a probabilidade de que:
a) O anagrama comece com C.
b) O anagrama comece com R e termine com C.
Resposta:
Seja A – o evento “a ficha escolhida tem anagrama que começa com C”, e; B o evento “a
ficha escolhida tem anagrama que começa com R e termine com C”
A palavra CARRO tem 5 letras, sendo uma repetida (a letra R aparece 2 vezes na palavra).
𝑃 5! 5∙4∙3∙2!
Portanto, casos possíveis: 𝑃5 = 2! = = 60
2 2!
a) Casos favoráveis:
𝑃
Portanto, 𝑃2 ∙ 2 ∙ 𝑃4 = 2 ∙ 𝑃4 = 2 ∙ 4! = 2 ∙ 24 = 48 casos favoráveis. Logo:
2
48
𝑝 𝐴 = = 0,8 = 80%
60
b) Casos favoráveis:
6
Portanto, 𝑃3 = 3! = 6 casos favoráveis. Logo: 𝑝 𝐵 = 60 = 0,10 = 10%
18
2. De um baralho de 52 cartas, tiram-se 2 delas sem reposição. Determine a probabilidade dos
seguintes eventos:
Resposta:
a) Existem C252 1326 maneiras de se tirar 2 das 52 cartas. E existem 𝐶24 = 6 maneiras de se
retirar 2 das 4 cartas de reis, logo:
P (E) = 6/1326 = 0,0045. O mesmo podia ser conseguido através do seguinte raciocínio:
Na primeira retirada o baralho tinha 52 cartas e 4 reis e na segunda, admitindo-se que se tenha
tirado uma na primeira, então tinha 51 cartas no seu todo e 3 reis que restavam. Assim, a
probabilidade pedida podia também ser determinada assim:
4 3 12
𝑃 𝐸 = 52 ∙ 51 = 2652 = 0,0045
b) Existem C252 1326 maneiras de se tirar 2 das 52 cartas. E existem C213 78 maneiras de se
retirar 2 das 13 cartas de espadas, logo:
78 3
P
1326 51
16
c) Casos favoráveis: 4 ∙ 4 = 16 e casos possíveis: 52 ∙ 51 = 2652. Assim: 𝑃 𝐸 = 2652 =
0,006.
3. Em uma bolsa há 20 fichas numeradas de 1 a 20. Tira-se uma ficha que em seguida é
recolocada na bolsa, logo após retira-se a outra ficha.
Resposta:
Esquema representativo:
19
Seja E o evento “uma ficha é tirada duas vezes”.
Pedido: 𝑃 𝐸 = ?
Resolução:
Como há 20 fichas, e não se especificou a ficha que foi retirada e recolocada na bolsa, então
trata-se de probabilidade de evento união. Ora, o processo de retirada é com reposição e a
retirada da segunda não depende da retirada da primeira ficha. Assim, a probabilidade pedida
é dada por:
1 1 20 20 ÷4 5
𝑃 𝐸 = 20 ∙ 20 ∙ 20 = 400 = 400 ÷4 = 100 = 5% .
20
Conclusão
Conclui-se que a probabilidade pode ser conceituada na perspectiva frequencista, intuitiva
(clássica ou a priori) entre outras. A frequencista baseia-se na frequência relativa em que a
quantificação depende da aproximação do quociente da frequência absoluta da observação
pelo número total de observações numa dada experiencia. Já a maneira clássica a de Laplace
entende que a probabilidade é dada pela razão entre os casos favoráveis a um evento pelo
número de resultados possíveis desse experimento.
Aprendeu-se que além de estudar uma variável isoladamente, pode-se estudar duas em
simultâneo. No estudo de uma distribuição bidimensional, procura-se saber se existe alguma
relação entre as duas variáveis. Um gráfico de dispersão é uma representação gráfica da
associação entre pares de dados, onde cada par se torna um ponto do gráfico de dispersão. O
objectivo é representar a distribuição dada através de uma nuvem/diagrama de pontos para
facilitar a visualização do comportamento da distribuição que estiver em análise.
O outro aspecto que merece destaque é que os dois principais usos para a regressão são
previsão e optimização. Além de também, no caso de empresas, ajudar os gerentes a prever
coisas como a demanda futura por seus produtos, a análise de regressão ajuda a ajustar os
processos de fabricação e entrega.
Estuda-se a relação linear entre duas variáveis quantitativas, sob dois pontos de vista:
explicitando a forma dessa relação: regressão ou, quantificando a força ou o grau dessa
relação: correlação. As técnicas de análise de correlação e regressão estão muito ligadas.
21
Referências bibliográficas
Bussab, W.O. & Morettin, P.A. (2010). Estatística Básica (6ª Ed.). Edição Revisada. Editora
Saraiva.
Kazmier, L. J. (1982). Estatística aplicada à economia e administração. Tradução de Carlos
Augusto Crusius, São Paulo: McGraw-Hill do Brasil.
Lopes, F. P. (2005). Estatística Descritiva e Inferencial, Faculdade de Economia,
Universidade de Coimbra.
22