Escolar Documentos
Profissional Documentos
Cultura Documentos
=
=
k
i
i
n f
1
, n = nmero total de observaes.
(2) FREQNCIA ACUMULADA (
i
F ): o total das freqncias de todos os valores
inferiores ao limite superior do intervalo de classe.
=
= + + + =
k
i
i k i
f f f f F
1
2 1
.....
Exemplo:
14
ALTURA (cm)
150 I-- 154 4 4
154 I-- 158 9 13
158 I-- 162 11 24
162 I-- 166 8 32
166 I-- 170 5 37
170 I-- 174 3 40
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
i
f
i
F
=
= + + = = + + =
3
1
3 2 1 3
24 11 9 4
i
i
f f f f F , ou seja, existem 24 alunos com
estatura inferior a 162 cm.
(3) FREQNCIA RELATIVA (
i
fr ): a razes entre a freqncia simples a
freqncia total.
=
=
k
i
i
i
i
f
f
fr
1
Exemplo:
ALTURA (cm)
150 I-- 154 4 4 0,1
154 I-- 158 9 13 0,225
158 I-- 162 11 24 0,275
162 I-- 166 8 32 0,2
166 I-- 170 5 37 0,125
170 I-- 174 3 40 0,075
Total 40 1
Fonte: MEC
ALTURA DOS ALUNOS
i
f
i
F
i
fr
275 , 0
40
11
40
1
3
3
= = =
= i
i
f
f
fr
(4) FREQNCIA ACUMULADA RELATIVA (
i
Fr ): a freqncia acumulada da
classe dividida pela freqncia total da distribuio.
=
=
k
i
i
i
i
f
F
Fr
1
15
ALTURA (cm)
150 I-- 154 4 4 0,1 0,1
154 I-- 158 9 13 0,225 0,325
158 I-- 162 11 24 0,275 0,6
162 I-- 166 8 32 0,2 0,8
166 I-- 170 5 37 0,125 0,925
170 I-- 174 3 40 0,075 1
Total 40 1
Fonte: MEC
ALTURA DOS ALUNOS
i
f
i
F
i
fr
i
Fr
600 , 0
40
24
40
1
3
3
= = =
= i
i
f
F
Fr
REPRESENTAO GRFICA DE UMA DISTRIBUIO DE FREQNCIA.
Histograma
Consiste em um conjunto de retngulos, tantos quantos forem s classes de uma
distribuio.
As classes so as bases dos retngulos (tantas partes quantas forem s classes)
A escala para marcao dos pontos no eixo Y corresponde s freqncias.
Exemplo:
Polgono de freqncias
Freqncia Simples:
Freqncia Acumulada: As bases dos retngulos vo estar centradas nos pontos mdios
das classes.
17
Exemplo:
18
CAPITULO 4
MEDIDAS DE POSIO: MDIA, MODA e MEDIANA;
O estudo sobre a Distribuio de Freqncia permitiu descrever, de um modo geral, os
valores que uma varivel pode assumir. Agora precisamos de um indicativo
generalizado.
O modo mais comum de se obter esse tipo de informao atravs das MEDIDAS DE
POSIO, estatstica que representa posio relativa da distribuio em relao ao eixo
horizontal.
As medidas de posio mais importantes so as MEDIDAS DE TENDNCIA
CENTRAL recebem esse nome pelo fato dos dados observados, em geral, se agruparem
em torno dos valores centrais.
So elas: MDIA ARITMTICA, MODA, MEDIANA, SEPARATRIZES, QUARTIS e
PERCENTIS.
Essas medidas quando bem interpretadas, podem fornecer-nos informaes muito
valiosas com respeito s sries estatsticas, ou seja, com estas medidas tenta-se encontrar
um valor numrico que represente o comportamento tpico da serei em estudo.
(1) MDIA ARITMTICA SIMPLES ( x )
MDIA PARA DADOS NO AGRUPADOS (dados brutos ou rol): Quando
desejamos conhecer a mdia dos dados no agrupados, determinamos a mdia
aritmtica simples.
n
x
x
n
i
i
=
=
1
, onde ( x ) a mdia aritmtica, (
i
x ) os valores da varivel e (n) o nmero
de valores.
Ex.: Produo leiteira diria da vaca A, durante uma semana, foi de 10, 14, 13, 15, 16, 18
e 12 litros. Qual a produo mdia da semana.
litros x 14
7
98
7
12 18 16 15 13 14 10
= =
+ + + + + +
=
MDIA PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSE.
=
=
=
n
i
i
n
i
i i
f
f x
x
1
1
, observe que
i
f a freqncia simples de cada varivel que neste caso
funciona como fator de ponderao (MDIA ARITMTICA PONDERADA).
19
Exemplo:
2 2 4
4 3 12
6 3 18
8 2 16
TOTAL 10 50
i
f
i
X
i i
f X
5
10
50
4
1
4
1
= = =
=
=
i
i
i
i i
f
f x
x
Exerccio: Calcule a Mdia.
Varivel estudada X(idade): 2, 5, 5, 5, 5, 6, 6, 6, 8, 8 Resposta: 5,6
IDADES f
i
f
i
x
i
2
5
6
8
Total
MDIA PARA DADOS AGRUPADOS COM INTERVALO DE CLASSE.
=
=
=
n
i
i
n
i
i i
f
f x
x
1
1
,
(
i
pm ) o ponto mdio de cada intervalo de classe.
(
i
f ) a freqncia simples de cada intervalo de classe.
Exemplo:
Classe
0 l-- 2 2 1 2
2 l-- 4 3 3 9
4 l-- 6 2 5 10
6 l-- 8 1 7 7
8 l--10 2 9 18
10 46
i
f
i i
f pm
i
pm
6 , 4
10
46
5
1
5
1
= = =
=
=
i
i
i
i i
f
f pm
x
20
Exerccio: Resposta: 161 cm
ALTURA (cm)
150 I-- 154 4
154 I-- 158 9
158 I-- 162 11
162 I-- 166 8
166 I-- 170 5
170 I-- 174 3
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
i
f
(2) MODA (Mo)
o valor que ocorre com maior freqncia em uma srie de dados. Quando uma srie
de dados no apresentar moda chamaremos de AMODAL. Dois valores na srie, duas
modas, chamaremos de BIMODAL.
MODA PARA DADOS NO AGRUPADOS (dados brutos ou rol)
Exemplo:
MODA PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSE.
Basta verificar o valor da varivel de maior freqncia.
N de meninos na famlia fi
0 2
1 6
2 10
3 12
4 4
Total 34
Uma vez agrupado os dados basta fixar o valor da varivel de MAIOR freqncia. A
moda nesse caso 3.
21
Exerccio: Qual a moda e o tipo para os dados agrupados em freqncia:
DADOS AGRUPADOS COM INTERVALO DE CLASSE.
A classe que apresentar a maior freqncia denominada CLASSE MODAL que servir
de base para os seguintes clculos:
a) Moda de KING:
* *
h
f f
f
l Mo
pos ant
pos
+
+ =
b) Moda de CZUBER:
*
2 1
1 *
h
D D
D
l Mo
+
+ =
pos
ant
f f
f f
l
Onde
=
=
*
2
*
1
*
*
ant
pos
*
D
D
modal classe da intervalo do amplitude a h
modal classe da simples freqncia a f
modal classe a anterior classe da simples freqncia a f
modal classe a posterior classe da simples freqncia a f
modal classe da inferior limite o
:
Exerccio: Calcule a moda utilizando os dois mtodos
Classe
0 l-- 2 2
2 l-- 4 3
4 l-- 6 10
6 l-- 8 3
8 l--10 2
20
i
f
Resposta.: 50
22
Observao:
1) A moda utilizada quando desejamos obter uma medida rpida e aproximada de
posio ou quando o valor da distribuio deve ser o valor mais tpico da distribuio.
2) A moda uma medida de posio, pois indica a regio das mximas freqncias.
(3) MEDIANA (Md)
o valor que divide o conjunto de dados ordenados em duas metades, com metade dos
valores acima da mediana e a metade dos valores abaixo dela. Quando o nmero de
observaes (n) mpar, a mediana o valor que ocupa a posio central. Quando n for
par, h duas posies centrais no conjunto, ento a mediana a mdia aritmtica dos dois
valores que ocupam as posies centrais.
MEDIANA PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSE.
1) Se n for mpar (n=nmero de observaes), o valor mediano ser o de ordem
|
.
|
\
| +
2
1 n
,
ou seja, o valor do elemento que ocupa est posio ser a mediana.
2) Se n for par, o rol admite dois termos centrais que ocupam as posies. O de ordem
|
.
|
\
|
+ |
.
|
\
|
1
2 2
n
e
n
, ento, a mediana ser a mdia dos valores que ocupam estas posies.
Exemplos:
Exemplo:
1)
N de meninos fi Fi
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
Total 34
A mediana vai ser a mdia entre o 17 valor e o 18
valor da srie => 2
2
2 2
=
+
= Md meninos.
23
2)
X fi Fi
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
Total 8
A mediana ser a mdia entre o 4 e o 5 elemento da srie => 5 , 15
2
16 15
=
+
= Md
Exerccios: Calcule a mediana. Resposta: 8
MEDIANA PARA DADOS AGRUPADOS COM INTERVALO DE CLASSE.
*
*
*
2
h
f
F
n
l Md
ant
|
.
|
\
|
+ =
Onde:
mediana a contm que classe de intervalo do amplitude a h
mediana classe da simples freqncia a f
mediana classe anterior classe da acumulada freqncia a F
srie na mediana da posio a
2
mediana classe da inferior limite o
*
*
ant
*
n
l
Exemplo:
idade f
i
F
i
3 |--- 6 2 2
6 |--- 9 5 7
9 |--- 12 7 14
12 |--- 15 3 17
15 |--- 18 2 19
total 19
*
*
*
2
h
f
F
n
l Md
ant
|
.
|
\
|
+ = =
( )
3
7
7 5 , 9
9
+ = =10,1
25
Exerccio: Calcule a mediana para o caso da distribuio de freqncia abaixo:
Salrio f
i
F
i
450 |--- 550 8
550 |--- 650 10
650 |--- 750 11
750 |--- 850 16
850 |--- 950 13
950 |--- 1.050 5
1.050 |-- 1.150 1
total 64
Observao:
No caso de existir uma freqncia acumulada exatamente igual a
2
n
, a Mediana ser o
limite superior da classe correspondente.
Por exemplo:
*
*
*
2
h
f
F
n
l Md
ant
|
.
|
\
|
+ =
=
( )
10
9
4 13
20
+ = =30
Nota:
1) A mediana pode coincidir ou no com um elemento da srie. Vimos que, quando
tivermos um nmero de elementos mpar na srie de dados, h coincidncia.
Quanto o nmero de elementos de uma srie par, na h coincidncia.
2) A mediana depende da posio e no dos valores centrais na srie ordenada.
3) Usamos a mediana quando desejamos obter o ponto que divide a distribuio em
partes iguais e quando h valores extremos afetando de uma maneira acentuada a
mdia.
Classes f
i
F
i
0 |---10 1 1
10 |---20 3 4
20 |---30 9 13
30 |---40 7 20
40 |---50 4 24
50 |---60 2 26
total 26
26
(3) SEPARATRIZES
As separatrizes, como o prprio nome sugere so medidas que separam a srie em partes
iguais.
QUARTIS: So valores de uma srie que a dividem em 4 partes iguais. Assim temos:
1
Q = 1 quartil: Separa a seqncia ordenada deixando 25% dos valores a sua esquerda e
75% dos valores a sua direita.
2
Q = 2 quartil: Separa a seqncia ordenada deixando 50% dos valores a sua esquerda e
50% dos valores a sua direita.
3
Q = 3 quartil: Separa a seqncia ordenada deixando 75% dos valores a sua esquerda e
25% dos valores a sua direita.
Pode-se observar que o 2 quartil e a mediana tem os mesmos valores, pois ambos
dividem uma srie ordenada em duas partes iguais.
!---------!---------!---------!---------!
Q1 Q2 Q3
!-------------------!-------------------!
Md
Clculo do QUARTIL
o mesmo clculo de mediana sendo que
2
n
deve ser substitudo por
4
i
f
k , onde k o
nmero de ordem do quartil.
*
*
*
.
4
f
h F
f k
l Q
ant
i
k
(
(
+ =
Exemplo:
1. Calcule o Q
1
da seqncia X: 2, 5, 8, 5, 5, 10, 1, 12, 12, 11, 13, 15.
Ordenar a srie: X: 1, 2, 5, 5, 5, 8, 10, 11, 13, 15
3
4
12
1
4
= =
i
f
k
Q
1
= 5
27
Calcule o Q
1
e Q
3
ALTURA (cm)
150 I-- 154 4
154 I-- 158 9
158 I-- 162 11
162 I-- 166 8
166 I-- 170 5
170 I-- 174 3
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
i
f
10
4
40
1
4
= =
i
f
k (classe 2) 30
4
40
3
4
= =
i
f
k (classe4)
| |
67 , 156 4
9
. 4 10
154
1
=
+ = Q
| |
165 4
8
. 24 30
162
3
=
+ = Q
Exerccio: Para os dados agrupados em freqncia, encontre o primeiro e segundo quartil.
Resposta: 4 e 6
QUINTIS: Quando dividimos uma srie em 5 partes iguais, cada parte ficar com 20%
dos elementos da srie. Assim temos:
1
K = 1 quintil separa a seqncia ordenada deixando 20% dos valores a sua esquerda e
80% dos valores a sua direita.
2
K
= 2 quintil separa a seqncia ordenada deixando 40% dos valores a sua esquerda
e 60% dos valores a sua direita.
3
K
= 3 quintil separa a seqncia ordenada deixando 60% dos valores a sua esquerda e
40% dos valores a sua direita.
4
K
= 4 quintil separa a seqncia ordenada deixando 80% dos valores a sua esquerda e
20% dos valores a sua direita.
!---------!---------!---------!---------!---------!
1
K
2
K
3
K
4
K
28
Clculo do QUINTIL
o mesmo clculo de mediana sendo que
2
n
deve ser substitudo por
5
i
f
k , onde k o
nmero de ordem do quintil.
*
*
*
.
5
f
h F
f k
l K
ant
i
k
(
(
+ =
Exemplo: Considerando a tabela de distribuio de freqncia por intervalo de classe,
calcule K
2
.
ALTURA (cm)
150 I-- 154 4
154 I-- 158 9
158 I-- 162 11
162 I-- 166 8
166 I-- 170 5
170 I-- 174 3
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
i
f
16
5
40
2
5
= =
i
f
k (classe 3)
| |
159 4
11
. 13 16
158
2
=
+ = k
Exerccio: A distribuio de freqncia abaixo representa o consumo por nota de 54 notas
fiscais emitidas durante um dia em uma loja de departamentos. Calcule o quintil de
ordem 2.
Resposta: 70,71
Consumo por nota (R$) N de notas
0 |---- 50 10
50 |---- 100 28
100 |---- 150 12
150 |---- 200 2
200 |---- 250 1
250 |---- 300 1
Total 54
29
DECIS: Quando dividimos uma srie em 10 partes iguais, cada parte ficar com 10% dos
elementos da srie. Assim temos:
1
D
= 1 decil separa a seqncia ordenada deixando 10% dos valores a sua esquerda e
90% dos valores a sua direita.
2
D
= 2 decil separa a seqncia ordenada deixando 20% dos valores a sua esquerda e
80% dos valores a sua direita.
3
D
= 3 decil separa a seqncia ordenada deixando 30% dos valores a sua esquerda e
70% dos valores a sua direita.
.
.
.
8
D
= 8 decil separa a seqncia ordenada deixando 80% dos valores a sua esquerda e
20% dos valores a sua direita.
9
D
= 9 decil separa a seqncia ordenada deixando 90% dos valores a sua esquerda e
10% dos valores a sua direita.
!---!---!---!---!---!---!---!---!---!---!
D1 D2 D3 D4 D5 D6 D7 D8 D9
Clculo do DECIL
o mesmo clculo de mediana sendo que
2
n
deve ser substitudo por
10
i
f
k , onde k o
nmero de ordem do decil.
*
*
*
.
10
f
h F
f k
l D
ant
i
k
(
(
+ =
Exemplo: Considerando a tabela de distribuio de freqncia por intervalo de classe,
calcule D
3
.
ALTURA (cm)
150 I-- 154 4
154 I-- 158 9
158 I-- 162 11
162 I-- 166 8
166 I-- 170 5
170 I-- 174 3
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
i
f
12
10
40
3
10
= =
i
f
k (classe 2)
| |
55 , 157 555 , 3 154 4
9
. 4 12
154
2
= + =
+ = D
29
Exerccio: Uma empresa de aviao observou em seus registros recentes, o tempo de
mo-de-obra gasto na reviso completa de um motor de jato. O seguinte quadro foi
obtido. Calcule o decil de ordem 3. Resposta: 9,44
Classe Tempo de mo-de-obra (horas) N de motores
1 0I------------4 1
2 4I------------8 5
3 8I-----------12 10
4 12I-----------16 12
5 16I-----------20 4
PERCENTIS ou CENTIL: So valores de uma srie que a dividem em 100 partes
iguais. Cada parte ficar com 1% dos elementos da srie. Assim temos:
1
P
= 1 percentil: separa a seqncia ordenada deixando 1% dos valores a sua esquerda e
99% dos valores a sua direita.
2
P
= 2 percentil: separa a seqncia ordenada deixando 2% dos valores a sua esquerda e
98% dos valores a sua direita.
3
P
= 3 percentil: separa a seqncia ordenada deixando 3% dos valores a sua esquerda e
97% dos valores a sua direita.
.
.
98
P
= 98 percentil: separa a seqncia ordenada deixando 98% dos valores a sua
esquerda e 2% dos valores a sua direita.
99
P
= 99 percentil: separa a seqncia ordenada deixando 99% dos valores a sua
esquerda e 1% dos valores a sua direita.
!---!---!---!---!---!---!---!---!---!---!
P10 P20 P30 P40 P50 P60 P70 P80 P90
Clculo do PERCENTIL
o mesmo clculo de mediana sendo que
2
n
deve ser substitudo por
100
i
f
k , onde k o
nmero de ordem do percentil.
*
*
*
.
100
f
h F
f k
l P
ant
i
k
(
(
+ =
30
Exemplo: Considerando a tabela de distribuio de freqncia por intervalo de classe,
calcule P
8
.
ALTURA (cm)
150 I-- 154 4
154 I-- 158 9
158 I-- 162 11
162 I-- 166 8
166 I-- 170 5
170 I-- 174 3
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
i
f
2 , 3
100
40
8
100
= =
i
f
k (classe 1)
| |
2 , 153 4
4
. 0 2 , 3
150
8
=
+ = P
Podemos notar que os quartis, quintis e decis podem ser expressos em termos dos
precentis.
Q
1
=P25 K
1
=P20 D
1
=P
10
Q
2
=P50 K
2
=P40 D
2
=P
20
Q
3
=P75 K
3
=P60 D
3
=P
30
K
4
=P80 D
4
=P
40
D
5
=P
50
D
6
=P
60
D
7
=P
70
D
8
=P
80
D
9
=P
90
31
CAPITULO 5:
MEDIDAS DE DISPERSO OU VARIABILIDADE
As medidas de disperso ou variabilidade servem para avaliar o quanto os dados so
semelhantes, descreve ento o quanto os dados distam do valor central.
Dessas medidas, estudaremos as seguintes:
- Medidas de variao absoluta: Amplitude total, Varincia e o Desvio Padro.
- Medidas de variao relativa: Coeficiente de Variao.
(1) MEDIDAS DE VARIAO ABSOLUTA
Amplitude Total: a diferena entre o maior e o menor valor observado. Tem o
inconveniente de s levar em conta os dois valores extremos da srie, no levando em
considerao os valores intermedirios. Ela apenas uma indicao aproximada da
disperso ou variabilidade.
AT = L (Max) l (min)
Varincia e Desvio Padro: A varincia e o desvio padro so medidas que levam em
considerao a totalidade dos valores da varivel em estudo, o que faz delas ndices de
variabilidade bastante estveis e, por isso mesmo, os mais geralmente empregados.
Clculo da Varincia (
2
x
o ): A varincia a mdia aritmtica do quadrado dos desvios
(em relao mdia).
) (
ou
) (
1
1
2
2
) (
1
2
2
) (
=
= =
=
=
n
i
i
i
n
i
i
x
n
i
i
x
f
f x x
n
x x
o o
Etapas do clculo da Varincia:
1. - Calcular a mdia aritmtica X
2. - Subtrair a mdia X de cada valor
i
x do conjunto x x
i
, o que chamamos de
desvio;
3. - Elevar cada desvio ao quadrado
2
) ( x x
i
4. - Somar os quadrados dos desvios ( )
2
1
=
n
i
i
x x
5. - Dividir a soma por (n-1) quando se tratar de dados amostrais, ou simplesmente por
n se os dados representam todos os valores de uma populao.
32
Sendo a varincia calculada a partir dos quadrados dos desvios, ela um nmero em
unidade quadrada em relao varivel em questo, o que, sob o ponto de vista prtico,
um inconveniente.
Por isso mesmo, imaginou-se uma nova medida que tem a interpretao prtica,
denominada desvio padro, definida como a raiz quadrada da varincia.
Desvio Padro:
2
) ( x x
o o =
Observao:
(1) O desvio padro sempre ser positivo!
(2) O desvio padro de uma srie indica o quanto os dados esto afastados da mdia e,
que se os dados so iguais, o valor da medida zero.
Exemplo 7: Em uma turma de aluno, verificaram-se atravs da anlise das notas de 15
alunos (amostra), os seguintes desempenhos:
Alunos Conceito na Prova
1 4,3 9,1204
2 4,5 7,9524
3 9 2,8224
4 6 1,7424
5 8 0,4624
6 6,7 0,3844
7 7,5 0,0324
8 10 7,1824
9 7,5 0,0324
10 6,3 1,0404
11 8 0,4624
12 5,5 3,3124
13 9,7 5,6644
14 9,3 3,9204
15 7,5 0,0324
Total 109,8 44,16
Mdia 7,32 3,155 Varincia
Desvio Padro 1,77
( )
2
X Xi
( )
2
n
1 i
X Xi
=
33
Observamos no exemplo, que a mdia das provas, foi estimada em 7,32 com desvio
padro em 1,77. Conclumos que a maioria das notas concentrou-se em 9,09 e 5,55.
Exerccio: Calcular a mdia aritmtica e o desvio padro dos seguintes dados relativos
dosagem de hemoglobina verificada numa amostra de 12 animais bovinos (mg).
15 14 13 11 13 14 13,5 12 16 14,5 12 9
Resp.: Mdia = 13,083mg Varincia = 3,583mg
2
Desvio padro = 1,892mg
(2) MEDIDAS DE VARIAO RELATIVA
O coeficiente de variao:
x
x
x CV
) (
) (
o
= . a razo entre o desvio padro e a mdia
aritmtica da srie dos dados. Pode ser expresso em percentual . Usado
para comparar a variabilidade de diferentes grupos de dados.
Exerccio: Os dados abaixo referem-se as medidas da altura de parafusos e do dimetro
de rolamentos. Determine o coeficiente de variao, para verificar em relao a qual
medida (parafuso ou rolamento) a variabilidade maior, sabendo-se que o desvio padro
dos parafusos de 0,46 cm e dos rolamentos de 0,27 cm?
Parafusos (cm) 10,2 10,6 9,8 10,0 9,8 10,4 9,2
Rolamentos (cm) 2,2 2,5 1,8 1,9 2,0 1,7 1,9
Resposta: CVp = 4,6 e CVr = 13,5. Os rolamentos apresentam maior variabilidade.
34
CAPITLO 6:
EXPERIMENTO ALEATRIO, ESPAO AMOSTRAL, EVENTOS E
PROBABILIDADE.
DEFINIES:
EXPERIMENTO ALEATRIO: So aqueles que, mesmo repetidos vrias vezes sob
condies semelhantes, apresentam resultados imprevisveis.
Ex.: Em uma jogada de futebol, provvel que seu time: perca; que ele ganha; que ele
empate.
ESPAO AMOSTRAL (S): Cada experimento aleatrio corresponde, em geral, a vrios
resultados possveis. O conjunto desses resultados possveis recebe o nome de espao
amostral ou conjunto universo, representado por S.
Exemplo: Lanamento de uma moeda: S = {Ca, Co}
Lanamento de um dado: S={1, 2, 3, 4, 5, 6}
Cada um dos elementos de S que correspondem a um resultado recebe o nome de
PONTO AMOSTRAL, por exemplo, 2 e a S => 2 um ponto amostral de S (no caso do
lanamento do dado).
EVENTOS (A): Chamamos de evento qualquer subconjunto do espao amostral S de um
experimento aleatrio.
Exemplo: Lanamento de um dado:
Espao amostral: S={1, 2, 3, 4, 5, 6}
Eventos:
a) Obter um nmero par na face superior:
A={2, 4, 6} => S A c , logo, A um evento de S.
35
Seja S o seu espao amostral. Se todos os elementos de S tem a mesma chance de
acontecer, ento, chamamos de PROBABILIDADE DE UM EVENTO A, S A c , o
nmero real P(A), tal que:
) (
) (
) (
S n
A n
A P =
, onde n(A) o nmero de elementos de A e n(S) o nmero de elementos
de S.
Exemplos: Considere o lanamento de uma moeda e o evento A obter cara.
S= {Ca, Co} n(S) = 2 A = {Ca} n(A) = 1 P(A) =
2
1
EVENTOS COMPLEMENTARES
Exemplo: Pesquisa afirma que de um grupo de 100 pacientes fumantes aparecem as
seguintes evidncias
1
.
Eventos (evidncias): e
1
= Normal; e
2
= Bronquite; e
3
= Cncer no Pulmo;
e
4
= Tuberculose
Espao Amostral: O= {Normal; Bronquite; Cncer no Pulmo; Tuberculose}
Evidncias Normal Bronquite Cncer no Pulmo Tuberculose
N de Pacientes 25 60 10 5
Se a probabilidade de um paciente apresentar tuberculose de 0,05. Ento se abordarmos
um paciente, ao acaso, qual a probabilidade de que ele tenha tuberculose ausente.
Resoluo:
e
4
: paciente tem tuberculose: 05 , 0
100
5
) (
4
= = e P
Como: 1 ) ( ) (
4 4
= + e P e P Ento, 95 , 0 05 , 0 1 ) ( 1 ) (
4 4
= = = e P e P onde
4
e significa:
paciente tem tuberculose ausente.
Assim, a chance de abordarmos um paciente que tem tuberculose ausente 95%.
1
Considere estas evidncias as mais comuns entre pacientes. Suponha tambm que as evidncias acima
sejam exclusivas.
36
EVENTOS MUTUAMENTE EXCLUSIVOS
Se os mesmos elementos no podem ocorrer simultaneamente.
P(AB) = P(A) + P(B), a probabilidade de que um ou outro se realize igual a soma das
probabilidades.
Exemplo: Considerando os dados do exemplo (1).
Evidncias Normal Bronquite Cncer no Pulmo Tuberculose
N de Pacientes 25 60 10 5
Se abordarmos um paciente, ao acaso, qual a probabilidade de que ele tenha cncer de
pulmo ou tuberculose?
Resoluo: 15 , 0
100
15
100
5
100
10
) ( ) ( ) (
4 3 4 3
= = + = + = e P e P e e P
EVENTOS QUE NO SO MUTUAMENTE EXCLUSIVOS
P(AB) = P(A) + P(B) - P(AB)
De um grupo de 80 pessoas considere:
SITUAO
EMPREGATCIA
SITUAO ESCOLAR
Total
At o Nvel Mdio Nvel Superior
Empregada 10 35 45
Desempregada 15 20 35
Total 25 55 80
A probabilidade de uma pessoa estar desempregada ou ter nvel superior.
Resoluo:
8750 , 0
80
70
80
20
80
55
80
35
) ( ) ( ) ( ) ( = = + = + = S D P S P D P S D P
EVENTOS INDEPENDENTES
Dois eventos so independentes quando a ocorrncia ou a no ocorrncia de um evento
no tem efeito algum na probabilidade de ocorrncia do outro evento. Quando lanamos
dois dados, o resultado obtido em um deles independe do resultado obtido no outro.
P(A e B) = P(AB) = P(A)P(B)
37
Exemplo: Se dois por cento da populao apresenta esquizofrenia. A probabilidade de se
encontrar duas pessoas com esquizofrenia ausente :
Resoluo:
9604 , 0 98 , 0 98 , 0 ) ( ) ( ) ( = = = nia Esquizofre P nia Esquizofre P nia Esquizofre nia Esquizofre P
Ou seja, a chance de ambos apresentarem esquizofrenia de 96,04%.
EVENTOS DEPENDENTES
Quando dois eventos so dependentes, o conceito de probabilidade condicional
empregado para indicar a probabilidade de ocorrncia de um evento relacionado. A
expresso P(B/A) indica a probabilidade de ocorrer o evento B, dado que tenha ocorrido
o evento A. Note que B/A no uma frao.
P(B/A) =
) (
) (
A P
BeA P
=
) (
) (
A P
A B P
Exemplo: Em um grupo de 50 turistas temos as seguintes variveis descritas abaixo:
NACIONALIDADE
SEXO
Total
M F
Brasileiro (B) 20 15 35
Estrangeiro (E) 5 10 15
Total 25 25 50
Calcule as seguintes probabilidades:
a) O turista ser masculino se brasileiro.
= =
35
20
) B / M ( P 0,5714
b) O turista ser masculino se estrangeiro.
= ) / ( E M P (0,3333)
c) O turista ser feminino se brasileiro.
= =
35
15
) B / F ( P 0,4286
d) O turista ser feminino se estrangeiro.
= ) / ( E F P (0,6667)
e) O turista ser brasileiro se masculino.
= =
25
20
) M / B ( P 0,80
f) O turista ser estrangeiro se masculino.
= ) / ( M E P (0,20)
g) O turista ser brasileiro se feminino.
= =
25
15
) F / B ( P 0,60
h) O turista ser estrangeiro se feminino.
= ) / ( F E P (0,40)
38
EXERCCIO DE FIXAO
1) Qual a probabilidade de sair s de ouros quanto retiramos uma carta de um
baralho de 52 cartas?
2) Qual a probabilidade de sair um rei quanto retiramos uma carta de um baralho de
52 cartas?
3) Um lote de 12 peas, 4 so defeituosas. Sendo retirada uma pea, calcule?
a- A probabilidade de essa pea ser defeituosa:
b- A probabilidade de essa pea no ser defeituosa:
4) No lanamento de dois dados, calcule a probabilidade de se obter soma igual a 5.
5) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro
baralho e uma carta do segundo baralho. Qual a probabilidade de a carta do
primeiro baralho ser um rei e a do segundo baralho ser o 5 de paus?
6) Uma urna A contm: 3 bolas brancas, 4 pretas, 2 verdes; Uma urna B contm: 5
bolas brancas, 2 pretas, 1 verde; Uma urna C contm: 2 bolas brancas, 3 pretas e 4
verdes. Uma bola retirada de cada urna. Qual a probabilidade de as 3 bolas
retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca,
preta e verde?
7) De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposio. Qual
a probabilidade de a primeira carta ser o s de paus e a segunda ser o rei de paus?
8) Qual a probabilidade de sair uma figura quando retiramos uma carta de um
baralho de 52 cartas?
9) Qual a probabilidade de sair uma carta de copas ou de ouros quando retiramos
uma carta de um baralho de 52 cartas?
10) No lanamento de um dado, qual a probabilidade de se obter um nmero no
inferior a 5?
39
GABARITO
1. A = sair s de ouros P(A)=1/52
2. A = sair rei P(A)=4/52
3.
a) A= a pea ser defeituosa P(A)=4/12
b) B=a pea ser perfeita P(B)=8/12
4. A= a soma ser 5 A={(1,4), (2,3), (3,2), (4,1)} P(A) = 4/36
5. A= sair rei
B= sair 5 de paus
P(A E B) = P(A)x P(B) = 4/52 x 1/52 = 4/2704
6.
A= 3 bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente,
branca, preta e verde
P(A)= 3/9 x 2/8 x 4/9 = 24/648
7. C= sair s de paus e reis de paus
P(C1 e C2)= P(C1). P(C2/C1) = 1/52 x 1/51 = 1/2652
8.
Figuras = valete, dama e rei
A= sair uma figura
P(A) = 12/52
9. A= sair copas ou ouros P(A)=13/52 + 13/52 = 26/52
10. A= nmero maior que 5 P(A)=1/6
40
CAPTULO 07
DISTRIBUIO DE PROBABILIDADE
Quando conhecemos todos os valores de uma varivel aleatria juntamente com suas
respectivas probabilidade, temos uma distribuio de probabilidade.
Exemplo: Distribuio de probabilidade no nmero de acidentes areos com a GOL,
dentre sete acidentes.
X p(x)
0 0,210
1 0,367
2 0,275
3 0,115
4 0,029
5 0,004
6 0+
7 0+
A representao grfica de uma DISTRIBUIO DE PROBABILIDADES feita
atravs do HISTOGRAMA DE PROBABILIDADES, semelhantes ao HISTOGRAMA
DE FREQNCIA, sendo que a escala vertical apresenta probabilidades, em lugar das
correspondentes freqncias.
Condies para uma DISTRIBUIO DE PROBABILIDADE:
1) A soma de todas as probabilidades individuais 1: ( ) 1 =
x p
2) Para qualquer evento A implica que p(x) deve estar entre 0 e 1 para qualquer valor de
x: 1 ) ( 0 s s x P
MDIA DE UMA DISTRIBUIO DE PROBABILIDADE
( ) ( )
=
= =
n
i
i i
x p x X E
1
VARINCIA DE UMA DISTRIBUIO DE PROBABILIDADE
( ) ( ) | | ( )
=
= =
n
i
i i
x p X E x X VAR
1
2 2
o
- A probabilidade de 0 acidentes com
a GOL (dentre sete acidentes)
0,210;
- Os valores denotados 0+
representam probabilidades muito
pequenas;
41
EXERCCIO DE FIXAO
1) Determine se dada uma distribuio de probabilidade. Nos casos em que no
descrita uma distribuio de probabilidade, identifique a condio que no satisfeita. E
quando for descrita uma distribuio de probabilidade, determine sua mdia e desvio
padro.
a) Se sua faculdade contrata os 4 prximos funcionrios sem distino de sexo e o
conjunto de candidatos grande, com nmeros iguais de homens e mulheres, a
tabela a seguir d a distribuio de probabilidade do nmero x de mulheres
contratadas.
X p(x)
0 0,0625
1 0,2500
2 0,3750
3 0,2500
4 0,0625
Resposta: 2 e 1
b) Ao avaliar riscos de crdito, Jefferson investiga o nmero de cartes de crdito
que a pessoa tem. Com x sendo o nmero de cartes de crdito que os adultos
possuem a tabela a seguir d a distribuio de probabilidade para um conjunto de
solicitantes.
X p(x)
0 0,26
1 0,16
2 0,12
3 0,09
4 0,07
5 0,09
6 0,07
7 0,14
Resposta: 2,8 e 2,52
2)Seja X uma varivel aleatria discreta assumido valores no conjunto {1, 2, 3} e com
distribuio de probabilidade dada por:
x 1 2 3
P(X=x) 1/3 1/6 1/2
a. Calcule a mdia de X. (resposta: 2,165)
b. Calcule a ( ( ) 2 > x P (resposta: 0,666)
c. Calcule a ( ( ) 2 > x P (resposta: 0,5)
3)O tempo T, em minutos, necessrio para um operrio processar certa pea uma
varivel aleatria com a seguinte distribuio de probabilidade:
T 2 3 4 5 6 7
P(T=t) 0,1 0,1 0,3 0,2 0,2 0,1
Calcule o tempo mdio de processamento. Resposta: 4,6 minutos
42
DISTRIBUIES ESTATSTICAS: DISCRETA E CONTNUA
(1) DISTRIBUIO BINOMIAL (discreta)
Vimos que uma varivel aleatria associa um valor numrico a cada resultado de um
experimento aleatrio e uma distribuio de probabilidade associa uma probabilidade a
cada valor de uma varivel aleatria.
Veremos agora como determinar as probabilidades para uma categoria importante de
distribuio de probabilidades: OS EXPERIMENTOS BINOMIAIS.
Os experimentos binomiais tm a caracterstica de apresentarem exatamente dois
resultados complementares: SUCESSO E FRACASSO.
Exemplo: Em processos industriais: as peas falham ou no falham.
Na medicina: um paciente sobrevive ou morre.
Em propaganda, um consumidor reconhece um produto ou no.
Definio:
Um experimento binomial um experimento que satisfaz as seguintes condies:
1. O experimento deve comportar um nmero fixo de provas (n).
2. As provas devem ser independentes (o resultado de qualquer prova no afeta
as probabilidades das outras provas.)
3. Cada prova deve ter todos os resultados classificados em duas categorias
(sucesso e fracasso).
4. As probabilidades devem permanecer constantes para cada prova.
Quando fazemos um experimento binomial, a distribuio da varivel aleatria x
chamada uma DISTRIBUIO BINOMIAL.
43
Notao:
p => probabilidade de sucesso
q => probabilidade de fracasso
x => denota um nmero especfico de sucessos em n provas, podendo ser qualquer inteiro
entre 0 e n, inclusive.
P(x) => denota a probabilidade de obter exatamente x sucessos em n provas.
Parmetros da Distribuio Binomial: ) , ( ~ p n B X
Clculo da Probabilidade de uma Distribuio Binomial:
( )
x n x n
x
p p x X P
= = ) 1 .( ). (
( )
x n x x n x
x n
x n x n
x
q p
x x n
n
p p C p p x X P
= = = = . .
! )! (
!
) 1 .( . ) 1 .( ). (
,
Para x = 0, 1, 2, .....,n
Mdia de uma Distribuio Binomial: E(x) = np
Varincia da Distribuio Binomial: V(x) = npq
Obs.: lembrando que 0! = 1 (por definio)
Exerccio:
1) Aplicando a frmula da probabilidade binomial, determine a probabilidade de
obter 3 estudantes canhotos em uma turma de 15 estudantes, dado que 10% da
populao so canhotos. Isto determine P(3), se n=15, x=3, p=0,1 e 1=0,9.
Resposta: 0,1285
44
EXERCCIO DE FIXAO
1) Suponha que em um experimento binomial, uma prova se repita n vezes.
Determine a probabilidade de x sucessos, dada a probabilidade p de sucesso em
uma prova: Respostas:
a) n = 3, x= 2, p=0,9 (0,243)
b) n=8, x=7, p=0,99 (0,0745)
c) n=10, x=4, p=0,30 (0,2001)
d) n=6, x=1, p=0,05 (0,2321)
2) Uma firma afirma que 20% de suas pastilhas de chocolate M&M so vermelhas.
Determine a probabilidade de que, em 15 pastilhas M&M escolhidas
aleatoriamente, exatamente 20%, ou seja, 3 pastilhas sejam vermelhas.
Resposta: 0,250
3) Acredita-se que 20% dos moradores das proximidades de uma grande indstria
siderrgica tm alergia aos poluentes lanados ao ar. Admitindo que este
percentual de alrgicos real (correto), calcule a probabilidade de que pelo menos
4 moradores tenham alergia entre 13 selecionados ao acaso.
Resposta: 0,252
4) Trs em cada quatro alunos de uma universidade fizeram cursinho antes de prestar
vestibular. Se 16 alunos so selecionados ao acaso, qual a probabilidade de que:
Respostas
a) Pelo menos 12 tenham feito cursinho? (0,6302)
b) No mximo 13 tenham feito cursinho? (0,8029)
c) Exatamente 12 tenham feito cursinho? (0,2252)
45
46
47
48
49
(2) DISTRIBUIO NORMAL OU GAUSS (contnua)
Se X uma varivel aleatria contnua, ento X assume todos os valores em um intervalo
de nmeros reais (9).
- A distribuio de probabilidade de X descrita por uma curva de densidade, ou funo
de densidade.
( )
2
2
1
.
2
1
|
.
|
\
|
=
o
t o
x
e x f
(Pi): ( 3,14159)
e: ( 2,71828).
- A probabilidade de qualquer evento a rea sob a curva de densidade entre os valores
de X que compe o evento.
- A rea total sob qualquer curva de densidade 1, de modo que a probabilidade de um
evento varia entre 0 e 1.
- Parmetros da Distribuio Normal ) , ( ~
2
o N X
Mdia da Distribuio Normal: E(X) =
Varincia da Distribuio Normal: VAR(X) =
2
o
Algumas propriedades da Distribuio Normal:
P(X=x) = f(X) = 0 (pois no existe a probabilidade no ponto e sim na rea)
f(X) simtrica ao redor da mdia, ou seja, a probabilidade de ocorrer valor
menor do que a mdia igual a probabilidade de ocorrer valor menor do que a
mdia.
A curva normal depende de duas constantes, e o
2
:
- corresponde ao centro da simetria da curva e o2 graficamente, fornece a
distncia do centro da simetria aos pontos onde a curva muda de sentido.
50
Distribuio Normal Padro:
Na prtica desejamos calcular probabilidades para diferentes valores de e . Para isso,
a varivel cuja distribuio ) , ( ~
2
o N X transformada numa forma padronizada
com distribuio ) 1 , 0 ( ~ N X (distribuio normal padro), pois tal distribuio
tabelada. A quantidade dada por:
o
=
X
Z
Exemplo:
1) Se j X a varivel aleatria que representa os dimetros dos parafusos produzidos por
certa mquina. Suponha que essa varivel tenha Distribuio Normal com mdia 2cm e
desvio padro 0,04cm.
a) A probabilidade de um parafuso ter um dimetro com valor entre 2 e 2,05 :
3944 , 0 ) 25 , 1 0 ( )
04 , 0
2 05 , 2
04 , 0
2 2
( ) 05 , 2 2 ( = < < =
<
<
= < < Z P
X
P X P
o
b) P(-1,25<Z<0) =
c) P(0,8<Z<1,23) =
d) P(Z>0,6) =
Obs.: Quando temos uma varivel aleatria com distribuio Normal, nosso principal
interesse obter a probabilidade de essa varivel aleatria assumir um valor em um
determinado intervalo.
51
Tabela: Probabilidades da Distribuio Normal
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,000000 0,003989 0,007978 0,011966 0,015953 0,019939 0,023922 0,027903 0,031881
0,035856
0,1 0,039828 0,043795 0,047758 0,051717 0,055670 0,059618 0,063559 0,067495 0,071424 0,075345
0,2 0,079260 0,083166 0,087064 0,090954 0,094835 0,098706 0,102568 0,106420 0,110261 0,114092
0,3 0,117911 0,121720 0,125516 0,129300 0,133072 0,136831 0,140576 0,144309 0,148027 0,151732
0,4 0,155422 0,159097 0,162757 0,166402 0,170031 0,173645 0,177242 0,180822 0,184386 0,187933
0,5 0,191462 0,194974 0,198468 0,201944 0,205401 0,208840 0,212260 0,215661 0,219043 0,222405
0,6 0,225747 0,229069 0,232371 0,235653 0,238914 0,242154 0,245373 0,248571 0,251748 0,254903
0,7 0,258036 0,261148 0,264238 0,267305 0,270350 0,273373 0,276373 0,279350 0,282305 0,285236
0,8 0,288145 0,291030 0,293892 0,296731 0,299546 0,302337 0,305105 0,307850 0,310570 0,313267
0,9 0,315940 0,318589 0,321214 0,323814 0,326391 0,328944 0,331472 0,333977 0,336457 0,338913
1,0 0,341345 0,343752 0,346136 0,348495 0,350830 0,353141 0,355428 0,357690 0,359929 0,362143
1,1 0,364334 0,366500 0,368643 0,370762 0,372857 0,374928 0,376976 0,379000 0,381000 0,382977
1,2 0,384930 0,386861 0,388768 0,390651 0,392512 0,394350 0,396165 0,397958 0,399727 0,401475
1,3 0,403200 0,404902 0,406582 0,408241 0,409877 0,411492 0,413085 0,414657 0,416207 0,417736
1,4 0,419243 0,420730 0,422196 0,423641 0,425066 0,426471 0,427855 0,429219 0,430563 0,431888
1,5 0,433193 0,434478 0,435745 0,436992 0,438220 0,439429 0,440620 0,441792 0,442947 0,444083
1,6 0,445201 0,446301 0,447384 0,448449 0,449497 0,450529 0,451543 0,452540 0,453521 0,454486
1,7 0,455435 0,456367 0,457284 0,458185 0,459070 0,459941 0,460796 0,461636 0,462462 0,463273
1,8 0,464070 0,464852 0,465620 0,466375 0,467116 0,467843 0,468557 0,469258 0,469946 0,470621
1,9 0,471283 0,471933 0,472571 0,473197 0,473810 0,474412 0,475002 0,475581 0,476148 0,476705
2,0 0,477250 0,477784 0,478308 0,478822 0,479325 0,479818 0,480301 0,480774 0,481237 0,481691
2,1 0,482136 0,482571 0,482997 0,483414 0,483823 0,484222 0,484614 0,484997 0,485371 0,485738
2,2 0,486097 0,486447 0,486791 0,487126 0,487455 0,487776 0,488089 0,488396 0,488696 0,488989
2,3 0,489276 0,489556 0,489830 0,490097 0,490358 0,490613 0,490863 0,491106 0,491344 0,491576
2,4 0,491802 0,492024 0,492240 0,492451 0,492656 0,492857 0,493053 0,493244 0,493431 0,493613
2,5 0,493790 0,493963 0,494132 0,494297 0,494457 0,494614 0,494766 0,494915 0,495060 0,495201
2,6 0,495339 0,495473 0,495604 0,495731 0,495855 0,495975 0,496093 0,496207 0,496319 0,496427
2,7 0,496533 0,496636 0,496736 0,496833 0,496928 0,497020 0,497110 0,497197 0,497282 0,497365
2,8 0,497445 0,497523 0,497599 0,497673 0,497744 0,497814 0,497882 0,497948 0,498012 0,498074
2,9 0,498134 0,498193 0,498250 0,498305 0,498359 0,498411 0,498462 0,498511 0,498559 0,498605
3,0 0,498650 0,498694 0,498736 0,498777 0,498817 0,498856 0,498893 0,498930 0,498965 0,498999
3,1 0,499032 0,499065 0,499096 0,499126 0,499155 0,499184 0,499211 0,499238 0,499264 0,499289
3,2 0,499313 0,499336 0,499359 0,499381 0,499402 0,499423 0,499443 0,499462 0,499481 0,499499
3,3 0,499517 0,499534 0,499550 0,499566 0,499581 0,499596 0,499610 0,499624 0,499638 0,499651
3,4 0,499663 0,499675 0,499687 0,499698 0,499709 0,499720 0,499730 0,499740 0,499749 0,499758
3,5 0,499767 0,499776 0,499784 0,499792 0,499800 0,499807 0,499815 0,499822 0,499828 0,499835
3,6 0,499841 0,499847 0,499853 0,499858 0,499864 0,499869 0,499874 0,499879 0,499883 0,499888
3,7 0,499892 0,499896 0,499900 0,499904 0,499908 0,499912 0,499915 0,499918 0,499922 0,499925
3,8 0,499928 0,499931 0,499933 0,499936 0,499938 0,499941 0,499943 0,499946 0,499948 0,499950
3,9 0,499952 0,499954 0,499956 0,499958 0,499959 0,499961 0,499963 0,499964 0,499966 0,499967
4,0 0,499968 0,499970 0,499971 0,499972 0,499973 0,499974 0,499975 0,499976 0,499977 0,499978
52
EXERCCIO DE FIXAO
1) Determinar o valor, ou valores, de z em cada um dos casos, nos quais as reas
referem-se s limitadas pela curva normal:
Resposta:
a) a rea entre 0 e z 0,3770 (z= 1,16)
b) a rea a esquerda de z 0,8621 (z=1,09)
2) O peso mdio de 500 estudantes do sexo masculino de uma determinada
universidade 75,5kg e o desvio padro de 7,5 kg. Admitindo-se que os pesos
esto distribudos normalmente, determinar quantos estudantes pesam:
Resposta
a) entre 60 e 77,5kg (P(-2,06<z<0,266)=0,6 => 300 estudantes)
b) mais do que 92,5kg (P(z>2,26)=0,0119 = > 6 estudantes)
3) A mdia dos dimetros internos de uma amostra de 200 arruelas produzidas por
certa mquina 0,502 polegadas e o desvio padro 0,005 polegadas. A
finalidade para a qual essas arruelas so fabricadas permite a tolerncia mxima,
para o dimetro, de 0,496 a 0,508 polegadas; se isso no se verifica, as arruelas
sero consideradas defeituosas. Determinar a porcentagem de arruelas defeituosas
produzidas pela mquina, admitindo-se que os dimetros so distribudos
normalmente. Resposta: 23,02%
4) Se z normalmente distribuda, com mdia zero e varincia 1, determinar:
Resposta:
a) P(z>-1,64) = (0,9495)
b) P(-1,96<z<1,96) = (0,95)
c) P(0<z<1,44) = (0,4251)
d) P(-0,85<z<0) = (0,3023)
e) P(-1,48<z<2,05) = (0,9104)
f) P(0,72<z<1,86) = (0,2044)
53
CAPITULO 8
INTRODUO
A REGRESSO e a CORRELAO so tcnicas utilizadas para estimar uma
relao que possa existir na populao, enquanto as tcnicas anteriormente estudadas
(Medidas de Tendncia Central e de Disperso: Mdia, Desvio Padro, Varincia, etc.)
servem para estimar um nico parmetro populacional.
A anlise de correlao e regresso compreende a anlise de dados amostrais para
saber se e como duas ou mais variveis esto relacionadas uma com a outra numa
populao.
A correlao mede a fora, ou grau, de relacionamento entre duas variveis; a
regresso d a equao que descreve o relacionamento em termos matemticos.
(1) CORRELAO
Definio: Quando duas variveis esto ligadas por uma relao estatstica, dizemos que
existe correlao entre elas.
Por exemplo:
- A circunferncia C e o raio r esto perfeitamente correlacionados, porque
t 2 = C
r.
- As variveis altura e peso de indivduos revelariam alguma correlao.
Diagrama de disperso: O diagrama de disperso um grfico onde pontos no espao
cartesiano XY so usados para representar simultaneamente os valores de duas variveis
quantitativas medidas em um conjunto de dados.
54
Por exemplo:
Um dos objetivos dos pesquisadores neste estudo encontrar uma maneira de conhecer o
peso do urso atravs de uma medida mais fcil de se obter do que a direta (carregar uma
balana para o meio da selva e colocar os ursos em cima dela) como, por exemplo, uma
medida de comprimento (altura, permetro do trax, etc.).
O problema estatstico aqui encontrar uma varivel que tenha uma relao forte com o
peso, de modo que, a partir de seu valor medido, possa ser calculado (estimado) o valor
peso indiretamente, atravs de uma equao matemtica.
O primeiro passo para encontrar esta varivel fazer o diagrama de disperso das
variveis candidatas (eixo horizontal) versus o peso (eixo vertical), usando os pares de
informaes de todos os ursos. Voc pode tentar as variveis: idade, altura, comprimento
da cabea, largura da cabea, permetro do pescoo e permetro do trax.
A Figura mostra a relao entre peso e altura e entre peso e permetro do trax.
Analisando o grfico:
1) Podemos ver que, tanto a altura quanto o permetro do trax so fortemente associados
ao peso do urso, no sentido de que quanto mais alto o urso ou quanto maior a medida de
seu trax, mais pesado ele ser.
2) Note que este crescimento linear para o permetro do trax e no-linear para a altura.
3) Os pontos esto mais dispersos no grfico da altura, a varivel mais adequada para
estimar o peso o permetro do trax.
55
Observao: A correlao entre duas variveis pode ser POSITIVA, NULA ou
NEGATIVA.
-30
-25
-20
-15
-10
-5
0
5
10
0 5 10 15 20 25 30
Grfico 1 (+) Grfico 2 (-)
-10
-5
0
5
10
15
0 5 10 15 20 25 30
Grfico 3 (nula)
Clculo do Coeficiente de Correlao Linear de Pearson
Definio: Dado n pares de valores (x1, y1), (x2, y2), ..., (xn, yn), o coeficiente entre as
duas variveis X e Y dado pela mdia dos valores dos produtos padronizados das
variveis.
( )( )
( ) ( ) ( ) ( )
=
2
2
2
2
i i i i
i i i i
y y n x x n
y x y x n
r
Indica o grau de intensidade entre duas variveis e ainda o sentido dessa correlao
(positivo ou negativo).
S deve ser utilizado com variveis contnuas.
A partir dos valores de r, podemos verificar o tipo da correlao existente entre as
variveis estudadas, conforme tabela seguinte:
-10
-5
0
5
10
15
20
25
30
0 5 10 15 20 25 30
Valor de r Correlao
0,0 Nula
0,0 ----| 0,3 Fraca
0,3 ----| 0,6 Media
0,6 ----| 0,9 Forte
0,9 ----| 0,99 Fortssima
1,0 Perfeita
56
Exemplo: Considerando uma amostra aleatria, formada por dez dos 98 alunos de uma
classe da faculdade A e pelas notas obtidas por eles em Matemtica e Estatstica:
Matemtica (x) Estatstica (y)
1 5,0 6,0
8 8,0 9,0
24 7,0 8,0
38 10,0 10,0
44 6,0 5,0
58 7,0 7,0
59 9,0 8,0
72 3,0 4,0
80 8,0 6,0
92 2,0 2,0
Notas
Alunos
Grfico de disperso
0
2
4
6
8
10
12
0 2 4 6 8 10 12
Matemtica
E
s
t
a
t
s
t
i
c
a
Calcule o coeficiente de correlao e interprete seu valor.
Matemtica (x) Estatstica (y) xy
1 5 6 30 25 36
8 8 9 72 64 81
24 7 8 56 49 64
38 10 10 100 100 100
44 6 5 30 36 25
58 7 7 49 49 49
59 9 8 72 81 64
72 3 4 12 9 16
80 8 6 48 64 36
92 2 2 4 4 4
Total 65 65 473 481 475
Notas
Alunos
2
i
x
2
i
y
911 , 0
18 , 554
505
525 585
505
) 4225 4750 )( 4225 4810 (
4225 4730
) 65 475 10 )( 65 481 10 (
65 65 473 10
2 2
= = =
=
=
x
x x
x x
r
Concluso: O resultado nos indica uma correlao linear positiva altamente significativa
entre as duas variveis.
Se o relacionamento entre X e Y for consistente e necessitamos fazer uma predio para o
valor de Y, conhecido um valor de X, atravs de uma formula matemtica adequada,
podemos aplicar a chamada ANLISE DE REGRESSO SIMPLES.
57
EXERCCIO DE FIXAO
1) Observou-se que o volume mensal de lixo gerado em uma cidade, em funo do
nmero de dormitrios das residncias, o seguinte (em m
3
):
N
o
Dormitrios 1 2 3 4
Volume de lixo 0,15 0,29 0,45 0,57
a) Calcular o coeficiente de correlao de Pearson. (0,9986)
2) A funo de demanda de um produto est representada na tabela abaixo:
Preo (R$) 56,00 60,00 63,00 68,00 74,00
Demanda (un.) 100 93 87 81 75
a) Calcular o coeficiente de correlao de Pearson. (-0,983)
3) Os gastos com propaganda e o respectivo volume de vendas gerado, de um certo
produto, so dados abaixo:
a) Calcular o coeficiente de correlao de Pearson. (0,9969)
Gastos com propaganda (em
milhares de R$)
20 40 10 100 70
Volume de vendas (em milhares de
R$)
1.110 1.250 1.000 1950 1600
58
(2) REGRESSO
Objetivo: A regresso linear simples constitui uma tentativa de estabelecer uma equao
matemtica linear (linha reta) que descreva o relacionamento entre duas variveis.
Para obter uma reta de regresso, n pares de observaes das variveis so utilizados.
Considerando Y como a varivel dependente ou varivel resposta e, X como a varivel
independente ou preditora, a reta de regresso dada por:
Y = o+ |X + u
o o coeficiente linear (intercepto), ou seja, o ponto onde a reta corta o eixo Y;
| o coeficiente angular, ou seja, determina a inclinao da reta.
Graficamente:
u representa o incremento em Y quando X aumenta em uma unidade;
ESTIMADORES DE o E | PARA O MODELO DE REGRESSO LINEAR
Os valores de a e b sero determinados, atravs do Mtodo dos Mnimos Quadrados
(MMQ). O objetivo encontrar a e b tal que a soma dos erros quadrticos mdios seja o
menor possvel.
o+ |X + u
o+ |X
o
|
X X+1
Y
X
59
O erro determinado por:
i i i
y y e =
tal que
) (
i i i
bx a y e + =
Os valores de a e b so encontrados atravs da seguinte frmula:
2
1
2
1
x n x
y x n y x
b
n
i
i
n
i
i i
=
=
x b y a
=
importante observar que:
- b mede a variao que ocorre em Y por unidade de variao de X.
- Quando no houver relao entre X e Y teremos =
.
Y Y , pois b=0
- Quando as relaes entre X e Y forem proporcionais, a reta passa na origem e
a = 0, logo =
.
Y bX
Exemplo:
1) Um laboratrio est interessado em medir o efeito da temperatura sobre a potncia de
um antibitico. Dez amostras de 50 gramas cada foram guardadas a diferentes
temperaturas, e aps 15 dias, mediu-se a potncia. Os resultados esto no quadro abaixo.
Temperatura 30 36 50 54 60 73 78 82 91 95
Potncia 38 43 32 26 33 19 27 23 14 21
0
10
20
30
40
50
0 20 40 60 80 100
Temperatura
P
o
t
n
c
i
a
882 , 0 = r
Podemos concluir que o grfico se trata de uma correlao retilnea, de modo a permitir o
ajustamento de uma reta, imagem da funo Y = o+ |X + u. (se no houvesse uma
correlao significativa, nossa melhor predio da potncia do antibitico seria
6 , 27 = y ).
60
Ento, precisamos calcular os valores dos parmetros da equao X b Y
+ =
.
que uma
estimativa da verdadeira equao da reta de regresso, onde
.
Y o estimado.
Identificao das variveis:
Varivel dependente: Potncia do antibitico
Varivel independente: Temperatura
Estimadores da reta de regresso:
35114 , 0
9 , 4534
4 , 1592
) 9 , 64 ( 10 655 . 46
) 6 , 27 )( 9 , 64 )( 10 ( 320 . 16
2
2
1
2
1
=
=
=
x n x
y x n y x
b
n
i
i
n
i
i i
(Coef. Linear)
389 , 50 9 , 64 ) 35114 , 0 ( 6 , 27
+ = + =
Assim, o valor apostado quando a freqncia zero (0) de 4,3424 mil dlares.
Alm disso, para cada 100 pessoas a mais na pista o total apostado subir em 0,0465.
Uma importante funo de determinar a reta de regresso para duas variveis a
possibilidade de realizar previses, ou seja, uma vez que obtemos a reta de regresso,
podemos escolher um valor de interesse para a varivel independente (X) e determinar o
valor esperado para a varivel dependente (Y).
62
EXERCCIO DE FIXAO
1) Observou-se que o volume mensal de lixo gerado em uma cidade, em funo do
nmero de dormitrios das residncias, o seguinte (em m
3
):
N
o
Dormitrios 1 2 3 4
Volume de lixo 0,15 0,29 0,45 0,57
a) Determinar a equao da reta de regresso. (y = 0,142x + 0,01)
b) Estimar o volume de lixo para uma residncia com 5 dormitrios. (0,11082)
2) A funo de demanda de um produto est representada na tabela abaixo:
Preo (R$) 56,00 60,00 63,00 68,00 74,00
Demanda (un.) 100 93 87 81 75
c) Determinar a equao da reta de regresso. (y = -1,3831x + 176)
d) Estimar a demanda se o preo for R$ 80,00. (65,352)
3) Os gastos com propaganda e o respectivo volume de vendas gerado, de um certo
produto, so dados abaixo:
a) Determinar a equao da reta de regresso. (v=10,496p+878,175)
b) Estimar o volume de vendas para um gasto de R$ 150,00 em propaganda.
(2.452,575)
c) Caso no se faa nenhum investimento em propaganda, qual o volume de vendas
esperado? (878,175)
d) Se a expectativa de vendas for de R$ 1.500,00, quando se deve investir em
propaganda para esse produto? (59,24)
Gastos com propaganda (em
milhares de R$)
20 40 10 100 70
Volume de vendas (em milhares de
R$)
1.110 1.250 1.000 1950 1600
63
2
r : COEFICIENTE DE DETERMINAO
Uma das formas de determinar se o modelo encontrado satisfatrio para explicar
os dados calculando o COEFICIENTE DE DETERMINAO do modelo. Esse
coeficiente compara a variabilidade do modelo com a variabilidade total dos dados.
CLCULO DO
2
r :
SQT
SQE
y y
y y
r
n
i
i
n
i
i
=
=
=
1
2
1
2
2
) (
) (
A variabilidade do modelo (variabilidade explicada ou soma dos quadrados
explicada) pode ser calculada como:
2
1
) (
=
n
i
i
y y
.
A variabilidade total (soma dos quadrados total) pode ser calculada como:
=
n
i
i
y y
1
2
) (
.
0 X
Y
y
i
y
i
x
X b a Y
+ =
SQT
SQE
SQR
i
y
Mostra a variao total nos
valores de Y observados em
relao a mdia.
Variao devido ao resduo,
pois nem todas s observaes
efetivas de Y ficam sobre a
reta ajustada.
Variao devido regresso.
0 X
Y
y
i
y
i
x
X b a Y
+ =
SQT
SQE
SQR
i
y
Mostra a variao total nos
valores de Y observados em
relao a mdia.
Variao devido ao resduo,
pois nem todas s observaes
efetivas de Y ficam sobre a
reta ajustada.
Variao devido regresso.
64
Observao:
Exemplo 1: Calcular e interpretar o coeficiente de determinao R
2
para os dados do
primeiro exerccio.
Temperatura
(X)
Potncia
(Y)
Valores
preditos ( y )
2
) ( y y
i
2
) ( y y
i
30 38 39.86 108.16 150.21
36 43 37.75 237.16 103.01
50 32 32.83 19.36 27.40
54 26 31.43 2.56 14.67
60 33 29.32 29.16 2.97
73 19 24.76 73.96 8.07
78 27 23.00 0.36 21.13
82 23 21.60 21.16 36.01
91 14 18.44 184.96 83.92
95 21 17.03 43.56 111.63
y 27,6
=
n
i
i
y y
1
2
) ( 720,4
=
n
i
i
y y
1
2
) ( 559,02
R
2
0,7759
Interpretao: o modelo X Y 3511 , 0 3892 , 50