O
D
E
P
E
T
R
L
E
O
N
O
B
R
A
S
I
L
(
b
i
l
h
e
s
d
e
l
i
t
r
o
s
)
ANO
29
F) GRFICO DE LINHAS MLTIPLAS
uma aplicao do processo de representao das funes num sistema de coordenadas
cartesianas. Neste tipo de grfico se utiliza linhas poligonais para representar as sries estatsticas.
til para comparar a variao de uma grandeza em relao outra. Este grfico serve para retratar
dados quantitativos.
Exemplo: Na tabela abaixo, esto indicadas as variveis Oferta e Demanda de Etanol no Brasil de
1997 a 2005.
Anos Oferta e Demanda de Etanol no Brasil (bilhes de litros)
(frequncia absoluta f
i
)
Oferta Demanda
1997 15,49 7,51
1998 14,12 3,38
1999 12,98 3,02
2000 10,61 2,81
2001 11,50 5,56
2002 12,62 8,75
2003 14,73 12,23
2004 15,10 13,53
2005 16,05 15,02
Importante: Os dados aqui apresentados so fictcios, no existindo nenhuma conexo com a
realidade. O grfico em questo foi criado com o objetivo pedaggico de oferecer um melhor
entendimento de como um grfico pode ser utilizado.
Determinados, graficamente, todos os pontos das sries usando os pares ordenados, o ano no
eixo horizontal e as quantidades no eixo vertical, ligam-se esses pontos, dois a dois, por segmentos de
reta, para cada uma das variveis, gerando, nesse caso, duas linhas poligonais (podem ser mltiplas),
que o grfico em linhas correspondente s sries em estudo.
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
0
2
4
6
8
10
12
14
16
OFERTA
DEMANDA
O
F
E
R
T
A
e
D
E
M
A
N
D
A
D
E
E
T
A
N
O
L
N
O
B
R
A
S
I
L
(
b
i
l
h
e
s
d
e
l
i
t
r
o
s
)
ANO
30
G) HISTOGRAMAS
Representao grfica da distribuio de frequncias somente de varivel contnua.
Os dados agrupados em intervalos de classe podem ser representados graficamente por meio
de um histograma. O histograma uma representao grfica formada por retngulos justapostos,
cujas bases se apiam no eixo horizontal. A altura de cada retngulo deve ser proporcional frequncia
correspondente a cada classe e o ponto mdio da base de cada retngulo deve coincidir com o ponto
mdio do respectivo intervalo de classe.
Exemplo: Na tabela abaixo est indicado o nmero de famlias brasileiras de acordo com o nmero de
salrios mnimos que cada uma delas tem como renda familiar mensal.
Renda Familiar Mensal
(Salrios Mnimos)
Nmero de Famlias (milhes)
(frequncia absoluta f
i
)
1 0 13200
2 1 15000
3 2 6900
4 3 3800
5 4 4000
6 5 3250
7 6 1560
8 7 1300
9 8 900
10 9 500
Importante: Os dados aqui apresentados so fictcios, no existindo nenhuma conexo com a
realidade. O grfico em questo foi criado com o objetivo pedaggico de oferecer um melhor
entendimento de como um grfico pode ser utilizado.
Representando-se, graficamente, por meio de um histograma, a varivel quantitativa contnua
Renda Familiar Mensal no pas, tm-se:
0
2000
4000
6000
8000
10000
12000
14000
16000
1 2 3 4 5 6 7 8 9 10
RENDA FAMILIAR MENSAL (SALRIOS MNIMOS)
N
M
E
R
O
D
E
F
A
M
L
I
A
S
(
M
I
L
H
E
S
)
31
LISTA 2 - Exerccios para fixao
1. Estes quatro grficos, na ordem em que so apresentados (1, 2, 3, 4), denominam-se:
GRFICO 1 GRFICO 2
0
2000
4000
6000
8000
10000
12000
14000
16000
1 2 3 4 5 6 7 8 9 10
RENDA FAMILIAR MENSAL (SALRIOS MNIMOS)
N
M
E
R
O
D
E
F
A
M
L
I
A
S
(
M
I
L
H
E
S
)
Servios
Burocrticos
Gerencial
Trabalho No
Qualificado
Artesanato
0
10
20
30
40
50
60
70
80
F
R
E
Q
N
C
I
A
A
B
S
O
L
U
T
A
OCUPAO
GRFICO 3 GRFICO 4
0
20000
40000
60000
80000
100000
2000 2001 2002 2003 2004
ANO
P
R
O
D
U
O
D
E
P
E
T
R
L
E
O
(
m
i
l
m
3
)
0 10 20 30 40 50 60 70 80
SUDESTE
CENTRO-OESTE
NORTE
SUL
PRODUO DE MADEIRA
Freqncia Relativa (%)
R
E
G
I
O
B
R
A
S
I
L
E
I
R
A
A) Colunas simples, colunas simples, polgono de frequncia, barras simples.
B) Colunas mltiplas, histograma, linha, barras mltiplas.
C) Histograma, colunas simples, linha, barras simples.
D) Histograma, colunas simples, polgono de frequncia, barras simples.
E) Colunas mltiplas, colunas simples, diagrama de disperso, barras simples.
2. Representar graficamente a distribuio de frequncias da empresa Delta, segundo o nmero de
faltas mensais, como um grfico de colunas simples para varivel discreta.
N
o
de faltas do ms 0 1 2 3 4 5 6
N
o
de operrios
(frequncia absoluta)
160
120
90
70
40
20
10
3. Construir um grfico de colunas simples segundo os dados abaixo:
Nmero aproximado de alunos matriculados de 5
a
a 8
a
sries em 2010 por regio brasileira
Regio N
o
de Alunos
Norte 1.300.000
Nordeste 5.400.000
Centro-Oeste 1.500.000
Sudeste 6.200.000
Sul 2.250.000
32
4. Construir um grfico de barras simples segundo os dados abaixo:
Turistas estrangeiros no Brasil - Cidades mais visitadas em 2010
Cidade Porcentagem
(frequncia relativa)
Rio de Janeiro 24
So Paulo 4
Salvador 18
Fortaleza 44
Recife 8
Outras 2
5. Construir um grfico de setores para os dados tabelados em cada um dos itens abaixo.
A)
Estimativa da safra de gros em 2011 por regio brasileira
Regio Porcentagem
(frequncia relativa)
Norte 3
Nordeste 8
Sudeste 15
Centro-Oeste 33
Sul 41
B)
Nmero de veculos motorizados registrados em Santa Vitria/MG
Tipo de Veculo Nmero de veculos
(frequncia absoluta)
Carro de passageiro 585
Minivan 75
Caminho de 2 eixos 60
Caminho de Multieixo 30
Moto 315
Barco a motor 15
6. Construir um grfico de barras mltiplas para representar a evoluo ao longo das dcadas da
populao urbana e rural brasileira.
Populao (%)
Anos Urbana Rural
1950 36,16 63,84
1960 45,08 54,92
1970 55,94 44,06
1980 67,59 32,41
1990 75,59 24,41
2000 81,25 18,75
2005 83,01 16,99
Fonte: www.ibge.gov.br
33
7. Construir um grfico de linha segundo os dados abaixo:
Anos Produo de Feijo
(milhes de toneladas)
2000 4,3
2001 3,9
2002 4,3
2003 4,4
2004 4,3
2005 3,9
Fonte: www.conab.gov.br
8. Construir um grfico de linhas duplas segundo os dados abaixo:
Participao de homens e mulheres no mercado de trabalho (%)
Anos Homens Mulheres
1975 71,2 28,8
1985 66,5 33,5
1995 59,6 40,4
2005 57,6 42,4
Fonte: www.fcc.org.br
9. Os dados abaixo representam a massa, em quilogramas, de uma amostra de 50 bebs nascidos na
Maternidade So Bento no perodo de 30 dias. Construa o histograma que represente os valores da
frequncia relativa.
Massa (kg) N
o
de bebs % de bebs
1,0 1,5
2 4
1,5 2,0
2 4
2,0 2,5
4 8
2,5 3,0
14 28
3,0 3,5
23 46
3,5 4,0
5 10
Total 50 100
10. Os dados abaixo representam a vida til, em horas, de 260 lmpadas de certa indstria na cidade
de Jacare. Construir o histograma correspondente a essa distribuio.
Durao (horas) N
o
de lmpadas
300 400
12
400 500
28
500 600
36
600 700
48
700 800
60
800 900
50
900 1000
26
Total 260
34
11. Do lixo produzido no Brasil, diariamente, 60.000 toneladas so de papel, 7.200 toneladas de
plstico, 19.200 toneladas de metais, 4.800 toneladas de vidro e 148.800 toneladas so provenientes de
outros materiais, totalizando 240.000 toneladas de lixo por dia (www.cempre.org.br). Observe os grficos
de setores abaixo e indique qual o mais adequado para representar essas informaes.
A B C D
12. Um grupo de estudantes de enfermagem fez uma pesquisa sobre o tipo de sangue contido nos 540
frascos de um banco de sangue de certo hospital. Para resumirem os dados encontrados, os
estudantes construram um grfico de setores e, no lugar das porcentagens, indicaram os ngulos de
alguns desses setores circulares, como mostrado na figura abaixo). Calcule o nmero de frascos que
contm sangue tipo B.
Tipo O
162
o
Tipo AB
36
o
Tipo B
X
o
Tipo A
108
o
13. O grfico abaixo representa, em milhares de toneladas, a produo de soja do estado de So Paulo
entre os anos de 1997 e 2005 (Brasil Pesquisas, 2006). Calcule o decrscimo percentual entre os anos de
2000 e 2001 e o acrscimo percentual entre os anos de 2001 e 2002.
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
20
30
40
50
60
70
P
r
o
d
u
o
d
e
S
o
j
a
n
o
E
s
t
a
d
o
d
e
S
o
P
a
u
l
o
(
m
i
l
t
o
n
e
l
a
d
a
s
)
ANO
35
14. A escolaridade dos jogadores de futebol nos grandes centros maior do que se imagina, como
mostra a pesquisa abaixo, realizada com os jogadores profissionais dos quatro principais clubes de
futebol do Rio de Janeiro.
De acordo com esses dados, o percentual dos jogadores dos quatro clubes que concluram o Ensino
Mdio de aproximadamente:
A) 14% B) 48% C) 54% D) 60% E) 68%
15. Um estudo caracterizou cinco ambientes aquticos, nomeados de A a E, em uma regio, medindo
parmetros fsico-qumicos de cada um deles, incluindo o pH nos ambientes. O Grfico I representa os
valores de pH dos cinco ambientes.
Grfico I Grfico II
Utilizando o Grfico II, que representa a distribuio estatstica de espcies em diferentes faixas de pH,
pode-se esperar um maior nmero de espcies no ambiente:
A) A B) B C) C D) D E) E
16. No grfico abaixo pode-se observar como so divididos os 188 bilhes de reais do oramento da
Unio entre os setores de sade, educao, previdncia e outros.
36
Se os 46 bilhes gastos com a previdncia fossem totalmente repassados aos demais setores de modo
que 50% fossem destinados sade, 40% educao e 10% aos outros setores, o aumento percentual
para o setor de sade seria igual, aproximadamente, a:
A) 121% B) 69% C) 65% D) 61% E) 50%
17. No grfico de colunas abaixo, est representado o nmero de rdio emissoras por regio brasileira
no ano 2000. Analisando-o, classifique em V ou F cada sentena seguinte:
A) Se esse conjunto de dados fosse representado em um grfico de setores, o ngulo correspondente
regio Sul seria menor que 90. ( )
B) Na regio Centro-Oeste h 2,27% das rdios emissoras brasileiras. ( )
C) O nmero de rdio emissoras na regio Sudeste 60,24% maior que na regio Nordeste. ( )
D) Na regio Norte h, apenas, 5,73% das rdio emissoras de todo o pas. ( )
E) Nas regies Sul e Sudeste esto mais de 60% das rdio emissoras de todo o pas. ( )
18. Moradores de trs cidades, aqui chamadas de X, Y e Z, foram indagados quanto aos tipos de
poluio que mais afligiam as suas reas urbanas. Nos grficos de setores abaixo esto representadas
as porcentagens de reclamaes sobre cada tipo de poluio ambiental.
X Y Z
Considerando a queixa principal dos cidados de cada cidade, a primeira medida de combate
poluio em cada uma delas seria, respectivamente:
X Y Z
A) Manejamento de lixo Esgotamento sanitrio Controle de emisso de gases
B) Controle de despejo industrial Manejamento de lixo Controle de emisso de gases
C) Manejamento de lixo Esgotamento sanitrio Controle de despejo industrial
D) Controle de emisso de gases Controle de despejo industrial Esgotamento sanitrio
E) Controle de despejo industrial Manejamento de lixo Esgotamento sanitrio
37
19. O grfico abaixo mostra uma triste realidade brasileira: a desigualdade racial associada renda do
trabalhador.
De acordo com o grfico, julgue as sentenas abaixo como verdadeiras (V) ou falsas (F):
A) Alm da desigualdade racial, h uma desigualdade salarial entre os sexos. ( )
B) A desigualdade salarial entre os sexos maior entre os negros. ( )
C) Em mdia, o salrio dos negros metade do salrio dos no-negros, independentemente do
sexo. ( )
D) Para que um homem negro recebesse, por hora, o mesmo valor que uma mulher no-negra, seu
rendimento por hora deveria aumentar 50%. ( )
E) Para que uma mulher negra recebesse, por hora, o mesmo valor que uma mulher no-negra, seu
rendimento por hora deveria aumentar aproximadamente 100%. ( )
20. Com base no grfico abaixo, assinale a alternativa correta:
N
o
total de pousos e decolagens em alguns aeroportos
do pas entre 2003 e setembro de 2006
A) Em 2006 (at setembro), houve mais de 300 mil pousos e decolagens em aeroportos de So Paulo.
B) O aeroporto do Galeo registrou acrscimo de mais de 38% nos pousos e decolagens de 2004 a
setembro de 2006.
C) Houve, no aeroporto de Braslia, aumento de mais de 2 mil pousos e decolagens de 2004 a 2005.
38
D) Se a mdia mensal de pousos e decolagens registrada em Congonhas at setembro de 2006 se
mantivesse at o final do ano, o total anual de pousos e decolagens em 2006 ultrapassaria 230 mil.
E) O aeroporto de Congonhas registrou uma taxa de variao percentual maior que 3% nos pousos e
decolagens no perodo de 2003 a 2005.
21. Em um estudo feito pelo Instituto Florestal, foi possvel acompanhar a evoluo de ecossistemas
paulistas desde 1962. Desse estudo publicou-se o Inventrio Florestal de So Paulo, que mostrou
resultados de dcadas de transformaes da Mata Atlntica.
Examinando o grfico da rea de vegetao natural remanescente (em mil km
2
) pode-se inferir que:
A) a Mata Atlntica teve sua rea devastada em 50% entre 1963 e 1973.
B) a vegetao natural da Mata Atlntica aumentou antes da dcada de 60, mas reduziu nas dcadas
posteriores.
C) a devastao da Mata Atlntica remanescente vem sendo contida desde a dcada de 60.
D) nos anos 2000-2001, a rea de Mata Atlntica preservada em relao ao perodo de 1990-1992 foi
de 34,6%.
E) nos anos 2000-2001, a rea preservada da Mata Atlntica maior do que a registrada no perodo de
1990-1992.
22. Para o clculo da inflao, utiliza-se, entre outros, o ndice Nacional de Preos ao Consumidor
Amplo (IPCA), que toma como base os gastos das famlias residentes nas reas urbanas, com
rendimentos mensais compreendidos entre um e quarenta salrios mnimos. O grfico a seguir mostra
as variaes do IPCA de quatro capitais brasileiras no ms de maio de 2008.
39
Com base no grfico qual foi o item determinante para a inflao de maio de 2008?
A) Alimentao e bebidas.
B) Artigos de residncia.
C) Transportes.
D) Vesturio.
E) Habitao.
23. O analfabetismo um problema social que atinge parte da populao brasileira. Observe o grfico
de colunas abaixo, obtido pelo IBGE em 2003, que mostra o nmero de pessoas com 5 anos ou mais
de idade no-alfabetizadas nas cinco regies do Brasil.
Considerando que, segundo o ltimo censo, a populao brasileira era de, aproximadamente,
180.762.400 habitantes, a porcentagem de pessoas no-alfabetizadas no Brasil igual a:
A) 88% B) 78 % C) 68% D) 12% E) 10%
40
CAPTULO 3 - MEDIDAS QUANTITATIVAS
BIBLIOGRAFIA CONSULTADA:
1. ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A. Estatstica Aplicada Administrao e
Economia. 2.ed. So Paulo: Cengage Learning, 2007.
2. BUSSAB, W. O.; MORETIN, P. Mtodos Quantitativos: Estatstica Bsica. 5.ed. So Paulo:
Saraiva, 2002.
3. DOWNING, D.; CLARK, J. Estatstica Aplicada. 3.ed. So Paulo: Saraiva, 2011.
4. MARTINS, G. A. Estatstica Geral e Aplicada. 2.ed. So Paulo: Atlas, 2002.
5. MEDEIROS, E. S. et al. Estatstica para os Cursos de Economia, Administrao e Cincias
Contbeis. vol. 1 e 2. 3.ed. So Paulo: Atlas, 1999.
6. STEVENSON, W. J. Estatstica Aplicada Administrao. 3.ed. So Paulo: Harbra, 2001.
7. TRIOLA, M. F. Introduo Estatstica. 10.ed. Rio de Janeiro: LTC, 2008.
8. WEBSTER, A. L. Estatstica Aplicada Administrao e Economia. 3.ed. So Paulo: McGraw Hill,
2006.
INTRODUO
Os mtodos estatsticos envolvem a anlise e a interpretao de dados numricos. Para
interpretar os dados corretamente necessrio, primeiramente, organizar e sumarizar os nmeros. Um
conjunto de nmeros pode reduzir-se a uma ou a algumas medidas numricas que resumem todo o
conjunto. Usualmente, empregam-se as seguintes medidas:
1.1 Medidas de posio (ou tendncia central) = mdia, mediana e moda.
1.2 Medidas de disperso = amplitude total, varincia e desvio padro.
1.3 Medidas separatrizes = quartis, decis e percentis.
1.1 MEDIDAS DE POSIO (TENDNCIA CENTRAL)
A) DADOS BRUTOS OU ROL
A.1 Mdia Aritmtica Notao: x
Calcula-se a mdia aritmtica efetuando-se a soma das observaes dividida pelo nmero total
de observaes.
n
x
x
n
1 i
i
=
=
Exemplo 1: Durante um determinado ms de vero, os quinze vendedores de uma empresa de
calefao central e ar condicionado venderam os seguintes nmeros de ar condicionado central: 8, 11,
12, 5, 14, 12, 8, 11, 16, 12, 12, 17, 7, 9, 11. Considerando este ms como uma populao estatstica de
interesse, o nmero mdio de unidades vendidas :
11
15
11 9 7 17 12 12 16 11 8 12 14 5 12 11 8
x =
+ + + + + + + + + + + + + +
=
41
A.2 Mdia Aritmtica Ponderada Notao: x
O clculo da mdia ponderada deve levar em conta os pesos desiguais dos bimestres. A frmula
para o clculo :
=
=
=
n
1 i
i
n
1 i
i i
f
f . x
x
onde x
i
a observao de ordem i e f
i
o peso da observao de ordem i.
Exemplo 2: Considere a situao em que um professor informe que os pesos das notas bimestrais,
so: 1
o
bimestre - peso 2; 2
o
bimestre - peso 2; 3
o
bimestre - peso 3; 4
o
bimestre - peso 3. O aluno
obteve as seguintes notas em Estatstica: 6,0; 8,0; 9,0 e 5,0, em cada bimestre, respectivamente.
Portanto:
0 , 7
10
70
3 3 2 2
0 , 5 3 0 , 9 3 0 , 8 2 0 , 6 2
x = =
+ + +
+ + +
=
A.3 Mediana Notao: x
~
Colocados os dados brutos em ordem crescente ou decrescente (ROL), a mediana o elemento
que ocupa a posio central. Sua caracterstica principal dividir um conjunto ordenado de dados em
dois grupos iguais; a metade ter valores inferiores mediana e a outra metade ter valores superiores
mediana.
Para se calcular a mediana, determina-se o nmero n de elementos do rol, utilizando o seguinte
critrio:
Se n mpar O rol admite um termo central que ocupa a posio
2
1 n +
.
Exemplo 3: Os quinze vendedores citados no Exemplo 1 venderam as seguintes quantidades de
aparelhos de ar condicionado, colocadas em ordem crescente (rol): 5, 7, 8, 8, 9, 11, 11, 11, 12, 12, 12,
12, 14, 16, 17. O elemento central desse conjunto de dados ocupa a posio 8
2
1 15
2
1 n
=
+
=
+
, ou
seja, a 8
a
posio. Portanto, a mediana desse conjunto de dados igual a 11.
11 x
~
=
Se n par Utiliza-se como mediana, a mdia aritmtica das duas observaes centrais, ou seja, a
mdia dos elementos que ocupam no rol as posies
2
n
e 1
2
n
+ .
Exemplo 4: O gerente de uma pizzaria mantm o controle das vendas dos diversos tipos de pizza.
Suponha que ele tenha observado os seguintes valores de vendas dirias em ordem crescente (rol) do
tipo calabresa durante o perodo de quatorze dias: 37, 38, 38, 39, 40, 43, 44, 46, 48, 51, 56, 59, 61, 64.
As posies centrais desse conjunto de dados so: 7
2
14
2
n
= = (7
a
posio) 44 e
8 1
2
14
1
2
n
= + = + (8
a
posio) 46. A mediana , portanto, a mdia aritmtica desses 2 elementos:
42
45
2
46 44
x
~
=
+
=
Portanto, o procedimento para se determinar a mediana o seguinte:
1. Ordenar os valores (Rol);
2. Verificar se h um nmero mpar ou par de observaes;
3. a) Para um nmero mpar n de observaes, a mediana o valor central.
b) Para um nmero par n de observaes, a mediana a mdia aritmtica das duas
observaes centrais.
A.4 Moda Notao: x*.
o valor (observao) que ocorre com maior frequncia num conjunto de dados.
Exemplo 5: Os quinze vendedores citados no Exemplo 1 venderam as seguintes quantidades de
aparelhos de ar condicionado: 8, 11, 12, 5, 14, 12, 8, 11, 16, 12, 12, 17, 7, 9, 11. A moda para esse
conjunto de dados o valor que ocorre com maior frequncia, ou seja, x* = 12.
OBSERVAES:
- Se mais de um valor ocorre com maior, mas igual, frequncia, todos eles so chamados de moda.
- Muitas distribuies que surgem na prtica so razoavelmente simtricas com a maioria dos valores
concentrada prximo ao centro. Em tal caso, mdia, moda e mediana esto muito prximas umas
das outras ou so at coincidentes.
- Uma distribuio com duas modas chamada de distribuio bimodal.
COMPARANDO A MDIA, A MEDIANA E A MODA
A mdia a medida de tendncia central mais usada. Ela fcil de calcular e interpretar.
Infelizmente, a mdia afetada por valores extremos ou atpicos e, diferente da mediana, pode ser
drasticamente desviada por observaes que ficam extremamente acima ou abaixo da maioria das
observaes.
Por exemplo, para os dados 4, 5, 6, 6, 7, 8, a mdia e a mediana so 6 e representam uma
medida excelente do ponto central do conjunto de dados. Se a ltima observao fosse 80 e no 8, a
mdia no seria 6, seria 18, mas a mediana ainda seria 6. Como a mediana no afetada pelo valor
extremo, ela representa melhor as seis observaes.
A moda tambm pouco afetada por algumas observaes atpicas e, continua sendo 6, mesmo
se o ltimo valor fosse 80. De qualquer maneira, se no h moda ou se o conjunto de dados for
bimodal, seu uso pode ser confuso.
Isso no significa que uma medida melhor que a outra. A medida escolhida depende da
natureza dos dados ou da maneira como os dados so usados. Por exemplo, uma loja de equipamentos
para camping, far pouco uso da informao de que o tamanho mdio das botas para escaladas
vendidas 41,8. Muito mais til, para decises nos negcios, seria conhecer a moda do tamanho das
botas, pois saberia que o tamanho mais vendido o 40.
Entretanto, suponha que essa loja deseja colocar no mercado uma nova barraca. As dimenses
da barraca dependem, dentre outras coisas, da estatura mdia dos adultos.
A experincia tem mostrado que a mdia serve muito bem como uma medida de tendncia
central quando se trata de produtos confeccionados para uso de pessoas. O tamanho das portas, a
altura do p-direito em casas, os balces em lojas e muitas moblias produzidas tm como base a
estatura mdia dos adultos.
43
B) VARIVEIS DISCRETAS
B.1 Mdia x de uma distribuio de frequncias
Se os dados so provenientes de uma varivel discreta, deve-se utilizar a mdia aritmtica
ponderada, considerando as frequncias absolutas f
i
como sendo as ponderaes dos elementos x
i
correspondentes.
Deve-se, portanto, utilizar a frmula da mdia ponderada para determinar a mdia de uma
distribuio de frequncias:
n
f . x
f
f . x
x
n
1 i
i i
n
1 i
i
n
1 i
i i
=
=
=
=
=
com f
i
sendo a frequncia da i-sima classe e n f
n
1 i
i
=
=
, onde n o nmero total de observaes.
Exemplo 6: Sem perda de informao. O departamento de trnsito da cidade de So Paulo coletou o
nmero de acidentes ocorridos em certo cruzamento de ruas na zona oeste, por 25 dias teis do ms
de maro, com o objetivo de estudar a possibilidade de colocao de um semforo no citado
cruzamento. A seguir, foi determinado o nmero mdio de acidentes, com os dados apresentados na
tabela abaixo:
N
o
de acidentes
x
i
N
o
de dias
f
i
x
i
. f
i
0 2 0
5 4 20
10 5 50
15 10 150
20 2 40
25 1 25
30 1 30
Total n = 25 315
Soluo:
13 6 , 12
25
315
n
f . x
x
n
1 i
i i
~ = =
=
=
acidentes/dia
B.2 Mediana x
~
de uma distribuio de frequncias
Se os dados, provenientes de uma varivel discreta, esto apresentados em tabelas, eles j
esto naturalmente ordenados. Como a mediana o elemento que ocupa a posio central do conjunto
ordenado de dados, basta verificar se o nmero de elementos da srie mpar ou par.
44
- n = mpar a mediana ser o elemento central, ordem =
2
1 n +
- n = par a mediana ser a mdia aritmtica entre os elementos centrais, ordem =
2
n
e 1
2
n
+
Exemplo 7: Determinando a mediana do conjunto de dados do Exemplo 6.
N
o
de acidentes
x
i
N
o
de dias
f
i
Frequncia Acumulada
F
ac
0 2 2
5 4 6
10 5 11
15 10 21 (13
o
elemento)
20 2 23
25 1 24
30 1 25
Total n = 25 --------------------------------
Soluo:
Como n = 25 (mpar), o elemento central 13
2
1 25
2
1 n
=
+
=
+
(13
o
elemento).
Aps calcular a posio da mediana, abre-se a coluna de F
ac
e, pelas frequncias acumuladas,
encontra-se a posio da mediana. O valor x
i
que o elemento central corresponde mediana.
Neste exemplo, portanto:
15 x
~
= acidentes/dia
Exemplo 8: Uma indstria metalrgica embala peas em caixas com 100 unidades. O controle de
qualidade selecionou 50 caixas na linha de produo e anotou em cada caixa o nmero de peas
defeituosas. A seguir, obteve a seguinte distribuio de frequncias:
N
o
de peas defeituosas
x
i
N
o
de caixas
f
i
Frequncia Acumulada
F
ac
0 15 15
1 10 25 (25
o
elemento)
2 12 37 (26
o
elemento)
3 8 45
4 5 50
Total n = 50 --------------------------------
Soluo:
Observando a coluna das frequncias acumuladas, sendo n = 50 (par), os elementos centrais so:
25
2
50
2
n
= = (25
o
elemento) 1 pea defeituosa/caixa
26 1
2
50
1
2
n
= + = + (26
o
elemento) 2 peas defeituosas/caixa
A mediana , nesse caso, a mdia aritmtica desses dois elementos:
5 , 1
2
2 1
x
~
=
+
= peas defeituosas/caixa
45
B.3 Moda x* de uma distribuio de frequncias
o valor que ocorre com maior frequncia na distribuio. Para distribuies sem agrupamento
de classes, a identificao da moda facilitada pela simples observao do elemento que se apresenta
com maior frequncia.
Exemplo 9: Determinando a moda do conjunto de dados do Exemplo 6.
N
o
de acidentes
x
i
N
o
de dias
f
i
0 2
5 4
10 5
15 10
20 2
25 1
30 1
Total n = 25
Soluo:
Por observao, a moda 15, ou seja, x* = 15, pois esse valor aparece com maior frequncia nesta
distribuio (10 vezes).
C) VARIVEL CONTNUA
C.1 Mdia x de uma distribuio de frequncias
Se os dados apresentados so classificados como varivel contnua, deve-se utilizar para o
clculo da mdia, a mdia aritmtica ponderada. Nesse caso, consideram-se as frequncias absolutas
das classes como sendo as ponderaes dos pontos mdios destas classes.
Exemplo 10: Com perda de informao. Os salrios (em R$) de 25 funcionrios selecionados em uma
empresa esto representados na tabela abaixo. Determinando o salrio mdio dessa distribuio,
obtem-se:
Classe Salrios (em R$)
Ponto mdio da classe
x
i
N
o
de funcionrios
f
i
x
i
.f
i
1 1.000,00 1.200,00 1.100,00 2 2.200,00
2 1.200,00 1.400,00 1.300,00 6 7.800,00
3 1.400,00 1.600,00 1.500,00 10 15.000,00
4 1.600,00 1.800,00 1.700,00 5 8.500,00
5 1.800,00 2.000,00 1.900,00 2 3.800,00
Total n = 25 37.300,00
Obs.: Os pontos mdios das classes (x
i
) so determinados tomando-se a mdia aritmtica entre o
extremo inferior e superior de cada classe.
Soluo:
00 , 492 . 1
25
300 . 37
n
f . x
x
n
1 i
i i
= =
=
=
reais/funcionrio
46
C.2 Mediana x
~
de uma distribuio de frequncias
Se os dados apresentados so classificados como varivel contnua, deve-se utilizar para o
clculo da mediana, o procedimento a seguir.
1. Calcula-se a ordem
2
n
(como a varivel contnua, no se preocupe se n par ou mpar);
2. Pela frequncia acumulada F
ac
, identifica-se a classe que contm a mediana (classe da x
~
);
3. Ento, utiliza-se a frmula:
x
~
Md
ant , ac
Md
f
h . F
2
n
I
|
.
|
\
|
+ =
onde: I
Md
= limite inferior da classe da mediana;
n = nmero total de elementos;
F
ac,ant
= soma das frequncias absolutas anteriores classe da mediana;
h = amplitude da classe da mediana;
f
Md
= frequncia absoluta da classe da mediana.
Exemplo 11: Determinando a mediana da situao apresentada no Exemplo 10.
Classe Salrios (em R$)
N
o
de funcionrios
f
i
F
ac
1 1.000,00 1.200,00 2 2
2 1.200,00 1.400,00 6 8
3 1.400,00 1.600,00 10
18 (classe da x
~
)
4 1.600,00 1.800,00 5 23
5 1.800,00 2.000,00 2 25
Total 25 --------------------------
Soluo:
1
o
passo: Calcula-se
2
n
. Como n = 25, tm-se 13 5 , 12
2
25
~ = (13
a
posio);
2
o
passo: Identifica-se a classe da mediana pela F
ac
. Neste caso, a classe da mediana a 3
a
classe, ou
seja, 1.400,00 1.600,00;
3
o
passo: Aplica-se a frmula:
x
~
Md
ant , ac
Md
f
h . F
2
n
I
|
.
|
\
|
+ =
Neste caso: I
Md
= limite inferior da classe da mediana = 1.400,00
n = nmero total de elementos = 25
F
ac,ant
= soma das frequncias absolutas anteriores classe da mediana = 8
h = amplitude da classe da mediana = 200,00
f
Md
= frequncia absoluta da classe da mediana = 10
47
Ou seja: x
~
00 , 490 . 1
10
00 , 200 . 8
2
25
00 , 1400 =
|
.
|
\
|
+ = reais/funcionrio
C.3 Moda x* de uma distribuio de frequncias
Se os dados apresentados so classificados como varivel contnua, pode-se optar por vrios
procedimentos, como moda de Pearson, moda de King, moda de Czuber, entre outros, para se
determinar a moda. Ser dado destaque moda de Czuber.
MODA DE CZUBER
CZUBER levou em considerao, em sua frmula, a frequncia absoluta da classe anterior, a
frequncia absoluta da classe posterior, alm da frequncia absoluta da classe modal, o que leva a um
valor mais preciso para a moda de uma varivel contnua. A frmula de Czuber a seguinte:
x*
( )
) f f ( f 2
h . f f
I
post ant Mo
ant Mo
Mo
+
+ =
onde: I
Mo
= limite inferior da classe modal;
f
Mo
= frequncia absoluta da classe modal;
f
ant
= frequncia absoluta da classe anterior classe modal;
f
post
= frequncia absoluta da classe posterior classe modal;
h = amplitude do intervalo de classe.
Exemplo 12: Determinando a moda de Czuber para a situao apresentada no Exemplo 10.
Classe Salrios (em R$)
N
o
de funcionrios
f
i
1 1.000,00 1.200,00 2
2 1.200,00 1.400,00 6
3 1.400,00 1.600,00 10
4 1.600,00 1.800,00 5
5 1.800,00 2.000,00 2
Total 25
Soluo:
Por observao, a classe modal a terceira classe, j que esta a classe de maior frequncia. Neste
caso,
I
Mo
= limite inferior da classe modal = 1.400,00
f
Mo
= frequncia absoluta da classe modal = 10
f
ant
= frequncia absoluta da classe anterior classe modal = 6
f
post
= frequncia absoluta da classe posterior classe modal = 5
h = amplitude do intervalo de classe = 200,00
Ou seja: x*
( )
89 , 488 . 1
) 5 6 ( 10 . 2
00 , 200 . 6 10
00 , 400 . 1 =
+
+ = reais/funcionrio
Observao Importante: Ocorrem, algumas vezes, dois ou mais picos distintos de igual frequncia nos
dados. Nesses casos, a distribuio bimodal (duas modas) ou de modas mltiplas, respectivamente.
48
1.2 MEDIDAS DE DISPERSO
Em nosso esforo para descrever um conjunto de nmeros, vimos que til localizar o centro do
conjunto de dados. Mas identificar a medida de tendncia central raramente suficiente. Uma descrio
completa de dados pode ser obtida se medirmos o quanto os dados esto dispersos ao redor do ponto
central. exatamente o que as medidas de disperso fazem. Elas mostram o quanto as observaes
desviam-se de sua mdia.
Considere, por exemplo, os trs pequenos conjuntos de dados:
X : 10, 10, 10, 10, 10, 10, 10, 10, 10, 10
Y : 7, 8, 9, 9, 10, 10, 11, 11, 12, 13
Z : 3, 4, 5, 6, 10, 10, 14, 15, 16, 17
Os trs conjuntos tm uma caracterstica comum, que o valor da mdia. Essa mdia 10 para
as trs sries. Entretanto, elas diferem entre si com relao ao agrupamento dos dados em torno dessa
mdia. Na srie X todos os dados so iguais a 10 e, portanto, a mdia representa muito bem essa
srie. Na sequncia Y v-se que vrios dados diferem da mdia, mas esto prximos dela, ou seja,
apresentam grande concentrao em torno de 10: a mdia 10 representa razoavelmente bem a srie.
Na sequncia Z existem muitos valores muito afastados do valor 10 e, portanto, a mdia 10 no
representa muito bem a srie.
Chamando de disperso ou variabilidade a maior ou menor diversificao dos valores de uma
varivel em torno de um valor de tendncia central tomado como ponto de comparao, pode-se dizer
que o conjunto X apresenta uma disperso ou variabilidade nula e que o conjunto Y apresenta uma
disperso ou variabilidade menor que o conjunto Z.
Em resumo, em X os dados esto totalmente concentrados na mdia 10 e, portanto, no h
disperso de dados. Em Y existe forte concentrao de dados em torno da mdia e fraca disperso.
Em Z h fraca concentrao de valores em torno da mdia e grande disperso de dados.
Portanto, para qualificar os valores de uma dada varivel, ressaltando a maior ou menor
disperso entre esses valores e sua medida de posio, a Estatstica recorre s medidas de disperso.
Dessas medidas, sero estudadas a amplitude total, a varincia, o desvio padro e o coeficiente
de variao.
D.1 AMPLITUDE TOTAL
A amplitude total a diferena entre o maior e o menor valor observado:
mn mx T
x x A =
A amplitude total tem o inconveniente de s levar em conta os dois valores extremos da srie,
descuidando do conjunto de valores intermedirios, o que quase sempre invalida a idoneidade do
resultado. Ela apenas uma indicao aproximada da disperso.
Exemplo 13: Determinando a amplitude total para a varivel discreta (n
o
de acidentes) descrita no
Exemplo 6.
Soluo:
30 0 30 A
T
= = acidentes
Exemplo 14: Determinando a amplitude total para a varivel contnua (salrios) descrita no Exemplo 10.
Soluo:
1000 1000 2000 A
T
= = reais
49
D.2 VARINCIA E DESVIO PADRO
Como comentado, a amplitude total instvel por ser influenciada por valores extremos, que
so, na sua maioria, devidos ao acaso.
A varincia e o desvio padro so medidas que no possuem essa falha, pois levam em
considerao a totalidade dos valores da varivel em estudo, o que faz dessas medidas, ndices de
disperso bastante estveis, e por isso mesmo, os mais empregados.
A varincia baseia-se nos desvios em torno da mdia, determinando, porm, a mdia dos
quadrados dos desvios das observaes em relao mdia.
Assim, para o clculo da varincia mais interessante o uso das frmulas:
n
f . ) x (
) x (
i
2
i 2
= o Varincia populacional
onde
=
i
f n
1 n
f . ) x x (
) x ( s
i
2
i 2
=
Varincia amostral
Sendo a varincia calculada a partir dos quadrados dos desvios, ela um nmero em unidade
quadrada em relao varivel em questo, o que, sob o ponto de vista prtico um inconveniente.
Por isso mesmo, imaginou-se uma medida que tem utilidade e interpretao prticas,
denominada desvio padro, definido como a raiz quadrada do valor da varincia, ou seja:
o
= o
2
) x ( Desvio padro populacional
s
2
) x ( s = Desvio padro amostral
Exemplo 15: O Sr. Bonani o gerente da empresa "Investimentos Ninho Seguro". Recentemente,
Bonani estava interessado nas taxas de retorno de dois fundos de investimentos durante os ltimos
cinco anos. Megainvest Inc. apresentou taxas de rendimentos de 12%, 10%, 13%, 9% e 11% nesse
perodo, enquanto as taxas da Dinmica Empresarial foram de 13%, 12%, 14%, 10% e 6%. Um cliente
procurou Bonani e mostrou-se interessado em investir em fundos. Qual deles Bonani deve escolher
para seu cliente?
Soluo:
Os dois fundos oferecem taxa mdia de retorno de 11% (calcule!). O investimento mais seguro aquele
que tem o menor grau de risco, ou seja, o menor desvio padro.
Para a Megainvest, Bonani encontra varincia e desvio padro, respectivamente, iguais a:
2
5
) 11 11 ( ) 11 9 ( ) 11 13 ( ) 11 10 ( ) 11 12 (
n
f . ) x (
) x (
2 2 2 2 2
i
2
i 2
=
+ + + +
=
= o
41 , 1 2 ) x (
2
= = = o
o
%
Para Dinmica Empresarial:
8
5
) 11 6 ( ) 11 10 ( ) 11 14 ( ) 11 12 ( ) 11 13 (
n
f . ) x (
) x (
2 2 2 2 2
i
2
i 2
=
+ + + +
=
= o
83 , 2 8 ) x (
2
= = = o
o
%
Portanto, como Megainvest e Dinmica tm as mesmas taxas mdias de retorno de investimentos,
observamos, pelo desvio padro, que a primeira apresenta menor risco e deve ser a apli cao
escolhida.
50
Exemplo 16: Determinando a varincia amostral e o respectivo desvio padro para a varivel discreta
descrita no Exemplo 6.
Soluo:
Para facilitar o clculo da varincia e do desvio padro, monta-se a tabela abaixo, usando
60 , 12 x = acidentes/dia:
N
o
de acidentes
x
i
N
o
de dias
f
i
i
f .
2
) x
i
x (
0 2 317,52
5 4 231,04
10 5 33,80
15 10 57,60
20 2 109,52
25 1 153,76
30 1 302,76
Total 25 1206,00
1 n
f . ) x x (
) x ( s
i
2
i 2
=
= 25 , 50
1 25
206 . 1
=
s
2
s = , logo 09 , 7 25 , 50 s = =
Portanto, o desvio padro amostral , aproximadamente, 7 acidentes/dia. Assim, o departamento de
trnsito pode decidir se necessria a colocao de um semforo nesse cruzamento, baseando-se no
desvio padro, ou seja, na flutuao do nmero de acidentes dirios que varia de 5 a 19 acidentes.
Exemplo 17: O diretor de vos da TAL requer informaes relativas disperso do nmero de
passageiros. Decises relativas escala de horrios, ao tamanho mais eficiente dos avi es para serem
usados, dependem da variao do nmero de passageiros. Se essa variao em nmero de
passageiros for grande, avies maiores sero necessrios para que se evite super lotao em dias
determinados. necessrio, portanto, calcular a varincia e o respectivo desvio padro. A tabela de
frequncias para a TAL a seguinte (foi considerado aqui dados agrupados em classes):
Classe
(passageiros)
Ponto mdio
da classe
x
i
N
o
de dias
f
i
x
i
.f
i
i
f .
2
) x
i
x (
50 60
55 3 165 1756,92
60 70
65 7 455 1411,48
70 80
75 18 1350 317,52
80 90
85 12 1020 403,68
90 100
95 8 760 1997,12
100 110
105 2 210 1331,28
Total ----- 50 3960 7218,00
Soluo:
Para facilitar o clculo da varincia e do desvio padro, montou-se a tabela acima. Calcula-se a mdia
como:
20 , 79
50
3960
n
f . x
x
n
1 i
i i
= = =
=
passageiros
51
A varincia e do desvio padro, so, portanto:
1 n
f . ) x x (
) x ( s
i
2
i 2
=
= 31 , 147
1 50
7218
=
s
2
s = , logo 14 , 12 31 , 147 s = = passageiros
Portanto, o diretor de vos pode decidir se os atuais avies acomodam as flutuaes do nmero de
passageiros baseando-se no desvio padro de 12,14. Caso no acomodem, talvez avies maiores
sejam usados nos dias com maior nmero de passageiros.
D.3 FORMAS USUAIS DE UTILIZAO DO DESVIO PADRO
D.3.1 O TEOREMA DE CHEBYSHEV
O Teorema de Chebyshev foi formulado pelo matemtico russo Pafnuty Chebyshev (1821-1894).
Ele enuncia que, em qualquer conjunto de dados, pelo menos
2
K
1
1 por cento das observaes
encontra-se a uma distncia de K desvios padro da mdia, onde K qualquer nmero maior que 1.
O Teorema de Chebyshev expresso como:
(
2
K
1
1
Por exemplo, se construirmos um intervalo cujo limite superior a mdia mais trs (K = 3)
desvios padro e o inferior a mdia menos trs desvios padro, ento, pelo menos
% 89 , 88 8889 , 0
3
1
1
2
=
(
X
Suponha que temos um grande nmero de observaes, em minutos, dos tempos que atletas
levam para completar determinada corrida. Se os dados so distribudos normalmente, um grfico das
frequncias com que cada observao ocorre ficar com a forma da figura acima. As observaes de
cada extremo no ocorrem frequentemente, mas as observaes prximas ao centro vo aumentando,
produzindo assim a curva em forma de sino. A observao modal, 5 nesse caso, a que ocorre com
maior frequncia e, assim, o ponto de mximo dessa curva. Numa distribuio normal, a mdia, a
mediana e a moda so iguais.
53
A metade das observaes est acima da mdia e a outra metade est abaixo. Isso significa que
metade da rea sob a curva est esquerda da mdia e a outra metade est direita.
Para ilustrar como o desvio padro aplica-se na distribuio normal, suponha que 1000 atletas
completaram determinada corrida. Os tempos de todos os corredores so distribudos normalmente,
com uma mdia de = 5 minutos e um desvio padro de 1 minuto. A distribuio emprica diz que, se
considerarmos as observaes localizadas no intervalo formado pela mdia menos um desvio padro e
pela mdia mais um desvio padro, teremos 68,3% de todas as observaes. Isto , no importa qual
a mdia, nem o desvio padro, 68,3% das observaes caem no intervalo de amplitude de dois desvios
padro e com ponto mdio dado pela mdia das observaes.
Como os atletas levaram em mdia 5 minutos para completar a corrida, tomando um desvio
padro de 1 minuto acima e abaixo da mdia, produzimos o intervalo 4 a 6 minutos. Assim, de acordo
com a distribuio emprica 683 (68,3% de 1000) atletas levaram de 4 a 6 minutos para completar a
corrida.
Claro que, se tomarmos mais de um desvio padro acima ou abaixo da mdia, vamos incluir
uma maior porcentagem das observaes. A distribuio emprica especifica que:
Dados os tempos dos atletas com um desvio padro de 1 minuto acima e abaixo da mdia de 5
minutos, construmos o intervalo de 4 a 6 minutos. Com dois desvios padro acima e abaixo da mdia
de 5 minutos, construmos o intervalo de 3 a 7 minutos. Com trs desvios padro acima e abaixo da
mdia de 5 minutos, construmos o intervalo de 2 a 8 minutos. Portanto, de acordo com a distribuio
emprica, 997 dos 1000 atletas gastaram de 2 a 8 minutos para completar a corrida. Apenas 3 dos 1000
atletas so muito bons e levaram menos de 2 minutos ou so pssimos corredores levando mais de 8
minutos para completar a corrida. Uma observao afastada da mdia mais de trs desvios padro
uma raridade e acontece em 0,3% dos casos se os dados obedecem a distribuio normal.
Intervalo Porcentagem de
observaes
o 1
68,3%
o 2
95,5%
o 3
99,7%
54
1.3 MEDIDAS SEPARATRIZES
So nmeros reais que dividem a sequncia ordenada de dados em partes que contm a
mesma quantidade de elementos da srie.
A mediana, por exemplo, que divide a sequncia ordenada em dois grupos, cada um deles
contendo 50% dos valores da sequncia, tambm uma medida separatriz.
Alm da mediana, neste captulo, sero destacadas outras medidas separatrizes, ou seja,
quartis, decis e percentis.
E.1 Quartis
Os quartis dividem um conjunto de dados em quatro partes iguais, como pode ser visto
esquematicamente:
0% 25% 50% 75% 100%
Q
1
Q
2
= x
~
Q
3
Q
1
= 1
o
quartil, composto por 25% dos elementos.
Q
2
= 2
o
quartil, coincide com a mediana, composto por 50% dos elementos.
Q
3
= 3
o
quartil, composto por 75% dos elementos.
Os quartis sero utilizados, apenas, para dados agrupados em classes. As frmulas para a
determinao dos quartis Q
1
e Q
3
so semelhantes quelas usadas para o clculo da mediana.
Determinao de Q
1
: Determinao de Q
3
:
1
o
Passo: Calcula-se a posio
4
n
1
o
Passo: Calcula-se a posio
4
n 3
2
o
Passo: Identifica-se a classe de Q
1
pela F
ac
2
o
Passo: Identifica-se a classe de Q
3
pela F
ac
3
o
Passo: Aplica-se a frmula: 3
o
Passo: Aplica-se a frmula:
1
Q
ant , ac
1
Q 1
f
h . F
4
n
I Q
|
.
|
\
|
+ =
3
Q
ant , ac
3
Q 3
f
h . F
4
n 3
I Q
|
.
|
\
|
+ =
onde: l
Qi
= limite inferior da classe Q
i
n = nmero total de elementos
h = amplitude de classe
f
Qi
= frequncia absoluta da classe Q
i
F
ac,ant
= soma das frequncias absolutas anteriores classe Q
i
.
55
Exemplo 20: Em conjunto com uma auditoria anual, uma empresa de contabilidade pblica anota o
tempo necessrio para realizar a auditoria de 52 balanos contbeis, tal como indicado na tabela
abaixo. Determinando os valores do 1
o
e 3
o
quartis (Q
1
e Q
3
):
Classe Tempo de auditoria
(em minutos)
N
o
de balanos
f
i
F
ac
1
9 19
3 3
2
19 29
5 8
3
29 39
10 18 (classe de Q
1
)
4
39 49
14 32
5
49 59
20 52 (classe de Q
3
)
Total 52 ----------
Soluo:
Q
1
= ? Q
3
= ?
1
o
Passo: 13
4
52
4
n
= = (13
a
posio) 39
4
52 . 3
4
n 3
= = (39
a
posio)
2
o
Passo: Pela F
ac
, identifica-se as classes de Q
1
e Q
3
3
o
Passo: Uso das frmulas:
1
Q
ant , ac
1
Q 1
f
h . F
4
n
I Q
|
.
|
\
|
+ = 34
10
10 . 8
4
52
29 Q
1
=
|
.
|
\
|
+ = minutos/balano
3
Q
ant , ac
3
Q 3
f
h . F
4
n 3
I Q
|
.
|
\
|
+ = 5 , 52
20
10 . 32
4
52 . 3
49 Q
3
=
|
.
|
\
|
+ = minutos/balano
0% 25% 50% 75% 100%
10 34 x
~
52,5 59
Interpretao: 25% dos balanos so realizados em at 34 minutos e 75% dos balanos so realizados
em at 52,5 minutos.
56
E.2 DECIS
Os decis dividem um conjunto de dados em dez partes iguais. Os decis sero utilizados, apenas,
para dados agrupados em classes. O procedimento para a determinao dos decis semelhante
quele usados para o clculo dos quartis.
1
o
Passo: Calcula-se a posio
10
n . i
, onde i = 1, 2, 3, 4, 5, 6, 7, 8, 9
2
o
Passo: Identifica-se a classe de D
i
pela F
ac
3
o
Passo: Aplica-se a frmula:
f
h . F
10
n . i
I D
Di
ant , ac
i
D i
|
.
|
\
|
+ =
onde: l
Di
= limite inferior da classe D
i
n = nmero total de elementos
h = amplitude de classe
f
Di
= frequncia absoluta da classe D
i
F
ac,ant
= soma das frequncias absolutas anteriores classe D
i
Exemplo 21: Determinando o valor do 4
o
decil (D
4
) para a situao apresentada no Exemplo 20.
Classe Tempo de auditoria
(em minutos)
N
o
de balanos
f
i
F
ac
1
9 19
3 3
2
19 29
5 8
3
29 39
10 18
4
39 49
14 32 (classe de D
4
)
5
49 59
20 52
Total 52 ----------
Soluo:
1
o
Passo: Calcula-se a posio 21 80 , 20
10
52 . 4
~ = (21
a
posio)
2
o
Passo: Identifica-se a classe de D
4
pela F
ac
3
o
Passo: Aplica-se a frmula:
f
h . F
10
n . 4
I D
4
D
ant , ac
4
D 4
|
.
|
\
|
+ = 41
14
10 . 18
10
52 . 4
39 D
4
=
|
.
|
\
|
+ = minutos/balano
Interpretao: 40% dos balanos so realizados em at 41 minutos e 60% dos balanos, portanto, so
realizados em tempos acima de 41 minutos.
57
E.3 PERCENTIS
Os percentis dividem um conjunto de dados em cem partes iguais. Os percentis sero utilizados,
apenas, para dados agrupados em classes. O procedimento para a determinao dos percentis
semelhante quele usados para o clculo dos quartis e dos decis.
1
o
Passo: Calcula-se a posio
100
n . i
, onde i = 1, 2, 3, 4, 5, ..., 97, 98, 99
2
o
Passo: Identifica-se a classe P
i
pela F
ac
3
o
Passo: Aplica-se a frmula:
f
h . F
100
n . i
I P
Pi
ant , ac
i
P i
|
.
|
\
|
+ =
onde: l
Pi
= limite inferior da classe P
i
n = nmero total de elementos
h = amplitude de classe
f
Pi
= frequncia absoluta da classe P
i
F
ac,ant
= soma das frequncias absolutas anteriores classe P
i
Exemplo 22: Determinando o valor do 82
o
percentil (P
82
) para a situao apresentada no Exemplo 20.
Classe Tempo de auditoria
(em minutos)
N
o
de balanos
f
i
F
ac
1
9 19
3 3
2
19 29
5 8
3
29 39
10 18
4
39 49
14 32
5
49 59
20 52 (classe de P
82
)
Total 52 ----------
Soluo:
1
o
Passo: Calcula-se a posio 43 64 , 42
100
52 . 82
~ = (43
a
posio)
2
o
Passo: Identifica-se a classe de P
82
pela F
ac
3
o
Passo: Aplica-se a frmula:
f
h . F
100
n . 82
I P
82
P
ant , ac
82
P 82
|
.
|
\
|
+ = 32 , 54
20
10 . 32
100
52 . 82
49 P
82
=
|
.
|
\
|
+ = minutos/balano
Interpretao: 82% dos balanos so realizados em at 54,32 minutos e 18% dos balanos, portanto,
so realizados em tempos acima de 54,32 minutos.
58
LISTA 3 Exerccios para fixao
1. Considere uma amostra com os valores de 53, 55, 70, 58, 64, 57, 53, 69, 57, 68 e 53. Calcule a
mdia, a mediana e a moda.
2. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2.
Calcule a nota mdia, a nota mediana e a nota modal.
3. Para uma amostra de 15 clientes de um pequeno mercado, foram observados os seguintes
montantes de vendas, ordenados em ordem crescente: R$ 5,10; 5,10; 6,25; 6,25; 6,25; 7,45; 8,40;
8,53; 9,90; 10,25; 10,35, 12,55; 12,71; 13,09 e 14,10. Determinar a mdia, a mediana e a moda
para esses valores de vendas.
4. Uma amostra de 20 operrios de uma companhia apresentou os seguintes salrios recebidos durante
certa semana, arredondados para o valor do real mais prximo e apresentados em ordem crescente: R$
140; 140; 140; 140; 140; 140; 140; 140; 155; 155; 165; 165; 180; 180; 190; 200; 205; 225; 230; 240.
Calcular a mdia, a mediana e a moda para esse grupo de salrios.
5. As taxas de juros recebidas por 10 aes escolhidas ao acaso na BOVESPA durante um trimestre
foram (em porcentagem): 2,59; 2,64; 2,60; 2,62; 2,61; 2,50; 2,63; 2,64; 2,55; 2,57. Calcule a taxa de
juros mdia e a taxa de juros mediana.
6. Numa turma com 20 moas e 50 rapazes foi aplicada uma prova de Estatstica. A mdia aritmtica
das moas foi 9,2 e a dos rapazes foi 7,8. Qual foi a mdia de toda a turma nessa prova?
7. Um grupo de 64 pessoas, que trabalha em uma empresa, formado por sub-grupos que tem salrios
dirios com as seguintes caractersticas: 12 pessoas ganham R$ 50,00; 10 ganham R$ 60,00;
20 ganham R$ 25,00; 15 ganham R$ 90,00 e 7 ganham R$ 120,00. Qual a mdia salarial diria de
todo o grupo?
8. Para se estimar o nmero de peas defeituosas de um veculo, escolheu-se uma amostra de 50
veculos, encontrando-se o seguinte nmero de peas defeituosas por veculo:
N
o
de peas defeituosas N
o
de veculos (f
i
)
0 25
1 20
2 3
3 1
4 1
Calcule o nmero mdio de peas defeituosas por veculo, o nmero mediano e o nmero modal.
9. Para se estimar o nmero de acidentes dirios em um grande estacionamento durante um perodo de
um ms, escolheu-se o ms de setembro, encontrando-se os seguintes nmeros:
N
o
de acidentes N
o
de dias (f
i
)
0 5
1 9
2 12
3 3
4 1
Calcule o nmero mdio dirio de acidentes em setembro, o nmero mediano e o nmero modal.
59
10. Em um levantamento entre os assinantes da revista Fortune 500, foi feita a seguinte pergunta:
"Quantas das ltimas quatro edies voc leu ou folheou?" A seguinte distribuio de frequncias
sintetiza uma amostra de 500 respostas:
N
o
de edies lidas N
o
de assinantes (f
i
)
0 15
1 10
2 40
3 85
4 350
a) Qual o nmero mdio de edies lidas por um assinante da revista "Fortune"?
b) Qual o nmero mediano?
c) Qual o nmero modal?
d) Compare os trs valores obtidos nos itens anteriores e discuta esses resultados.
11. Na tabela abaixo se observa o nmero de dias necessrios para entregas de pedidos de compra
para a Dawson Supply Distribuidores em relao ao nmero mdio de produtos comprados.
N
o
de dias para entrega
de pedidos de compra
N
o
de produtos comprados
(f
i
)
7 50
10 150
12 200
15 400
20 1.200
30 2.000
45 4.000
Calcule o nmero mdio de dias para entregas de pedidos de compra, o nmero mediano e o nmero
modal. Compare os trs valores obtidos e discuta esses resultados.
12. Os dados abaixo representam uma amostra das vendas semanais, em classes de salrios mnimos,
de vendedores de gneros alimentcios.
Vendas semanais
(em salrios mnimos)
N
o
de vendedores (f
i
)
30 35
2
35 40
10
40 45
18
45 50
50
50 55
70
55 60
30
60 65
18
65 70
2
Calcule a mdia, a mediana e a moda de Czuber para esse conjunto de dados.
60
13. A tabela abaixo apresenta os resultados de 30 anlises de uma substncia qumica (em
porcentagem) presente em amostras de gua coletadas num rio de So Paulo.
Substncia Qumica (%) N
o
de anlises (f
i
)
0 16
3
16 32
5
32 48
7
48 64
9
64 80
4
80 96
2
Calcule a mdia, a mediana e a moda de Czuber para esse conjunto de dados e interprete os
resultados obtidos.
14. Uma pesquisa para determinar a eficincia de uma nova rao para animais, em termos de ganho
de peso, mostrou que aps um ms em que a rao normal foi substituda pela nova rao, os animais
apresentaram um aumento de peso, segundo a distribuio, dada na tabela abaixo:
Aumento de peso (em kg)
N
o
de animais (f
i
)
0 2
5
2 4
7
4 6
20
6 8
16
8 10
7
10 12
5
Calcule o aumento mdio de peso por animal, o aumento mediano e o aumento modal. Interprete os
resultados obtidos.
15. Calcule a mdia, a mediana e a moda para uma amostra das alturas de 70 alunos de uma escola.
Interprete os resultados obtidos.
Alturas (cm) N
o
de alunos ( f
i
)
150 160
2
160 170
15
170 180
18
180 190
18
190 200
16
200 210
1
16. Uma empresa de mbito nacional, fornecedora de supermercados, fez um levantamento do
consumo de seu principal produto em vrios supermercados, obtendo em determinado ms, a tabela:
N
o
de unidades consumidas N
o
de supermercados ( f
i
)
0 1.000 10
1.000 2.000 50
2.000 3.000 200
3.000 4.000 320
4.000 5.000 150
5.000 6.000 30
Determine o consumo mdio, mediano e modal deste produto por supermercado pesquisado. Interprete
os resultados obtidos.
61
17. O departamento de recursos humanos de uma empresa fez um levantamento dos salrios de uma
amostra de 120 funcionrios do setor de logstica, obtendo os seguintes resultados:
Salrios (R$) N
o
de funcionrios (f
i
)
400,00 500,00 12
500,00 600,00 30
600,00 700,00 42
700,00 800,00 24
800,00 900,00 6
900,00 1.000,00 6
a) Calcule o salrio mdio dos funcionrios do setor de logstica.
b) Calcule o salrio mediano.
c) Calcule a moda de Czuber.
d) Calcule a varincia dos salrios do setor de logstica e o desvio padro correspondente,
interpretando os resultados obtidos em termos de coeficiente de variao.
18. A varivel x, que representa uma amostra das notas de Estatstica dos alunos de uma classe de
certa universidade, tem distribuio dada pela tabela abaixo:
Notas de
Estatstica
N
o
de
alunos
x
i
(ponto mdio)
x
i
.f
i
2
i
) x x (
i
2
i
f . ) x x (
F
ac
0 2
3
2 4
12
4 6
18
6 8
12
8 10
3
Total
a) Complete a tabela.
b) Calcule a mdia, a mediana, a moda e o desvio padro de x. Interprete os resultados obtidos.
c) Todo aluno que tiver nota situada entre as 10% mais altas receber um prmio. A partir de que nota o
aluno far jus ao prmio?
d) Todo aluno que tiver nota situada entre as 45% mais baixas far recuperao. A partir de que nota o
aluno no necessitar de recuperao?
19. Um conjunto de dados dos pesos de 1000 sacos de comida para cachorro "Lulu Feliz" tem uma
mdia de 23 kg e um desvio padro de 1,04 kg. Os produtores da "Lulu Feliz" esperam que pelo menos
750 sacos pesem entre 20,92 kg e 25,08 kg. Usando o Teorema de Chebyshev, o que voc pode
afirmar para os produtores?
20. Dadas as idades dos 100 maiores executivos das empresas citadas na Fortune 500, revelou-se que
a mdia de 56,2 anos de idade e o desvio padro 12,7 anos. A renda mdia desses executivos
89.432 dlares com desvio padro de 16.090 dlares. Qual das variveis tem maior variao: idade ou
renda?
21. Estudando-se o consumo dirio de leite em certa regio, verificou-se que 20% das famlias
consomem at 1 litro de leite por dia; 50% das famlias consomem entre 1 e 2 litros; 20% consomem
entre 2 e 3 litros e o restante das famlias consome entre 3 e 4 litros. Para uma amostra de 100 famlias:
a) Escreva estas informaes na forma de uma distribuio de frequncias.
b) Construa o histograma para essa situao.
c) Qual o consumo mdio dirio de leite por famlia?
d) E o consumo mediano?
e) Qual o desvio padro? Interprete o resultado obtido em relao mdia.
62
22. Um posto de gasolina registrou a seguinte distribuio de frequncias para o nmero de litros de
gasolina vendido por carro em uma amostra de 680 carros.
Gasolina (em litros) N
o
de carros (f
i
)
0 8 74
8 16 192
16 24 280
24 32 105
32 40 23
40 48 6
TOTAL 680
a) Calcule a mdia e o desvio padro para esses dados agrupados. Interprete o resultado obtido.
b) Se o posto de gasolina espera atender cerca de 120 carros em determinado dia, qual a estimativa
do nmero total de litros de gasolina que sero vendidos?
c) Calcule a mediana e a moda.
d) Se o proprietrio do posto de gasolina deseja oferecer um brinde para 5% dos clientes que colocarem
o maior nmero de litros de gasolina em seu tanque, a partir de que nmero de litros o cliente ser
premiado?
23. A tabela abaixo apresenta a distribuio das exportaes de empresas de equipamentos eletrnicos
em 2004.
Volume Exportado (em US$ milhes) N
o
de empresas (f
i
)
50.000 60.000
5
60.000 70.000
10
70.000 80.000
20
80.000 90.000
10
90.000 100.000
5
Para essa distribuio de frequncias, analise e responda:
a) Se o governo, para incrementar as exportaes, der incentivos fiscais metade das empresas que
tenham melhor desempenho em relao ao volume exportado, a partir de que valor exportado as
empresas tero esses incentivos?
b) Se o governo, para incrementar as exportaes, der iseno fiscal s empresas que estejam entre as
7% com melhor desempenho em relao ao volume exportado, a partir de que valor exportado as
empresas tero iseno?
24. Um banco decidiu diminuir as taxas bancrias para 10% de seus correntistas (pessoas fsicas) que
tenham os maiores saldos em uma de suas agncias bancrias no interior do Paran. Para isto, fez um
levantamento desses saldos, por correntista, obtendo a tabela:
Saldos (R$) N
o
de contas correntes ( f
i
)
0 10.000 50
10.000 20.000 100
20.000 30.000 80
30.000 40.000 10
40.000 50.000 10
Pergunta-se: A partir de que saldo o correntista ter reduo de taxas bancrias?
63
25. Uma amostra do tempo de vida til de uma pea automotiva forneceu a seguinte distribuio:
Vida til (horas) N
o
de peas ( f
i
)
0 1.000 6
1.000 2.000 42
2.000 3.000 86
3.000 4.000 127
4.000 5.000 74
5.000 6.000 15
Se o fabricante deseja estabelecer uma garantia mnima para o nmero de horas de vida til dessa
pea, trocando a pea que no apresentar este nmero mnimo de horas, qual a garantia, se ele est
disposto a trocar 4% das peas?
26. O relatrio Nielsen de Tecnologia Domstica (20/02/2003) relatou o uso de tecnologia domstica por
pessoas com 12 anos ou mais. Os dados abaixo so as horas de uso do computador pessoal durante
uma semana para uma amostra de 50 pessoas.
8,2 3,0 20,8 11,8 6,8 11,4 3,2 12,2 6,0 7,5
6,2 9,6 4,0 27,9 10,8 8,4 7,9 8,3 22,3 7,0
8,2 8,2 17,6 11,2 8,6 6,6 14,1 20,5 12,4 15,3
21,6 5,6 19,0 25,8 24,2 0,8 8,1 18,5 8,8 11,4
14,4 12,2 11,4 11,8 9,4 7,9 7,4 6,2 12,2 6,2
a) Sintetize os dados construindo uma tabela de distribuio de frequncias frequncia absoluta,
frequncia relativa (%), frequncia acumulada e frequncia acumulada relativa (%) Calcule a
amplitude de classe ideal para responder s prximas questes iniciando de 0,0.
b) Responda:
b1) Qual a % de pessoas que utilizam o computador pessoal por menos de 12,0 horas?
b2) Qual o nmero de pessoas que utilizam o computador pessoal pelo menos por 20,0 horas?
b3) Qual a % de pessoas que utilizam o computador pessoal no mximo por 24,0 horas
(exclusive)?
b4) Qual o nmero de pessoas que utilizam o computador pessoal por mais de 8,0 horas (inclusive)?
c) Construa um histograma de frequncias absolutas para esta distribuio.
d) Qual o tempo mdio de utilizao do computador pessoal?
e) Qual o desvio padro? Interprete o resultado obtido em termos de coeficiente de variao.
f) Qual o tempo mediano de utilizao do computador pessoal? Interprete o resultado obtido.
g) Qual o tempo modal de utilizao do computador pessoal?
h) Se determinado site der um prmio a 2% dos usurios que o visitarem por mais vezes, a partir de
quantas horas esses usurios sero premiados?
27. Em uma fila de banco, doze pessoas esperaram, em minutos, os seguintes tempos para serem
atendidas: 8, 11, 5, 4, 5, 14, 11, 12, 16, 11, 8 e 11. O tempo mediano de espera, em minutos, :
A) 11
B) 11,5
C) 12
D) 12,5
E) 13
28. Uma empresa possui dois tcnicos em informtica recebendo salrios mensais de R$ 3.400,00 cada
um, quatro economistas recebendo R$ 4.500,00 cada um por ms, um diretor de recursos humanos
com salrio mensal de R$ 7.000,00 e trs outros profissionais recebendo R$ 5.500,00 cada um por
ms. A mdia mensal destes salrios :
A) R$ 5.830,00
64
B) R$ 6.830,00
C) R$ 2.830,00
D) R$ 3.830,00
E) R$ 4.830,00
29. Um pesquisador calculou a mdia amostral de 25 observaes e obteve 12,80. Mais tarde,
percebeu que havia se enganado em relao a uma das observaes, cujo valor correto era 18,60 em
vez de 22,60. Portanto, o valor correto da mdia amostral :
A) 9,98
B) 10,06
C) 10,28
D) 11,36
E) 12,64
30. A mdia aritmtica dos salrios dos 100 empregados em uma empresa era de R$ 1.500,00. Por
conta da crise econmica, em 2008, foram demitidos 20 empregados, que ganhavam cada um o salrio
de R$ 2.500,00. No incio de 2010, aps o fim da crise, foi concedido um aumento de 10% em todos os
salrios dos empregados remanescentes. Ento, a nova mdia aritmtica dos salrios :
A) R$ 1.375,00
B) R$ 1.350,00
C) R$ 1.345,00
D) R$ 1.320,00
E) R$ 1.300,00
31. Em 2001, uma universidade pagou a cada um de seus instrutores salrios mensais de R$ 1.500,00;
a cada um de seus 67 assistentes, R$ 2.000,00; a cada um dos 58 adjuntos , R$ 2.600,00 e a cada um
de seus 32 titulares, R$ 3.100,00. O salrio mensal mediano dos 202 docentes dessa universidade :
A) R$ 2.300,00
B) R$ 2.600,00
C) R$ 2.000,00
D) R$ 2.400,00
E) R$ 3.100,00
32. Na tabela abaixo, tm-se a distribuio do valor dos aluguis (em reais) pagos por 200 pessoas em
residncias situadas na zona urbana de uma cidade de mdio porte.
Aluguel (R$) N
o
de pessoas
f
i
F
ac
200 300 10 10
300 400 40 50
400 500 80 130
500 600 50 180
600 700 20 200
Total 200 --------
Se fosse concedido um desconto no valor do aluguel para 50% das pessoas que pagam os aluguis
mais altos, elas teriam o desconto a partir de:
A) R$ 462,50
B) R$ 428,00
C) R$ 328,80
D) R$ 318,00
E) R$ 300,00
33. Os preos do pacote de caf (500g) cobrados em diferentes supermercados locais so: R$ 3,50,
R$ 2,00, R$ 1,50 e R$ 1,00. Com base nesses dados, correto afirmar que:
A) o preo mdio do pacote de 500g de caf de R$ 1,80;
65
B) se todos os preos tiverem uma reduo de 50%, o novo preo mdio ser de R$ 1,00;
C) a varincia dos preos igual a 0,625;
D) o desvio padro dos preos igual a 0,791;
E) o coeficiente de variao dos preos igual aproximadamente a 44%.
34. Uma amostra aleatria de 250 residncias de famlias, classe mdia com dois filhos, revelou a
seguinte distribuio do consumo mensal de energia eltrica:
Consumo
mensal
(KWh)
N
o
de famlias
f
i
f
ri
(%) x
i
.f
i
i
2
i
f . ) x x (
F
ac
0 50 2 0,80 50 74.343,68 2
50 100 15 6,00 1.125 305.877,60 17
100 150 32 12,80 4.000 275.578,88 49
150 200 47 18,80 8.225 86.096,48 96
200 250 50 20,00 11.250 2.592,00 146
250 300 80 32,00 22.000 261.747,20 226
300 350 24 9,60 7.800 275.804,16 250
Total 250 100,00 54.450 1.282.040,00 _____
Nesta distribuio, em relao ao desvio padro, pode-se dizer que:
A) representa, aproximadamente, 32,95% da mdia (coeficiente de variao);
B) igual a 71,61 KWh;
C) aproximadamente igual a 72 KWh e representa o valor mais freqente no conjunto de dados;
D) igual a 5.148,76 KWh e calculado como raiz quadrada da varincia;
E) 50% das famlias gastam at 217,44 KWh e 50% das famlias gastam mais que 217,44 KWh.
35. Em relao ao exerccio anterior, se a companhia de energia eltrica divide seus clientes em trs
categorias, com relao ao consumo, de forma que:
- os 15% que menos consomem energia sejam da categoria A;
- os 75% seguintes sejam da categoria B;
- e os 10% seguintes, isto , os que mais consomem, sejam da categoria C;
o limite inferior da categoria C , aproximadamente, igual a:
A) 217,44 KWh
B) 229,00 KWh
C) 250,00 KWh
D) 299,38 KWh
E) 300,00 KWh
66
CAPTULO 4 - REGRESSO LINEAR E CORRELAO
BIBLIOGRAFIA CONSULTADA:
1. ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A. Estatstica Aplicada Administrao e
Economia. 2.ed. So Paulo: Cengage Learning, 2007.
2. DOWNING, D.; CLARK, J. Estatstica Aplicada. So Paulo: Saraiva, 2002.
3. MARTINS, G. A.; DONAIRE, D. Princpios de Estatstica. 4.ed. So Paulo: Atlas, 1995.
4. NOBRE, J. S. M. Apostila de Estatstica. So Paulo: Universidade Paulista, 2007.
5. STEVENSON, W. J. Estatstica Aplicada Administrao. 3.ed. So Paulo: Harbra, 2001.
REGRESSO LINEAR E CORRELAO
REGRESSO LINEAR SIMPLES: Mtodo de anlise da relao entre uma varivel independente e
uma varivel dependente. uma equao que descreve a relao em termos matemticos.
CORRELAO: Mede o grau de relao entre as duas variveis.
Na REGRESSO a varivel y chamada de varivel dependente e a varivel x de varivel
independente.
Seja y uma varivel de interesse e cujo comportamento futuro deseja-se prever. fcil identificar
uma srie de variveis x
i
(x
1
, x
2
, x
3
,..., x
n
) que influenciam o comportamento de y, a varivel dependente
do modelo. A Estatstica oferece meios de se chegar relao entre a varivel dependente (y) e as
variveis independentes (x
1
, x
2
, x
3
,..., x
n
) atravs da anlise de regresso.
Ser estudado o modelo: y = ax +b (ajuste de uma reta).
DIAGRAMA DE DISPERSO
Exemplo 1: Suponha que um analista toma uma amostra aleatria de 10 carregamentos por caminho
feitos por uma companhia e anota a distncia em quilmetros e o tempo de entrega em dias
(arredondado para o meio dia mais prximo), conforme a tabela abaixo.
Carregamento Distncia Rodoviria (km)
x
Tempo de entrega (dias)
y
1 825 3,5
2 215 1,0
3 1070 4,0
4 550 2,0
5 480 1,0
6 920 3,0
7 1350 4,5
8 325 1,5
9 670 3,0
10 1215 5,0
Uma boa maneira de determinar se h relao entre a distncia rodoviria percorrida e o tempo
de entrega do carregamento traar um grfico. interessante plotar um diagrama, no qual cada ponto
plotado representa um par observado de valores para as variveis dependente e independente. O valor
da varivel independente, x, no caso a distncia rodoviria, plotado no eixo horizontal, enquanto que,
67
o valor da varivel dependente, y, no caso o tempo de entrega, plotado no eixo vertical. Para cada
observao ser marcado um ponto. Este tipo de grfico chamado diagrama de disperso (ver figura
abaixo).
0
1
2
3
4
5
6
0 200 400 600 800 1000 1200 1400 1600
Distncia Rodoviria (km)
T
e
m
p
o
d
e
E
n
t
r
e
g
a
(
d
i
a
s
)
Pelo diagrama acima, parece que os pontos seguem uma relao linear. Assim, apropriado ao caso, a
anlise de regresso linear.
AJUSTE DE UMA RETA - MTODO DOS MNIMOS QUADRADOS
Estabelecido o modelo y = a.x + b, necessrio calcular-se os valores de a e b de forma que a
reta passe, to prxima quanto possvel, dos pontos assinalados no diagrama de disperso. Isto ,
deseja-se minimizar a discrepncia total entre os pontos marcados e a reta, cujos coeficientes, a e b,
sero determinados. O melhor mtodo para a determinao dos parmetros a e b o Mtodo dos
Mnimos Quadrados. Segundo esse mtodo, possvel calcular os parmetros a e b pela aplicao
das seguintes frmulas:
=
2
2
) x (
x
n
y . x xy n
a
x . a y b = , onde n = nmero de observaes;
n
x
x
= = mdia dos x
i
;
n
y
y
= = mdia dos y
i
Portanto,
n
x
. a
n
y
b
=
A equao ajustada y = a.x + b permite predizer o valor de y a partir de um determinado valor de x.
Exemplo 2: Determinando a equao de regresso de mnimos quadrados para os dados apresentados
no Exemplo 1.
68
Neste caso, necessrio calcular a e b. Para isso, conveniente a construo da tabela:
Carregamento
amostrado
Distncia
(km)
x
Tempo de entrega
(dias)
y
x.y
x
2
1 825 3,5 2.887,5 680.625
2 215 1,0 215,0 46.225
3 1070 4,0 4.280,0 1.144.900
4 550 2,0 1.100,0 302.500
5 480 1,0 480,0 230.400
6 920 3,0 2.760,0 846.400
7 1350 4,5 6.075,0 1.822.500
8 325 1,5 487,5 105.625
9 670 3,0 2.010,0 448.900
10 1215 5,0 6.075,0 1.476.225
Total 7.620 28,5 26.370,0 7.104.300
Soluo: n = 10
= 0 , 26370 y . x 7620 x =
5 , 28 y =
7104300
x
2
=
=
2
2
) x (
x
. n
y . x xy . n
a = 0035851 , 0
) 7620 ( 7104300 10
5 , 28 7620 0 , 26370 10
2
=
0 , 762
10
7620
n
x
x = =
=
85 , 2
10
5 , 28
n
y
y = =
=
x . a y b = , logo 12 , 0 1182 , 0 0 , 762 0035851 , 0 85 , 2 b ~ = =
Portanto, 12 , 0 x . 0036 , 0 y b x . a y + = + = a reta ajustada, que est traada no diagrama de
disperso do Exemplo 1, conforme a figura abaixo.
0
1
2
3
4
5
6
0 200 400 600 800 1000 1200 1400 1600
Distncia Rodoviria (km)
T
e
m
p
o
d
e
E
n
t
r
e
g
a
(
d
i
a
s
)
69
Usando a equao de regresso desenvolvida acima, pode-se estimar o tempo de entrega de
um carregamento para qualquer distncia, desde que as viagens no ultrapassem 1.350 km, que a
distncia mxima para a qual essa equao de regresso foi estimada. Para a distncia de 1.000 km,
por exemplo, o clculo o seguinte:
72 , 3 12 , 0 1000 . 0036 , 0 12 , 0 x . 0036 , 0 y = + = + = dias
Logo, o tempo de entrega para um carregamento pela distncia rodoviria de 1.000 km igual a
3,72 dias.
COEFICIENTE DE CORRELAO
a medida que descreve o grau da associao linear entre duas variveis aleatrias contnuas,
por exemplo, x e y.
Para avaliar o coeficiente de correlao linear entre duas variveis, ou seja, medir o grau de
ajuste dos valores em torno de uma reta, utilizado o coeficiente de correlao de Pearson. Este
coeficiente de correlao dado por:
=
] ) y ( y n ][ ) x (
x
n [
) y )( x ( xy n
r
2 2 2
2
, onde n o nmero de observaes.
Os valores do coeficiente de correlao r esto sempre entre 1 e +1. Um valor +1 indica
que as duas variveis x e y esto perfeitamente relacionadas de forma linear positiva. Isto , todos os
pontos dados esto numa linha reta que tem inclinao positiva (f uno linear crescente). Um valor -1
indica que as duas variveis x e y esto perfeitamente relacionadas de forma linear negativa. Isto ,
todos os pontos dados esto numa linha reta que tem inclinao negativa (funo linear decrescente).
Valores do coeficiente de correlao prximos a zero indicam que x e y no esto linearmente
relacionados.
Estas afirmaes podem ser observadas abaixo, pelas configuraes dos diagramas de
disperso para diferentes valores de r.
0 5 10 15 20 25 30 35 40
0
10
20
30
40
50
60
70
80
y
x
r = +1,00 Relacionamento linear positivo, perfeito.
70
0 5 10 15 20 25 30 35
-10
0
10
20
30
40
50
60
70
80
y
x
70 , 0 r ~ Relacionamento linear positivo, moderado.
0 5 10 15 20 25 30 35 40
0
20
40
60
80
100
y
x
r = 0 Ausncia de relacionamento linear
0 5 10 15 20 25 30 35 40
-30
-20
-10
0
10
20
30
40
50
y
x
r = -1,00 Relacionamento linear negativo, perfeito
71
Exemplo 3: Determinando o coeficiente de correlao linear de Pearson para os dados apresentados
no Exemplo 1.
Reapresentando a tabela com o clculo de y
2
, necessrio neste caso, para o clculo de r:
Carregamento
amostrado
Distncia
(km)
x
Tempo de entrega
(dias)
y
x.y
x
2
y
2
1 825 3,5 2.887,5 680.625 12,25
2 215 1,0 215,0 46.225 1,0
3 1070 4,0 4.280,0 1.144.900 16,00
4 550 2,0 1.100,0 302.500 4,00
5 480 1,0 480,0 230.400 1,00
6 920 3,0 2.760,0 846.400 9,00
7 1350 4,5 6.075,0 1.822.500 20,25
8 325 1,5 487,5 105.625 2,25
9 670 3,0 2.010,0 448.900 9,00
10 1215 5,0 6.075,0 1.476.225 25,00
Total 7.620 28,5 26.370,0 7.104.300 99,75
Soluo: n = 10
= 0 , 26370 y . x 7620 x = 7104300
x
2
=
5 , 28 y =
75 , 99 y
2
=
( ) ] ) 5 , 28 ( 75 , 99 10 [ ] ) 7620 ( 7104300 10 [
5 , 28 7620 0 , 26370 10
] y y n ].[ ) x (
x
n [
) y )( x ( xy n
r
2 2 2 2 2
2
=
=
95 , 0 9489 , 0
67 , 49033
46530
r ~ = = ou % 95 r =
A equao da reta ajustada, como visto no Exemplo 2, 12 , 0 x . 0036 , 0 y + = , com coeficiente de
correlao igual a 95%, o que representa uma excelente relao linear entre as variveis x e y.
Lembrete: HP-12C (Regresso Linear):
y enter x E+
g y ,r y ajustado x
>
<
y r (coeficiente de correlao linear)
RCL 1 n RCL 4 E y
RCL 2 E x RCL 5 E y
2
RCL 3 E x
2
RCL 6 E x.y
72
LISTA 4 Exerccios para fixao
1. Na tabela abaixo esto indicados o valor y do aluguel (em mil reais) e a idade x (em anos, desde a
construo) de cinco casas.
Tempo aps construo (anos) x 5 7 10 13 20
Valor do aluguel (mil reais) y 6 5 4 3 2
a) Para esse conjunto de dados, faa o diagrama de disperso.
b) Se uma reta parecer apropriada, determine os coeficientes a e b da reta pelo mtodo dos mnimos
quadrados e escreva a equao da reta.
c) Represente graficamente a reta obtida no diagrama de disperso.
d) Calcule o coeficiente de correlao e interprete seu significado.
e) Qual ser o valor do aluguel para uma casa com 16 anos de idade?
f) Qual ser a idade de uma casa cujo aluguel 4,52 mil reais?
2. Na tabela abaixo so apresentados os custos de manuteno por hora classificados pela idade da
mquina em meses.
Idade x (meses) 6 15 24 33 42
Custos y ($) 9,70 16,50 19,30 19,20 26,90
a) Determinar a reta de regresso;
b) Calcular o coeficiente de correlao e interpretar seu significado;
c) Fazer uma previso de custo para uma mquina de 20 meses.
3. Numa amostra de cinco operrios de uma dada empresa, foram observadas duas variveis: X: anos
de experincia em um dado cargo e Y: tempo gasto na execuo de certa tarefa relacionada com esse
cargo. Discuta a correlao dessas variveis se:
a) O coeficiente de correlao linear determinado foi de 0,9865.
b) O coeficiente de correlao linear determinado foi de 0,5734.
4. Na tabela abaixo est representado o valor total de vendas (em milhes de reais) de uma companhia
por 10 meses consecutivos.
x 1 2 3 4 5 6 7 8 9 10
y 5,0 6,7 6,0 8,7 6,2 8,6 11,0 11,9 10,6 10,8
a) Faa o diagrama de disperso. Se uma reta parecer apropriada, determine a equao da reta pelo
mtodo dos mnimos quadrados e plote-a no diagrama de disperso.
b) Qual a previso de vendas dessa companhia para o 11
o
ms?
5. O diretor de vendas de uma rede de varejo com vendas a nvel nacional, est querendo analisar a
relao que existe entre o investimento em propaganda e o valor das vendas da empresa. O objetivo
ter uma equao matemtica que permita realizar projees e estimativas de vendas entre a varivel
dependente vendas e a varivel independente investimento em propaganda. O departamento de vendas
da rede relacionou os dados levantados na tabela abaixo:
Investimento anual (milhes de reais) 32 21 37 12 17 24
Vendas anuais (milhes de reais) 430 330 470 190 270 480
a) Construa o diagrama de disperso;
b) Determine a equao da reta;
c) Determine o coeficiente de correlao e interprete o seu significado.
d) Faa uma projeo dos valores de vendas para investimento de 600 milhes de reais.
73
6. Na tabela abaixo apresentada a produo de ao de uma indstria no perodo de 2000 a 2004:
Ano (x) 2000 2001 2002 2003 2004
Produo de Ao (y) (toneladas) 17,5 19,0 23,3 28,7 35,0
a) Ajustar uma reta aos dados (ateno: modificar a varivel x para x = 0, 1, 2,...).
b) Calcular o coeficiente de correlao.
c) Estimar a produo de ao para 2005.
7. Os dados abaixo correspondem s variveis renda familiar (em salrios mnimos) e gasto com
alimentao (em salrios mnimos) em amostra de 10 famlias.
Renda familiar
(salrios mnimos)
Gasto com alimentao
(salrios mnimos)
3 1,5
5 2,0
10 6,0
20 10,0
30 15,0
50 20,0
70 25,0
100 40,0
150 60,0
200 80,0
a) Construa o diagrama de disperso. O que ele sugere?
b) Calcule o coeficiente de correlao e interprete seu significado.
c) Ajuste a reta de regresso e interprete o significado dos coeficientes.
d) Qual a previso do gasto com alimentao para uma famlia com renda de 17 salrios mnimos?
e) Qual a previso do gasto com alimentao para uma famlia com excepcional renda, como por
exemplo, 1.000 salrios mnimos? Voc acha este valor razovel? Por qu?
8. Um jornal quer verificar a eficcia de seus anncios na venda de carros usados. Na tabela abaixo
esto apresentados o nmero de anncios publicados e o correspondente nmero de carros vendidos
por 6 companhias, que usaram apenas este jornal como veculo de propaganda.
Companhia A B C D E F
Anncios 74 45 48 36 27 16
Vendas 139 108 98 76 62 57
a) Construa o diagrama de disperso. O que ele sugere?
b) Calcule o coeficiente de correlao e interprete seu significado.
c) Ajuste a reta de regresso e interprete o significado dos coeficientes.
d) Com base nos resultados anteriores, como voc argumentaria com a Companhia F para que ela
aumentasse o nmero de anncios, aumentando, portanto, suas vendas?
9. Na tabela seguinte esto indicadas as porcentagens de mulheres que trabalham em cada companhia
e as porcentagens de cargos de gerncia ocupados por mulheres nessas companhias.
Companhia Porcentagem
de mulheres
Porcentagem de
mulheres gerentes
Federated Department Stores 72 61
Kroger 47 16
Marriot 51 32
McDonald's 57 46
Sears 55 36
74
a) Construa o diagrama de disperso.
b) Calcule o coeficiente de correlao e interprete seu significado.
c) Ajuste uma reta aos dados pelo mtodo dos mnimos quadrados e trace a reta no diagrama de
disperso.
d) Faa uma previso da porcentagem de cargos de gerncia ocupados por mulheres em uma
companhia que tem 60% de funcionrios do sexo feminino.
e) Faa uma previso da porcentagem de cargos de gerncia ocupados por mulheres em uma
companhia onde 55% so mulheres. Como esse valor previsto se compara aos 36% da Sears, uma
companhia onde 55% dos funcionrios so mulheres?
10. Os dados abaixo se referem s variveis gastos com publicidade (em mil reais) e faturamento (em
mil reais) para o Kuriuwa Hotel na cidade de Monte Verde, MG.
Gastos com publicidade
(mil reais)
Faturamento
(mil reais)
1 20
2 32
4 40
6 44
10 52
14 54
a) Ajuste uma reta aos dados pelo mtodo dos mnimos quadrados.
b) Qual a previso de faturamento do hotel se forem gastos R$ 8 mil em publicidade?
c) Qual a previso de gastos com publicidade no caso de se pretender um faturamento de R$ 50 mil?
d) Calcule o coeficiente de correlao e interprete seu significado.
11. A tabela abaixo indica a quantidade de bolas de futebol de salo produzidas mensalmente e os
respectivos custos totais de produo.
Quantidade produzida 10 11 12 13 14 15
Custo Total (R$) 100 112 119 130 139 142
a) Construir o diagrama de disperso;
b) Analisando o grfico obtido, possvel afirmar que o sistema se comporta de forma
aproximadamente linear?
c) Os pontos apresentam um comportamento crescente ou decrescente?
d) Determine a equao da reta que melhor se ajusta a esses dados, utilizando Anlise de Regresso;
e) Determine o valor mais provvel dos custos fixos;
f) Determine o custo estimado para a produo de 16 bolas.
12. Na tabela a seguir esto indicadas as quantidades produzidas mensalmente de televisores da
marca SHAWN e os respectivos custos totais de produo.
Quantidade produzida 1 2 3 4 5 6 7 8 9 10
Custo Total (R$) 100 120 130 140 150 160 170 180 190 200
Pede-se estabelecer pela Anlise de Regresso:
a) A reta que melhor se ajusta a esses dados;
b) O valor mais provvel dos custos fixos;
c) O valor do custo estimado para a produo de 12 televisores.
75
13. Uma pesquisa sobre a demanda de mercado de um produto X levou seguinte escala de demanda:
Preo p (R$/unidade) 20 30 40 50 60
Quantidade demandada q (unidades) 3.550 2.600 1.800 1.000 500
a) representar graficamente os dados apresentados;
b) identificar o modelo linear (ou seja, determinar a equao da reta) que melhor se ajusta escala de
demanda do produto X.
c) representar graficamente a reta de regresso no mesmo sistema de coordenadas do item a.
14. Uma pesquisa sobre a oferta de mercado de um produto Y levou seguinte escala de demanda:
Preo p (R$/unidade) 47 65 80 100 120
Quantidade ofertada q (unidades) 34 75 120 130 170
a) Representar graficamente os dados apresentados;
b) identificar o modelo linear (ou seja, determinar a equao da reta) que melhor se ajusta escala de
oferta do produto Y.
c) representar graficamente a reta de regresso no mesmo sistema de coordenadas do item a.
15. O coeficiente de correlao, como medida da relao entre sries de nmeros que representam
qualquer tipo de dados, pode ser utilizada tambm para medir a diversificao de uma carteira de
ativos. O risco de uma carteira de ativos pode ser reduzido pela combinao de ativos negativamente
correlacionados ou de baixa correlao positiva. Considere uma carteira AB, composta de 50% de
ativos A e 50% de ativos B. Um levantamento das taxas de retorno desses ativos nos ltimos quatro
meses apresentado na tabela abaixo:
Ativo Taxa de Retorno (%)
Janeiro Fevereiro Maro Abril
A 2,4% 3,7% 1,8% 2,0%
B 1,5% 1,1% 2,1% 1,9%
Determine o coeficiente de correlao linear. O que pode ser comentado a respeito do risco dessa
carteira de ativos?
16. Considere a carteira XY, composta de 50% dos ativos X e 50% dos ativos Y. Um levantamento das
taxas de retorno desses ativos nos ltimos quatro meses apresentado na tabela abaixo:
Ativo Taxa de Retorno (%)
Janeiro Fevereiro Maro Abril
X 6,4% 4,7% 3,8% 5,5%
Y 4,6% 3,1% 2,8% 3,6%
Com base no coeficiente de correlao linear, faa um comentrio a respeito do risco dessa carteira de
ativos.
17. Se o coeficiente de correlao entre duas variveis igual a -0,95, ento podemos afirmar que a
intensidade da correlao entre essas duas variveis apresenta:
A) correlao perfeita negativa;
B) forte correlao negativa;
C) fraca correlao negativa;
D) correlao nula;
E) fraca correlao positiva.
76
18. Propaganda versus Vendas: Existe relao?
Um administrador na rea de marketing conduz um estudo para determinar se existe uma relao linear
entre o dinheiro gasto em propaganda e as vendas de uma empresa. Os dados esto dispostos na
tabela a seguir:
Gastos com propaganda
(milhares de dlares) (x)
Vendas da empresa
(milhares de dlares) (y)
2,4 225
1,6 184
2,0 220
2,6 240
1,4 180
1,6 184
2,0 186
2,2 215
Ao representar graficamente os dados em um grfico de disperso, obtm-se:
A partir destes dados, afirmou-se:
I. Verificamos, com base no mapa de disperso, que parece existir uma correlao linear positiva entre
as variveis, pois lendo da esquerda para a direita, medida que os gastos em propaganda crescem,
as vendas tendem a aumentar.
II. A correlao positiva indica que medida que aumenta a quantia gasta em propaganda, crescem
tambm as vendas da companhia.
III. No existe correlao entre as variveis propaganda e vendas.
Podemos dizer que:
A) Todas as afirmaes so verdadeiras.
B) Somente I falsa.
C) Somente II falsa.
D) Somente III falsa.
E) As afirmaes I e III so falsas.