Você está na página 1de 29

Estatstica & Probabilidade 1

Aula 03: Resumo de dados e Medidas de posio.


Problema 01. A seguir temos uma lista de possibilidades para classificar variveis, em funo da
escala adotada. (Observe a similaridade com a apresentada na aula anterior)

(a) Razo
( ) Salrios dos empregados de uma indstria.

(b) Ordinal ( ) QI de um individuo.

( ) Nmero de respostas certas de alunos num teste com


(c) Razo dez items.

( ) Opinio de consumidores sobre um determinado


(d) intervalar produto.

( ) Porcentagem da receita de municpios aplicada em


(e) razo educao.

( ) Temperatura diria da cidade de Joo Monlevade.


(f) nominal
( ) Opinio dos empregados da companhia MB sobre a
realizao ou no de cursos obrigatrios de
(g) intervalar treinamento.

Problema 02. Informaes sobre estado civil, grau de instruo, nmero de filhos, salario (expresso
como frao do salario mnimo), idade (medida em anos e meses) e procedncia de 36 empregados
da seo de oramento da companhia MB so apresentadas na seguinte tabela:

N Estado Grau de N de Salrio Idade Regio de

Civil Instruo filhos (x sal. Min.) anos meses procedncia

1 Solteiro Ensino fundamental - 4,00 26 03 Capital

2 Casado Ensino mdio 1 4,56 32 10 Interior

3 Casado Ensino fundamental 2 5,25 36 05 Outra

4 Solteiro Superior - 5,73 20 10 Outra

Dr. Francis Crdova


Estatstica & Probabilidade 2

5 Solteiro Ensino mdio - 6,26 40 07 Outra

6 Casado Ensino fundamental 0 6,66 28 00 Interior

7 Solteiro Ensino fundamental - 6,86 41 00 Capital

8 Solteiro Ensino mdio - 7,39 43 04 Capital

9 Casado Ensino mdio 1 7,59 34 10 Interior

10 Solteiro Superior - 7,44 23 06 Capital

11 Casado Ensino mdio 2 8,12 33 06 Interior

12 Solteiro Ensino mdio - 8,46 27 11 Outra

13 Solteiro Superior - 8,74 37 05 Outra

14 Casado Superior 3 8,95 44 02 Interior

15 Casado Ensino mdio 0 9,13 30 05 Capital

16 Solteiro Ensino mdio - 9,35 38 08 Capital

17 Casado Ensino fundamental 1 9,77 31 07 Interior

18 Casado Ensino mdio 2 9,80 39 07 Interior

19 Solteiro Ensino mdio - 10,53 25 08 Outra

20 Solteiro Superior - 10,76 37 04 Outra

21 Casado Ensino fundamental 1 11,06 30 09 Outra

22 Solteiro Ensino fundamental - 11,59 34 02 Interior

23 Solteiro Ensino fundamental - 12,00 41 00 Interior

24 Casado Superior 0 12,79 26 01 Interior

25 Casado Ensino mdio 2 13,23 32 05 Outra

26 Casado Ensino mdio 2 13,60 35 00 Capital

27 Solteiro Ensino mdio - 13,85 46 07 Capital

28 Casado Ensino fundamental 0 14,69 29 08 Outra

29 Casado Ensino mdio 5 14,71 40 06 Outra

Dr. Francis Crdova


Estatstica & Probabilidade 3

30 Casado Ensino mdio 2 15,99 35 10 Interior

31 Solteiro Ensino mdio - 16,22 31 05 Outra

32 Casado Ensino fundamental 1 16,61 36 04 Outra

33 Casado Ensino fundamental 3 17,26 43 07 Capital

34 Solteiro Ensino mdio - 18,75 33 07 Capital

35 Casado Ensino fundamental 2 19,40 48 11 Interior

36 Casado Ensino mdio 3 23,30 42 02 Capital

Usando os dados, construa a distribuio de frequncias das variveis: (n=36)

(a)
Estado Freqncia Proporo Porcentagem
Civil fi hi= fi/n 100xhi
Casado 20 0,5556 55,56%
Solteiro 16 0,4444 44,44
Total 36 1,0000 100,00
(b)
Freqncia Proporo Porcentagem
Regio de Procedncia
fi hi 100 hi
Capital 11 0,3056 30,56
Interior 12 0,3333 33,33
Outra 13 0,3611 36,11
Total 36 1,0000 100,00
(c)
Nmero de filhos dos Freqncia Proporo Porcentagem
empregados casados fi hi 100 hi
0 4 0,20 20,00
1 5 0,25 25,00
2 7 0,35 35,00
3 3 0,15 15,00
5 1 0,05 5,00
Total 20 1,00 100,00

Dr. Francis Crdova


Estatstica & Probabilidade 4

(d)
Freqncia Proporo Porcentagem
Idade
fi hi 100 hi
20 | 25 2 0,0556 5,56
25 | 30 6 0,1667 16,67
30 | 35 10 0,2778 27,78
35 | 40 8 0,2222 22,22
40 | 45 8 0,2222 22,22
45 | 50 2 0,0556 5,56
Total 36 1,0001 100,01

Dr. Francis Crdova


Estatstica & Probabilidade 5

Dr. Francis Crdova


Estatstica & Probabilidade 6

Problema 03. Complete os espaos em branco com o valor correspondente:

Populao urbana. ( n = 27 )

Freqncia Proporo Porcentagem


Nmero de habitantes
fi hi 100 hi
Menos de 500.000 3 0,1111 11,11
500.001 a 1.000.000 2 0,0740 7,40
1.000.001 a 5.000.000 15 0,5556 55,56
5.000.001 a 10.000.000 4 0,1481 14,81
Mais de 10.000.000 3 0,1111 11,11
Total 27 1,0000 100,00

Densidade populacional.

Freqncia Proporo Porcentagem


Densidade (hab/km2)
fi hi 100 hi
Menos de 10 9 0,3333 33,33
10 | 30 5 0,1852 18,52
30 | 50 4 0,1481 14,81
50 | 100 6 0,2222 22,22
Mais de 100 3 0,1111 11,11
Total 27 1,0000 100,00

Medidas de posio

Dr. Francis Crdova


Estatstica & Probabilidade 7

Problema 04. Contou-se o nmero de erros de impresso da primeira pgina do jornal de


Joo Monlevade durante 50 dias, obtendo-se o seguinte grfico de barras:
Freqncia absoluta (ni)

10

0
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
Nme ro de e rros de impre sso

a) Estabelecer as frequencias correspondentes a cada caso, numa tabela ordenada com fi , hi


e 100xhi.
b) Graficar o histograma correspondente.
Dr. Francis Crdova
Estatstica & Probabilidade 8

xi fi hi xi*fi Fi Hi
5 3 0.06 15 3
6 3 0.06 18 6
7 5 0.1 35 11
8 7 0.14 56 18
9 2 0.04 18 20
10 5 0.1 50 25
11 4 0.08 44 29
12 9 0.18 108 38
13 1 0.02 13 39
14 7 0.14 98 46
15 1 0.02 15 47
16 1 0.02 16 48
19 1 0.02 19 49
22 1 0.02 22 50
TOTAL 50

MEDIA =
MEDIANA =
MODA =
Freqncia absoluta (ni)

10

0
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
Nme ro de e rros de impre sso

Dr. Francis Crdova


Estatstica & Probabilidade 9

Exemplo

Problema 05. Informaes sobre idade e grau de instruo de 36 empregados da seo de oramento
da companhia MB so apresentadas como:

0,06
27,77% Superior
Densidade de freqncia

0,05
16,5%
1 grau
22,22% 22,22%
32,5%
0,04
16,67%
0,03

0,02
2 grau
5,56% 5,56%
0,01 51,0%

0,00

0 20 25 30 35 40 45 50
Idade

(a) Histograma (b) Grfico de composio em setores (pizza)

a) Calcular a mdia, moda e mediana da varivel Y: idade.

b) Calcular a Moda da varivel X : grau de instruo. Qual a frequncia absoluta de x = 2 grau?.


Dr. Francis Crdova
Estatstica & Probabilidade 10

Dr. Francis Crdova


Estatstica & Probabilidade 11

Dr. Francis Crdova


Estatstica & Probabilidade 12

Problema 06.

a) Calcular a mdia e mediana da seguinte distribuio

Dr. Francis Crdova


Estatstica & Probabilidade 13

b) As taxas mdias geomtricas de incremento anual (por 100 habitantes) dos 30 maiores
municpios do Brasil, esto dadas abaixo.

3,67 1,82 3,73 4,10 4,30 1,28 8,14 2,43 4,17 5,36 3,96 6,54 5,84 7,35 3,63 2,93 2,82 8,45

5,28 5,41 7.77 4,65 1,88 2,12 4,26 2,78 5,54 0,90 5,09 4,07

0,2 40,00%

Densidade de freqncia
30,00%

0,1

13,33%
10,00%
6,67%

0,0

1 3 5 7 9
Taxa mdia geomtrica de incremento anual
(por 100 habitantes)

Histograma

a) Elaborar a tabela de frequncias absoluta, relativa 100% e acumulada da varivel continua


X:Taxa mdia geomtrica de incremento anual dos 30 maiores municpios do Brasil.
b) Calcular a mdia de X.
c) Calcular a moda de X.
d) Elaborar o grfico de composio em setores (pizza)

Problema 07. Voc foi convidado para chefiar a seo de oramento ou a seo tcnica da
companhia MB. Aps analisar o tipo de servio que cada seo executa, voc ficou indeciso e
resolveu tomar a deciso baseado em dados fornecidos para as duas sees. |O departamento de
pessoal forneceu os dados da tabela Problema 02 para os funcionrios da seo de oramentos, ao
passo que para a seo tcnica os dados vieram agrupados segundo as tabelas abaixo, que
apresentam as frequncias dos 50 empregados dessa seo, segundo as variveis grau de instruo e
salrio. Baseado nesses dados, qual seria a sua deciso? Justifique.

Frequncia Proporo Porcentagem


Instruo
fi hi= fi/n 100 hi
Fundamental 15
Mdio 30
Superior 5
Total 50 1,000 100,00

Dr. Francis Crdova


Estatstica & Probabilidade 14

Classe de Ponto Frequncia Proporo Porcentagem


mdio fi hi 100 hi
salrios
7,50 | 10,50 14
10,50 | 13,50 17
13,50 | 16,50 11
16,50 | 19,50 8
Total 50 1,0000 100,00

Dica: Para decidir qual seo irei chefiar, primeiramente farei um grfico de barras (utilizando a frequncia
relativa ao invs da frequncia absoluta, devido ao diferente nmero de observaes em cada seo) para cada
seo para comparar o grau de instruo dos funcionrios. Em seguida, farei um histograma para cada seo
(utilizando os mesmos intervalos para ambas as sees, facilitando assim a comparao) comparando assim o
salrio dos funcionrios.
Freqncia relativa (fi)

0.6
0.5
0.4
0.3
0.2
0.1
0
1o.grau 2o.grau superior
Grau de instruo

Grfico de barras para a Seo de Oramentos


Freqncia relativa (fi)

0.6
0.5
0.4
0.3
0.2
0.1
0
1o.grau 2o.grau superior
Grau de instruo

Grfico de barras para a Seo Tcnica

Dr. Francis Crdova


Estatstica & Probabilidade 15

0,09 0,15
33,33% 56,0%
Densidade de freqncia

Densidade de freqncia
0,08

0,07 27,78%

0,06 22,22% 0,10

0,05
28,0%
0,04
13,89%
0,03 0,05
16,0%
0,02

0,01 2,78%

0,00 0,00

0 4 8 12 16 20 24 0 4 8 12 16 20 24
Salrio Salrio

Histograma para a Seo de Oramentos Histograma para a Seo Tcnica

Atravs dos grficos de barras, pode-se notar que ambas as sees tm propores semelhantes de
funcionrios com grau de instruo de 1o grau ou superior e que, a seo tcnica apresenta uma
proporo levemente maior de funcionrios com grau de instruo de 2o grau. Considerando os
salrios, pode-se notar que a seo de oramentos apresenta salrios mais distribudos, desde
salrios mais baixos at bem altos.

Ento, voc ser chefe de qual departamento?

Dr. Francis Crdova


Estatstica & Probabilidade 16

Aula 4: Medidas de disperso e Grfico box plots

Dr. Francis Crdova


Estatstica & Probabilidade 17

Notaes:

dm(X) = desvio mdio absoluto


var(X) = varincia
dp(X) = var(X) = desvio padro

Observao: As formulas acima so utilizadas para um conjunto de dados xi , sem considerar


repeties, isto , sem considerar as frequncias absolutas fi ou frequncias relativas hi

Problema 01. Reescrever as frmulas acima considerando as repeties, isto , em funo das
frequncias.

Problema 02. Quer se estudar o nmero de erros de impresso de um livro. Para isso escolheu-se
uma amostra de 50 pginas, encontrando-se o nmero de erros por pgina da tabela abaixo.

Erros Freqncia Fi
xi fi xi * fi (xi - x )2 fi*(xi - x )2
0 25 25 0 0,4356 10,8900
1 20 45 20 0,1156 2,3120
2 3 48 6 1,7956 5,3868
3 1 49 3 5,4756 5,4756
4 1 50 4 11,1556 11,1556
Total 50 33 18,5424 35,2200

(a) Qual o nmero mdio de erros por pgina?

Sendo x o nmero mdio de erros por pgina, tem-se:


0 25 1 20 2 3 3 1 4 1 33
x 0,66
50 50

(b) E o nmero mediano?

Representando o nmero mediano de erros por md, tem-se, pela ordenao dos valores
observados, que os valores de ordem 25 e 26 so 0 e 1, respectivamente. Assim
0 1
md 0,5
2

Dr. Francis Crdova


Estatstica & Probabilidade 18

(c) Qual o desvio padro?


25 0 0,66 20 1 0,66 3 2 0,66 1 3 0,66 1 4 0,66
2 2 2 2 2
var(X )
50
25 0,4356 20 0,1156 3 1,7956 1 5,4756 1 11,1556 35,22
0,7044
50 50
Logo,
dp( X ) 0,7044 0,8393

(d) Faa uma representao grfica para a distribuio

30
Freqncia absoluta (ni)

25
20
15
10
5
0
0 1 2 3 4
Nmero de erros de impresso

Grfico de barras do nmero de erros por pgina

(e) Se o livro tem 500 pginas, qual o nmero total de erros esperado no livro?

Uma vez que a mdia de erros por pgina 0,66 e o livro tem 500 pginas, o nmero
esperado de erros no livro 0,66 500 330

Problema 03. As taxas de juros recebidas por 10 aes durante um certo perodo foram (medidas
em porcentagem) 2,59; 2,64; 2,60; 2,62; 2,57; 2,55; 2,61; 2,50; 2,63; 2,64. Calcule a mdia, a
mediana e o desvio padro.

Mdia:
2,59 2,64 2,60 2,62 2,57 2,55 2,61 2,50 2,63 2,64
x 2,595
10
Mediana:
2,600 2,610
md 2,605
2
Dr. Francis Crdova
Estatstica & Probabilidade 19

Desvio Padro:

var(X )
0,0052 0,0452 0,0052 0,0252 0,0252 0,0452 0,0452
10


0,015 0,095 0,0018 dp( X ) 0,0018 0,0424
2 2

10

Problema 04. Para facilitar um projeto de ampliao da rede de esgoto de uma certa regio de Joo
Monlevade, as autoridades tomaram uma amostra de tamanho 50 dos 270 quarteires que compem
a regio, e foram encontrados os seguintes nmeros de casas por quarteiro:

2 2 3 10 13 14 15 15 16 16

18 18 20 21 22 22 23 24 25 25

26 27 29 29 30 32 36 42 44 45

45 46 48 52 58 59 61 61 61 65

66 66 68 75 78 80 89 90 92 97

(a) Use cinco intervalos e complete a seguinte tabela


Vmin = 2 Vmax = 9 Vmax Vmin = 95 Amplitude de cada intervalo: 95/5
= 19

Classes n Ponto Frequncia Fi Proporo


mdio fi hi
casas
0|20 10 12 12 0,24
20|40 30 15 27 0,30
40|60 50 9 36 0,18
60|80 60 9 45 0,18
80|100 70 5 50 0,10
Total 50 1,00

0.015
Densidade

0.010

0.005

0.000

0 20 40 60 80 100
Nmero de casas por quarteirao

Dr. Francis Crdova


Estatstica & Probabilidade 20

(b) Determine uma medida de tendncia central e uma medida de disperso.

Freqncia
xi fi Fi xi * fi fi*(xi - x)2
2 2 2 4 2952.1928

3 1 3 3 1400.2564

10 1 4 10 925.3764

13 1 5 13 751.8564

14 1 6 14 698.0164

15 2 8 30 1292.3528

16 2 10 32 1192.6728

18 2 12 36 1005.3128

20 1 13 20 416.9764

21 1 14 21 377.1364

22 2 16 44 678.5928

23 1 17 23 303.4564

24 1 18 24 269.6164

25 2 20 50 475.5528

26 1 21 26 207.9364

27 1 22 27 180.0964

29 2 24 58 260.8328

30 1 25 30 108.5764

32 1 26 32 70.8964

36 1 27 36 19.5364

Dr. Francis Crdova


Estatstica & Probabilidade 21

42 1 28 42 2.4964

44 1 29 44 12.8164

45 2 31 90 41.9528

46 1 32 46 31.1364

48 1 33 48 57.4564

52 1 34 52 134.0964

58 1 35 58 309.0564

59 1 36 59 345.2164

61 3 39 183 1270.6092

65 1 40 65 604.1764

66 2 42 132 1308.6728

68 1 43 68 760.6564

75 1 44 75 1195.7764

78 1 45 78 1412.2564

80 1 46 80 1566.5764

89 1 47 89 2360.0164

90 1 48 90 2458.1764

92 1 49 92 2660.4964

97 1 50 97 3201.2964

Total 50 2021 33320.18

Respostas; Mdia: 40,42; desvio-padro: 25,81.

Dr. Francis Crdova


Estatstica & Probabilidade 22

(c) D uma situao prtica onde voc acha que a mediana uma medida mais
apropriada do que a mdia.
A mediana uma medida de posio mais importante do que a mdia, por exemplo, em
situaes em que a varivel em estudo tem algum valor muito discrepante que puxa a
mdia para cima ou para baixo. (Desenhe uma tabela onde isso acontece!)

(d) Esboce um histograma onde a mdia e a mediana coincide. Existe alguma classe de
histogramas onde isso sempre acontece?
Em distribuies simtricas, a mdia e a mediana coincidem. Por exemplo:

0.2
Densidade

0.1

0.0

4 6 8 10 12 14 16

Histograma

(e) Esboce os histogramas de trs variveis (X, Y, Z) com a mesma mdia aritmtica, mas
com as varincias ordenadas em ordem crescente.
Por exemplo, consideremos os seguintes grficos:

0.10
Densidade

X 0.05

0.00

-10 0 10 20 30

Mdia =10,0 e Varincia = 4

Dr. Francis Crdova


Estatstica & Probabilidade 23

0.08

0.07

0.06

Densidade
0.05
Y 0.04

0.03

0.02

0.01

0.00

-10 0 10 20 30

Mdia =10,0 e Varincia = 16

0.06

0.05
Densidade

0.04
Z
0.03

0.02

0.01

0.00

-10 0 10 20 30

Mdia =10,0 e Varincia = 36

Para garantir que voc esta ligado com a ideia, faa as tabelas de frequncias absoluta e relativa das
variveis X, Y, Z.

Problema 05. Suponha que a varivel de interesse tenha a distribuio como a figura abaixo,

Voc acha que a mdia uma boa medida de posio? E a mediana?. Justifique.

Dr. Francis Crdova


Estatstica & Probabilidade 24

Nessa situao, tanto a mdia quanto a mediana (que coincidem) no se apresentam como boas
medidas de posio. Elas no retratam bem a distribuio da varivel estudada. Nessas condies,
seria melhor considerar a moda, ou modas, pois nesse caso a distribuio bi-modal.

Problema 06. Numa pesquisa realizada com 100 famlias, levantaram-se as seguintes informaes:

Numero de 0 1 2 3 4 5 Mais que 5


filhos

Frequncia 17 20 28 19 7 4 5
de famlias
(a) Qual a mediana do nmero de filhos?.......
(b) A moda do nmero de filhos ........
(c) Que problemas voc enfrentaria para calcular a mdia? Faa alguma suposio e
encontre-a.

O clculo da mdia fica prejudicado pelo fato de haver uma categoria representada por
mais que 5 filhos, sem a especificao do valor exato. Neste caso, deve-se usar o
conhecimento emprico que se tem da varivel para propor um valor mximo para o
intervalo, ou o ponto mdio da classe.

Quantis
Tanto a mdia como o desvio padro podem no ser medidas adequadas para representar um
conjunto de dados, pois: (a) so afetados, de forma exagerada, por valores extremos. (b) apenas com
estes dois valores no temos ideia da simetria ou assimetria da distribuio dos dados.
Para contornar esses fatos, outras medidas tm de ser consideradas.
Vimos que a mediana um valor que deixa metade dos dados abaixo e metade dos dados acima. De
modo geral, podemos definir uma medida, chamada quantil de ordem p ou p-quantil, indicada por
p(q), onde p uma proporo qualquer 0 < p < 1, tal que 100p% das observaes sejam menores do
que q(p).
Indicamos, abaixo, alguns quantis e seus nomes particulares.
q(0,25): 1 quartil = 25 percentil = q1
q(0,50): Mediana = 5 Decil = 50 percentil = q2
q(0,75): 3 quartil = 75 percentil = q3

Dr. Francis Crdova


Estatstica & Probabilidade 25

q(0,40): 4 Decil
q(0,95): 95 percentil
Dependendo do valor de p, h dificuldades ao se calcular os quantis. Isso ilustrado no problema a
seguir:
Uma medida de disperso alternativa ao desvio padro a distancia ou intervalo interquartil,
definida como a diferena entre o terceiro e o primeiro quartis, ou seja:
dq = q(0,75) - q(0,25) = q3 q1

Problema 07. Suponha que tenhamos os seguintes valores de uma varivel X:

15, 5, 3, 8, 10, 2, 7, 11, 12.

Ordenando os valores temos n= 9 e

x1 = 2, 3, 5, 7, 8, 10, 11, 12, xn = 15.

(a) Elaborar a funo de distribuio acumulada F(x)

(b) Calcular: q(0,50), q(0,20), q(0,10) e q(0,75).

Soluo:

Use a definio do p-quantil;

,
= = , = , ,
( )( ) + (+ )
() = () < < +
() <
{ >

Onde =
+

Definio. Os cinco valores x1 , q1 , q2 , q3 e xn so importantes para se ter uma boa ideia da


assimetria da distribuio dos dados. Para uma distribuio simtrica ou aproximadamente
simtrica, deveramos ter:

(a) Disperso inferior = q2 x1 xn q2 = Disperso superior

(b) q2 q1 q3 q2

(c) q1 x1 xn q3

(d) Distancias entre mediana e q1 , q3 menores do que distancias entre os extremos e q1 , q3 .

Dr. Francis Crdova


Estatstica & Probabilidade 26

Distribuio simtrica: Normal ou gaussiana

50 %

x1 q1 q2 q3 xn

As cinco estatsticas de ordem consideradas acima podem ser representadas esquematicamente como

n
q2
q1 q3
x1 xn

Problema 07. Baseado nas seguintes medidas verifique se a forma da distribuio dos dados
normal.

37
35
31 40
21 49

Intervalo interquartil:
Disperso inferior (di):
Disperso superior (ds):
Os valores acima obtidos indicam que a distribuio dos dados tem forma ..................................

Problema 08. Obtenha o esquema dos cinco nmeros para os dados do problema 4. Calcule o
intervalo interquartil e as disperses inferior e superior. Baseado nessas medidas verifique se a
forma da distribuio dos dados normal.

50
z
31
z
20 61
z z
2 97
z z
Dr. Francis Crdova
Estatstica & Probabilidade 27

Intervalo interquartil: q3 q1 61 20 41
Disperso inferior (di): q2 x(1) 31 2 29
Disperso superior (ds): x( n) q2 97 31 66
Para que a distribuio dos dados tenha forma normal (simtrica, em geral), necessrio:

di ds
q2 q1 q3 q2
q2 q1 e q3 q2 di e ds
Os valores acima obtidos indicam que a distribuio dos dados no tem forma normal.
Os valores acima obtidos indicam que a distribuio dos dados tem forma ..................................

Problema 09. Obter os trs quartis, q(0,10) e q(0,90) para os dados do problema 4.

q(0,10)
13 14 13,5 , q(0,25) 19,5 , q(0,50) 31,0 , q(0,75) 61,0 ,
2

q (0,90)
78 80 79,0
2

Desenho esquemtico (Box plots)

Considere a informao contida no esquema dos cinco nmeros:

n
q2
q1 q3
x1 xn

esta informao pode ser traduzida graficamente num diagrama, ilustrado na seguinte figura:

Dr. Francis Crdova


Estatstica & Probabilidade 28

3dq/2

q1
dq

q2

q3

3dq/2

Para construir este diagrama, consideremos um retngulo onde esto representados a mediana e os quartis. a partir do
retngulo, para cima, segue uma linha at o ponto mais remoto que no exceda

LS = q3 + (1,5)dq

chamado limite superior. De modo similar, da parte inferior do retngulo, para baixo, segue uma linha at o ponto mais
remoto que no seja menor do que

LI = q1 - (1,5)dq

chamado limite inferior. Os valores compreendidos entre esses dois limites so chamados valores adjacentes. As
observaes que estiverem acima do limite superior ou abaixo do limite inferior estabelecido sero chamadas pontos
exteriores e representados por asteriscos. Essas so observaes destoantes das demais e podem ou no ser o que
chamamos de outliers ou atpicos.

Problema 10. Construa o Box plot para os dados do problema 02 da aula 3.


Freqncia Proporo Porcentagem
Classe salarios
fi hi 100 hi
4,00 | 8,00 10 27,78

8,00 |12,00 12

12,00 | 16,00 8 22,22

16,00 | 20,00 5

20,00 | 24,00 1 2,78

Total 36 1,00 100,00

Dr. Francis Crdova


Estatstica & Probabilidade 29

25

Salarios (S.M.)
15

Box-Plot dos Salrios dos funcionrios da Companhia MB

Pode-se perceber uma distribuio assimtrica direita.

Dr. Francis Crdova

Você também pode gostar