Você está na página 1de 149

Estatstica descritiva

Descrio do tema
2.1 Distribuio da frequncia e seus grficos
2.2 Mais grficos e representaes
2.3 Medidas de tendncia central

2.4 Medidas de variao


2.5 Medidas de posio

Distribuio de frequncia
e seus grficos

Objetivos da Seo
Construir distribuies de frequncia
Construir histogramas de frequncia, polgonos de
frequncia, histogramas de frequncia relativa e
ogivas

Distribuio de frequncia
Distribuio de
frequncia
Uma tabela que mostra
classes ou intervalos
de dados com uma
contagem do nmero
de entradas em cada
classe
A frequncia, f, de
uma classe o nmero
de entradas de dados na
classe

Classe Frequncia, f
Tamanho da
classe 6 1 = 5

15

6 10

11 15

16 20

21 25

26 30

Limite inferior da
classe

Limite superior
da classe

Construindo uma
distribuio de frequncia
1. Decida o nmero de classes.
Geralmente entre 5 e 20; do contrrio, pode ser
difcil detectar padres
2. Encontre o tamanho da classe.
Determine a variao dos dados
Divida a variao pelo nmero de classes
Arredonde para cima para o prximo nmero
conveniente

3. Encontre os limites da classe.


Voc pode usar a entrada de menor valor como o
limite inferior da primeira classe
Encontre os limites inferiores remanescentes
(adicione o tamanho da classe ao limite inferior
da classe precedente)
Encontre o limite superior da primeira classe.
Lembre-se de que as classes no podem ter
limites iguais
Encontre os limites superiores remanescentes

4. Faa um registro para cada entrada de dados na


fileira da classe apropriada.
5. Conte os registros para encontrar a frequncia total f
para cada classe.

Exemplo: construindo uma


distribuio de frequncia
A amostra seguinte lista o nmero de minutos que 50
usurios da internet passaram conectados durante a
sesso mais recente. Construa uma distribuio de
frequncia para as sete classes.
50 40 41 17 11 7 22 44 28 21 19 23 37 51 54 42 86
41 78 56 72 56 17 7 69 30 80 56 29 33 46 31 39 20
18 29 34 59 73 77 36 39 30 62 54 67 39 31 53 44

Soluo: construindo uma


distribuio de frequncia
50 40 41 17 11 7 22 44 28 21 19 23 37 51 54 42 86
41 78 56 72 56 17 7 69 30 80 56 29 33 46 31 39 20
18 29 34 59 73 77 36 39 30 62 54 67 39 31 53 44

1. Nmero de classes = 7 (dados)


2. Encontre o tamanho da classe
max min 86 7

11.29
#classes
7

Arredondando para
cima: 12

3. Use 7 (valor mnimo)


como o primeiro limite
mnimo. Adicione o
tamanho da classe, 12,
para definir o limite
mnimo da prxima
classe.
7 + 12 = 19
Encontre os limites
mnimos restantes.

Limite Limite
mnimo mximo
Tamanho da
classe = 12

7
19
31
43
55

67
79

O limite mximo da
primeira classe 18 (um a
menos que o limite mnimo
da segunda classe).
Some o tamanho da classe,
12, para definir o limite
mximo da prxima classe.
18 + 12 = 30
Encontre os limites
mximos restantes.

Limite
mnimo

Limite
mximo

7
19
31
43
55
67
79

18
30
42
54
66

78
90

Tamanho da
classe = 12

4. Faa um registro para cada entrada de dado na fileira


da classe apropriada.
5. Conte os registros para encontrar a frequncia total f
para cada classe.
Classe
7 18

Registro

Frequncia, f

IIII I

19 30

IIII IIII

10

31 42

IIII IIII III

13

43 54

IIII III

55 66

IIII

67 78

IIII I

79 90

II

2
f = 50

Determinando o ponto
mdio
Ponto mdio de uma classe
(Limite mnimo da classe) + (Limite mximo da classe)
2
Classe
7 18

Larson/Farber 4th ed.

Ponto mdio
7 18
12.5
2

19 30

19 30
24.5
2

31 42

31 42
36.5
2

Frequncia, f
6

Tamanho da classe = 12
10
13

14

Determinando a
frequncia relativa
Frequncia relativa de uma classe
Poro da porcentagem dos dados que se encaixa em
um classe em particular
Frequncia da classe

Frequncia relativa =

Tamanho da amostragem
Classe

Frequncia, f

7 18

19 30

10

31 42

13

Frequncia relativa
6
0.12
50
10
0.20
50
13
0.26
50

15

Frequncia acumulada de uma classe


A soma das frequncias daquela classe e de todas as
classes anteriores.

Larson/Farber 4th ed.

Classe

Frequncia, f

Frequncia acumulada

7 18

19 30

+ 10

16

31 42

+ 13

29

16

Distribuio de
frequncia expandida
Classe

Frequncia, f

Ponto
mdio

7 18

12.5

0.12

19 30

10

24.5

0.20

16

31 42

13

36.5

0.26

29

43 54

48.5

0.16

37

55 66

60.5

0.10

42

67 78

72.5

0.12

48

79 90

84.5

0.04
f
1
n

50

f = 50

Frequncia
relativa

Frequncia
acumulada

Grficos de distribuio
de frequncia

Frequncia

Histograma de frequncia
Um grfico de barras que representa a distribuio da
frequncia
O eixo horizontal quantitativo e mede os valores dos dados
O eixo vertical mede as frequncias das classes
Barras consecutivas precisam se tocar

Valores dos
dados

Fronteiras de classes
Os nmeros que separam as classes sem formar
espaos entre elas
A distncia do limite superior da
primeira classe para o limite
inferior da segunda 19 18 = 1
A metade dessa distncia 0,5
Fronteira inferior da primeira
classe = 7 0.5 = 6.5
Fronteira superior da
primeira classe = 18 + 0.5 =
18.5

Classe
7 18

Fronteiras Frequncia,
de classes
f
6.5 18.5

19 30

10

31 42

13

Classe
7 18
19 30
31 42
43 54

55 66
67 78
79 90

Fronteiras de Frequncia,
classes
f
6.5 18.5
6
18.5 30.5
10
30.5 42.5
13
42.5 54.5
8

54.5 66.5
66.5 78.5
78.5 90.5

5
6
2

Exemplo: histograma
de frequncia
Construa um histograma de frequncia para a
distribuio da frequncia do uso da internet.
Classe

Fronteiras de
classes

Ponto
mdio

Frequncia,
f

7 18

6.5 18.5

12.5

19 30

18.5 30.5

24.5

10

31 42

30.5 42.5

36.5

13

43 54

42.5 54.5

48.5

55 66

54.5 66.5

60.5

67 78

66.5 78.5

72.5

79 90

78.5 90.5

84.5

Soluo: histograma de
frequncia (usando pontos mdios)

Frequncia

Uso de Internet

Tempo on-line (em minutos)

Soluo: histograma de
frequncia (usando fronteiras de classes)

Frequncia

Uso de Internet

6.5

18.5

30.5

42.5

54.5

66.5

78.5

90.5

Tempo on-line (em minutos)

visvel que mais da metade dos assinantes passaram entre 19 e


54 minutos na Internet em sua sesso mais recente.

Grficos de distribuies
de frequncia

Frequncia

Polgono de frequncia
Um grfico em linha que enfatiza a mudana contnua
nas frequncias.

Valores dos
dados

Exemplo: polgono de
frequncia
Construa um polgono de frequncia para a distribuio
da frequncia do uso de Internet.
Classe

Ponto mdio

Frequncia, f

7 18

12.5

19 30

24.5

10

31 42

36.5

13

43 54

48.5

55 66

60.5

67 78

72.5

79 90

84.5

Soluo: polgono de
frequncia
Internet
Usage
Uso de Internet

Frequency
Frequncia

O grfico deve
comear e terminar no
eixo horizontal, ento
estenda o lado
esquerdo at o
tamanho de uma
classe antes do ponto
mdio da primeira
classe e estenda o lado
direito at o tamanho
de uma classe depois
do ponto mdio da
ltima classe.

14
12
10
8
6
4
2
0
0.5

12.5

24.5

36.5

48.5

60.5

72.5

84.5

96.5

Tempo conectado
minutos)
Time online(em
(in minutes)

Pode-se perceber que a frequncia dos assinantes aumenta at


36,5 minutos e ento diminui.

Grficos de distribuio
de frequncia

Frequncia
relativa

Histograma de frequncia relativa


Tem o mesmo formato e eixo horizontal que o
histograma de frequncia correspondente
O eixo vertical mede as frequncias relativas e no
as frequncias

Valores dos
dados

Exemplo: histograma de
frequncia relativa
Construa um histograma de frequncia relativa para a
distribuio da frequncia do uso de Internet.
Frequncia, f

Classe

Fronteiras de
classes

Frequncia
relativa

7 18

6.5 18.5

0.12

19 30

18.5 30.5

10

0.20

31 42

30.5 42.5

13

0.26

43 54

42.5 54.5

0.16

55 66

54.5 66.5

0.10

67 78

66.5 78.5

0.12

79 90

78.5 90.5

0.04

Soluo: histograma de
frequncia relativa

Frequncia

Uso de Internet

6.5

18.5

30.5

42.5

54.5

66.5

78.5

90.5

Tempo on-line (em minutos)

A partir do grfico, pode-se perceber que 20% dos assinantes de


Internet passaram entre 18,5 minutos e 30,5 minutos conectados.

Grficos de distribuio
de frequncias

Frequncia
cumulativa

Grfico de frequncias cumulativas ou ogiva


Um grfico de linhas que demonstra a frequncia
cumulativa de cada classe em sua fronteira superior
As fronteiras superiores so demarcadas no eixo
horizontal
As frequncias cumulativas so demarcadas no eixo
vertical

Valores dos
dados

Construindo uma ogiva


1. Construa uma distribuio de frequncia que inclua
frequncias cumulativas como uma das colunas.
2. Especifique os eixos horizontal e vertical.
O eixo horizontal consiste nas fronteiras
superiores das classes
O eixo vertical mede as frequncias cumulativas
3. Pontos que representam as fronteiras superiores das
classes e suas frequncias cumulativas
correspondentes.

4. Conecte os pontos da esquerda com os da direita.


5. O grfico deve comear na fronteira inferior da
primeira classe (frequncia cumulativa zero) e
deve terminar na fronteira superior da ltima classe
(frequncia cumulativa igual ao tamanho da
amostra).

Exemplo: ogiva
Construir uma ogiva para a distribuio de frequncia
do uso da Internet.
Classe

Fronteiras de Frequncia,
classes
f

Frequncia
cumulativa

7 18

6.5 18.5

19 30

18.5 30.5

10

16

31 42

30.5 42.5

13

29

43 54

42.5 54.5

37

55 66

54.5 66.5

42

67 78

66.5 78.5

48

79 90

78.5 90.5

50

Soluo: ogiva
Cumulative
cumulativa
Frequnciafrequency

Internet
Usage
Uso de Internet
60
50
40
30
20
10
0

6.5

18.5

30.5

42.5

54.5

66.5

78.5

90.5

TempoTime
on-line
minutos)
online(em
(in minutes)

A partir da ogiva, pode-se perceber que aproximadamente 40


assinantes passaram 60 minutos ou menos conectados em sua
ltima sesso. O maior aumento no uso ocorre entre 30,5 minutos
e 42,5 minutos.

Sumrio da Seo
Construmos distribuies de frequncia
Construmos histogramas de frequncia, polgonos de
frequncia, histogramas de frequncia relativa e
ogivas

Seo 2.2
Mais grficos e representaes

Objetivos da Seo
Fazer grficos de dados quantitativos usando
diagrama de ramos-e-folhas e um diagrama de pontos
Fazer grficos de dados qualitativos usando grficos
de pizza e de Pareto
Fazer grficos de conjunto de dados emparelhados
usando grficos de disperso e grficos da srie
temporal

Fazendo grficos de
conjuntos de dados quantitativos
Diagrama de ramos-e-folhas
Cada nmero separado em um ramo e uma folha
Similar a um histograma
Ainda contm os valores dos dados originais 26
Dados: 21, 25, 25, 26, 27,
28, 30, 36, 36, 45

2
3

1 5 5 6 7 8
0 6 6

Exemplo: construindo um
diagrama de ramos-e-folhas
Os nmeros seguintes representam a quantidade de
mensagens de texto enviadas no ms passado pelos
usurios de celulares em um andar do dormitrio da
faculdade. Mostre os dados em um diagrama de
ramos-e-folhas.
155 159 144 129 105 145 126 116 130 114 122 112 112 142 126
118 118 108 122 121 109 140 126 119 113 117 118 109 109 119
139 139 122 78 133 126 123 145 121 134 124 119 132 133 124
129 112 126 148 147

Soluo: construindo um
diagrama de ramos-e-folhas
155
118
139
129

159
118
139
112

144
108
122
126

129
122
78
148

105 145 126 116 130 114 122 112 112 142 126
121 109 140 126 119 113 117 118 109 109 119
133 126 123 145 121 134 124 119 132 133 124
147

As entradas de dados variam do baixo 78 at um alto


159
Use o dgito mais direita como a folha
Por exemplo,
78 = 7 | 8
e 159 = 15 | 9
Liste os ramos, 7 at 15, esquerda de uma linha
vertical
Para cada entrada de dados, liste uma folha direita de
seu ramo

Nmero de mensagens de texto enviadas Nmero de mensagens de texto enviadas


Chave:
Chave:
Inclui uma chave
para identificar os
valores dos dados.

Diagrama de ramos-e-folhas no ordenado Diagrama de ramos-e-folhas ordenado

Pode-se concluir pelos dados acima que mais de 50% dos


usurios de celular enviaram entre 110 e 130 mensagens de
texto.

Fazendo grficos de
conjuntos de dados quantitativos
Diagrama de pontos
Cada entrada de dados posta usando um ponto
acima de um eixo horizontal
Dados: 21, 25, 25, 26, 27, 28, 30, 36, 36, 45
26
20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45

Exemplo: construindo um
diagrama de pontos
Use um diagrama de pontos para organizar os dados das
mensagens de texto.
155
118
139
129

159
118
139
112

144
108
122
126

129
122
78
148

105 145 126 116 130 114 122 112 112 142 126
121 109 140 126 119 113 117 118 109 109 119
133 126 123 145 121 134 124 119 132 133 124
147

Para que cada entrada seja includa no diagrama de


pontos, o eixo horizontal deve incluir nmeros entre 70
e 160
Para reresentar uma entrada, insira um ponto acima da
posio da entrada no eixo
Se uma entrada for repetida, faa outro ponto acima do
ponto anterior

Soluo: construindo um
diagrama de pontos
155
118
139
129

159
118
139
112

144
108
122
126

129
122
78
148

105 145 126 116 130 114 122 112 112 142 126
121 109 140 126 119 113 117 118 109 109 119
133 126 123 145 121 134 124 119 132 133 124
147

Nmero de mensagens de texto enviadas

Partindo do diagrama de pontos, pode-se perceber que


a maioria dos valores se agrupam entre 105 e 148 e que
o valor que mais ocorre 126. Pode-se notar tambm
que 78 um valor incomum.

Fazendo grficos de
conjunto de dados qualitativos
Grfico de pizza
Um crculo dividido em vrios setores, que
representam categorias
A rea de cada setor proporcional frequncia de
cada categoria

Exemplo: construindo um
grfico de pizza
O nmero de ocupantes de veculos motorizados mortos
em acidentes em 2005 exibido na tabela. Use um
grfico de pizza para organizar os dados. (Fonte: U.S.
Department of Transportation, National Highway
Traffic Safety Administration.)
Tipo de
Mortes
veculo
Carros
18.440
Caminhes
13.778
Motocicletas
4.553
Outros
823

Soluo: construindo um
grfico de pizza
Encontre a frequncia relativa (porcentagem) de cada
categoria.
Tipo de
Veculo

Frequncia,
f

Carros

18.440

Caminhes

13.778

Motocicletas
Outros

4.553
823

Frequncia
relativa
18440
0.49
37594
13778
0.37
37594
4553
0.12
37594
823
0.02
37594

Construa o grfico de pizza usando o ngulo central


que corresponda cada categoria.
Para encontrar o ngulo central, multiplique 360
pela frequncia relativa da categoria.
Por exemplo, o ngulo central para carros
360(0,49) 176

Tipo de
veculo

Frequncia, Frequncia
f
relativa
ngulo central

Carros

18.440

0,49

360(0,49)176

Caminhes

13.778

0,37

360(0,37)133

4.553

0,12

360(0,12)43

823

0,02

360(0,02)7

Motocicletas

Outros

Ocupantes de veculos
Tipo de
veculo

Frequncia
relativa

ngulo
central

Carros

0,49

176

Caminhes

0,37

133

Motocicletas

0,12

43

Outros

0,02

motorizados mortos em 2005


Motocicletas

Caminhes

Outros

Carros

A partir do grfico, pode-se concluir que a maioria dos


acidentes fatais em veculos automotivos foram aqueles
envolvendo carros.

Fazendo grficos de
conjunto de dados qualitativos

Frequncia

Grfico de Pareto
Um grfico de barras verticais no qual a altura de
cada barra representa uma frequncia ou uma
frequncia relativa
As barras so posicionadas por ordem decrescente de
altura; a barra mais alta posicionada esquerda

Categorias

Exemplo: construindo um
grfico de Pareto
Recentemente, a indstria de varejo perdeu 41 milhes
com reduo nos estoques. A reduo de estoque uma
perda de estoque por meio de quebra, roubo de carga,
roubo em lojas e assim por diante. As causas da reduo
de estoque so erro administrativo (7,8 milhes), roubo
por funcionrios (15,6 milhes), furto das lojas (14,7
milhes) e fraude dos vendedores (2,9 milhes). Se
voc fosse um varejista, para qual causa de reduo de
estoque voc olharia primeiro? (Fonte: National Retail
Federation and Center for Retailing Education,
University of Florida.)

Soluo: construindo um
grfico de Pareto
US$ (em
milhes)

Erro adm.

7,8

Roubo por
funcionrios

15,6

Furto das
lojas

14,7

Fraude dos
vendedores

2,9

Causas da diminuio do estoque


Milhes de dlares

Causa

Roubo por

Furto das

funcionrios

lojas

Erro adm.

Causa

Fraude dos
vendedores

Pelo grfico, fcil ver que, das causas da diminuio do estoque, o


roubo por funcionrios deveria ser o primeiro a receber ateno.

Fazendo grficos de
conjunto de dados emparelhados
Conjunto de dados emparelhados
Cada entrada em um conjunto de dados corresponde
outra entrada em um segundo conjunto de dados
Grficos usam um grfico de disperso y
Os pares ordenados so representados
como pontos em um plano coordenado
Usado para representar a relao entre
duas variveis quantitativas

Exemplo: interpretando
um grfico de disperso
O estatstico britnico Ronald Fisher (ver p. 28)
apresentou um famoso conjunto de dados chamado de
conjunto de dados de ris de Fisher. Esse conjunto de
dados descreve vrias caractersticas fsicas, como o
comprimento de ptalas e a sua largura (em milmetros)
para trs espcies de ris (flor). No grfico de disperso
mostrado, os comprimentos de ptalas formam o
primeiro conjunto de dados e as larguras formam o
segundo conjunto de dados. Conforme o comprimento
da ptala aumenta, o que tende a acontecer com a
largura? (Fonte: Fisher, R. A., 1936.)

Largura da ptala (em milmetros)

Conforme o comprimento da ptala aumenta, o que


tende a acontecer com a largura?
Conjunto de dados de ris de Fisher

Comprimento da ptala (em milmetros)

Cada ponto no
esquema
disperso
representa o
comprimento e a
largura da ptala
de uma flor.

Largura da ptala (em milmetros)

Soluo: interpretando
um grfico de disperso
Conjunto de dados de ris de Fisher

Comprimento da ptala (em milmetros)

Interpretao
Partindo do grfico de disperso, pode-se notar que
conforme o comprimento da ptala aumenta, a
largura da ptala tambm tende a aumentar.

Fazendo grficos de
conjunto de dados

Dados
quantitativos

Srie temporal
Conjuntos de dados so compostos de entradas
quantitativas tomadas em intervalos regulares em um
perodo de tempo
Por exemplo, a quantidade de precipitaes
medidas a cada dia por um ms
Usa um grfico de perodos de tempo

Tempo

Exemplo: construindo um
grfico de srie temporal
A tabela lista o nmero de telefones
celulares (em milhes) para os anos
de 1995 at 2005. Construa um
grfico de srie temporal do nmero
de telefones celulares. (Fonte:
Cellular Telecommunication &
Internet Association.)

Ano

Usurios
(em milhes)

Soluo: construindo um
grfico de srie temporal
Faa com que o eixo horizontal
represente os anos
Deixe o eixo vertical representar
o nmero de celulares (em
milhes)
Marque os dados emparelhados e
conecte-os com os segmentos de
linha

Ano

Usurios
(em milhes)

Nmero de telefones celulares


Usurios
(em milhes)

Celulares (em milhes)

Ano

Anos

O grfico mostra que o nmero de celulares tem aumentado desde


1995, com aumentos ainda mais significativos recentemente.

Sumrio da Seo
Fizemos grficos de dados quantitativos usando um
diagrama de ramos-e-folhas e diagrama de pontos
Fizemos grficos de dados qualitativos usando
grficos de pizza e de Pareto
Fizemos grficos de dados emparelhados usando
grficos de disperso e grficos de srie temporal

Seo
Medidas de tendncia central

Objetivos da Seo 2.3


Determinar a mdia, mediana e moda de uma
populao e de uma amostra
Determinar a mdia ponderada de um conjunto de
dados e a mdia de uma distribuio de frequncia
Descrever a forma da distribuio como simtrica,
uniforme ou assimtrica e comparar a mdia e a
mediana de cada uma

Medidas de tendncia
central
Um valor que representa uma entrada de um conjunto
de dados como tpico ou central
Medidas de tendncia central mais comuns:
Mdia
Mediana
Moda

Medidas de tendncia
central: mdia

Mdia
A soma de todas as entradas de dados divididas pelo
nmero de entradas
Notao sigma: x = adicione todas as entradas (x)
no conjunto de dados
Mdia populacional: x
N

Mdia amostral:

x
x
n

Exemplo: encontrando a
mdia da amostra
Os preos (em dlares) para uma amostra de viagens
feitas de Chicago, Illinois, para Cancun, Mxico, so
listados.
Qual o preo mdio dos voos?
872 432 397 427 388 782 397

Soluo: encontrando a
mdia da amostra
872 432 397 427 388 782 397
A soma dos preos dos voos
x = 872 + 432 + 397 + 427 + 388 + 782 + 397 = 3.695
Para encontrar o preo mdio, divida a soma dos
preos pelo nmero de preos na amostra
x 3695
x

527.9
n
7
O preo mdio dos voos cerca de $ 527,90.

Medidas de tendncia
central: mediana

Mediana
O valor que est no meio dos dados quando o
conjunto dos dados ordenado
Mede o centro de um conjunto de dados ordenado
dividindo-o em duas partes iguais
Se o conjunto de dados possui um nmero de
entradas:
mpar: o mediano o elemento do meio
par: o mediano ser a mdia dos dois elementos
centrais

Exemplo: encontrando
a mediana
Os preos (em dlares) para uma amostra de viagens
feitas de Chicago, Illinois, para Cancun, Mxico, so
listados. Encontre a mediana.
872 432 397 427 388 782 397

Soluo: encontrando
a mediana
872 432 397 427 388 782 397
Primeiramente, ordene os dados
388 397 397 427 432 782 872
Existem sete entradas (um nmero mpar), e a
mediana o elemento central, ou o quarto, do
conjunto de dados

O preo mediano dos voos $ 427.

Exemplo: encontrando
a mediana
O preo dos voos em $ 432 no est mais disponvel.
Qual o preo mediano dos voos restantes?
872 397 427 388 782 397

Soluo: encontrando
a mediana
872 397 427 388 782 397
Primeiramente, ordene os dados
388 397 397 427 782 872
H seis elementos (um nmero par), a mediana a
mdia das duas entradas centrais.
397 427
Mediano
Median
412
2
O preo mediano dos voos $ 412.

Medidas de tendncia
central: moda
Moda
A entrada de dados ocorre com a maior frequncia
Se no houver entradas repetidas, o conjunto de
dados no tem moda
Se duas entradas ocorrem com a mesma e mais alta
frequncia, cada entrada um moda (bimodal)

Exemplo: encontrando
a moda
Os preos (em dlares) para uma amostra de viagens
feitas de Chicago, Illinois, para Cancun, Mxico, so
listados. Encontre a moda dos preos dos voos.
872 432 397 427 388 782 397

Soluo: encontrando
a moda
872 432 397 427 388 782 397
Ordenar os dados ajuda a encontrar a moda
388 397 397 427 432 782 872
A entrada de 397 ocorre duas vezes, enquanto as
outras ocorrem somente uma vez.
A moda dos preos dos voos $ 397.

Exemplo: encontrando
a moda
Em um debate poltico uma amostra de membros da
audincia foi questionada respeito de seus partidos
polticos. Suas respostas esto na tabela. Qual a moda
de suas respostas?
Partido poltico
Democrata
Republicano

Frequncia, f
34
56

Outros

21

No responderam

Soluo: encontrando
a moda
Partido poltico
Democrata
Republicano
Outros
No responderam

Frequncia, f
34
56
21
9

A moda Republicano (a resposta com maior


ocorrncia). Nessa amostra havia mais republicanos do
que pessoas de qualquer outro partido poltico.

Comparando a mdia,
a mediana e a moda
Todas as trs medidas descrevem uma entrada tpica
de um conjunto de dados
Vantagens de usar a mdia:
A mdia uma medida confivel porque leva em
conta cada entrada do conjunto de dados
Desvantagens de usar a mdia:
Muito afetada por valores discrepantes (uma
entrada que muito distante das outras entradas no
conjunto de dados)

Exemplo: comparando a
mdia, a mediana e a moda
Encontre a mdia, a mediana e a moda da amostra de
idades de uma classe. Qual medida de tendncia central
descreve melhor uma entrada tpica desse conjunto de
dados? Existe algum valor discrepante?
Idades em uma classe
20

20

20

20

20

20

21

21

21

21

22

22

22

23

23

23

23

24

24

65

Soluo: comparando a
mdia, a mediana e a moda
Idades em uma classe

Mdia:

20

20

20

20

20

20

21

21

21

21

22

22

22

23

23

23

23

24

24

65

x 20 20 ... 24 65
x

23.8 years
anos
n
20

21 22
anos
Mediana:
21.5 years
2

Moda:

20 anos (a entrada que ocorre com a


maior frequncia)

Mdia 23,8 anos

Mediana = 21,5 anos

Moda = 20 anos

A mdia leva todas as entradas em considerao,


mas influenciada pelo valor discrepante 65
A mediana tambm leva todas as entradas em
considerao, e no afetada pelo valor discrepante
Nesse caso a moda existe, mas no parece
representar uma entrada tpica

Larson/Farber 4th ed.

82

Algumas vezes uma comparao grfica pode ajudar a


decidir qual medida de tendncia central melhor
representa um conjunto de dados.

Nesse caso, parece que a mediana o que melhor descreve o


conjunto de dados.
Larson/Farber 4th ed.

83

Mdia ponderada
A mdia de um conjunto de dados cujas entradas
possuem pesos variantes

( x w)
x
em que w o peso de cada entrada x
w

Larson/Farber 4th ed.

84

Exemplo: encontrando a
mdia ponderada
Voc est frequentando uma aula na qual sua nota
determinada com base em 5 fontes: 50% da mdia de
seu exame, 15% do seu exame bimestral, 20% de seu
exame final, 10% de seu trabalho no laboratrio de
informtica e 5% de seus deveres de casa. Suas notas
so: 86 (mdia do exame), 96 (exame bimestral), 82
(exame final), 98 (laboratrio) e 100 (dever de casa).
Qual a mdia ponderada de suas notas? Se a mdia
mnima para um A 90, voc obteve uma nota A?

Soluo: encontrando a
mdia ponderada
Fonte

xw

Notas, x

Peso, w

Mdia do exame

86

0,50

86(0,50)= 43,0

Exame bimestral

96

0,15

96(0,15) = 14,4

Exame final

82

0,20

82(0,20) = 16,4

Laboratrio

98

0,10

98(0,10) = 9,8

Dever de casa

100

0,05

100(0,05) = 5,0

w = 1

(xw) = 88,6

( x w)
88.6
x

88.6
w
1
Sua mdia ponderada para essa aula foi 88,6. Voc no
tirou um A.

Mdia de dados agrupados


Mdia de uma distribuio de frequncia
Aproximada por

( x f )
x
n

n f

em que x e f so, respectivamente, os pontos mdios


e as frequncias de uma classe

Encontrando a mdia
da distribuio de uma frequncia
Em palavras
1. Encontre o ponto mdio de
cada classe.

Em smbolos
x

(Limite limit)+(upper
inferior) + (Limitelimit)
superior)
(lower
2

2. Encontre a soma dos produtos


dos pontos mdios e das
frequncias.

( x f )

3. Encontre a soma das


frequncias.

n f

4. Encontre a mdia da
distribuio das frequncias.

( x f )
n

Exemplo: encontrando a
mdia da distribuio
de uma frequncia
Use a distribuio de frequncia para aproximar a mdia
do nmero de minutos que uma amostra de internautas
passou conectada em sua ltima sesso.
Classe

Ponto
mdio

Frequncia, f

7 18

12,5

19 30

24,5

10

31 42

36,5

13

43 54

48,5

55 66

60,5

67 78

72,5

79 90

84,5

Classe

Ponto
mdio, x

Frequncia,
f

(xf)

7 18

12,5

12,56 = 75,0

19 30

24,5

10

24,510 = 245,0

31 42

36,5

13

36,513 = 474,5

43 54

48,5

48,58 = 388,0

55 66

60,5

60,55 = 302,5

67 78

72,5

72,56 = 435,0

79 90

84,5

84,52 = 169,0

n = 50

(xf) = 2.089,0

( x f ) 2089
minutos
x

41.8 minutes
n
50

A forma das distribuies


Distribuio simtrica
Uma linha vertical pode ser traada do meio do
grfico de distribuio e as metades resultantes
so quase idnticas.

O formato das
distribuies
Distribuio uniforme (retangular)
Todas as entradas tm frequncias iguais ou quase iguais
Simtrica

Distribuio assimtrica esquerda (assimtrica


negativamente)
A cauda do grfico se alonga mais esquerda
A mdia fica esquerda da mediana

Distribuio assimtrica direita (positivamente


assimtrica)
A cauda do grfico se alonga mais direita
A mdia fica direita da mediana

Sumrio da Seo 2.3


Determinamos a mdia, a mediana e a moda de uma
populao e de uma amostra
Determinamos a mdia ponderada de um conjunto de
dados e a mdia de uma distribuio de frequncia
Descrevemos a forma da distribuio como simtrica,
uniforme, ou assimtrica e comparamos a mdia e a
mediana de cada um

Medidas de variao

Objetivos da Seo
Determinar a amplitude de um conjunto de dados
Determinar a varincia e o desvio padro da
populao e da amostra
Usar a Regra Emprica e o Teorema de Chebychev
para interpretar o desvio padro
Aproximar o desvio padro da amostra para dados
agrupados

Varincia
Varincia
A diferena entre as entradas mxima e mnima em
um conjunto de dados
Os dados precisam ser quantitativos
Varincia = (Entrada mx.) (Entrada mn.)

Exemplo: encontrando a
varincia
Uma corporao contratou 10 graduados. Os salrios
iniciais de cada um so demonstrados abaixo. Encontre
a varincia dos salrios iniciais.
Salrios iniciais (milhares de dlares)
41 38 39 45 47 41 44 41 37 42

Ordenar os dados ajuda a encontrar o menor e o


maior salrio
37 38 39 41 41 41 42 44 45 47
Mnimo

Mximo

Varincia = (Entrada mx.) (Entrada mn.)


= 47 37 = 10
A varincia dos salrios iniciais igual a 10.

Desvio, varincia e
desvio padro

Desvio
A diferena entre a entrada de dados, x, e a mdia do
conjunto de dados
Conjunto de dados da populao:
Desvio de x = x
Conjunto de dados da amostra:
Desvio de x = x x

Exemplo: encontrando
o desvio
Uma corporao contratou 10 graduados. Os salrios
iniciais de cada um so demonstrados abaixo. Encontre
a variao dos salrios iniciais.
Salrios iniciais (milhares de dlares)
41 38 39 45 47 41 44 41 37 42
Soluo:
Primeiro, determine a mdia dos salrios
iniciais.
x 415

41.5
N

10

Soluo: encontrando
o desvio
Salrio ($ 1.000s), x Desvio: x

Determine o desvio
para cada entrada.

41

41 41,5 = 0,5

38

38 41,5 = 3,5

39

39 41,5 = 2,5

45

45 41,5 = 3,5

47

47 41,5 = 5,5

41

41 41,5 = 0,5

44

44 41,5 = 2,5

41

41 41,5 = 0,5

37

37 41,5 = 4,5

42

42 41,5 = 0,5

x = 415

(x ) = 0

Desvio, varincia e
desvio padro
Varincia da populao

( x )

N
2

Soma dos quadrados, SQx

Desvio padro da populao


2

(
x

)
2

Encontrando a varincia
populacional e o desvio padro
Em palavras
1. Encontre a mdia do
conjunto de dados da
populao.
2. Encontre o desvio de cada
entrada.
3. Eleve os desvios ao
quadrado.

4. Some para obter a soma dos


quadrados.

Em smbolos
x

x
(x )2

SSx = (x )2

Em palavras
5. Divida por N para obter a
varincia populacional.

Em smbolos
2

(
x

)
2
N

6. Encontre a raiz quadrada


para obter o desvio padro
populacional.

( x ) 2

Exemplo: encontrando o
desvio padro da populao
Uma corporao contratou 10 graduados. Os salrios
iniciais de cada um so demonstrados abaixo. Encontre
a variao dos salrios iniciais.
Salrios iniciais (milhares de dlares)
41 38 39 45 47 41 44 41 37 42
Lembrar = 41,5.

Soluo: encontrando o
desvio padro da populao
Desvio: x

Quadrados: (x )2

41

41 41,5 = 0,5

(0,5)2 = 0,25

38

38 41,5 = 3,5

(3,5)2 = 12,25

39

39 41,5 = 2,5

(2,5)2 = 6,25

45

45 41,5 = 3,5

(3,5)2 = 12,25

47

47 41,5 = 5,5

(5,5)2 = 30,25

41

41 41,5 = 0,5

(0,5)2 = 0,25

44

44 41,5 = 2,5

(2,5)2 = 6,25

41

41 41,5 = 0,5

(0,5)2 = 0,25

37

37 41,5 = 4,5

(4,5)2 = 20,25

42

42 41,5 = 0,5

(0,5)2 = 0,25

Salrio, x

Determine SQx
N = 10

(x ) = 0

SSx = 88,5

Varincia da populao

( x )
88.5

8.9

N
10
2

Desvio padro da populao


2 8.85 3.0

O desvio padro da populao cerca de 3,0 ou $ 3.000.

Desvio, varincia e
desvio padro
Varincia da amostra
2

(
x

x
)
s2
n 1

Desvio padro da amostra

( x x )
s s
n 1
2

Encontrando a varincia
e o desvio padro da amostra
Em palavras
1. Encontre a mdia do
conjunto de dados da
amostra.

2. Encontre o desvio de cada


entrada.
3. Eleve cada desvio ao
quadrado.
4. Some-os para obter a soma
dos quadrados.

Em smbolos
x
x
n

xx
( x x )2
SS x ( x x ) 2

Em palavras
5. Divida por n 1 para obter
a varincia da amostra.
6. Encontre a raiz quadrada
para obter o desvio padro
da amostra.

Em smbolos
2

(
x

x
)
s2
n 1

( x x ) 2
s
n 1

Exemplo: encontre o
desvio padro da amostra
Os salrios inicias so para uma filial da empresa em
Chicago. A empresa tem vrias outras filiais e voc
planeja usar os salrios iniciais de Chicago para estimar
os salrios iniciais da populao maior. Encontre o
desvio padro dos salrios iniciais da amostra.
Salrios iniciais (milhares de dlares)
41 38 39 45 47 41 44 41 37 42

Soluo: encontrando o
desvio padro da populao
Determine SQx
n = 10

Desvio: x

Quadrados: (x )2

41

41 41,5 = 0,5

(0,5)2 = 0,25

38

38 41,5 = 3,5

(3,5)2 = 12,25

39

39 41,5 = 2,5

(2,5)2 = 6,25

45

45 41,5 = 3,5

(3,5)2 = 12,25

47

47 41,5 = 5,5

(5,5)2 = 30,25

41

41 41,5 = 0,5

(0,5)2 = 0,25

44

44 41,5 = 2,5

(2,5)2 = 6,25

41

41 41,5 = 0,5

(0,5)2 = 0,25

37

37 41,5 = 4,5

(4,5)2 = 20,25

42

42 41,5 = 0,5
(x ) = 0

(0,5)2 = 0,25
SSx = 88,5

Salrio, x

Varincia da amostra

( x x )
88.5

9.8
s
n 1
10 1
2

Desvio padro da amostra

88.5
3.1
s s
9
2

O desvio padro da amostra de aproximadamente 3,1


ou $ 3.100.

Exemplo: usando tecnologia


para encontrar o desvio padro
A amostra dos aluguis de
escritrios (em dlares por p
quadrado ao ano) no distrito
comercial central de Miami
exibida na tabela. Use uma
calculadora ou um computador
para encontrar a mdia dos
aluguis e o desvio padro da
amostra (Adaptado de:
Cushman & Wakefield Inc.)

Preo dos aluguis


35,00

33,50

37,00

23,75

26,50

31,25

36,50

40,00

32,00

39,25

37,50

34,75

37,75

37,25

36,75

27,00

35,75

26,00

37,00

29,00

40,50

24,50

33,00

38,00

Soluo: usando tecnologia


para encontrar o desvio padro

Interpretando o desvio
padro
Desvio padro a medida do valor tpico que uma
entrada desvia da mdia
Quanto mais as entradas esto espalhadas, maior o
desvio padro

Interpretando desvio
padro: Regra Emprica
(Regra 68 95 99.7)
Para dados com uma distribuio em formato de sino
(simtrico), o desvio padro tem as seguintes
caractersticas:
Cerca de 68% dos dados esto dentro de um desvio
padro da mdia
Cerca de 95% dos dados esto dentro de dois desvios
padro da mdia
Cerca de 99,7% dos dados esto dentro de trs
desvios padro da mdia

99,7% dentro de trs desvios padro


95% dentro de dois desvios padro
68% dentro de um
desvio padro

34%

34%

2.35%

2.35%
13.5%

x 3s

x 2s

13.5%

x s

x s

x 2s

x 3s

Exemplo: usando a
Regra Emprica
Em uma pesquisa conduzida pelo National Center for
Health Statistics, a amostragem mdia da altura de
mulheres nos Estados Unidos (20-29 anos) era de 64
polegadas, com um desvio padro da amostragem de
2,71 polegadas. Estime a porcentagem de mulheres que
esto entre 64 e 69,42 polegadas.

Soluo: usando a
Regra Emprica
Porque a distribuio tem formato de sino, voc pode
usar a Regra Emprica.
34%
13.5%

55,87

x 3s

58,58

x 2s

61,29

x s

64

66,71

x s

69,42

x 2s

72,13

x 3s

34% + 13,5% = 47,5% das mulheres esto entre 64 e


69,42 polegadas.

Teorema de Chebychev
A poro de qualquer conjunto de dados postos
dentro de k desvios padro (k > 1) da mdia no
1
mnimo:
1 2
k
k = 2: Em qualquer conjunto de dados, pelo menos
1 3
1 2 or 75% dos dados esto dentro de dois
2
4
desvios padro da mdia.
k = 3: Em qualquer conjunto de dados, pelo menos
1

1 8
or 88.9% dos dados esto dentro de trs
2
3
9
desvios padro da mdia.

Exemplo: usando o
Teorema de Chebychev
A distribuio de idades na Flrida mostrada no
histograma. Aplique o Teorema de Chebychev aos
dados usando k = 2. O que se pode concluir?

Soluo: usando o
Teorema de Chebychev

k = 2: 2 = 39,2 2(24,8) = 10,4 (use 0 j que


idade no pode
ser negativa)
+ 2 = 39,2 + 2(24,8) = 88,8
Pelo menos 75% da populao da flrida est entre 0 e
88,8 anos de idade.

Desvio padro para


dados agrupados
Desvio padro de uma amostra para uma distribuio
de frequncia

( x x ) f
s
n 1
2

em que n = f (o nmero de
entradas no conjunto de
dados)

Quando uma distribuio de frequncia tem classes,


estime a mdia da amostra e o desvio padro usando o
ponto mdio de cada classe.

Exemplo: encontrando o
desvio padro para dados agrupados
Voc coleta uma amostragem
aleatria do nmero de crianas por
casa em uma regio. Encontre a
mdia da amostra e o desvio padro
da amostra do conjunto de dados.

Nmero de crianas em
50 casas
1

Soluo: encontrando o
desvio padro para dados agrupados
Primeiro, construa a distribuio da
frequncia
Encontre a mdia da distribuio da
frequncia
xf 91
x

1.8
n
50
A mdia da amostra de cerca de
1,8 criana.

xf

10

0(10) = 0

19

1(19) = 19

2(7) = 14

3(7) =21

4(2) = 8

5(1) = 5

6(4) = 24

f = 50 (xf )= 91

Determine a soma dos quadrados.


x

xx

( x x )2

10

0 1,8 = 1,8

(1,8)2 = 3,24

3,24(10) = 32,40

19

1 1,8 = 0,8

(0,8)2 = 0,64

0,64(19) = 12,16

2 1,8 = 0,2

(0,2)2 = 0,04

0,04(7) = 0,28

3 1,8 = 1,2

(1,2)2 = 1,44

1,44(7) = 10,08

4 1,8 = 2,2

(2,2)2 = 4,84

4,84(2) = 9,68

5 1,8 = 3,2

(3,2)2 = 10,24

10,24(1) = 10,24

6 1,8 = 4,2

(4,2)2 = 17,64

17,64(4) = 70,56

( x x )2 f

( x x )2 f 145.40

Encontre o desvio padro da amostra.


xx

( x x )2

( x x )2 f

( x x ) 2 f
145.40
s

1.7
n 1
50 1

O desvio padro de cerca de 1,7 criana.

Sumrio da Seo
Determinamos a amplitude de um conjunto de dados
Determinamos a varincia e o desvio padro da
populao e da amostra
Usamos a Regra Emprica e o Teorema de Chebychev
para interpretar o desvio padro
Aproximamos o desvio padro da amostra para dados
agrupados

Medidas de posio

Objetivos da Seo
Determinar os quartis de um conjunto de dados
Determinar a amplitude interquartil de um conjunto
de dados
Criar um grfico de caixa-e-bigodes
Interpretar outros fractis, como percentis
Determinar e interpretar o escore padro (escore z)

Quartilhos
Fractis so nmeros que particionam (dividem) um
conjunto de dados ordenados em partes iguais
Quartis dividem dados ordenados em quatro partes
aproximadamente iguais
Primeiro quartil, Q1: Cerca de um quarto dos
dados cai em ou abaixo de Q1
Segundo quartil, Q2: Cerca de metade dos dados
caem em ou abaixo de Q2 (mediana)
Terceiro quartil, Q3: Cerca de trs quartos dos
dados caem em ou abaixo de Q3

Exemplo: encontrando
quartis
As pontuaes dos testes de 15 empregados
matriculados em um curso de primeiros socorros so
listadas. Encontre o primeiro, o segundo e o terceiro
quartil das pontuaes dos testes.
13 9 18 15 14 21 7 10 11 20 5 18 37 16 17
Soluo:
Q2 divide o conjunto de dados em duas metades
Metade inferior

Metade superior

5 7 9 10 11 13 14 15 16 17 18 18 20 21 37
Q2

Soluo: encontrando
quartis
O primeiro e o terceiro quartis so as medianas das
metades inferior e superior do conjunto de dados
Metade inferior

Metade superior

5 7 9 10 11 13 14 15 16 17 18 18 20 21 37

Q1

Q2

Q3

Cerca de um quarto dos funcionrios obteve nota 10


ou menor; cerca de metade deles obteve 15 ou menor;
e cerca de trs quartos obteve 18 ou menor.

Amplitude interquartil
Encontrando a amplitude interquartil (VIQ)
A diferena entre o terceiro e o primeiro quartis
VIQ = Q3 Q1

Exemplo: encontrando
a amplitude interquartil
Encontre a amplitude interquartil das notas dos testes.
Lembre-se: Q1 = 10, Q2 = 15 e Q3 = 18

Soluo:
VIQ = Q3 Q1 = 18 10 = 8
As notas dos testes na poro do meio do conjunto
de dados variam no mximo em 8 pontos.

Grfico de caixa-e-bigodes
Ferramenta exploratria de anlise de dados
Destaca qualidades importantes do conjunto de dados
Requer (sumrio de cinco nmeros):
Entrada mnima
Primeiro quartil Q1
Mediana Q2
Terceiro quartil Q3
Entrada mxima

Desenhando um grfico
de caixa-e-bigodes
1.
2.
3.
4.
5.

Encontre o sumrio de cinco nmeros do conjunto de dados.


Construa uma escala horizontal que cubra a varincia dos dados.
Ponha os cinco nmeros acima da escala horizontal.
Desenhe uma caixa acima da escala horizontal de Q1 at Q3 e desenhe uma
linha vertical na caixa em Q2.
Desenhe bigodes saindo da caixa para as entradas mnima e mxima.

Exemplo: desenhando um
grfico de caixa-e-bigodes
Desenhe um grfico de caixa-e-bigodes que represente as 15
pontuaes dos testes.
Lembre-se: Mn. = 5 Q1 = 10 Q2 = 15 Q3 = 18
Mx. = 37
Soluo:

Cerca de metade das notas esto entre 10 e 18. Olhando para o


comprimento do bigode direito, pode-se concluir que 37 um
possvel valor discrepante.

Percentis e outros fractis


Fractis
Quartis
Decis

Percentis

Sumrio
Divide os dados em 4 partes
iguais
Divide os dados em 10 partes
iguais
Divide os dados em 100
partes iguais

Smbolos
Q1, Q2, Q3
D1, D2, D3,, D9

P1, P2, P3,, P99

Exemplo: interpretando
percentis
A ogiva representa a
distribuio de frequncia
cumulativa para as provas do
SAT (vestibular dos EUA) de
estudantes em uma ano
recente. Qual nota representa o
72 percentil? Como voc
deve interpretar isso? (Fonte:
College Board Online.)

Soluo: interpretando
percentis
O 72 percentil corresponde
nota 1.700.
Isso significa que 72% dos
alunos obtiveram resultados
de 1.700 ou menos.

O escore padro
Escore padro (escore z)
Representa o nmero de desvios padro que um dado
valor x cai da mdia .
valor - mean
mdia
value
x

z
standard

desvio deviation
padro

Exemplo: comparando
escores z de diferentes
conjuntos de dados
Em 2007, o ator Forest Whitaker ganhou o Oscar de
melhor ator, aos 45 anos de idade, por sua atuao no
filme O ltimo Rei da Esccia. A atriz Helen Mirren
ganhou o prmio de melhor atriz aos 61 anos por seu
papel em A Rainha. A idade mdia para todos os
vencedores do prmio de melhor ator 43,7, com
desvio padro de 8,8. A idade mdia para as vencedoras
do prmio de melhor atriz 36, com desvio padro de
11,5. Encontre o escore z que corresponda idade de
cada ator ou atriz. Depois, compare os resultados.

Soluo: comparando
escores z de diferentes
conjuntos de dados
Forest Whitaker

Helen Mirren

45 43.7

0.15
8.8

Desvio padro 0,15


acima da mdia

61 36

2.17
11.5

Desvio padro 2,17


acima da mdia

Escores muito incomuns


Escores no comuns
Escores comuns
Escore z

z = 0.15

z = 2.17

O escore z correspondente idade de Helen Mirren


mais de dois desvios padro da mdia, ento
considerado incomum. Comparado a outras
vencedoras do prmio de melhor atriz, ela
relativamente mais velha, enquanto a idade de Forest
Whitaker pouco acima da mdia dos ganhadores do
prmio de melhor ator.

Sumrio da Seo
Determinamos os quartis de um conjunto de dados
Determinamos a amplitude interquartil de um
conjunto de dados
Criamos grfico de caixa-e-bigodes
Interpretamos outros fractis, como percentis
Determinamos e interpretamos o escore padro
(escore z)