Você está na página 1de 30

Captulo 2, Parte B

Estatstica Descritiva:
Mtodos Tabulares e Mtodos Grficos

Anlise exploratria de dados: Apresentao de ramo-e-folhas

Tabulaes cruzadas e Diagramas de disperso

2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 1

Anlise exploratria de dados


As tcnicas de anlise exploratria de dados consistem em
aritmtica simples e grficos fceis de serem desenhados,
que podem ser utilizados para sintetizar os dados
rapidamente.
Uma dessas tcnicas a apresentao de ramo-e-folhas.

2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 2

Apresentao de ramo-e-folhas
A apresentao de ramo-e-folhas mostra a ordem de
classificao e o formato da distribuio dos dados.
similar a um histograma em sua lateral, mas tem a
vantagem de mostrar os valores reais dos dados.
Os primeiros dgitos de cada valor de dados so
organizados esquerda de uma linha vertical.
direita da linha vertical, registramos o ltimo dgito
para cada valor em ordem de classificao.
Cada linha na apresentao chamada ramo.

Cada dgito em um ramo chamado folha.


2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 3

Exemplo: Hudson Auto Repair


A gerente da Hudson Auto gostaria de ter uma
melhor compreenso do custo das peas utilizadas
nos ajustes de motores realizados em sua oficina. Ela
examina 50 faturas de clientes que fizeram ajustes.
Os custos das peas, arredondados para o dlar mais
prximo, so apresentados no slide a seguir.

2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 4

Apresentao de ramo-e-folhas
Exemplo: Hudson Auto Repair
Amostra do custo das peas ($) para 50 ajustes
91
71
104
85
62

78
69
74
97
82

93
72
62
88
98

57
89
68
68
101

75
66
97
83
79

52
75
105
68
105

99
79
77
71
79

80
75
65
69
69

97
72
80
67
62

62
76
109
74
73

2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 5

Apresentao de ramo-e-folhas
Exemplo: Hudson Auto Repair
5
6
7
8
9
10

2
2
1
0
1
1

7
2
1
0
3
4

2
2
2
7
5

2
2
3
7
5

5
3
5
7
9

6
4
8
8

7 8 8 8 9 9 9
4 5 5 5 6 7 8 9 9 9
9
9

um ramo
uma folha
2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 6

Apresentao de ramo-e-folhas ampliada


Se acreditarmos que a apresentao de ramo-e-folhas
original tem os dados muito condensados, podemos
ampliar a apresentao verticalmente utilizando dois
ramos para cada dgito principal.
Sempre que o valor de um ramo for declarado duas
vezes, o primeiro valor corresponder a valores de
folha de 0-4, e o segundo valor corresponder a
valores de folha de 5-9.

2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 7

Apresentao de ramo-e-folhas ampliada


Exemplo: Hudson Auto Repair
5 2
5 7
6 2 2 2 2
6 5 6 7 8 8 8 9 9 9
7 1 1 2 2 3 4 4
7 5 5 5 6 7 8 9 9 9
8 0 0 2 3
8 5 8 9
9 1 3
9 7 7 7 8 9
10 1 4
10 5 5 9

2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 8

Apresentao de ramo-e-folhas
Unidades-folha
Um nico dgito utilizado para definir cada folha.

No exemplo anterior, a unidade-folha era 1.


Unidades-folha podem ser 100, 10, 1, 0,1 etc.
Quando a unidade-folha no mostrada, se presume
que ela seja igual a 1.
A unidade-folha indica como multiplicar os nmeros
na apresentao de ramo-e-folhas, a fim de aproximar
os dados originais.
2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 9

Exemplo: Unidade-folha = 0,1


Se tivermos dados com valores tais como:
8,6

11,7

9,4

9,1

10,2

11,0

8,8

a apresentao de ramo-e-folhas para esses dados ser a seguinte:


Unidade-folha = 0,1
8 6 8
9 1 4
10 2
11 0 7
2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 10

Exemplo: Unidade-folha = 10
Se tivermos dados com valores tais como
1806

1717

1974

1791

1682

1910 1838

a apresentao de ramo-e-folhas para esses dados ser a seguinte


Unidade-folha = 10
16 8
O 82 em 1682
17 1 9
arredondado para
80 e representado
18 0 3
como 8.
19 1 7
2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 11

Tabulaes cruzadas e Diagramas de disperso


At o momento, focamos nos mtodos utilizados para
sintetizar os dados de uma varivel de cada vez.
Frequentemente, um gerente est interessado em mtodos
tabulares e grficos, que ajudaro a compreender a
relao entre duas variveis.
A tabulao cruzada e o diagrama de disperso so dois
mtodos para sintetizar os dados de duas variveis
simultaneamente.

2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 12

Tabulao cruzada
Uma tabulao cruzada um sumrio tabular de dados
para duas variveis.

A tabulao cruzada pode ser utilizada quando:


uma varivel qualitativa e a outra quantitativa,
ambas as variveis so qualitativas, ou
ambas as variveis so quantitativas.
Os rtulos margem esquerda e margem superior
definem a classe para as duas variveis.

2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 13

Tabulao cruzada
Exemplo: Finger Lakes Homes
O nmero de residncias vendidas em Finger Lakes
para cada estilo e preo, nos ltimos dois anos,
mostrado a seguir.
varivel
varivel
quantitativa
categorizada
Variao
de preo

Estilo
Colonial De madeira Planta Frame em A

Total

< $200.000
> $200.000

18

19

12

55

12

14

16

45

Total

30

20

15

100

35

2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 14

Tabulao cruzada
Exemplo: Finger Lakes Homes
Percepes obtidas a partir da tabulao cruzada

O maior nmero de casas (19) na amostra


do estilo baseado em planta, e o preo menor
que $200.000.

Somente trs casas na amostra so com frame em A,


e o preo de $200.000 ou mais.

2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 15

Tabulao cruzada
Exemplo: Finger Lakes Homes

Variao
de preo

Distribuio
de frequncia
para a varivel
diferena de
preo

Estilo da casa
Colonial Madeira Planta Frame em A

Total

< $200.000
> $200.000

18
12

6
14

19
16

12
3

55

Total

30

20

35

15

100

45

Distribuio de frequncia para a


varivel estilo da casa
2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 16

Tabulao cruzada:
Porcentagens de linhas ou de colunas
Converter os dados de uma tabulao cruzada em
porcentagens de linhas ou de colunas pode oferecer
uma melhor percepo da relao entre as duas
variveis.

2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 17

Tabulao cruzada: Porcentagens de linhas


Exemplo: Finger Lakes Homes
Estilo da casa
Variao de
preo
Colonial Madeira Planta Frame em A Total
< $200.000
> $200.000

32,73
26,67

10,91 34,55
31,11 35,56

21,82
6,67

100
100

Nota: os totais nas linhas so, na verdade,


100,01, pelo arredondamento.

(Colonial e > $200K)/(Todos > $200K) x 100 = (12/45) x 100


2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 18

Tabulao cruzada: Porcentagens de colunas


Exemplo: Finger Lakes Homes
Variao
de preo

Estilo da casa
Colonial Madeira Planta Frame A

< $200.000
> $200.000

60,00
40,00

Total

100

30,00 54,29
70,00 45,71
100

100

80,00
20,00
100

(Colonial e > $200K)/(Todas as coloniais) x 100 = (12/30) x 100


2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 19

Tabulao cruzada: Paradoxo de Simpson


Os dados em duas tabulaes cruzadas ou mais,
geralmente, so combinados ou agregados para produzir
um resumo da tabulao cruzada.
preciso ter cuidado ao tirar concluses sobre a
relao entre as duas variveis na tabulao cruzada
agregada.
Em alguns casos, as concluses baseadas em uma
tabulao cruzada agregada podem ser completamente
invertidas se observarmos os dados no agregados. A
inverso das concluses com base em dados agregados e
no agregados chamada Paradoxo de Simpson.
2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 20

Diagrama de disperso e Linha de tendncia


Um diagrama de disperso uma apresentao grfica
da relao entre duas variveis quantitativas.
Uma varivel mostrada no eixo horizontal e a outra
varivel mostrada no eixo vertical.
O padro geral dos pontos representados sugere a
relao geral entre as variveis.
Uma linha de tendncia proporciona uma aproximao
da relao.

2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 21

Diagrama de disperso
Uma relao positiva

x
2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 22

Diagrama de disperso
Uma relao negativa

x
2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 23

Diagrama de disperso
Sem relao aparente

x
2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 24

Diagrama de disperso
Exemplo: Time de Futebol do Panthers
A equipe de futebol do Panthers est interessada
em investigar a relao, se houver alguma, entre as
interceptaes feitas e os pontos marcados.
x = Nmero de
interceptaes

y = Nmero de
pontos marcados

1
3
2
1
3

14
24
18
17
30

2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 25

Diagrama de disperso

Nmero de pontos marcados

35
30
25
20

15
10
5
0

x
2

Nmero de interceptaes
2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 26

Exemplo: Time de Futebol do Panthers


Percepes obtidas a partir do diagrama de disperso
anterior
O diagrama de disperso indica uma relao positiva
entre o nmero de interceptaes e o nmero de pontos
marcados.

Um maior nmero de pontos marcados est associado


a um maior nmero de interceptaes.

A relao no perfeita; todos os pontos representados

no diagrama de disperso no esto em uma linha reta.

2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 27

Diagrama de disperso e Linha de tendncia


Diagrama de disperso para o time dos Panthers
35
Nmero de
pontos marcados

30
25
20
15
10

5
0
0

1
2
3
Nmero de interceptaes

2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 28

Mtodos Tabulares e Grficos


Dados

Dados categorizados
Mtodos
tabulares
Distribuio de

Mtodos
grficos

Grfico de
frequncia absoluta
colunas
Dist. Freq. Relativa Grfico de
Dist. Freq. Relativa
setores
Percentual
Tabulao cruzada

Dados quantitativos
Mtodos
tabulares

Mtodos
grficos

Diagrama de
Distribuio de
freq. absoluta
pontos
Dist. Freq. Relat.
Histograma
Dist. Freq. Rel. %
Ogiva
Dist. Cum. Freq. Abs. Apresentao de
Dist. Cum. Freq. Rel. ramo-e-folhas
Distr. Cum. Freq.
Diagrama de
Rel. Percentual
disperso
Tabulao cruzada

2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 29

Fim da Parte B do Captulo 2

2013. Cengage Learning. Todos os direitos reservados. Este material no pode ser
escaneado, copiado, duplicado nem divulgado em um site publicamente acessvel,
seja total ou parcialmente.

Slide 30

Você também pode gostar