Você está na página 1de 49

Gráficos

EST0142 - Estatística Descritiva

Marcus Nunes
https://marcusnunes.me/

Universidade Federal do Rio Grande do Norte


Tipos de Variáveis

0
Estatística Descritiva

• Os quatro tipos de variáveis que conhecemos são:


• Quantitativa Discreta
• Quantitativa Contínua
• Qualitativa Nominal
• Qualitativa Ordinal
• Existem ferramentas estatísticas indicadas para trabalhar com cada
um destes tipos de variáveis
• A Estatística Descritiva toma os dados brutos e os converte em dados
tabulados ou em gráficos

1
Representação Tabular

• Variáveis qualitativas: representam atributos ou qualidades


• Nominal: sem ordem natural
• Ordinal: com ordem natural
• Variáveis quantitativas: são de natureza numérica
• Discreta: resultante de contagens
• Contínua: proveniente de mensuração

2
Gráficos e Figuras

2
Gráficos Bem Construídos

• A função principal dos gráficos é apresentar um resumo visual de


uma coleção de números
• Quando bem feito, um gráfico informa rapidamente informações que
levaríamos algum tempo para descobrir
• Quando mal feito, um gráfico pode informar errado aquilo que o
pesquisador gostaria de reportar

3
Gráficos Bem Construídos - Características

1. Os dados devem ser destacados do fundo


2. Devem haver rótulos claros que indiquem
a) o título ou o propósito da figura
b) o que cada elemento no gráfico significa
c) a escala de cada eixo, geralmente incluindo pontos de início
3. Deve haver o mínimo de informação não-relevante presente no
gráfico

4
Variáveis Qualitativas

4
Variáveis Qualitativas

Grau de Instrução dos Funcionários de uma Empresa

Funcionário Instrução Funcionário Instrução


1 Fundamental 11 Médio
2 Médio 12 Médio
3 Médio 13 Superior
4 Superior 14 Superior
5 Médio 15 Fundamental
6 Médio 16 Médio
7 Fundamental 17 Superior
8 Fundamental 18 Superior
9 Médio 19 Superior
10 Médio 20 Médio 5
Variáveis Qualitativas - Gráfico de Barras

10

8
Frequência

0
fundamental medio superior
Grau de Instrução 6
Variáveis Qualitativas - Gráfico de Barras

Grau de Instrução superior

medio

fundamental

0 2 4 6 8 10
Frequência 7
Variáveis Qualitativas - Gráfico de Barras

10

Grau de
Frequência

6
Instrução
fundamental

4 medio
superior

0
8
Variáveis Qualitativas

• Os gráficos que vimos nos slides anteriores são chamados de gráficos


de barras ou de colunas
• São utilizados para representar variáveis qualitativas
• Outro tipo de gráfico utilizado para este fim é o gráfico de pizza

9
Variáveis Qualitativas - Gráfico de Pizza

4 Instrução
6
fundamental
medio
superior
10

10
Variáveis Qualitativas

• É possível construir gráficos de barra mais sofisticados


• Podemos representar mais de uma variável simultaneamente em um
mesmo gráfico
• Há pelo menos duas maneiras de fazermos isto

11
Variáveis Qualitativas - Gráfico de Barras

30

Possui
Frequência

20 Namorado(a)?
Nao
Sim
10

0
Feminino Masculino
Gênero 12
Variáveis Qualitativas - Gráfico de Barras

30

20
Frequência

Gênero
Feminino
Masculino
10

0
Nao Sim
Possui Namorado(a)? 13
Variáveis Qualitativas - Gráfico de Barras

20

15
Frequência

Gênero
10 Feminino
Masculino

0
Nao Sim
Possui Namorado(a)? 14
Variáveis Quantitativas

14
Variáveis Quantitativas

• Há mais maneiras de representar graficamente variáveis


quantitativas do que variáveis qualitativas
• Cada variável quantitativa possui uma melhor maneira de ser
representada
• Veremos alguns exemplos disto a seguir

15
Variáveis Quantitativas - Gráficos de Linha

• Indicado para variáveis variando no tempo


• Útil para detectar tendências

16
Variáveis Quantitativas - Gráficos de Linha

Introdução à Estatística e Probabilidade


Média na Primeira Unidade
65

60

55

50
2015 2016 2017 2018
Ano 17
Variáveis Quantitativas - Gráficos de Linha

Introdução à Estatística e Probabilidade


Média na Primeira Unidade
60

40

20

0
2015 2016 2017 2018
Ano 18
Variáveis Quantitativas - Gráficos de Dispersão

• Mostra a relação entre duas variáveis


• Cada ponto no gráfico representa um sujeito
• Embora exiba mais informações, é mais difícil de interpretar

19
Variáveis Quantitativas - Gráficos de Dispersão

100
Peso (kg)

80

60

40
150 160 170 180 190
Altura (cm) 20
Variáveis Quantitativas - Gráficos de Dispersão

• Correlação: um valor que varia de -1 (correlação negativa perfeita) a 1


(correlação positiva perfeita) e fornece um indicativo da relação entre
duas variáveis
( )( )
1∑
n
Xi − X Yi − Y
corr(X, Y) =
n SX SY
i=1

• Desenvolveremos a relação linear entre variáveis

21
Variáveis Quantitativas - Gráficos de Dispersão

É possível descrever o tipo de relação entre as variáveis?

• Duas variáveis são correlacionadas quando uma esta relacionada à


outra de alguma maneira
• A verificação da correlação pode ser realizada via um Gráfico de
Dispersão
• Plotando os valores de cada observação em dois eixos, onde cada
eixo corresponde a uma das variáveis
• O Gráfico de Dispersão permite a verificação visual de algum tipo de
relação entre as variáveis

22
Variáveis Quantitativas - Gráficos de Dispersão
6

3
y

−3

−2 −1 0 1 2
x 23
Variáveis Quantitativas - Gráficos de Dispersão

0
y

−3

−6
−2 −1 0 1 2
x 24
Variáveis Quantitativas - Gráficos de Dispersão

1
y

−1

−2

−3
−2 −1 0 1 2
x 25
Variáveis Quantitativas - Gráficos de Dispersão

−1 −0.9 −0.7

−0.4 0 0.4

0.7 0.9 1

26
Variáveis Quantitativas - Histograma

• Resultados de um Teste Padronizado


Sujeito Pontuação Sujeito Pontuação
1 88 11 95
2 103 12 90
3 111 13 92
4 77 14 101
5 104 15 110
6 105 16 99
7 94 ··· ···
8 95 198 90
9 94 199 102
10 91 200 79
27
Variáveis Quantitativas - Histograma

• Primeira classe: (70; 80]


• Segunda classe: (80; 90]
• Terceira classe: (90; 100]
• E assim por diante

28
Variáveis Quantitativas - Histograma

• Distribuição de Frequências da Pontuação no Teste


Classes Frequência
Absoluta (fi )
(70; 80] 5
(80; 90] 31
(90; 100] 81
(100; 110] 56
(110; 120] 20
(120; 130] 7
Total 200
• Nesta organização, temos perda de informação dos dados originais
29
Variáveis Quantitativas - Histograma

75
Frequência

50

25

0
70 80 90 100 110 120 130
Pontuação no Teste 30
Variáveis Quantitativas - Histograma

40

30
Frequência

20

10

0
70 75 80 85 90 95 100 105 110 115 120 125 130
Pontuação no Teste 31
Frequência

0
5
10
15

70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
Variáveis Quantitativas - Histograma

102
103
104
105
106
107
108
109
110
Pontuação no Teste

111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
32
Variáveis Quantitativas - Ramo e Folhas

7 | 13789
8 | 1223456667788888899999999
9 | 00000011111112222222233334444444555555555555555666666677777777888888
10 | 00000000111111222222333333344444445555555666666777778889999
11 | 000001123444445666777788
12 | 0111245
13 | 0

33
Variáveis Quantitativas - Boxplot

Resumo dos Cinco Números:

• Mínimo: menor valor presente na amostra (Min)


• Primeiro Quartil: valor que divide os primeiros 25% da amostra dos
75% restantes (Q1 )
• Mediana: valor que divide a amostra em exatos 50% (Xm )
• Terceiro Quartil: valor que divide os primeiros 75% da amostra dos
25% restantes (Q3 )
• Máximo: maior valor presente na amostra (Max)
• Desvio Interquartílico: é a diferença entre Q3 e Q1 (DIQ)

34
Variáveis Quantitativas - Boxplot

Resumo dos Cinco Números

25% 25% 25% 25%

Min Q1 Xm Q3 Max

35
Variáveis Quantitativas - Boxplot

Outlier
120 Q3 + 1,5DIQ

Q3
90 100

Xm
Q1
80

Q1 − 1,5DIQ
70

36
Variáveis Quantitativas - Boxplot

Introdução à Estatística e Probabilidade


Peso (kg) 100

80

60

40

37
Variáveis Quantitativas - Boxplot

Introdução à Estatística e Probabilidade


Peso (kg) 100

80

60

40
Feminino Masculino
Gênero 38
Variáveis Quantitativas - Boxplot

• Outliers são observações atípicas, afastadas da maioria dos outros


dados
• Estas observações devem ser analisadas com mais cuidado
• Por que são tão diferentes? Algo incomum ou interessante está
ocorrendo? São erros de observação?

39
Gráficos Problemáticos

39
Gráficos Problemáticos

• Um ou mais eixos sem identificação


• Não começar os eixos no zero para exagerar tendências
• Mudanças nas identificações dos eixos
• Unidades que levem à interpretação errada
• Usar informações erradas

40
Gráficos Problemáticos

1. A mensagem do gráfico está claramente informada?


2. O propósito ou o título do gráfico estão evidentes?
3. A fonte dos dados está reportada no gráfico ou no texto que o
acompanha?
4. A informação vem de uma fonte crível?
5. Tudo está claramente identificado, sem ambiguidade?

41
Gráficos Problemáticos

6. Os eixos começam em zero ou não?


7. Os eixos mantém uma escala constante?
8. Há algum intervalo faltante nos números dos eixos?
9. No caso de dados financeiros, os números foram ajustados pela
inflação?
10. Há alguma informação no gráfico que possa levar a algum engano?

42
Gráficos
EST0142 - Estatística Descritiva

Marcus Nunes
https://marcusnunes.me/

Universidade Federal do Rio Grande do Norte

Você também pode gostar