Você está na página 1de 42

2.

Gráficos

0
 As tabelas de frequências e as representações gráficas são duas formas de
apresentar a informação de forma ordenada.

 A leitura das tabelas, a síntese de informação que elas contêm é por vezes difícil.
Uma distribuição estatística pode ser descrita de uma forma bastante mais simples
graficamente.

 Uma representação gráfica aparece como um meio de síntese e de estudo


extremamente eficaz, devendo esta ser simples, clara e verdadeira.

 Para uma análise mais detalhada as tabelas podem ser preferíveis aos gráficos.

1
Uma imagem vale
por mil palavras

2
Dados
Tabela

Gráfico

Objetivo: facilitar a transmissão


da informação! Quanto mais simples
melhor!
Informação
3
Gráficos

 Gráfico de linhas  Gráfico de barras

4
 Gráfico polar  Gráfico de dispersão

5
 Pictograma

6
 Gráfico circular ou em anel

o Estes gráficos devem ser usados com proporções ou percentagens.

o Podem indicar valores absolutos, desde que indiquem as proporções em primeiro


plano.

o Os setores ou aneis devem ser substanciais. Demasiados setores ou aneis resultam em


porções impossíveis de comparar ou de detetar.

7
 Gráfico tridimensional Gráficos enganadores

Use gráficos tridimensionais só se se a


terceira dimensão adicionar alguma
informação. O uso de três dimensões só
adiciona complexidade ao gráfico. A 3ª
dimensão serve apenas para trazer confusão e
não informação. Serve para confundir a
perceção da informação.

Para confundir no caso do gráfico em torta


representado, a fatia que se quer realçar
coloca-se à frente, aumenta-se o quanto
possível a altura, e inclina-se a torta o
máximo para trás.

8
 Gráfico de áreas tridimensional

Cuidado. Os gráficos
devem transmitir
informação.

9
Eixo dos y truncado

Rentabilidade de diversos tipos de carteiras. Se o eixo dos y não se inicia no zero (eixo truncado)
cria-se a ilusão de que as diferenças entre os valores são maiores do que realmente são. Num gráfico
de barras a informação é transmitida pela proporcionalidade entre a altura das barras.
10
Escala incorreta

Gráfico retirado do relatório anual de uma grande companhia automobilística japonesa. As


distâncias na escala horizontal não coincidem com os valores de tempo (em anos), e passam
uma impressão de variação distorcida. O tempo entre a primeira barra e a terceira barra equivale a
dez anos. Logo a barra do meio, colocada igualmente espaçada entre as duas outras barras, deveria
representar o valor do meio, ou seja, de cinco anos. No entanto, a barra do meio representa seis anos.
Esta barra deveria ser colocada ligeiramente para a direita, mais próximo à barra dos dez anos.
Além disso, o eixo dos y está truncado.

11
O gráfico dá a impressão que as empresas atingiram o zero e não valem mais nada.
Na escala horizontal as magnitudes variam, pois divide o tempo analisado em três períodos:
março a outubro (7 meses), outubro a dezembro (2 meses), e dezembro a março (3 meses). As
divisões não apresentam tamanhos iguais e nem denotam o mesmo período de tempo.
Caso este gráfico estivesse representado com um escala de tempo coerente, poder-se-ia notar uma
tendência de queda muito mais acentuada que a mostrada.

12
Gráficos enganadores

O uso de figuras substituindo as barras


distorce a perceção visual da quantidade
sendo representada. Geralmente é a altura
da figura que está representando a medida,
mas aumentando a área distorce a
perceção.
Um gráfico que mostra uma figura
enorme ao lado de uma minúscula pode
sugerir incorretamente uma diferença
muito maior da que realmente é, mas, no
entanto, é só a altura que está sendo
comparada.

13
Tipos de gráficos mais comuns

 Gráfico de Barras

 Histograma

 Caixa de bigodes (boxplot)

 Diagrama de dispersão (scatterplot)

 Gráfico circular

 Diagrama de Pareto

14
Gráfico de Barras
Variáveis qualitativas Variáveis numéricas discretas

15
Esquema geral de uma tabela de frequências

ni → Frequência absoluta do subconjunto associado à modalidade M i .


ni
f i  → Frequência relativa, sendo n o número total de efetivos.
n
j
N j  ni  Frequência absoluta acumulada. Só tem sentido em variáveis numéricas ou ordinais.

i 1
j Nj
Fj   fi   Frequência relativa acumulada. Só tem sentido em variáveis numéricas ou
i 1 n
ordinais.
16
Gráfico de barras e curva cumulativa
Variáveis numéricas discretas, ordinais ou nominais

X  número de indivíduos por agregado doméstico

X Efect. Freq. Efect. acumulados Freq. acumuladas


1 1138 0, 0298 1138 0, 0298
2 3886 0, 1016 5024 0, 1314
3 6190 0, 1618 11214 0, 2932
4 8272 0, 2163 19486 0, 5095
5 9120 0, 2385 28606 0, 7479
6 9640 0, 2521 38246 1
Total: 38246 1

17
Gráfico de barras

Nº de indivíduos por agregado


doméstico
Frequências observadas
0,3000
0,2385 0,2521
0,2500 0,2163
0,2000 0,1618
0,1500
0,1016
0,1000
0,0500 0,0298
0,0000
1 2 3 4 5 6
Nº de indivíduos

18
Gráfico de frequências acumuladas ou curva cumulativa

19
Histograma e curva cumulativa
Variáveis numéricas contínuas

X  peso em mg de um cigarro "SG Filtro"


Tabela:

20
Histograma e Polígono de Frequências

Peso em mg de um cigarro "SG Filtro"

0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
750 770 790 810 830 850 870 890 910
Peso em mg de um cigarro

21
Gráfico de frequências acumuladas ou curva cumulativa

Frequências acumuladas Peso em mg de um cigarro "SG Filtro"

0,8

0,6

0,4

0,2

0
760 780 800 820 840 860 880 900 920
Peso em mg

22
Construção dum histograma

 Se se considerar um número muito elevado de classes - grandes flutuações

 Se se considerar um número limitado de classes – perda de informação

 Regra geral, escolhe-se a amplitude das classes de forma a que pequenas variações do
número de classes não altere de forma significativa a forma da distribuição

 Um histograma é um diagrama de áreas e não um gráfico de barras

23
Exemplo:

X  Salário mensal dos trabalhadores de uma empresa

24
Suponhamos agora que se dispõe de informação que nos permite decompor as classes de maior
amplitude de forma a obtermos sete classes de amplitudes iguais

25
Os gráficos devem
transmitir
corretamente a
informação

26
Num histograma cada retângulo tem base proporcional à amplitude da classe respetiva e altura dada
f
por hi  k i (para k  0 ), donde a área ser igual a hi  ai  k  f i . A área de cada retângulo é
ai
proporcional à frequência da classe respetiva. Se se tomar k  n , a área total é n, se se tomar k  1,
a área total toma o valor 1.
27
28
29
Caixa de bigodes (Boxplot)
Descrição mais pormenorizada a ser efetuada posterioriormente

30
Y variável dependente

X variável independente

Permite comparar uma variável quantitativa (variável dependente) com uma variável que toma um
número discreto de valores (variável independente)

31
Diagrama de dispersão (scatterplot)
Y variável dependente

X variável independente

Permite comparar o comportamento conjunto de duas variáveis quantitativas.

32
Representação de dados nominais

Gráfico circular

X  Preferencia clubística numa amostra de 100 habitantes de Barcelos

33
Diagrama de Pareto

 Importante representação gráfica de variáveis nominais. Largamente aplicado na resolução de


problemas de qualidade.

 Gráfico de barras ordenadas em sentido decrescente por frequência. Existem duas escalas num
diagrama de Pareto.

Permite identificar prioridades na tomada de decisões, determinar causas mais frequentes,


identificar os melhores e piores desempenhos, determinar causas mais frequentes. Ajuda a
identificar o reduzido número de causas que estão por detrás de uma grande parte dos problemas
(exemplo: deteção das causas que dão origem a 80% dos defeitos).

34
Distribuição de peças segundo o tipo de defeito: A, B, C, D ou E.

35
Mais gráficos enganadores

 Exemplo de gráfico enganador que nem sequer é tecnicamente correto, com


alteração da escala dentro do mesmo eixo. Qual a intenção de quem o representou?

36
 Magnitudes variam em cada uma das escalas horizontal e vertical.

37
 Este exemplo leva a questionar as intenções do Wall Street Journal e da Fox News em
transmitirem informação. Todos são valores anuais exceto o valor 23.8% que
representa a média para três anos (avg).

38
 Gráfico tecnicamente incorreto. A soma ultrapassa 100%.

39
 Gráficos com duas escalas, ilustrando duas variáveis diferentes. O problema surge
quando se colocam duas medidas relacionadas entre si no mesmo gráfico, em escalas
truncadas (em que as duas escalas estão distorcidas em proporções diferentes).
Assim, a desinformação se estabelece tanto na comparação entre os anos da mesma
variável mas essencialmente na comparação entre as duas variáveis.

Gráfico do relatório social anual de uma grande empresa brasileira, mostrando a evolução
da reciclagem do seu lixo. A escala da esquerda é da quantidade de lixo reciclado, e a escala
da direita mostra a percentagem em relação ao total de lixo. Ambas as escalas não se
iniciam no zero.
40
 Gráficos sem números

Curva para publicitar os negócios da agência publicitária de ano para ano

41

Você também pode gostar