Você está na página 1de 5

AED – Histogramas e Distribuições de frequências:

Vamos utilizar o conjunto de dados da aula anterior (video_data.txt), com n= 91 observações,analisando


inicialmente a variável work :

> summary(video$work)

Min. 1st Qu. Median Mean 3rd Qu. Max. NA's

0.000 0.000 1.000 7.352 13.250 55.000 3.000

> stem(video$work)
The decimal point is 1 digit(s) to the right of the |
0 | 000000000000000000000000000000000000000000002555556789
1 | 000000000223445555555566689
2 | 000
3|5
4 | 00
5|5

>boxplot(vídeo$work)

Se quisermos ver as frequências observadas para cada valor, ter


> table(video$work)
0 2 5 6 7 8 9 10 12 13 14 15 16 18 19 20 35 40 55
44 1 5 1 1 1 1 9 2 1 2 8 3 1 1 3 1 2 1

Poderíamos então construir uma tabela de distribuição de frequências assim:


Horas de estudo fi fri fr%i Fi FRi
0 |------- 5 45 0,51 51 45 0,51
5 |------- 10 9 0,10 10 54 0,61
10 |------- 15 14 0,16 16 68 0,77
15 |------- 20 13 0,15 15 81 0,92
20 |------- 25 3 0,03 3 84 0,95
25 |------- 30 0 0,00 0 84 0,95
30 |------- 35 0 0,00 0 84 0,95
35 |------- 40 1 0,01 1 85 0,96
40 |------- 45 2 0,02 2 87 0,98
45 |------- 50 0 0,00 0 87 0.98
50 |------- 55 0 0,00 0 87 0,98
55 |------- 60 1 0,01 1 88 0,99*
TOTAL 88 1,00* 100* - -
* Pode não somar 1 (ou 100) devido a arredondamento utilizado.
E teríamos um gráfico para esta tabela de distribuição de frequências denominado Histograma:

Obtido pelo R da seguinte forma:


> hist(video$work,nclass=12,right=F,xlim=c(0,60))

Talvez uma tabela mais adequada fosse:


Horas de estudo fi fri fr%i Fi FRi
0 |------- 5 45 0,51 51 45 0,51
5 |------- 10 9 0,10 10 54 0,61
10 |------- 15 14 0,16 16 68 0,77
15 |------- 20 13 0,15 15 81 0,92
20 |------- 60 7 0,08 8 88 1,00
TOTAL 88 1,00 100 - -

Neste caso, observar que não temos as classes com as amplitudes todas iguais, já que a última classe apresenta uma
amplitude bem maior, igual à 40 horas (diferente das outras classes, que tem amplitude 5 cada uma). Como os
histogramas representam áreas que podem ser comparadas entre si devemos usar o conceito de densidade em cada
classe: densidadei = fi /amplitudei.

Teríamos então:
Horas de estudo fi densidadei
0 |------- 5 0,51 0,51/5 = 0,102
5 |------- 10 0,10 0,10/5 = 0,02
10 |------- 15 0,16 0,16/5 = 0,032
15 |------- 20 0,15 0,15/5 = 0,03
20 |------- 60 0,08 0,08/40 = 0,002
TOTAL 1,00 -
E o histograma correto, equivalente a esta tabela, seria obtido pelo R:
> meio.work<-c(2.5,7.5,12.5,17.5,40)
> fi.work<-c(45,9,14,13,7)
> work.data<-rep(meio.work,fi.work)
> corte<-c(0,5,10,15,20,60)
> hist(work.data,breaks=corte)

E teria o seguinte aspecto, correto:


Agora observe o gráfico abaixo obtido da seguinte tabela:
> table(flike)
flike
nunca muito +ou- pouco não
1 23 46 13 7

Este é também um histograma? Como foi construído?

> barplot(table(flike), main = "Variável 'like' ")


AED: Box-plots e Histogramas – Indicar a correspondência entre eles

(A) (.....)

(B) (.....)

(C)
(.....)

(D) (.....)

(E) (.....)
AED: Histogramas e medidas síntese (sumário)– Indicar a correspondência entre as duas colunas

(A)
média aritmética ( ): 10,2

desvio-padrão (DPX): 1,3

mediana ( ): 10,4

intervalo inter-quartílico (IC): 1,8


(.....)
(B)
média aritmética ( ): 10,1

desvio-padrão (DPX): 2,8

mediana ( ): 10,0

intervalo inter-quartílico (IC): 4,5

(.....)
(C)
média aritmética ( ): 9,9

desvio-padrão (DPX): 2,1

mediana ( ): 9,9

intervalo inter-quartílico (IC): 2,8

(.....)
(D)
média aritmética ( ): 10,2

desvio-padrão (DPX): 4,5

mediana ( ): 11,2

intervalo inter-quartílico (IC): 7,4

(.....)
(E)
média aritmética ( ): 9,7

desvio-padrão (DPX): 13,5

mediana ( ): 4,6

intervalo inter-quartílico (IC): 11,0

(.....)

Você também pode gostar