Você está na página 1de 49

Estatística descritiva

Prof. Dr. Rogers Barros de Paula


Dados amostrais isolados (desagregados, não
agrupados)

110 120 129 141 101 107 107 121 119 115

115 94 101 141 93 103 121 118 122 128

107 105 103 133 121 91 126 127 135 123

109 110 131 111 114 132 104 119 113 116

119 111 124 106 118 102 119 101 101 118
Dados amostrais ordenados 𝑥𝑖

91 93 94 101 101 101 101 102 103 103

104 105 106 107 107 107 109 110 110 111

111 113 114 115 115 116 118 118 118 119

119 119 119 120 121 121 121 122 123 124

126 127 128 129 131 132 133 135 141 141
Média e variância amostral
𝑛
1
𝑥ҧ = ෍ 𝑥𝑖
𝑛
𝑖=1

𝑛
1
𝑠2 = ෍ 𝑥𝑖 − 𝑥ҧ 2
𝑛−1
𝑖=1

𝑛 𝑛 2
1 2 1 1 1
𝑠2 = ෍ 𝑥𝑖 − ෍ 𝑥𝑖 𝑚𝑎𝑠 = 𝑛.
𝑛−1 𝑛 𝑛 𝑛²
𝑖=1 𝑖=1
Média e variância amostral
𝑛
1
𝑥ҧ = ෍ 𝑥𝑖
𝑛
𝑖=1

𝑛
1
𝑠2 = ෍ 𝑥𝑖 − 𝑥ҧ 2
𝑛−1
𝑖=1

𝑛 𝑛 2
1 2 1 1 1
𝑠2 = ෍ 𝑥𝑖 − ෍ 𝑥𝑖 𝑚𝑎𝑠 = 𝑛.
𝑛−1 𝑛 𝑛 𝑛²
𝑖=1 𝑖=1
Média e variância amostral
𝑛
1
𝑥ҧ = ෍ 𝑥𝑖
𝑛
𝑖=1

𝑛
1
𝑠2 = ෍ 𝑥𝑖 − 𝑥ҧ 2
𝑛−1
𝑖=1

𝑛 𝑛 2
1 2 1 1 1
𝑠2 = ෍ 𝑥𝑖 − ෍ 𝑥𝑖 𝑚𝑎𝑠 = 𝑛.
𝑛−1 𝑛 𝑛 𝑛²
𝑖=1 𝑖=1
Média e variância amostral
𝑛
1
𝑥ҧ = ෍ 𝑥𝑖
𝑛
𝑖=1

𝑛
1
𝑠2 = ෍ 𝑥𝑖 − 𝑥ҧ 2
𝑛−1
𝑖=1

𝑛 𝑛 2 𝑛 2 𝑛 2
1 2 1 1 1
𝑠2 = ෍ 𝑥𝑖 − ෍ 𝑥𝑖 𝑒𝑛𝑡ã𝑜 ෍ 𝑥𝑖 = 𝑛. ෍ 𝑥𝑖
𝑛−1 𝑛 𝑛 𝑛
𝑖=1 𝑖=1 𝑖=1 𝑖=1
Média e variância amostral
𝑛
1
𝑥ҧ = ෍ 𝑥𝑖
𝑛
𝑖=1

𝑛
1
𝑠2 = ෍ 𝑥𝑖 − 𝑥ҧ 2
𝑛−1
𝑖=1

𝑛 𝑛 2 𝑛 2 𝑛 2
1 2 1 1 1
𝑠2 = ෍ 𝑥𝑖 − ෍ 𝑥𝑖 𝑒𝑛𝑡ã𝑜 ෍ 𝑥𝑖 = 𝑛. ෍ 𝑥𝑖
𝑛−1 𝑛 𝑛 𝑛
𝑖=1 𝑖=1 𝑖=1 𝑖=1
Média e variância amostral
𝑛
1
𝑥ҧ = ෍ 𝑥𝑖
𝑛
𝑖=1

𝑛
1
𝑠2 = ෍ 𝑥𝑖 − 𝑥ҧ 2
𝑛−1
𝑖=1

𝑛 𝑛 2 𝑛
1 2 1 1
𝑠2 = ෍ 𝑥𝑖 − ෍ 𝑥𝑖 ⇔ 𝑠2 = ෍ 𝑥𝑖2 − 𝑛𝑥ҧ 2
𝑛−1 𝑛 𝑛−1
𝑖=1 𝑖=1 𝑖=1
Média e variância amostral
1 1
• 𝑥ҧ = 91 + 93 + ⋯ + 141 = 5755 = 115,1
50 50

1
• 𝑠2 = (91 − 115,1)2 +(93 − 115,1)2 + ⋯ + (141 − 115,1)2
50−1

91 93 94 101 101 101 101 102 103 103


• 𝑠 2 ≈ 143,43
104 105 106 107 107 107 109 110 110 111

111 113 114 115 115 116 118 118 118 119

119 119 119 120 121 121 121 122 123 124

126 127 128 129 131 132 133 135 141 141
Variância amostral e desvio padrão amostral
• 𝑠 2 ≈ 143,43
• 𝑠 = 𝑠 2 → 𝑠 = 143,43 = 11,97

91 93 94 101 101 101 101 102 103 103

104 105 106 107 107 107 109 110 110 111

111 113 114 115 115 116 118 118 118 119

119 119 119 120 121 121 121 122 123 124

126 127 128 129 131 132 133 135 141 141
Dados amostrais sujeitos a repetições
(afetados pela frequência)

91 93 94 101 101 101 101 102 103 103

104 105 106 107 107 107 109 110 110 111

111 113 114 115 115 116 118 118 118 119

119 119 119 120 121 121 121 122 123 124

126 127 128 129 131 132 133 135 141 141
Dados amostrais sujeitos a repetições
(afetados pela frequência)

91 93 94 101 101 101 101 102 103 103

104 105 106 107 107 107 109 110 110 111

111 113 114 115 115 116 118 118 118 119

119 119 119 120 121 121 121 122 123 124

126 127 128 129 131 132 133 135 141 141
Observação / Elemento Frequência Absoluta
91 1

Dados amostrais sujeitos 93


94
101
1
1
4

a repetições (afetados 102


103
104
1
2
1

pela frequência) 105


106
107
1
1
3
109 1

• 𝑛𝑖 − 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑑𝑜 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜 𝑥𝑖


110 2
111 2
113 1

• k – número de classes ou agrupamentos 114


115
1
2
116 1
• σ𝑘𝑖=1 𝑛𝑖 = 𝑛 118
119
3
4
𝑛 120 1
1 121 3
𝑥ҧ = ෍ 𝑥𝑖 . 𝑛𝑖 122 1
𝑛 123
124
1
1
𝑖=1 126 1
127 1
128 1
𝑛 129 1
1 131 1
𝑠2 = ෍ 𝑥𝑖 − 𝑥ҧ 2 . 𝑛𝑖 132 1

𝑛−1 133
135
1
1
𝑖=1 141 2
Soma 50
Dados amostrais agrupados em classes de
frequência

91 93 94 101 101 101 101 102 103 103

104 105 106 107 107 107 109 110 110 111

111 113 114 115 115 116 118 118 118 119

119 119 119 120 121 121 121 122 123 124

126 127 128 129 131 132 133 135 141 141
Dados amostrais agrupados em classes de
frequência

91 93 94 101 101 101 101 102 103 103

104 105 106 107 107 107 109 110 110 111

111 113 114 115 115 116 118 118 118 119

119 119 119 120 121 121 121 122 123 124

126 127 128 129 131 132 133 135 141 141
Dados amostrais agrupados em classes de
frequência (𝐴)𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 (𝑥𝑖 𝑚á𝑥. − 𝑥𝑖 𝑚í𝑛. )

91 93 94 101 101 101 101 102 103 103

104 105 106 107 107 107 109 110 110 111

111 113 114 115 115 116 118 118 118 119

119 119 119 120 121 121 121 122 123 124

126 127 128 129 131 132 133 135 141 141
Dados amostrais agrupados em classes de
frequência – número (𝑘) de classes
• Fórmula de Sturges: 𝑘 = 1 + 3,22. log 𝑛
• 𝑘 = 1 + 3,22. log 50 ≈ 6,47068 → 7 𝑐𝑙𝑎𝑠𝑠𝑒𝑠

• Alternativa: 𝑘 = 𝑛 = 50 ≈ 7,07 → 7 𝑐𝑙𝑎𝑠𝑠𝑒𝑠


Dados amostrais agrupados em classes de
frequência – número (𝑘) de classes
• Não se trabalha com classes vazias.
Dados amostrais agrupados em classes de
frequência – amplitude (ℎ) de classes
𝐴
• Amplitude de classe ℎ =
𝑘
• ℎ é a diferença entre os limites inferiores (ou superiores) de duas
classes contíguas.
𝐴 50
•ℎ= = ≈7
𝑘 7
Dados amostrais agrupados em classes de
frequência
Frequência Frequência absoluta Frequência relativa
Classes absoluta acumulada Frequência relativa acumulada
90,5-97,5 3 3 0,06 0,06
97,5-104,5 8 11 0,16 0,22
104,5-111,5 10 21 0,2 0,42
111,5-118,5 8 29 0,16 0,58
118,5-125,5 11 40 0,22 0,8
125,5-132,5 6 46 0,12 0,92
132,5-139,5 2 48 0,04 0,96
139,5-146,5 2 50 0,04 1
n 50 1
Dados amostrais agrupados em classes de frequência –
Histograma e polígono de frequências
12

10

0
0-90,5 90,5-97,5 97,5-104,5 104,5-111,5 111,5-118,5 118,5-125,5 125,5-132,5 132,5-139,5 139,5-146,5 146,5-200
Dados amostrais agrupados em classes de frequência –
Ogiva
60

50

40

30

20

10

0
0-90,5 90,5-97,5 97,5-104,5 104,5-111,5 111,5-118,5 118,5-125,5 125,5-132,5 132,5-139,5 139,5-146,5
Média para dados agrupados 𝑛
1
𝑥ҧ = ෍ 𝑥𝑖 . 𝑛𝑖
𝑛
𝑖=1

1
𝑥ҧ = . 5764
Classes Ponto médio Frequência absoluta 𝒑𝒎 𝒇𝒂 50
90,5-97,5 94 3 282
97,5-104,5 101 8 808 𝑥ҧ =115,28
104,5-111,5 108 10 1080
111,5-118,5 115 8 920
118,5-125,5 122 11 1342
125,5-132,5 129 6 774
132,5-139,5 136 2 272
139,5-146,5 143 2 286
n 50 5.764
Mediana (Me)

91 93 94 101 101 101 101 102 103 103

104 105 106 107 107 107 109 110 110 111

111 113 114 115 115 116 118 118 118 119

119 119 119 120 121 121 121 122 123 124

126 127 128 129 131 132 133 135 141 141
Mediana (Me)

91 93 94 101 101 101 101 102 103 103

104 105 106 107 107 107 109 110 110 111

111 113 114 115 𝒙𝟐𝟓 𝒙𝟐𝟔 118 118 118 119

119 119 119 120 121 121 121 122 123 124

126 127 128 129 131 132 133 135 141 141
115+116
Mediana (𝑀𝑒 = = 115,5)
2

91 93 94 101 101 101 101 102 103 103

104 105 106 107 107 107 109 110 110 111

111 113 114 115 115 116 118 118 118 119

119 119 119 120 121 121 121 122 123 124

126 127 128 129 131 132 133 135 141 141
E a mediana para dados agregados?

Frequência relativa
Classes Frequência relativa acumulada
90,5-97,5 0,06 0,06
97,5-104,5 0,16 0,22
104,5-111,5 0,2 0,42
111,5-118,5 0,16 0,58
118,5-125,5 0,22 0,8
125,5-132,5 0,12 0,92
132,5-139,5 0,04 0,96
139,5-146,5 0,04 1
n 1
E a mediana para dados agregados?
12

10

0,06 0,16 0,20 0,16


0
0-90,5 90,5-97,5 97,5-104,5 104,5-111,5 111,5-118,5 118,5-125,5 125,5-132,5 132,5-139,5 139,5-146,5 146,5-200
E a mediana para dados agregados?
12

10

0,16
6

0,06 + 0,16 + 0,20 = 0,42


0
0-90,5 90,5-97,5 97,5-104,5 104,5-111,5 111,5-118,5 118,5-125,5 125,5-132,5 132,5-139,5 139,5-146,5 146,5-200
E a mediana para dados agregados?
12

10

0,080,08
6

0
0-90,5 90,5-97,5 97,5-104,5 104,5-111,5 111,5-118,5 118,5-125,5 125,5-132,5 132,5-139,5 139,5-146,5 146,5-200
E a mediana para dados agregados?

• [111,5 − 118,5[
• Mediana é 115.
• ℎ. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,16
• 𝑥. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,08
• 7. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,16
• 𝑥. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,08
0,16 0,8
• =
7 𝑥
• 𝑥 = 3,5 portanto 𝑀𝑒 = 111,5 + 3,5 = 115
E a mediana para dados agregados?

• [111,5 − 118,5[
• Mediana é 115.
• ℎ. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,16
• 𝑥. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,08
• 7. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,16
• 𝑥. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,08
0,16 0,8
• =
7 𝑥
• 𝑥 = 3,5 portanto 𝑀𝑒 = 111,5 + 3,5 = 115
E a mediana para dados agregados?

• [111,5 − 118,5[
• Mediana é 115.
• ℎ. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,16
• 𝑥. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,08
• 7. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,16
• 𝑥. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,08
0,16 0,8
• =
7 𝑥
• 𝑥 = 3,5 portanto 𝑀𝑒 = 111,5 + 3,5 = 115
E a mediana para dados agregados?

• [111,5 − 118,5[
• Mediana é 115.
• ℎ. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,16
• 𝑥. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,08
• 7. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,16
• 𝑥. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,08
0,16 0,08
• =
7 𝑥
• 𝑥 = 3,5 portanto 𝑀𝑒 = 111,5 + 3,5 = 115
Moda 𝑀𝑜

91 93 94 101 101 101 101 102 103 103

104 105 106 107 107 107 109 110 110 111

111 113 114 115 115 116 118 118 118 119

119 119 119 120 121 121 121 122 123 124

126 127 128 129 131 132 133 135 141 141
E a moda para dados agregados?
• Classe modal
• Moda Bruta (Mo = 122)
Classes Ponto médio Frequência absoluta
90,5-97,5 94 3
97,5-104,5 101 8
104,5-111,5 108 10
111,5-118,5 115 8
118,5-125,5 122 11
125,5-132,5 129 6
132,5-139,5 136 2
139,5-146,5 143 2
n 50
E a moda para dados agregados?
• Karl Pearson – método empírico para distribuições levemente
assimétricas
• 𝑀𝑜 = 3𝑀𝑒 − 2𝑥ҧ
• 𝑀𝑜 = 3 115 − 2(115,28)
• 𝑀𝑜 = 345 − 230,56
• 𝑀𝑜 = 114,44
E a moda para dados agregados? Processo de
Czuber
• A moda divide o intervalo da classe modal em distâncias
proporcionais às diferenças entre a frequência da classe modal com a
frequência das classes subjacentes.
E a moda para dados agregados? Processo de
Czuber
𝑥 Δ1
• =
ℎ−𝑥 Δ2
• Δ1 = 𝑓𝑚𝑜 − 𝑓𝑎𝑛
• Δ2 = 𝑓𝑚𝑜 − 𝑓𝑝
𝑓𝑚𝑜−𝑓𝑎𝑛
•𝑥= .ℎ
2𝑓𝑚𝑜−(𝑓𝑎𝑛+𝑓𝑝)
• 𝑀𝑜 = 𝑙𝑖 + 𝑥
• 𝑀𝑜 = 121,125
E a moda para dados agregados? Processo de
King
• A moda divide o intervalo da classe modal em distâncias
inversamente proporcionais às frequências das classes subjacentes.
E a moda para dados agregados? Processo de
King
𝑥 Δ1
• =
ℎ−𝑥 Δ2
• Δ1 = 𝑓𝑝
• Δ2 = 𝑓𝑎𝑛
𝑓𝑝
•𝑥= .ℎ
(𝑓𝑎𝑛+𝑓𝑝)
• 𝑀𝑜 = 𝑙𝑖 + 𝑥
• 𝑀𝑜 = 121,5
R: Tabela de frequências (dados contínuos)
#################################################################################
# Tabela de Distribuição de frequências para variáveis contínuas: Variável Idade
#################################################################################

# Argumentos para determinar o nº de classes, k


n=length(idade) # nº de observações
n
k=sqrt(n) k
k<-round(k,0) # arredondamento de k para o inteiro superior
# k=6 classes

range(idade) # Menor e maior valores observados


h=(48-20)/k
h<-round(h,0) # Amplitude de cada classe é h=5
h

tab.idade<-table(idade)
df_id<-matrix(0,k+1,3)

colnames(df_id)<-c("Freq absoluta","Freq relativa","Porcent(%)")


rownames(df_id)<-
c("[20;25)","[25;30)","[30;35)","[35;40)","[40;45)","[45;50)","Total")
tab.idade<-table(cut(idade,breaks=c(19.9,24.9,29.9,34.9,39.9,44.9,50)))

df_id[1:k,1]<-tab.idade
df_id[k+1,1]<-length(idade)

for(i in 1:7) {df_id[i, 2]<-df_id[i,1]/n}


for(i in 1:7) {df_id[i, 3]<-df_id[i,2]*100}
39
df_id # Tabela de distribuição de frequencias, em classes.
round(df_id,2)
Distribuição de frequências para a idade do funcionários

Classe de idades Frequência Freq . relativa Porcentagem (%)


20 ⱶ 25 2 0,056 5,56
25 ⱶ 30 6 0,167 16,67
30 ⱶ 35 10 0,278 27,78
35 ⱶ 40 8 0,222 22,22
40 ⱶ 45 8 0,222 22,22
45 ⱶ 50 2 0,056 5,56
Total 36 1,000 100,00

40
4
6
Rotina no R: Histograma e Polígono de frequência
h<-hist(idade,breaks=c(14.9,19.9,24.9,29.9,34.9,39.9,44.9,50,55),xlim=c(15,55),freq=FALSE,ylab="Frequência
relativa",xlab="Idade dos funcionários",main="",col=gray(seq(0.1,1.0,length=7)))
h<-hist(idade,breaks=c(14.9,19.9,24.9,29.9,34.9,39.9,44.9,50,55),xlim=c(15,55),freq=FALSE,ylab="Frequência
relativa",xlab="Idade dos funcionários",main="",col=gray(seq(0.1,1.0,length=7)))
points(h$mids,h$density,"l",lwd=3) # Histograma com polígono de frequência
Frequência relativa

Frequência relativa
0.04

0.04
0.02

0.02
0.00

0.00
20 30 40 50 20 30 40 50

Idade dos funcionários Idade dos funcionários


4
7
Rotina no R: Histograma e Polígono de frequências
h<-hist(idade,breaks=c(14.9,19.9,24.9,29.9,34.9,39.9,44.9,50,55),xlim=c(15,55),freq=FALSE,ylab="Frequência
relativa",xlab="Idade dos funcionários",main="",col=gray(seq(0.1,1.0,length=7)))
h<-hist(idade,breaks=c(14.9,19.9,24.9,29.9,34.9,39.9,44.9,50,55),xlim=c(15,55),freq=FALSE,ylab="Frequência
relativa",xlab="Idade dos funcionários",main="",col=gray(seq(0.1,1.0,length=7)))
points(h$mids,h$density,"l",lwd=3) # Histograma com polígono de frequência
Frequência relativa

Frequência relativa
0.04

0.04
0.02

0.02
0.00

0.00
20 30 40 50 20 30 40 50

Idade dos funcionários Idade dos funcionários


Rotina no R: Ogiva (frequências acumuladas)
f<-c(0,0,2,6,10,8,8,2,0) # Frequências absolutas da Tabela p/ a variável
Idade fac<-cumsum(f)
fac
lim=c(15,19.9,24.9,29.9,34.9,39.9,44.9,50,55)
plot(lim,fac,"l",lwd=3,ylab="Frequência acumulada",xlab="Idade dos funcionários")

35
30
Frequência acumulada

25
20
15
10
5
0

20 30 40 50
43
Idade dos funcionários
Rotina no R: Boxplot (Gráfico em Caixa)
boxplot(idade,main=" ",ylab="Idade dos funcionários")

45
Idade dos funcionários

40
35
30
25
20

44

Você também pode gostar