Escolar Documentos
Profissional Documentos
Cultura Documentos
110 120 129 141 101 107 107 121 119 115
109 110 131 111 114 132 104 119 113 116
119 111 124 106 118 102 119 101 101 118
Dados amostrais ordenados 𝑥𝑖
104 105 106 107 107 107 109 110 110 111
111 113 114 115 115 116 118 118 118 119
119 119 119 120 121 121 121 122 123 124
126 127 128 129 131 132 133 135 141 141
Média e variância amostral
𝑛
1
𝑥ҧ = 𝑥𝑖
𝑛
𝑖=1
𝑛
1
𝑠2 = 𝑥𝑖 − 𝑥ҧ 2
𝑛−1
𝑖=1
𝑛 𝑛 2
1 2 1 1 1
𝑠2 = 𝑥𝑖 − 𝑥𝑖 𝑚𝑎𝑠 = 𝑛.
𝑛−1 𝑛 𝑛 𝑛²
𝑖=1 𝑖=1
Média e variância amostral
𝑛
1
𝑥ҧ = 𝑥𝑖
𝑛
𝑖=1
𝑛
1
𝑠2 = 𝑥𝑖 − 𝑥ҧ 2
𝑛−1
𝑖=1
𝑛 𝑛 2
1 2 1 1 1
𝑠2 = 𝑥𝑖 − 𝑥𝑖 𝑚𝑎𝑠 = 𝑛.
𝑛−1 𝑛 𝑛 𝑛²
𝑖=1 𝑖=1
Média e variância amostral
𝑛
1
𝑥ҧ = 𝑥𝑖
𝑛
𝑖=1
𝑛
1
𝑠2 = 𝑥𝑖 − 𝑥ҧ 2
𝑛−1
𝑖=1
𝑛 𝑛 2
1 2 1 1 1
𝑠2 = 𝑥𝑖 − 𝑥𝑖 𝑚𝑎𝑠 = 𝑛.
𝑛−1 𝑛 𝑛 𝑛²
𝑖=1 𝑖=1
Média e variância amostral
𝑛
1
𝑥ҧ = 𝑥𝑖
𝑛
𝑖=1
𝑛
1
𝑠2 = 𝑥𝑖 − 𝑥ҧ 2
𝑛−1
𝑖=1
𝑛 𝑛 2 𝑛 2 𝑛 2
1 2 1 1 1
𝑠2 = 𝑥𝑖 − 𝑥𝑖 𝑒𝑛𝑡ã𝑜 𝑥𝑖 = 𝑛. 𝑥𝑖
𝑛−1 𝑛 𝑛 𝑛
𝑖=1 𝑖=1 𝑖=1 𝑖=1
Média e variância amostral
𝑛
1
𝑥ҧ = 𝑥𝑖
𝑛
𝑖=1
𝑛
1
𝑠2 = 𝑥𝑖 − 𝑥ҧ 2
𝑛−1
𝑖=1
𝑛 𝑛 2 𝑛 2 𝑛 2
1 2 1 1 1
𝑠2 = 𝑥𝑖 − 𝑥𝑖 𝑒𝑛𝑡ã𝑜 𝑥𝑖 = 𝑛. 𝑥𝑖
𝑛−1 𝑛 𝑛 𝑛
𝑖=1 𝑖=1 𝑖=1 𝑖=1
Média e variância amostral
𝑛
1
𝑥ҧ = 𝑥𝑖
𝑛
𝑖=1
𝑛
1
𝑠2 = 𝑥𝑖 − 𝑥ҧ 2
𝑛−1
𝑖=1
𝑛 𝑛 2 𝑛
1 2 1 1
𝑠2 = 𝑥𝑖 − 𝑥𝑖 ⇔ 𝑠2 = 𝑥𝑖2 − 𝑛𝑥ҧ 2
𝑛−1 𝑛 𝑛−1
𝑖=1 𝑖=1 𝑖=1
Média e variância amostral
1 1
• 𝑥ҧ = 91 + 93 + ⋯ + 141 = 5755 = 115,1
50 50
1
• 𝑠2 = (91 − 115,1)2 +(93 − 115,1)2 + ⋯ + (141 − 115,1)2
50−1
111 113 114 115 115 116 118 118 118 119
119 119 119 120 121 121 121 122 123 124
126 127 128 129 131 132 133 135 141 141
Variância amostral e desvio padrão amostral
• 𝑠 2 ≈ 143,43
• 𝑠 = 𝑠 2 → 𝑠 = 143,43 = 11,97
104 105 106 107 107 107 109 110 110 111
111 113 114 115 115 116 118 118 118 119
119 119 119 120 121 121 121 122 123 124
126 127 128 129 131 132 133 135 141 141
Dados amostrais sujeitos a repetições
(afetados pela frequência)
104 105 106 107 107 107 109 110 110 111
111 113 114 115 115 116 118 118 118 119
119 119 119 120 121 121 121 122 123 124
126 127 128 129 131 132 133 135 141 141
Dados amostrais sujeitos a repetições
(afetados pela frequência)
104 105 106 107 107 107 109 110 110 111
111 113 114 115 115 116 118 118 118 119
119 119 119 120 121 121 121 122 123 124
126 127 128 129 131 132 133 135 141 141
Observação / Elemento Frequência Absoluta
91 1
𝑛−1 133
135
1
1
𝑖=1 141 2
Soma 50
Dados amostrais agrupados em classes de
frequência
104 105 106 107 107 107 109 110 110 111
111 113 114 115 115 116 118 118 118 119
119 119 119 120 121 121 121 122 123 124
126 127 128 129 131 132 133 135 141 141
Dados amostrais agrupados em classes de
frequência
104 105 106 107 107 107 109 110 110 111
111 113 114 115 115 116 118 118 118 119
119 119 119 120 121 121 121 122 123 124
126 127 128 129 131 132 133 135 141 141
Dados amostrais agrupados em classes de
frequência (𝐴)𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 (𝑥𝑖 𝑚á𝑥. − 𝑥𝑖 𝑚í𝑛. )
104 105 106 107 107 107 109 110 110 111
111 113 114 115 115 116 118 118 118 119
119 119 119 120 121 121 121 122 123 124
126 127 128 129 131 132 133 135 141 141
Dados amostrais agrupados em classes de
frequência – número (𝑘) de classes
• Fórmula de Sturges: 𝑘 = 1 + 3,22. log 𝑛
• 𝑘 = 1 + 3,22. log 50 ≈ 6,47068 → 7 𝑐𝑙𝑎𝑠𝑠𝑒𝑠
10
0
0-90,5 90,5-97,5 97,5-104,5 104,5-111,5 111,5-118,5 118,5-125,5 125,5-132,5 132,5-139,5 139,5-146,5 146,5-200
Dados amostrais agrupados em classes de frequência –
Ogiva
60
50
40
30
20
10
0
0-90,5 90,5-97,5 97,5-104,5 104,5-111,5 111,5-118,5 118,5-125,5 125,5-132,5 132,5-139,5 139,5-146,5
Média para dados agrupados 𝑛
1
𝑥ҧ = 𝑥𝑖 . 𝑛𝑖
𝑛
𝑖=1
1
𝑥ҧ = . 5764
Classes Ponto médio Frequência absoluta 𝒑𝒎 𝒇𝒂 50
90,5-97,5 94 3 282
97,5-104,5 101 8 808 𝑥ҧ =115,28
104,5-111,5 108 10 1080
111,5-118,5 115 8 920
118,5-125,5 122 11 1342
125,5-132,5 129 6 774
132,5-139,5 136 2 272
139,5-146,5 143 2 286
n 50 5.764
Mediana (Me)
104 105 106 107 107 107 109 110 110 111
111 113 114 115 115 116 118 118 118 119
119 119 119 120 121 121 121 122 123 124
126 127 128 129 131 132 133 135 141 141
Mediana (Me)
104 105 106 107 107 107 109 110 110 111
111 113 114 115 𝒙𝟐𝟓 𝒙𝟐𝟔 118 118 118 119
119 119 119 120 121 121 121 122 123 124
126 127 128 129 131 132 133 135 141 141
115+116
Mediana (𝑀𝑒 = = 115,5)
2
104 105 106 107 107 107 109 110 110 111
111 113 114 115 115 116 118 118 118 119
119 119 119 120 121 121 121 122 123 124
126 127 128 129 131 132 133 135 141 141
E a mediana para dados agregados?
Frequência relativa
Classes Frequência relativa acumulada
90,5-97,5 0,06 0,06
97,5-104,5 0,16 0,22
104,5-111,5 0,2 0,42
111,5-118,5 0,16 0,58
118,5-125,5 0,22 0,8
125,5-132,5 0,12 0,92
132,5-139,5 0,04 0,96
139,5-146,5 0,04 1
n 1
E a mediana para dados agregados?
12
10
10
0,16
6
10
0,080,08
6
0
0-90,5 90,5-97,5 97,5-104,5 104,5-111,5 111,5-118,5 118,5-125,5 125,5-132,5 132,5-139,5 139,5-146,5 146,5-200
E a mediana para dados agregados?
• [111,5 − 118,5[
• Mediana é 115.
• ℎ. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,16
• 𝑥. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,08
• 7. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,16
• 𝑥. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,08
0,16 0,8
• =
7 𝑥
• 𝑥 = 3,5 portanto 𝑀𝑒 = 111,5 + 3,5 = 115
E a mediana para dados agregados?
• [111,5 − 118,5[
• Mediana é 115.
• ℎ. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,16
• 𝑥. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,08
• 7. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,16
• 𝑥. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,08
0,16 0,8
• =
7 𝑥
• 𝑥 = 3,5 portanto 𝑀𝑒 = 111,5 + 3,5 = 115
E a mediana para dados agregados?
• [111,5 − 118,5[
• Mediana é 115.
• ℎ. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,16
• 𝑥. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,08
• 7. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,16
• 𝑥. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,08
0,16 0,8
• =
7 𝑥
• 𝑥 = 3,5 portanto 𝑀𝑒 = 111,5 + 3,5 = 115
E a mediana para dados agregados?
• [111,5 − 118,5[
• Mediana é 115.
• ℎ. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,16
• 𝑥. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,08
• 7. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,16
• 𝑥. 𝑎𝑙𝑡𝑢𝑟𝑎 = 0,08
0,16 0,08
• =
7 𝑥
• 𝑥 = 3,5 portanto 𝑀𝑒 = 111,5 + 3,5 = 115
Moda 𝑀𝑜
104 105 106 107 107 107 109 110 110 111
111 113 114 115 115 116 118 118 118 119
119 119 119 120 121 121 121 122 123 124
126 127 128 129 131 132 133 135 141 141
E a moda para dados agregados?
• Classe modal
• Moda Bruta (Mo = 122)
Classes Ponto médio Frequência absoluta
90,5-97,5 94 3
97,5-104,5 101 8
104,5-111,5 108 10
111,5-118,5 115 8
118,5-125,5 122 11
125,5-132,5 129 6
132,5-139,5 136 2
139,5-146,5 143 2
n 50
E a moda para dados agregados?
• Karl Pearson – método empírico para distribuições levemente
assimétricas
• 𝑀𝑜 = 3𝑀𝑒 − 2𝑥ҧ
• 𝑀𝑜 = 3 115 − 2(115,28)
• 𝑀𝑜 = 345 − 230,56
• 𝑀𝑜 = 114,44
E a moda para dados agregados? Processo de
Czuber
• A moda divide o intervalo da classe modal em distâncias
proporcionais às diferenças entre a frequência da classe modal com a
frequência das classes subjacentes.
E a moda para dados agregados? Processo de
Czuber
𝑥 Δ1
• =
ℎ−𝑥 Δ2
• Δ1 = 𝑓𝑚𝑜 − 𝑓𝑎𝑛
• Δ2 = 𝑓𝑚𝑜 − 𝑓𝑝
𝑓𝑚𝑜−𝑓𝑎𝑛
•𝑥= .ℎ
2𝑓𝑚𝑜−(𝑓𝑎𝑛+𝑓𝑝)
• 𝑀𝑜 = 𝑙𝑖 + 𝑥
• 𝑀𝑜 = 121,125
E a moda para dados agregados? Processo de
King
• A moda divide o intervalo da classe modal em distâncias
inversamente proporcionais às frequências das classes subjacentes.
E a moda para dados agregados? Processo de
King
𝑥 Δ1
• =
ℎ−𝑥 Δ2
• Δ1 = 𝑓𝑝
• Δ2 = 𝑓𝑎𝑛
𝑓𝑝
•𝑥= .ℎ
(𝑓𝑎𝑛+𝑓𝑝)
• 𝑀𝑜 = 𝑙𝑖 + 𝑥
• 𝑀𝑜 = 121,5
R: Tabela de frequências (dados contínuos)
#################################################################################
# Tabela de Distribuição de frequências para variáveis contínuas: Variável Idade
#################################################################################
tab.idade<-table(idade)
df_id<-matrix(0,k+1,3)
df_id[1:k,1]<-tab.idade
df_id[k+1,1]<-length(idade)
40
4
6
Rotina no R: Histograma e Polígono de frequência
h<-hist(idade,breaks=c(14.9,19.9,24.9,29.9,34.9,39.9,44.9,50,55),xlim=c(15,55),freq=FALSE,ylab="Frequência
relativa",xlab="Idade dos funcionários",main="",col=gray(seq(0.1,1.0,length=7)))
h<-hist(idade,breaks=c(14.9,19.9,24.9,29.9,34.9,39.9,44.9,50,55),xlim=c(15,55),freq=FALSE,ylab="Frequência
relativa",xlab="Idade dos funcionários",main="",col=gray(seq(0.1,1.0,length=7)))
points(h$mids,h$density,"l",lwd=3) # Histograma com polígono de frequência
Frequência relativa
Frequência relativa
0.04
0.04
0.02
0.02
0.00
0.00
20 30 40 50 20 30 40 50
Frequência relativa
0.04
0.04
0.02
0.02
0.00
0.00
20 30 40 50 20 30 40 50
35
30
Frequência acumulada
25
20
15
10
5
0
20 30 40 50
43
Idade dos funcionários
Rotina no R: Boxplot (Gráfico em Caixa)
boxplot(idade,main=" ",ylab="Idade dos funcionários")
45
Idade dos funcionários
40
35
30
25
20
44