Escolar Documentos
Profissional Documentos
Cultura Documentos
Descritiva
Pratique:
https://pedro.unifei.edu.br/quiz/Conceitos
https://pedro.unifei.edu.br/quiz/Descriptive
https://pedro.unifei.edu.br/quiz/Amostragem
Estatística Descritiva | Pedro Paulo Balestrassi | pedro.unifei.edu.br 1
População e amostra: nomenclatura
diferente para um mesmo conceito
(1)
(2)
x1 + x 2 + + x n i =1
∑x i
Aritmética Simples x= =
n n
𝑥𝑥1 𝑝𝑝1 + 𝑥𝑥2 𝑝𝑝2 + ⋯ + 𝑥𝑥𝑛𝑛 𝑝𝑝𝑛𝑛
𝑥𝑥̄ =
𝑝𝑝1 + 𝑝𝑝2 + ⋯ + 𝑝𝑝𝑛𝑛
Aritmética Ponderada ∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖 𝑝𝑝𝑖𝑖
= 𝑛𝑛
∑𝑖𝑖=1 𝑝𝑝𝑖𝑖
Chama-se Robert
Pesa 78 Kg
Manequim 48
85 cm de cintura
Consome anualmente 8,5 Kg massa, 11,8Kg de bananas, 1,8 Kg de
batatas fritas, 8,15Kg de sorvete e 35,8 Kg de carne.
Vê TV por ano 2567 horas
Recebe anualmente 585 “coisas” por correio (cartas e outros)
Diariamente dorme 7,7 horas, gasta 21 minutos para chegar ao trabalho e
trabalha 6,1 horas
Se n é ímpar: Se n é par:
o o
n n
o termo + + 1 termo
~ n + 1 ~ 2 2
x = termo x=
2 2
Devido ao Outlier
x = 601
2300, a mediana é
x~ = 300 melhor estatística que
a média.
Rode e Entenda o
programa Interativo da
PQ Systems
∑ (x − x ) =4 + 1 + 0 + 1 + 4 = 10
2
i
i =1
.
∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖 − 𝑥𝑥̄ 2
𝑛𝑛 − 1
S2 = ...que é a Variância amostral( Var(x))
𝑁𝑁 n
2 ∑𝑁𝑁 2
∑ (x − x)
2
∑ 𝑖𝑖=1 𝑥𝑥𝑖𝑖 − 𝑥𝑥̄ 𝑖𝑖=1 𝑥𝑥𝑖𝑖 2
𝜎𝜎 = = − 𝑥𝑥̄ 2
𝑁𝑁 𝑁𝑁 i
2 i =1
S =
n−1
Variância Populacional Variância
(σ2 ou σN 2 ) Amostral
n-1 está
Relacionado a
um problema de
tendenciosidade
(X − X) (X − X)
2
X X
5 2 4
4 1 1
3 Média = 3 0 0
1 -2 4
2 Soma dos pontos de dados
-1 1
X= Número dos pontos de dados
Uma Regra
Prática para Soma da
conjunto de dados
típicos: S= S 2 S2 última coluna
= 10
Raiz Qadrada Divide a Soma
S=Amplitude/4 da Variância por (n-1):
= Desv.Pa. = S = Variância = S2
= 1,58 = 2,5
𝑛𝑛 2
2
∑ 𝑖𝑖=1 𝑥𝑥𝑖𝑖 − 𝑥𝑥̄ Estimador
𝑠𝑠 = Não-Tendencioso σ
𝑛𝑛 − 1
2
∑ 𝑛𝑛 2 3
2 𝑖𝑖=1 𝑥𝑥𝑖𝑖 − 𝑥𝑥̄
𝑠𝑠 =
𝑛𝑛
4 𝑛𝑛 2
2
𝑛𝑛 ∑ 𝑖𝑖=1 𝑥𝑥𝑖𝑖 − 𝑥𝑥̄
𝑠𝑠 = .
(𝑛𝑛 − 1) 𝑛𝑛
∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖 − 𝑥𝑥̄ 2
=
𝑛𝑛 − 1
Estatística Descritiva | Pedro Paulo Balestrassi | pedro.unifei.edu.br 19
Uma melhor forma de computar o
desvio padrão
𝑛𝑛 2 𝑛𝑛 2 2
2
∑ 𝑖𝑖=1 𝑖𝑖𝑥𝑥 − 𝑥𝑥 ∑ 𝑖𝑖=1 𝑖𝑖 + 𝑥𝑥 − 2𝑥𝑥𝑖𝑖 𝑥𝑥
𝑥𝑥
𝑠𝑠 = =
𝑛𝑛 − 1 𝑛𝑛 − 1
2 2
∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖2 + 𝑛𝑛𝑥𝑥 − 2𝑥𝑥 ∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖 ∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖2 + 𝑛𝑛𝑥𝑥 − 2𝑥𝑥 ⋅ 𝑛𝑛 𝑥𝑥
= =
𝑛𝑛 − 1 𝑛𝑛 − 1
𝑛𝑛 2
2 𝑛𝑛 2 ∑𝑖𝑖=1 𝑥𝑥𝑖𝑖
𝑛𝑛 2
∑𝑖𝑖=1 𝑥𝑥𝑖𝑖 − 𝑛𝑛𝑥𝑥 ∑𝑖𝑖=1 𝑥𝑥𝑖𝑖 −
= = 𝑛𝑛
𝑛𝑛 − 1 𝑛𝑛 − 1
Usando tal
fórmula, a
computação é
simplificada.
EDA
(Exploratory
Data Analysis)
e Método dos
Cinco
Números
Use:
<Graph> <Boxplot>
Use a opção <Frame>
Survey.mtw <Multiple Graph>
100
Avaliacao
50
Entenda o
procedimento de
empilhamento de
colunas (Stack):
0
<Manip>
Perg1 Perg2 Perg3 Perg4 Perg5 Perg6
<Stack Columns> Perguntas
Distribuião Normal
Reduzida ou Padronizada
Qual o formato da
z curva acumulada?
-3 -2 -1 0 1 2 3
N(0,1) é a
x
µ-3σ µ -2σ µ -σ µ µ+σ µ+2σ µ+3σ distribuição
Benchmark
Estatística Descritiva | Pedro Paulo Balestrassi | pedro.unifei.edu.br 27
Probability Plot: uma forma de
representar uma variável
Normal - 95% CI
0,999
Mean 9,737
StDev 1,842
0,99 N 100
AD 0,149
0,95 P-Value 0,963
0,9
0,8
Probability
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,05
0,01
0,001
2 4 6 8 10 12 14 16 18
X
𝑠𝑠 2 = � 𝑥𝑥𝑖𝑖 − 𝑥𝑥̄ 2 𝑓𝑓
𝑖𝑖
𝑖𝑖=1
Estatística Descritiva | Pedro Paulo Balestrassi | pedro.unifei.edu.br 30
Classes ou categorias em distribuições de
frequência: um velho recurso para compilar dados
x xi ni fi f% Ni Fi F%
(Variável) (ponto (frequência (frequência (frequência (Absoluta (Relativa (Percentual
médio) absoluta) relativa) percentual) Acum.) Acum.) Acum.)
10 ├ ─ 20 15 2 0.04 4 2 0.04 4
20 ├ ─ 30 25 12 0.24 24 14 0.28 28
30 ├ ─ 40 35 18 0.36 36 32 0.64 64
40 ├ ─ 50 45 13 0.26 26 45 0.9 90
50 ├ ─ 60 55 5 0.1 10 50 1.0 100
Σ 50 1 100
𝐾𝐾 𝐾𝐾
x
Ramos x x Folhas
x x x x x
folha_ramo.mtw x x x
Compare os
resultados fazendo
um Histograma.
Positiva
~Nula
Negativa
𝑛𝑛
𝑛𝑛 3
𝐴𝐴𝐴𝐴𝐴𝐴 = � 𝑥𝑥𝑖𝑖 − 𝑥𝑥̄
(𝑛𝑛 − 1)(𝑛𝑛 − 2)
𝑖𝑖=1
Estatística Descritiva | Pedro Paulo Balestrassi | pedro.unifei.edu.br 34
Kurtosis (Achatamento):o quão os dados
são distantes de uma forma normal
Normal K~0
Mesocúrtica
Leptocúrtica Platicúrtica
K>>0 K<<0
𝑛𝑛
𝑛𝑛(𝑛𝑛 + 1) 4
3(𝑛𝑛 − 1)2
𝐾𝐾 = � 𝑥𝑥𝑖𝑖 − 𝑥𝑥̄ −
(𝑛𝑛 − 1)(𝑛𝑛 − 2)(𝑛𝑛 − 3) (𝑛𝑛 − 2)(𝑛𝑛 − 3)
𝑖𝑖=1
14
12
10
Tempo na fila
0
1 6 12 18 24 30 36 42 48 54 60
Index
Abra runchart.mtw
<Stat> <Quality Tools>
<Run Chart>
•Column=Tempo na fila
•Subgroup Size=1
Não existe
automaticamente
no Minitab
Estatística Descritiva | Pedro Paulo Balestrassi | pedro.unifei.edu.br 40
Use o Layout Tool para criar novos gráficos
Ex.: <Marginal Plot
+Time Series>
14
Similar ao
Digidot
14 2
13 5
12 12 11
11 17
10 10 21
X
9 21
8 8 12
7 8
6 6 2
5 1
1 13 26 39 52 65 78 91
Use
TempoSinter
Sinter.mtw 23,5
0,5
1,0
<Stat> 22,5
2,0
<Multi-Vari>:
Força
20,5
Response: Força
19,5
Factor1: TempoSinter
18,5
Factor2: TipoMetal
17,5
15 18 21
TipoMetal
99; 19,8%
201; 40,2% 4; 40,0%
43; 43,0%
Pratique:
https://pedro.unifei.edu.br/quiz/Amostragem
Estatística Descritiva | Pedro Paulo Balestrassi | pedro.unifei.edu.br 43
Pratique!