Escolar Documentos
Profissional Documentos
Cultura Documentos
CENTRO DE TECNOLOGIA
Estatística Descritiva
x1 x2 x3 ... xn
Descrição Numérica de Dados
(Localização)
X POPULAÇÃO:
Representada pela variável aleatória
X com função densidade de
probabilidade fX(x)
AMOSTRA
x1 x2 x3 ... xn OBSERVADA
Descrição Numérica de Dados
(Localização)
X POPULAÇÃO:
Representada pela variável aleatória
X com função densidade de
probabilidade fX(x)
AMOSTRA
x1 x2 x3 ... xn OBSERVADA
DADOS
Descrição Numérica de Dados
(Localização)
X POPULAÇÃO:
Representada pela variável aleatória
X com função densidade de
probabilidade fX(x)
AMOSTRA
x1 x2 x3 ... xn OBSERVADA
x1 x2 xn 1 n
x xi
n n i 1
Descrição Numérica de Dados
(Localização)
X POPULAÇÃO:
Representada pela variável aleatória
X com função densidade de
probabilidade fX(x)
AMOSTRA
x1 x2 x3 ... xn OBSERVADA
x1 x2 xn 1 n n
x xi x i nx
n n i 1 i 1
Descrição Numérica de Dados
(Localização)
X POPULAÇÃO:
Representada pela variável aleatória
X com função densidade de
probabilidade fX(x)
AMOSTRA
x1 x2 x3 ... xn OBSERVADA
x1 x2 xn 1 n n
x xi x i nx
n n i 1 i 1
81.926,1
Note que: se tivéssemos x3=4.000 teríamos x 8.192,61 horas
10
Descrição Numérica de Dados
(Localização)
– MEDIANA DA AMOSTRA x
~
É o ponto que divide a amostra em duas partes iguais.
Diagrama de Dispersão
A 713,5
A 2374,8
Descrição Numérica de Dados
(Dispersão)
– VARIÂNCIA (s2) E DESVIO PADRÃO (s)
Diagrama de Dispersão
x 8.844,0
3.421.735,16
s B2
5
s B2 684.347,03 h 2 s B 827,25 h
Em suma:
s s2
Dividindo a soma dos desvios ao quadrado por n-1
1 n
s
2
i
n 1 i 1
( x x ) 2
x1 xn
Distribuição de Frequências
A distribuição de frequências está para a amostra assim como a distribuição de
probabilidades está para a população
É uma forma de quantificar a frequência de ocorrência das amostras em
determinadas faixas de valores
x1 xn
A
– Intervalos de classe: divide-se a amplitude da amostra (ou um intervalo
maior) em um certo número K de classes
Sugere-se K n (inteiro)
Distribuição de Frequências
A distribuição de frequências está para a amostra assim como a distribuição de
probabilidades está para a população
É uma forma de quantificar a frequência de ocorrência das amostras em
determinadas faixas de valores
A
– Intervalos de classe: divide-se a amplitude da amostra (ou um intervalo
maior) em um certo número K de classes
A
Sugere-se K n (inteiro) Largura D de cada classe:
K
Δ Δ Δ Δ
x1 xn
Distribuição de Frequências
A distribuição de frequências está para a amostra assim como a distribuição de
probabilidades está para a população
É uma forma de quantificar a frequência de ocorrência das amostras em
determinadas faixas de valores
x1 xn
A
– Intervalos de classe: divide-se a amplitude da amostra (ou um intervalo
maior) em um certo número K de classes
A
Sugere-se K n (inteiro) Largura D de cada classe:
Limites dos K
intervalos Δ Δ Δ Δ
x1 xn
Distribuição de Frequências
Frequência (nk): Conta-se o número de amostras dentro de cada intervalo
Frequência Relativa (fk): Determina-se a porcentagem de amostras dentro
de cada intervalo (dividindo a frequência pelo tamanho n da amostra)
Frequência Acumulada (Fk): Somam-se as frequências relativas de todas
as classes anteriores a atual (incluindo-se a atual)
x1 xn
5
Distribuição de Frequências
Frequência (nk): Conta-se o número de amostras dentro de cada intervalo
Frequência Relativa (fk): Determina-se a porcentagem de amostras dentro
de cada intervalo (dividindo a frequência pelo tamanho n da amostra)
Frequência Acumulada (Fk): Somam-se as frequências relativas de todas
as classes anteriores a atual (incluindo-se a atual)
x1 xn
5
n1 =3 n2 =7 n3 =4 n4=2
Distribuição de Frequências
Frequência (nk): Conta-se o número de amostras dentro de cada intervalo
Frequência Relativa (fk): Determina-se a porcentagem de amostras dentro
de cada intervalo (dividindo a frequência pelo tamanho n da amostra)
Frequência Acumulada (Fk): Somam-se as frequências relativas de todas
as classes anteriores a atual (incluindo-se a atual)
nk
f k=
n
x1 xn
5
Distribuição de Frequências
Frequência (nk): Conta-se o número de amostras dentro de cada intervalo
Frequência Relativa (fk): Determina-se a porcentagem de amostras dentro
de cada intervalo (dividindo a frequência pelo tamanho n da amostra)
Frequência Acumulada (Fk): Somam-se as frequências relativas de todas
as classes anteriores a atual (incluindo-se a atual)
nk
f k=
n
x1 xn
5
3 7 4 2
f 1= =0,1875 f 2= =0,4375 f 3= =0,25 f 4 = =0,125
16 16 16 16
Distribuição de Frequências
Frequência (nk): Conta-se o número de amostras dentro de cada intervalo
Frequência Relativa (fk): Determina-se a porcentagem de amostras dentro
de cada intervalo (dividindo a frequência pelo tamanho n da amostra)
Frequência Acumulada (Fk): Somam-se as frequências relativas de todas
as classes anteriores a atual (incluindo-se a atual)
nk
f k=
n
f 1+…+f K =1
x1 xn
5
3 7 4 2
f 1= =0,1875 f 2= =0,4375 f 3= =0,25 f 4 = =0,125
16 16 16 16
Distribuição de Frequências
Frequência (nk): Conta-se o número de amostras dentro de cada intervalo
Frequência Relativa (fk): Determina-se a porcentagem de amostras dentro
de cada intervalo (dividindo a frequência pelo tamanho n da amostra)
Frequência Acumulada (Fk): Somam-se as frequências relativas de todas
as classes anteriores a atual (incluindo-se a atual)
k
F k =∑ f j
j=1
x1 xn
5
Distribuição de Frequências
Frequência (nk): Conta-se o número de amostras dentro de cada intervalo
Frequência Relativa (fk): Determina-se a porcentagem de amostras dentro
de cada intervalo (dividindo a frequência pelo tamanho n da amostra)
Frequência Acumulada (Fk): Somam-se as frequências relativas de todas
as classes anteriores a atual (incluindo-se a atual)
k
F k =∑ f j
j=1
x1 xn
5
F1 =18,75 %
Distribuição de Frequências
Frequência (nk): Conta-se o número de amostras dentro de cada intervalo
Frequência Relativa (fk): Determina-se a porcentagem de amostras dentro
de cada intervalo (dividindo a frequência pelo tamanho n da amostra)
Frequência Acumulada (Fk): Somam-se as frequências relativas de todas
as classes anteriores a atual (incluindo-se a atual)
k
F k =∑ f j
j=1
x1 xn
5
F 2=62,5 %
Distribuição de Frequências
Frequência (nk): Conta-se o número de amostras dentro de cada intervalo
Frequência Relativa (fk): Determina-se a porcentagem de amostras dentro
de cada intervalo (dividindo a frequência pelo tamanho n da amostra)
Frequência Acumulada (Fk): Somam-se as frequências relativas de todas
as classes anteriores a atual (incluindo-se a atual)
k
F k =∑ f j
j=1
x1 xn
5
F 3=87,5 %
Distribuição de Frequências
Frequência (nk): Conta-se o número de amostras dentro de cada intervalo
Frequência Relativa (fk): Determina-se a porcentagem de amostras dentro
de cada intervalo (dividindo a frequência pelo tamanho n da amostra)
Frequência Acumulada (Fk): Somam-se as frequências relativas de todas
as classes anteriores a atual (incluindo-se a atual)
k
F k =∑ f j
j=1
x1 xn
5
F 4=100 %
Distribuição de Frequências
EXEMPLO
Vamos construir a tabela de distribuição de frequências
dos dados obtidos a partir de ensaios de laboratório para
medição da força de compressão em 80 barras de
alumínio (corpos de prova)
Distribuição de Frequências
EXEMPLO
Vamos construir a tabela de distribuição de frequências
dos dados obtidos a partir de ensaios de laboratório para
medição da força de compressão em 80 barras de
alumínio (corpos de prova)
n=80
Tamanho da amostra
Distribuição de Frequências
EXEMPLO: força de compressão medida em 80 barras de alumínio (em psi)
Distribuição de Frequências
EXEMPLO: força de compressão medida em 80 barras de alumínio (em psi)
x min x max
A=x max − x min
Distribuição de Frequências
EXEMPLO: força de compressão medida em 80 barras de alumínio (em psi)
x max
x min
x min x max
A=x max − x min =245 −76=169
Distribuição de Frequências
EXEMPLO: força de compressão medida em 80 barras de alumínio (em psi)
∑ nk =n
k=1
Distribuição de Frequências
Limites dos intervalos Distribuição de Frequências
∑ nk =n ∑ f k =1 ou 100%
k=1 k=1
Distribuição de Frequências
Limites dos intervalos Distribuição de Frequências
∑ nk =n ∑ f k =1 ou 100%
k=1 k=1
Histogramas
Histogramas
São gráficos de colunas que representam as informações da tabela de distribuição de
frequência
5
Histogramas
São gráficos de colunas que representam as informações da tabela de
distribuição de frequência
5
Histogramas
São gráficos de colunas que representam as informações da tabela de
distribuição de frequência
5
Histogramas
São gráficos de colunas que representam as informações da tabela de
distribuição de frequência
5
Histogramas
São gráficos de colunas que representam as informações da tabela de
distribuição de frequência
5
Histograma de Frequência
20
15
Frequência
10
0
76 – 95 95 – 114 114 – 133 133 – 152 152 – 171 171 – 190 190 – 209 209 – 228 228 – 247
25,0%
20,0%
Frequência relativa (%)
15,0%
10,0%
5,0%
0,0%
76 – 95 95 – 114 114 – 133 133 – 152 152 – 171 171 – 190 190 – 209 209 – 228 228 – 247
100,0%
80,0%
Frequência cumulativa (%)
60,0%
40,0%
20,0%
0,0%
76 – 95 95 – 114 114 – 133 133 – 152 152 – 171 171 – 190 190 – 209 209 – 228 228 – 247
AMOSTRA 2:
Caso Discreto
Muitos resultados distintos
AMOSTRA 1:
AMOSTRA 2:
Caso Discreto
Muitos resultados distintos
AMOSTRA 1:
Poucos resultados
AMOSTRA 2:
distintos (apenas 5 opções)
Caso Discreto
Muitos resultados distintos
AMOSTRA 1:
Poucos resultados
AMOSTRA 2:
distintos (apenas 5 opções)
No caso da AMOSTRA 1
Faz sentido usar INTERVALOS como CLASSES da distribuição
de frequência (e do histograma)
No caso da AMOSTRA 2
Faz sentido usar os PRÓPRIOS VALORES DAS AMOSTRAS
como CLASSES da distribuição de frequência (e do histograma)
Caso Discreto
Distribuição de frequência
No caso da AMOSTRA 1
Faz sentido usar INTERVALOS como CLASSES da distribuição
de frequência (e do histograma)
No caso da AMOSTRA 2
Faz sentido usar os PRÓPRIOS VALORES DAS AMOSTRAS
como CLASSES da distribuição de frequência (e do histograma)
Caso Discreto
Distribuição de frequência
AMOSTRA 2
Caso Discreto
Distribuição de frequência
AMOSTRA 2
Caso Discreto
Distribuição de frequência
AMOSTRA 2
Caso Discreto
Distribuição de frequência
AMOSTRA 2
Caso Discreto
Histogramas da Amostra 2
16 35%
14 30%
20%
8
15%
6
4 10%
2 5%
0 0%
0 1 2 3 4 0 1 2 3 4
120%
100%
Frequência Acumulada
80%
60%
40%
20%
0%
0 1 2 3 4
Aproximação do valor médio e da
variância usando a distribuição de
frequência ou o histograma
No exemplo anterior (barras de alumínio), calcule o valor
médio e o desvio padrão dos dados amostrais apresentados
no primeiro slide do exemplo (pode usar calculadora ou
computador)
No exemplo anterior (barras de alumínio), calcule o valor
médio e o desvio padrão dos dados amostrais apresentados
no primeiro slide do exemplo (pode usar calculadora ou
computador)
20
20
16 16
15
Frequência
10
10
6
5 4 4
2 2
0
85,5 104,5 123,5 142,5 161,5 180,5 199,5 218,5 237,5
Valor Médio Aproximado
25
20
20
16 16
15
Frequência
10
10
6
5 4 4
2 2
0
85,5 104,5 123,5 142,5 161,5 180,5 199,5 218,5 237,5
85,5 x 2
171
Valor Médio Aproximado
25
20
20
16 16
15
Frequência
10
10
6
5 4 4
2 2
0
85,5 104,5 123,5 142,5 161,5 180,5 199,5 218,5 237,5
104,5 x 4
171 418
Valor Médio Aproximado
25
20
20
16 16
15
Frequência
10
10
6
5 4 4
2 2
0
85,5 104,5 123,5 142,5 161,5 180,5 199,5 218,5 237,5
123,5 x 6
20
20
16 16
15
Frequência
10
10
6
5 4 4
2 2
0
85,5 104,5 123,5 142,5 161,5 180,5 199,5 218,5 237,5
142,5 x 16
20
20
16 16
15
Frequência
10
10
6
5 4 4
2 2
0
85,5 104,5 123,5 142,5 161,5 180,5 199,5 218,5 237,5
161,5 x 20
20
20
16 16
15
Frequência
10
10
6
5 4 4
2 2
0
85,5 104,5 123,5 142,5 161,5 180,5 199,5 218,5 237,5
180,5 x 16
20
20
16 16
15
Frequência
10
10
6
5 4 4
2 2
0
85,5 104,5 123,5 142,5 161,5 180,5 199,5 218,5 237,5
199,5 x 10
20
20
16 16
15
Frequência
10
10
6
5 4 4
2 2
0
85,5 104,5 123,5 142,5 161,5 180,5 199,5 218,5 237,5
218,5 x 2
20
20
16 16
15
Frequência
10
10
6
5 4 4
2 2
0
85,5 104,5 123,5 142,5 161,5 180,5 199,5 218,5 237,5
237,5 x 4
20
20
16 16
15
Frequência
10
10
6
5 4 4
2 2
0
85,5 104,5 123,5 142,5 161,5 180,5 199,5 218,5 237,5
171 + 418 + 741 + 2280 + 3230 + 2888 + 1995 + 437 + 950 = 13110
Valor Médio Aproximado
25
20
20
16 16
15
Frequência
10
10
6
5 4 4
2 2
0
85,5 104,5 123,5 142,5 161,5 180,5 199,5 218,5 237,5
13110
x̄ ≈ =163,875
80
171 + 418 + 741 + 2280 + 3230 + 2888 + 1995 + 437 + 950 = 13110
Valor Médio Aproximado
Para encontrar o valor médio aproximado a partir da
distribuição de frequência, substitua o somatório das
amostras pela média ponderada dos centros das classes
(com os pesos dados por suas respectivas frequências)
n K
1 1
x̄= ∑ xi x̄≈ ∑ C k n k
n i=1 n k=1
0,25
25%
Frequência relativa (%)
0,2 0,2
20%
15%
0,125
10%
0,075
0,05 0,05
5%
0,025 0,025
0%
85,5 104,5 123,5 142,5 161,5 180,5 199,5 218,5 237,5
Valor Médio Aproximado
30%
0,25
25%
Frequência relativa (%)
0,2 0,2
20%
15%
0,125
10%
0,075
0,05 0,05
5%
0,025 0,025
0%
85,5 104,5 123,5 142,5 161,5 180,5 199,5 218,5 237,5
0,25
25%
Frequência relativa (%)
0,2 0,2
20%
15%
0,125
10%
0,075
0,05 0,05
5%
0,025 0,025
0%
85,5 104,5 123,5 142,5 161,5 180,5 199,5 218,5 237,5
2,1375 + 5,225 + 9,2625 + 28,5 + 40,375 + 36,1 + 24,9375 + 5,4625 + 11,875 = 163,875
Valor Médio Aproximado
30%
0,25
25%
Frequência relativa (%)
0,2 0,2
20%
15%
0,125
10%
0,075
0,05 0,05
5%
0,025 0,025
0%
85,5 104,5 123,5 142,5 161,5 180,5 199,5 218,5 237,5
x̄ ≈163,875
2,1375 + 5,225 + 9,2625 + 28,5 + 40,375 + 36,1 + 24,9375 + 5,4625 + 11,875 = 163,875
Métodos Gráficos de Descrição de Dados
– Diagrama de Caule-e-Folha (ainda o exemplo das barras de alumínio)
Caules Folhas Frequência
Esse diagrama apresenta todos
os valores observados
explicitamente
Quartis e Parcentis
Determinando os Quartis:
Primeiro quartil (q1): ¼ das amostras estão abaixo de q1 (¾ acima)
Segunda quartil (q2): ½ das amostras estão abaixo de q2 (corresponde
à mediana)
Terceiro quartil (q3): ¾ das amostras estão abaixo de q3 (¼ acima) xi , se f 0
3x x
n 1 i i 1
, se f 0,25
p k i f qk xi f ( xi 1 xi ) 4
x xi 1
4 i , se f 0,5
2
k é o número do Parte fracionária xi 3 xi 1
, se f 0,75
quartil (1,2,3) Parte inteira 4
Métodos Gráficos de Descrição de Dados
Quartis e Parcentis
Quartis e Parcentis
Quartis e Parcentis