Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatstica descritiva
Prof. Dr. Bruno B. Batista
brunob.batista@gmail.com
18 de novembro de 2016 1
Estatstica - Cincia que se preocupa com a organizao, descrio, anlise e
interpretao de dados numricos de uma populao ou amostra
18 de novembro de 2016 2
Dados estatsticos:
o Apresentados em tabelas (arranjo tabular dos dados por classes, com suas frequncias
correspondentes denominado tabela de distribuio de frequncia).
o Representados graficamente por histogramas ou polgonos de frequncia.
18 de novembro de 2016 3
TABELA DE DISTRIBUIO DE FREQUNCIA
1. Conjunto dos dados numricos obtidos por amostragem ou
experimentao dados brutos.
2. Dentre os dados brutos observar o maior valor (M) e o menor
valor (m). Calcular a amplitude total diferena entre o maior e o menor valor
observado.
A=Mm
3. Arranjo dos dados brutos em ordem crescente ou decrescente rol.
4. Calcular o nmero de classes (K), considerando que conveniente obter entre
5 e 20 classes
K 1 + 3,22 x log n
18 de novembro de 2016 4
5. Calcular a amplitude do intervalo de classe (h), dividindo a amplitude total (A)
pelo nmero de classes (K).
hAK
6. aconselhvel, tambm, que os intervalos de classe sejam escolhidos de
maneira que seus pontos mdios (xi) coincidam com os dados realmente
observados. Ponto mdio (xi) da primeira classe deve ser o menor valor (m) da
distribuio.
18 de novembro de 2016 5
18 de novembro de 2016 6
ARREDONDAMENTOS DOS DADOS
Somar os nmeros:
4,35 8,65 2,95 12,45 6,65 7,55 9,75
(a) Diretamente.
(b) Arredondando de maneira que o algarismo anterior a 5 aumente uma
unidade.
(c) Arredondando para o dcimo de acordo com a
CONVENO DO NMERO PAR reduz ao mnimo os erros acumulados
com arredondamento
18 de novembro de 2016 7
18 de novembro de 2016 8
Medidas de Posio Localizam as distribuies
18 de novembro de 2016 9
Se o nmero de observaes for grande, os dados de uma varivel dentro de uma
certa amplitude devem ser distribudos em intervalos de tamanho constante, de
acordo com as frequncias absolutas (fi), as quais assumem diferentes pesos ao longo
dessa amplitude e refletem quantas vezes um dado da varivel se repete
18 de novembro de 2016 10
Propriedades da mdia
Quando os dados da varivel no esto uniformemente distribudos
em torno da mdia, dois tipos de distribuio so gerados:
a) Distribuio assimtrica positiva ou inclinada direita com
preponderncia das frequncias direita da mdia (mdia > mediana
> moda);
(b) Distribuio assimtrica negativa ou inclinada esquerda com
preponderncia das frequncias esquerda da mdia (mdia <
mediana < moda).
A distribuio considerada simtrica (mdia = mediana = moda)
quando os valores da varivel esto equitativamente distribudos em
torno da mdia
18 de novembro de 2016 11
O grau de assimetria pode ser medido atravs do ndice de
assimetria de Pearson (Ias):
18 de novembro de 2016 12
Moda (Mo) o valor que ocorre com maior frequncia em uma distribuio, ou o
evento que se repete mais vezes (o valor mais comum).
Um conjunto pode no ter moda. As distribuies que apresentam uma, duas ou vrias
modas so chamadas de unimodais, bimodais e polimodais, respectivamente.
No influenciada por valores extremos.
Menos til que a mdia e a mediana.
Dados no agrupados
Visualizada mais claramente, para uma pequena quantidade de dados, quando eles
estiverem organizados em rol (ordem crescente de seus valores).
Dados agrupados (grande nmero de observaes)
18 de novembro de 2016 13
Onde: L1 = limite inferior da classe que contm a maior frequncia.
h = amplitude da classe.
1 = diferena entre a frequncia modal e a frequncia anterior.
2 = diferena entre a frequncia modal e a frequncia posterior.
18 de novembro de 2016 14
Mediana (Md) a mediana de um conjunto de dados, ordenados em
ordem crescente, corresponde ao valor central ou a mdia aritmtica
dos dois valores centrais.
Dados no agrupados
Para conjuntos de dados com pequena freqncia, os valores so
ordenados em ordem crescente de grandeza, sendo determinada
como:
1. O valor central do rol, se o nmero de dados for mpar;
2. A mdia dos dois valores centrais, se o nmero de dados for par.
18 de novembro de 2016 15
Dados agrupados
Para uma distribuio de frequncia com grande nmero de
observaes, a mediana (Md) calculada pela seguinte frmula:
X
Disperso
Sejam as sries:
a) 20, 20, 20 b) 10, 15, 20, 25, 30
Sries com mdias iguais .
Na srie a, no h disperso.
Na srie b, os valores apresentam disperso em torno da mdia.
Mdia muito mais representativa para a srie a do que para a b.
18 de novembro de 2016 17
Varincia (s) definida como a soma do quadrado dos desvios em
relao mdia, dividida pelo nmero de graus de liberdade.
Dados no agrupados em uma distribuio de frequncia
18 de novembro de 2016 18
Desvio Padro (s) corresponde raiz quadrada da varincia, sendo
calculado pelas seguintes frmulas:
18 de novembro de 2016 19
Coeficiente de Variao (CV) uma medida relativa do desvio
padro, calculada como frao da mdia e apresentada sob a forma
de percentagem.
Vantagens do uso do CV
Permite comparar a variabilidade de vrias distribuies.
Consiste em um ndice de variao relativa.
Independe da unidade em que foram medidas.
CV 15% baixa disperso
15% < CV < 30% mdia disperso
CV 30% alta disperso
18 de novembro de 2016 20