Você está na página 1de 29

Estatstica

Descritiva
Como construir uma distribuio de freqncias.
Como construir grficos de freqncias.
Como encontrar medidas de tendncia central.
Como encontrar medidas de variabilidade.
Como encontrar separatrizes
Motivao
Idades de uma amostra com 80 residentes em Alaska:
25, 5, 18, 12, 60, 44, 24, 22, 2, 7, 15, 39, 58, 53, 36, 42,
16, 20, 1, 5, 39, 51, 44, 23, 3, 13, 37, 56, 58, 13, 47, 23,
1, 17, 39, 13, 24, 0, 39, 10, 41, 1, 48, 17, 18, 3, 72, 20,
3, 9, 0, 12, 33, 21, 40, 68, 25, 40, 59, 4, 67, 29, 13, 18,
19, 13, 16, 41, 19, 26, 68, 49, 5, 26, 49, 26, 45, 41, 19,
49
Mdia
Range
anos
Idade
F
r
e
q

n
c
i
a
Distribuio de Freqncias
Dados Quantitativos
Uma tabela de classes ou intervalos
de valores de uma amostra com um
nmero total de observaes em cada
classes.
Classe
Freqncia
Etapas para construo de uma
distribuio de freqncias
1. Decida o tamanho do nmero de intervalos.
Um bom tamanho onde n o tamanho
da amostra.
2. Determine a amplitude de cada intervalo.
Divida o range dos valores pelo tamanho do
nmero de intervalos. Arredonde at o prximo
nmero.
3. Calcule os limites das classes. O valor mnimo
dos dados pode ser o limite inferior da primeiro
intervalo. Adicione o range para formar o limite
mximo deste intervalo e obter os prximos
intervalos. Os intervalos no podem sobrepor.
4. Conte as freqncias de cada classe.
] , 1 [ n
Exemplo: Tempo (em min)
gasto na Internet
Conjunto de dados amostrais: lista do
nmero de minutos de 50 assinantes.
50 40 41 17 11 7 22 44 28 21 19 23
37 51 54 42 88 41 78 56 72 56 17 7
69 30 80 56 29 33 46 31 39 20 18 29
34 59 73 77 36 39 30 62 54 67 39 31
53 44
Construindo a distribuio
de freqncias
1. O nmero de intervalos 7.
2. Os valores mnimo e mximo so 7 e 88,
respectivamente. Logo a amplitude total
81. A amplitude dos intervalos 12.
3. Os limites inferior e superior do primeiro
intervalo so 7 e 18, respectivamente.
4. Estabelea a freqncia de cada classe.
Distribuio de freqncias
Freqncia
Freqncia
Relativa
Freqncia
Acumulado
Ponto
Mdio
Classe
Grficos da distribuio de
freqncias
Histograma usando os pontos mdios Histograma usando as fronteiras
Classe Fronteiras
Freqncia
Grficos da distribuio de
freqncias
Polgono de freqncias
Histograma de freqncia relativa
Grficos da distribuio de
freqncias
Limites
Superiores
Freqncia
Acumulada
f
Ogiva
Grficos de dados
qualitativos
Carro
Caminho
7%
Outros
1%
Motos
Carros
Motos
Caminhes
Outros
Grfico de Pizza
Freqncia
Relativa
Angulo
Grficos de dados
qualitativos
Grfico de barras verticais
Roubo Assaltos
Erros Fraudes
Causas de reduo de ativos
Grfico de dados
emparelhados
Conjunto de dados Iris
Comprimento da ptala
L
a
r
g
u
r
a

d
a

p

t
a
l
a
Grfico de srie temporal
Ano
Assinantes
Conta
Mdia
Nmero de assinantes de telefones celulares
(em milhes)
Medidas de tendncia
central
Mdia
Amostra
Populao
Mediana
Valor que divide o conjunto em duas partes
de iguais. Se o tamanho do conjunto par ,
a mediana a mdia entre os dois
elementos mais centrais.
Moda
Valor que tem a maior freqncia
Em uma distribuio normal a mdia, a
mediana e a moda so iguais.

=
=
n
i
i
x
n
x
1
1

=
=
N
i
i
x
N
1
1

Comparao entre Mdia,


Moda e Mediana
Vantagens e desvantagens:
Mdia: funciona bem com muitos
mtodos estatsticos
Mediana: costuma ser uma boa
escolha se h alguns valores
extremos.
Moda: apropriada para dados ao nvel
nominal
Exemplo
Idades em uma classe
Mdia= 23,75
Mediana=21,5
Moda= 20
Valor aberrante
Mdia ponderada
Fonte Nota x Peso w
Mdia testes
Exame do meio
Laboratrio
Trabalho de casa
6 , 88
1
= =

=
i
n
i
i
w x x
Mdia de dados agrupados
x f
x.f
80 , 41
1
1
= =

=
i
n
i
i
f x
n
x
Aspectos das distribuies
Simtrica
Mdia
Moda
Mediana
Uniforme
Mdia
Mediana
Media <Mediana <Moda Moda <Mediana < Mdia
Assimtrica
esquerda
Assimtrica
direita
Aspectos das distribuies
Assimetria Sk: mede o grau de deformao . Assume
valores entre 1 e 1.
onde Mo a moda.
Curtose: mede o grau de achatamento ou afilamento
S
Mo x
Sk

=
4
4
) (
1
S
x x
n
K
i
i

=
Usando Regra Emprica
Usada para determinar a porcentagem de valores que
precisam estar dentro de um nmero especificado de
desvios-padres da mdia.
Para dados que tem uma distribuio na forma de um
sino:
Aproximadamente 68% dos valores dos dados
estaro dentro de um desvio padro da mdia.
Aproximadamente 95% dos valores dos dados
estaro dentro de dois desvios padres da mdia.
Aproximadamente 99% dos valores dos dados
estaro dentro de trs desvios padres da mdia.
Assimetria e Curtose
Sk Sk = 0 (Sim = 0 (Sim trica) trica)
Sk Sk > 0 (Assimetria positiva) > 0 (Assimetria positiva)
Sk Sk < 0 (Assimetria negativa < 0 (Assimetria negativa
Menores que 0,15 distribuio simtrica
0,15<IA<1,0 Distribuio moderadamente assimtrica
Maior que 1,0 Distribuio fortemente assimtrica
K = 3 ( K = 3 (Mesoc Mesoc rtica rtica) (Distribui ) (Distribui o Normal) o Normal)
K > 3 ( K > 3 (Leptoc Leptoc rtica rtica) )
K < 3 ( K < 3 (Platoc Platoc rtica rtica) )
Medidas de Variabilidade
Amplitude total
Diferena entre o maior valor e o menor valor.
Varincia
Populacional
Amostral
Desvio padro
Populacional
Amostral
Coeficiente de variao
2
1
2
) (
1
=

=
n
i
i
x
N
2
1
) (
1
1
x x
n
S
n
i
i

=

=
2
1
) (
1
=

=
n
i
i
x
N
2
1
2
) (
1
1
x x
n
S
n
i
i

=

=
100
x
S
Interpretando o desvio
padro
Quanto mais espalhados estiverem os
dados maior ser o desvio padro
Desvio padro de dados
agrupados
Distribuio de nmero de crianas
em 50 domiclios
7 , 1 ) (
1
1
2
1
=

=

=
i
n
i
i
f x x
n
s
Medidas de posio
Os trs quartis Q
1
, Q
2
e Q
3
dividem ao conjunto de
dados em quatro partes iguais: 25% ficam dentro ou
abaixo de Q
1
, 50% ficam dentro ou abaixo de Q
2
e
75% ficam dentro ou abaixo de Q
3.
Amplitude interquartlica: diferena entre Q
3
e Q
1.
Fornece uma idia de quanto 50% centrais (mdios)
dos dados variam.
Metade inferior Metade superior
Decis e percentis
Decis: divide o conjunto de dados em dez
partes iguais.
Percentis: divide o conjunto de dados em
cem partes iguais.
So freqentemente usados na educao e
nos campos relacionados a sade para
indicar como um indivduo se compara com
outros em um determinado grupo.
Pontuaes em testes e medidas de
crescimento infantil so freqentemente
expressos em percentis.
Box PLot
Um grfico que permite identificar os pontos aberrantes em
uma amostra e reala caractersticas importantes.
Etapas:
1. Obtenha Q
1
, Q
2
, Q
3
Q
3
-Q
1
. Calcule os limites inferior: LI=Q1
1,5(Q3-Q1) e LS= Q1+1,5(Q3-Q1). Os dados fora do
intervalo [LI,lS] so considerados fora da curva.
2. Construa uma escala total que abrange todos os dados.
3. Plote os cincos nmeros acima da escala horizontal.
4. Faa uma caixa acima de Q
1
a Q
3
e trace uma reta vertical
passando por Q
2
.
5. Faa as tranas
Limite
inferior
Mediana
Limite
superior
Trana Trana
Caixa

Você também pode gostar