Você está na página 1de 14

Estatstica Descritiva

Departamento de Matematica
Escola Superior de Tecnologia de Viseu

de Empresas
Gestao
Marketing

Contabilidade e Administracao

Conceitos Basicos


ou Universo Estatstico: conjunto de elementos


Populacao
sobre o qual incide o estudo estatstico

Caracterstica Estatstica ou Atributo: a caracterstica que

se observa nos elementos da populacao

Modalidades (incompatveis e exaustivas): as diversas formas


em que se apresenta a caracterstica estatstica

Amostra: subconjunto nito da populacao


para a recolha de uma amostra: dimensao
excessiva da
Razoes
estudo de natureza destrutiva, economia e tempo
populacao,


Conceitos Basicos

Exemplo


de uma fabrica

O Gestor de producao
pretende ter uma

ideia da percentagem de pecas defeituosas que a fabrica


produziu em determinado perodo de tempo
em estudo e constituda por todas as pecas
A populacao

produzidas pela fabrica


durante aquele perodo de tempo
A caracterstica estatstica tem apenas duas
defeituosa
modalidades: peca defeituosa e peca nao

Conceitos Basicos
Exemplo


de um centro
Num estudo de mercado para construcao
comercial, interessa estudar o rendimento familiar mensal
dos habitantes de uma determinada cidade
e constituda pelas famlias daquela cidade e
A populacao
a caracterstica estatstica e o rendimento familiar
mensal
se
As modalidades do rendimento familiar mensal nao
todos os valores desde, por
podem enumerar; sao
exemplo, 50 contos ate 1000 contos


Conceitos Basicos
Exemplo


Uma determinada empresa pretende realizar um inquerito


aos seus trabalhadores, onde lhes e pedido para

classicarem a qualidade do servico do bar/refeitorio

segundo a seguinte escala: fraco, razoavel,


bom ou muito
bom

em
Os trabalhadores da fabrica
constituem a populacao
acerca
estudo, e a caracterstica estatstica e a opiniao

da qualidade do servico do bar/refeitorio


Neste estudo o atributo pode manifestar-se nas seguintes

modalidades: fraco, razoavel,


bom ou muito bom

Tipos de Dados Estatsticos




Quantitativos

por exemplo: no diario


de nascimentos no hospital de Viseu
altura dos alunos da ESTV


Discretos - no nito ou innito numeravel


de modalidades

por exemplo: no diario


de nascimentos no hospital de Viseu

Contnuos - pode assumir qualquer valor num intervalo de


numeros
reais

por exemplo: altura de um aluno da ESTV

Qualitativos
por exemplo: cor dos cabelos
estado civil

Escalas de Medida de Dados Estatsticos


Escala Nominal (dados qualitativos)

Apresentam-se em diferentes categorias ou classes, nao

ordenaveis

Exemplos



Estado civil dos empregados de uma empresa

Religiao

Cor de cabelos

Os numeros
das camisolas dos futebolistas

Sexo de um indivduo (caracterstica dicotomica


ou binaria)
a resposta a` pergunta E a
Numa sondagem de opiniao,
do aborto?(caracterstica
favor da despenalizacao

dicotomica
ou binaria)

Para lidar com este tipo de dados e frequente atribuir um codigo


numerico
a
cada categoria da caracterstica em estudo
realizar operacoes
aritmeticas

calcular medias,

Nao
e nao
desvios padroes,

Escalas de Medida de Dados Estatsticos


Escala Ordinal (dados qualitativos)
As diversas categorias possuem uma ordem intrnseca

Os codigos
numericos
devem ter em conta essa ordem

Exemplos



militar: Soldado, Cabo,


O sistema de graduacao
Sargento, ...

pede-se as
` pessoas que
Num inquerito
de opiniao
classiquem um determinado produto como sendo: muito

fraco, fraco, razoavel,


bom ou muito bom (escala de
Likert)
dos clientes de um banco, segundo o
Classicacao
volume de capital que movimentam mensalmente: pouco
importantes, importantes ou muito importantes
dos alunos de uma escola segundo a sua
Classicacao

altura: baixos (menos de 155 cm), medios


(entre 155 e 170 cm)
ou altos (mais de 170 cm)

Escalas de Medida de Dados Estatsticos


Escala de Intervalo (dados quantitativos)
Os dados podem ser ordenados e a diferenca entre dois
valores desta escala pode ser calculada e interpretada

Exemplo
Temperatura do ar em graus Fahrenheit ou em graus centgrados
F = 9/5C + 32

na
Distancias
numericamente iguais implicam as mesmas alteracoes
caracterstica que esta a ser medida

20o C esta a` mesma distancia


de 25o C, do que 25o C de 30o C

podemos atribuir um signicado a` razao


entre dois valores
Nao
signicaria
Se na Guarda se registasse uma temperatura de 40o C isto nao
que na Guarda estava duas vezes mais calor do que em Viseu

tem o signicado de nada


O valor zero nao
se pode dizer que uma cidade onde se registe uma temperatura de 0o C
Nao
tem qualquer temperatura
nao

Escalas de Medida de Dados Estatsticos


ou de Racios

Escala de Razoes
(dados quantitativos)
Tem todas as caractersticas de uma escala de intervalo e,
disso, o valor zero representa a ausencia

alem
total da
caracterstica que esta a ser medida
so e possvel atribuir
Com dados medidos nesta escala, nao

um signicado a` diferenca (distancia)


entre dois valores como
a` razao
entre eles
tambem
nas unidades de medida nao
afectam os racios

Alteracoes
entre dois valores
por exemplo: peso, altura
esta denida numa escala de racios

A temperatura do ar nao
Note que 10o C = 50o F e 30o C = 86o F mas,

10o C
30o C

=

50o F
86o F

de Dados
Representacao
ou amostra de n individuos
Populacao
Atributo A com p modadilades: A1 , A2 , ..., Ap

ni frequencia
absoluta ou efectivo da modadilade Ai : no de
indivduos que apresentam a modalidade Ai

de
fi frequencia
relativa da modadilade Ai : proporcao
indivduos que apresentam a modadidade Ai ,
fi =
p


ni = n

ni
n
p


i=1

fi = 1

i=1

Estatstica Descritiva

Representao Tabular Quadros de Frequncias

Modalidades Frequncias
absolutas

Frequncias
relativas

A1
A2

n1
n2

f1=n1/n
f2=n2/n

Frequncias
absolutas
acumuladas
n1
n1+n2

AP
Total

np
n

fp=np/n
1

Frequncias
relativas
acumuladas
f1
f1+f2


n1+n2+...+np=n f1+f2+...+fp=1
-

Exemplo 1:
Os dados que se seguem so relativos s vendas (em contos) de 30 vendedores da
ElectroNoLar durante o ms de Outubro passado.
120
140
160

130
110
80

80
100
70

100
100
120

110
110
100

100
70
110

90
90
110

70
90
80

140
130
100

120
150
120

Estatstica Descritiva

Tabela de frequncias - dados no agrupados

xi
70
80
90
100
110
120
130
140
150
160
Total

Freq.
absolutas

Freq.
relativas

ni

fi

3
3
3
6
5
4
2
2
1
1
30

3/30
3/30
3/30
6/30
5/30
4/30
2/30
2/30
1/30
1/30
1

Freq.
Freq.
absolutas
relativas
acumuladas acumuladas
3
3/30
6
6/30
9
9/30
15
15/30
20
20/30
24
24/30
26
26/30
28
28/30
29
29/30
30
1
-

Tabela de frequncias com dados agrupados.

Freq.
Freq.
Freq.
Classes de Freq.
valores absolutas relativas absolutas relativas
acum.
acum.
ni
fi
>60, 80>
>80, 100>
>100, 120>
>120, 140>
>140, 160>
>160, 180>

3
6
11
6
3
1

3/30
6/30
11/30
6/30
3/30
1/30

3
9
20
26
29
30

3/30
9/30
20/30
26/30
29/30
30/30

Total

30

 Os intervalos de classe podem ter a mesma amplitude ou amplitudes diferentes dependendo da


natureza dos fenmenos a estudar.
 Agrupar os dados implica perda de informao.
 Regras prticas para a determinao do n de classes:

Regra de Sturges n de classes # 1+log10(n)/log10(2)


Outra n de classes # n (usualmente empregue quando n>25).

Estatstica Descritiva

Representao grfica

Dados No Agrupados
Frequncia absoluta

Polgono de frequncias

7
6
5
4
3
2
1
0
80

90

100 110 120 130 140 150 160

Vendas

7
6
5
4
3
2
1
0
70

80

90 100 110 120 130 140 150 160


Vendas

Representao grfica das frequncias acumuladas


1
acumuladas

70

Frequncias relativas

Frequncia absoluta

Diagrama de barras

0,8
0,6
0,4
0,2
0
60

70

80

90 100 110 120 130 140 150 160 170

Vendas

Estatstica Descritiva

Dados Agrupados
Histograma
No histograma tomamos rectngulos justapostos, cada um com base proporcional
amplitude da classe respectiva e altura hi dada por:
ni
a  a (frequncias absolutas)
i
hi i 1
fi

(frequncias relativas)
ai 1  ai

A rea de cada rectngulo ento proporcional frequncia da classe respectiva:


n (frequncias absolutas)
rea do i - simo rectngulo i
f i (frequncias relativas)
A rea total do histograma igual a n se foram usadas frequncias absolutas e igual a 1 se
foram usadas frequncias relativas.

Note-se porm que, quando as classes tm todas a mesma amplitude costume, para
facilitar a representao, tomar para altura de cada rectngulo a frequncia absoluta ou
relativa da classe a que respeita.

Estatstica Descritiva

Histograma

Polgono de frequncias

Freq. absolutas

10
8
6
4
2
0
60-80

80-100 100-120 120-140 140-160 160-180

12
10
8
6
4
2
0
50

70

90

110

Vendas

Polgono de frequncias acumuladas


1
Freq. relativas acumulada

Freq. absolutas

12

0,8
0,6
0,4
0,2
0
60

80

100

120

140

160

180

Vendas

130

150

170
190
Vendas

Estatstica Descritiva

Medidas Descritivas
Medidas de Localizao ou de Tendncia Central
Estas medidas do-nos uma ideia do centro ou localizao da distribuio dos dados.
Mdia aritmtica
Sejam x1, x2, ..., xp os valores distintos de um conjunto de n dados, cada um deles com
frequncia absoluta ni e frequncia relativa fi. Ento a mdia aritmtica representa-se por x
e dada por:
n
1 n
x
n
x
i i f i xi .
ni1
i 1

Para dados agrupados em classes toma-se para xi o ponto mdio da i-sima classe; ni e fi
sero, naturalmente, a frequncia absoluta e relativa da i-sima classe, respectivamente.

Estatstica Descritiva

Exemplo 2:
A tabela de frequncias que se segue relativa ao nmero de pneus produzidos por dia na
fbrica MAVOR, para uma amostra de 30 dias.
xi

18
20
21
24
25
28
29
Total

Freq.
absoluta
ni
2
3
5
7
6
4
3
30

Freq.
relativa
fi
0.06667
0.1
0.16667
0.23333
0.2
0.13333
0.1
1

Freq.
abso.
acum.
2
5
10
17
23
27
30
-

Freq.
relat.
acum.s
0.06667
0.16667
0.33334
0.56667
0.76667
0.9
1
-

nixi

36
60
105
168
150
112
87
718

A mdia de pneus produzidos diariamente, para os 30 dias considerados :


1 n
718
x
23.9333 .
ni xi
ni1
30

Estatstica Descritiva

Mediana
Trata-se do valor que divide o conjunto de dados, ordenados por ordem crescente, em
duas partes iguais. Isto , a mediana, como o prprio nome indica, o ponto mediano de um
conjunto de dados ordenados em ordem crescente.
Sejam x1, x2, ..., xn, n observaes ordenadas por ordem crescente dos seus valores, e que
constituem o conjunto de dados em anlise.
se n impar
x( n1) 2

Me xn 2  xn 21
se n par

x30 2  x30 21

x15  x16 24  24
24 .
2
2
2
Para dados agrupados em classes, procuramos a classe mediana, sendo esta tal que a sua
frequncia absoluta (resp. relativa) acumulada n/2 (resp. 1/2) e a frequncia absoluta
(resp. relativa) acumulada da classe anterior < n/2 (resp. 1/2).
Depois de encontrada a classe mediana, [aj, aj+1[, encontra-se a mediana por interpolao
linear:
n / 2  ij 11ni
a j 1  a j
Me a j 
nj
Exemplo 2, como n par: Me

Estatstica Descritiva

Moda
o valor mais frequente num conjunto de dados.
 {2, 3, 4, 4, 5} o Mo=4 (distribuio unimodal);
 {2, 2, 3, 4, 4, 5} o Mo=2 e 4 (distribuio bimodal);
 Exemplo 2 o Mo=24.

Havendo mais de 2 valores modais, a distribuio diz-se multimodal.


Quando os dados esto agrupados em classes, a classe modal aquela que tem maior
frequncia por unidade de amplitude. Nestes casos no podemos determinar o valor exacto
da moda pois no sabemos como esto distribudas as observaes dentro de cada classe.
Podemos, no entanto, obter uma aproximao da Moda usando uma das seguintes frmulas:
n j 1
a j 1  a j
Frmula de King: Mo a j 
n j 1  n j 1
Frmula de Czuber: Mo

aj 

n j  n j 1

 n j 1  n j  n j 1

j 1

aj

onde, [aj, aj+1[ a classe modal; nj a freq. abso. desta classe; nj+1 e nj-1 so, resp., a freq. abso. da
classe anterior e posterior modal.

Estatstica Descritiva

Medidas de Localizao no Central Quantis: Qp


A mediana divide o conjunto de dados em duas partes iguais. Quando o conjunto de dados
ordenados dividido em 4 partes iguais, os pontos de diviso so chamados os quartis:
 Q1/4, 1 quartil valor que tem cerca de 25% dos dados abaixo dele;
 Q2/4, 2 quartil valor que tem cerca de 50% dos dados abaixo dele trata-se da Mediana;
 Q3/4, 3 quartil valor que tem cerca de 75% dos dados abaixo dele.

Podemos ainda calcular os quintis, decis, percentis,


Clculo do quantil de ordem p, Qp: Dados no agrupados em classes
Sejam x1, x2, ..., xn, n observaes ordenadas por ordem crescente dos seus valores.
Se np no um inteiro, ento Qp=xk, onde k o inteiro imediatamente seguinte a np. Caso
contrrio, sendo np um inteiro, ento Qp=(xnp+ xnp+1)/2.
Clculo do quantil de ordem p, Qp: Dados agrupados em classes
Seja [aj, aj+1[ a classe que contm Qp, i.e., que contm o valor ao qual corresponde a
frequncia absoluta (resp. relativa) acumulada de np (resp. p). Por interpolao linear
obtm-se Qp:
np  ij 11ni
a j 1  a j
Qp a j 
nj

Estatstica Descritiva

Posio relativa da mdia, mediana e moda


As distribuies de frequncias podem ser simtricas ou no.
Considerando apenas distribuies unimodais, temos:

Distribuies simtricas o x

Me

Mo

Distribuies assimtricas positivaso Mo  Me  x


A cauda direita mais longa e menos abrupta do que a esquerda.
Distribuies assimtricas negativaso x  Me  Mo
A cauda esquerda mais longa e menos abrupta do que a direita
Nas distribuies assimtricas os valores extremos da cauda mais longa
puxam a mdia para o lado direito. A mediana, como divide a rea em duas
partes iguais, para compensar a reduo de rea no lado abrupto, afasta-se
tambm da moda, mas menos do que a mdia.

Estatstica Descritiva

Medidas de Disperso
Exemplo:
Duas empresas concorrentes com sede em Viseu, obtiveram os seguintes lucros nos 5 ltimos anos:
Lucros em unidades monetrias (u. m.)
Empresa 1
10
13
12
14
16
Empresa 2
7
5
10
19
24
O lucro mdio das duas empresa nos ltimos 5 anos o mesmo, 13 u.m., no entanto a Empresa 2
apresenta uma maior variabilidade nos lucros do que a Empresa 1.
12

14

Empresa 1
10

Empresa 2

x =13

16

24
10

x =13

19

Estatstica Descritiva

O intervalo interquartis, [Q1/4, Q3/4] contm 50% das observaes. A amplitude deste intervalo,
amplitude interquartis, uma medida de disperso.
As medidas de disperso mais utilizadas so o desvio padro e a varincia que definimos a seguir.
Sejam x1, x2, ..., xp os valores distintos de um conjunto de n dados, cada um deles com frequncia
absoluta ni e frequncia relativa fi.
Se estes dados constituem observaes feitas sobre toda a populao, a varincia denota-se por
e calculada da seguinte maneira:

1 p
ni ( xi  x ) 2

ni 1

V

fi ( xi  x )2 ,

i 1

ou equivalentemente,

1 p
ni xi2  x 2

ni 1

f i xi2  x 2 .
i 1

Se, pelo contrrio, o conjunto de dados constitui uma amostra da populao, ento a varincia
denota-se por s2 e dada por:

1 p
ni ( xi  x ) 2

n  1i 1

1 p

s
s
ni xi2  nx 2 .
n  1 i 1

O desvio padro a raiz quadrada da varincia e denota-se por V ou por s.


2

Estatstica Descritiva

Exemplo 2
Como dispomos de uma amostra, temos:

1 p

ni xi2  nx 2 .
n  1 i 1

Frequncias Frequncias nixi


absolutas ni relativas fi
18
2
0.06667
36
20
3
0.1
60
21
5
0.16667
105
24
7
0.23333
168
25
6
0.2
150
28
4
0.13333
112
29
3
0.1
87
Total
30
1
718
Ento a varincia e o desvio padro so, respectivamente,

nixi2

xi

s2

1
17494  30 u 23.93332
29

=10.6867 (u.m.)

648
1200
2205
4032
3750
3136
2523
17494

106867

3.269 u.m..

Estatstica Descritiva

Coeficiente de disperso e de variao


Medidas de disperso absolutas: expressas na mesma unidade dos dados a que se
referem
Medidas de disperso relativas: independentes da unidade de medida dos dados a que
se referem

A varincia e o desvio padro so medidas de disperso absolutas.


Se pretendermos comparar a disperso de dois conjuntos de dados que no estejam
expressos na mesma unidade de medida, teremos de adoptar uma medida de disperso
relativa, por exemplo:

Coeficiente de disperso: cd=

s V
ou
x
x

Coeficiente de variao: cv=cdu100%

Estes coeficientes s se empregam quando a varivel toma valores de um s sinal.

Estatstica Descritiva

Momentos
Chama-se momento simples de ordem r ou momento ordinrio de ordem r a
p
1 p
m' k f i xik
ni xik
ni 1
i 1
Chama-se momento centrado de ordem r a
p
1 p
k
k
m k f i xi  x
ni xi  x
ni 1
i 1

Se a distribuio for simtrica os momentos centrados de ordem mpar so nulos, pois


para cada desvio negativo h um desvio positivo com o mesmo valor absoluto.
Alguns momentos:
p
i 1 fi 1
p
i 1 f i xi x

m 'o
m'1
m' 2

f x2
1 i i

mo
m1

V 2  x2

m2

 x x  x 0
2
xi  x V 2
f x
1 i i
p
f
i 1 i

Estatstica Descritiva

Coeficientes de assimetria e achatamento


Coeficiente de assimetria: g1=

m3
m23

Distribuio simtrica o g1=0


Distribuio assmtrica positiva o g1>0
Distribuio assmtrica negativa o g1<0
Embora as proposies recprocas no sejam sempre verdadeiras costume tomar g1 como medida
de assimetria.

Coeficiente de achatamento ou curtose: g2=

m4
m22

Este coeficiente mede o grau de achatamento de uma distribuio, considerado em


relao ao da distribuio normal, para a qual se tem g2=3.
Distribuio mesocrtica o g2=3 (achatamento igual ao da normal)
Distribuio leptocrtica o g2>3 (achatamento inferior ao da normal)
Distribuio platicrtica o g2<3 (achatamento superior ao da normal)