Você está na página 1de 28

1

Mdulo Estatstica e
Fiabilidade
Captulo I - Estatstica
Descritiva
1 Maria Filipa Mouro
O que significa a palavra Estatstica ?
Estatstica
Recolher dados
Amostragem
Compilar dados
Tabelas
Grficos
Medidas Estatsticas
Analisar dados Interpretar dados
Maria Filipa Mouro 2
2
Estatstica Descritiva
Tem como objectivo sintetizar e representar de uma forma
compreensvel a informao contida num conjunto de dados
Maria Filipa Mouro 3
Inferncia Estatstica
Com base na anlise de um conjunto de dados (amostra)
pretende caracterizar o todo a partir do qual tais dados foram
obtidos (populao)
Considere-se uma anlise estatstica que incide sobre um
conjunto de objectos, em particular sobre uma determinada
caracterstica:
Populao: conjunto dos dados que expressam essa
caracterstica para todos os objectos sobre os quais a anlise
incide;
Amostra: um subconjunto de dados que pertencem
populao.
Maria Filipa Mouro 4
3
Fases do mtodo da anlise Estatstica
1- Estabelecer o objectivo da anlise a efectuar e definir a(s)
populao (es) correspondente(s);
2- Conceber um procedimento adequado para a seleco de uma ou
mais amostras;
3- Recolher os dados
4- Analisar os dados
5- Estabelecer inferncias acerca da populao
Maria Filipa Mouro 5
Recolha de dados
Primrios: se forem obtidos directamente pelo analista ou
pela organizao na qual est inserido.
Secundrios: Se os dados so compilados ou publicados por
outra organizao.
Agncias governamentais
Associaes empresariais ou sindicatos
Empresas especializadas em estudos de mercado
Maria Filipa Mouro 6
4
Processos de recolha de dados
Processos de recolha de dados
Experimentais Observacionais
exercido um controlo
directo sobre os factores
que potencialmente
afectam a caracterstica em
anlise
Os factores que
potencialmente afectam a
caracterstica em anlise
no so controlados
Maria Filipa Mouro 7
Anlise de dados
nesta fase que, aps devidamente recolhidos os dados, se
utilizam as tcnicas da estatstica descritiva com o objectivo de
sintetizar esses mesmos dados.
Tabelas de dados
Grficos
Medidas estatsticas
Maria Filipa Mouro 8
5
Estabelecer inferncias acerca da populao
Populao
Amostra
Anlise de dados
INFERIR
Maria Filipa Mouro 9
Estatstica Descritiva
Tipos de dados
Qualitativos Quantitativos
Escala Nominal Escala Ordinal Escala Intervalar Escala absoluta
Maria Filipa Mouro 10
6
Dados Qualitativos
Escala nominal
Quando cada um deles for identificado apenas pela atribuio
de um nome que designa uma classe.
Exemplo: sexo, estado civil
Escala ordinal
Pode-se estabelecer uma ordenao das classes nas quais os dados
so classificados, segundo algum critrio relevante.
Exemplo: muito bom, bom, suficiente,
insuficiente
Maria Filipa Mouro 11
Dados Quantitativos
Escala absoluta
Os dados so diferenciados e ordenados por nmeros expressos
numa escala em que a origem fixa. Nesta escala, zero significa
nada.
Escala de intervalo
Os dados so diferenciados e ordenados por nmeros expressos
numa escala em que a origem arbitrria.
Maria Filipa Mouro 12
7
Comparao entre as diferentes escalas
Escala Nominal Escala Ordinal Escala de Intervalo Escala Absoluta
Dados
classificados
por categorias
no ordenadas
Dados
classificados
por categorias
ordenadas
Dados expressos
numa escala
numrica com
origem arbitrria
Dados expressos
numa escala
numrica com
origem fixa
Maria Filipa Mouro 13
Caracterizao de amostras
Uma amostra diz-se univariada quando cada um dos dados
que a integram mede, numa escala qualquer, apenas um
atributo.
Caso univariado:
Caso bivariado:
Uma amostra diz-se bivariada quando cada um dos dados
que a integram mede, numa escala qualquer, dois atributos.
Maria Filipa Mouro 14
8
Dados Qualitativos
As formas de representao mais usuais para estes tipos de
dados so:
Tabelas de frequncias
Diagramas de barras
Diagramas circulares
Maria Filipa Mouro 15
Numa amostra constituda por 120 peas, constatou-se que 100
no tinham qualquer defeito, 15 tinham defeito mas eram
recuperveis e 5 eram irrecuperveis ( sucata).
Exemplo:
Para fazer o estudo descritivo para esta amostra, comeamos
por construir a tabela de frequncias, das quais fazem parte os
seguintes elementos:
*******************
Maria Filipa Mouro 16
9
Frequncias absolutas: n de dados contidos numa categoria
qualquer i (i=1,2,...,k), representadas por n
i

=
=
k
1 i
i
n n
N total de dados:
Frequncias relativas: % de dados que pertence a uma
categoria qualquer i, de entre o n total de dados, representadas por f
i
k i
n
n
f
i
i
,..., 2 , 1 , = =
Maria Filipa Mouro 17
Teremos ento a seguinte tabela de frequncias:
Categoria das
peas
Frequncia
absoluta (n
i
)
Frequncia
relativa (f
i
)
Sem defeito n
1
=100 f
1
=83.3%
Recuperveis n
2
=15 f
2
=12.5%
Sucata n
3
=5 f
3
=4.2%
Total n=120 100%
Maria Filipa Mouro 18
10
Diagrama de barras
Percentagem de cada tipo de peas na amostra
83,3%
12,5%
4,2%
0
20
40
60
80
100
Sem defeito Recuperveis Sucata
Maria Filipa Mouro 19
Diagrama circular
83,3%
12,5%
4,2%
Percentagem de cada tipo de peas na amostra
Sem defeito
Recuperveis
Sucata
Maria Filipa Mouro 20
11
Dados Quantitativos
As tcnicas a utilizar para descrever amostras constitudas por
dados quantitativos, dependem do tipo de dados que se estejam a
analisar.
Os dados dizem-se discretos se esto associados a uma varivel ( que
define a caracterstica em estudo ) que assume valores finitos ou
infinitos numerveis.
Os dados dizem-se contnuos se esto associados a uma varivel ( que
define a caracterstica em estudo ) que assume valores infinitos
no numerveis.
Maria Filipa Mouro 21
Dados Quantitativos Discretos
Seja N a dimenso de uma populao, da qual se retirou uma
amostra de dimenso n. Estes n elementos possuem uma
caracterstica X que apresenta k modalidades observadas, X
1
,
X
2
,...,X
k
.
D-se o nome de distribuio de frequncias ao conjunto de todos
os valores ou modalidades que uma determinada varivel assume
e das frequncias ou nmero de ocorrncias correspondentes.
Maria Filipa Mouro 22
12
O quadro de frequncias para este tipo de dados toma a seguinte
forma:
X
i
n
i
f
i
N
i
F
i
X
1
n
1
f
1
=n
1
/n n
1
f
1
X
2
n
2
f
2
=n
2
/n n
2
+n
1
f
2
+f
1
... ... ... ... ...
X
k
n
k
f
k
=n
k
/n n
k
+...+n
2
+n
1
f
k
+...+f
2
+f
1
Total n 100%
Maria Filipa Mouro 23
A n
i
d-se o nome de frequncia absoluta e representa o
nmero de vezes que cada modalidade da varivel se repete
na amostra.
A f
i
d-se o nome de frequncia relativa e representa a
frequncia de ocorrncias de cada modalidade.
A N
i
d-se o nome de frequncia absoluta acumulada e a F
i
frequncia relativa acumulada.
Maria Filipa Mouro 24
13
Dados Quantitativos Contnuos
Amostras cuja caracterstica em estudo seja contnua, ou que
possuam muitos valores observados, levam-nos construo de
classes de valores, que assumem o papel das modalidades em
estudo.
Para a construo dessas classes (em nmero k) adoptada uma
das seguintes regras:
1 Regra
Se n<25 ento K= 5;
Se n 25 ento K=
>
n
2 Regra: Regra de Sturges
K = 1 + 3,22 log
10
n
Maria Filipa Mouro 25
Para a construo das classes, teremos ainda que falar na
amplitude ( a
i
) que cada classe vai assumir, partindo do
pressuposto de que todas as classes tero a mesma amplitude.
Amplitude de cada classe:
k
R
a
i
=
em que R a amplitude da amostra ou seja, R= X
mx
- X
min
(i=1,2,...,k)
necessrio ainda introduzir o conceito de ponto mdio ou
centro de classe C
i
, que no mais do que a mdia dos limites de
cada classe.
Maria Filipa Mouro 26
14
Tabela de frequncias para dados contnuos
Classe n
i
C
i
f
i
N
i
F
i
[a
1
,a
2
[
n
1
c
1
f
1
n
1
f
1
[a
2
,a
3
[
n
2
c
2
f
2
n
2
+n
1
f
2
+f
1
...
... ... ... ... ...
[a
k-1
,a
k
]
n
k
c
k
f
k
n
k
+...+n
2
+n
1
=n
f
k
+...+f
2
+
f
1
=100%
Total
n 100%
Maria Filipa Mouro 27
Representao grfica das distribuies de
frequncia
Dados discretos
Grfico de barras ou diagrama diferencial
Este tipo de grfico utilizado para representar
uma distribuio de frequncias relativas ou
absolutas.
Maria Filipa Mouro 28
15
Diagrama integral
Este grfico usado para representar as
frequncias acumuladas ( absolutas ou relativas).
Sendo os dados no discretos, a representao
grfica das frequncias acumuladas vai ter o aspecto
de uma escada.
Maria Filipa Mouro 29
Dados contnuos
Histograma
Este tipo de grfico adequado para representar
as frequncias absolutas ou relativas de uma
coleco de dados contnuos.
construdo com rectngulos adjacentes de tal
modo que a base proporcional amplitude da
classe e a rea proporcional s frequncias da
respectiva classe.
Maria Filipa Mouro 30
16
E se as classes tiverem amplitudes diferentes ?
Aquilo que se faz normalizar todas as frequncias
para que a proporcionalidade das reas se verifique.
Normalizao das frequncias:
Dividem-se as frequncias de cada classe pela
amplitude da respectiva classe, obtendo-se as alturas
(h
i
) de cada rea.
Maria Filipa Mouro 31
Estatsticas
O clculo de estatsticas a forma mais sinttica de resumir
uma coleco de dados.
Com o clculo de estatsticas, pretende-se traduzir em nmeros
aquilo que se aprende da observao de uma tabela de
frequncias ou de um grfico.
Maria Filipa Mouro 32
17
Estatsticas de Localizao
Mdia da amostra
Para uma amostra constituda por n elementos, a mdia
definida pela expresso:

=
=
k
i
i
x
n
x
1
1
(dados no agrupados)
a medida de localizao mais utilizada.
Maria Filipa Mouro 33
Regra geral, os dados de uma amostra tem os seus valores
agrupados. Neste caso, a expresso a utilizar para o clculo da
mdia a seguinte:

= =
= =
k
1 i
i i
k
1 i
i i
x n
n
1
x f x
(dados discretos)
Uma variante a esta expresso aplicvel
quando os dados so classificados como
contnuos (veja-se no acetato seguinte).
Maria Filipa Mouro 34
18
Nesta situao, os dados em vez de serem definidos
individualmente, so caracterizados globalmente pelas frequncias
associadas a diferentes clulas.
Neste caso, a mdia da amostra pode ser calculada de modo
aproximado, recorrendo expresso:

= =
= ~
k
1 i
i i
k
1 i
i i
c n
n
1
c f x
em que c
i
, como j vimos, o ponto mdio da classe.
Maria Filipa Mouro 35
Mediana
outra medida de localizao, que permite identificar um
valor tal que, cerca de metade dos dados so maiores do que a
mediana e os restantes so menores.
Como bvio, para podermos falar em ordem de grandeza
relativamente aos dados que compem a amostra, temos que
considerar os dados colocados por ordem crescente/decrescente
dos seus valores, formando aquilo a que se d o nome de vector
(x
1
,x
2
,...,x
n
).
Maria Filipa Mouro 36
19
Se os dados forem discretos, a mediana da amostra (Med)
definida nos seguintes termos:
Se o nmero de dados que constituem a amostra for
mpar, a mediana toma o valor do dado que ocupa a
posio central no vector ordenado, isto :
2
1 +
=
n
x Med
Maria Filipa Mouro 37
Se o nmero de dados que constituem a amostra for par,
a mediana toma o valor mdio dos dois termos cujas
localizaes no vector mais se aproximam da posio
central, isto :
2
1
2 2
|
|
.
|

\
|
+
=
+
n n
x x
Med
Maria Filipa Mouro 38
20
Quando os dados so contnuos, uma vez que no so
caracterizados individualmente, a mediana da amostra pode ser
definida apenas de forma aproximada.
Seja Li o limite inferior da classe mediana ( aquela onde as
frequncias acumuladas passam de um valor inferior a 0.5 para
um valor superior) e seja A a amplitude desta classe.
Maria Filipa Mouro 39
O valor aproximada da mediana de uma amostra pode ser
obtido atravs da expresso:
A

+ =
+

a a
a
f f
f 5 . 0
Li Med
na qual:

a
f - frequncia relativa acumulada da classe que
precede a classe mediana
+
a
f
- frequncia relativa acumulada correspondente
classe mediana
Maria Filipa Mouro 40
21
Moda
tambm uma medida de localizao, e indica o valor
ou a gama de valores nos quais a concentrao dos
dados amostrais mxima.
Dados discretos
A moda o valor dos dados que ocorre com
maior frequncia, ou seja, o valor observado
com maior frequncia absoluta.
Maria Filipa Mouro 41
Dados contnuos
A moda definida a partir das classes nas quais os
dados so agrupados, como o ponto central ou
mdio da classe com maior frequncia ( a classe
modal).
No entanto, este conceito de moda pode ser refinado, tendo em
conta as frequncias absolutas ou relativas) da classe modal
( n
Mod
ou f
Mod
) e das classes que lhe so adjacentes ( n
1
ou f
1
para a classe esquerda) e (n
2
ou f
2
para a classe direita ).
Maria Filipa Mouro 42
22
A moda pode assim ser calculada atravs da seguinte expresso:
A
+
+ =
2 1
1
d d
d
LI Mod
na qual:
LI: Limite inferior da classe modal
A: amplitude da classe modal
d
1
:n
Mod
-n
1
ou f
Mod
-f
1
d
2
: n
Mod
-n
2
ou f
Mod
-f
2
Maria Filipa Mouro 43
Estas medidas de localizao, alm de resumirem a coleco de
dados a um valor, permitem retirar concluses quanto forma
como os dados esto distribudos.
Se Mdia = Mediana = Moda
Distribuio diz-se
simtrica
Se Mdia>Mediana>Moda
Distribuio diz-se
assimtrica direita
Se Mdia < Mediana < Moda
Distribuio diz-se
assimtrica esquerda
Maria Filipa Mouro 44
23
A(as)simetria de uma distribuio, pode tambm ser estudada
atravs Coeficiente de Assimetria de Pearson:
o
Mod x
g

=
Se g=0, a distribuio diz-se simtrica
Se g<0, a distribuio diz-se assimtrica negativa
Se g>0, a distribuio diz-se assimtrica positiva
Maria Filipa Mouro 45
Disperso
Outro aspecto importante de considerar, quando se faz a anlise
de uma coleco de dados, a disperso ou a variabilidade dos
dados que integram essa amostra.
A disperso definida tomando em conta a posio das
observaes em relao a uma referncia fixa, que deve ser o
valor escolhido para localizar a coleco( regra geral, a mdia).
Quando a mdia escolhida como valor referncia, a medida de
disperso deve sintetizar o comportamento do conjunto dos
desvios em relao mdia, ou seja:
) x x (
i
para i=1,2,...,n
Maria Filipa Mouro 46
24
Estatsticas de disperso
Existem vrias medidas de disperso, tais como:
Disperso da amostra
Intervalo de variao
Intervalo inter-quartis
Desvio quadrtico mdio
Entre outras
Maria Filipa Mouro 47
No entanto, existe uma medida que extremamente usada,
quer em estatstica descritiva quer em inferncia que a
varincia.
Assim, se quisermos fazer uma inferncia acerca da
variabilidade de uma populao de grandes dimenses a partir
de uma amostra aleatria limitada, deve recorrer-se a esta
medida que se representa por s
2.
Maria Filipa Mouro 48
25
Dados discretos

=
k
1 i
2
i i
2
) x x ( n
1 n
1
s

=
k
1 i
2
i i
2
) x c ( n
1 n
1
s
Varincia da amostra
Dados contnuos
Maria Filipa Mouro 49
Uma vez que a dimenso destas medidas de disperso o
quadrado da dimenso original dos dados, contribui para que
seja difcil interpretar os seus valores.
Assim em vez de se caracterizar a disperso dos dados atravs
da varincia da amostra, recorre-se normalmente sua raiz
quadrada, designada por desvio-padro:
2
s s =
Maria Filipa Mouro 50
26
Representao grfica de Estatsticas
Existe uma grande variedade de processos para representar
graficamente estatsticas e simplificar a sua interpretao. No
entanto, o diagrama mais utilizado o diagrama tipo caixa (em
ingls, box plot ou box-and-whisker plot)
Maria Filipa Mouro 51
Valor
mnimo
Valor
mximo
Mediana
1 quartil 3 quartil
Maria Filipa Mouro 52
27
Maria Filipa Mouro
Deste diagrama podemos retirar informaes tais como:
Localizao
Disperso
(As)simetria
53
Localizao: representada pela mediana.
Disperso: O comprimento da caixa mostra a disperso dos
dados em termos da disperso quartal.
(As)simetria: A partir da posio da mediana e do 1 e 3
quartil, conclumos quanto (as)simetria da
coleco de dados.
Distribuio simtrica
Distribuio assimtrica positiva
Distribuio assimtrica negativa
Maria Filipa Mouro 54
28
Se a mediana a medida de localizao que divide a coleco
de dados em duas partes iguais, ou seja, acumula 50% das
observaes, o 1 quartil acumula 25% e o 3 quartil 75%
dessas observaes.
O clculo destas medidas feito recorrendo ao conceito de
mediana, com as devidas alteraes nas frmulas de clculo,
conforme os dados a tratar sejam discretos ou contnuos.
Maria Filipa Mouro 55

Você também pode gostar