Escolar Documentos
Profissional Documentos
Cultura Documentos
ano
ESTATSTICA DESCRITIVA
Noes gerais de estatstica Conceito: uma parte da matemtica aplicada que fornece mtodos para colecta, organizao, descrio, anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises. Estatstica: um ramo do conhecimento que consta de um conjunto de processos cujo objectivo a observao, a classificao formal e a anlise de fenmenos colectivos ou de massa (finalidade descritiva) e, tambm, de investigar a possibilidade de fazer inferncias indutivas vlidas a partir de dados observados e buscar mtodos para permitir essa inferncia (finalidade indutiva).
Por: E. Seno FE-UAN - 2006 2
Noes gerais de estatstica Fases do mtodo estatstico: 1 - DEFINIO DO PROBLEMA: Saber exactamente aquilo que se pretende pesquisar o mesmo que definir correctamente o problema problema. 2 - PLANEAMENTO: Como levantar informaes? Que dados devero ser obtidos? Qual levantamento a ser utilizado? Censitrio? Por amostragem? E o cronograma de actividades? Os custos envolvidos? etc. 3 - COLECTA DE DADOS: Fase operacional. o registro sistemtico de dados, com um objectivo determinado.
prpria pessoa ou organizao que os haja recolhido. Ex: tabelas d IPC d INE. b l do do
outra organizao. Ex: quando determinado jornal publica estatsticas referentes ao REMPE (Recenseamento de empresas e estabelecimentos) do INE.
OBS: mais seguro trabalhar com fontes primrias. O uso g p da fonte secundria traz o grande risco de erros de transcrio.
Por: E. Seno FE-UAN - 2006 4
Colecta directa: quando obtida directamente da fonte. Ex: Empresa que realiza uma pesquisa para saber a preferncia dos consumidores pela sua marca.
A colecta directa pode ser: contnua (registos de co ecta d ecta se co t ua ( eg stos nascimento, bitos, casamentos, etc.), peridica (recenseamento demogrfico, censo industrial) e ocasional (registo de casos de clera).
Colecta Indirecta: feita por dedues a partir g p dos elementos conseguidos pela colecta directa, por analogia, por avaliao, indcios ou proporcionalizao.
Por: E. Seno FE-UAN - 2006 5
Noes gerais de estatstica Fases do mtodo estatstico: 4 - APURAMENTO DOS DADOS: Resumo dos dados atravs de sua contagem e agrupamento. a condensao e tabulao dos dados. 5 - APRESENTAO DOS DADOS: H duas formas de apresentao, que no se excluem mutuamente. A apresentao tabular ou seja uma apresentao tabular, numrica dos dados em linhas e colunas distribudas de modo ordenado, segundo regras prticas fixadas. A apresentao grfica dos dados numricos constitui uma apresentao geomtrica permitindo uma viso rpida e clara do fenmeno.
6 - ANLISE E INTERPRETAO DOS DADOS DADOS: A ltima fase do trabalho estatstico a mais p e delicada. Est ligada g importante essencialmente ao clculo de medidas e coeficientes, cuja finalidade principal descrever o fenmeno (estatstica descritiva) descritiva). Na estatstica indutiva a interpretao dos dados se fundamentam na teoria da probabilidade.
apresentao de dados em grficos e tabelas e do clculo d parmetros numricos para d l l de descrio d de dados, tais como frequncias, mdias, medianas, percentagens e faixas de variao.
concluses ou tomar decises sobre uma populao a partir de evidncias apresentadas pelos dados numricos relativos populao, ou a uma amostra dela.
Por: E. Seno FE-UAN - 2006 8
1. Denomina-se varivel estatstica, a caracterstica em relao qual se realiza o estudo. Pode ser: d d
Quantitativos: resultam de medidas numricas, como peso altura tempo e distncia; ou de peso, altura, contagens, como nmero de filhos, nmero de televisores em casa e nmero de furos em uma cmara de ar etc ar, etc. Qualitativos: resultam de observaes sobre caractersticas, como sexo, raa, religio, tipo de ocupao econmica, tipo de dieta ao qual foi submetido, etc.
Por: E. Seno FE-UAN - 2006 9
10
so objecto de um determinado estudo e interessam ao investigador. Assim, as populaes so os conjuntos fundamentais para efectuar anlises estatsticas estatsticas.
que objecto de observao, qualquer que seja a sua natureza, desde que possa corresponder a uma definio precisa (ser vivo uma instituio um objecto vivo, instituio, objecto, um facto qualquer, etc)
11
Noes gerais de estatstica Conceitos fundamentais: 4. Amostra: Coleco de dados representativa da populao; subconjunto da populao para efeitos de estudo Dimenso ou tamanho da amostra: o nmero de dados da amostra Representa-se normalmente por n. amostra. Representa se N representa a dimenso da populao.
5.
12
Distribuio de frequncias De variveis discretas: A distribuio de frequncias constitui o mtodo de organizao de informao mais utilizado em estatstica. Os quadros e grficos de frequncias permitem agregar e sintetizar grandes quantidades d i f i i d id d de informao sem perda duas caractersticas fundamentais. Def.: Considere-se Def : Considere se uma populao (de dimenso N) ou uma amostra (de dimenso n) de indivduos com a caracterstica X que apresenta k modalidades observadas X1, X2, , Xk. D. D.se o nome de distribuio de frequncias ao conjunto de todos os valores ou modalidades possveis de uma varivel e das frequncias ou nmero de ocorrncias correspondentes. correspondentes.
13
Frequncias Xi X1 X2 X3
. . .
Absolutas ni n1 n2 n3
. . .
Xk
nk
14
Distribuio de frequncias De variveis discretas: Ex.: Medidas do grau de satisfao com os servios de homebanking de um dado banco para uma amostra de 12 clientes do banco (1 = completamente insatisfeito; 5 = completamente satisfeito): No do clie nte: Grau de satis fa o:
10
11
12
15
Distribuio de frequncias De variveis discretas: Para se analisar os dados, pode-se tabular o nmero de vezes que cada valor de grau de satisfao ocorreu, que a frequncia de cada valor: q Valor 1 2 3 4 5 Total Frequncia 1 1 2 5 3 12
Por: E. Seno FE-UAN - 2006 16
Distribuio de frequncias De variveis discretas: O exemplo acima corresponde distribuio de frequncias. mesmos dados atravs de um que d uma ideia da forma todos os resultados possveis: ao que se chama de uma Pode-se apresentar os diagrama de frequncias frequncias, da distribuio ao cobrir
17
Distribuio de frequncias De variveis discretas: Def.: Chama-se frequncia absoluta de xi, e representa-se por ni, ao nmero de vezes que este valor observado Por outras palavras a frequncia absoluta observado. palavras, de um acontecimento dado pelo nmero de ocorrncia deste acontecimento. A partir d ti das f frequncias absolutas podem-se calcular as i b l t d l l frequncias relativas, as frequncias absolutas acumuladas e as frequncias relativas acumuladas Def.: A frequncia relativa de xi, e representa-se por fi, definida pelo quociente entre a frequncia absoluta e a dimenso da coleco, ou seja,
fi = ni / n
Por: E. Seno FE-UAN - 2006 18
Distribuio de frequncias De variveis discretas: Def.: As frequncias acumuladas so a soma do nmero de ocorrncias para os valores da varivel inferiores ou iguais ao valor dado. Representam, assim, g p , , o nmero ou proporo de elementos observados que possuem o valor da caracterstica igual ou inferior modalidade em causa. A frequncia acumulada em b dada pela soma das frequncias absolutas (ou relativas) dos valores da varivel i f i i l inferiores ou i iguais a b. i Na prtica podem entretanto ser calculadas e interpretadas frequncias acumuladas em sentido p q descendentes.
19
fak = f1 + f2 + + fk = 1
20
Total
1
Por: E. Seno FE-UAN - 2006
Distribuio de frequncias De variveis contnuas: O quadro apresentado na pgina adequado nas seguintes situaes: anterior no
Quando a varivel discreta toma valores num intervalo muito grande; Quando a varivel contnua.
Nestes dois casos usual adoptar variveis classificadas classificadas. Def.: Uma varivel classificada uma varivel cujo domnio foi segmentado constituindo classes disjuntas e segmentado, sucessivas. Torna-se ento Torna se ento, aconselhvel efectuar um agrupamento dos dados em classes de valores.
21
necessrio
Para classes de valores de uma varivel contnua, tomam-se, em regra, intervalos, correctamente designados intervalos de classes A definio de classes. classes consiste, assim, na fixao dos limites desses intervalos ou limites de classes.
Por: E. Seno FE-UAN - 2006 22
Distribuio de frequncias De variveis contnuas: Nmero de classes p No existe uma frmula exacta para o clculo do nmero de classes. Depende do intervalo de variao e do nmero de observaes. O bom senso diz nos que no dever ser um nmero diz-nos muito grande, para que no introduza irregularidades que podero no existir na populao, mas tambm no deve ser muito pequeno, para que no h j perda d d it haja d de informaes. No N existe nenhum mtodo rigoroso para a seleco d i t h t d i l do nmero de classes ou intervalos.
Por: E. Seno FE-UAN - 2006 23
Distribuio de frequncias De variveis contnuas: Nmero de classes p , g , g p p p Apresentam-se, a seguir, algumas propostas para a determinao do nmero de classes (de amplitude igual) p k = 5 para n < 25 e k = n para n 25 p
Frmula de Struges: k = 1 + 3,22 log (n) Frmula de Struges original: k tal que 2k n
25
Distribuio de frequncias De variveis contnuas: Amplitude de classe A amplitude das classes (ai) (para as classes de igual a amplitude) pode ser calculada da seguinte forma:
AT X mx X min ai = = k k
Em que: q AT a diferena entre o mximo e o mnimo das observaes (amplitude total = intervalo de variao) k o nmero de classes Resumindo, a amplitude de uma classe i a diferena entre o valor mais elevado e o valor mais baixo dessa classe.
Por: E. Seno FE-UAN - 2006 26
Distribuio de frequncias De variveis contnuas: Limites de classes Os limites das classes inferior (li) e superior (ls) para classes, l l ), amplitudes de classe constantes e iguais a a, podem ser obtidos conforme quadro abaixo: Vamos considerar para facilitar os clculos que, o mximo da coleco ir pertencer ltima classe e corresponde ao seu limite superior. Para as restantes classes vamos usar a conveno de as classes serem fechadas esquerda e abertas direita [ Xi ; Xi+1 [ i+1
27
1 2 3
. . .
Xmin + (k-1)a
Xmin + ka
28
O centro d classe i obtm-se somando o l da l b d limite inferior e o limite superior da classe e dividindo por dois e dado por: dois,
X i + X i +1 ci = X'i = 2
29
Distribuio de frequncias De variveis contnuas: Ex.: Os seguintes dados referem-se ao tempo gasto (em minutos) por 42 trabalhadores entre a sua residncia e o local de trabalho numa determinada cidade: 5 12 23 15 27 14 21 31 22 38 8 47 26 5 17 20 24 19 13 50 32 11 12 22
Por: E. Seno FE-UAN - 2006
24 18 7 26 39 28
29 33 17 25 25 9
37 14 42 29 28 18
30
Distribuio de frequncias De variveis contnuas: Facilmente se verifica ser pouco prtico organizar os dados individualmente em srie. Os objectivos so p p g p melhor cumpridos se procedermos ao agrupamento dos dados: Depois de ordenar os dados, tem-se:
Tamanho da coleco: n = 42; Valor mnimo: Xmin = 5 Valor mximo: Xmx = 50 Amplitude total da coleco: Xmx - Xmin = 50 5 = 45 Limite inferior da primeira classe: 5 Limite superior da ltima classe: 50 Nmero de classes: k = 1 + 3 22 log (42) 6 3,22 6. Amplitude das classes: ai = AT / k = 45 / 6 = 7,5
31
Freq. Acumul. abs. asc. nai 8 17 29 36 40 42 desc. nai 42 34 25 13 6 2 asc. fai 0,19047619 0,40476190 0,69047619 0,85714286 0,95238095 0 95238095 1 relat. desc. fai 1 0,80952381 0,59523810 0,30952381 0,14285714 0 14285714 0,04761905
i 1 2 3 4 5 6
Total
32
Tipos de Medidas
Medidas de localizao Medidas de disperso; Medidas de concentrao; Medidas de assimetria; Medidas de curtose (achatamento).
Por: E. Seno FE-UAN - 2006 33
Medidas de localizao
De tendncia central
Mdias (pela grandeza): Aritmtica; Geomtrica; Harmnica. Mediana (pela posio); Moda
34
Mdia aritmtica
Valor mdio pela sua grandeza; Obtm-se somando todos os dados e dividir pelo nmero destes; a medida de localizao mais importante e a mdia mais utilizada.
35
Na amostra:
X = X
1
+ X
2 + ... + X n
X n
i =1
Na Populao:
=
X
1
+ X
2 + ... + X N
Por: E. Seno FE-UAN - 2006
X N
i =1
36
Na amostra:
X = X 1 .n1 + X 2 .n 2 + ... + X k .n k
i =1
i =1
X i .n i n
ni
i =1
X i. fi
Na populao:
=
X 1 . N 1 + X 2 . N 2 + ... + X K . N K
Ni
i =1
X .N
i =1 i
= X i .Fi
i =1
37
Aplica-se em situaes de variveis que resultam de relaes de proporcionalidade directa; Na p tica so as variveis q e prtica a i eis que representam relao entre grandezas da d mesma natureza ( t (ex. j juros, t d tx. de variao);
38
1 n
39
k ni G = Xi i =1
1 n
k 1 k 1 k n ln G = ln X i i = ni . ln X i = f i . ln X i n i =1 n i =1 i =1
O logaritmo da mdia geomtrica igual mdia aritmtica dos logaritmos dos dados, ou seja, a mdia geomtrica igual ao antilogaritmo da mdia aritmtica dos logaritmos dos dados
Por: E. Seno FE-UAN - 2006 40
Mdia harmnica
Aplica-se em situaes de variveis que resultam de relaes de proporcionalidade inversa; Na p tica so as variveis q e prtica a i eis que representam relao entre grandezas de d naturezas dif t diferentes ( t (ex. preo, velocidade, etc);
41
Define-se como sendo o inverso da mdia aritmtica dos inversos dos dados.
H =
n 1 1 1 + + ... + X1 X 2 Xn
i =1
1 Xi
42
H =
n n1 n2 nk + + ... + X1 X 2 Xk
i =1
ni Xi
43
Mediana
em
duas
Me =
Xh+X 2
Calcula-se:
Me : fa ( Me
= 0 ,5
45
Me = Li ( Me )
n na ( Me 1 ) + 2 A ( Me ) n ( Me )
ou,
Por: E. Seno FE-UAN - 2006 46
Me = Li( Me ) +
Onde:
0,5 fa ( Me 1) f ( Me )
A( Me )
Li(Me): Limite inferior da classe mediana; A(Me): A Amplitude d classe mediana; lit d da l di n(Me), f(Me): Frequncias abs. e relativa da classe mediana; na(Me-1), fa(Me-1): Frequncias abs. e relativa acumuladas at classe imediatamente anterior classe mediana;
47
Moda
o valor que mais se verifica no conjunto dos dados, por isso o valor da varivel a que corresponde a maior frequncia; Uma distribuio pode ter duas ou mais modas; assim chamar-se- bi d i h bi-modal, t i d l trimodal,e at multi-modal Assim determina se determina-se
Mo : f ( Mo ) ; n ( Mo ) mxima
Por: E. Seno FE-UAN - 2006 48
Mo = Li( Mo) +
n( Mo+1) n( M 1) + n( M +1) Mo Mo
ou,
A( Mo)
49
Mo = Li( Mo ) +
Onde:
f ( Mo +1) f ( Mo 1) + f ( Mo +1)
A( Mo )
Li(Mo): Limite inferior da classe modal; A(Mo): Amplitude da classe modal; n(Mo+1), f(Mo+1): Frequncias abs e relativa da classe imediatamente a abs. seguir a classe modal; n(Mo-1), f(Mo-1): Frequncias abs. e relativa da classe imediatamente anterior a classe modal
50
Quantis
Quartis: dividem a distribuio em 4 partes iguais; Existem 3 quartis: (Q1) Primeiro quartil: valor at onde se acumula o primeiro quarto (25%) dos dados; (Q2) Segundo quartil: valor at onde se g q acumula a primeira metade (50%) dos dados; (Q3) T Terceiro quartil: valor at onde se i til l t d acumulam os primeiros trs quartos (75%) ; dos dados;
Por: E. Seno FE-UAN - 2006 51
Quantis Q ti Decis: dividem a distribuio em 10 partes iguais; Existem 9 decis; Por exemplo:
D3 (terceiro decil) o valor at ao qual so acumulados os primeiros 30% dos dados; p ; D5 (quinto decil) o valor at ao qual so acumulados os primeiros 50% dos dados Mediana;
52
Quantis Q ti
Percentis: dividem a distribuio em 100 partes iguais; p g ; Existem 99 decis; Por exemplo:
P74 (septuagsimo percentil) o valor at ao qual so acumulados os primeiros 74% dos dados; P50 (quinquagsimo percentil) o valor at ao qual so acumulados os primeiros 50% dos dados - Mediana;
Por: E. Seno FE-UAN - 2006 53
Quantis
Utiliza-se a mesma frmula da mediana p para a sua determinao; por exemplo, ; p p , para o stimo decil (D7)
D7 = Li( D7 ) +
0,7 fa( D7 1) f ( D7 )
A( D7 )
54
Medidas de Disperso
Medidas de Disperso
AT = X mx X min
Intervalo I I l Inter-quartil: di i il distncia primeiro e o terceiro quartis: entre o
I Q = Q3 Q1
Por: E. Seno FE-UAN - 2006 56
i=1
i =1
X i X .n i n
i =1
X i X . fi
57
Mdia aritmtica dos quadrados dos desvios dos valores em relao sua mdia Toma como unidade, o quadrado da unidade dos dados uma medida de disperso muito importante e por isso muito utilizada, principalmente quando se estabelece comparao entre duas distribuies
Por: E. Seno FE-UAN - 2006 58
Na amostra:
S2 =
(X
i =1
X)
n
=
=
2
X
i =1
2
2 i
2 X X i + n. X
i =1
n
+ n. X
2
=
2
i =1
X i 2 n. X n
=
2
i =1
X i n. X
2
1 = n
i =1
Xi X
2
59
Na populao:
i =1
X i N .
2
1 = N
i =1
Xi
2
60
Na amostra:
S
2
2 i
i =1
.n i n . X n
2 i
i =1
. fi X
Na populao:
2 i
i =1
. N i N . N
2 i
i =1
.Fi
61
S =
=
Por: E. Seno FE-UAN - 2006
62
Fornece o grau de disperso entre os dados (em termos relativos) igual ao desvio padro a dividir pela mdia, ou seja: mdia o seja s Na amostra: Cv = X Na populao: Cv =
Por: E. Seno FE-UAN - 2006 63
Medidas de concentrao
Fornecem o grau de concentrao da caracterstica em estudo por parte dos possuidores dessa caracterstica Duas medidas: D as medidas
Grfica: Curva de Lorenz Indicador: ndice (coeficiente) de Gini
64
Gi G
= 1
k 1
q p
i=1 k 1 i=1
65
Medidas de assimetria
3 ( X Me ) Na amostra: G = s
Na populao:
G =
3 ( Me )
66
Coeficiente de Pearson:
G
ou
Mo =
Q 3 + Q 1 2 Me G2 = Q 3 Q1
Quando no se dispe da mdia e do desvio padro.
Por: E. Seno FE-UAN - 2006 67
Medidas de assimetria
Avaliao:
Se G = 0;isto = Me = Mo ; distribuio simtrica; Se G > 0; isto > Me > Mo; distribuio di t ib i assimtrica positiva i t i iti Se G < 0; isto < Me < Mo; distribuio di t ib i assimtrica negativa i t i ti
68
Medidas de achatamento
Indicam a intensidade das frequncias na vizinhana dos valores centrais Grau G a de Curtose: C tose
Q 3 Q1 K = 2 ( P90 P10 )
69
Avaliao
Se K = 0,263; distribuio mesocrtica; Se K > 0,263; distribuio platicrtica; Se K < 0,263; distribuio leptocrtica
70