Escolar Documentos
Profissional Documentos
Cultura Documentos
Capítulo I
ESTATÍSTICA DESCRITIVA
Iola Pinto
ipinto@adm.isel.pt
Sumário
2
Introdução e conceitos básicos
INFERÊNCIA ESTATÍSTICA
Parâmetros
POPULAÇÃO Permite obter conclusões
Características a estimar sobre os parâmetros da
Desconhecidas população
??????
ESTIMAÇÃO DE
TESTES DE HIPÓTESES
PARÂMETROS
ESTATÍSTICA DESCRITIVA
AMOSTRA Descreve os dados da amostra
Características colocando em evidência as
conhecidas suas características importantes.
3
Introdução e conceitos básicos
4
Tipos de dados: exemplos
Ø 5
Tipos de dados
Nominais
Qualitativos
ordinais
Discretos
Quantitativos
Contínuos
6
Tipos de dados
7
Escalas de medida
• Cor dos olhos; grupo sanguíneo: O+, A+, A-, AB+, AB-
8
Organização dos dados
9
Dados qualitativos nominais
10
Dados qualitativos nominais
normal
87%
11
Dados qualitativos ordinais
12
Dados qualitativos ordinais
BAIXO 13.33%
MODERADO 36.67%
ELEVADO 50.00%
13
Variáveis quantitativas
14
Escalas para variáveis quantitativas
15
Listagem das idades de um conjunto de pessoas que
entraram num programa de rastreio
Dados ordenados
16
Organização dos dados
17
Tabela de Frequências
18
Variáveis quantitativas
Caso Discreto
19
Dados Quantitativos discretos
20
Dados Quantitativos discretos
EXEMPLO 2 NÚMERO DE BEBÉS QUE NASCERAM EM 60 HOSPITAIS
NUM DADO ANO
número de Frequência Frequência
nascimentos absoluta relativa
21 1 2.00%
22 1 2.00%
24 3 5.00%
A tabela de frequências
26 1 2.00%
tem tantas linhas quantos
… … …
os valores diferentes que a
57 4 7.00%
variável assume.
58 1 2.00%
59 3 5.00%
TOTAL n= 60 100%
21
EXEMPLO 2 NÚMERO DE BEBÉS QUE NASCERAM EM 60
HOSPITAIS NUM DADO ANO
Gráfico de barras
22
DADOS E CARACTERÍSTICAS AMOSTRAIS
23
Variáveis quantitativas
EXEMPLO 3 Medições de hemoglobina em gramas por 100 ml,
para 70 pacientes
1 8.90
2 9.10 Os valores geralmente
3 9.30
não se repetem …
4 9.40
5 10.00
Quando as variáveis são quantitativas e medidas numa escala
contínua as observações assumem uma infinidade de
diferentes valores possíveis e neste caso a tabela de
frequências, do modo apresentado no exemplo anterior, não
se adequa.
24
Variáveis quantitativas
Caso contínuo
Para proceder ao agrupamento destes dados torna-
se mais adequado a construção de classes, dado
que se utilizássemos as observações e construíssemos
uma tabela de frequências iríamos obter
demasiados casos diferentes cujas frequências
relativas iriam ser muito baixas.
25
Variáveis quantitativas
Agrupamento dos dados em classes
n: dimensão da amostra
26
Variáveis quantitativas
28
Variáveis quantitativas
Dados agrupados em intervalos de classe
29
Medidas descritivas
ØLocalização central: média, mediana e moda
Ø Pesquisa de Outliers
30
Medidas de localização
31
Medidas de localização
32
Propriedades da média
33
Medidas de localização
34
Medidas de localização
1º Ordenar a amostra
2º n é par logo, me=(x(5)+x(6))/2
35
Medidas de localização
36
Assimetria
37
Medidas descritivas
38
Medidas de posição não central
39
Medidas de posição não central
Quantil de ordem p
40
Medidas de posição não central
41
Diagrama de Extremos e quartis
42
Diagrama de Extremos e quartis
OUTLIER
Outlier moderado
X > Q3 +1.5 IQ ou x < Q1 - 1.5 IQ
Outlier Severo
X > Q3 +3.0 IQ ou x < Q1 – 3.0 IQ
43
Medidas de dispersão
44
Medidas de dispersão
45
Medidas de dispersão
46
DEFINITION
If the graph (histogram or frequency polygon) of a distribution is
asymmetric, the distribution is said to be skewed . If a distribution is
not symmetric because its graph extends further to the right than to
Medida Assimetria
the left, that is, if it has a long tail to the right, we say that the distribution
is skewed to the right or is positively skewed. If a distribution is not
symmetric because its graph extends further to the left than to the right,
that is, if it has a long tail to the left, we say that the distribution is
skewed to the left or is negatively skewed.
A distribution will be skewed to the right, or positively skewed, if its mean is greater
than its mode. A distribution will be skewed to the left, or negatively skewed, if its mean is
less than its mode. Skewness can be expressed as follows:
pffiffi P
n pffiffi Pn
n ðxi " !xÞ3 n ðxi " !xÞ3
i¼1 i¼1
Skewness ¼ " #3=2 ¼ pffiffiffiffiffiffiffiffiffiffiffi (2.4.3)
n
P ðn " 1Þ n " 1 s3
ðxi " !xÞ2
i¼1
In Equation 2.4.3, s is the standard deviation of a sample as defined in Equation 2.5.4. Most
computer statistical packages include this statistic as part of a standard printout. A value of
skewness > 0 indicates positive skewness and a value of skewness < 0 indicates negative
skewness. An illustration of skewness is shown in Figure 2.4.1.
EXAMPLE 2.4.6
Consider the three distributions shown in Figure 2.4.1. Given that the histograms represent 47
frequency counts, the data can be easily re-created and entered into a statistical package.
For example, observation of the “No Skew” distribution would yield the following data:
EXAMPLE 2.4.6
Consider the three distributions shown in Figure 2.4.1. Given that the histograms represent
Medida Assimetria
frequency counts, the data can be easily re-created and entered into a statistical package.
For example, observation of the “No Skew” distribution would yield the following data:
5, 5, 6, 6, 6, 7, 7, 7, 7, 8, 8, 8, 8, 8, 9, 9, 9, 9, 10, 10, 10, 11, 11. Values can be obtained from
48
Medidas Achatamento
49
Such a distribution is said to be platykurtic. Conversely, a distribution, in comparison to a
normal distribution, may possess a smaller proportion of observations in its tails, so that its
graph exhibits a more peaked appearance. Such a distribution is said to be leptokurtic. A
normal, or bell-shaped distribution, is said to be mesokurtic.
Medidas Achatamento
Kurtosis can be expressed as
n
P n
P
4
n ðxi " !xÞ n ðxi " !xÞ4
Kurtosis ¼ ! i¼1 "2
" 3 ¼ i¼1
2 4
"3 (2.5.8)
Pn
2 ð n " 1Þ s
ðxi " !xÞ
i¼1
Manual calculation using Equation 2.5.8 is usually not necessary, since most statistical
packages calculate and report information regarding kurtosis as part of the descriptive
statistics for a data set. Note that each of the two parts of Equation 2.5.8 has been reduced
by 3. A perfectly mesokurtic distribution has a kurtosis measure of 3 based on the equation.
Most computer algorithms reduce the measure by 3, as is done in Equation 2.5.8, so that the
kurtosis measure of a mesokurtic distribution will be equal to 0. A leptokurtic distribution,
then, will have a kurtosis measure > 0, and a platykurtic distribution will have a kurtosis
measure < 0. Be aware that not all computer packages make this adjustment. In such cases,
Nota: Usualmente os softwares retornam o resultado deste coeficiente subtraído
comparisons with a mesokurtic distribution are made against 3 instead of against 0. Graphs
de 3 e portanto para a interpretação deve-se comparar com zero.
of distributions representing the three types of kurtosis are shown in Figure 2.5.4.
50
EXAMPLE 2.5.4
Medidas Achatamento
51
Medidas Achatamento
52