ESTATISTICA - DESCRITIVA Cap1

Estatística Biomédica
Capítulo I
ESTATÍSTICA DESCRITIVA
Iola Pinto
ipinto@adm.isel.pt
Sumário
1. Introdução à Estatística Descritiva: conceitos

importantes e tipos de dados
2. Organização dos dados e representações gráficas
3. Medidas descritivas: localização, tendência não

central, dispersão, assimetria e achatamento
4. Exemplos de aplicação em RStudio
2
Introdução e conceitos básicos
INFERÊNCIA ESTATÍSTICA
Parâmetros
POPULAÇÃO Permite obter conclusões
Características a estimar sobre os parâmetros da
Desconhecidas população
??????
ESTIMAÇÃO DE
TESTES DE HIPÓTESES
PARÂMETROS
ESTATÍSTICA DESCRITIVA
AMOSTRA Descreve os dados da amostra
Características colocando em evidência as
conhecidas suas características importantes.
3
Introdução e conceitos básicos
4
Tipos de dados: exemplos
ØVariável categórica: variáveis qualitativas

§ Proporção, risco ou chance de ser
portador de um vírus;
§ Proporção de crianças diagnosticadas
com ASMA;
ØVariável numérica: variáveis quantitativas

§ Número de leucócitos
§ Peso à nascença
§ Nível de colesterol
Ø 5
Tipos de dados
Nominais
Qualitativos
ordinais
Discretos
Quantitativos
Contínuos
6
Tipos de dados
7
Escalas de medida
• Cor dos olhos; grupo sanguíneo: O+, A+, A-, AB+, AB-
8
Organização dos dados
9
Dados qualitativos nominais
EXEMPLO 1 Método de nascimento de 646 bebés

TIPO DE PARTO NÚMERO DE PERCENTAGEM
NASCIMENTOS DE
NASCIMENTOS
(%)
Normal 560 86.69
Forceps 45 6.97
Cesariana 41 6.35
TOTAL n = 646 100%
Frequência absoluta Frequência relativa
10
Dados qualitativos nominais
EXEMPLO 1 Gráfico circular
Frequência dos tipos de parto

cesariana
forceps 6%
7%
normal
87%
11
Dados qualitativos ordinais
12
Dados qualitativos ordinais
EXEMPLO Gráfico de barras
Frequência de pacientes por categoria da variável

número de leucócitos (n=150)
BAIXO 13.33%
MODERADO 36.67%
ELEVADO 50.00%
0.0% 10.0% 20.0% 30.0% 40.0% 50.0% 60.0%
13
Variáveis quantitativas
14
Escalas para variáveis quantitativas
15
Listagem das idades de um conjunto de pessoas que
entraram num programa de rastreio
Dados ordenados
16
Organização dos dados
17
Tabela de Frequências
18
Caso Discreto
19
Dados Quantitativos discretos
EXEMPLO 2 NÚMERO DE BEBÉS QUE NASCERAM EM 60 HOSPITAIS

NUM DADO ANO
ü A variável em estudo representa uma contagem

ü n = 60 (dimensão da amostra)
20
Dados Quantitativos discretos
EXEMPLO 2 NÚMERO DE BEBÉS QUE NASCERAM EM 60 HOSPITAIS
NUM DADO ANO
número de Frequência Frequência
nascimentos absoluta relativa
21 1 2.00%
22 1 2.00%
24 3 5.00%
A tabela de frequências
26 1 2.00%
tem tantas linhas quantos
… … …
os valores diferentes que a
57 4 7.00%
variável assume.
58 1 2.00%
59 3 5.00%
TOTAL n= 60 100%
21
EXEMPLO 2 NÚMERO DE BEBÉS QUE NASCERAM EM 60
HOSPITAIS NUM DADO ANO
Gráfico de barras
22
DADOS E CARACTERÍSTICAS AMOSTRAIS
VARIÁVEIS CONTÍNUAS MEDIÇÕES EXEMPLOS

§Pressão Arterial
Agrupamento dos dados em • Ureia
intervalos de classe • Potássio
• Colesterol
• Glicémia
HISTOGRAMA
Reflete a forma da distribuição
dos dados observados
23
EXEMPLO 3 Medições de hemoglobina em gramas por 100 ml,
para 70 pacientes
1 8.90
2 9.10 Os valores geralmente
3 9.30
não se repetem …
4 9.40
5 10.00
Quando as variáveis são quantitativas e medidas numa escala
contínua as observações assumem uma infinidade de
diferentes valores possíveis e neste caso a tabela de
frequências, do modo apresentado no exemplo anterior, não
se adequa.
24
Caso contínuo
Para proceder ao agrupamento destes dados torna-
se mais adequado a construção de classes, dado
que se utilizássemos as observações e construíssemos
uma tabela de frequências iríamos obter
demasiados casos diferentes cujas frequências
relativas iriam ser muito baixas.
25
Agrupamento dos dados em classes
Indicação para o número de classes a utilizar:
• fórmula de Sturges: K = Int [1+3.321928 log10(n)]
n: dimensão da amostra
26
Dados agrupados em intervalos de classe

Níveis de
hemoglobina Freq. Freq.
(g/100 ml) Absoluta Relativa
[8 - 9[ 1 1.4%
[9 - 10[ 3 4.3%
[10 - 11[ 14 20.0%
[11 - 12[ 19 27.1%
[12 - 13[ 14 20.0%
[13 - 14[ 13 18.6%
[14 - 15[ 5 7.1%
HISTOGRAMA
[15 - 15.9[ 1 1.4%
TOTAL 70 100.0%
27
28
29
Medidas descritivas
ØLocalização central: média, mediana e moda
ØLocalização não central: Quartis, decis e percentis
ØDispersão: amplitude total, variância, desvio padrão,

coeficiente de variação amplitude inter-quartis
ØForma: coeficiente de assimetria e coeficiente de

achatamento
Ø Pesquisa de Outliers
30
Medidas de localização
31
32
Propriedades da média
33
34
Calcular a mediana das seguintes observações:
38, 43, 50, 57, 57, 59, 61, 64, 65 , 66 (n=10)
1º Ordenar a amostra
2º n é par logo, me=(x(5)+x(6))/2
observação na 5ª posição na amostra ordenada

Mediana = (57+59)/2=58
35
36
Assimetria
Por comparação das medidas de localização central

pode-se caracterizar uma distribuição quanto à assimetria.
37
Medidas descritivas
Assimétrica positiva ou Assimétrica negativa ou

simétrica
enviesada à direita enviesada à esquerda
38
Medidas de posição não central
39
Quantil de ordem p
O quantil de ordem p de um dado conjunto de n observações

x1; x2; . . . xn, é o valor de X tal que p por cento ou menos das
observações são menores que X e (100-p) por cento ou menos
das observações são maiores que X.
40
41
Diagrama de Extremos e quartis
42
Diagrama de Extremos e quartis
OUTLIER
Um outlier é uma observação cujo valor,

x, excede o valor do terceiro quartil por
uma magnitude superior a 1.5 (IQ) ou
que é inferior ao valor do primeiro
quartil em magnitude superior a 1.5 (IQ).
Outlier moderado
X > Q3 +1.5 IQ ou x < Q1 - 1.5 IQ
Outlier Severo
X > Q3 +3.0 IQ ou x < Q1 – 3.0 IQ
43
Medidas de dispersão
44
45
46
DEFINITION
If the graph (histogram or frequency polygon) of a distribution is
asymmetric, the distribution is said to be skewed . If a distribution is
not symmetric because its graph extends further to the right than to
Medida Assimetria
the left, that is, if it has a long tail to the right, we say that the distribution
is skewed to the right or is positively skewed. If a distribution is not
symmetric because its graph extends further to the left than to the right,
that is, if it has a long tail to the left, we say that the distribution is
skewed to the left or is negatively skewed.
A distribution will be skewed to the right, or positively skewed, if its mean is greater
than its mode. A distribution will be skewed to the left, or negatively skewed, if its mean is
less than its mode. Skewness can be expressed as follows:
pffiffi P
n pffiffi Pn
n ðxi " !xÞ3 n ðxi " !xÞ3
i¼1 i¼1
Skewness ¼ " #3=2 ¼ pffiffiffiffiffiffiffiffiffiffiffi (2.4.3)
n
P ðn " 1Þ n " 1 s3
ðxi " !xÞ2
i¼1
In Equation 2.4.3, s is the standard deviation of a sample as defined in Equation 2.5.4. Most
computer statistical packages include this statistic as part of a standard printout. A value of
skewness > 0 indicates positive skewness and a value of skewness < 0 indicates negative
skewness. An illustration of skewness is shown in Figure 2.4.1.
EXAMPLE 2.4.6
Consider the three distributions shown in Figure 2.4.1. Given that the histograms represent 47
frequency counts, the data can be easily re-created and entered into a statistical package.
For example, observation of the “No Skew” distribution would yield the following data:
EXAMPLE 2.4.6
Consider the three distributions shown in Figure 2.4.1. Given that the histograms represent
Medida Assimetria
frequency counts, the data can be easily re-created and entered into a statistical package.
For example, observation of the “No Skew” distribution would yield the following data:
5, 5, 6, 6, 6, 7, 7, 7, 7, 8, 8, 8, 8, 8, 9, 9, 9, 9, 10, 10, 10, 11, 11. Values can be obtained from
FIGURE 2.4.1 Three histograms illustrating skewness.
48
Medidas Achatamento
49
Such a distribution is said to be platykurtic. Conversely, a distribution, in comparison to a
normal distribution, may possess a smaller proportion of observations in its tails, so that its
graph exhibits a more peaked appearance. Such a distribution is said to be leptokurtic. A
normal, or bell-shaped distribution, is said to be mesokurtic.
Medidas Achatamento
Kurtosis can be expressed as
n
P n
P
4
n ðxi " !xÞ n ðxi " !xÞ4
Kurtosis ¼ ! i¼1 "2
" 3 ¼ i¼1
2 4
"3 (2.5.8)
Pn
2 ð n " 1Þ s
ðxi " !xÞ
i¼1
Manual calculation using Equation 2.5.8 is usually not necessary, since most statistical
packages calculate and report information regarding kurtosis as part of the descriptive
statistics for a data set. Note that each of the two parts of Equation 2.5.8 has been reduced
by 3. A perfectly mesokurtic distribution has a kurtosis measure of 3 based on the equation.
Most computer algorithms reduce the measure by 3, as is done in Equation 2.5.8, so that the
kurtosis measure of a mesokurtic distribution will be equal to 0. A leptokurtic distribution,
then, will have a kurtosis measure > 0, and a platykurtic distribution will have a kurtosis
measure < 0. Be aware that not all computer packages make this adjustment. In such cases,
Nota: Usualmente os softwares retornam o resultado deste coeficiente subtraído
comparisons with a mesokurtic distribution are made against 3 instead of against 0. Graphs
de 3 e portanto para a interpretação deve-se comparar com zero.
of distributions representing the three types of kurtosis are shown in Figure 2.5.4.
50
EXAMPLE 2.5.4
Medidas Achatamento
51
Medidas Achatamento
52

ESTATISTICA - DESCRITIVA Cap1

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

ESTATISTICA - DESCRITIVA Cap1

Enviado por

Direitos autorais:

Formatos disponíveis

Estatística Biomédica

1. Introdução à Estatística Descritiva: conceitos

2. Organização dos dados e representações gráficas

3. Medidas descritivas: localização, tendência não

4. Exemplos de aplicação em RStudio

ØVariável categórica: variáveis qualitativas

ØVariável numérica: variáveis quantitativas

EXEMPLO 1 Método de nascimento de 646 bebés

Frequência absoluta Frequência relativa

EXEMPLO 1 Gráfico circular

Frequência dos tipos de parto

EXEMPLO Gráfico de barras

Frequência de pacientes por categoria da variável

0.0% 10.0% 20.0% 30.0% 40.0% 50.0% 60.0%

EXEMPLO 2 NÚMERO DE BEBÉS QUE NASCERAM EM 60 HOSPITAIS

ü A variável em estudo representa uma contagem

VARIÁVEIS CONTÍNUAS MEDIÇÕES EXEMPLOS

Indicação para o número de classes a utilizar:

• fórmula de Sturges: K = Int [1+3.321928 log10(n)]

Dados agrupados em intervalos de classe

ØLocalização não central: Quartis, decis e percentis

ØDispersão: amplitude total, variância, desvio padrão,

ØForma: coeficiente de assimetria e coeficiente de

Calcular a mediana das seguintes observações:

38, 43, 50, 57, 57, 59, 61, 64, 65 , 66 (n=10)

observação na 5ª posição na amostra ordenada

Por comparação das medidas de localização central

Assimétrica positiva ou Assimétrica negativa ou

O quantil de ordem p de um dado conjunto de n observações

Um outlier é uma observação cujo valor,

FIGURE 2.4.1 Three histograms illustrating skewness.

Você também pode gostar