Você está na página 1de 52

Estatística Biomédica

Capítulo I
ESTATÍSTICA DESCRITIVA

Iola Pinto
ipinto@adm.isel.pt
Sumário

1. Introdução à Estatística Descritiva: conceitos


importantes e tipos de dados

2. Organização dos dados e representações gráficas

3. Medidas descritivas: localização, tendência não


central, dispersão, assimetria e achatamento

4. Exemplos de aplicação em RStudio

2
Introdução e conceitos básicos

INFERÊNCIA ESTATÍSTICA
Parâmetros
POPULAÇÃO Permite obter conclusões
Características a estimar sobre os parâmetros da
Desconhecidas população
??????

ESTIMAÇÃO DE
TESTES DE HIPÓTESES
PARÂMETROS

ESTATÍSTICA DESCRITIVA
AMOSTRA Descreve os dados da amostra
Características colocando em evidência as
conhecidas suas características importantes.

3
Introdução e conceitos básicos

4
Tipos de dados: exemplos

ØVariável categórica: variáveis qualitativas


§ Proporção, risco ou chance de ser
portador de um vírus;
§ Proporção de crianças diagnosticadas
com ASMA;

ØVariável numérica: variáveis quantitativas


§ Número de leucócitos
§ Peso à nascença
§ Nível de colesterol

Ø 5
Tipos de dados

Nominais
Qualitativos
ordinais

Discretos
Quantitativos
Contínuos

6
Tipos de dados

7
Escalas de medida

• Cor dos olhos; grupo sanguíneo: O+, A+, A-, AB+, AB-

8
Organização dos dados

9
Dados qualitativos nominais

EXEMPLO 1 Método de nascimento de 646 bebés


TIPO DE PARTO NÚMERO DE PERCENTAGEM
NASCIMENTOS DE
NASCIMENTOS
(%)
Normal 560 86.69
Forceps 45 6.97
Cesariana 41 6.35
TOTAL n = 646 100%

Frequência absoluta Frequência relativa

10
Dados qualitativos nominais

EXEMPLO 1 Gráfico circular

Frequência dos tipos de parto


cesariana
forceps 6%
7%

normal
87%

11
Dados qualitativos ordinais

12
Dados qualitativos ordinais

EXEMPLO Gráfico de barras

Frequência de pacientes por categoria da variável


número de leucócitos (n=150)

BAIXO 13.33%

MODERADO 36.67%

ELEVADO 50.00%

0.0% 10.0% 20.0% 30.0% 40.0% 50.0% 60.0%

13
Variáveis quantitativas

14
Escalas para variáveis quantitativas

15
Listagem das idades de um conjunto de pessoas que
entraram num programa de rastreio

Dados ordenados

16
Organização dos dados

17
Tabela de Frequências

18
Variáveis quantitativas
Caso Discreto

19
Dados Quantitativos discretos

EXEMPLO 2 NÚMERO DE BEBÉS QUE NASCERAM EM 60 HOSPITAIS


NUM DADO ANO

ü A variável em estudo representa uma contagem


ü n = 60 (dimensão da amostra)

20
Dados Quantitativos discretos
EXEMPLO 2 NÚMERO DE BEBÉS QUE NASCERAM EM 60 HOSPITAIS
NUM DADO ANO
número de Frequência Frequência
nascimentos absoluta relativa
21 1 2.00%
22 1 2.00%
24 3 5.00%
A tabela de frequências
26 1 2.00%
tem tantas linhas quantos
… … …
os valores diferentes que a
57 4 7.00%
variável assume.
58 1 2.00%
59 3 5.00%
TOTAL n= 60 100%

21
EXEMPLO 2 NÚMERO DE BEBÉS QUE NASCERAM EM 60
HOSPITAIS NUM DADO ANO

Gráfico de barras

22
DADOS E CARACTERÍSTICAS AMOSTRAIS

VARIÁVEIS CONTÍNUAS MEDIÇÕES EXEMPLOS


§Pressão Arterial
Agrupamento dos dados em • Ureia
intervalos de classe • Potássio
• Colesterol
• Glicémia
HISTOGRAMA
Reflete a forma da distribuição
dos dados observados

23
Variáveis quantitativas
EXEMPLO 3 Medições de hemoglobina em gramas por 100 ml,
para 70 pacientes

1 8.90
2 9.10 Os valores geralmente
3 9.30
não se repetem …
4 9.40
5 10.00
Quando as variáveis são quantitativas e medidas numa escala
contínua as observações assumem uma infinidade de
diferentes valores possíveis e neste caso a tabela de
frequências, do modo apresentado no exemplo anterior, não
se adequa.
24
Variáveis quantitativas
Caso contínuo
Para proceder ao agrupamento destes dados torna-
se mais adequado a construção de classes, dado
que se utilizássemos as observações e construíssemos
uma tabela de frequências iríamos obter
demasiados casos diferentes cujas frequências
relativas iriam ser muito baixas.

25
Variáveis quantitativas
Agrupamento dos dados em classes

Indicação para o número de classes a utilizar:

• fórmula de Sturges: K = Int [1+3.321928 log10(n)]

n: dimensão da amostra

26
Variáveis quantitativas

Dados agrupados em intervalos de classe


Níveis de
hemoglobina Freq. Freq.
(g/100 ml) Absoluta Relativa
[8 - 9[ 1 1.4%
[9 - 10[ 3 4.3%
[10 - 11[ 14 20.0%
[11 - 12[ 19 27.1%
[12 - 13[ 14 20.0%
[13 - 14[ 13 18.6%
[14 - 15[ 5 7.1%
HISTOGRAMA
[15 - 15.9[ 1 1.4%
TOTAL 70 100.0%
27
Variáveis quantitativas
Dados agrupados em intervalos de classe

28
Variáveis quantitativas
Dados agrupados em intervalos de classe

29
Medidas descritivas
ØLocalização central: média, mediana e moda

ØLocalização não central: Quartis, decis e percentis

ØDispersão: amplitude total, variância, desvio padrão,


coeficiente de variação amplitude inter-quartis

ØForma: coeficiente de assimetria e coeficiente de


achatamento

Ø Pesquisa de Outliers
30
Medidas de localização

31
Medidas de localização

32
Propriedades da média

33
Medidas de localização

34
Medidas de localização

Calcular a mediana das seguintes observações:

38, 43, 50, 57, 57, 59, 61, 64, 65 , 66 (n=10)

1º Ordenar a amostra
2º n é par logo, me=(x(5)+x(6))/2

observação na 5ª posição na amostra ordenada


Mediana = (57+59)/2=58

35
Medidas de localização

36
Assimetria

Por comparação das medidas de localização central


pode-se caracterizar uma distribuição quanto à assimetria.

37
Medidas descritivas

Assimétrica positiva ou Assimétrica negativa ou


simétrica
enviesada à direita enviesada à esquerda

38
Medidas de posição não central

39
Medidas de posição não central

Quantil de ordem p

O quantil de ordem p de um dado conjunto de n observações


x1; x2; . . . xn, é o valor de X tal que p por cento ou menos das
observações são menores que X e (100-p) por cento ou menos
das observações são maiores que X.

40
Medidas de posição não central

41
Diagrama de Extremos e quartis

42
Diagrama de Extremos e quartis

OUTLIER

Um outlier é uma observação cujo valor,


x, excede o valor do terceiro quartil por
uma magnitude superior a 1.5 (IQ) ou
que é inferior ao valor do primeiro
quartil em magnitude superior a 1.5 (IQ).

Outlier moderado
X > Q3 +1.5 IQ ou x < Q1 - 1.5 IQ

Outlier Severo
X > Q3 +3.0 IQ ou x < Q1 – 3.0 IQ

43
Medidas de dispersão

44
Medidas de dispersão

45
Medidas de dispersão

46
DEFINITION
If the graph (histogram or frequency polygon) of a distribution is
asymmetric, the distribution is said to be skewed . If a distribution is
not symmetric because its graph extends further to the right than to
Medida Assimetria
the left, that is, if it has a long tail to the right, we say that the distribution
is skewed to the right or is positively skewed. If a distribution is not
symmetric because its graph extends further to the left than to the right,
that is, if it has a long tail to the left, we say that the distribution is
skewed to the left or is negatively skewed.

A distribution will be skewed to the right, or positively skewed, if its mean is greater
than its mode. A distribution will be skewed to the left, or negatively skewed, if its mean is
less than its mode. Skewness can be expressed as follows:

pffiffi P
n pffiffi Pn
n ðxi " !xÞ3 n ðxi " !xÞ3
i¼1 i¼1
Skewness ¼ " #3=2 ¼ pffiffiffiffiffiffiffiffiffiffiffi (2.4.3)
n
P ðn " 1Þ n " 1 s3
ðxi " !xÞ2
i¼1

In Equation 2.4.3, s is the standard deviation of a sample as defined in Equation 2.5.4. Most
computer statistical packages include this statistic as part of a standard printout. A value of
skewness > 0 indicates positive skewness and a value of skewness < 0 indicates negative
skewness. An illustration of skewness is shown in Figure 2.4.1.

EXAMPLE 2.4.6
Consider the three distributions shown in Figure 2.4.1. Given that the histograms represent 47
frequency counts, the data can be easily re-created and entered into a statistical package.
For example, observation of the “No Skew” distribution would yield the following data:
EXAMPLE 2.4.6
Consider the three distributions shown in Figure 2.4.1. Given that the histograms represent

Medida Assimetria
frequency counts, the data can be easily re-created and entered into a statistical package.
For example, observation of the “No Skew” distribution would yield the following data:
5, 5, 6, 6, 6, 7, 7, 7, 7, 8, 8, 8, 8, 8, 9, 9, 9, 9, 10, 10, 10, 11, 11. Values can be obtained from

FIGURE 2.4.1 Three histograms illustrating skewness.

48
Medidas Achatamento

49
Such a distribution is said to be platykurtic. Conversely, a distribution, in comparison to a
normal distribution, may possess a smaller proportion of observations in its tails, so that its
graph exhibits a more peaked appearance. Such a distribution is said to be leptokurtic. A
normal, or bell-shaped distribution, is said to be mesokurtic.
Medidas Achatamento
Kurtosis can be expressed as

n
P n
P
4
n ðxi " !xÞ n ðxi " !xÞ4
Kurtosis ¼ ! i¼1 "2
" 3 ¼ i¼1
2 4
"3 (2.5.8)
Pn
2 ð n " 1Þ s
ðxi " !xÞ
i¼1

Manual calculation using Equation 2.5.8 is usually not necessary, since most statistical
packages calculate and report information regarding kurtosis as part of the descriptive
statistics for a data set. Note that each of the two parts of Equation 2.5.8 has been reduced
by 3. A perfectly mesokurtic distribution has a kurtosis measure of 3 based on the equation.
Most computer algorithms reduce the measure by 3, as is done in Equation 2.5.8, so that the
kurtosis measure of a mesokurtic distribution will be equal to 0. A leptokurtic distribution,
then, will have a kurtosis measure > 0, and a platykurtic distribution will have a kurtosis
measure < 0. Be aware that not all computer packages make this adjustment. In such cases,
Nota: Usualmente os softwares retornam o resultado deste coeficiente subtraído
comparisons with a mesokurtic distribution are made against 3 instead of against 0. Graphs
de 3 e portanto para a interpretação deve-se comparar com zero.
of distributions representing the three types of kurtosis are shown in Figure 2.5.4.
50
EXAMPLE 2.5.4
Medidas Achatamento

51
Medidas Achatamento

52

Você também pode gostar