Você está na página 1de 126

Estatística Descritiva

a Uma Dimensão

1
1.Distribuição de Frequências
 Variável:
 Representa determinadas características ou atributos
de uma população. A notação utilizada para as
variáveis corresponde habitualmente às letras X, Y e
Z.
 Uma variável pode ser qualitativa ou quantitativa
discreta ou contínua.

 Distribuição de frequências:
 Conjunto de todos os valores ou modalidades de uma
variável e do correspondente número de ocorrências.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 2


1.Distribuição de Frequências
 Notação:

x1,x2,...,xk  valores que a variável X pode assumir;

N  número total de elementos da colecção;

ni  frequência absoluta (simples) – número de


ocorrências de xi ;
fi=ni/N  frequência relativa (simples) – percentagem
das ocorrências de xi em relação ao total de
elementos da colecção.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 3


1.Distribuição de Frequências
 Notação: X Variável Discreta

Ni=n1+...+ni  frequência absoluta acumulada – soma do


número de ocorrências observadas para
valores iguais ou inferiores à modalidade xi .

Fi=f1+...+ fi  frequência relativa acumulada – percentagem


das ocorrências, em relação ao total de
elementos da colecção, para valores iguais ou
inferiores à modalidade xi .

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 4


1.Distribuição de Frequências
Quadro de frequências

Frequências simples Frequências acumuladas

absolutas relativas absolutas relativas

Xi ni fi Ni Fi
x1 n1 f1 N1 F1
x2 n2 f2 N2 F2
. . . .
.
. . . .
.
. . . .
.

xk nk fk Nk=n Fk=1

 n 1 - -

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 5


1.Distribuição de Frequências
 Exemplo 1
 Distribuição de frequências do número de refeições
(suplementos) dadas aos recém-nascidos (dados não
classificados):

3 6 4 5
4 2 3 3
2 4 5 4
7 3 3 6
4 5 4 3

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 6


1.Distribuição de Frequências
 Exemplo 1 – continuação:
 Distribuição de frequências do número de refeições dadas aos
recém-nascidos:

Nº de Frequência Frequência Frequência Frequência


refeições absoluta relativa absoluta relativa
acumulada acumulada

2 2 0.10 2 0.10
3 6 0.30 8 0.40
4 6 0.30 14 0.70
5 3 0.15 17 0.85
6 2 0.10 19 0.95
7 1 0.05 20 1.00
Total 20 1 - -

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 7


1.Distribuição de Frequências
 Gráficos de frequências simples:

 Diagrama de barras: gráficos em que no eixo do X estão


representados os valores da variável e no eixo do Y
figuram barras com comprimento igual à frequência
simples (absoluta ou relativa) dos respectivos valores.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 8


1.Distribuição de Frequências
 Exemplo 1 – continuação:

Gráfico de frequências absolutas simples

Gráfico de barras

7
6
Frequência absoluta

5
4
3
2
1
0
2 3 4 5 6 7
nº de refeições

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 9


1.Distribuição de Frequências
 Gráficos de frequências acumuladas:

 Diagrama em escada: gráficos em forma de escada que


representam a distribuição de frequência acumulada
(absoluta ou relativa).

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 10


1.Distribuição de Frequências
 Exemplo 1 – continuação:

Gráfico de frequências relativas acumuladas (diagrama em escada)

Frequência Rel. Acum ulada

1,2

0,8

0,6

0,4

0,2

0
1 1 2 2 33 4 4 5 56 6 7 7 8

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 11


1.Distribuição de Frequências

Variáveis contínuas

 Por poderem tomar um número infinito não


numerável de valores, obrigam-nos à criação de
classes que passam a ser as modalidades da
característica em estudo.

 Não há uma regra cientificamente fundamentada


e universalmente aceite para a construção das
classes.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 12


1.Distribuição de Frequências
 Variáveis contínuas
Determinação do número de classes (sugestões):
 Não deverão ser nem em número muito grande, nem em
número muito pequeno (em geral, deverão ser entre 4 e 14);
 Nenhuma classe deverá ter frequência nula;
 O número de classes, k, pode ser determinado de uma das
seguintes formas:

1. k=5 para n<25 e k n para n25


2. k1+3.32Log(n)  Regra de Sturges
3. k é tal que 2k ≥ n

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 13


1.Distribuição de Frequências
Amplitude das Classes:
 Sempre que possível, deverão ter amplitudes iguais;
 A amplitude das classes pode ser determinada da seguinte
forma:

Xmax - Xmin Xmax - valor máximo da variável


a= Xmin – valor mínimo da variável
k

Ponto Médio da Classe


Linf + L sup Linf – limite inferior da classe
C=
2 Lsup – limite superior da classe

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 14


1.Distribuição de Frequências

Quadro de Frequências:

 Para cada classe são definidas as frequências


absolutas e relativas, simples e acumuladas, da mesma
forma que para as variáveis discretas.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 15


1.Distribuição de Frequências
 Exemplo 2
 O quadro seguinte refere-se a valores observados para a tensão
arterial, em 121 doentes internados num determinado hospital:
122 136 141 144 146 149 151 152 155 158 164
127 137 142 144 146 149 151 153 156 159 165
130 138 142 144 147 149 151 153 156 159 166
131 138 142 145 147 149 151 153 156 159 166
132 139 142 145 147 150 151 154 157 160 167
133 139 143 145 148 150 151 154 157 160 168
133 139 143 145 148 150 151 154 157 160 169
134 140 143 145 148 150 152 154 157 161 171
134 140 143 146 148 150 152 155 158 162 175
135 141 144 146 148 151 152 155 158 162 180
136 141 144 146 149 151 152 155 158 163 198

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 16


1.Distribuição de Frequências
 Exemplo 2 – continuação

Construção das classes:

n = 121
Regra 3: K = 7 (27=128 e 26=64)
Xmax = 198 Xmin = 122
a = (198 - 122)/7 =10,86 ≈ 11
a = 11 (por excesso)

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 17


1.Distribuição de Frequências
 Exemplo 2 - Continuação
 Valores observados para a tensão arterial, em 121
doentes internados num determinado hospital.

Freq. Abs. Freq. Rel. Freq. Abs.


Tensão Arterial Freq. Rel. Acum.
Acum.

122, 133] 7 0,06 7 0,06

]133, 144] 29 0,24 36 0,30

]144, 155] 53 0,44 89 0,74

]155, 166] 25 0,20 114 0,94

]166, 177] 5 0,04 119 0,98

]177, 188] 1 0,01 120 0,99

]188, 199] 1 0,01 121 1

Total 121 1

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 18


1.Distribuição de Frequências

Histograma de Frequências:

 O histograma é a representação gráfica de


distribuições de frequências de variáveis
contínuas ;

 O histograma de frequências é um gráfico


formado por uma sucessão de rectângulos
adjacentes.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 19


1.Distribuição de Frequências
Histograma de Frequências:
 No caso das distribuições com classes de amplitude
constante não há inconveniente em que a altura seja
igual à frequência;
 Neste caso se estivermos a utilizar frequências
absolutas simples, a área total é igual à dimensão (N) a
multiplicar pela amplitude de classe (constante e igual a
a)  (igual a Na);
 Se estivermos a utilizar frequências relativas simples, a
área total do histograma será igual a a (amplitude de
classe).

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 20


1.Distribuição de Frequências

Histograma de Frequências:
 Se as classes tiverem amplitudes diferentes, ai, os
rectângulos têm base ai e altura igual à respectiva
densidade, ou seja, frequência (absoluta ou relativa)
dividida pela amplitude do intervalo de classe, ai .

 Deste modo, a área do rectângulo de cada classe é


igual à respectiva frequência e a soma das áreas é
igual a N ou 1 caso se trate de frequências absolutas
ou frequências relativas, respectivamente.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 21


1.Distribuição de Frequências

Polígono de Frequências:

 O polígono de frequências é o gráfico que resulta de unir


sucessivamente, por segmentos de recta, os pontos médios
dos lados superiores dos rectângulos do histograma;

 Como se deseja fechar o polígono em relação ao eixo


horizontal, identificam-se classes adjacentes (com a mesma
amplitude) no início e no fim do histograma. Como estas
classes não pertencem à distribuição inicial têm naturalmente
uma frequência nula.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 22


1.Distribuição de Frequências
 Exemplo 2 - Continuação

Tensão arterial

60

50

40

30

20

10

0
]111,122] ]122, 133] ]133, 144] ]144, 155] ]155, 166] ]166, 177] ]177, 188] ]188, 199] ]199,210]

Histograma Polígono de freq.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 23


1.Distribuição de Frequências
 Exemplo 2 – Histograma e polígono das freq. relativas acumuladas

1.2

0.8

0.6

0.4

0.2

0
]122, 133] ]133, 144] ]144, 155] ]155, 166] ]166, 177] ]177, 188] ]188, 199]

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 24


1.Distribuição de Frequências
 Exemplo 2 - Continuação

Tensão arterial

60

50

40

30

20

10

0
]111,122] ]122, 133] ]133, 144] ]144, 155] ]155, 166] ]166, 177] ]177, 188] ]188, 199] ]199,210]

Histograma Polígono de freq.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 25


1.Distribuição de Frequências
 Caso Discreto vs Caso Contínuo (diferenças):
 A função cumulativa de uma variável discreta é
descontínua nos pontos que a variável pode assumir
e apresenta nesses pontos um “salto” igual à
respectiva frequência relativa (simples). Entre os
pontos de descontinuidade, a função é constante
(forma de “escada”).
 A função cumulativa de uma variável contínua é
uma função contínua, dada a natureza da variável,
admitindo que as frequências se acumulam
uniformemente em cada intervalo de classe e não
exclusivamente em certos pontos.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 26


1.Diagrama de Caule-e-folhas
A representação em diagrama de caule-
e-folhas salienta:
 A simetria;
 Maior ou menor dispersão;
 Coexistência de valores diferentes;
 Concentração de dados em torno de um valor;
 Existência de lacunas entre os diferentes valores
de dados.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 27


1.Diagrama de Caule-e-folhas
 Exemplo 3: Consideremos as idades de 40 utentes de
um centro de saúde:

42 35 10 12 50 72 24 28 7 3

49 53 36 18 62 68 81 31 20 43

61 40 35 21 6 11 83 50 72 44

38 30 51 49 12 45 60 32 71 49

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 28


1.Distribuição de Frequências
 Diagrama de Caule-e-folhas (Unidade=1)
0 |3 6 7
1 |0 1 2 2 8
2 |0 1 4 8
3 |0 1 2 5 5 6 8
4 |0 2 3 4 5 9 9 9
5 |0 0 1 3
6 |0 1 2 8
7 |1 2 2
8 |1 3

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 29


1. Distribuição de Frequências
Nem sempre se pode calcular todo o tipo de frequências.
Tal depende da escala de medida da variável em estudo.

Tipo Variáveis
de Nominais Ordinais Quantitativas
Frequências
Discretas Contínuas
Absolutas X X X X
Relativas X X X X
Acumuladas X X X

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 30


1. Representações Gráficas

Escala de Medida Representações gráficas da


distribuição de frequências
Nominal Gráficos de barras
Ordinal Gráficos de barras
Quantita- Discreta Diagramas de frequências absolutas,
tivas relativas, absolutas acumuladas ou
relativas acumuladas
Contínua Histograma
Polígono de frequências

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 31


2.Medidas Descritivas
 Introdução:
 Nos capítulos anteriores construímos quadros e
gráficos para apresentar a informação;
 Muitas vezes, precisamos também de sintetizar
características importantes da informação através de
um único número;
 As medidas descritivas classificam-se em:
 Medidas de Localização;
 Medidas de Dispersão;
 Medidas de Assimetria;
 Medidas de Curtose.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 32


2.Medidas Descritivas
 Medidas de localização
 Localizam os valores observados da variável
no eixo do X.

A localização central da curva B está mais à direita


que a curva A.
Ano Letivo 2023/2024 Estatística Aplicada à Saúde 33
2.Medidas de Localização

ALGUMAS MEDIDAS DE LOCALIZAÇÃO


Medidas de tendência central Medidas de tendência não central

Média aritmética Quartis


Mediana Decis
Moda Percentis

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 34


2.Medidas Descritivas
 Medidas de dispersão
 Medem a dispersão da informação em relação ao
valor central da distribuição.

 As curvas A e B têm a mesma localização, mas a curva B


representa uma distribuição com maior dispersão que a
curva A.
Ano Letivo 2023/2024 Estatística Aplicada à Saúde 35
3.Medidas de Dispersão

ALGUMAS MEDIDAS DE DISPERSÃO

Intervalo de variação Variância

Intervalo interquartis Desvio padrão

Desvio absoluto médio Coeficiente de variação

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 36


2.Medidas Descritivas
 Medidas de assimetria
 Distinguem as distribuições segundo a forma como se
distribui a informação nos dois lados. Podem ser
simétricas e assimétricas.

 A curva A é simétrica. Se traçarmos uma linha vertical do


pico até ao eixo horizontal, a curva fica dividida em duas
partes iguais. A curva C é assimétrica positiva e a curva
B é assimétrica negativa.
Ano Letivo 2023/2024 Estatística Aplicada à Saúde 37
2.Medidas Descritivas
 Medidas de curtose
 Diferenciam as distribuições segundo o
achatamento.

 Na curva B o grau de curtose é maior.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 38


2.Medidas de Localização

ALGUMAS MEDIDAS DE LOCALIZAÇÃO


Medidas de tendência central Medidas de tendência não central

Média aritmética Quartis


Mediana Decis
Moda Percentis

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 39


2.Medidas de Localização

Média Aritmética:
 É a medida de tendência central mais
utilizada e de mais fácil interpretação.

 Notação:

Parâmetro da população - µ
Estatística referente à amostra - x

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 40


2.Medidas de Localização

Média Aritmética
 Dados desagregados (casos discreto e contínuo):
Número total n Valores que a
1
de elementos X
n  Xi variável X
pode assumir
i 1
 Dados agregados (caso discreto):
k
X   fi X i
i 1 Frequência relativa
(simples)
 Dados agregados em classes (caso contínuo):
k Ponto médio
X   fiCi da classe

i 1
Ano Letivo 2023/2024 Estatística Aplicada à Saúde 41
2.Medidas de Localização
 Vantagens e Desvantagens da Média Aritmética
 Vantagens: a média é calculada a partir de todas as
observações (não há perca de informação).

 Desvantagens: é muito sensível a valores aberrantes


ou outliers.

Concluindo:
 A média aritmética é uma medida de localização sensível
e pouco resistente.
 Uma medida de localização mais resistente é a Mediana.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 42


2.Medidas de Localização
 Mediana
Valor central da sucessão ordenada das observações.
 Exemplo – Caso discreto
n = 9 (ímpar)
xi ni Ni
0 4 4 000012234
1 1 5
2 2 7 Mediana = 1
3 1 8
4 1 9
Total 9

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 43


2.Medidas de Localização
 Mediana
 Exemplo – Caso discreto

xi ni Ni
0 4 4 n = 10 (par)
1 1 5 00001 22344
2 2 7
3 1 8 Mediana = (1+2)/2 = 1,5
4 2 10
Total 10

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 44


2.Medidas de Localização

Mediana – corresponde ao valor abaixo


e acima do qual se registou metade das
observações.

 X ( n 1) / 2 , se n é impar
 
X  Md   ( X n / 2  X ( n / 2)1 )
 , se n é par
 2

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 45


2.Medidas de Localização

Mediana
 Exemplo: Consideremos a variável aleatória X com os
valores {5, 2, 8, 7, 10, 4}.
1º - Ordenar por ordem crescente
{2, 4, 5, 7, 8,10}

2º - Como o número de observações é par (n=6) a mediana é dada por:

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 46


2.Medidas de Localização
 Mediana
 Exemplo – Caso contínuo
Classe Mediana  classe onde se encontra o valor 0.5
(50%) para as frequências relativas acumuladas.

Classes ni fi Fi

[0,2] 9 0.30 0.30

]2,4] 10 0.33 0.63

]4,6] 6 0.20 0.83

]6,8] 3 0.10 0.93

]8,10] 2 0.07 1.00

Total 30 1

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 47


2.Medidas de Localização
 Mediana
 Exemplo – Caso contínuo

0,35 0.33
0.30
0,30 X --- 0,2
Frequências relativas

0,25 (base) 2 --- 0,33


2  0,2
0,20  x  1,21
0,15 0.5 0,33
0,10  Md = 2 + 1,21 = 3,21
0,05
 Mediana = 3.21
0,00
[0,2] x ]2,4] ]4,6] ]6,8] ]8,10]
utilizando o histograma
Mediana das frequências relativas
Ano Letivo 2023/2024 Estatística Aplicada à Saúde simples 48
2.Medidas de Localização
 Mediana Assume-se que a relação da
base é linear à da altura, i.e.:
 Exemplo – Caso contínuo
M  2 0,50  0,30 laranja
1,20 
42 0,63  0,30 preto
1,00
Frequências relativas

0,2  2 0,2  2
0,80
 M 2   M  2
0,33 0,33
0.63
0,60
 M = 2 + 1,21 = 3,21
0,40 0.30
0,20  Mediana = 3.21
0.5
0,00 M
[0,2] ]2,4] ]4,6] ]6,8] ]8,10]
utilizando o histograma
das frequências relativas
Mediana absolutas
Ano Letivo 2023/2024 Estatística Aplicada à Saúde 49
2.Medidas de Localização
 Mediana

0.5 - F(Me-1)
(M-1)
Mediana = L InfMe+ aMe
fM e

L InfMe  limite inferior da classe mediana;


aMe  amplitude da classe mediana;
FMe-1  frequência relativa acumulada da classe anterior à classe mediana;
fMe  frequência relativa simples da classe mediana.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 50


2.Medidas de Localização
 Mediana
L InfMd  limite inferior da classe mediana;
aMd  amplitude da classe mediana; (2)
FMd-1  frequência relativa acumulada da classe anterior à classe mediana;
fMd  frequência relativa simples da classe mediana.

Classes ni fi Fi

[0,2] 9 0.30 0.30

]2,4] 10 0.33 0.63

]4,6] 6 0.20 0.83

]6,8] 3 0.10 0.93

]8,10] 2 0.07 1.00

Total 30 1

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 51


2.Medidas de Localização

Moda
Observação que tem maior frequência.

 Exemplo – Caso discreto

000012234

Moda = 0

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 52


2.Medidas de Localização
 Moda
Caso contínuo:

f **
Moda  LInf  aMo
f *  f **

LInf  limite inferior da classe modal;


aMo  amplitude da classe modal;
f*  frequência relativa (simples) da classe anterior à classe modal;
f**  frequência relativa (simples) da classe superior à classe modal.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 53


2.Medidas de Localização
 Moda
 Exemplo – Caso contínuo

Classe Modal = ]2,4]

Classes ni fi 0.2
[0,2] 9 0.30 Moda = 2 + ×2
0.3 + 0.2
]2,4] 10 0.33
]4,6] 6 0.20
]6,8] 3 0.10 Moda = 2.8
]8,10] 2 0.07
Total 30 1

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 54


2.Medidas de Localização

Vantagens e Desvantagens da Moda


 Vantagens:
É fácil de calcular e interpretar;
Não é afectada por valores extremos.

 Desvantagens:
Não pode ser definida com rigor;
O seu valor exacto é muitas vezes incerto.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 55


2.Comparação das medidas de
tendência central
Média:
 Medida mais familiar e usada com maior frequência;
 Medida muito influenciada pelos valores observados;
 É muito sensível aos valores extremos da amostra.
Mediana:
 Fácil de calcular e compreender;
 É determinada pelo nº de observações e não pelo seu valor;
 É muito utilizada em particular em distribuições fortemente
assimétricas;
 Para fins de inferência estatística a mediana não satisfaz as
propriedades de um bom estimador.
Moda:
 É em geral menos usada que as 2 medidas anteriores;
 Pode não existir em algumas distribuições e noutras pode
existir mais que 1 moda;
 Pode ser determinada em qualquer situação e não sofre
influência dos valores extremos.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 56


(29) AS ESTATÍSTICAS ENGANAM -
YouTube

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 57


Exercícios

Caderno 1 (Ex: 1,2,3 e 4)


Para casa – Ex 5 e 6

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 58


Exercício 1

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 59


Exercício 1

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 60


Exercício 1
Gráfico 3: Afluência às licenciaturas de Fisioterapia e Terapia
da Fala tendo em conta o sexo

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 61


Exercício 2

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 62


Exercício 2

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 63


Exercício 3

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 64


Exercício 3

k
X   fi X i
i 1

 X ( n 1) / 2 , se n é impar

X  Md   ( X n / 2  X ( n / 2) 1 )
 , se n é par
 2

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 65


Exercício 4

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 66


Exercício 4

k
X  fiCi
i 1

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 67


2.Medidas de Localização

Medidas de tendência não central


 Para além das medidas de tendência central
existem outras medidas que nos dão a
localização dos valores da variável, são
chamados os quantis e podem ser:

 Quartis;
 Decis;
 Percentis.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 68


2.Medidas de Localização

Medidas de tendência não central


O cálculo dos QUANTIS é idêntico ao da mediana
(tanto para os dados discretos como contínuos):

 Quartis - dividem o conjunto ordenado das


observações em 4 partes iguais.
 Decis - dividem o conjunto ordenado das
observações em 10 partes iguais.
 Percentis - dividem o conjunto ordenado das
observações em 100 partes iguais.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 69


2.Medidas de Localização
Medidas de tendência não central
0% 25% 50% 75% 100%

Q1 Q2 Q3

Q1 – primeiro quartil, será um valor da variável tal que o número de


observações para valores inferiores será 25%, e superiores 75% (equivale
ao percentil 25, P25).
Q2 – segundo quartil, terá metade das observações à sua direita e outra
metade à sua esquerda, coincide com a mediana e com o percentil 50, P50.
Q3 – terceiro quartil, será um valor tal que à sua esquerda concentrar-se-
-ão 75% das observações e à sua direita os restantes 25% (equivale ao
percentil 75, P75).
Ano Letivo 2023/2024 Estatística Aplicada à Saúde 70
2.Medidas de Localização

Medidas de tendência não central


Exemplo: Horas de sono das crianças de uma turma.

5 6 7 7 7 8 8 8 9 10 12

Q1 Q2 = Md Q3

Q1 – 25% das crianças dormem 7 ou menos horas


Q2 – 50% das crianças dormem 8 ou menos horas
Q3 – 75% das crianças dormem 9 ou menos horas

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 71


2.Medidas de Localização
Medidas de tendência não central

 O percentil de ordem p define-se como:

 X k  X k 1 np
 , se k  é int eiro
2 100
Pp  
 X , se k  np não é int eiro
 k 1 100

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 72


2.Medidas de Localização
Medidas de tendência não central
 Exemplo: Consideremos a seguinte distribuição de frequências
das idades (em anos) de um grupo de 100 estudantes de um
curso de francês:

Idade ni fi Fi (%)

15 18 0.18 18

16 10 0.10 28

18 24 0.24 52

20 12 0.12 64

22 15 0.15 79

30 21 0.21 100

 Calcule o P25 25% da amostra tem idade igual ou inferior a 16 anos


75% da amostra tem idade igual ou superior a 16 anos

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 73


2.Medidas de Localização
 Percentis – caso contínuo

P  F( P 1)
Pp  LInf P  aP
fP
L InfP  limite inferior da classe do percentil;
aP  amplitude da classe do percentil;
FP-1  frequência relativa acumulada da classe anterior à classe do percentil;
fP  frequência relativa simples da classe do percentil.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 74


2.Medidas de Localização
P  F( P 1)
 Exemplo: P25 Pp  LInf P  aP
fP

ap=0.2

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 75


2.Medidas Descritivas
Estatística na net
 http://www.alea.pt/

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 76


3.Medidas de Dispersão
• Indicam se a variabilidade de observações é muito grande ou não.

ALGUMAS MEDIDAS DE DISPERSÃO

Intervalo de variação Variância

Intervalo interquartis Desvio padrão

Desvio absoluto médio Coeficiente de variação

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 77


3.Medidas de Dispersão
 Intervalo de Variação:
 Diferença entre o maior e o menor valor da
variável.
R = X max - X min

 Intervalo Interquartis:
 Diferença entre o 3º quartil e o 1º quartil (engloba
50% das observações centrais)

IQ = Q3 - Q1

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 78


3.Medidas de Dispersão
 Desvio absoluto médio:

 Dados desagregados
1 n

n i 1
Xi  X

 Dados agregados Mede o grau de


k
dispersão dos valores
f
i 1
i Xi  X
da variável em torno
da média.
 Dados agregados em classes
k

f i Ci  X
i 1 Ponto médio
da classe

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 79


3.Medidas de Dispersão
Variância:
 Dados desagregados Esta fórmula só é válida para
amostras muito grandes

 
n
1
V(X) = S =  i
2
2 X  X (amostra)
n i 1
n

(X i  X )2
S '2  i 1
(corrigida)
n 1
 Dados agregados
k
S   fi ( X i  X )2
2

i 1
Mede igualmente o
 Dados agregados em classes grau de dispersão
k
S   f i (C i  X ) 2
2
dos valores da
i 1
variável em torno da
Ano Letivo 2023/2024 Estatística Aplicada à Saúde média. 80
3.Medidas de Dispersão
 Desvio padrão: raiz quadrada da variância.

S = V(X)

 A variância apresenta a desvantagem de se traduzir


no quadrado das unidades em que está definida a
variável X.

 O desvio padrão é definido nas mesmas unidades


que a variável.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 81


3.Medidas de Dispersão
 Como calcular a variância e desvio padrão

Exemplo:
Aluno Nota

A 3 (3-5)²=4

B 7 (7-5)²=4

C 6 (6-5)²=1

D 5 (5-5)²=0

E 4 (4-5)²=1

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 82


3.Medidas de Dispersão
 Coeficiente de variação:
 Medida de dispersão relativa (independente das
unidades de medida das variáveis);
 Permite comparar o grau de dispersão, em torno da
média, de distribuições de frequências distintas.

s
CV = × 100
X

Corresponde ao desvio padrão a dividir pela média, a


multiplicar por 100.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 83


3.Medidas de Dispersão
 Coeficiente de variação:

 Superior a 50%  indica alto grau de dispersão


relativa, consequentemente, uma pequena
representatividade da média como medida estatística;

 Inferior a 50%  a média será tanto mais


representativa quanto menor o valor deste coeficiente.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 84


3.Medidas de Dispersão
 Exemplo 4
Idades dos utentes dos Centros de Saúde, com os dados
agrupados em classes:
Classes ni fi Ci (Ci-X) fiICi- XI (Ci- X)2 fi(Ci- X)2

[1,13[ 7 0.175 7 -33 5.775 1089 190.57

[13,25[ 4 0.100 19 -21 2.100 441 44.100

[25,37[ 7 0.175 31 -9 1.575 81 14.175

[37,49[ 6 0.150 43 3 0.450 9 1.350

[49,61[ 8 0.200 55 15 3.000 225 45.00

[61,73[ 6 0.150 67 27 4.050 729 109.35

[73,85[ 2 0.050 79 39 1.950 1521 76.050

Total 40 1 - 18.90 480.60

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 85


3.Medidas de Dispersão
 Exemplo 4
Idades dos utentes dos Centros de Saúde, com os dados
agrupados em classes:

(Ci-X) fiICi- XI (Ci- X)2 fi(Ci- X)2

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 86


3.Medidas de Dispersão
 Exemplo 3 - continuação
Idades dos utentes dos Centros de Saúde, com os dados agrupados
em classes:

Média = 40,0
Desvio absoluto médio = 18,9
Variância = 480,6
Desvio padrão = 21,92
Cv = 54,8%

Existe uma grande dispersão de idades, uma vez que a amplitude da


amostra é de 80 e a concentração em torno da média tem uma
dispersão de 21,92, ou seja, 54,8%.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 87


Exercícios

Caderno 1 (Ex. 9)

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 88


Exercícios
Idade
30
1º Calcular a média
76,2

81,5

50,0

47,5

63,5

65,1

63,2

64,5

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 89


Exercícios
Idade
2º Cálculo auxiliar para variância
30
76,2 (76,2-63,95)²=150,1 n

81,5 (81,5-63,95)²=308,0
(X i  X )2
S '2  i 1

50,0 (50,0-63,95)²=194,6 n 1
47,5 (47,5-63,95)²=270,6
=925,7
63,5 (63,5-63,95)²=0,2

65,1 (65,1-63,95)²=1,3
3º Calcular a variância
63,2 (63,2-63,95)²=0,6

64,5 (64,5-63,95)²=0,3

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 90


Exercícios
4º Calcular o desvio padrão

5º Calcular o coeficiente de variação

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 91


2. Análise de outliers
 Outlier: observação discordante ou extrema.

 Explicações possíveis para a ocorrência de


outliers

 erros humanos ao medir ou ao registar os


dados
 eventualmente, eliminar os outliers do estudo

 natureza do fenómeno em estudo


não são outliers.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 92


2. Análise de outliers

Identificação de outliers

 Por comparação, através da análise do


posicionamento das observações extremas
com medidas de localização e de
dispersão.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 93


2. Análise de outliers
 Medidas utilizadas na identificação de outliers:
 Mediana (Md)
 1º Quartil (Q1)
 3º Quartil (Q3)
 Máximo (Xmax)
 Mínimo (Xmin)
 Intervalo Interquartis (IQ)

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 94


2. Análise de outliers
 Representação de outliers
 Diagrama de caixa-de-bigodes (Boxplot)

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 95


2. Análise de outliers
 Diagrama de caixa-de-bigodes com outliers

v1  valor inferior a Q1 depois da BII X Outlier severo


v2  valor superior a Q3 antes da BIS Outlier moderado

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 96


2. Análise de outliers
 Regras de identificação de outliers

 Candidato a outlier
Xi < Q1 ou Xi > Q3

 Barreiras interior e exterior


Barreira Exterior Inferior (BEI): Q1 – 3 IQ
Barreira Exterior Superior (BES): Q3 + 3 IQ
Barreira Interior Inferior (BII): Q1 – 1,5 IQ
Barreira Interior Superior (BIS): Q3 + 1,5 IQ

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 97


2. Análise de outliers
 Regras de identificação de outliers:

 Outlier moderado

 Outlier severo

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 98


2. Análise de outliers
O que fazer na presença de outliers?

 “A eliminação pura e simples de um potencial outlier


deve fazer-se com prudência e o mais aconselhável é
proceder à análise com e sem a presença da
respectiva observação. Se as conclusões são
discordantes deve pelo menos ter-se a consciência
de que o outlier afecta significativamente as
conclusões e não há como relatar esse facto,
deixando a terceiros a possibilidade de escolher o seu
próprio caminho”. (Murteira 1993, p. 100)

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 99


2. Análise de outliers
O que fazer na presença de outliers?

 “A eliminação de um potencial outlier é imprópria quando


a variável observada tem uma distribuição com caudas
pesadas, no quadro da qual os outliers são naturais. Para
alguns autores, a identificação quase certa de outliers só
é em geral possível para amostras com 500 ou mais
observações; assim, quando se trabalha com amostras
pequenas, a política mais prudente é isolar alguns valores
para lhes prestar ou pedir para que lhes seja prestada
atenção especial.” (Murteira 1993, p. 101)

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 100


2. Análise de outliers
 Exemplo 3
O quadro seguinte apresenta o tempo (em minutos) de
circulação extracorporal (CEC) em 94 doentes submetidos
a intervenção ao coração, entre Maio de 1980 e
Dezembro de 1988, no Hospital de Santa Cruz.
118 162 145 150 195 77 86 70 85 120 180
150 300 172 85 120 52 402 110 143 80 210
251 207 120 95 80 99 58 188 90 30 87
115 160 150 98 90 190 86 147 118 110 85
97 172 177 222 80 85 210 142 120 113
117 155 117 180 50 145 97 403 117 119
145 237 153 168 102 166 225 124 93 207
114 157 100 155 120 155 295 120 65 69
53 164 115 145 230 140 98 180 37 218
Fonte: Murteira (1993, p. 97–98)
Ano Letivo 2023/2024 Estatística Aplicada à Saúde 101
2. Análise de outliers
 Exemplo 3 – continuação
Medidas descritivas
Média = 139.72
Neste caso, as barreiras
Min = 30 inferiores, interna (BII) e
Q1 = 95 externa (BEI), são
Mediana = Q2 = 120 irrelevantes porque são
Q3 = 168 menores que zero e a
variável é positiva.
Max = 403
IQ = 73
BIS = 168 + 1.5  73 = 277.5
BES = 168 + 3  73 = 387

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 102


2. Análise de outliers
 Exemplo 3 – continuação

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 103


2. Análise de outliers

Exemplo 3 – continuação
Histograma

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 104


2. Análise de outliers
 Exemplo 3 – continuação
Boxplot e outliers OUTLIERS
Moderados
295 minutos
300 minutos

Severos
402 minutos
403 minutos

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 105


4.Medidas de Assimetria
 Classificação da distribuição quanto à assimetria:

Distribuição Distribuição
assimétrica positiva Distribuição simétrica assimétrica negativa

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 106


4.Medidas de Assimetria
Comparação das Medidas de Tendência Central

Assimetria Posição relativa das três


medidas
Distribuições simétricas Média = Mediana = Moda
Distribuições enviesadas à Média > Mediana > Moda
esquerda (assimétricas positivas)
Distribuições enviesadas à direita Média < Mediana < Moda
(assimétricas negativas)

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 107


4.Medidas de Assimetria
 Quanto mais pronunciada for a assimetria da
distribuição maior será a distância entre a média
e a mediana.

 Grau de assimetria:

3 (Média – Mediana)
G=
Desvio padrão

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 108


4.Medidas de Assimetria

 Coeficiente de assimetria de Pearson:

X - Mo
G1=
s
Desvio padrão

Se G1=0 a distribuição é simétrica.


Se G1>0 a distribuição é assimétrica positiva.
Se G1<0 a distribuição é assimétrica negativa.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 109


4.Medidas de Assimetria
 Observação:

 Pearson definiu um outro coeficiente que permite calcular


o grau de assimetria de uma distribuição quando não
dispomos da média e do desvio padrão, utilizando apenas
os quartis da distribuição.

Q3 + Q1 - 2Me
G2 =
Q3 - Q1

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 110


4.Medidas de Assimetria
 Medida de assimetria relativa – Coeficiente de
assimetria (Skewness)

n
n   xi  x 
3

g1  i 1

n-1 n-2 S ' 3

Se g1=0 a distribuição é simétrica.


Se g1>0 a distribuição é assimétrica positiva.
Se g1<0 a distribuição é assimétrica negativa.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 111


5.Medidas de Achatamento ou
Curtose

 Classificação da distribuição quanto ao grau


de achatamento

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 112


5.Medidas de Achatamento ou
Curtose
Grau de Curtose
 Para medir o grau de achatamento de uma distribuição
pode ser utilizada a seguinte medida:
Q3 - Q1
K= Grau de Curtose
2(P90 - P10 )

Se K=0.263 a distribuição é mesocúrtica


Se k<0.263 a distribuição é platicúrtica
Se k>0.263 a distribuição é leptocúrtica

Nota: A distribuição normal é uma distribuição tipicamente mesocúrtica


sendo o seu grau de curtose de 0.263. Como tal, foi este o valor
considerado para base de comparação.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 113


5.Medidas de Achatamento ou
Curtose
 Medida de curtose ou achatamento relativo –
Coeficiente de curtose (Kurtosis)

  xi  x 
4

n(n  1) (n-1)2
G2   i 1
3
(n-1)(n-2)(n-3) S '4 (n-2)(n-3)

Se G2=0 a distribuição é mesocúrtica

Se G2<0 a distribuição é platicúrtica

Se G2>0 a distribuição é leptocúrtica

Nota: Teoricamente G2 pode variar de -∞ a +∞  No entanto valores na casa


dos ±2 já representam curvas bastante acentuadas

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 114


Caderno 1 (Ex. 10)
Exercícios
10. A seguir apresenta-se parte da base de
dados referentes a um trabalho realizado
sobre a satisfação dos cuidadores de
doentes de Alzheimer em relação à
qualidade dos cuidados de saúde
hospitalares.

Especificação das variáveis:

SEXO – sexo do cuidador (1: feminino; 2: masculino)

BDI – resultados no inventário depressivo de Beck

SGLOBAL – resultados num dos 28 itens, cotados de 1


a 5, que integram um questionário de satisfação
construído para o estudo.

SERVIÇO – Tipo de serviço hospitalar a que haviam


recorrido para prestação de cuidados de saúde ao
doente.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 115


Caderno 1 (Ex. 10)
Exercícios
a) Classifique quanto à escala de medida cada uma das variáveis
consideradas.

SEXO – Variável qualitativa nominal dicotómica

BDI – Variável quantitativa

SGLOBAL – Variável ordinal

SERVIÇO – Variável qualitativa nominal dicotómica

Nota: Inventário de Depressão de Beck (BDI), permite avaliar a presença e severidade


da sintomatologia depressiva em adultos e adolescentes com mais de 13 anos de idade.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 116


Caderno 1 (Ex. 10)
BDI

Exercícios 12
23
23
30
36
b) Em relação ao BDI: 40
40
a. Calcule o percentil 80 e interprete-o. 40
40
40
 X k  X k 1 np
 , se k  é int eiro 44

2 100 44
Pp   45
 X , se k  np não é int eiro 45
 k 1 100 45
45
48

1º Calcular k 48
50
50
K não é inteiro P80=X21 50
50
50
50
57
57
80% dos cuidadores apresentaram resultados iguais ou inferiores a 50
no inventário depressivo de Beck.

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 117


Caderno 1 (Ex. 10)
Exercícios
b) Em relação ao BDI:

b. Qual a percentagem de cuidadores com nível de BDI superior a 30?

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 118


Caderno 1 (Ex. 10)
Exercícios BDI
12
23
23
30
b) Em relação ao BDI: 36
40
c. Desenhe a caixa de bigodes para os resultados da BDI, tendo 40
40
em conta a análise de outliers. 40
40

 Medidas utilizadas na identificação de outliers: 44


44
 Mediana (Md) = Q2 = P50 45
45
 1º Quartil (Q1) = P25 45
45
 3º Quartil (Q3) = P75
48

 Máximo (Xmax) = 57 48
50
 Mínimo (Xmin) = 12 50
50
 Intervalo Interquartis (IQ) = 50
50
50
57
57

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 119


Caderno 1 (Ex. 10)
Exercícios BDI
12
23
23

Calcular Q1 (P25), Q2 (P50) e Q3 (P75) 30


36
 X k  X k 1 np 40

 , se k  é int eiro P25=Q1 40


2 100
Pp   40

 X , se k  np não é int eiro 40

 k 1 100
40
44
44
45
P50=Q2
45
45
45
48
48
50
P75=Q3 50
50
50
50
50
57
57

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 120


Caderno 1 (Ex. 10)
Exercícios
Calcular IQ Q1=40
Q2=45
=50-40=10 Q3=50

Calcular barreiras
Barreira Exterior Inferior (BEI):
Q1 – 3 IQ = 40 – 3x10=10
Barreira Exterior Superior (BES):
Q3 + 3 IQ = 50 + 3x10=80
Barreira Interior Inferior (BII):
Q1 – 1,5 IQ= 40 – 1,5x10=25
Barreira Interior Superior (BIS):
Q3 + 1,5 IQ = 50 + 1,5x10=65

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 121


Caderno 1 (Ex. 10)
Exercícios BDI
12
23
23
30
36
40
40
40
40
40
44
44
45
45
45
45
48
48

10 25 65 80 50
50

Barreira Exterior Inferior (BEI): 10 50


50
Barreira Exterior Superior (BES): 80 50

Barreira Interior Inferior (BII): 25 50


57
Barreira Interior Superior (BIS): 65 57

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 122


Caderno 1 (Ex. 10)
Exercícios BDI
12
23
23
xi ni fi 30
b) Em relação ao BDI: 36
12 1 0,038 40
d. Calcule o desvio-padrão da variável BDI. 40
23 2 0,077 40
40
30 1 0,038 40
44
36 1 0,038 44
45
1º Calcular a variância 40 5 0,192 45
45
k 44 2 0,077 45

S   fi ( X i  X )
2 2
45 4 1,154
48
48
i 1
48 2 0,077 50
50

50 6 0,231 50
50

57 2 0,077 50
50

26 1,000 57
57

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 123


Caderno 1 (Ex. 10)
Exercícios xi ni fi
12 1 0,038
23 2 0,077
k
X   fi X i 30 1 0,038
36 1 0,038
i 1
40 5 0,192
44 2 0,077
45 4 0,154
48 2 0,077
50 6 0,231
57 2 0,077
26 1,000

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 124


Caderno 1 (Ex. 10)
Exercícios
Cálculo Auxiliar (CA) x̅=42,38

xi ni fi (xi-x̅)² fi(xi-x̅)²
12 1 0,038 (12-42,38)²=922,94 35,50
23 2 0,077 (23-42,38)²=375,58 28,89
30 1 0,038 (30-42,38)²=153,26 5,89
36 1 0,038 (36-42,38)²=40,70 1,57
40 5 0,192 (40-42,38)²=5,66 1,09
44 2 0,077 (44-42,38)²=2,62 0,20
45 4 1,154 (45-42,38)²=6,86 1,06
48 2 0,077 (48-42,38)²=31,58 2,43
50 6 0,231 (50-42,38)²=58,06 13,40
57 2 0,077 (57-42,38)²=213,744 16,44
26 1,000 112,88 V(x)

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 125


Caderno 1 (Ex. 10)
Exercícios
Calcular desvio padrão
V(x)=112,88

Ano Letivo 2023/2024 Estatística Aplicada à Saúde 126

Você também pode gostar