Você está na página 1de 9

Introdução à Bioestatística Introdução à Bioestatística

CONTEÚDO DO CURSO

1. Estatística descritiva

2. Introdução à probabilidade e aplicações

3. Modelos probabilísticos e aplicações: Variáveis aleatórias


Introdução à Bioestatística discretas e contínuas. Modelo Binominal, Modelo normal ou
Gaussiano
Estatística Descritiva
4. Introdução à inferência estatística Estimação Testes de
hipóteses.

Marcos Santos Bioestatística


Departamento de Estatística
Universidade Federal de Minas Gerais - UFMG

Marcos Santos – Depto. de Estatística – ICEX/UFMG 1 Marcos Santos – Depto. de Estatística – ICEX/UFMG 2

1 2

Visualização de dados Medidas de posição central


Exemplo: Contaminação de falcões – 27 observações
Medidas resumo do exemplo
DDT Região Idade DDT Região Idade Região:
19 1 1 82 3 2
17 1 1 80 3 2
1 - EUA Min. 1Q Mediana Média 3Q Max.
16 1 1 80 3 2
2 - Canada 13.00 24.00 36.00 44.37 74.00 91.00
16 2 1 34 1 3
13 2 1 37 1 3 3 - Ártico
16 2 1 36 1 3 Obtenção da mediana, em dados ordenados:
74 3 1 36 2 3 Idade: em ordem
69 3 1 39 2 3 crescente 1,2 e 3
72 3 1 37 2 3 13 16 16 16 17 19 24 24 25 26 28 29 34 36 36 37 37 39 69 72 74 80 80 82 88 90 91
25 1 2 91 3 3
24 1 2 88 3 3
29 1 2 90 3 3
28 2 2
Mediana
24 2 2
26 2 2 OBS: cálculo em computador pode fornecer valores ligeiramente diferentes para a
mediana pois é usado interpolação

Fonte: Minitab software


Marcos Santos – Depto. de Estatística – ICEX/UFMG 3 Marcos Santos – Depto. de Estatística – ICEX/UFMG 4

3 4

1
Medidas de posição central Percentis

Quartis e mediana Para obter percentis


13 16 16 16 17 19 24 24 25 26 28 29 34 36 36 37 37 39 69 72 74 80 80 82 88 90 91 1. Ordenar os dados em ordem crescente
2. Obter a posição do valor do percentil nos dados através da fprmyla:

Min 1Q Mediana 3Q Max Posição: p (n+1)/100

Min. 1Q Mediana Média 3Q Max.


Exemplo: Obter o percentil 40 (símbolo P40) para o conjunto de idades
13.00 24.00 36.00 44.37 74.00 91.00
23 23 24 44 45 45 46 48 48 49 52 54 55 56 56 80 81

Solução: n = 17 observações

Cálculo da mediana, nos n valores ordenados:


Posição: 40 x (18)/100 = 7,2  P40 = (46 + 48)/2 = 47

Convenção adotada: média do valor da sétima e da oitava posição


Se n ímpar: é o valor na posição posição: (n+1)/2
Se n par: é o média dos valores das posições n/2 e a posição seguinte
OBS: Em alguns programas de computador, é feita uma interpolação ao invés
da média simples.

Marcos Santos – Depto. de Estatística – ICEX/UFMG 5 Marcos Santos – Depto. de Estatística – ICEX/UFMG 6

5 6

Percentis Boxplot
Exemplo Informações em um boxplot

p (n+1)/100

P80: posição (80 x 61)/100 = 48,8 P80 = 5,185

P25: posição (25 x 61)/100 = 15,25 P25 = 4,76

https://operdata.com.br/blog/como-interpretar-um-boxplot/

Marcos Santos – Depto. de Estatística – ICEX/UFMG 7 Marcos Santos – Depto. de Estatística – ICEX/UFMG 8

7 8

2
Boxplot Boxplot
Contaminação por DDT – Região 1 - EUA Contaminação por DDT – Região 2 - Canadá
Min. 1Q Mediana Média 3Q Max.
16.00 19.00 25.00 26.33 34.00 37.00
DDT Região Idade
DDT Região Idade
16 2 1
19 1 1
13 2 1
17 1 1
16 2 1
16 1 1
28 2 2
25 1 2
24 2 2
24 1 2
26 2 2
29 1 2
36 2 3
34 1 3
39 2 3
37 1 3
37 2 3
36 1 3

Marcos Santos – Depto. de Estatística – ICEX/UFMG 9 Marcos Santos – Depto. de Estatística – ICEX/UFMG 10

9 10

Boxplot Boxplot
Contaminação por DDT – Região 3 - Ártico Contaminação por DDT – Comparativo por região e idade

DDT Região Idade


74 3 1
69 3 1
72 3 1
82 3 2
80 3 2
80 3 2
91 3 3
88 3 3
90 3 3

Marcos Santos – Depto. de Estatística – ICEX/UFMG 11 Marcos Santos – Depto. de Estatística – ICEX/UFMG 12

11 12

3
Boxplot Boxplot
Exemplo – Boxplot para o peso de um grupo de meninos de 2 meses de idade Esquema Geral detalhado para boxplot
(27 observações)
Saída no software R [usar: quantile(..., type=6)]
:

Min. 1st Qu. Median Mean 3rd Qu. Max.


4.17 5.08 5.36 5.36 5.77 6.29

4.17 4.49 4.58 5.00 5.03 5.05 5.08


5.09 5.14 5.20 5.26 5.29 5.34 5.36
5.39 5.42 5.43 5.44 5.62 5.64 5.77
5.78 5.79 5.87 5.90 6.23 6.29

Marcos Santos – Depto. de Estatística – ICEX/UFMG 13 Marcos Santos – Depto. de Estatística – ICEX/UFMG 14

13 14

Boxplot Histograma

Exemplo 1 Exemplo 2 Tabela de Frequências


Nível de colesterol de dois grupos Exemplo 3.3 – Construir uma tabela de frequências

Amostras de populações urbana (esq) e


Observar que há um número considerável de
rural na Guatemala mulheres com pressão baixa do que no grupo
de homens

http://homepage.stat.uiowa.edu/~luke/xls/tutorial/techreport/node15.html Fonte: Introdução à Estatística Médica – J F Soares – A L Siqueira

Marcos Santos – Depto. de Estatística – ICEX/UFMG 15 Marcos Santos – Depto. de Estatística – ICEX/UFMG 16

15 16

4
Histograma Histograma

Tabela de Frequências Frequência relativa: é a


Exemplo 3.3 – Construir uma tabela de frequências frequência absoluta
divido pelo total de casos

Para a primeira faixa a


frequência absoluta é
2/78=0,03

Obs: 9 = código de dado faltante

Marcos Santos – Depto. de Estatística – ICEX/UFMG 17 Marcos Santos – Depto. de Estatística – ICEX/UFMG 18

17 18

Histograma Histograma

Tabela de Frequências
Exercício 1- Esboço de um histograma com 5 classes, com
primeira classe intervalo 1520
Faixa Frequência
15,2 35,5 27,0 39,5 39,1 20,0
15  20 4
18,1 21,2 31,2 21,3 15,6 33,7
20  25 3
31,5 30,0 35,6 33,4 31,1 35,3
Histograma - Colesterol
19,3 28,8 26,0 30,7 32,7 31,5 25  30 3
30  35
35

9
35 40 5
30
25
20
Frequency

15
10
5
0

100 200 300 400 500

Marcos Santos – Depto. de Estatística – ICEX/UFMG 19 Marcos Santos – Depto. de Estatística – ICEX/UFMG 20

19 20

5
Distribuição Normal - Exemplos Medidas de Variabilidade

Variável contínua – Exemplo de dados com distribuição Normal Medidas de variabilidade para um conjunto de dados com n observações

Amplitude A = |xmax – xmin|

σ𝑖 (𝑥𝑖 − 𝑥)ҧ 2 σ𝑖 𝑥𝑖2 − 𝑛𝑥ҧ 2


Variância 𝑉𝑎𝑟 = ou 𝑉𝑎𝑟 =
𝑛−1 𝑛−1

Desvio padrão 𝑑𝑝 𝑋 = 𝑉𝑎𝑟(𝑋)

𝑠
Coeficiente de variação 𝐶𝑉 = . 100
𝑥ҧ

σ𝑖 (𝑥𝑖 − 𝑥)ҧ 2
OBS: para uma população: 𝑉𝑎𝑟 =
𝑛

Fonte: Introdução à Estatística Médica – J F Soares – A L Siqueira

Marcos Santos – Depto. de Estatística – ICEX/UFMG 21 Marcos Santos – Depto. de Estatística – ICEX/UFMG 22

21 22

Medidas de Dispersão Medidas de Variabilidade

Conceito de medida de variabilidade Exemplo - medida de variabilidade


Exemplo – Grupos com mesma média
Conjunto de dado A: Média 50 e desvio padrão = 9.1
Idades das pessoas, anotados em tres grupos diferentes

Grupo A: 10 20 30 40 50 média = 30 Var(A) =250 dp(A)= 18,2 anos

Grupo B: 25 25 30 35 35 média = 30 Var(B) = 25 dp(B) = 5 anos


10 20 30 40 50 60 70 80 90

Grupo C: 30 30 30 30 30 média = 30 Var(C) = 0 Grupo A Grupo B


Conjunto de dados B: Média 50 e desvio padrão = 24.1 40 30
45 31
55 59
60 80
Média 50 50
10 20 30 40 50 60 70 80 90 dp 9.1 24.1

Marcos Santos – Depto. de Estatística – ICEX/UFMG 23 Marcos Santos – Depto. de Estatística – ICEX/UFMG 24

23 24

6
Medidas de Variabilidade Medidas de Variabilidade

Como calcular o desvio padrão em uma amostra de tamanho n Um método para cálculo da variância
Pesos de 10 recém-nascidos (Kg) - Média: 3,1 Kg

Expressão Geral:

Obtendo o desvio padrão para o Grupo A


variância:
2,14/9 = 0,237
x (x-média) (x-média)2
40 (40-50)=-10 100
45 (45-50)= -5 25
10 20 30 40 50 60 70
55 (55-50)= 5 25 desvio padrão:
60 (60-50)= 10 100 raiz de 0,237 = 0,490
SOMA 250
250
= = 9,1
(4 − 1)

Marcos Santos – Depto. de Estatística – ICEX/UFMG 25 Marcos Santos – Depto. de Estatística – ICEX/UFMG 26

25 26

Tipos de variáveis Exercício


Variáveis Quantitativas:
Como existe nos ratos uma doença análoga a diabetes, muitos estudos
Variáveis discretas: os valores representam um conjunto numérico finito ou
utilizam ratos. Num estudo foram obtidos os seguintes valores para o peso
enumerável. Variáveis ​discretas em geral referem-se a contagens: número de
do corpo (gramas) de 48 ratos de uma linhagem
pacientes, número de infectados, número de pessoas com determinada
característica
35 31 35 30 30 31 24 26 33 30
34 35 29 32 29 35 30 27 30 33
Variáveis contínuas: os valores pertencem a um intervalo de números reais,
33 26 43 29 29 33 28 34 31 28
por exemplo altura ou peso de uma pessoa. Neste caso a variável pode
33 32 29 27 32 30 35 35 28 26
assumir qualquer valor no intervalo.
31 28 34 35 30 31 34 28
Variáveis Qualitativas: representam uma qualidade (ou atributo), definidas
Fazer um esboço do boxplot. Use:
por duas ou mais categorias. Essas variáveis podem ser
Min. 1Q. Mediana Média 3Q. Max.
• Nominal: quando não existe nenhuma ordenação. Exemplos: sexo,
24.0 29.0 31.0 31.0 33.2 43.0
atributo presente/ausente

• Ordinal: quando a ordem é considerada. Exemplo: Nível sócio-


econômico, avaliado em 1,2 ou 3

Marcos Santos – Depto. de Estatística – ICEX/UFMG 27 Marcos Santos – Depto. de Estatística – ICEX/UFMG 28

27 28

7
Outras formas de visualização Associação entre duas variáveis
http://waterforuss.blogspot.com.br/p/graficos.html
Gráficos de dispersão - Coeficiente de correlação

Correlação positiva Forte correlação Correlação perfeita


Entre x e y positiva positiva

Marcos Santos – Depto. de Estatística – ICEX/UFMG 29 Marcos Santos – Depto. de Estatística – ICEX/UFMG 30

29 30

Associação entre duas variáveis Associação entre duas variáveis


Gráficos de dispersão - Coeficiente de correlação
Ausência de correlação linear

Correlação negativa Forte correlação Correlação perfeita


entre x e y negativa negativa

Marcos Santos – Depto. de Estatística – ICEX/UFMG 31 Marcos Santos – Depto. de Estatística – ICEX/UFMG 32

31 32

8
Coeficiente de correlação

𝜌=1
correlação perfeita positiva entre as Exemplo:
duas variáveis

𝜌 = -1
correlação perfeita negativa

𝜌=0
As variáveis não dependentes ou não
associadas linearmente uma da
outra. No entanto, pode existir uma
dependência não linear.

Marcos Santos – Depto. de Estatística – ICEX/UFMG 33

33

Você também pode gostar