Você está na página 1de 45

Bioestatística

Prof. Dr. Glaucio Araujo


UNIFACIG
Medidas de Medidas de
Posição dispersão

As medidas de posição representam o Dispersão ou variação é o grau com


valor em torno do qual os dados que os dados tendem a se afastar de
observados tendem a se acumular. um valor central.
Medidas
Numéricas Média Aritmética Variância

Descritivas
Desvio Padrão
Mediana
Coeficiente de
variação
Moda
Amplitude
Dados de altura das
pessoas

Medidas de
posição

Média Aritmética
(valor médio)

Mediana
(Valor do meio)

Moda
(Valor mais frequente)
Medidas de
posição

Média Aritmética
(valor médio) 1,4 1,7 2,0

Mediana De um modo geral, os dados de uma população ou


amostra tendem a ser mais numerosos em torno de um
(Valor do meio)
valor central, e vão se tornando mais raros à medida que
se afastam desse valor.
Moda
(Valor mais frequente) A medida de posição representa o valor em torno do qual
os dados observados tendem a se acumular.
Medidas de
dispersão
Variância
(dispersão em torno da
média)

Desvio Padrão 1,7


(dispersão em torno da
média)

Coeficiente de
variação
(medida relativa de
variação)

Amplitude
(maior menos o menor valor)

1,7
 De um modo geral, os dados de uma população
ou amostra tendem a ser mais numerosos em
Medidas de torno de um valor central, e vão se tornando
posição mais raros à medida que se afastam desse
valor.
Média Aritmética  A medida de posição representa o valor em
(valor médio) torno do qual os dados observados tendem a se
acumular.
Mediana
(Valor do meio)  Quando as pessoas conversam sobre um “valor
médio” ou o “valor do meio” ou o “valor mais
Moda frequente”, elas estão falando, informalmente,
(Valor mais frequente) sobre a média aritmética, a mediana e a moda.
Medidas de Posição
• A Média Aritmética → Valor Médio
• A Mediana → Valor do Meio
• A Moda → Valor Mais Frequente
Média
é o valor médio

Jogador Altura
1 1.60 Soma = 17,82 11 = n
2 1.52 n é o nº de elementos
3 1.66
4 1.68
5 1.69
Média = 17,82 / 11
6 1.66
7 1.64
8 1.48 Média = 1,62 m
9 1.61
10 1.66
11 1.62
Mediana
é o valor do meio

Jogador Altura Organizado


1 1.60 1.48 Valor do meio
2 1.52 1.52
3 1.66 1.60
4 1.68 1.61
5 1.69 1.62
1,64
6 1.66 1.64
7 1.64 1.66
8 1.48 1.66 É preciso organizar em
9 1.61 1.66
10 1.66 1.68 ordem crescente
11 1.62 1.69
Moda
é o valor mais frequente

Jogador Altura
1 1.60 Valor mais frequente
2 1.52
3 1.66
4 1.68 1,66
5 1.69
6 1.66
7 1.64
8 1.48
9 1.61
10 1.66
11 1.62
Média Aritmética É a medida de posição mais utilizada em
(valor médio) experimentos é definida como: a soma de
todas as observações, dividida pelo
número de observações.

Soma dos Valores Você calcula a média aritmética por meio


X= da soma de todos os valores em um
Quantidade de Valores
conjunto de dados, seguida pela divisão
do total dessa soma pela quantidade de
X1 + X 2 + X 3 +  + X n valores no conjunto de dados.
X=
n

X i
X= i =1
n
Média Aritmética Vamos imaginar um grupo de 6 Paciente Idade
(valor médio) Pacientes. P1 45
P2 55
P3 56
n

X
45 + 55 + 56 + 45 + 33 + 60 P4 33
ഥ=
X P5 60
i 6
X= i =1
ഥ = 49,00
X
P6 45
Área Calculadora
n
Mediana A mediana de um A mediana é o valor do meio em uma disposição
(Valor do meio) conjunto de dados ordenada de dados que tenham sido
ordenados (rol) é o valor classificados partindo-se do menor para o maior.
que divide esse conjunto
em dois subconjuntos É um valor que ocupa a posição central dos
com igual número de dados. Acima desse valor temos 50% da
população ou amostra, e abaixo dele, outros 50%
dados.

Se o valor de K for inteiro, exemplo


A mediana é o valor que 10, a mediana é o valor que ocupa a
está na posição K em um n+1 10ª posição.
conjunto de dados que foi k=
ordenado do menor para o 2 Se o valor de K não for inteiro,
maior valor. exemplo, 10,5 a mediana é o valor
médio entre os valores da 10ª e da
11ª posição.
Mediana Vamos imaginar um grupo de 6 Paciente Idade
(Valor do meio) Pacientes. P1 45
P2 55
P3 56
6+1
n+1 𝑘=
2
Como não temos um valor P4 33
k= exato, a mediana está entre a P5 60
2 𝑘 = 3,5 posição 3 e 4. P6 45
Área Calculadora

Paciente Idade
P5 33
P1 45
P4 45
P2 55
P3 56
P6 60

1º Passo Organizar em
ordem crescentes.
45 + 55
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 =
2

𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 50
Moda
(Valor mais frequente) A moda de um conjunto de dados
é o valor que ocorre com maior
frequência nesse conjunto.

A moda, como a mediana, não é


afetada pelos valores extremos.

Às vezes, um conjunto de valores Em alguns casos, o


apresenta duas ou mais modas, o conjunto de valores não
que indica uma certa apresenta nenhum valor
heterogeneidade dos dados. com frequência maior que
a dos outros valores.
Moda Vamos imaginar um grupo de 6 Paciente Idade
(Valor mais frequente) Pacientes. P1 45
P2 55
P3 56
P4 33
A moda é o valor que mais se
P5 60
repete
P6 45
Área Calculadora

Paciente Idade
P5 33
P1 45
P4 45
P2 55
P3 56
P6 60

Organizar os dados em ordem


crescente pode ajudar a identificar 𝑀𝑜𝑑𝑎 = 45
os valores repetidos.
Exercício  Vamos praticar no plickers
Exercício
Um paciente está estudando seus tempos de corrida. Ao
longo de 10 dias ele fez anotações da do tempo de corrida
em cada dia. Os dados são apresentados na tabela abaixo.
Calcule a média, a moda e a mediana.
Tempos de
Dia corrida Área Calculadora
1 39
n
n+1
2
3
29
43 X i k=
4 52 X= i =1 2
n
5 39
6 44
7 40
8 31
9 44
10 35
Exercício Um paciente está estudando seus tempos de corrida. Ao
longo de 10 dias ele fez anotações da do tempo de corrida em
cada dia. Os dados são apresentados na tabela abaixo.
Calcule a média, a moda e a mediana.

Tempos de
Dia corrida Organizado Área Calculadora
n
n+1
1
2
39
29
29
31
X i k=
3 43 35
X= i =1 2
n
4 52 39
5 39 39
6 44 40
7 40 43
Respostas
8 31 44 Média = 39,6
9 44 44 Mediana = 39,5
10 35 52 Moda = 39 e 44
Medidas de Medidas de
Posição Dispersão

As medidas de posição representam o Dispersão ou variação é o grau com


valor em torno do qual os dados que os dados tendem a se afastar de
observados tendem a se acumular. um valor central.
Medidas
Numéricas Média Aritmética Variância

Descritivas
Desvio Padrão
Mediana
Coeficiente de
variação
Moda
Amplitude
Medidas de  Dispersão ou variação é o grau com que os
dispersão dados tendem a se afastar de um valor central,
geralmente a média aritmética.
Variância
(dispersão em torno da  Em todas as amostras ou populações, ocorre
média) variabilidade dos indivíduos que as constituem.
Desvio Padrão  Além disso, amostras com mesma média
(dispersão em torno da
média) podem apresentar distribuições diferentes.
Portanto, só a média não nos dá uma ideia
Coeficiente de clara de como os dados se distribuem.
variação
(medida relativa de  Então, é necessário calcular as medidas de
variação) dispersão ou variação para ter uma melhor
noção da distribuição dos dados.
Amplitude
(maior menos o menor valor)
A média na amostra A é 158 cm. Na
amostra B é também 158 cm. As
medianas são iguais a 158,5 cm, nas duas
amostras. Portanto, as amostras A e B
possuem médias e medianas idênticas.

O fato das amostras A e B possuírem


medidas de locação iguais (média e
mediana) nos permite afirmar que
adolescentes das amostras A e B são
semelhantes em relação à estatura?
Medidas de dispersão
• Amplitude – Diferença entre o maior e o menor valor
• Variância – Mede a dispersão em torno da media
• Desvio Padrão – Mede a dispersão em torno da media
• Coeficiente de variação – Medida relativa de variação
Amplitude
é a diferença entre o
maior e o menor valor

Jogador Altura Organizado


1 1.60 1.48 Maior = 1,69
2 1.52 1.52
3 1.66 1.60 Menor = 1,48
4 1.68 1.61
5 1.69 1.62
Amplitude = 1,69 – 1,48
6
7
1.66
1.64
1.64
1.66
Amplitude = 0,21
8 1.48 1.66
9 1.61 1.66
10 1.66 1.68
11 1.62 1.69
Variância
é uma medida da dispersão
em torno da média
 (X i − X)
n
2

S2 = i =1
n −1 1.75 Altura
1.70 Média
Jogador Altura
1 1.60 1.65
2 1.52

Altura (m)
1.60
3 1.66
1.55
4 1.68
5 1.69 1.50
6 1.66 1.45
7 1.64
1.40
8 1.48
9 1.61 1.35
10 1.66 1 2 3 4 5 6 7 8 9 10 11
Jogador
11 1.62
Variância =0,0043
Desvio Padrão
é uma medida da dispersão
em torno da média, é a raiz
quadrada da Variância
S= S 2

Jogador Altura Variância =0,0043


1 1.60
2 1.52
3 1.66
4 1.68
Desvio Padrão = 0,0043
5 1.69 Desvio Padrão = 0,066 m
6 1.66
7 1.64
8 1.48
9 1.61 É Apresentado na mesma unidade
10
11
1.66
1.62
que os dados
Coeficiente de variação
É útil para comparar dois conjuntos
de dados que não estão na mesma
unidade.
S
CV =   100%
X Desvio Padrão = 0,066 m
Jogador Altura
1 1.60
Média = 1,62 m
2 1.52
3 1.66 0,066
4 1.68
Cv = ∗ 100
1,62
5 1.69
6 1.66
7 1.64 Cv =4,07
8 1.48
9 1.61 É útil para comparar dois conjuntos de
10 1.66
11 1.62 dados que não estão na mesma unidade.
Amplitude
(maior menos o menor A amplitude é a
valor)
medida descritiva
numérica mais
simples para a
A amplitude mede a dispersão total
A amplitude é variação em um no conjunto de dados, ela não leva
conjunto de dados. em consideração como estes dados
igual ao maior estão distribuídos entre o menor
valor menos o valor e o maior valor.

menor valor.
Ela não indica se estão distribuídos de
Indica a maior diferença forma uniforme ao longo do conjunto,
possível. se estão concentrados na parte
central ou próximo aos extremos.

Amplitude = X maior − X menor


Amplitude
(maior menos o menor
Vamos imaginar um grupo de 6 Paciente Idade
valor) Pacientes. P1 45
P2 55
P3 56
P4 45
Amplitude = X maior − X menor P5
P6
33
60
Área Calculadora

Paciente Idade
P5 33
P1 45
P4 45
P2 55
P3 56
P6 60
Organizar os dados em
ordem crescente pode 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 = 60 − 33
ajudar a identificar os
valores extremos. 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 = 27
Imagine dois times, T1 e T2, os dados de idade dos jogardores são
apresentados abaixo. Qual apresenta maior variabilidade?

50
T1 50
T2
49 49
48 48
47 47
46 46
45 45
44 44
43 43
42 42
41 41
40 40
1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9

Menor Variação Maior Variação


Menor Variância Maior Variância
Menor Desvio Padrão Maior Desvio Padrão
A média na amostra A é 158 cm. Na
amostra B é também 158 cm. As
medianas são iguais a 158,5 cm, nas duas
amostras. Portanto, as amostras A e B
possuem médias e medianas idênticas.

O fato das amostras A e B possuírem


medidas de locação iguais (média e
mediana) nos permite afirmar que
adolescentes das amostras A e B são
semelhantes em relação à estatura?
Variância A variância de uma população é representada por
(dispersão em torno da σ² e pode ser definida como: a média dos Normalmente, trabalhamos
média) com amostras, e a
quadrados dos desvios em relação à média
aritmética. estimativa da variância
(representada por s².

 (X − X)
n É a soma dos desvios elevados
2
i ao quadrado dividida pelo
Essas estatísticas medem a dispersão
S2 = i =1 número de elementos da
n −1 amostra menos 1. “média” em torno da média aritmética, o
modo como os valores mais elevados
flutuam acima dela e o modo como os
( X1 − X ) + ( X 2 − X ) +  + ( X n − X )
2 2 2
S =
2 dados mais baixos se distribuem abaixo
n −1 dela.
Variância
 (X i − X)
n
Vamos imaginar um grupo de 6 2
(dispersão em torno da
média)
Pacientes.
S2 = i =1
n −1
45 − 49 ² + 55 − 49 ² + 56 − 49 ² + 45 − 49 ² + 33 − 49 ² + (60 − 49)²
𝑆2 =
6−1
𝑆 2 = 98,8 Área Calculadora
Paciente Idade
P1 45
P2 55
P3 56
P4 45
P5 33
P6 60

ഥ = 49,00
X

1º Vamos pegar cada valor de Xi e


subtrair da média e elevar o
resultado ao quadrado.
Desvio Padrão
(dispersão em torno da
É a raiz quadrada da variância, É a mais utilizada das
média) tomada como valor positivo. É medidas de dispersão,
expresso na mesma unidade
e é representado por
dos dados.
σ para população,
S= S 2
Quanto maior a dispersão,
com estimativa s para
amostra.
maior será a amplitude a
Se os valores forem todos variância e o desvio
iguais, não existirá variação, padrão. Quanto maior a
a amplitude a S² e o S, serão concentração dos
iguais a zero. valores em torno de
uma valor central,
menor será a
amplitude a S² e o S.
Desvio Padrão Vamos imaginar um grupo de 6
(dispersão em torno da
média)
Pacientes.
S= S 2

𝑆 2 = 98,8
É apenas retirar a raiz
𝑆= 98,8
quadrada da variância.
𝑆 = 9,93 Área Calculadora
Paciente Idade
P1 45
P2 55
P3 56
P4 45
P5 33
P6 60
Coeficiente de O coeficiente de variação (C.V.) Diferentemente das
variação medidas de variação
(medida relativa de
relaciona o desvio padrão em
variação) termos de porcentagem da apresentadas
média aritmética. anteriormente, o
coeficiente de variação é
S
CV =   100% O coeficiente de variação,
uma medida relativa de
X mede a dispersão dos
variação que é sempre
expressa sob a forma de
Quanto menor dados em relação à média
percentagem, e não em
melhor. aritmética.
termos das unidades dos
dados específicos.
Os pesquisadores utilizam o coeficiente de
variação para comparar a variabilidade de É útil para comparar dois conjuntos de
seus resultados com a obtida por dados que não estão na mesma
pesquisadores que trabalham com material unidade.
semelhante. Ele é sempre expresso em
porcentagem e da uma ideia da precisão do
experimento.
Coeficiente de Vamos imaginar um grupo de 6 S
variação Pacientes. CV =   100%
(medida relativa de X
variação)

𝑆 = 9,93
9,93
ഥ = 49,00 𝐶𝑣 = ∗ 100 𝐶𝑣 = 20,26%
X 49 Área Calculadora
Paciente Idade
P1 45
P2 55
P3 56
P4 45
P5 33
P6 60
Exercício  Vamos praticar no plickers
Exercício Um paciente está estudando seus tempos de corrida. Ao
longo de 10 dias ele fez anotações da do tempo de corrida em
cada dia. Os dados são apresentados na tabela abaixo.
Calcule a amplitude, a variância, o desvio padrão e o CV.

Dia Tempos
Amplitude = X maior − X menor Área Calculadora
1 39

 (X − X)
2 29 n
2
3 43 i

4 52 S2 = i =1
n −1
5 39
6 44 S = S2
7 40
8 31 S
CV =   100%
9 44 X
10 35
Exercício Um paciente está estudando seus tempos de corrida. Ao
longo de 10 dias ele fez anotações da do tempo de corrida em
cada dia. Os dados são apresentados na tabela abaixo.
Calcule a amplitude, a variância, o desvio padrão e o CV.

Dia Tempos Amplitude = X maior − X menor


1 39 Área Calculadora

 (X − X)
n
2 29 2
Amplitude=52-29=23 i
3 43 S2 = i =1

4 52 S²= ((39-39,6)²+(29-39,6)²+(43-39,6)²+ n −1
(52-39,6)²+(39-39,6)²+(44-39,6)²+
5 39
S= S
(40-39,6)²+(31-39,6)²+(44-39,6)²+ 2
6 44 (35-39,6)²)/(10-1) = 45,82
7 40
S = Raiz(45,82) S
8 31 CV =   100%
9 44 S = 6,769 X Respostas
Amplitude = 23
10 35 S² = 45,82
CV=(6,769/39,6)*100 = 17,09% S = 6,76
CV = 17,07%
Exercício Um paciente está estudando seus tempos de corrida. Ao
longo de 10 dias ele fez anotações da do tempo de corrida em
cada dia. Os dados são apresentados na tabela abaixo.
Calcule a média, a moda e a mediana.

Tempos de
Dia corrida Organizado Área Calculadora
n
n+1
1
2
39
29
29
31
X i k=
3 43 35
X= i =1 2
n
4 52 39
5 39 39
6 44 40
7 40 43
Respostas
8 31 44 Média = 39,6
9 44 44 Mediana = 39,5
10 35 52 Moda = 39 e 44
Bioestatística
Prof. Dr. Glaucio Araujo
UNIFACIG
Exercício Um paciente está estudando seus tempos de corrida. Ao
longo de 10 dias ele fez anotações da do tempo de corrida em
cada dia. Os dados são apresentados na tabela abaixo.
Calcule a média, a moda, a mediana, a amplitude, a variância,
o desvio padrão e o CV.

Área Calculadora
Dia Tempos Organizado
1 39 29
2 29 31
3 43 35
4 52 39 Amplitude = X maior − X menor
5 39 39
 (X i − X)
n
2
6 44 40
Respostas
7 40 43 S2 = i =1
Média = 39,6
n −1
8 31 Mediana = 39,5
44
9 44 44 S = S2 Moda = 39 e 44
Amplitude = 23
S² = 45,82
10 35 52 S
CV =   100% S = 6,76
X CV = 17,07%
Exercício Um paciente está estudando seus tempos de corrida. Ao
longo de 10 dias ele fez anotações da do tempo de corrida em
cada dia. Os dados são apresentados na tabela abaixo.
Calcule a média, a moda, a mediana, a amplitude, a variância,
o desvio padrão e o CV.

Amplitude=52-29=23 Área Calculadora


Dia Tempos Organizado
1 39 29 S²= ((39-39,6)²+(29-39,6)²+(43-39,6)²+
2 29 31 (52-39,6)²+(39-39,6)²+(44-39,6)²+
(40-39,6)²+(31-39,6)²+(44-39,6)²+
3 43 35 (35-39,6)²)/(10-1) = 45,82
4 52 39 Amplitude = X maior − X menor
5 39 39 S = Raiz(45,82)

 (X i − X)
n
2
6 44 40 S = 6,769 Respostas
7 40 43 S2 = i =1
Média = 39,6
n −1
8 31 CV=(6,769/39,6)*100 = 17,09% Mediana = 39,5
44
9 44 44 S = S2 Moda = 39 e 44
Amplitude = 23
S² = 45,82
10 35 52 S
CV =   100% S = 6,76
X CV = 17,07%
Obrigado. Até a próxima aula.

Você também pode gostar