Você está na página 1de 20

Bioestatística

Material Teórico
Medidas de Tendência Central e de Dispersão

Responsável pelo Conteúdo:


Prof.ª Me. Priscila Bernardo Martins

Revisão Textual:
Prof.ª Dr.ª Luciene Oliveira da Costa Granadeiro
Medidas de Tendência
Central e de Dispersão

• Introdução;
• Medidas de Tendência Central;
• Medidas de Dispersão;
• Conclusão.

OBJETIVO DE APRENDIZADO
• Ampliar seu conhecimento sobre as Medidas de Tendência Central (Média, Moda e a
Mediana) e Medidas de Dispersão: Variância e Desvio Padrão.
Orientações de estudo
Para que o conteúdo desta Disciplina seja bem
aproveitado e haja maior aplicabilidade na sua
formação acadêmica e atuação profissional, siga
algumas recomendações básicas:
Conserve seu
material e local de
estudos sempre
organizados.
Aproveite as
Procure manter indicações
contato com seus de Material
colegas e tutores Complementar.
para trocar ideias!
Determine um Isso amplia a
horário fixo aprendizagem.
para estudar.

Mantenha o foco!
Evite se distrair com
as redes sociais.

Seja original!
Nunca plagie
trabalhos.

Não se esqueça
de se alimentar
Assim: e de se manter
Organize seus estudos de maneira que passem a fazer parte hidratado.
da sua rotina. Por exemplo, você poderá determinar um dia e
horário fixos como seu “momento do estudo”;

Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma


alimentação saudável pode proporcionar melhor aproveitamento do estudo;

No material de cada Unidade, há leituras indicadas e, entre elas, artigos científicos, livros, vídeos
e sites para aprofundar os conhecimentos adquiridos ao longo da Unidade. Além disso, você tam-
bém encontrará sugestões de conteúdo extra no item Material Complementar, que ampliarão sua
interpretação e auxiliarão no pleno entendimento dos temas abordados;

Após o contato com o conteúdo proposto, participe dos debates mediados em fóruns de discus-
são, pois irão auxiliar a verificar o quanto você absorveu de conhecimento, além de propiciar o
contato com seus colegas e tutores, o que se apresenta como rico espaço de troca de ideias e de
aprendizagem.
UNIDADE Medidas de Tendência Central e de Dispersão

Introdução
Vamos abordar um assunto importante a respeito da transmissão das infor-
mações relativas à amostra ou à população estudada. Em se tratando dos dados
obtidos, a condensação deles facilita a compreensão das características essenciais
de uma amostra ou população. Para viabilizar essa etapa, usamos as medidas de
tendência central e de dispersão. Hoje vamos conhecer um pouco mais sobre
essas medidas.

Figura 1
Fonte: Getty Images

Medidas de Tendência Central


As medidas de tendência central são confiáveis quanto mais representativo for o
conjunto de elementos da amostra ou da população. Se o conjunto de elementos for
bem selecionado, se guardar características semelhantes às características da popu-
lação que foi extraída, e se for suficientemente grande, os dados refletirão melhor
o que poderíamos encontrar na população. Pode-se dizer também que essas medi-
das – de tendência central e de dispersão – são uma primeira caracterização dos
conjuntos populacionais ou amostrais.

Média Aritmética
A média aritmética consiste na soma dos valores de um conjunto de dados, di­
vididos pelo número de elementos.

Veja o exemplo abaixo. Considere o seguinte conjunto de dados:

11  10  10  12  23  24  30

8
A média aritmética será = 11 + 10 + 10 + 12 + 23 + 24 + 30 / 7 = 17,14

Observação 1: Frequentemente a média aritmética vem acompanhada de outra medida, o desvio padrão.
Essa é uma medida de dispersão e indica o quanto os valores se afastam ou se aproximam da média.

Observação 2: A média aritmética é muito influenciada por valores extremos, ou seja, valores muito
menores ou maiores influenciam de forma marcante o valor real da média.

Figura 2
Fonte: Getty Images

Dividir a conta em um bar (“rachar a conta”) é um bom exemplo prático de mé-


dia aritmética.

A fórmula para cálculo da média aritmética é:

x + x2 ++ xn i =1
∑x i

x= 1 =
n n

Onde o X com uma barra significa média aritmética de uma amostra e n o


número de indivíduos da amostra.

Exercício resolvido:

Uma nutricionista decidiu investigar a circunferência abdominal de 10 gerentes


de uma grande empresa multinacional interessados em perder peso por meio de
um programa de reeducação alimentar. As medidas seguem abaixo:

Gerentes 1 2 3 4 5 6 7 8 9 10
Circunferência 88 83 79 76 78 70 80 82 86 105

9
9
UNIDADE Medidas de Tendência Central e de Dispersão

Devemos primeiro determinar qual o tamanho da amostra (n):

Como no caso temos 10 gerentes, então dizemos que n = 10.

Cada gerente representa um valor de x, como segue:

x1 = 88

x2 = 83

x3 = 79

x4 = 76

x5 = 78

x6 = 70

x7 = 80

x8 = 82

x9 = 86

x10 = 105

Substituindo na fórmula, teremos:


88 + 83 + 79 + 76 + 78 + 70 + 80 + 82 + 86 + 105
x=
10

827
x=
10

x = 82 , 7

Dizemos então que: a média aritmética da circunferência abdominal dos 10


­gerentes é de 82,7 cm.

Mediana
A mediana é outra medida que indica a caracterização do conjunto de valores.
Ela indica o valor que divide ao meio o conjunto de valores, ou seja, indica o valor
que ocupa a posição central desse conjunto, não sofrendo qualquer interfe­
rência dos valores extremos. O seu cálculo depende da ordenação dos dados, o
que corresponde a colocá-los em ordem crescente ou decrescente.

Continuando com o exemplo usado no calculo da média aritmética:

10
11 10 10 12 23 24 30
A mediana seria assim calculada: Essa é a mediana, pois é o valor
central de um conjunto de dados.

10 10 11 12 23 24 30
Quando o número de valores for
ímpar (como no caso acima), a
mediana será sempre o valor do meio.

Segue um exemplo com n par:


Como o n é par, soma-se os dois
11 10 12 23 24 valores centrais e divide-se por “2”.

10+12=22
22 2=11

Portanto, nesse exemplo, 11 é a mediana da distribuição apresentada.

Moda
A moda é o valor que ocorre com maior frequência. Essa medida, juntamente
com a média e a mediana, ajudam a compreender o padrão homogêneo dos dados.
Quando essas três medidas estão próximas, podemos dizer que o conjunto de
dados é homogêneo, ou seja, não há valores extremos, mas sim uma tendência de
que boa parte dos números se localizem próximos a essas três medidas.

Figura 3
Fonte: Getty Images

11
11
UNIDADE Medidas de Tendência Central e de Dispersão

Se um conjunto de dados possui um único valor que se repete com maior frequên-
cia, diz-se que o conjunto é unimodal; quando dois números aparecem com maior
frequência, é bimodal; se três ou mais números aparecem com maior frequên­cia, é
multimodal. A ausência de moda caracteriza um conjunto amodal.

Veja o exemplo abaixo. Considere o seguinte conjunto de dados:

0  1  1  2  3  4  4  4  5

Analisando os dados, observa-se que o número 4 é o número que se repete com


maior frequência (3 vezes). Dessa forma, dizemos que o conjunto é unimodal.

Vamos analisar outro conjunto de dados:

0  1  1  1  3  4  4  4  5

Analisando os dados, observa-se que os números 1 e 4 se repetem com maior


frequência (3 vezes cada um). Dessa forma, dizemos que o conjunto é bimodal.

Medidas de Dispersão
As medidas de tendência central, vistas anteriormente, ajudam a explicar a ten-
dência central dos dados, ou seja, o quanto esse conjunto é homogêneo. Essas
medidas precisam estar acompanhadas de outras informações que indiquem a
­VARIABILIDADE dos dados, isto é, o quanto os valores divergem em relação aos
valores de caracterização geral da população ou amostra.

Considere a situação apresentada no livro Introdução à bioestatística, da autora


Sônia Vieira (2008):
Considerando 2 domicílios, sendo que em um deles moram 7 pessoas­,
todas com 22 anos de idade. A média de idade será de 22 anos. No ou-
tro domicilio, poderíamos ter a mesma média de idade, no ­entanto,
­nesse ­s egundo domicilio, moram uma garota de 17 anos, um garoto
com 23 anos, duas crianças de 2 e 3 anos, respectivamente, além de
uma mulher de 38 anos, outra criança de 8 anos e uma senhora de
65 anos.

Nesse exemplo acima, temos dois conjuntos de valores, cuja variabilidade é diferente, embora a média
seja a mesma. No primeiro conjunto de valores, a variabilidade é bem menor, condição contrária à que
ocorre no segundo grupo­, no qual a variabilidade é maior, pois as idades variam de 2 até 65 anos.

12
Quartis e Percentis
Já aprendemos que a mediana é o valor que divide ao meio o conjunto de valores.
Poderíamos dizer também que a mediana indica que, abaixo daquele valor, temos 50%
das observações dos valores. Mas há situações em que podemos dividir o conjunto de
valores em partes menores: quartis, decis e percentis indicam essa possibilidade.

Sendo assim, o primeiro quartil indica que 25% dos valores estão abaixo desse
valor; o segundo quartil indica que 50% da amostra está abaixo desse valor; e assim
por diante. Veja o modelo abaixo:

1º quartil 2º quartil 3º quartil 4º quartil

25% 25% 25% 25%

50% DOS VALORES

75% DOS VALORES


Já os percentis consideram as posições dividindo o conjunto de valores em 100
partes. Da mesma forma que o quartil, o percentil 70, por exemplo, indica que 70%
dos valores de um conjunto encontram-se abaixo desse valor.

Observação: percebam, no modelo esquemático abaixo, que uma posição (ou


valor) pode ser indicada de mais de uma forma.

25% 25% 25% 25%

50% 2º quartil

50% Percentil 50

13
13
UNIDADE Medidas de Tendência Central e de Dispersão

Amplitude, Mínimo e Máximo


A amplitude explica a variabilidade de valores, e por isso é considerada uma
medida de dispersão. É definida como a diferença entre o maior e o menor valor de
um determinado conjunto de valores.

Menor, também chamado de mínimo, é o menor valor de um determinado con-


junto de valores.

Maior, também chamado de máximo, é o maior valor de um determinado con-


junto de valores.

Maior _ menor

A M P L I T U D E

Importante! Importante!

Assim como a média, a amplitude é muito influenciada por valores extremos, isto é, um
valor muito baixo ou muito alto altera facilmente essa medida e pode, em determinados
casos, não representar a real variabilidade do conjunto de valores, pois houve o compro-
metimento em razão desse(s) valor(es) extremo(s).

Variância e Desvio Padrão


Essas duas medidas indicam a variabilidade, distância dos valores em torno do
valor médio encontrado para um determinado conjunto de dados (valores). Se meno­
res, a variância e o desvio padrão indicam pouca variabilidade dos valores, caracteri-
zando um conjunto de valores mais homogêneo, ou seja, de variabilidade pequena.

Considere as informações abaixo:

∑(x − x ) ∑(x − x )
2 2

Variância = Desvio Padrão =


n −1 n −1

∑ : somatória
x : o valor de cada uma das observações
x : a média da amostra
n : o número de obsservações (tamanho da amostra)

Perceba que tanto a variância quanto o desvio padrão partem do cálculo da


distância de um valor em relação a media (x – x). Faz-se a somatória dessas
distâncias e, por “necessidades” matemáticas, eleva-se ao quadrado (para eliminar
os valores negativos das distâncias) ou extrai-se a raiz quadrada (pois queremos
eliminar a elevação ao quadrado de uma determinada medida).

14
Definiremos como variância a soma dos quadrados dos desvios de cada observação em relação a media,
dividida por (n – 1).
E desvio padrão como a raiz quadrada da variância.

Exercício Resolvido:

Vamos considerar o seguinte conjunto de notas de um determinado aluno:

5,0 6,0 5,0 9,0

Calcule a Variância e o Desvio Padrão.

Variância é representada por s. Pela fórmula dada, precisamos subtrair cada


valor de x da média da amostra, somar todos esses valores, elevar o resultado ao
quadrado e depois dividir por n – 1.

Vamos fazer passo a passo:

Abaixo a fórmula do desvio padrão:

s=
∑( x − x ) 2

n −1

Vamos calcular em primeiro lugar a média:

x = (5 + 6 +5 + 9) ÷ 4
x = 25 ÷ 4
x = 6 , 25

Vamos subtrair cada valor de x da média amostral:

Notas dos alunos Média calculada x menos a média

x x ( x –x )
5 – 6,25 –1,25
6 – 6,25 –0,25
5 – 6,25 –1,25
9 – 6,25 +2,75

Agora, vamos elevar os valores obtidos ao quadrado:

x x ( x –x ) ( x –x )2
5 – 6,25 –1,25 1,5625
6 – 6,25 –0,25 0,0625
5 – 6,25 –1,25 1,5625
9 – 6,25 +2,75 7,5625

15
15
UNIDADE Medidas de Tendência Central e de Dispersão

Precisamos, então, somar os quadrados obtidos:

x x ( x –x ) ( x –x )2
5 – 6,25 –1,25 1,56
6 – 6,25 –0,25 0,0625 +
5 – 6,25 –1,25 1,5625
9 – 6,25 +2,75 7,5625
= 10,75

A fórmula pede que esse valor (10,75), seja dividido por n – 1.

Em nosso exemplo, n = 4 (quatro notas), então 4 – 1 = 3

Então:

10,75 ÷ 3 = 3,58

Portanto:

s (variância) é igual a 3,58.

O desvio padrão é representado por s2.

s2 é igual a raiz quadrada de s (variância), então:

s2 = s

s2 = 3,58

s2 = 1,89 ou seja, o desvio padrão das notas desse aluno é 1,89, sendo que a
média foi 6,25.

Coeficiente de Variação
Essa medida indica a dispersão dos valores em relação à média. Para se calcular
o coeficiente de variação, usamos o desvio padrão e a média:

CV= desvio padrão / média x 100

Percebam que o CV não possuirá unidade de medida (é adimensional). Dessa


forma, podemos comparar a dispersão de valores para dados quantitativos que
utilizaram medidas diferentes, como metros e quilogramas. O uso de coeficientes
não é tão frequente quanto o uso das outras medidas discutidas neste capítulo.
Os c­ oeficientes são importantes na elaboração de indicadores de saúde.

16
Em Síntese Importante!

As medidas de tendência central e de dispersão são úteis na compreensão e caracteri-


zação dos dados populacionais ou amostrais. A apresentação dessas medidas ajuda a
entender o caráter homogêneo ou não dos dados, bem como a forma de dispersão dos
mesmos em relação a um determinado valor médio.

17
17
UNIDADE Medidas de Tendência Central e de Dispersão

Material Complementar
Indicações para saber mais sobre os assuntos abordados nesta Unidade:

Vídeos
Moda, Média e Mediana
https://youtu.be/UfupcG1ax6U
Média e Mediana de dados agrupados
https://youtu.be/7djAJFHYyno
Propriedades da Média e Desvio Padrão
https://youtu.be/3swCXxdYwdI
Cálculo do desvio padrão e da variância
https://youtu.be/PEN2M_eo6SY

18
Referências
ARANGO, H. G. Bioestatística – Teórica e Computacional. 2. ed. Rio de Janeiro:
Guanabara Koogan, 2005. (acompanha CD demonstrativo)

VIEIRA, S. Princípios de Estatística. São Paulo: Pioneira Thomson Learning, 2003.

VIEIRA, S. Introdução à Bioestatística. 4. ed. Rio de Janeiro: Elsevier, 2008.

TRIOLA, M. F. Introdução à Estatística. Rio de Janeiro: LTC, 2005.

19
19

Você também pode gostar