Você está na página 1de 5

Medidas de tendência central: ...

Duquia RP, Bastos JLD


NOTAS DE EPIDEMIOLOGIA E ESTATÍSTICA

Medidas de tendência central:


onde a maior parte dos indivíduos
se encontra?
Measures of central tendency: where are
the bulk of people?

RODRIGO PEREIRA DUQUIA1


JOÃO LUIZ DORNELLES BASTOS2

1 MEDIDAS DE TENDÊNCIA CENTRAL deria representar esses 20 indivíduos? Dito de


outra forma, próximo de que valor encontra-se a
Conforme mencionado na primeira edição maioria das medidas de creatinina dos idosos
das Notas de Epidemiologia e Estatística desta investigados?
revista, existem várias formas de se classificar as
informações coletadas em um estudo. Inicialmen-
TABELA 1 – Descrição da creatinina sérica de 20 in-
te, podemos dividir as variáveis em dois gran- divíduos idosos.
des grupos: o das variáveis quantitativas e o das
qualitativas.1-3 Quando trabalhamos com va- Número do professor Peso (kg)
riáveis quantitativas, muitas vezes o número de 1 0,6
observações é grande e necessitamos de parâme- 2 0,8
tros para descrever de forma sucinta o compor- 3 1,0
tamento desse conjunto de informações. Utiliza- 4 0,8
mos as medidas de tendência central (MTC) para 5 0,9

expressar, através de um único número, em tor- 6 1,0


7 0,7
no de que valor tende a se concentrar um con-
8 0,5
junto de dados numéricos.1 Por exemplo, um pes- 9 1,1
quisador interessado em estudar a creatinina, 10 0,5
substância dosada pelo sangue que avalia a fun- 11 0,8
ção renal de um indivíduo, em um grupo de ido- 12 1,1
sos de um asilo, afere a creatinina de 20 idosos. 13 0,8
Posteriormente, ele registra em uma tabela (Ta- 14 0,9
bela 1) a creatinina de cada indivíduo, por ordem 15 0,8
de entrevista, a fim de estudar o valor desse 16 0,9
metabólito nesse grupo de pessoas. Da forma 17 0,7
como está apresentado na Tabela 1, podemos 18 0,6

observar especificamente a creatinina de cada 19 0,8


20 0,7
idoso. Entretanto, qual o valor numérico que po-

1 Dermatologista. Mestre em Epidemiologia pela Universidade Federal de Pelotas.


2 Odontólogo. Mestre em Epidemiologia pela Universidade Federal de Pelotas.

190 Scientia Medica, Porto Alegre: PUCRS, v. 16, n. 4, out./dez. 2006


Medidas de tendência central: ... Duquia RP, Bastos JLD

Algumas pessoas responderiam a esta ques- mas de distribuição: simétrica (também chama-
tão citando a média da creatinina nesses 20 ido- da Normal ou Gaussiana) ou assimétrica (Não-
sos. No entanto, conforme veremos posterior- Gaussiana) (Figura 1).1-3 Em uma distribuição
mente, nem sempre a média é a medida mais perfeitamente simétrica, a maioria dos dados se
adequada. Para responder a este questiona- encontra próximo de um determinado valor, que
mento, freqüentemente utilizamos as MTC, que pode ser expresso pela média, ou mediana, uma
têm como objetivo descrever de forma sucinta vez que nesse tipo de distribuição ambas as MTC
um conjunto de dados. Existem três principais são idênticas.1-3 Os demais dados se distribuem
medidas de tendência central. São elas: média, igualmente afastando-se dos valores centrais,
mediana e moda. conforme demonstrado no gráfico A da Figura 1.
Nesta figura, representamos de forma gráfi-
1.1 Média ca o peso de mil sacos de arroz de um determi-
nado depósito. A média e a mediana de peso des-
Esta é a MTC mais utilizada e melhor com- ses sacos é de 3.200g. Como podemos observar,
preendida. O cálculo da média (X) [leia-se X bar- a maioria apresenta um peso igual ou muito pró-
ra] é feito pelo somatório [representado aqui pela ximo de 3.200g e os sacos mais pesados ou mais
letra grega sigma ()] dos valores de todas as ob- leves que 3.200g se distribuem igualmente para
servações (indivíduos), dividido pelo número de ambos os lados da média, fazendo com que a re-
observações (n), conforme a fórmula abaixo.1-4 presentação gráfica desse conjunto de dados seja
simétrica e lembre o formato de um sino.
X  X No gráfico B da Figura 1 adicionamos 15 sa-
n cos de arroz de 10 kg aos mil sacos já existentes.
Utilizando os dados da Tabela 1 para calcu- Como resultado, a forma gráfica altera-se e não
lar a média de creatinina do grupo de 20 idosos, mais apresenta uma distribuição perfeitamente
verificamos que seu valor equivale a 0,8. simétrica (normal) como aquela do gráfico A. No
gráfico B, a média de peso dos sacos passa a ser
0,60,81,00,80,91,00,70,51,10,50,81,10,80,90,80,90,70,60,80,7
X 0,8 3.550g, enquanto que a mediana permanece sen-
20
do 3.200g. Dessa forma, verificamos que em dis-
Ao representarmos de forma gráfica (histo- tribuições assimétricas não podemos utilizar o
grama) um conjunto de dados quantitativos con- valor da média. Devemos, nestas situações, utili-
tínuos ou numéricos, nós podemos ter duas for- zar a mediana.
8.0e-04
.001
8.0e-04

6.0e-04
6.0e-04

Density
Density

4.0e-04
4.0e-04

2.0e-04
2.0e-04

mediana
0
0

1000 2000 3000 4000 5000 0 2000 4000 6000 8000 10000
Peso dos sacos de arroz Peso dos sacos de arroz
A B
média e mediana média

Figura 1 – À esquerda (gráfico A) temos a representação uma distribuição normal e à direita (gráfico B) a mesma represen-
tação após a inclusão de 15 sacos de arroz com 10 kg.

Scientia Medica, Porto Alegre: PUCRS, v. 16, n. 4, out./dez. 2006 191


Medidas de tendência central: ... Duquia RP, Bastos JLD

Vantagens da média Vantagens da mediana


1. Seu cálculo leva em consideração os valo- 1. Não sofre influência de valores extremos; e
res de todos indivíduos estudados; 2. A mediana é utilizada especialmente para
2. É utilizada em boa parte dos testes estatís- distribuições assimétricas, mas pode ser
ticos para calcular diferenças em um estu- utilizada para dados com distribuição si-
do; e métrica também.
3. É mais facilmente compreendida pelos lei-
tores e pesquisadores. Desvantagens da mediana
1. Suas propriedades não são bem compre-
Desvantagens da média endidas por muitas pessoas; e
1. É influenciada por valores extremos (con- 2. Não é levada em consideração na maior
forme mencionado anteriormente); parte dos testes estatísticos.
2. Só deve ser utilizada quando a distribui- Quando devemos utilizar média ou mediana?
ção dos dados for simétrica (normal ou A tendência de muitos pesquisadores é de utili-
Gaussiana) zar a média, pois o seu cálculo é facilmente reali-
zado e a sua interpretação compreendida pela
1.2 Mediana maioria dos leitores. Mas esses não devem ser os
Esta é a segunda MTC mais utilizada. Colo- únicos critérios para a escolha da medida de ten-
cando os dados em ordem crescente ou decres- dência central. Devemos lembrar que o termo
cente, a mediana corresponde ao valor que divi- média nem sempre corresponde ao número pró-
de o conjunto de informações em duas partes ximo do qual se encontra a maioria dos valores
iguais. Para seu cálculo, devemos levar em con- de um conjunto de dados. Por exemplo, quando
sideração duas situações: se o número de obser- um pesquisador nos fornece a informação de que
vações é ímpar ou par.2 a média do número de dias de freqüência à praia
Quando o número de observações for ímpar, de uma determinada cidade foi 12 no último ve-
devemos colocar os valores em ordem crescente ou rão, nós logo interpretamos que a maioria dos
decrescente para obter a mediana. Posteriormente, indivíduos dessa cidade foi 12 vezes à praia no
identificamos o valor que divide os dados em duas verão em questão.
partes iguais,1-3 tal como no Exemplo 1. Será que essa interpretação está correta? Na
Figura 1 representamos de forma gráfica, por
Exemplo 1
meio de um histograma, o número de dias fre-
Número ímpar de observações qüentados na praia no verão de 2005 pelos adul-
0,5 0,5 0,6 0,6 0,7 0,7 0,7 0,8 0,8 0,8 0,8 0,8 0,8 0,8 0,9 0,9 0,9 1,0 1,0 1,1 1,1 tos da cidade de Pelotas.5 Nesse estudo, foi per-
guntado a 3.136 adultos da cidade de Pelotas o
10 observações 10 observações número de dias que os mesmos foram à praia no
verão de 2005.5 Conforme demonstrado na Figu-
Mediana = 0,8 ra 2, gráfico A, a maior parte das pessoas não fre-
Quando o número de observações for par, qüentou a praia ou o fez por apenas um dia, en-
para calcular a mediana devemos também colo- quanto pouquíssimos indivíduos foram à praia
car os valores em ordem crescente ou decrescen- em um grande número de ocasiões. Essa hetero-
te e, após, identificar os dois valores centrais. geneidade na freqüência à praia nos fornece uma
Somamos esses dois valores centrais e dividimos distribuição dos dados denominada “assimé-
por dois, obtendo assim o valor da mediana,1-3 trica” (não-gaussiana). Isto significa que a maio-
conforme o Exemplo 2 abaixo. ria dos indivíduos foi poucos dias à praia, en-
Exemplo 2 quanto muito poucos freqüentaram-na quase que
diariamente no mesmo período.
Número par de observações
Ao contrário do que ocorre em distribuições
5 0,5 0,6 0,6 0,7 0,7 0,7 0,7 0,7 0,7 0,8 0,9 0,9 0,9 0,9 0,9 1,0 1,0 1,1 Gaussianas, em distribuições assimétricas, a mé-
dia e a mediana se distanciam, fornecendo valo-
10 observações 10 observações res diferentes.1-3 Nestes casos, a média não repre-
Mediana = 0,7 + 0,8 = 0,15/2 = 0,75 senta o ponto onde se encontra a maioria dos va-
A mediana, neste caso, é de 0,75 lores de um conjunto de dados.

192 Scientia Medica, Porto Alegre: PUCRS, v. 16, n. 4, out./dez. 2006


Medidas de tendência central: ... Duquia RP, Bastos JLD

60

60
40

40
Porcentagem

Porcentagem
20

20
Média= 12 dias
0

0
0 50 100 0 50 100
Quantos dias foi a praia Quantos dias foi a praia
A B Mediana= 1 dia

Figura 2 – (A) Representação do número de dias de exposição solar na praia. (B) Valores da média e mediana do número de
dias freqüentados na praia.

No gráfico B, apresentamos o mesmo gráfico de em anos de alunos de uma classe de aula.


com os respectivos valores da média e da media- Como podemos notar, existem mais alunos com
na do número de dias freqüentados na praia. 7 anos de idade nessa turma. Desta forma, dize-
Como podemos observar, a distribuição dos da- mos que a moda desse conjunto de dados é 7, pois
dos é assimétrica e, portanto, os valores da mé- a maioria das crianças apresenta 7 anos de ida-
dia e da mediana se distanciam. Neste caso, a de. Devemos lembrar que sempre que uma dis-
média de dias de freqüência à praia foi 12, mas tribuição for perfeitamente simétrica, o valor da
esse valor não representa o ponto onde se encon- moda também será igual ao da média e ao da
tra a maioria dos valores. O ponto que represen- mediana. Outra observação a ser feita é que, al-
ta mais adequadamente o número de dias fre- gumas vezes, a distribuição de um conjunto de
qüentados na praia pela maioria dos indivíduos dados pode não ter moda. Isto ocorre caso as ob-
é o valor 1. Este é o valor que divide esse conjun- servações sejam todas diferentes entre si nesse
to de dados em duas partes iguais, ou seja, é a conjunto de dados.
mediana.
Dessa forma, nos casos em que a distribuição
dos dados for assimétrica, devemos utilizar como TABELA 2 – Lista de alunos com suas respectivas
medida de tendência central preferencialmente idades.
a mediana, pois seu valor não será influenciado
Nome dos alunos Idade em anos
por valores extremos de distribuições assimé-
tricas.1-3 Sempre que utilizarmos a média como 1. João 7

MTC para distribuições assimétricas, seu valor 2. Samuel 9

será influenciado pelos valores extremos do con- 3. Rodrigo 7

junto de dados, ou seja, os valores extremos de 4. Luciano 7


5. Gustavo 10
uma distribuição assimétrica “puxarão” o valor
6. Luis Artur 11
da média para perto deles.
7. Luiz Henrique 7
8. Gustavo 8
1.3 Moda 9. Paulo 9
Não foi ao acaso que deixamos essa medida 10. Gerson 7
por último lugar. Sua utilização é pouco freqüen- 11. Julio 7
te e serve apenas para demonstrar qual o valor é 12. Lucio 12

o mais freqüente (que mais se repete) em um con- 13. Lucas 7

junto de dados.1,2 Por exemplo, na Tabela 2 de- 14. Marcelo 9


15. Mateus 7
monstramos um conjunto de valores com a ida-

Scientia Medica, Porto Alegre: PUCRS, v. 16, n. 4, out./dez. 2006 193


Medidas de tendência central: ... Duquia RP, Bastos JLD

2 CONSIDERAÇÕES FINAIS REFERÊNCIAS

O conhecimento das propriedades das MTC 1 Altman DG. Practical statistics for medical research.
é fundamental para descrição, interpretação e London: Chapman & Hall; 1997.
análise de dados em pesquisa. 2 Kirkwood BR, Sterne JAC. Essential medical statistics.
Oxford: Blackwell Science; 2003.
Frente a um artigo, devemos sempre ter o cui-
3 Massad E, Menezes RX, Silveira PSP, Ortega NRS. Mé-
dado de avaliar se as MTC foram bem aplicadas, todos quantitativos em medicina. São Paulo: Manole;
pois, caso contrário, todas as conclusões dos au- 2004.
tores e, conseqüentemente, as nossas poderão 4 Pereira MG. Epidemiologia: teoria e prática. Rio de Ja-
estar distorcidas. O mesmo se aplica para o tipo neiro: Guanabara Koogan; 1995.
de teste utilizado para realizar análises estatísti- 5 Duquia RP, Menezes AMB, Reichert FF, Almeida HL.
Prevalence and associated factors with sunscreen use
cas, já que o pressuposto de muitos deles é que a in Southern Brazil: A population-based study. J Am
distribuição da variável de interesse (desfecho) Acad Dermatol. 2007: in press.
tenha distribuição simétrica (normal). Dessa for-
ma, muitas vezes, observando a forma da distri- Endereço para correspondência:
JOÃO LUIZ DORNELLES BASTOS
buição dos dados, sabemos se um determinado Avenida do Antão, 353 – Morro da Cruz
teste em um artigo foi corretamente utilizado e CEP 88025-150, Florianópolis, SC, Brasil
Telefone: (48) 3028-1345
se seus resultados são válidos. E-mail: joao@pilotis.com.br

194 Scientia Medica, Porto Alegre: PUCRS, v. 16, n. 4, out./dez. 2006

Você também pode gostar