Você está na página 1de 5

Medidas de tendncia central: ...

Duquia RP, Bastos JLD


NOTAS DE EPIDEMIOLOGIA E ESTATSTICA

Medidas de tendncia central:


onde a maior parte dos indivduos
se encontra?
Measures of central tendency: where are
the bulk of people?

RODRIGO PEREIRA DUQUIA1


JOO LUIZ DORNELLES BASTOS2

1 MEDIDAS DE TENDNCIA CENTRAL deria representar esses 20 indivduos? Dito de


outra forma, prximo de que valor encontra-se a
Conforme mencionado na primeira edio maioria das medidas de creatinina dos idosos
das Notas de Epidemiologia e Estatstica desta investigados?
revista, existem vrias formas de se classificar as
informaes coletadas em um estudo. Inicialmen-
TABELA 1 Descrio da creatinina srica de 20 in-
te, podemos dividir as variveis em dois gran- divduos idosos.
des grupos: o das variveis quantitativas e o das
qualitativas.1-3 Quando trabalhamos com va- Nmero do professor Peso (kg)
riveis quantitativas, muitas vezes o nmero de 1 0,6
observaes grande e necessitamos de parme- 2 0,8
tros para descrever de forma sucinta o compor- 3 1,0
tamento desse conjunto de informaes. Utiliza- 4 0,8
mos as medidas de tendncia central (MTC) para 5 0,9
expressar, atravs de um nico nmero, em tor- 6 1,0
no de que valor tende a se concentrar um con- 7 0,7
8 0,5
junto de dados numricos.1 Por exemplo, um pes-
9 1,1
quisador interessado em estudar a creatinina,
10 0,5
substncia dosada pelo sangue que avalia a fun- 11 0,8
o renal de um indivduo, em um grupo de ido- 12 1,1
sos de um asilo, afere a creatinina de 20 idosos. 13 0,8
Posteriormente, ele registra em uma tabela (Ta- 14 0,9
bela 1) a creatinina de cada indivduo, por ordem 15 0,8
de entrevista, a fim de estudar o valor desse 16 0,9
metablito nesse grupo de pessoas. Da forma 17 0,7
como est apresentado na Tabela 1, podemos 18 0,6
observar especificamente a creatinina de cada 19 0,8
idoso. Entretanto, qual o valor numrico que po- 20 0,7

1 Dermatologista. Mestre em Epidemiologia pela Universidade Federal de Pelotas.


2 Odontlogo. Mestre em Epidemiologia pela Universidade Federal de Pelotas.

190 Scientia Medica, Porto Alegre: PUCRS, v. 16, n. 4, out./dez. 2006


Medidas de tendncia central: ... Duquia RP, Bastos JLD

Algumas pessoas responderiam a esta ques- mas de distribuio: simtrica (tambm chama-
to citando a mdia da creatinina nesses 20 ido- da Normal ou Gaussiana) ou assimtrica (No-
sos. No entanto, conforme veremos posterior- Gaussiana) (Figura 1).1-3 Em uma distribuio
mente, nem sempre a mdia a medida mais perfeitamente simtrica, a maioria dos dados se
adequada. Para responder a este questiona- encontra prximo de um determinado valor, que
mento, freqentemente utilizamos as MTC, que pode ser expresso pela mdia, ou mediana, uma
tm como objetivo descrever de forma sucinta vez que nesse tipo de distribuio ambas as MTC
um conjunto de dados. Existem trs principais so idnticas.1-3 Os demais dados se distribuem
medidas de tendncia central. So elas: mdia, igualmente afastando-se dos valores centrais,
mediana e moda. conforme demonstrado no grfico A da Figura 1.
Nesta figura, representamos de forma grfi-
1.1 Mdia ca o peso de mil sacos de arroz de um determi-
nado depsito. A mdia e a mediana de peso des-
Esta a MTC mais utilizada e melhor com- ses sacos de 3.200g. Como podemos observar,
preendida. O clculo da mdia (X) [leia-se X bar- a maioria apresenta um peso igual ou muito pr-
ra] feito pelo somatrio [representado aqui pela ximo de 3.200g e os sacos mais pesados ou mais
letra grega sigma ()] dos valores de todas as ob- leves que 3.200g se distribuem igualmente para
servaes (indivduos), dividido pelo nmero de ambos os lados da mdia, fazendo com que a re-
observaes (n), conforme a frmula abaixo.1-4 presentao grfica desse conjunto de dados seja
simtrica e lembre o formato de um sino.
X =
X No grfico B da Figura 1 adicionamos 15 sa-
n cos de arroz de 10 kg aos mil sacos j existentes.
Utilizando os dados da Tabela 1 para calcu- Como resultado, a forma grfica altera-se e no
lar a mdia de creatinina do grupo de 20 idosos, mais apresenta uma distribuio perfeitamente
verificamos que seu valor equivale a 0,8. simtrica (normal) como aquela do grfico A. No
grfico B, a mdia de peso dos sacos passa a ser
0,6+0,8+1,0+0,8+0,9+1,0+0,7+0,5+1,1+0,5+0,8+1,1+0,8+0,9+0,8+0,9+0,7+0,6+0,8+0,7
X= = 0,8 3.550g, enquanto que a mediana permanece sen-
20
do 3.200g. Dessa forma, verificamos que em dis-
Ao representarmos de forma grfica (histo- tribuies assimtricas no podemos utilizar o
grama) um conjunto de dados quantitativos con- valor da mdia. Devemos, nestas situaes, utili-
tnuos ou numricos, ns podemos ter duas for- zar a mediana.
8.0e-04
.001
8 .0e-04

6.0e-04
4 .0e-04 6 .0e-04

Density
De nsity

4.0e-04
2.0e-04
2 .0e-04

mediana
0
0

1000 200 0 3 000 4000 5 00 0 0 2000 4000 6000 8000 10000


Peso dos sacos de arro z Peso dos sacos de arroz
A B
mdia e mediana mdia

Figura 1 esquerda (grfico A) temos a representao uma distribuio normal e direita (grfico B) a mesma represen-
tao aps a incluso de 15 sacos de arroz com 10 kg.

Scientia Medica, Porto Alegre: PUCRS, v. 16, n. 4, out./dez. 2006 191


Medidas de tendncia central: ... Duquia RP, Bastos JLD

Vantagens da mdia Vantagens da mediana


1. Seu clculo leva em considerao os valo- 1. No sofre influncia de valores extremos; e
res de todos indivduos estudados; 2. A mediana utilizada especialmente para
2. utilizada em boa parte dos testes estats- distribuies assimtricas, mas pode ser
ticos para calcular diferenas em um estu- utilizada para dados com distribuio si-
do; e mtrica tambm.
3. mais facilmente compreendida pelos lei-
tores e pesquisadores. Desvantagens da mediana
1. Suas propriedades no so bem compre-
Desvantagens da mdia endidas por muitas pessoas; e
1. influenciada por valores extremos (con- 2. No levada em considerao na maior
forme mencionado anteriormente); parte dos testes estatsticos.
2. S deve ser utilizada quando a distribui- Quando devemos utilizar mdia ou mediana?
o dos dados for simtrica (normal ou A tendncia de muitos pesquisadores de utili-
Gaussiana) zar a mdia, pois o seu clculo facilmente reali-
zado e a sua interpretao compreendida pela
1.2 Mediana maioria dos leitores. Mas esses no devem ser os
Esta a segunda MTC mais utilizada. Colo- nicos critrios para a escolha da medida de ten-
cando os dados em ordem crescente ou decres- dncia central. Devemos lembrar que o termo
cente, a mediana corresponde ao valor que divi- mdia nem sempre corresponde ao nmero pr-
de o conjunto de informaes em duas partes ximo do qual se encontra a maioria dos valores
iguais. Para seu clculo, devemos levar em con- de um conjunto de dados. Por exemplo, quando
siderao duas situaes: se o nmero de obser- um pesquisador nos fornece a informao de que
vaes mpar ou par.2 a mdia do nmero de dias de freqncia praia
Quando o nmero de observaes for mpar, de uma determinada cidade foi 12 no ltimo ve-
devemos colocar os valores em ordem crescente ou ro, ns logo interpretamos que a maioria dos
decrescente para obter a mediana. Posteriormente, indivduos dessa cidade foi 12 vezes praia no
identificamos o valor que divide os dados em duas vero em questo.
partes iguais,1-3 tal como no Exemplo 1. Ser que essa interpretao est correta? Na
Exemplo 1 Figura 1 representamos de forma grfica, por
meio de um histograma, o nmero de dias fre-
Nmero mpar de observaes
qentados na praia no vero de 2005 pelos adul-
0,5 0,5 0,6 0,6 0,7 0,7 0,7 0,8 0,8 0,8 0,8 0,8 0,8 0,8 0,9 0,9 0,9 1,0 1,0 1,1 1,1 tos da cidade de Pelotas.5 Nesse estudo, foi per-
guntado a 3.136 adultos da cidade de Pelotas o
10 observaes 10 observaes nmero de dias que os mesmos foram praia no
vero de 2005.5 Conforme demonstrado na Figu-
Mediana = 0,8
ra 2, grfico A, a maior parte das pessoas no fre-
Quando o nmero de observaes for par, qentou a praia ou o fez por apenas um dia, en-
para calcular a mediana devemos tambm colo- quanto pouqussimos indivduos foram praia
car os valores em ordem crescente ou decrescen- em um grande nmero de ocasies. Essa hetero-
te e, aps, identificar os dois valores centrais. geneidade na freqncia praia nos fornece uma
Somamos esses dois valores centrais e dividimos distribuio dos dados denominada assim-
por dois, obtendo assim o valor da mediana,1-3 trica (no-gaussiana). Isto significa que a maio-
conforme o Exemplo 2 abaixo. ria dos indivduos foi poucos dias praia, en-
Exemplo 2 quanto muito poucos freqentaram-na quase que
Nmero par de observaes diariamente no mesmo perodo.
Ao contrrio do que ocorre em distribuies
5 0,5 0,6 0,6 0,7 0,7 0,7 0,7 0,7 0,7 0,8 0,9 0,9 0,9 0,9 0,9 1,0 1,0 1,1
Gaussianas, em distribuies assimtricas, a m-
dia e a mediana se distanciam, fornecendo valo-
10 observaes 10 observaes
res diferentes.1-3 Nestes casos, a mdia no repre-
Mediana = 0,7 + 0,8 = 0,15/2 = 0,75 senta o ponto onde se encontra a maioria dos va-
A mediana, neste caso, de 0,75 lores de um conjunto de dados.

192 Scientia Medica, Porto Alegre: PUCRS, v. 16, n. 4, out./dez. 2006


Medidas de tendncia central: ... Duquia RP, Bastos JLD

60

60
40

40
Porcentagem

Porcentag em
20

20
Mdia= 12 dias
0

0
0 50 100 0 50 100
Quantos dias foi a praia Qu antos dias foi a praia
A B Mediana= 1 dia

Figura 2 (A) Representao do nmero de dias de exposio solar na praia. (B) Valores da mdia e mediana do nmero de
dias freqentados na praia.

No grfico B, apresentamos o mesmo grfico de em anos de alunos de uma classe de aula.


com os respectivos valores da mdia e da media- Como podemos notar, existem mais alunos com
na do nmero de dias freqentados na praia. 7 anos de idade nessa turma. Desta forma, dize-
Como podemos observar, a distribuio dos da- mos que a moda desse conjunto de dados 7, pois
dos assimtrica e, portanto, os valores da m- a maioria das crianas apresenta 7 anos de ida-
dia e da mediana se distanciam. Neste caso, a de. Devemos lembrar que sempre que uma dis-
mdia de dias de freqncia praia foi 12, mas tribuio for perfeitamente simtrica, o valor da
esse valor no representa o ponto onde se encon- moda tambm ser igual ao da mdia e ao da
tra a maioria dos valores. O ponto que represen- mediana. Outra observao a ser feita que, al-
ta mais adequadamente o nmero de dias fre- gumas vezes, a distribuio de um conjunto de
qentados na praia pela maioria dos indivduos dados pode no ter moda. Isto ocorre caso as ob-
o valor 1. Este o valor que divide esse conjun- servaes sejam todas diferentes entre si nesse
to de dados em duas partes iguais, ou seja, a conjunto de dados.
mediana.
Dessa forma, nos casos em que a distribuio
dos dados for assimtrica, devemos utilizar como TABELA 2 Lista de alunos com suas respectivas
medida de tendncia central preferencialmente idades.
a mediana, pois seu valor no ser influenciado
Nome dos alunos Idade em anos
por valores extremos de distribuies assim-
tricas.1-3 Sempre que utilizarmos a mdia como 1. Joo 7
MTC para distribuies assimtricas, seu valor 2. Samuel 9
ser influenciado pelos valores extremos do con- 3. Rodrigo 7
junto de dados, ou seja, os valores extremos de 4. Luciano 7
uma distribuio assimtrica puxaro o valor 5. Gustavo 10

da mdia para perto deles. 6. Luis Artur 11


7. Luiz Henrique 7
8. Gustavo 8
1.3 Moda
9. Paulo 9
No foi ao acaso que deixamos essa medida 10. Gerson 7
por ltimo lugar. Sua utilizao pouco freqen- 11. Julio 7
te e serve apenas para demonstrar qual o valor 12. Lucio 12
o mais freqente (que mais se repete) em um con- 13. Lucas 7
junto de dados.1,2 Por exemplo, na Tabela 2 de- 14. Marcelo 9
monstramos um conjunto de valores com a ida- 15. Mateus 7

Scientia Medica, Porto Alegre: PUCRS, v. 16, n. 4, out./dez. 2006 193


Medidas de tendncia central: ... Duquia RP, Bastos JLD

2 CONSIDERAES FINAIS REFERNCIAS

O conhecimento das propriedades das MTC 1 Altman DG. Practical statistics for medical research.
fundamental para descrio, interpretao e London: Chapman & Hall; 1997.
anlise de dados em pesquisa. 2 Kirkwood BR, Sterne JAC. Essential medical statistics.
Oxford: Blackwell Science; 2003.
Frente a um artigo, devemos sempre ter o cui-
3 Massad E, Menezes RX, Silveira PSP, Ortega NRS. M-
dado de avaliar se as MTC foram bem aplicadas, todos quantitativos em medicina. So Paulo: Manole;
pois, caso contrrio, todas as concluses dos au- 2004.
tores e, conseqentemente, as nossas podero 4 Pereira MG. Epidemiologia: teoria e prtica. Rio de Ja-
estar distorcidas. O mesmo se aplica para o tipo neiro: Guanabara Koogan; 1995.
de teste utilizado para realizar anlises estatsti- 5 Duquia RP, Menezes AMB, Reichert FF, Almeida HL.
Prevalence and associated factors with sunscreen use
cas, j que o pressuposto de muitos deles que a in Southern Brazil: A population-based study. J Am
distribuio da varivel de interesse (desfecho) Acad Dermatol. 2007: in press.
tenha distribuio simtrica (normal). Dessa for-
ma, muitas vezes, observando a forma da distri- Endereo para correspondncia:
JOO LUIZ DORNELLES BASTOS
buio dos dados, sabemos se um determinado Avenida do Anto, 353 Morro da Cruz
teste em um artigo foi corretamente utilizado e CEP 88025-150, Florianpolis, SC, Brasil
Telefone: (48) 3028-1345
se seus resultados so vlidos. E-mail: joao@pilotis.com.br

194 Scientia Medica, Porto Alegre: PUCRS, v. 16, n. 4, out./dez. 2006