Você está na página 1de 19

BIOESTATÍSTICA

Medidas de
tendência central
Cristiane da Silva

OBJETIVOS DE APRENDIZAGEM

> Definir as medidas de tendência central.


> Calcular média, mediana e moda.
> Diferenciar média, mediana e moda.

Introdução
As medidas de tendência central auxiliam na representação dos dados de
forma mais sucinta quando comparada à apresentação em dados brutos ou em
tabela, por exemplo. Além disso, nos dão subsídios para a tomada de decisão
uma vez que nos fornecem informações importantes sobre a amostra ou a
população em estudo.
É possível analisar o comportamento de um conjunto de dados por meio de
inspeção visual usando gráficos, bem como por meio de medidas estatísticas
numéricas que são mais precisas do que a primeira opção. É importante dizer
que uma análise estatística não se esgota nessas medidas, mas elas contribuem
significativamente para o entendimento do que será o objeto de estudo em
determinada situação aplicada.
Neste capítulo, você vai conhecer as principais medidas de tendência central,
que são aquelas que identificam os diferentes pontos centrais de determinado
conjunto de dados.
2 Medidas de tendência central

Conhecendo um conjunto de dados


Dentre as medidas estatísticas que nos permitem conhecer o comportamento
de um conjunto de dados, estão as medidas de tendência central. As três
principais medidas são a média, a mediana e a moda. Enquanto as duas pri-
meiras reportam uma informação posicional dos dados, a terceira evidencia
qual dado repete-se com maior frequência. Nesta seção, vamos conhecer
cada uma delas em detalhes, bem como a sua relevância.

Média aritmética
É uma medida amplamente utilizada, simples de calcular, com uma interpre-
tação de fácil compreensão, além de possuir propriedades estatísticas que
a tornam útil em diversos estudos. Por representar o valor “provável” de
uma variável, costuma ser denominada valor esperado, ou, ainda, esperança
matemática, quando calculada para a população (CALLEGARI-JACQUES, 2007).
Utiliza-se duas notações para indicar a média. Sabemos qual é a nota-
ção adequada por meio da definição dos dados do estudo, ou seja, se eles
se referem a uma amostra ou a uma população. Em se tratando de dados
amostrais, utiliza-se um x com uma barra em cima, x̅ (lê-se: x barra), e, para
dados populacionais, utiliza-se a letra grega, μ (lê-se: “mi”, pois vem da letra
m do alfabeto grego).
Ela fornece um valor tal que, se a soma dos valores de cada elemento
fosse distribuída igualmente entre eles, cada elemento receberia o valor da
média (KUYVEN, 2010). Uma das suas características e também desvantagem
é que o seu resultado é afetado por valores atípicos (extremos) do conjunto
de dados. A Figura 1 traz a ilustração da média.
Valores

Média
Observações

Figura 1. Representação da média.


Fonte: Adaptada de Instituto Brasileiro de Geografia e Estatística (2022).
Medidas de tendência central 3

A média pode ser utilizada em situações aplicadas às mais diversas áreas


da ciência. Na área da saúde, a média é essencial para compreender, por
exemplo, o período de incubação de uma doença em determinada amostra da
população. Ou, ainda, para comparar grupos de valores (idades, por exemplo),
como de pessoas que ingeriram determinado alimento e que após um período
de tempo não apresentaram nenhum sintoma e aquelas que apresentaram
algum sintoma que pudesse ser associado ao alimento. Pode haver interesse
em calcular a média de casos de suicídio relacionado a determinada condição
clínica, uma doença degenerativa, por exemplo, entre tantas outras situações
práticas para as quais a média ajuda a compreender o comportamento dos
dados.

Mediana
É uma medida que divide uma série ordenada de dados em dois subgrupos de
igual tamanho. Em outras palavras, é um valor tal que tenha igual quantidade
de valores menores e maiores do que ele (CALLEGARI-JACQUES, 2007; DOANE;
SEWARD, 2014).
O primeiro ponto importante antes de iniciarmos o cálculo da mediana é
saber que precisamos ter os dados ordenados, pois sem isso não consegui-
remos identificar em que posição ela se localiza. Para essa medida, temos
mais de uma forma de resolver. Quando o banco de dados é pequeno (há
poucas informações a serem analisadas), conseguimos rapidamente encontrar
o resultado da mediana, ao ordenar os dados e verificar o valor que fica no
centro da distribuição (quando a amostra for ímpar) ou a média dos valores
centrais (quando a amostra for par). No entanto, também existem duas fór-
mulas matemáticas para o seu cálculo para os casos em que o conjunto de
dados é extenso ou está organizado em tabela de distribuição de frequência
e uma fórmula para uso em caso de dados organizados em intervalos de
classe, conforme veremos na seção seguinte.
A mediana depende da posição e não dos valores dos elementos na série
ordenada. Essa é uma das diferenças marcantes entre mediana e média.
A média é influenciada por valores extremos, ao passo que a mediana não
(BECKER, 2015; KUYVEN, 2010). A Figura 2 traz a ilustração da mediana.
4 Medidas de tendência central

Mediana

50% inferiores 50% superiores

Mediana

n par

Mediana

n ímpar

= Observações menores que a mediana = Observações maiores que a mediana

Figura 2. Representação da mediana.


Fonte: Adaptada de Doane e Seward (2014).

A mediana também se aplica aos exemplos discutidos para a média.


No caso do período de incubação de uma doença em determinada amostra
da população, é possível verificar qual é o período de incubação (em dias)
que divide a série de dados ao meio, deixando 50% das observações acima
e 50% abaixo dela. Pode haver interesse em calcular a mediana de casos de
suicídio relacionado a determinada condição clínica, entre outras diversas
possibilidades.

Moda
É uma medida que informa qual é o valor mais frequente de uma série de
valores, ou seja, é o valor mais comum, sendo simbolizada por Mo. Quando os
dados estiverem apresentados em intervalos de classe, indica-se o intervalo
modal. Nos casos em que há interesse em estimar um valor único para a
moda, pode-se usar o ponto médio do intervalo modal (CALLEGARI-JACQUES,
2007; KUYVEN, 2010).
Cabe ressaltar que a moda é aplicável a qualquer tipo de variável, qua-
litativa e quantitativa. Ela não exige cálculo, apenas a contagem do número
de ocorrências para cada valor da variável de interesse.
Medidas de tendência central 5

Além de não ser utilizada em inferências estatísticas, a moda nem sempre


existe. Se nenhum valor da amostra ocorrer mais de uma vez, a distribuição
não tem moda e é dita amodal. Por outro lado, se ocorrer empate entre dois
valores da variável, por serem os mais frequentes com o mesmo número de
ocorrências, dizemos que a distribuição é bimodal e, assim, tem duas modas
(BECKER, 2015; KUYVEN, 2010).
A moda pode ser similar à média e à mediana, se os valores perto do
centro da sequência ordenada tendem a ocorrer várias vezes. Mas também
pode ser bem diferente da média e da mediana (DOANE; SEWARD, 2014).
A Figura 3 traz a ilustração da moda.
a
od
M

Figura 3. Representação da moda.


Fonte: Adaptada de Doane e Seward (2014).

A moda para o exemplo do período de incubação de uma doença em


determinada amostra da população será aquele(s) período(s) de incubação
que aparece(m) com maior frequência, que mais se repete(m). No caso das
idades das pessoas que ingeriram determinado alimento e que após um
período de tempo não apresentaram nenhum sintoma ou que apresentaram
algum sintoma que pudesse ser associado ao alimento, pode-se conferir
qual é a idade em que isso ocorre de forma mais frequente. A moda ajuda a
compreender em qual faixa de idade há mais casos de suicídio, o que pode ser
fundamental para planejar políticas públicas em saúde para uma população
bem específica e assim obter resultados mais assertivos.
6 Medidas de tendência central

Nem todas as medidas descritivas são aplicáveis a todos os tipos


de variáveis. Por exemplo, a média é usada exclusivamente para
variáveis quantitativas. Já a mediana pode ser obtida para variáveis quantitativas
e qualitativas ordinais. A moda é válida para qualquer tipo de variável.
Cada uma dessas medidas apresenta vantagens e desvantagens, e a escolha
depende dos objetivos desejados.

Nesta seção, você conheceu a definição das medidas de tendência central:


média, mediana e moda, bem como o seu significado em situações aplicadas.
As ilustrações tiveram o intuito de evidenciar a particularidade de cada uma
das medidas, e pontos de atenção também foram destacados para que você
possa analisar com cautela dados de estudos futuros.

Calculando as medidas de tendência central


O cálculo das medidas de tendência central pode ser realizado por meio de
fórmulas, e no caso da moda, por meio de observação e contagem. As fórmulas
possuem particularidades em sua notação matemática quando tratamos de
dados populacionais ou amostrais. Sendo assim, para um rigor matemático,
sugere-se atentar para os dados em estudo e usar a notação apropriada.

O cálculo da média conforme a apresentação dos


dados
É importante ter claro que o cálculo da média sofre alguns ajustes conforme
a forma de apresentação dos dados, ou seja, se estão em rol, agrupados em
tabelas de distribuição de frequência ou por intervalo de classe.
O cálculo da média para dados simples (não agrupados), em se tratando
de dados populacionais, é dado por:


=

onde ∑xi é a soma de todos os valores de xi e N é o tamanho da população.


Medidas de tendência central 7

No caso em que os dados forem amostrais, é dado por:


=

onde ∑xi é a soma de todos os valores de xi e n é o tamanho da amostra.


O cálculo da média para dados agrupados (como em tabelas de distribuição
de frequência) é dado por:


=

Observe que, no cálculo da média para dados agrupados, cada valor de xi


deve ser multiplicado pelo número de vezes em que ele ocorre f i, para depois
obter a soma.
Quando os dados estiverem agrupados em uma tabela por intervalos de
classe, devemos encontrar um valor que represente cada intervalo. Sendo
assim, utiliza-se o ponto médio do intervalo de classe, M, (BECKER, 2015;
CALLEGARI-JACQUES, 2007), calculado da seguinte forma:

limite inferior do intervalo de classe + limite superior do intervalo de classe


=
2

Com isso, a média segue calculada da mesma forma que foi feita no caso
dos dados agrupados, apenas substituindo xi pelo valor de M em cada inter-
valo de classe:

∑ ∑
= =
∑ ∑

O cálculo da mediana conforme a apresentação dos


dados
O cálculo da mediana também sofre alguns ajustes conforme a forma de
apresentação dos dados, ou seja, se estão em rol, agrupados em tabelas de
distribuição de frequência ou por intervalo de classe.
8 Medidas de tendência central

O cálculo da média para dados simples (não agrupados) — e quando se


trata de um conjunto de dados com poucas observações — é bastante simples,
basta seguir os seguintes passos:

„ ordenar os dados;
„ verificar se o tamanho da amostra/população é par ou ímpar;
„ se ímpar, verificar qual é o valor que divide a distribuição exatamente
ao meio, deixando 50% dos dados à sua esquerda e 50% à sua direita;
„ se par, verificar os dois valores centrais, que dividem a distribuição
exatamente ao meio, deixando 50% dos dados à sua esquerda e 50%
à sua direita, e calcular a média aritmética desses dois valores.

O cálculo da mediana para dados agrupados (como em tabelas de dis-


tribuição de frequência) ou quando o tamanho da amostra/população for
maior é dado por:
Se n for ímpar:

=
( 2 )
Se n for par:

=
( 2 ) + ( 2 +1)
2

Em que Me denota mediana.


Cabe destacar que ela é uma medida que pode ser obtida para variáveis
quantitativas e qualitativas ordinais. É obtida a partir da ordenação de todos
os n valores observados na amostra (ou população, quando for o caso) e, em
seguida, localizando o valor central desses dados (KUYVEN, 2010).
Quando os dados estiverem agrupados em uma tabela por intervalos de
classe (DOANE; SEWARD, 2014; SPIEGEL; STEPHENS, 2009), devemos estimar a
mediana usando:

= +ℎ 2

( )
Medidas de tendência central 9

onde:

„ LIRMe é o limite inferior real do intervalo que contém a mediana;


„ h é a amplitude do intervalo;
„ n é o tamanho da amostra;
„ Fiant é a frequência absoluta acumulada no intervalo anterior ao que
contém a mediana;
„ fiMe é a frequência absoluta simples no intervalo que contém a mediana.

Em uma variável, a média, a mediana e a moda não têm, necessaria-


mente, o mesmo valor.

Você pode saber mais sobre as medidas de tendência central con-


sultando o Capítulo 2 da obra Bioestatística, de Castanheira (2020).

Contudo, vimos que as fórmulas para o cálculo das medidas descritivas


de tendência central têm suas particularidades e diferenças. As notações
apropriadas para dados amostrais e populacionais foram destacadas, assim
como discutiu-se as formas de resolução quando os dados estão em rol,
agrupados ou em intervalos de classe.

Aplicações das medidas de tendência


central
Acompanharemos problemas aplicados em que se calculam as três medidas
de tendência central, diferenciando-as e ressaltando o significado de cada
uma delas no contexto dos problemas. Cabe destacar que podemos realizar o
cálculo dessas medidas com o uso de softwares; aqui, faremos uso do Excel.
10 Medidas de tendência central

Problema 1: Período de incubação da rubéola em


crianças
Considere um estudo que observou uma amostra de crianças com casos de
rubéola, em que foi necessário observar uma grande quantidade de casos
— desde o primeiro contato de uma pessoa sadia com um doente até o surgi-
mento dos sinais e sintomas — e medir esse período em dias. Acompanhe nos
dados a seguir, organizados em rol, o período de incubação da rubéola, em
dias, observado em 11 crianças (primeira linha a identificação do x, ou seja,
da criança e, na segunda linha, o período de incubação em dias).

(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11)
15 15 15 16 16 16 16 19 20 32 37

A mediana é calculada por meio da seguinte fórmula:

=
( 2 ) = ( 11+1
2 )
= (6) = 16 dias

A mediana nos dá a tendência central do conjunto de dados, principal-


mente quando não é conveniente usar a média devido à presença de valores
extremos ou quando a distribuição é assimétrica, como na curva epidêmica.
A moda é o que mais se repete. Neste problema, observamos que os mais
frequentes foram os períodos de incubação de 16 dias (repetiu-se 4 vezes). Esse
valor pode ser utilizado para representar o período de incubação nesse grupo,
por exemplo, o período de incubação de rubéola mais frequente é de 16 dias.
A média desse conjunto de dados pode ser calculada da seguinte forma:

∑ 15 + 15 + 15 + 16 + 16 + 16 + 16 + 19 + 20 + 32 + 37 217
= = = = 19,7 dias
11 11

A média é maior do que os valores da mediana e da moda, pois como


considera os valores de todos os casos, se vê afetada pela influência dos
casos com 32 e 37 dias de incubação, que são valores extremos.
Esse problema pode ser resolvido rapidamente por meio do Excel. Para
isso, é necessário organizar os dados em uma planilha, como mostra a Figura 4.
Medidas de tendência central 11

Figura 4. Organizando os dados no Excel.

Com isso, clicamos em “Dados” e em seguida em “Análise de Dados”, como


destacado na Figura 4. Com isso, a seguinte tela abrirá como na Figura 5.

Figura 5. Tela do Excel para cálculo das medidas de tendência central.

Como mostra a Figura 5, devemos clicar em “Estatística descritiva” e depois


em “OK”. Com isso, a tela da Figura 6 se abrirá.

Figura 6. Selecionando os dados para gerar o resultado.


12 Medidas de tendência central

Como mostra a Figura 6, devemos clicar na seta para selecionar as células


da linha do Excel em que estão contidos os dados, depois informamos que
os dados estão agrupados por linhas, que desejamos os resultados em uma
nova planilha (também é possível pedir que os resultados sejam mostrados
em um intervalo de saída ou em uma nova pasta de trabalho), e pedimos
resumo estatístico. Assim, o resultado será apresentado conforme a Figura 7.

Figura 7. Tela de resultados.

Perceba que surgiram diversas outras medidas descritivas para além das
que desejávamos. Isso não é um problema; na verdade, é muito bom, pois com
o aprofundamento dos estudos você perceberá a relevância dessas outras
medidas. No entanto, neste momento, vamos dar atenção à média, à mediana
e à moda. Perceba que os resultados dessas medidas são idênticos aos que
encontramos por meio das fórmulas matemáticas anteriormente aplicadas.
Esta é apenas uma das formas de calcular as medidas de tendência central;
você pode utilizar outros comandos no próprio Excel, ou fazer uso de softwares
estatísticos como o R, o Stata, o SPSS, entre outros.
Medidas de tendência central 13

Problema 2: Casos de suicídio por idade


Considere um estudo que tem interesse em analisar os casos de suicídio
por idade. Para tanto, observou uma amostra de indivíduos que cometeram
suicídio, por idade. Acompanhe nos dados abaixo, no Quadro 1, que estão
agrupados, e veja como devemos tratá-los para calcular as medidas desejadas.

Quadro 1. Casos de suicídio por idade. Lugar X, 1995–2000

Faixa etária (em anos) Número de Casos (f i)

10 a 14 37

15 a 19 176

20 a 29 693

30 a 39 659

40 a 49 784

50 a 59 1.103

60 a 69 1.005

Total 4.457

Fonte: Adaptado de Organização Pan-Americana de Saúde (2010).

Quando os dados sobre uma variável contínua estão agrupados (catego-


rizados), podemos calcular uma média e mediana aproximadas. Para estimar
a média, deve-se construir uma coluna com os pontos médios (xi) de cada
intervalo de classe da variável e outra (f i ∙ xi), resultado da multiplicação
entre o valor de cada ponto médio (xi) e o número de casos (f i) do intervalo
correspondente. A soma desses produtos (∑f i ∙ xi) dividida entre a soma de
casos (∑f i) nos dá uma aceitável aproximação da média.
Para calcular o ponto médio de cada intervalo de classe da variável, deve-se
obter a média do intervalo, isso é, soma-se os limites inferior e superior do
intervalo e se divide por dois; por exemplo, no Quadro 2, o primeiro intervalo
é de 10 a 14 anos:

10 + 14,9
= 12,5
2
14 Medidas de tendência central

Note que utilizamos 14,9 por ser o limite superior real do intervalo.
Os pontos médios dos seguintes intervalos de classe são calculados de modo
similar.

Quadro 2. Casos de suicídio por idade. Lugar X, 1995-2000

Faixa etária Número de Ponto Casos


f i · xi
(em anos) Casos (f i) médio (xi) acumulados Fi

10 a 14 37 12,5 462,5 37

15 a 19 176 17,5 3.080,0 213

20 a 29 693 25,0 17.325,0 906

30 a 39 659 35,0 23.065,0 1.565

40 a 49 784 45,0 35.280,0 2.349

50 a 59 1.103 55,0 60.665,0 3.452

60 a 69 1.005 65,0 65.325,0 4.457

Total 4.457 205.325,0

Fonte: Adaptado de Organização Pan-Americana de Saúde (2010).

Utilizando o Excel, encontramos o cálculo da média como mostra a Figura 8.

Figura 8. Cálculo da média para o Problema 2.


Medidas de tendência central 15

Ou seja, a média é dada pelo somatório das frequências (número de casos)


multiplicadas pelo ponto médio, e, depois, o resultado é dividido por n, que é
o somatório das frequências. Neste problema, a média de idade das pessoas
que cometeram suicídio foi de 46 anos aproximadamente.
Também podemos estimar a mediana a partir de dados agrupados em
uma tabela de frequências. Para isso, construímos uma coluna de “casos
acumulados” como a que foi apresentada no Quadro 2, que se obtém a par-
tir da coluna de “casos”. A primeira célula corresponde aos casos de 10 a
14 anos (37), a segunda se obtém somando a esses 37 os casos de 14 a
19 anos (176) e assim sucessivamente, até completar a última célula, cujo valor
tem de coincidir com o total de casos (4.457). Uma vez construída a coluna de
frequências acumuladas, podemos aproximar a mediana da idade conforme
o seguinte processo de cálculo:

( )
1
2 −
= +ℎ

onde:

„ LIRMe é o limite inferior do intervalo que contém a mediana;


„ h é a amplitude do intervalo da posição da mediana;
„ n é o tamanho da amostra;
„ Fiant é a frequência absoluta acumulada no intervalo anterior ao que
contém a mediana;
„ fiMe é a frequência absoluta simples no intervalo que contém a mediana.

Primeiro, localizar o intervalo de classe que contém a posição da mediana,


isso é:

( n −2 1 ) = ( 44572 − 1 ) = 2.228
16 Medidas de tendência central

Na coluna de casos acumulados, o caso nº 2.228, está situado no intervalo


de idade de 40 a 49 anos. Depois de obter a posição da mediana, estima-se
a mediana por interpolação, isso é:

( )
1
2 −
= +ℎ

( ) ( )
1 4457 − 1
2 − 2 − 1565
= 40 + 10 ∙ = 40 + 10 ∙
784

= 40 + 10 ∙ (0,84566326)

≈ 48,45 anos

A moda do número de casos de suicídio por idade foi observada na faixa


de 50 a 59 anos, pois é a que possui a maior frequência observada.
Nesta seção, você acompanhou a aplicabilidade das três medidas de
tendência central e o uso do Excel para a sua resolução. O capítulo trouxe
informações relevantes sobre cada uma das principais medidas estatísticas
discutidas, detalhes que precisamos observar em estudos que desenvolver-
mos ao fazer uso dessas métricas, bem como situações-problema que nos
permitam visualizar as aplicações na área da saúde.

Referências
BECKER, J. L. Estatística básica: transformando dados em informação. Porto Alegre:
Bookman, 2015. (Métodos de Pesquisa).
CALLEGARI-JACQUES, S. M. Bioestatística: princípios e aplicações. Porto Alegre: Artmed,
2007. E-book.
DOANE, D. P.; SEWARD, L. E. Estatística aplicada à administração e economia. 4. ed.
Porto Alegre: AMGH, 2014.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. A média aritmética: o que é? Rio
de Janeiro: IBGE, 2022. Disponível em: https://educa.ibge.gov.br/professores/educa-
-recursos/17862-media-pagina-inicial.html. Acesso em: 15 out. 2022.
KUYVEN, P. S. Raciocínio lógico e métodos quantitativos. São Leopoldo: Unisinos, 2010.
Medidas de tendência central 17

ORGANIZAÇÃO PAN-AMERICANA DE SAÚDE. Módulos de princípios de epidemiologia


para o controle de enfermidades (MOPECE): medida das condições de saúde e doença
na população. Brasília: OPAS, 2010. v. 3.
SPIEGEL, M. R.; STEPHENS, L. J. Estatística. 4. ed. Porto Alegre: Bookman, 2009. (Coleção
Schaum).

Leitura recomendada
CASTANHEIRA, N. P. Bioestatística. Curitiba: Contentus, 2020. E-book.

Os links para sites da web fornecidos neste capítulo foram todos


testados, e seu funcionamento foi comprovado no momento da
publicação do material. No entanto, a rede é extremamente dinâmica; suas
páginas estão constantemente mudando de local e conteúdo. Assim, os edito-
res declaram não ter qualquer responsabilidade sobre qualidade, precisão ou
integralidade das informações referidas em tais links.

Você também pode gostar