Você está na página 1de 27

ANÁLISE ESTATÍSTICA

MEDIDAS DE TENDÊNCIA
CENTRAL
A u t o r ( a ) : D r. G u i l h e r m e A u g u s t o P i a n e z z e r

Revisor: Me. Eder Cassettari

Tempo de leitura do conteúdo estimado em 1 hora e 10 minutos.

Introdução
Caro(a) estudante, seja muito bem-vindo(a) ao estudo de “Análise estatística”. Nele, aprenderemos
sobre as principais medidas de tendência central, que nos permitem descrever a distribuição de
certo conjunto de dados. Como sabemos, a extração da amostra a partir da população segue
certas regras que precisam ser respeitadas para que a amostra selecionada, realmente, represente
a população escolhida. Aqui, a diferença aparece quando tratamos as diversas medidas de
tendência central, seja para a amostra, seja para a população. Ao compreender esses diversos
tipos de cálculos e expressões, conseguimos formalizar o que faz a estatística.

Medidas de Tendência
Central – Médias

Para compreendermos os conceitos de medidas de tendência central, iniciando pela média,


diversas vezes, somos convidados a trabalhar com o somatório dos dados. Então, é essencial
saber tratar de propriedades essenciais para simplificar os resultados obtidos em cada somatório.
Triola (2013, p. 70) indica que “uma medida de centro é um valor no centro, ou meio, do conjunto de
dados”.

Somatório
A representação de uma variável de interesse pode ser utilizada usando um símbolo, digamos, x.
Então, essa variável poderá representar cada um dos valores que a variável de interesse pode
admitir. Vamos imaginar uma sequência, por exemplo:

9, 14, 6, 28, 11.

Nesse caso, podemos utilizar um índice para indicar o ordenamento dos dados. Dessa forma,
teríamos:

x1 = 9, x2 = 14, x3 = 6, x4 = 28, x5 = 11.

Note a situação da sequência a seguir.

4,  3,  5,  4,  3,  2,  2,  3,  2,  3,  3,  4,  3,  5,  4,  3
Nela, temos a ocorrência de 4 dados. Aqui, devemos tomar cuidado ao observar que as ocorrências
possíveis são denotadas por:

x1 = 2, x2 = 3, x3 = 4, x4 = 5

Assim, a quantidade de vezes em que o dado aparece poderá ser resumida ao se usar a função
frequência. Nesse caso, realizando o processo de contagem, verificamos que:

f (x1 ) = 3, f (x2 ) = 7, f (x3 ) = 4, f (x4 ) = 2

Perceba, neste exemplo, que todos os dados podem ser apresentados a partir da tabela de
frequência, conforme disposto na Tabela 2.1.

k xk f (xk )

1 2 3

2 3 7

3 4 4

4 5 2

Tabela 2.1 - Tabela de frequência para os dados exemplificados a partir da notação indicial
Fonte: Elaborada pelo autor.

#PraCegoVer: a tabela, composta de 5 linhas e 3 colunas, apresenta a numeração do evento, o


resultado e a frequência de ocorrência desse resultado. O primeiro evento, de resultado 2,
acontece 3 vezes. O segundo evento, de resultado 3, acontece 7 vezes. O terceiro evento, de
resultado 4, acontece 4 vezes. O quarto evento, de resultado 5, acontece 2 vezes.

Uma das etapas essenciais para o tratamento de dados estatísticos é a ordenação ou organização
dos dados. Com isso, vejamos como fazer essa disposição de forma interativa.

1. Dados crescentes: ocorre quando os dados estão ordenados em ordem alfabética ou em


valores numéricos crescentes.
2. Dados decrescentes: ocorre quando a classificação é de Z a A, por valores numéricos
decrescentes ou do mais novo ao mais antigo.

Considere os dados da série dada por:

9, 14, 6, 28, 11.


Tendo em vista a sequência apresentada, alguém poderia estar interessado em encontrar o
somatório. Nesse caso, podemos representá-lo pela letra S, e ele será dado por:

S = x1 + x2 + x3 + x4 + x5 .

Embora essa operação tenha sido apresentada de forma adequada para esse conjunto, quando
tratamos de uma quantidade maior de dados, é necessário utilizar a simplificação simbólica. Nesse
caso, usamos o símbolo de somatório, denotado por:

∑ xi

i=1

Nesse cenário, i é conhecida como a variável de controle, em que i=1 é o primeiro termo a ser
somado e i=n o último. Note que a expressão dada anteriormente pode ser simplificada e
representada por:

∑ xi = 68

i=1

Dentre as propriedades relevantes do somatório, devemos imaginar a possibilidade de multiplicar


todos os dados por uma constante. Em termos simbólicos, podemos observar que:

n n

∑ c. xi = c. ∑ xi , c ∈ R

i=1 i=1

Em outras expressões, seremos convidados a somar uma sequência de termos constantes, i.e., de
termos iguais. Nesse caso, teremos que:

n n

∑ xi = ∑ c = n. c, c ∈ R

i=1 i=1

Também deverá ser simplificada a soma ou a diferença entre duas variáveis. Assim, é válido que:

n n n

∑ (xi + yi ) = ∑ xi + ∑ yi

i=1 i=1 i=1

Média Aritmética
Definimos a média aritmética como a soma de todos os dados dividida pelo número de dados. Isso
pode ser simplificado pela notação de somatório, de forma que:

n
∑ xi
i=1


 dia =
n

Aqui, você deve tomar cuidado em relação ao tipo de dado com que está lidando. Isso porque
existem, pelo menos, duas médias: uma referente à média populacional e outra, à média amostral.
Assim, considerando n como o tamanho da amostra e N como o tamanho da população, podemos
estabelecer duas médias distintas:
n
∑ xi
i=1
x̄ =
n

N
∑ xi
i=1
μ =
N

Agora que você foi capaz de determinar a média populacional e a média amostral, e diferenciá-las,
vejamos, a partir da próxima atividade, como organizar dados para extrair tais informações.

Conhecimento
Teste seus Conhecimentos
(Atividade não pontuada)

Um determinado experimento foi conduzido em uma empresa com a finalidade de levantar


dados sobre a quantidade de faltas de um grupo de funcionários. Após a coleta, observaram-se
os seguintes dados:

0 5 6 0 2 0 8 0 15 0 0 0 0 8 0 0 6 0 5 5 4 0 0 5 0 0 6

Tais dados indicavam a quantidade diária de faltas para os 27 dias do mês analisado.

Considerando os pressupostos discutidos no início da atividade, marque a alternativa que


encontra a média quando selecionamos apenas os dias em que os funcionários faltaram.

a) 5,25.
b) 2,77.
c) 5,5.
d) 6,25.
e) 75.
Moda e Mediana

Além da média, podemos levantar outras medidas de tendência central, como é o caso da moda e
da mediana.

Mediana
Definimos a mediana como um valor que divide o conjunto de dados, quando ordenados, ao meio.
Triola (2013, p. 72) define “mediana de um conjunto de dados como a medida de centro que é o
valor do meio quando os dados originais estão arranjados em ordem crescente (ou decrescente) de
magnitude”, enquanto isso, Morettin (2010, p. 35) define “mediana como a realização que ocupa a
posição central da série de observações, quando estão ordenadas em ordem crescente”. Então,
considere os dados referentes à quantidade de ganhadores da Mega-Sena nos últimos 13 sorteios
realizados:

3 1 3 2 0 2 5 0 1 2 3 4 3 1

Então, como comentado inicialmente, devemos ordenar os dados:

0,  0,  1,  1,  1,  2,  2,  3,  3,  3,  3,  4,  5

Perceba que, por se tratar de 13 dados, a mediana será o valor que está na posição central, ou seja,
na sétima posição. Até aqui, acredito que não há nenhum grande problema. Entretanto, quando a
quantidade de dados é par, devemos notar que a mediana será definida como a média entre os dois
valores centrais. Para verificar como se calcula a mediana nesse caso, observe o exemplo:

0,  0,  1,  1,  1,  2,  2,  3,  3,  3,  3,  4

Nele, a mediana será dada pela média entre os dois valores centrais. Assim, será calculada como:

2 + 3
= 2, 5
2

Moda
Definimos a moda, em estatística, como o valor que mais aparece em um conjunto de dados. Triola
(2013, p. 72) define “moda de um conjunto de dados como o valor que ocorre com maior
frequência”. Então, pode ser entendida como o valor que apresenta a maior frequência.

Perceba que essa definição pode levar-


nos a entender que é possível haver
mais de uma moda: são considerados
os dados bimodais; ou não existir moda
nenhuma, no caso em que os dados não
se repetem.

Para exemplificar, vamos considerar uma pesquisa de satisfação sobre o serviço oferecido pela
internet de seu bairro por diversas operadoras. Nesse caso, os entrevistados foram solicitados a
responder entre E – Excelente, O – Ótimo, B – Bom, R – Regular e P – Péssimo. Assim, a operadora
A teve as seguintes respostas:

P ,  R,  B,  B,  O,  O,  O,  O,  E,  E

A operadora B:

R,  B,  B,  B,  B,  O,  O,  O,  O,  E

E a operadora C:

P ,  P ,  R,  R,  B,  B,  O,  O,  E,  E

Perceba que a moda para a operadora A é O; para a operadora B, a moda é B e O (ou seja, é
bimodal); enquanto a operadora C não tem moda, uma vez que todos os dados aparecem na
mesma frequência.

SAIBA MAIS
Os dados, quando lidos de forma bruta, não são capazes de nos fornecer interpretações adequadas sobre
os fenômenos que estão ocorrendo. Dessa forma, o simples ato de organizar os dados já é essencial para
extrair significado daquilo que estamos lendo. Perceba que a organização e a leitura correta deles
permitem tomar decisões de forma razoável, calcular riscos e otimizar processos.

Para saber mais sobre a importância de acessar dados, confira o link a seguir:
http://blog.coletum.com/organizar-dados-de-forma-estrategica/.

Aqui, é interessante perceber que alguns dados estarão distribuídos em tabela de frequência, e,
devido a isso, haverá procedimentos específicos para o cálculo de média, moda e mediana.
Vejamos, em detalhes, esse quesito.

Medidas de Tendência Central com Tabela de


Frequência
Vamos considerar os dados apresentados na forma da tabela de frequência a seguir.
k xk f (xk ) F (xk )

1 11 2 2

2 12 5 7

3 13 8 15

4 14 6 21

5 15 5 26

6 16 4 30

Σ   30  

Tabela 2.2 - Tabela de frequência e frequência acumulada para os dados do exemplo


Fonte: Elaborada pelo autor.

#PraCegoVer: a tabela, composta de 8 linhas e 4 colunas, apresenta dados de número do


evento, valor observável, frequência da observação e frequência acumulada. O primeiro evento,
de resultado 11, teve frequência 2 e frequência acumulada de 2. O segundo evento, de
resultado 12, teve frequência 5 e frequência acumulada 7. O terceiro evento, de resultado 13,
teve frequência 8 e frequência acumulada 15. O quarto evento, de resultado 14, teve frequência
6 e frequência acumulada 21. O quinto evento, de resultado 15, teve frequência 5 e frequência
acumulada 26. O sexto e último evento, de resultado 16, teve frequência 4, com frequência
acumulada 30. Na última linha, aparece a soma das frequências, cujo resultado é 30.

Para iniciarmos com o cálculo da mediana, perceba que ela tem a função de separar os dados em
dois grupos de mesmo tamanho, de forma que a posição dela será dada por:

1 + 30
i = = 15, 5
2

Assim, a tabela de frequência acumulada nos permite extrair, rapidamente, que a 15ª observação é
de 13, enquanto a 16ª é 14. Desse modo, a mediana é dada por 13,5, isso porque:

13 + 14
= 13, 5
2

Em relação à moda, como se refere ao dado que mais aparece, será, então, o de maior frequência.
Assim, a moda é 13. Em relação à média, quando temos um conjunto de dados distribuídos em
uma tabela de frequência, realizamos o cálculo de forma equivalente, mas com uma pequena
alteração. Nesse caso,
m
∑ xk . f (xk )
k=1
x̄ =
n

Veja que m representa a quantidade de observações semelhantes, a qual, nesse exemplo, é 6. Nos
dados da Tabela 2.2, concluímos que:
m
∑ xk . f (xk ) 409
k=1
x̄ = = = 13, 6
n 30

Perceba que, mesmo com dados distribuídos de acordo com a frequência, ainda podemos extrair
medidas de tendência central significativas que indicam a forma e as características da
distribuição. Agora, vejamos, em uma atividade, como fazer os cálculos aprendidos nesta seção.

Conhecimento
Teste seus Conhecimentos
(Atividade não pontuada)

Considere os dados a seguir, eles apresentam a quantidade de moradores de certas casas de um


condomínio residencial. Tal coleta foi sistematizada na tabela seguinte:
Moradores Frequência

1 10

2 19

3 5

4 2

Tabela - Frequência da quantidade de moradores em casas de um determinado condomínio


residencial
Fonte: Elaborada pelo autor.

#PraCegoVer: na tabela, composta de 5 linhas e 2 colunas, aparece a frequência de


ocorrência de casas com determinado número de moradores. São 10 casas com 1
morador, 19 casas com 2 moradores, 5 casas com 3 moradores e 2 casas com 4
moradores.

Para calcular a média do conjunto de dados fornecidos, com base nos conceitos de média com o
uso da tabela de frequência, utilize a expressão dada por:
m
∑ x k . f (x k )
k=1
x̄ =
n

a) 1,94.
b) 1,95.
c) 1,96.
d) 1,97.
e) 1,98.
Medidas de Dispersão –
Variância e Desvio
Padrão

Entendemos o desvio, em estatística, como a diferença entre um determinado valor da média.


Triola (2013, p. 83) define “desvio padrão de um conjunto de valores amostrais como uma medida
de variação dos valores em relação à média”. Então, denotamos o desvio padrão como:

desvio = xi − x̄

REFLITA

Em vários métodos de análise, como a análise de variância ou os


métodos de regressão linear, estamos interessados em
determinar a soma de todos os desvios. Mas note que:
n n n
∑ (xi − x̄) = ∑ xi − ∑ x̄ = nx̄ − nx̄ = 0
i=1 i=1 i=1

Então, concluímos que a soma dos desvios da forma apresentada


não é interessante. Isso acontece, porque os termos negativos do
desvio se anulam com os termos positivos do somatório. Além
dessa estratégia, outras podem ser pensadas a fim de medir o
desvio dos dados. Quais outras você conseguiria elaborar?

Uma estratégia é calcular o módulo de cada um dos desvios antes do somatório para definirmos o
desvio médio absoluto:

n
∑ |xi − x̄|
i=1
DM =
n
Todavia, na dificuldade em usar um termo com módulo no cálculo de desvio, costumamos usar o
desvio padrão e a variância para, de forma mais adequada, descrever essa dispersão. Entretanto
esse indicativo é considerado forte para indicar a dispersão de um conjunto de dados.

Fonte: VG Educacional

A estratégia mais comum para contornar o fato de que a soma dos desvios é igual a zero é, em vez de utilizar o módulo,
elevar cada um dos desvios ao quadrado.

Quando fazemos isso, encontramos a variância dos dados.

Para o cálculo da variância populacional ou para o cálculo da variância amostral, devemos somar
os quadrados de cada um dos desvios e dividir pelo tamanho da população, N, ou pelo tamanho da
amostra, n, respectivamente, isto é:

N 2
∑ (xi − μ)
2 i=1
σ =
N

n 2
∑ (xi − x̄)
2 i=1
s =
n − 1

Como exemplo, podemos ver o cálculo da variância amostral para a amostra dada por:

11 16 12 14 13.

Podemos calcular a média e a variância amostral dela, respectivamente:

11 + 16 + 12 + 14 + 13
x̄ = = 11, 2
5

2 2 2 2 2
(11 − 11, 2) + (16 − 11, 2) + (12 − 11, 2) + (14 − 11, 2) + (13 − 11, 2)
2
s =
5 − 1

2
s = 8, 7

Em estatística, a variância é considerada uma ótima medida de dispersão, mas, geralmente, não é
escolhida para descrever certas dispersões. Isso porque a maior parte dos dados costuma vir
acompanhada de uma unidade de medida (metro, quilograma, reais, alunos etc.). Quando
realizamos o cálculo da variância, elevamos os desvios ao quadrado, de forma que a unidade de
medida da variância carece da mesma interpretação dos dados originais (nesse caso, são dados
em metro ao quadrado, quilograma ao quadrado, reais ao quadrado e assim por diante).

Então, para contornar essa dificuldade de unidade de medida, calculamos a raiz quadrada da
variância, definida como o desvio padrão. Para isso, vamos pensar em um fabricante de bolos que
pesou 7 deles e obteve as seguintes medidas, todas em quilogramas:

1, 2 1, 3 1, 4 1, 2 1, 3 1, 5 1, 3

Aqui, podemos calcular a média amostral, obtendo:

1, 2 + 1, 3 + 1, 4 + 1, 2 + 1, 3 + 1, 5 + 1, 3
x̄ = = 1, 3 kg
7

Também podemos encontrar a variância amostral e o desvio padrão:

2 2 2
(1, 2 − 1, 3) + (1, 3 − 1, 3) + … + (1, 3 − 1, 3)
2 2
s = = 0, 01 kg
7 − 1

−− −−− −
2
s = √s = √0, 01 = 0, 1 kg

Note a unidade de medida de cada métrica.

praticar
Vamos Praticar
Considere três candidatos a uma vaga para executar determinado serviço. Para a escolha, o
critério é a rapidez do candidato. Para isso, extraíram-se amostras de 7 tempos, em minutos,
correspondendo ao que cada candidato levou para realizar certa atividade, conforme a tabela a
seguir.
Candidato Tempo (min)

A 12,5 13,6 12,8 13,5 12,8 12,9 13,0

B 15,5 18,2 15,6 14,5 16,5 18,2 14,5

C 12,8 10,5 15,2 16,5 9,9 12,5 13,0

Tabela - Tempo de execução de tarefa por 3 candidatos distintos


Fonte: Elaborada pelo autor.

#PraCegoVer: na tabela, composta de 4 linhas e 8 colunas, são apresentados dados


de tempo de execução de certa tarefa por 3 candidatos a uma determinada vaga. O
candidato A levou 12,5; 13,6; 12,8; 13,5; 12,8; 12,9 e 13,0 minutos. O candidato B
levou 15,5; 18,2; 15,6; 14,5; 16,5; 18,2 e 14,5 minutos. O candidato C levou 12,8; 10,5;
15,2; 16,5; 9,9; 12,5 e 13,0 minutos.

Com base nos conteúdos referentes à média, à variância e ao desvio padrão, calcule esses três
parâmetros para os candidatos dados e apresente qual deveria ser contratado.

Medidas de Assimetria e
Medidas de Curtose

Vejamos, nesta seção, como descrever os conceitos de assimetria e de curtose, necessários para,
de forma mais adequada, descrever cada distribuição de dados.
Assimetria
Consideramos a assimetria como um grau de desvio da simetria de uma certa distribuição. Triola
(2013, p. 77) indica que “uma distribuição de dados é assimétrica quando se estende mais para um
lado do que para o outro. Uma distribuição de dados é simétrica se a metade esquerda do
histograma for praticamente uma imagem espelhada da metade direita”. De forma geral, quando a
curva é simétrica, a média, a mediana e a moda coincidem num mesmo ponto! Nesse caso,
consideramos que existe um equilíbrio perfeito na distribuição: ela se aproxima do formato da
distribuição normal padrão. Vamos entender isso melhor analisando a figura a seguir?

Figura 2.1 - Distribuição simétrica em que a média, a mediana e a moda coincidem


Fonte: Triola (2013, p. 204).

#PraCegoVer: na figura, observamos uma distribuição simétrica na forma de sino, em que a média, a
mediana e a moda são iguais. No histograma, a metade esquerda e a metade direita são espelhadas.

Entretanto, nos casos em que a média, a mediana e a moda recaem em pontos diferentes da
distribuição, teremos uma distribuição assimétrica, podendo ser um dos dois casos: enviesada à
direita ou à esquerda.

No caso em que a distribuição é assimétrica negativa, ou seja, que é enviesada à esquerda,


percebemos que os valores se concentram na extremidade superior da escala, de forma que se
distribuem, gradativamente, em direção à extremidade inferior. Podemos observar esse conceito na
Figura 2.2:
Figura 2.2 - Assimetria negativa
Fonte: Morettin (2010, p. 51).

#PraCegoVer: na figura, observamos uma distribuição em que a média é menor que a mediana, que, por
sua vez, é menor que a moda. Observamos, dessa forma, uma distribuição assimétrica negativamente
com formato deformado de sino, com a cauda maior do lado esquerdo.

Quando a distribuição é assimétrica positivamente, ou considerada enviesada à direita, os valores


se concentram na extremidade inferior da escala e são distribuídos, gradativamente, em direção à
extremidade superior, como podemos observar na Figura 2.3, a seguir:

Figura 2.3 - Assimetria positiva


Fonte: Morettin (2010, p. 51).

#PraCegoVer: na figura, observamos uma distribuição em que a média é maior que a mediana, que, por
sua vez, é maior que a moda. Observamos, dessa forma, uma distribuição assimétrica positivamente com
formato deformado de sino, com a cauda maior do lado direito.
Apenas com conhecimento da média, da mediana e da moda, perceba que podemos ter uma boa
noção sobre a assimetria da curva e o formato de distribuição.

Fonte: Adaptado de orson / 123RF.

#PraCegoVer: na figura, temos um infográfico estático intitulado “Cálculo da Assimetria”. O título do


infográfico é apresentado alinhado ao centro na parte superior. Logo abaixo, temos três caixas de texto
coloridas, cada uma delas contendo um número em sua estrutura. Na primeira, com o número 1 e o fundo
em azul, temos o texto: “Critério de Bowley: a assimetria será considerada positiva à medida que o
terceiro quartil se afastar da mediana e enquanto o primeiro quartil se aproximar dela. Por outro lado, a
assimetria será considerada negativa quando o primeiro quartil se afastar da mediana e o terceiro quartil
se aproximar dela”. Em seguida, com o número 2 e o fundo em roxo, temos o texto: “Critério de Kelley:
aqui a assimetria é medida pelos centis. Ao invés de utilizar o terceiro e o primeiro quartil, como no
Critério de Bowley, os centis utilizados são o décimo e o nonagésimo”. Por fim, na terceira caixa, com o
número 3 e o fundo em verde, temos o texto: “Coeficiente de Assimetria de Pearson: analisa-se a forma
com que a média, a mediana e a moda vão se afastando, observando cada vez mais a diferença entre
elas”.

Assim como a assimetria indica o grau de desvio de uma distribuição, outra característica que
apresenta a forma da distribuição é a curtose, a qual será discutida na seção posterior.

Curtose
Definimos a curtose como o grau de achatamento de uma distribuição em relação à distribuição
normal. Note que a distribuição normal é o padrão de curtose, considerado, aqui, como a curtose
do tipo mesocúrtica. Nesse caso, podemos observar esse conceito sendo exemplificado na Figura
2.4, a seguir:
Figura 2.4 - Curva de distribuição mesocúrtica, apresentando uma distribuição normal devido ao
formato
Fonte: Triola (2013, p. 204).

#PraCegoVer: na figura, observamos uma distribuição em forma de sino, considerada mesocúrtica.


Assim, os dados são distribuídos com desvio padrão maior em relação à curva de referência, que é a
normal padrão.

Os outros casos de curtose são curvas mais pontiagudas em relação a essa referência ou mais
achatadas. Perceba que a curtose será do tipo leptocúrtica quando a distribuição for mais
pontiaguda que a normal, conforme Figura 2.5, a seguir:

Figura 2.5 - Curva de distribuição leptocúrtica, com distribuição mais pontiaguda que a normal
Fonte: Triola (2013, p. 237).

#PraCegoVer: na figura, observamos uma distribuição em forma de sino, considerada leptocúrtica. Assim,
os dados são distribuídos com desvio padrão maior em relação à curva de referência, que é a normal
padrão.
A curtose será do tipo platicúrtica quando a distribuição for mais achatada que a normal, como
podemos analisar na Figura 2.6.

Figura 2.6 - Curva de distribuição platicúrtica, com distribuição mais achatada que a normal
Fonte: Triola (2013, p. 237).

#PraCegoVer: na figura, observamos uma distribuição em forma de sino, considerada platicúrtica. Assim,
os dados são distribuídos com desvio padrão maior em relação à curva de referência, que é a normal
padrão.

Agora que você aprendeu sobre os diversos tipos de distribuição e os formatos dela, vejamos como
realizar um critério para a classificação da curva.

praticar
Vamos Praticar
Em vez de analisar o formato da curva visualmente, o cálculo da curtose nos permite inferir o
formato dela sem precisar da representação gráfica. Para isso, um dos cálculos é definido pelo
coeficiente percentílico de curtose, que é calculado deste modo:

D
C =
C90 − C10

Aqui, o autor considera que, para C = 0,263, a distribuição é mesocúrtica. Para C < 0,263, a
distribuição é leptocúrtica, enquanto, para C > 0,263, a distribuição é platicúrtica.
Idade (anos) Número de alunos

7–9 197

9–11 372

11–13 527

13–15 114

15–17 49

17–19 25

19–21 3

Total 1.287

Tabela - Distribuição da idade de alunos numa determinada escola


Fonte: Elaborada pelo autor.

#PraCegoVer: na coluna, composta de 9 linhas e 2 colunas, temos a faixa de idade


(em anos) e o número de alunos respectivos. Entre 7 e 9 anos, temos 197 alunos.
Entre 9 e 11 alunos, 372 alunos. Entre 11 e 13 anos, 527 alunos. Entre 13 e 15 alunos,
114 alunos. Entre 15 e 17 alunos, 49 alunos. Entre 17 e 19 anos, 25 alunos. Entre 19
e 21 anos, 3 alunos. E, no total, 1.287 alunos.

Com base nos dados coletados de estrutura etária dos alunos de certa unidade escolar, encontre
a curtose por meio do coeficiente percentílico de curtose.
Material
Complementar

FILME

TED: Por que devemos amar as estatísticas?


Ano: 2021

Comentário: Na plataforma TED, disponível no YouTube, podemos acessar o


vídeo do Prof. Alan Smith explicando a importância de valorizarmos a
estatística como uma área promissora do conhecimento para chegar a
conclusões que não conseguimos chegar sem ela. Afinal, nossa
possibilidade de tratar dados é limitada, e os erros são comuns quando não
os analisamos de forma sistemática.

Para conhecer mais sobre o filme, acesse o trailer disponível em:

TRAILER
LIVRO

Uma senhora toma chá...: como a Estatística


revolucionou a ciência do século XX
Editora: Zahar

Autor: David Salsburg

ISBN: 978-8537801161

Comentário: Nesse livro do estatístico David Salzburg, o autor busca


explicar como se deu a história da Estatística citando e apresentando a
história, de forma intuitiva, dos principais nomes que surgiram ao longo do
último século. Como estudiosos da área se reuniam em encontros informais
e de lá surgiam perguntas e respostas que acabaram por definir e
impulsionar a área de Estatística e, consequentemente, as diversas áreas de
Matemática Aplicada desde os diversos campos de ciência até as áreas de
Engenharia.
Conclusão
Caro(a) estudante, neste material, você foi capaz de aprender sobre os diversos tipos de distribuição, os
quais explicam como os dados são apresentados. O conhecimento dessas técnicas e parâmetros nos
permite compreender a força da estatística e nos prepara para desenvolver análises poderosas, capazes
de explicar pequenos ou grandes conjuntos de dados.

Referências
MORETTIN, P. A. Estatística básica. 6. ed. São Paulo: Saraiva,
2010.

POR QUE devemos amar as estatísticas? [S. l.: s. n.], 2021. 1


vídeo (13 min.). Publicado por TED. Disponível em:
https://www.ted.com/talks/alan_smith_why_you_should_love_statistics
language=pt-br. Acesso em: 18 set. 2021.

QUAL a importância de organizar dados de forma estratégica? Coletum, 2018. Disponível em:
http://blog.coletum.com/organizar-dados-de-forma-estrategica/. Acesso em: 18 set. 2021.

SALSBURG, D. Uma senhora toma chá...: como a Estatística revolucionou a ciência do século XX. Rio de
Janeiro: Zahar, 2009.

TRIOLA, M. F. Introdução à estatística: atualização da tecnologia. 11. ed. Rio de Janeiro: LTC, 2013.

Você também pode gostar