Escolar Documentos
Profissional Documentos
Cultura Documentos
DELEGAÇÃO DE CHIMOIO
2ᵒ ANO / A Distancia
I-SEMESTRE
TURMA−A 1ºGRUPO
CADEIRA: Estatistica I
DISCENTES:
Março 2024
1 Índice
1 Introdução:.................................................................................................................5
1.1 Objectivos...........................................................................................................5
1.1.1 Objectivo Geral...........................................................................................5
1.1.2 Objectivos específicos.................................................................................5
1.2 As medidas de localização são fundamentais em estatística por diversas razões
6
1.3 Medidas de tendência central: moda, média e mediana......................................7
1.3.1 Moda............................................................................................................7
1.3.2 Média...........................................................................................................7
1.3.3 Mediana.......................................................................................................8
1.3.4 Interpretações..............................................................................................8
1.3.5 Média aritmética (x)....................................................................................9
1.3.6 Mediana (x)................................................................................................10
2 Conclusão:................................................................................................................13
3 Referências bibliográficas........................................................................................14
2 Introdução:
As medidas de localização são utilizadas na estatística para resumir e descrever
anposição central de um conjunto de dados. Elas nos ajudam a entender onde os dados
estão concentrados e são essenciais para interpretar a distribuição dos dados. Além
dessas medidas, existem outras menos comuns, como percentis, quartis e desci, que
dividem os dados em partes específicas, fornecendo informações detalhadas sobre a
posição dos dados em relação ao todo.
2.1 Objectivos
2.1.1 Objectivo Geral
Estudar. Medidas de localização.
4
Em estatística, medidas de localização são utilizadas para descrever a posição central de
um conjunto de dados. Elas são úteis para resumir e compreender a distribuição dos
dados. As medidas de localização mais comuns são a média, a mediana e a moda.
A média é a soma de todos os valores dividida pelo número total de observações. Ela é
sensível a valores extremos, o que pode distorcer a interpretação da posição central dos
dados.
Outras medidas de localização menos comuns incluem percentis, quartis e decis. Essas
medidas também fornecem informações sobre a posição dos dados em relação ao todo,
mas de uma maneira mais específica, como os valores que dividem os dados em quartos
(quartis) ou em centésimos (percentis)
5
2.3 Medidas de tendência central: moda, média e mediana
Existem várias formas de caracterizar um conjunto de dados. As formas mais simples
estatisticamente falando, são as medidas de tendência central: moda, média e mediana.
É possível que você já tenha escutado esses nomes por aí, mas vamos definir e aprender
a calcular cada uma delas.
Para ficar mais fácil de assimilar, durante todo esse poste, nós vamos usar o seguinte
conjunto de dados:
2, 5, 7, 5, 8, 10, 9
2.3.1 Moda
A moda, é o valor em que a frequência dos seus dados é maior. Então para encontrar a
moda desse conjunto poderíamos fazer uma tabela de frequência e ver qual é o número
mais frequente:
Números Frequência
2 1
5 2
7 1
8 1
9 1
10 1
Tabela de frequências
Dessa forma, sabemos que a moda desse conjunto seria o cinco, porque o cinco é o
número mais frequente.
2.3.2 Média
A média, é o resultado da soma de todos os valores dividido pela quantidade de
entradas do nosso conjunto de dados, ou seja, se somarmos todos os nossos valores e
dividirmos pela quantidade teremos a média.
2+ 5+7+5+ 8+ 10+9 46
Media = = =6.57
7 7
Cálculo da média
6
2.3.3 Mediana
Já mediana, é o valor que divide o nosso conjunto de dados em duas metades. Para
encontrar nossa mediana precisamos primeiro ordenar nossos dados:
2, 5, 5, 7, 8, 9, 10
Como nosso dataset tem uma quantidade ímpar de números, a mediana será o valor 7.
Caso nosso dataset tivesse uma quantidade par de entradas, a mediana seria a média dos
dois valores mais ao centro:
2, 5, 5, 7, 8, 9
5+ 7
mediana= =6.5
2
2.3.4 Interpretaçõ es
Como a moda é definida por frequência, nem todos os valores dos nossos dados vão
afectá-la, por exemplo, se a gente pegar amostras da nossa população/nossos dados, a
moda ser arbitrária, ou seja, ela pode variar muito de uma amostra pra outra. Além
disso, quando a gente leva em consideração o histograma de uma amostra, a moda irá
variar dependendo do seu bin size.
Por outro lado, a gente tem a média, que é muito afectada por cada valor presente no
nosso conjunto de dados, então, se nós tivermos outliers no nosso conjunto de dados, a
média vai ser “puxada” para o valor do outlier. Por exemplo, se no
nosso dataset original nós colocássemos uma entrada com valor igual a 100, esse novo
valor iria fazer a média aumentar bruscamente, no entanto a mediana não sofreria
tamanha alteração:
2, 5, 5, 7, 8, 9, 10 6.5 7
7
Então se a gente tem um valor que é muito influenciado pelo nosso conjunto de dados
(média) e um outro valor que é pouco influenciado (moda), eles não são muito bons
certos? E aí que a mediana entra, como ela define o meio do nosso dataset, ela é
uma medida robusta em relação os nossos dados, ou seja, outliers não vão influenciar a
mediana.
Por mais que seja divertido pegar a calculadora e fazer essas continhas na mão, pode se
tornar inviável quando nosso dataset é muito grande então, vamos ver como encontrar
as medidas de tendência central com ajuda de ferramentas no próximo
post: “Calculando as medidas de tendência central com Python, R ou Excel”.
Exemplo
Suponha que durante a quadra festiva (última semana do ano e primeira Semana do
novo ano), uma loja de prendas tenha registado os seguintes valores (em mil meticais)
na venda dos seus produtos:
Qual é neste caso o valor médio (média aritmética) das vendas da loja no referido
período?
Σx , Σx , f ,
x= ou x=
n n
8
Quando os dados se apresentam agrupados em classes de igual amplitude, a
determinação da média aritmética passa primeiro pela determinação de um valor que
possa a caracterizar cada uma das classes - O ponto médio da classe ( x, ).
1,10 - 1,20 7
1,20 - 1,30 8
1,30 - 1,40 4
1,40 - 1,50 2
Total 26 ₋
O ponto médio representa o valor no meio do intervalo da classe. Também pode ser
obtido fazendo a média dos dois limites, isto é,
1, 00+1 , 10
=1.05.
2
9
No centro da distribuição dos dados das vendas aparecem dois valores. Portanto a
mediana será a média desses dois valores:
8+8 , 5
x= =8 , 25
2
Observe que neste caso, em que temos 12 observações a mediana resulta da soma dos
dados nas posições 6 e 7.
Preencha a seguinte tabela, sobre a posição dos valores a somar para determinar a
mediana, no caso em que temos um número par de observações: (Não leve mais de 10
minutos).
12 6o e 7o
10 ___ e ___
16 ___ e ___
20 ___ e ___
n ___ e ___
Caso n-par.
10
e prove se essa regra pode ser usada para esses casos. Por último, aplique a regra para os
outros casos em que o tamanho da amostra é maior.
Conclui-se portanto, para casos em que n é par que a mediana é obtida colocando os
dados em ordem crescente e achando a média dos dados centrais; cujas posições são:
11
3 Conclusão:
12
4 Referências bibliográficas
Smith, J. (2020). Measures of Central Tendency in Statistics. In: Statistics for
Beginners. Publisher X. pp. 50-65.
− HOGG e TANIS. Probability and Statical Inference. New Jersey. Prantice Hall, 2001
− LEVIN, Jack at al; Estatística para ciências Humanas, São Paulo 9ª edição, Editora
Pearson, , 2004.
13