Você está na página 1de 13

Universidade Aberta Isced (UnISCED)

Faculdade de Ciências de Educação


Curso de Licenciatura em Ensino de Geografia

Medidas de variabilidade e sua aplicação na análise de dados geográficos

Nome: Zito Omar Patua; Código: 81231785

Nampula, Março de 2023


Universidade Aberta Isced (UnISCED)
Faculdade de Ciências de Educação
Curso de Licenciatura em Ensino de Geografia

Medidas de variabilidade e sua aplicação na análise de dados geográficos

Trabalho de carácter avaliativo,


desenvolvido no campo a ser
submetido na Coordenação do
Curso de Licenciatura em Ensino
de Geografia da UniSCED,
disciplina de Estatística.

Nome: Zito Omar Patua; Código: 81231785

Nampula, Março de 2023


2
II
Índice
1. Introdução .................................................................................................................................... 4
2. Contextualização ......................................................................................................................... 5
2.1. A importância de quantificar a dispersão ................................................................................. 5
3. Medidas de dispersão ou de variabilidade ................................................................................... 5
3.1. Amplitude ............................................................................................................................. 6
3.2. Variância ............................................................................................................................... 7
3.3. Desvio Padrão ....................................................................................................................... 8
3.3.1. Desvio padrão populacional ........................................................................................... 9
3.4. Coeficiente de variação ....................................................................................................... 11
4. Conclusão .................................................................................................................................. 12
5. Referências Bibliográficas ......................................................................................................... 13

III
3
1. Introdução

O presente trabalho foi concebido no âmbito da realização das actividades curriculares na


disciplina de Estatística da UniSCED, Curso de Licenciatura em Ensino de Geografia do 1º ano, e
tem como tema “Medidas de variabilidade e sua aplicação na análise de dados geográficos”, a ser
desenvolvido pelo estudante de ensino à distância no campo, cujo objectivo é:

Objectivo Geral: Reconhecer a importância do estudo das medidas de variabilidade estatísticas


na área da geografia.

Objectivos Específicos:

 Explicar a importância de quantificar a dispersão na análise de dados geográficos;


 Descrever as diferentes variáveis estatísticas aplicadas na análise de dados geográficos;
 Explicar a diferença existente entre o desvio padrão populacional e o desvio padrão
amostral.

Metodologia:

Para elaboração do presente trabalho, o autor baseou-se numa pesquisa científica, A pesquisa é
um trabalho em processo não totalmente controlável ou previsível. Como descreve Demo (1991),
em sua origem, a palavra “metodologia” significa estudos dos caminhos ou dos instrumentos
utilizados para um trabalho científico. Não determina uma única via, mas busca apresentar os
caminhos possíveis do processo científico, como problematizar criticamente, indagar sobre os
limites da ciência e estabelecer um padrão de inteligibilidade na apresentação da pesquisa.

Não obstante, o trabalho apresenta os elementos pré-textuais (capa, folha de rosto, índice);
elementos textuais (introdução, desenvolvimento e conclusão) e; elementos pós-textuais
(referencias bibliográficas).

4
2. Contextualização
2.1. A importância de quantificar a dispersão

Resumo de variável observada apenas por uma medida de posição, ignora a informação sobre a
sua variabilidade. Não é seguro analisar um conjunto de dados somente pelo emprego de medidas
de tendência central. Por isso, precisamos de medidas que caracterizem a dispersão ou
variabilidade dos dados em relação a um valor central.

Figura 1. Histogramas exibindo a profundidade das covas para transplante de mudas antes e após
ser dado treinamento sobre cultivo

3. Medidas de dispersão ou de variabilidade

As medidas de dispersão resumem os dados a partir de um único valor que indica variabilidade.
As medidas de dispersão são medidas estatísticas usadas para determinar a variabilidade em um
conjunto de dados.

5
Existem várias medidas de dispersão, as principais são: amplitude, variância, desvio padrão e
coeficiente de variação. O uso de uma ou outra medida, pode variar de acordo com cada situação.

Mas, de forma geral, quando calculamos uma medida de dispersão, obtemos um número que
indica o quanto os dados estão próximos ou distantes (dispersos) uns dos outros. Quanto mais
afastados são os dados, mais altas tendem a ser as medidas de dispersão. Por outro lado, quanto
mais concentrados os dados, mais baixas tendem ser as medidas.

3.1. Amplitude

A amplitude é a diferença entre o maior e o menor valor da variável:

A = max(ç) – min(ç) = ç(n) – ç(1)

Amplitude total ou máxima é a diferença entre o maior e o menor valor de um conjunto de dados.
Como, por exemplo, nas médias das notas do teste psicotécnico da Tabela 1 em que a amplitude
máxima é dada pela diferença entre 75 e 60, ou seja, 05. Logo, as notas do teste variam em 5
unidades.

Mas, para estudar a dispersão dos dados, a amplitude não é um dos melhores meios, pois o
cálculo é efetuado apenas com os valores extremos do conjunto. Por exemplo, as idades em anos
de um grupo de pessoas, são: 2, 5, 8, 10, 14, 18 e 22.

Um segundo grupo, possui as idades:2, 14, 15, 15, 16,16 e 22.

Nos dois grupos a amplitude máxima é de 20 anos. Porém, a dispersão no primeiro é bem maior
do que no segundo. Para medir a dispersão de um grupo de dados, o pesquisador poderá fazer uso
do desvio padrão: um procedimento matemático igualmente fácil, mas muito mais elaborado e
que contempla todos os valores do conjunto de dados em estudo.

6
3.2. Variância

A variância é uma medida de dispersão que considera todos os valores do conjunto de dados e a
média aritmética entre eles. A fórmula da variância é:

Em que:
 é a variância;
 é o valor da i-ésima observação;
 é a média das observações;
 é o total de observações.

O somatório na fórmula indica a soma de todos os termos , para indo de 1 até , ou


seja:

Exemplo: As alturas, em metros, de três jogadoras de basquete são: 1,84; 1,88 e 1,95. Vamos
calcular a variância das alturas.
Primeiro, obtemos a média das alturas:

Agora, aplicamos os valores na fórmula da variância:

7
Portanto, a variância das alturas é igual a 0,02 m².

A variância da amostra é aproximadamente a média das diferenças ao quadrado entre cada uma
das observações de um conjunto de dados. Assim, para uma amostra contendo n observações x 1,
x2, …, xn, a variância da amostra pode ser escrita como

3.3. Desvio Padrão

O desvio padrão de uma amostra (representado pela letra S) é definido como sendo a raiz
quadrada da variância da amostra.

Ao iniciar as análises de um agrupamento de dados, a média permite que se estabeleça um juízo


sobre tal conjunto. Porém, não permite avaliar a dispersão, principalmente para conjunto de
dados mais numerosos.

Um dos modos mais simples de se medir a dispersão, é calcular a amplitude total, entretanto, tal
amplitude pode se deixar influenciar pelos valores extremos. O desvio padrão foge a essa falha

8
por levar em conta todos os valores em questão. Portanto, o desvio padrão é muito mais
conveniente no cálculo da dispersão.

O desvio padrão é definido como a raiz quadrada da média dos quadrados dos desvios
(variância):

3.3.1. Desvio padrão populacional

O desvio padrão populacional ou amostral mede a variabilidade dos dados, com respeito à média.
Conjunto de dados com maior dispersão implica em desvios padrões elevados.

3.3.1.1. Diferença entre o desvio padrão populacional e o desvio padrão amostral

A diferença entre o desvio padrão populacional e o desvio padrão amostral, está no significado do
conjunto e no denominador da expressão matemática que o determina. Enquanto o desvio padrão
amostral é calculado com a média de uma amostra da população. Portanto, expresso a partir de
um valor estimado da verdadeira média.

O desvio padrão populacional é obtido com a média verdadeira, ou seja, a média da população.
Então, o denominador n do desvio estimado, é subtraído de uma unidade como forma de
correcção, uma vez que essa subtracção implica em um aumento de seu valor e, portanto, o uso
do desvio padrão amostral tem diminuído a possibilidade de erro quando for usado para verificar
a variabilidade dos dados.

9
Para exemplificar a análise de variabilidade de dados, analisar-se-á 4 amostras de massas de
alunos iniciantes em um curso de graduação. Os dados com as estaturas destes alunos, constam
abaixo.

Amostras com massas de alunos de graduação

Em ambas as amostras da tabela acima, a média das massas dos alunos é 63 kg. Entretanto, a
dispersão observada não é a mesma.

Para a amostra 1, o desvio padrão amostral é de 4,69 kg, a segunda amostra não possui
variabilidade, na terceira o desvio padrão é de 14,82 e, para a quarta, este valor sobe para 23,32.
Comparando os resultados dos desvios padrões calculados, se observa que, quanto maior for a
dispersão dos dados, maior será o valor numérico do desvio padrão. Ressalta-se que o desvio
padrão somente tem sentido enquanto informação se for comparado com a média.

3.3.1.2. O que a Variância e o desvio padrão indicam

A variância e o desvio padrão medem a dispersão “média” em torno da média aritmética, ou seja,
como as observações maiores flutuam acima dela e as observações menores se distribuem abaixo
dela.

10
3.4. Coeficiente de variação

O coeficiente de variação (CV) é uma medida de dispersão que, ao contrário de todas as medidas
anteriores, é livre de qualquer unidade de medida. O CV é definido como o quociente entre o
desvio padrão e a média dos dados:

Em geral, é um valor apresentado em forma de percentagem, por isso multiplica-se por 100 na
fórmula.
O coeficiente de variação é uma medida indicada para comparar a variabilidade entre dois ou
mais conjuntos de dados, já que é um valor livre de unidade de medida.
O conjunto de dados mais homogéneos é aquele que apresenta menor valor do CV.

Contudo, também podemos calcular o coeficiente de variação para analisar um único conjunto de
dados. Nesse caso, a interpretação do valor do coeficiente de variação depende da natureza da
variável estudada.

11
4. Conclusão

As medidas de dispersão são medidas estatísticas usadas para determinar a variabilidade em um


conjunto de dados. Existem várias medidas de dispersão, as principais são: amplitude, variância,
desvio padrão e coeficiente de variação.
As medidas de tendência central, como a média, moda e mediana, também resumem um conjunto
de dados a partir de um único valor. Essas medidas indicam a centralidade dos dados, mas nada
informam sobre a variabilidade entre eles.

12
5. Referências Bibliográficas

MARCIANO, Elainy (2020) Medidas de dispersão. Acessado em: Medidas de dispersão - O


que são, amplitude, variância, desvio padrão (escolaeducacao.com.br)
LUCAS (2021) Medidas de dispersão ou variabilidades dos dados geográficos. Acessado em:
https://blogdoenem.com.br/medidas-de-dispe-variabilidade-dos-dados/

13

Você também pode gostar