Escolar Documentos
Profissional Documentos
Cultura Documentos
Princípios da estatística
Veremos, a seguir, os principais conceitos e princípios
da estatística. Com base neles, será possível definir
conceitos mais sofisticados.
População ou universo estatístico
A população ou universo estatístico é o conjunto
formado por todos os elementos que participam de um
determinado tema pesquisado.
População
Dado estatístico
Dado de seis faces 4
Henrique Avancini
Campeões Brasileiros
Amostra
Chamamos de amostra o subconjunto formado com
base no universo estatístico. Uma amostra é utilizada
quando a população é muito grande ou infinita. Em
casos em que coletar todas as informações do universo
estatístico é inviável por motivos financeiros ou
logísticos, também se faz necessário a utilização de
amostras.
A escolha de uma amostra é de extrema importância
para uma pesquisa, e ela deve representar de maneira
fidedigna a população. Um exemplo clássico da
utilização das amostras em uma pesquisa é na
realização do censo demográfico do nosso país.
Variável
Em estatística, a variável é o objeto de estudo, isto é, o
tema que a pesquisa pretende estudar. Por exemplo, ao
estudar-se as características de uma cidade, o número
de habitantes pode ser uma variável, assim como o
volume de chuva em determinado período ou até
mesmo a quantidade de ônibus para o transporte
público. Note que o conceito de variável em estatística é
dependente do contexto da pesquisa.
A organização dos dados em estatística dá-se em etapas,
como em todo processo de organização.
Inicialmente é escolhido o tema a ser pesquisado, em
seguida, é pensado o método para a coleta dos dados da
pesquisa, em seguida, é pensado o método para a coleta
dos dados da pesquisa, e o terceiro passo é a execução
da coleta. Após o fim dessa última etapa, faz-se a
análise do que foi coletado, e assim, com base na
interpretação, busca-se resultados. Veremos, agora,
alguns conceitos importantes e necessários para a
organização dos dados.
Rol
Em casos em que os dados podem ser representados
por números, ou seja, quando a variável é quantitativa,
utiliza-se o rol para organização desses dados. Um rol
pode ser crescente ou decrescente. Caso uma variável
não seja quantitativa, ou seja, caso seja qualitativa, não
é possível utilizar-se o rol, por exemplo, se os dados são
sentimentos sobre determinado produto.
Exemplo:
Em uma sala de aula, foram coletadas as alturas dos
alunos em metros. São elas: 1,70; 1,60; 1,65; 1,78; 1,71;
1,73; 1,72; 1,64
Como o rol pode ser organizado de maneira crescente
ou decrescente, segue que:
rol: {1,60; 1,64; 1,65; 1,70; 1,71; 1,72; 1,73; 1,78}
Observe que, com o rol já montado, é possível
encontrar um dado com mais facilidade.
Tabela de distribuição de frequência
Em casos nos quais há muitos elementos no rol e
muitas repetições de dados, o rol torna-se obsoleto, pois
a organização desses dados é inviável. Nesses casos, as
tabelas e a distribuição de frequências servem como
uma excelente ferramenta de organização.
Na tabela de distribuição de frequência absoluta,
devemos colocar a frequência em que cada dado
aparece, ou seja, a quantidade de vezes que ele aparece.
Vamos construir a tabela de distribuição de frequência
absoluta das idades, em anos, dos alunos de uma
determinada classe.
1,60 – 1,50
0,10 metro
Medidas de posição
As medidas de posição são utilizadas em casos em que
é possível construir-se um rol numérico com os dados
ou uma tabela de frequência. Essas medidas indicam a
posição dos elementos em relação ao rol. As três
principais medidas de posição são:
Média
A média aritmética é considerada uma medida de
tendência central e é muito utilizada no cotidiano. Surge
do resultado da divisão do somatório dos números
dados pela quantidade de números somados.
Vamos determinar a média dos números 3, 12, 23, 15,
2.
Ma = (3+12+23+15+2) / 5
Ma = 55 / 5
Ma = 11
Exemplo
Em um grupo de dança, as idades dos integrantes
foram coletadas e representadas no rol a seguir:
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
(2, 2, 3, 3, 4, 5, 6, 7, 9)
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
Medidas de dispersão
As medidas de dispersão são utilizadas nos casos em
que a média já não é suficiente. Por exemplo, imagine
que dois carros tenham percorrido uma média de 40.000
quilômetros. Somente com conhecimento sobre média
podemos afirmar que os dois carros andaram
determináveis quilômetros cada um, certo?
No entanto, imagine que um dos carros tenha
percorrido 79.000 quilômetros, e o outro, 1.000
quilômetros, veja que somente com as informações
sobre média não é possível realizar afirmações com
precisão.
As medidas de dispersão nos indicarão o quanto os
elementos de um rol numérico estão afastados da média
aritmética. Temos duas importantes medidas de
dispersão:
Variância (σ2)
Vamos chamar de variância a média aritmética dos
quadrados da diferença entre cada elemento do rol e a
média aritmética desse rol. A variância é representada
por: σ2.
Considere o rol (x1, x2, x3, …, xn) e que ele possua
média aritméticax. A variância é dada por:
Desvio-padrão (σ)
O desvio-padrão é dado pela raiz da variância, ele nos
indica o quanto um elemento está disperso em relação à
média. O desvio padrão é denotado por σ.
Exemplo:
Determine o desvio-padrão do conjunto de dados (4, 7,
10). Veja que, para isso, é necessário determinar-se
primeiro a variância, e que, para tanto, é necessário
antes o cálculo da média desses dados.
Substituindo esses dados na fórmula da variância,
temos: