Você está na página 1de 5

ORGANIZAÇÃO, REPRESENTAÇÃO E

TRATAMENTO DE DADOS
Quando falamos em estatística e em estudo estatístico, há uma série de
expressões que vêm associados. São estas:

• população – conjunto de pessoas, objectos ou acontecimentos sobre


os quais incide um estudo estatístico;
• amostra – parte representativa da população, sobre a qual incide o
estudo;
• censo ou recenseamento – estudo estatístico realizado sobre a
totalidade da população;
• sondagem – estudo estatístico realizado a partir de uma amostra;
• variável estatística – características que os elementos da população
podem ou não ter e que é alvo de investigação num estudo estatístico.

As variáveis estatísticas podem ser classificadas em variáveis quantitativas


e variáveis qualitativas. As variáveis quantitativas representam informação
que é susceptível de medida e as variáveis qualitativas representam
informação que identifica alguma qualidade ou categoria, logo, não são
susceptíveis de medida. Dentro das variáveis quantitativas podemos
encontrar:

• variáveis quantitativas discretas – representam informação que


apenas pode tomar um número finito (ou infinito numerável) de valores
distintos;
• variáveis quantitativa contínua – representam informação que pode
tomar todos os valores no seu intervalo de variação.
Existem mais dois conceitos relacionados com os estudos estatísticos:
frequência absoluta e frequência relativa. A frequência absoluta representa-
se por e é o número de vezes que um acontecimento se repete. A
frequência relativa representa-se por
e é o quociente entre a frequência absoluta de um acontecimento e o
número total de observações (N). A soma das frequências relativas é
sempre 1. Podemos multiplicar a frequência relativa de um acontecimento
por 100 e obtemos a frequência relativa em percentagem.

𝑓%
𝑓" =
𝑁

Tabelas e gráficos

Uma tabela de frequências é uma tabela onde se indica uma ou duas


frequências.

Os gráficos constituem uma forma prática e eficiente de transmitir


informação. Dos gráficos mais utilizados destacam-se os gráficos de
barras, histogramas, gráficos circulares e pictogramas.
MEDIDAS DE TENDÊNCIA CENTRAL
• Habitualmente, quando estamos perante um conjunto de dados
estatísticos, interessa-nos saber se estes têm tendência a concentrar- se
em torno de algum valor médio ou central. As medidas estatísticas que
nos dão essa indicação são a média, a moda e a mediana e designam-
se por medidas de tendência central.

• A moda é a única das três que pode ser determinada para variáveis
qualitativas. A moda de uma distribuição é a observação que mais vezes
se repete. Se não houver nenhuma observação que se repita mais vezes
que as restantes então diz-se que a distribuição é amodal. No caso de
haver duas modas diz-se que a distribuição é bimodal. Se houver três ou
mais modas, diz-se que a distribuição é plurimodal.

• A média apenas pode ser calculada para variáveis quantitativas. Dado


um conjunto de dados numéricos, calcula-se a média somando todos os
dados e dividindo o resultado pelo número total de observações.

• A mediana também pode ser calculada apenas para variáveis


quantitativas. Dada uma sequência ordenada (por ordem crescente ou
decrescente) dos dados observados, a mediana é o valor que ocupa a
posição intermédia. Se o número de dados for par, a mediana é a média
aritmética dos dois valores centrais.
MEDIDAS DE LOCALIZAÇÃO
o A média, moda e mediana não são por vezes suficientes para retirar
conclusões sobre uma dada amostra. Para além destas medidas existem
outras medidas importantes que nos permitem descrever melhor a
distribuição de um conjunto de dados. São elas as medidas de localização.
o Numa distribuição existem três quartis, o primeiro quartil ( ), o segundo
quartil ( ), que coincide com a mediana, e o terceiro quartil ( ). Dada uma
sequência ordenada (por ordem crescente ou decrescente) dos dados em
estudo, o segundo quartil (mediana) é o valor que ocupa a posição
intermédia. Se o número de dados for par, o segundo quartil (mediana) é a
média aritmética dos dois valores centrais. Uma vez determinada a
mediana ( ) a distribuição fica dividida a meio. Para calcularmos o primeiro
quartil ( ) determinamos a mediana da primeira metade da distribuição.
Para calcularmos o terceiro quartil ( ) determinamos a mediana da segunda
metade da distribuição.
o Todas as distribuições têm dois extremos, o extremo máximo, que é a
maior das observações feitas, e o extremo mínimo, que é a menor das
observações feitas. A amplitude (A) é a diferença entre o máximo e o
mínimo de uma distribuição. A amplitude interquartis (AIQ) é a diferença
entre o valor do terceiro e do primeiro quartis.
o O diagrama de extremos e quartis (ou caixa de bigodes) é uma forma
esquemática de representar os extremos, mediana e quartis de uma
distribuição. Para construir um diagrama de extremos e quartis é
necessário conhecer os seguintes valores:

ü extremos (máximo e mínimo);

ü mediana;
ü 1.o quartil ( );
ü 3.o quartil ( ).

o O conjunto dos valores da amostra compreendidos entre o 1.o e o 3.o


quartis são representados por um rectângulo (a largura do rectângulo não
dá qualquer informção). No rectângulo marca-se o valor da mediana com
uma barra. De seguida, marcam-se duas linhas que unem os meios dos
lados do rectângulo com os extremos da amostra.

Você também pode gostar