Você está na página 1de 6

Estatística Descritiva

GRAN: Prof. Josimar Padilha

A Estatística Descritiva ou Dedutiva é o ramo da Estatística que tem por objetivo descrever fatos
relacionados a determinado grupo ou população, sem pretender tirar conclusões de caráter mais
genérico.

É o conjunto de técnicas destinadas à síntese de dados numéricos.

 A coleta, organização e a descrição dos dados estão a cargo da Estatística Descritiva


 A análise e a interpretação dos dados ficam a cargo da Estatística Inferencial*

CONCEITOS ELEMENTARES

POPULAÇÃO: Conjunto universo de todos os elementos (objetos e outros) com uma característica
comum (objeto de estudo). Um parâmetro é uma medida numérica que descreve alguma
característica de uma população.

AMOSTRA: Qualquer subconjunto não-vazio de uma população. Uma estimativa é uma medida
numérica que descreve alguma característica de uma amostra.

CENSO E ESTIMATIVA: são processos estatísticos utilizados no estudo de fenômenos coletivos.

 Censo: é uma avaliação direta de um parâmetro, através dos dados obtidos de todos os
componentes da população. É caro, lento e quase sempre desatualizado. Admite erro
processual zero e confiabilidade de 100%.

 Estimativa: é uma avaliação indireta de um parâmetro com base em um estimador, através


do cálculo de probabilidades por meio de uma amostra. É barato, rápido e atualizado.
Admite erro processual positivo e confiabilidade menor que 100%.

Os dados amostrais devem ser coletados de modo apropriado através de um processo de seleção
aleatória. Se não, podem se tornar inúteis ou induzir a erro o processo decisório.

Quanto à organização:

a) Dados brutos: obtidos diretamente da observação, os quais não estão numericamente


organizados.
b) Rol: dados brutos numericamente organizados de forma crescente ou decrescente.

Quanto ao tipo:

a) Dados quantitativos: possuem características numéricas representando contagens ou


medidas, sendo chamados de variáveis. Podem ser classificados em:

 Discretos: possuem variáveis que assumem determinados valores inteiros em um


intervalo, não admitindo fracionamentos. Exemplos: quantidade de alunos em um
curso, quantidade de servidores públicos, quantidade de objetos, etc.
 Contínuos: possuem variáveis que assumem quaisquer valores em um intervalo
numérico, inclusive fracionamentos. Exemplos: altura, peso, salário, temperatura,
etc.

b) Dados qualitativos: possuem características não-numéricas, podendo ser separados em


diferentes categorias, sendo chamados de atributos. Podem ser classificados em:

 Nominais: dados categóricos que consistem em nomes ou rótulos. Possuem


característica não-numérica, logo não podem ser ordenados (tal como do menor para
o maior). Exemplos: sexo (M ou F), cor dos olhos (castanhos, azuis, etc.) resposta de
sondagem (sim, não, indeciso), etc.

OBS.: Para serem processados estatisticamente, deve-se definir valores numéricos para esses
atributos! LEMBRAR DO SPSS!

 Ordinais: dados estatísticos que precisam de uma avaliação subjetiva quanto à


preferência ou desempenho em um conjunto de observações.
* A principal diferença é que estes possuem uma ordenação categórica que os
nominais não podem ter. Exemplos: termos como “menor - médio - maior” ou
“insatisfeito - satisfeito - muito satisfeito” ou “péssimo - ruim - regular - bom –
ótimo - excelente”.

DISTRIBUIÇÃO DE FREQUÊNCIA

É uma representação tabular dos dados estatísticos discretos ou contínuos, sendo uma forma de
resumir grandes conjuntos de dados.

Ao representá-los em uma tabela de frequência facilita-se a construção de gráficos, bem como a


compreensão sobre a natureza desses dados.

 Representação dos DADOS DISCRETOS:

 Considere a seguinte amostra de valores, relativos às disciplinas estudadas por 20 alunos. A


variável de estudo disciplinas é representada por X: {4 8 8 6 6 8 5 5 6 7 7 7 6 6 7 5 5 7 5 5}
* Serão consideradas variáveis discretas porque são valores inteiros (não há como estudar
meia disciplina). A partir deles, é possível formar tabelas para facilitar a compreensão:

1. Frequência Simples Absoluta (𝑓𝑖)

A frequência simples de um elemento é o número de vezes que o elemento figura no conjunto de


dados. Para os dados discretos da amostra anterior, teremos a seguinte distribuição:

Disciplinas (X𝑖) Frequência (𝑓𝑖)


4 1
5 6
6 5
7 5
8 3
TOTAL 𝑛 = ∑𝑓𝑖 = 20

𝑛 = total da amostra
∑= somatório

2. Frequência Relativa (Fr):

É a razão entre a frequência absoluta da variável e o número total n de elementos da série.


Representada por meio de porcentagens.

fi fi
Fr = ∑ fi ou Fr = n

Disciplinas (X𝑖) Frequência (𝑓𝑖) Frequência Relativa (Fr)


4 1 1/20 = 0,05 = 5%
5 6 6/20 = 0,3 = 30%
6 5 5/20 = 0,25 = 25%
7 5 5/20 = 0,25 = 25%
8 3 3/20 = 0,15 = 15%
TOTAL 𝑛 = ∑𝑓𝑖 = 20 20/20 = 1 = 100%

3. Frequência acumulada (Fac):

É o somatório da frequência simples da variável com as frequências simples dos elementos que o
antecedem.

Disciplinas (X𝑖) Frequência (𝑓𝑖) Frequência Acumulada (Fac)


4 1 1
5 6 (+1) 7
6 5 (+7) 12
7 5 (+12) 17
8 3 (+17) 20
TOTAL 𝑛 = ∑𝑓𝑖 = 20

4. Amplitude amostral (A) Range:

É a diferença entre o maior e o menor valor da amostra.

Exemplo anterior (𝑛 = 20):

Disciplinas (X𝑖)
4
5
6
7
8
TOTAL
A= 8 - 4 = 4
 Representação de DADOS CONTÍNUOS em CLASSES (AGRUPADOS)

Na representação de grandes quantidades de dados, principalmente contínuos, utiliza se a forma


de intervalos de classe. Pode ser aplicada a dados discretos quando se tratarem de grandes
amostras.

a) Classe: é cada um dos intervalos/grupos obtidos a partir do conjunto de dados. Os


intervalos/grupos terão valor mínimo (limite inferior Ls) e valor máximo (limite superior
L𝑖).

Há diversos métodos para se determinar o número de classes, sendo esta a mais simples:

* Regra do quadrado (K) = √ n, onde 𝑛 é o tamanho da amostra e K é o número de classes a


saber. Utiliza-se o valor mais próximo do quadrado perfeito.

* Após achar K, deve-se encontrar a Amplitude amostral Range (A).

* Finalmente, deve-se calcular a razão entre a Amplitude amostral Range (A) e o K. Esse
resultado será a Amplitude de classe (Ac).

b) Amplitude de classe (Ac) = Ls – L𝑖, sendo a diferença entre os limites superior e inferior da
classe.

c) Ponto médio da classe (Pm) = (L s + Li)/2, sendo a média aritmética simples dos limites
superior e inferior de cada classe.

P m= ( L s+ L i )
2

Exemplo: Quantidades de filhos (Ac) por família (𝑓𝑖)

Classes Frequência (𝑓𝑖) Pm (X𝑖) (X𝑖). (𝑓𝑖)


2 │--- 4 3 Ls + L𝑖/2 = 3 9
4 │--- 6 5 Ls + L𝑖/2 = 5 25
6 │--- 8 10 Ls + L𝑖/2 = 7 70
8 │--- 10 5 Ls + L𝑖/2 = 9 45
10│--- 12 3 Ls + L𝑖/2 = 11 33
𝑛= ∑𝑓𝑖 =𝟐𝟔 26 182

Com o valor do ponto médio Pm, pode-se esquecer as classes e admitir que aquelas são as
quantidades de filhos por família das respectivas frequências. O (X𝑖). (𝑓𝑖) será o produto numérico
final daquela distribuição.

MEDIDAS DESCRITIVAS
1. Medidas de Posição:

a) Tendência Central (Rol):

É um valor intermediário da série, ou seja, compreendido entre o menor e o maior valor. É


também um valor em torno do qual os elementos da série estão distribuídos e posicionados
em relação ao eixo horizontal.

Resumidamente, a medida de tendência central procura estabelecer um número no eixo


horizontal em torno do qual a série se concentra.

[--------•--------]

As principais são: Média (aritmética e ponderada), Mediana e Moda.

X̅: {x1, x2, x3, ..., xn}

x 1 , x 2 , x 3 , … xn
* Média aritmética:
n

- Sofre influência dos valores extremos (outliers) da distribuição: conforme o aumento ou


diminuição dos valores extremos, a média é atraída em direção àquele extremo.
- A média aritmética por si só é incompleta, não sendo suficiente para representar a
realidade e possibilitar um processo decisório.
- É boa para calcular o somatório (∑x = X̅. 𝑛)

* Mediana:

- Medida de posição.
- Divide o conjunto de valores em duas partes iguais.
- O conjunto precisa estar disposto em Rol (crescente)

Se o conjunto tiver quantidade ímpar, o elemento central será o próprio valor do centro.

Se o conjunto tiver quantidade par, deve-se tirar a média aritmética dos dois valores centrais.

b) Separatrizes (Rol crescente): quartis, decis, percentis

Quartil: separa a distribuição de frequência em partes de ¼ (25%)


3 pontos de quartis dá os 100%: [----•----•----•----]
Decil: separa a distribuição de frequência em partes de 1/10 (10%)
9 pontos de decis dá os 100%: [----•----•----•----•----•----•----•----•----•----]
Percentil: é a mesma coisa que decis, só que em porcentagem (P10, P20, P30, ..., P90)

 Algumas bancas consideram a Mediana uma separatriz, pois divide a distribuição de


frequência pela metade (50%)

2. Medidas de Dispersão (Variabilidade):

I. Variância (σ2)
II. Desvio padrão (σ)
III. Coeficiente de variação (cv)

3. Assimetria:

Distribuições de frequência podem ser: simétricas, assimétricas à direita (+) e assimétricas à


esquerda (-).

Para sabê-la, é necessário saber a média, a moda* e a mediana. Se estas forem iguais, a
distribuição será simétrica. Se tenderam a alguma direção, serão assimétricas à direita ou à
esquerda.

* pode haver distribuição amodal

4. Curtose:
É o achatamento da curva normal (curva de Gauss)

Normal: mesocúrtica
Para cima: leptocúrtica
Para baixo: platicúrtica

SIMBOLOGIAS

Média:
População: valores reais (μ)
Amostra: valores estimados (X̅)

Variância
População: valores reais (σ2)
Amostra: valores estimados (ς2)

Desvio padrão
População: valores reais (σ)
Amostra: valores estimados (ς)

Proporção
População: valores reais (ρ)
Amostra: valores estimados (p)

Você também pode gostar