Você está na página 1de 7

Anotações de Estatística

Unidade Experimental ou de Observação: é um objeto (isto é, pessoa, objeto,


transação ou evento)
a partir do qual coletamos os dados.

População: é o conjunto total de unidades experimentais que têm determinada


característica que se deseja estudar.
Uma população pode ser finita ou infinita.

Finita - que pode ser contada. Indicado pela letra N.

Infinita -

Parâmetro - é uma medida numérica que descreve alguma característica de uma


população.

Estatística - é uma medida numérica que descreve alguma característica de uma


amostra.

//-----------------//
O que vai estudar nas unidades amostrais?

Variável - é uma característica da unidade experimental.


- Discreta - associado a números
inteiros.
Quantitativas -
- Contínua - associado a números
decimais.

- Nominal
Qualitativas -
- Ordinal

Técnicas para coleta de dados (amostragem):

Probabilística (ou aleatória):


Se todos os elementos da população tiverem probabilidade conhecida, e
diferente de zero, de pertencer à amostra.

Não probabilística (ou não aleatória):


Contrário da anterior.

Amostragem - com reposição e sem reposição.

Amostragens probabilística:

Aleatória simples: é utilizada quando todos os elementos da população


têm a mesma chance (ou probabilidade
igual) de pertencer à amostra.
Os elementos serão sorteados de forma
aleatória.

Sistemática: consiste na escolha sistemática (empregando um mesmo


procedimento) dos elementos da população.
Ex.

População - 300
Tam. Nr. amostra / 20
Resposta = 15
Escolhe um elemento de 1 a 15 e a partir
dele escolho de 15 em 15.

Estratificada:
consiste em uma tentativa de melhoria dos
critérios da amostragem aleatória ou sistemática.
Dividimos a população em subgrupos de elementos
parecidos, homogêneos, aplicando, em seguida, a
amostragem aleatória simples dentro de cada
subgrupo individual.
Extraindo amostras representativas de subgrupos
menores e mais parecidos e depois agrupando as
amostras individuais, tenta-se melhorar o
critério de representatividade das amostras.
Pode dividir em extratos, sexo, gênero etc.

Amostragem não probabilística:

Amostragem a esmo ou sem norma.

Amostragem intencional.

//-----------------------//
Como organiza os dados?

Através da distribuição de frequência.


Tabela que lista a resposta dos dados (variáveis), juntamente com suas frequências
correspondentes.
É como os dados estão distribuídos.

ROL - Sequência ordenada (crescente ou decrescente) de dados brutos.

Tabela de distribuição de frequências:

Nome da Frequência F.Relativa(%)


Variável Absoluta

Respostas da
Variável

Total Nr. de 100,00


elementos em
estudo

Conceitos: Pelo menos e no máximo

Indicar - é descrever o que está sendo estudado.

* Qnd a variável é numérica, ela deve ser organizada em ordem decrescente.

Classificar é dizer qual é a variável.

Numa tabela de frequência a soma da frequência deverá dar o número dos dados.

Significado do termo '...pelo menos.' = no mínimo. Ou seja, quantos elementos


tem valor X ou mais que X.
Numa tabela de frequência, a coluna de frequência absoluta deve estar na
ordem decrescente.

Obs. a primeira frequência acumulada sempre será o primeiro valor da


frequência absoluta e a última será o total de
elementos da frequência.

Ex.

Idade Frequência fr(%) fa fra(%)


18 1 8,33 1 8,33
19 1 8,33 2 16,67
21 1 8,33 3 25,00
22 2 16,67 5 41,67
24 2 16,67 7 58,33
25 3 25,00 10 83,33
28 2 16,67 12 100,00
Total 12 100,00

Classes:

Obs: um nr. não pode aparecer em dois intervalos.

Amplitude da classe se dá através da subtração do valor máximo com o valor


minimo.
Número de classes = Raiz de n
n = número de observações (conjunto de elementos).

Tamanho das classes, através do cálculo amplitude total dividido pelo número de
classes.

Pode arredondar o valor de k


Pelo menos 5 classes e no máximo 20.

Ex. de Tabela

Tabela 1: Distribuição do número de reclamações recebidos por uma


concessionária.

Nº Reclamações Frequência FR(%)


3 2 6,67
4 9 30,00
5 8 26,67
...
Total 30 100

Medidas Numéricas

Podemos enriquecer a descrição dos dados através de algumas medidas numéricas.

Medidas de posição ou Tendência central


- tem o objetivo de apresentar um ponto central em torno do qual
os dados se distribuem.
Há um ponto em que esses dados estão concentrados, qual é?
- média, mediana e moda

Medidas de dispersão
- servem para indicar o quanto os dados se apresentam dispersos
em torno da região central.
* A média é uma medida central em torno do qual os dados estão agrupados.
* Será que está havendo muita variabilidade dos dados em torno da média?
* Quem indica essa variabilidade dos dados em torno da média são as medidas
de dispersão.

Idade Frequência F.R.(%) xi X fi


18 1 8,33 18
19 1 8,33 19
21 1 8,33 21
22 2 16,67 44
24 2 16,67 48
25 3 25,00 75
28 2 16,67 56

Total 12 100 281

Média -> 281/12 = 23,41 anos

Moda - A resposta da pergunta, quem aparece com maior frequência?

Mediana -
Primeiro ordena.
Se n for par:
x + x
n/2 n/2 + 1
Md = -----------------------
2

Ex. n = 12

x + x
12/2 12/2 + 1

x x
6 + 7
--------------------- = 24 + 24 = 48 =
24 anos
2 2
2

Podemos afirmar que no mínimo 50% dos valores são maiores ou


iguais a 24 anos.

* a Média, Moda e Mediana não precisam ser iguais?


Não!

= > Média, Moda e Mediana para dados agrupados.

Quando não temos os dados brutos o resultado dos cálculos será um


aproximado.
* Precisaremos encontrar o Ponto Médio das Classes.
Vai fazer o papel do salário (Ex. do vídeo)

Moda:
1º passo é identificar a classe que contém a moda.

h * (Fm - Fa)
Mo = X0 + --------------------
2Fm - (Fa + Fp)

X0 = o limite inferior da classe que contém a moda;


Fm = frequência máxima;
Fa = frequência anterior à frequência máxima;
Fp = frequência posterior à frequência máxima;
h = amplitude da classe que contém a moda;

Salarios Nrº F.R.(%) x1


x1 X fi
Funcionários
750 |- 1062 22 55 906
19932
1062 |- 1374 4 10 1218
4872
1374 |- 1686 2 5 1530
3060
1686 |- 1998 6 15 1842
11052
1998 |- 2310 2 5 2154
4308
2310 |- 2622 4 10 2466
9864
Total 40 100
53088

* A classe que contém a moda é a classe de maior frequência.


X0 = 750 |- ; Fm = 22; Fa = 0; Fp = 4; h = 312 (1062 - 750)

312 * (22 - 0)
Mo = 750 + --------------------
2 * 22 - (0 + 4)

6864
Mo = 750 + ----------
40

Mo = 921,60

Mediana:

h * (Xm - Fiaa)
Me = Xe + --------------------
Fi

Xe = o limite inferior da classe que con~ém a mediana;


Xm = metade do valor da frequência total;
Fiaa = frequência acumulada da classe anterior à classe que contém a mediana;
Fi = número do observações na classe que contém a mediana;
h = amplitude da classe que contém a mediana.

1º passo é encontrar a frequência acumulada imediatamente superior à


Somatório de fi / 2

A frequência acumulada da primeira classe é a própria frequência. Então é


esse o intervalo que contém a mediana.

Medidas separatrizes

- Medidas de ordenamento

Usa se dados agrupados quando a tabela é muito extensa e quando no conjunto de


dados não há muita repetição dos números.

- Essas medidas de ordenamento fornecem uma ideia sobre a distribuição dos dados
ordenados.
Apresentam a vantagem de não serem afetadas por valores extremos.
* outlier - ponto discrepante nos dados.

Essas medidas são:

- Quartis;
- Decis;
- Percentis;

Quartis - Fórmula

- dividem a distribuição ordenada em quatro partes iguais.

Qnq = X nq x n + 1
------- ---
4 2

Q = quartil que se deseja obter;


X = Valor da posição que está o quartil;
nq = número do quartil que se deseja obter (1, 2 ou 3)
x = elemento da série ordenada
n = tamanho da amostra.

Ideia Quartil:

25% 25% 25% 25%


|----------|-----------|------------|-----------|
Q1 Q2 Q3

Q1 = 75% das observações são maiores ou iguais ao 1º Quartil.


25% das observações são menores ou iguais ao 1º Quartil.

Q2 = *É a própria mediana - 50% são maiores ou iguais ao valor da


mediana.

Q3 = Ele separa 25% das observações superiores das 75% inferiores.

Ex.
1 2 3 5 6 9

Qnq = X 1 x 6 + 1
------- ---
4 2

Qnq = X 6 + 1
------- ---
4 2

Qnq = X 6 + 1
------- --- = 1,5 + 0,5 = 2
4 2

Q1 = 2

Q2 = X 2 x 6 + 1
------- --- = 12/4 = 3 + 0,5 = 4 ===> Está entre
dois números, então basta somar e dividir por dois, igual método da mediana.
4 2

Q3 = X 3 x 6 + 1
------- --- = 18/4 = 4,5 + 0,5 = 5 ==> é o quinto
elemento do conjunto de dados ordenados. * Podem ser iguais.
4 2

Ex.
3 7 9 11 15

Q3 = X 3 x 5 + 1
------- --- = 15/4 = 3,75 + 0,5 = 4,25
4 2

11 15

x4 x4,25 x5

-> 4,25 - 4 = 0,25 0,25 x


---- = ---
-> 5 - 4 1 4 -> é o
resultado de 15 -11

x = 0,25 x 4 = 1

11 x=1 15

11 + 1 = 12 -> Então o Q3 = 12