Você está na página 1de 19

Estatística

Envolve técnicas para coletar, organizar,


descrever, analisar e interpretar dados,
provenientes de experimentos ou vindos
de estudos obseracionais.
Ciclo

Pesquisa

Dados

Informação

Novos
conhecimentos,
novos problemas
A essência de uma análise
estatística é tirar conclusões
sobre uma população, ou
universo, com base em uma
amostra de observações
POPULAÇÃO:
• Conjunto de elementos que formam o universo de
nosso estudo que são passíveis de observação,
sob as mesmas condições.

AMOSTRA:
• Parte dos elementos de uma população

AMOSTRAGEM:
• Processo de seleção da amostra.
AMOSTRAGEM ALEATÓRIA SIMPLES:
• O processo de seleção dos elementos é feito por sorteios, fazendo
com que todos os elementos da população tenham a mesma chance
de serem escolhidos.
Exemplo:
Considere uma indústria processadora de suco de frutas. Ao
receber um carregamento de laranjas, os técnicos fazem inspeção
de qualidade nas frutas. Examinam uma amostra de cinco caixas,
tomadas de forma aleatória dentre toda a população de caixas do
carregamento.

Algumas características (ou variáveis) podem ser observadas


nas cinco caixas de laranjas amostradas:
• Uma classificação: ótima, boa, regular, ruim ou péssima.
• Número de laranjas não aproveitáveis por caixa.
• Peso de cada caixa de laranja, etc.
Variável QUALITATIVA:
• Expressa uma qualidade ou atributo.

Variável QUANTITATIVA:
• Expressa por um valor em uma dada escala de medida.

Uma VARIÁVEL ALEATÓRIA pode ser entendida


como uma variável, cujo resultado depende de
fatores aleatórios.
• Ex. Variável (x) = número de laranjas não
aproveitáveis por caixa.
PARÂMETRO:
• uma medida que descreve certa característica dos
elementos da população

ESTATÍSTICA:
• Uma medida que descreve certa característica dos
elementos da amostra.

ESTIMATIVA:
• Valor resultante do cálculo de uma estatística,
quando usado para se ter uma ideia do parâmetro
de interesse.
Ex.

• Média do número de laranjas não aproveitáveis por caixa.

• Proporção do número de caixas classificadas como


ótima.

Quando esses valores são obtidos de amostas, são


chamados de estatísticas e quando obidos da população
são chamados de parâmetros.
MÉDIA
• Ao calcular a média, estamos um busca de um valor
de equilíbrio entre os dados.

0 2 3 8 12

Média = 5
(esse equilíbrio somente existiria se todos os valores fossem iguais)
Sejam 𝒏 observações de uma certa variável
𝑿: 𝒙𝟏 , 𝒙𝟐 , … , 𝒙𝒏 provenientes de uma AMOSTRAGEM.
𝒏
𝒙𝟏 + 𝒙𝟐 + ⋯ + 𝒙𝒏 𝟏
𝒙= = 𝒙𝒊
𝒏 𝒏
𝒊=𝟏

Sejam 𝑵 observações de uma certa variável


𝑿: 𝒙𝟏 , 𝒙𝟐 , … , 𝒙𝑵 provenientes de uma POPULAÇÃO com
𝑵 elementos:

𝑵
𝒙𝟏 + 𝒙𝟐 + ⋯ + 𝒙𝑵 𝟏
µ= = 𝒙𝒊
𝑵 𝑵
𝒊=𝟏

µ é geralmente estimado a partir de 𝒙.


VARIABILIDADE

0 2 3 8 12

𝑥=5

-2
-3

-5

7
Valor coletado Média
(𝑥𝑖 ) (𝑥) 𝑥𝑖 − 𝑥
0 5 -5
2 5 -3
3 5 -2
8 5 3
12 5 7

−𝟓 + −𝟑 + −𝟐 + 𝟑 + 𝟕
𝒗𝒂𝒓𝒊𝒂𝒃𝒊𝒍𝒊𝒅𝒂𝒅𝒆 = =𝟎
𝟓

−𝟓 + −𝟑 + −𝟐 + 𝟑 + 𝟕
𝒅𝒆𝒔𝒗𝒊𝒐 𝒂𝒃𝒔𝒐𝒍𝒖𝒕𝒐 = =𝟒
𝟓
Valor Média 𝐱𝐢 − 𝐱 𝟐

coletado (𝐱 𝐢 ) (𝐱) 𝐱𝐢 − 𝐱
0 5 -5 25
2 5 -3 9
3 5 -2 4
8 5 3 9
12 5 7 49

𝟐𝟓 + 𝟗 + 𝟒 + 𝟗 + 𝟒𝟗
𝒗𝒂𝒓𝒊â𝒏𝒄𝒊𝒂 = = 𝟐𝟒
𝟓−𝟏

No exemplo das laranjas, temos média de 5 laranjas e variância


de 24 laranjas ao quadrado

Embora o quadrado das variações represente uma medida RELEVANTE


nas análise estatísticaas, sua compreensão como unidade torna-se
difícil.
Valor Média 𝐱𝐢 − 𝐱 𝟐

coletado (𝐱 𝐢 ) (𝐱) 𝐱𝐢 − 𝐱
0 5 -5 25
2 5 -3 9
3 5 -2 4
8 5 3 9
12 5 7 49
𝟐𝟓+𝟗+𝟒+𝟗+𝟒𝟗
𝒗𝒂𝒓𝒊â𝒏𝒄𝒊𝒂 = = 𝟐𝟒(laranjas ao quadrado)
𝟓−𝟏

𝒔 = 𝟐𝟒 = 𝟒, 𝟗(laranjas)

Ao extrair a raiz quadrada obtemos o desvio padrão que


representa a média das variações em torno da média
POR QUE (5-1) NO DENOMINADOR
Uma população dispõe de (N) elementos. A média desses N
elementos é µ.
• Quando calculamos µ utilizamos somente números
pertencentes a população.
𝑵 𝟐
𝒊=𝟏(𝒙𝒊 −µ)
• Resultando em: 𝒗𝒂𝒓𝒊â𝒏𝒄𝒊𝒂 𝒑𝒐𝒑𝒖𝒍𝒂𝒄𝒊𝒐𝒏𝒂𝒍 = 𝝈𝟐 = que
𝑵
também utiliza apenas valores pertencentes a população.

Ao calcular a média amostral 𝒙 dispomos de n elementos oriundos


da população. (podemos dizer que trata-se de uma estimativa da
média populacional)

Já a variância e por consequência o desvio padrão para dados


amostrais sofrem influência da média amostral que não é um
elemento da população.

Ou seja, utilizamos uma (1) estimativa dentro do cálculo da


variância (ou do desvio padrão)
Quando operamos com n elementos provenientes da população
dizemos que o cálculo envolve n graus de liberdade (pois são n
números reais da população)

No caso das amostras, introduzimos no cálculo uma estimativa


( 𝑥 ), ou seja, um número que não é um dos elementos da
população. Isso nos leva a (n-1) graus de liberdade.

Então, em uma amostra, partimos de n graus de liberdade e a


medida que introduzimos estimativas nos cálculos, perdemos
graus de liberdade.
Justificativa numérica

Valor coletado Média


(𝑥𝑖 ) (𝑥) 𝑥𝑖 − 𝑥
0 5 -5
2 5 -3
3 5 -2
8 5 3
12 5 7

Como 𝑛𝑖=1 𝑥𝑖 − 𝑥 = 0 , no exemplo −5 + −3 + −2 + 3 + 7 = 0


Estabelecidas as diferenças de 4 dos cinco valores, a quinta diferença
fica determinada pois é um dos termos da soma zero.
Consequentemente se haviam n graus de liberdade na amostra, no
cálculo da variância (ou desvio padrão), serão (n-1) graus de liberdade
(pois um valor foi determinado pelos demais).
Justificativa algébrica

Ao solucionar uma equação linear, você tem


liberdade para “escolher” quantos dos “n” valores
que compõe a solução?

𝑥 + 𝑦 = 10 (se escolhemos um valor para x, “y” fica


automaticamente determinado)
𝑥 + 𝑦 + 𝑧 + 𝑡 = 12 (se escolhemos valores para x , y e t,
“z” fica automaticamente determinado)

Consequentemente, para n variáveis teremos (n-1)


graus de liberdade (temos a possibilidade de
escolher valores para (n-1) variáveis).
Maiores detalhes podem ser encontrados em
https://limnonews.wordpress.com/2014/08/14/o-que-sao-graus-de-liberdade/
Na POPULAÇÃO
𝒙 +𝒙 +⋯+𝒙𝑵 𝟏 𝑵
• µ= 𝟏 𝟐 = 𝒊=𝟏 𝒙𝒊
𝑵 𝑵
𝑵 𝟐
𝒊=𝟏(𝒙𝒊 − 𝒙)
• 𝝈𝟐 =
𝑵
𝑵 (𝒙 − 𝒙)𝟐
𝒊=𝟏 𝒊
• 𝝈=
𝑵

Na AMOSTRA
𝒙 +𝒙 +⋯+𝒙𝒏 𝟏 𝒏
• 𝒙= 𝟏 𝟐 = 𝒊=𝟏 𝒙𝒊
𝒏 𝒏

𝟏 𝒏
• 𝒔𝟐 = 𝒊=𝟏 𝒙𝒊 − 𝒙 𝟐
𝒏−𝟏

𝒏 𝒙𝒊 −𝒙 𝟐
𝒊=𝟏
• 𝒔=
𝒏−𝟏