Você está na página 1de 72

Introdução à Estatística

Visão geral da Estatística


Dados
Definição
Os dados consistem em informações provenientes de
observações contagens, medidas ou respostas.
Estatística é a ciência que se ocupa de colectar,
organizar, analisar e interpretar dados afim de tomar
decisões.

1
Definição de Estatística

A estatística é um conjunto de técnicas que permite,de


forma sistemática, organizar, descrever, analisar e
interpretar dados oriundos de estudos ou
experimentos, realizados em qualquer área do
conhecimento.

2
Áreas da Estatística

1. Estatística Descritiva


2. Probabilidade
3. Inferência estatística

3
ESTATÍSTICA DESCRITIVA

A estatística descritiva é a etapa inicial da análise


utilizada para descrever e resumir os dados. A
disponibilidade de uma grande quantidade de dados
e de métodos computacionais muito eficientes
revigorou está área da estatística.

4
PROBABILIDADE

A teoria de probabilidades nos permite


descrever os fenômenos aleatórios, ou
seja, aqueles em que está presente a
incerteza.

5
INFERÊNCIA ESTATĺSTICA

É o estudo de técnicas que possibilitam a


extrapolação, a um grande conjunto de dados, das
informações e conclusões obtidas a partir da amostra.

6
AMOSTRAGEM

Uma área importante em muitas aplicações


estatísticas é a da Tecnologia de Amostragem.
Exemplos de Aplicação:
• Pesquisa de mercado,
• Pesquisa de opinião,
• Avaliação do processo de produção,
• Praticamente em todo experimento.

7
Estatística Descritiva
O que fazer com as informações que colectamos?
Primeira Etapa
 resumo de dados = Estatística Descritiva

8
Variável

Qualquer característica associada a uma população


População é o conjunto de todos os resultados,
respostas , medidas ou contagens que são de interesse.
Amostra é o subconjunto de uma população.

9
Classificação de variáveis

10
11
Cont.

12
13
14
15
16
17
18
19
Dados agrupados em classe

20
Cont.

21
22
23
24
Variáveis Quantitativas

MEDIDAS DE POSIÇÃO: Moda, Média, Mediana,


Percentís,
Quartis.
MEDIDAS DE DISPERSÃO: Amplitude, Intervalo-
Interquartil,
Variância, Desvio Padrão, Coeficiente de Variação.

25
Medidas de Posição

Moda(mo): É o valor (ou atributo) que


ocorre com maior freqüência.
Moda
Ex: 4,5,4,6,5,8,4,4
Mo = 4

26
Moda
Quando temos dados agrupados em classe, a moda é
calculada por aproximação, começando por localizar a
classe modal, se necessário deve-se conhecer a moda
bruta. A moda bruta é o ponto médio da classe que
contém a moda (classe modal) ou a classe com maior
frequência absoluta. A fórmula de Czuber é uma das
alternativas para calcular o valor da moda com
aproximação.

27
Moda
 
Onde:
 – Limite inferior da classe modal
– frequência absoluta da classe modal (= )
 – frequência absoluta anterior a classe modal
 – frequência absoluta posterior a classe modal e
 – amplitude do intervalo de classe da classe modal

28
Moda
 Uma outra alternativa de calcular a moda com
aproximação é usar a fórmula de King:

29
Média

30
31
Média ,Mediana

Ex:2,5,3,7,8
Média = [(2+5+3+7+8)/5]=5
A mediana é o valor da variável que ocupa a posição
central de um conjunto de n dados ordenados.
Posição da mediana: (n+1)/2
Ex: 2,5,3,7,8
Dados ordenados: 2,3,5,7,8 => (5+1)/2=3
=> Md = 5

32
Mediana
Ex: 3,5,2,1,8,6
Dados
ordenados:1,2,3,5,6,8
=>
(6+1)/2=3,5 => Md=(3+5)/2=4

33
34
35
36
Mediana

37
Quartis,
 Os quartis - para c = 1, 2, 3 dividem o conjunto de
dados ou distribuições de frequências em 4 partes
iguais

0% 25% 50% 75% 100%


  Q1 Q2 Q3  

38
Quartis

39
Quartis
 – é um valor tal que 25% das observações são menores
que este e 75% são superiores.
 – coincide com a mediana e deixa 50% dos elementos
em cada um dos subconjuntos
 - é um valor tal que 75% das observações são menores
e 25% são maiores que este.

40
Quartis
 Para dados não agrupados as posições onde se
encontram os elementos pertencentes aos quartis
podem ser determinados pelas fórmulas:

41
Quartis
Para
  dados agrupados em classe, pode-se calcular com
aproximação o quartil de ordem c, usando a fórmula.

Onde:
C – é a ordem do quartil
 – limite inferior da classe onde existe o quartil
 – frequência acumulada até a classe anterior onde existe
o quartil
 – frequência absoluta da classe onde existe o quartil
 – amplitude da classe onde existe o quartil
42
Quartis
 Onde:
C – é a ordem do quartil
 – limite inferior da classe onde existe o quartil
 – frequência acumulada até a classe anterior onde
existe o quartil
 – frequência absoluta da classe onde existe o quartil
 – amplitude da classe onde existe o quartil

43
Cont.

44
Cont.

45
Cont.

46
Decis
 Os decis são separatrizes (separadores) que dividem
as observações em 10 partes iguais:

0 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

D0 D1 D2 D3 D4 D5 D6 D7 D8 D9  

47
Decis
 A fórmula básica para determinar a posição do
elemento decil para dados não agrupados é:

Quando os dados estão agrupados em classe a fórmula


é semelhante as anteriores

48
Percentil
 Os Percentis - são separadores que dividem as
observações em 100 partes iguais.

0% 1% 2% 3% ............ ............ ............ ………… 98% 99% 100%


.

  P1 P2 P3 ............ ............ ............ ............ P98 P99


 

49
Percentil
 Para calcular o percentil de ordem c basta usar a
fórmula de aproximação quando temos dados
classificados.

50
Medidas de Dispersão

 Variância e desvio padrão


 
Variância ou dispersão de um conjunto de números, é
a medida aritmética dos quadrados dos desvios
absolutos desses números em relação a sua média
aritmética.

51
Variância e desvio padrão

 Quando os dados observados estiverem agrupados em


uma distribuição de frequências a fórmula da variância
assume o seguinte aspeto.

52
Desvio padrão
 Desvio padrão – é a medida de dispersão mais usada
ela é definida como a raiz quadrada positiva de média
aritmética dos quadrados dos desvios dos valores
observados em relação a grandeza média. As fórmulas
para o cálculo estão abaixo conforme o tipo de dados
 ou

53
Desvio padrão
  ou

54
Cont.
 
Quando se trabalha com uma amostra e não com uma
população, caso não mais frequente na inferência
estatística, ou quando o número das unidades
observadas não é muito elevado (n < 30), para obter
uma melhor estimativa use-se o desvio padrão
corrigido s ou .

55
 

56
Amplitude e amplitudes interquartis

57
Coeficiente de Variação

Os coeficientes de variação são medidas de variação


relativas que muitas vezes são expressas em
percentagem. Elas resultam do quociente entre uma
medida de dispersão absoluta e uma medida de
tendência central.

58
Coeficiente de Variação

 Quando a dispersão absoluta é igual ao desvio padrão


e a medida de tendência central é a média aritmética, a
dispersão relativa é denominada coeficiente de
variação de Pearson (Cv). Este é o coeficiente mais
vulgar e é o mais utilizado designando-se
simplesmente de coeficiente de variação ou coeficiente
de dispersão.
 ou

59
Medidas de Forma de distribuição

medidas de assimetria e curtose


As características mais importantes neste grupo são o
grau de deformação ou assimetria e o grau de
achatamento da curva de distribuição de frequências
ou do histograma.

60
medidas de assimetria e curtose

 Chama-se momento natural de ordem r, de um


conjunto de números ao valor dado pela fórmula.
 ou onde
O momento natural da primeira ordem (r = 1), é igual
a média aritmética .

61
medidas de assimetria e curtose
 Chama-se momento centrado na média de ordem
r, ao momento definido pela fórmula.
 ou
O segundo momento centrado na média (r = 2) é igual
a variância

62
Assimetria de uma distribuição e seus coeficientes

Chama-se assimetria, ao grau de desvio ou


afastamento de uma curva de distribuição de
frequências em relação a reta de simetria da
distribuição normal.

63
 Uma curva de distribuição é simétrica quando: .
Uma curva de distribuição tem simetria negativa ou à
esquerda quando: ou
Uma curva de distribuição tem simetria positiva ou à
direita quando: ou

64
Coeficiente de assimetria
 Coeficiente de assimetria: Karl Pearson,
desenvolveu uma fórmula empírica da relação entre as
três medidas de localização: a média (ponto de
equilíbrio), a moda (ponto de máxima frequência) e a
mediana (ponto do meio): .

65
Coeficiente de assimetria
 Para medir ou avaliar o grau de assimetria são
utilizados o primeiro e segundo coeficientes de
assimetria de Pearson.

 ou

66
Coeficiente de assimetria
Calculado o coeficiente de assimetria, importa
conhecer apenas o sinal do coeficiente quando não se
necessita a extensão da assimetria apresentada pela
curva.
Se CS < 0, temos assimetria negativa,
Se CS = 0, temos uma curva simétrica e
Se CS > 0, temos assimetria positiva

67
Coeficiente de assimetria
 Importa também referir que o grau de assimetria pode
ser classificado conforme a escala apresentada
independentemente de ser positiva ou negativa.
Se tivermos -0,15 < CS < +0,15 pequena assimetria
Se tivermos -1 CS -0,15 ou 0,15 CS 1, assimetria
moderada
Se tivermos CS < -1 ou CS > 1, assimetria elevada

68
Curtose de uma distribuição e seus coeficientes

Denomina-se curtose ao grau de achatamento de uma


distribuição em relação a uma distribuição padrão,
denominada curva normal (curva correspondente a
uma distribuição teórica de probabilidade).

69
Curtose de uma distribuição e seus coeficientes

Quando a distribuição apresenta uma curva de


frequência mais fechada que a normal (ou mais aguda
ou afiada em sua parte superior), ela recebe o nome de
léptocúrtica. Quando a distribuição apresenta uma
curva de frequência mais aberta que a normal (ou mais
achatada em sua parte superior), ela recebe o nome de
platicúrtica. E a curva normal, que é base de
referência, recebe o nome de mesocúrtica.

70
Curtose de uma distribuição e seus coeficientes

 Coeficiente de curtose: o coeficiente de curtose é


calculado com base numa das fórmulas abaixo.
 ou

71
Curtose de uma distribuição e seus coeficientes

Dependendo do coeficiente calculado a escala de


comparação para se definir o tipo de curtose da
distribuição de frequência na forma analítica poderá
ser:
Para a expressão de C1 Para a expressão de CC

< 0,263 curva platicúrtica CC < 3 curva platicúrtica

= 0,263 curva mesocúrtica CC = 3 curva mesocúrtica

> 0,263 curva leptocúrtica CC > 3 curva leptocúrtica

72

Você também pode gostar