Você está na página 1de 54

ENG256 – MÉTODOS DE ADM

DE MINAS
Universidade Federal da Bahia
Felipe Bride
ESTATISTICA APLICADA: REVISAO

 Estatística é a ciência dos dados, envolvendo o desenvolvimento de


processos, métodos e técnicas de coleta, classificação, organização,
resumo, análise e interpretação de dados sobre uma população, e os
métodos de tirar conclusões ou fazer predições com base nesses dados.
ESTATÍSTICA APLICADA: REVISAO
ESTATÍSTICA APLICADA: REVISAO
 Estatística indutiva ou inferencial e/ou inferência estatística é um conjunto de
técnicas que, partindo de uma amostra, estabelece hipóteses, tira conclusões sobre
a população de origem, formula previsões fundamentando-se na teoria das
probabilidades, e baseia-se na análise e na interpretação dos dados.

 A estatística preditiva é uma área da estatística que utiliza modelos estatísticos e


algoritmos de aprendizado de máquina para fazer previsões futuras com base em dados
históricos. Ela é usada para identificar padrões nos dados e prever o comportamento
futuro de um fenômeno, com o objetivo de tomar decisões informadas.

 A estatística descritiva é usada para descrever e resumir dados, sem fazer


inferências sobre a população. Ela inclui medidas estatísticas como média, mediana,
moda, desvio padrão, variância, entre outras, e é usada para descrever
características de um conjunto de dados, como sua forma, dispersão e centralidade.
ESTATÍSTICA APLICADA: REVISAO

 A estatística tem a capacidade de sintetizar os dados;

 A amostragem é o ponto de partida (na prática) para todo um Estudo


Estatístico. É através da amostragem que obtemos os dados da medição
de determinada característica ou propriedade de um objeto, pessoa ou
coisa;
ESTATÍSTICA APLICADA: REVISAO

 População: é a coleção de todas as observações potenciais sobre


determinado fenômeno;

 Amostra: é o conjunto de dados efetivamente observados, ou extraídos;


ESTATÍSTICA APLICADA: REVISAO

 Cada observação individual ou item é denominada como unidade


elementar, que pode estar composta por um ou mais itens medidos,
propriedades, atributos, etc, denominados como variáveis.

 Variável é uma característica, propriedade ou atributo de uma unidade


da população, cujo valor pode variar entre as unidades da população.
ESTATÍSTICA APLICADA: REVISAO
ESTATÍSTICA APLICADA: REVISAO

Nominal
 Tipos de variável:

Qualitativa
Ordinal

Variável
Discreta

Quantitativa

Continua
ESTATÍSTICA APLICADA: REVISAO

 Exemplo: Para uma população de peças produzidos em um processo,


poderíamos ter:
ESTATÍSTICA APLICADA: REVISAO

 Agrupamento de dados e distribuição de frequências

 Quando vamos fazer um levantamento de uma população, um dos


passos é retirar uma amostra dessa população e obter dados relativos à
variável desejada nessa amostra;

 Cabe à Estatística sintetizar tais dados na forma de tabela e gráficos que


contenham, além dos valores das variáveis, o número de elementos
correspondentes a cada variável;
ESTATÍSTICA APLICADA: REVISAO

 A esse procedimento está associado o conceito de:

 Dados brutos: é o conjunto de dados numéricos obtidos que ainda não


foram organizados;

 Rol: é o arranjo dos dados brutos em ordem crescente (ou decrescente);

 Amplitude (H): é a diferença entre o maior e o menor dos valores


observados;

 Frequência absoluta (ni ): é o número de vezes que um elemento aparece


na amostra;
ESTATÍSTICA APLICADA: REVISAO
 n : número total de dados da amostra

 k : número de valores diferentes na amostra

 Frequência relativa (f i ):

 Frequência absoluta acumulada (Ni ): é a soma da frequência absoluta


do valor da variável i com todas as frequências absolutas anteriores;

 Frequência relativa acumulada (Fi)


ESTATÍSTICA APLICADA: REVISAO
 Exemplo: Os seguintes dados foram amostrados do números de negócios
efetuados diariamente por um operador financeiro:

 População: Número de negócios efetuados diariamente

 Dados brutos: {14, 12, 13, 11, 12, 13, 16, 14, 14, 15, 17, 14, 11, 13, 14, 15, 13,
12, 14, 13, 14, 13, 15, 16, 12, 12}

 Rol: {11, 11, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14,14,
15,15,15, 16,16, 17}

 Amplitude: 17 – 11 = 6

 n = 26 observações
ESTATÍSTICA APLICADA: REVISAO
ESTATÍSTICA APLICADA: REVISAO
ESTATÍSTICA APLICADA: REVISAO
 Exercício: A Gerência de Operação de Mina está buscando entender as
principais causas de perda de produção dos equipamentos de carga
(Escavadeiras Hidráulicas). Abaixo tem-se as principais paradas operacionais
destes equipamentos.
 EH-01 : Horas em operação no mês = 504 horas
 Paradas Operacionais EH-01: 32 horas = acerto de praça ; 12 horas =
aguardando caminhão ; 5 horas = troca de turno ; 2 horas = mal tempo;
 EH-02 : Horas em operação no mês = 330 horas
 EH-02: 21 horas = sem frente disponível; 4 horas = acerto de praça; 9 horas =
aguardando caminhão; 6 horas = mal tempo;

 Qual foi a principal causa de perda de produção da mina? Quais são os tipos
de variáveis? É possível determinar o numero total de observações? Qual a
amplitude ?
ID TEMPO (h) CAUSA
 DADOS BRUTOS: EH-01 32 ACERTO DE PRAÇA
EH-01 12 AGUARDANDO CAMINHAO
EH-01 5 TROCA DE TURNO
EH-01 2 MAL TEMPO
EH-02 21 SEM FRENTE DISPONÍVEL
EH-02 4 ACERTO DE PRAÇA
EH-02 9 AGUARDANDO CAMINHAO
EH-02 6 MAL TEMPO

CAUSA (VARIÁVEL TEMPO (h) (FREQUENCIA TEMPO (h) (FREQUENCIA TEMPO (h) (FREQUENCIA
ID (VARIÁVEL NOMINAL)
NOMINAL) ABSOLUTA) RELATIVA) RELATIVA ACUMULADA)

EH-01 ACERTO DE PRAÇA 32 35% 35%


EH-02 SEM FRENTE DISPONÍVEL 21 23% 58%
EH-01 AGUARDANDO CAMINHAO 12 13% 71%
EH-02 AGUARDANDO CAMINHAO 9 10% 81%
EH-02 MAL TEMPO 6 7% 88%
EH-01 TROCA DE TURNO 5 5% 93%
EH-02 ACERTO DE PRAÇA 4 4% 98%
EH-01 MAL TEMPO 2 2% 100%
TOTAL 91 1

Temos variáveis 2 nominais. Não é possível determinar o número total de observações,


nem a amplitude
PARADAS OPERACIONAIS: EQUIPAMENTOS DE CARGA
36

21 21

8
5

ACERTO DE PRAÇA AGUARDANDO CAMINHAO SEM FRENTE DISPONÍVEL MAL TEMPO TROCA DE TURNO

PARADAS OPERACIONAIS: FREQUENCIA ACUMULADA

100,0%
94,5%
85,7%

62,6%
39,6%

ACERTO DE PRAÇA AGUARDANDO CAMINHAO SEM FRENTE DISPONÍVEL MAL TEMPO TROCA DE TURNO
N ID do Furo Mineralizaçao de Au (m) 26 AFL-26 17,00
1 AFL-01 49,00 27 AFL-27 58,00
2 AFL-02 39,00 28 AFL-28 27,00
3 AFL-03 52,00 29 AFL-29 15,00
4 AFL-04 21,00 30 AFL-30 26,00
5 AFL-05 64,00 31 AFL-31 56,00
6 AFL-06 26,00 32 AFL-32 27,00
7 AFL-07 50,00 33 AFL-33 35,00
8 AFL-08 57,00 34 AFL-34 19,00
9 AFL-09 19,00 35 AFL-35 28,00
10 AFL-10 60,00 36 AFL-36 47,00
11 AFL-11 52,00 37 AFL-37 35,00
12 AFL-12 62,00 38 AFL-38 14,00
13 AFL-13 51,00 39 AFL-39 14,00
14 AFL-14 14,00 40 AFL-40 43,00
15 AFL-15 36,00 41 AFL-41 40,00
16 AFL-16 52,00 42 AFL-42 55,00
17 AFL-17 60,00 43 AFL-43 57,00
18 AFL-18 60,00 44 AFL-44 63,00
19 AFL-19 54,00 45 AFL-45 30,00
20 AFL-20 35,00 46 AFL-46 49,00
21 AFL-21 30,00 47 AFL-47 46,00
22 AFL-22 55,00 48 AFL-48 26,00
23 AFL-23 42,00 49 AFL-49 43,00
24 AFL-24 17,00
50 AFL-50 14,00
25 AFL-25 33,00
ESTATÍSTICA APLICADA: REVISAO
 Classes
 As classes são um artifício para condensar o número de elementos
diferentes de uma amostra. Imagine construir uma tabela para 200 valores
diferentes, nos moldes do problema anterior.
 Os principais pré-requisitos para uma boa definição de classes em um
conjunto de dados são:
 a) as classes devem abranger todas as observações;
 b) o extremo superior de uma classe é o extremo inferior da classe
subsequente (simbologia: | , intervalo fechado à esquerda e aberto à
direita);
 c) cada valor absoluto deve enquadrar-se em apenas uma classe;
 d) k <= 25, de modo geral, sendo k o número de classes;
 e) As unidades das classes devem ser as mesmas dos dados.
ESTATÍSTICA APLICADA: REVISAO
 Classes
 Cálculo de k (Formas de calcular) :

Obs.: N é o número de elementos diferentes da amostra e, muitas vezes, pode ser


considerado N = n (no. de observações).

Intervalo da classe (h): h = aproximadamente H/k

Ponto médio da classe (xi ) : Ponto médio entre o limite inferior e o limite superior de
cada classe.
ESTATÍSTICA APLICADA: REVISAO
 Exemplo: Utilizando os dados do exemplo anterior, temos:
ESTATÍSTICA APLICADA: REVISAO
 Medidas de Posição
 Mostram o valor representativo em torno do qual os dados tendem a
agrupar-se com maior ou menor frequência
ESTATÍSTICA APLICADA: REVISAO
 Exemplo:
 Os dados {11, 13, 15, 17, 19} apresenta a seguinte média (n=5, pois temos
cinco números) :

 • Se um aluno obteve as notas {7, 10, 6, 8} com pesos {1, 2, 2, 3}, qual será
a nota final do aluno:
ESTATÍSTICA APLICADA: REVISAO

 Propriedades:

 A soma dos desvios é sempre igual a zero

 A soma dos quadrados dos desvios das observações de uma série é


sempre um valor mínimo
ESTATÍSTICA APLICADA: REVISAO
 Exemplo: Qual a média do número de operações fechadas por dia:
ESTATÍSTICA APLICADA: REVISAO
 Média aritmética ponderada para dados agrupados em classes:
ESTATÍSTICA APLICADA: REVISAO
ESTATÍSTICA APLICADA: REVISAO
Exemplo: Calcule a média da tabela abaixo:

•Observe que o resultado apresentou uma pequena diferença do anterior (2,8% maior que
13,54 ). A precisão dos dados na tabela em classes diminuiu pouco em relação aos dados
originais.
Exercício: organizar em classes os dados
coletados de mineralização de Au

 Calcular o k ( quantidade de classes);


 Calcular o h (intervalo da classe);
 Compor a tabela em classes;
 Calcular a média através das classes;
Exercício: organizar em classes os dados
coletados de mineralização de Au
Valor Max 65,0
Valor Min 11,0
Média 39,48 m Dados brutos
Amplitude (H) 50 m

k 5,954 5,60 5,644 6


h 8,3 m

xi ni fi
Classe Limite Inf Limite Sup Valor Médio Freq Absoluta Freq. Relativa xi *ni xi *fi
1 14,0 22,3 18,2 10 20,0% 181,7 3,6
2 22,3 30,7 26,5 8 16,0% 212,0 4,2
3 30,7 39,0 34,8 6 12,0% 209,0 4,2
4 39,0 47,3 43,2 6 12,0% 259,0 5,2
5 47,3 55,7 51,5 10 20,0% 515,0 10,3
6 55,7 64,0 59,8 10 20,0% 598,3 12,0
soma 50 1975,0 39,50

X médio 39,50
ESTATÍSTICA APLICADA: REVISAO
Mediana: É o valor do meio de um conjunto de dados, quando os dados estão
dispostos em ordem crescente ou decrescente, ou seja, o Rol de Dados.
ESTATÍSTICA APLICADA: REVISAO
 Exemplo:
 Qual a mediana dos dados abaixo:
 Dados brutos: {14, 12, 13, 11, 12, 13, 16, 14, 14, 15, 17, 14, 11, 13, 14, 15, 13,
12, 14, 13, 14, 13, 15, 16, 12, 12}
 Rol: {11, 11, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14,14,
15,15,15, 16,16, 17}
 n = 26 observações (par)
 A mediana dos dados é 13,5.
ESTATÍSTICA APLICADA: REVISAO
Exemplo: Calcule a mediana da tabela abaixo:

A mediana estará na faixa de 13 a 15, pois temos no total 26 observações e mediana


encontra-se no meio (13º termo) (aqui não iremos calcular a média entre o 13º e o 14º -
Verique !).
ESTATÍSTICA APLICADA: REVISAO
Exemplo: Calcule a mediana da tabela abaixo:

Li é o limite inferior da classe onde está a mediana,


P é a posição da mediana no conjunto total dos dados (chamado de posto
da mediana),
fai é a freqüência acumulada até a classe anterior à classe onde está a
mediana,
h é a largura do intervalo de classe e fm é a freqüência da classe onde está
a mediana.
fm é a freqüência da classe onde está a mediana.

Mediana = 13 + (13 – 7) x 2/13 = 13,92


ESTATÍSTICA APLICADA: REVISAO
Exemplo: Moda ou classe modal (mo ):

• É o valor que representa a maior frequência em um conjunto de


observações individuais. Em alguns casos, pode haver mais de uma
moda.:
Classe modal

Para se calcular a moda,


basta obter o ponto
central do intervalo de
maior frequência

Moda =(13+15)/2 = 14
ESTATÍSTICA APLICADA: REVISAO
 Média:
• Sensível a valores extremos de um conjunto de observações
• Usa todos os dados disponíveis

 Mediana
• “Robusta” : Não sofre muito com a presença de alguns valores muito
altos ou muito baixos
• Não usa todos os dados disponíveis

 Moda
• Não é afetada por valores extremos
• Não usa todos os dados disponíveis
ESTATÍSTICA APLICADA: REVISAO
 Percentil: são medidas que dividem a amostra (por ordem crescente dos dados)
em 100 partes, cada uma com uma percentagem de dados aproximadamente
igual. O k-ésimo percentil Pk é o valor x (xk) que corresponde à frequência
cumulativa de N .k/100, onde N é o tamanho amostral.

 Percentil: De forma geral, o percentil de um conjunto de valores postos em


ordem crescente é um valor que contém p% das observações abaixo
dele.
Os percentis de ordem 25, 50 e 75 são chamados de quartis. Os decis são
os percentis de ordem 10, 20, ..., 90.

 Portanto:
• o 1º percentil determina o 1% menor dos dados;
• o 98º percentil determina os 98% menores dos dados.
 O 25º percentil é o primeiro quartil; o 50º percentil é a mediana. De igual forma, o
10º percentil é o primeiro decil e o 80º percentil é o oitavo decil.
ESTATÍSTICA APLICADA: REVISAO
ESTATÍSTICA APLICADA: REVISAO
 Exemplo:
 Calcular o percentil de ordem 50 (2º Quartil
ESTATÍSTICA APLICADA: REVISAO
 Exemplo:
 Calcular o percentil de ordem 50 (2º Quartil)
X n n Acumulado f f Acumulada

1,810 1,822 7 7 14,0% 14,0%


1,822 1,834 14 21 28,0% 42,0%
1,834 1,846 18 39 36,0% 78,0%
1,846 1,858 7 46 14,0% 92,0%
1,858 1,87 4 50 8,0% 100,0%
ESTATÍSTICA APLICADA: REVISAO
 Medidas de Dispersão ou Variabilidade
 As medidas de dispersão possuem a finalidade de verificar quanto os
valores da série estão distantes da média da série. O principal meio de
calcular a variabilidade é através da variância, que é calculada pela
fórmula abaixo:

Onde n é o número de observações, X a média e xi são os valores


individuais. Esta fórmula é valida para população. Para amostra deve-se
considerar n-1 ao invés de n.
ESTATÍSTICA APLICADA: REVISAO
 Exemplo:
 Os dados {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} apresentam qual média, variância e
desvio padrão ?
 A sequência apresenta n=10 números. A média é igual a soma dos valores
dividido pelo número de elementos. A variância é calculados na
sequência:
ESTATÍSTICA APLICADA: REVISAO
 Para calcular a variância quando os dados estiverem dispostos em classes
deve-se utilizar a seguinte fórmula:

 k é o número de classes, ni é a frequência absoluta, n o número de


observações e f i a frequência relativa;

 Quando extraímos a raiz quadrada da variância, obtemos o desvio


padrão (s).
 Uma observação importante é que a variância possui as unidades dos
dados individuais elevado ao quadrado, enquanto que o desvio padrão e
média possuem mesma unidade.
ESTATÍSTICA APLICADA: REVISAO
 Exemplo: Calcular a variância e desvio padrão dos dados abaixo:

Iremos realizar os cálculos na


forma de tabela, porque os
dados ficam mais
organizados e os cálculos
mais fáceis de serem
entendidos.
ESTATÍSTICA APLICADA: REVISAO

Variância = 0,00187
Desvio padrão = (0,00187)^0,5 = 0,43
CV = s/x x 100% = 0,43/1,84 = 2,4%
ESTATÍSTICA APLICADA: REVISAO
 Outra forma de expressar a dispersão dos dados é através do Coeficiente
de Variação (CV), que é dado pela fórmula:

 onde s é o desvio padrão, e x é a média.

 O Coeficiente de Variação dá uma indicação de quanto os dados estão


dispersos em torno da média. Quanto maior o valor de CV, maior a
dispersão.
ESTATÍSTICA APLICADA: REVISAO
 Exemplo:
 No exemplo de cálculo de variância e desvio padrão, obtivemos os
valores 8,25 e 2,87 respectivamente.
 A média tinha resultado em 5,5 O valor do Coeficiente de Variação será:

 Um valor de 52% indica que os dados estão muito dispersos com relação a
média.
 Por exemplo, os dados {5,1; 5,2; 5,3; 5,4; 5,5; 5,6; 5,7; 5,8; 5,9; 6,0}
apresentam média: 5,55; desvio-padrão: 0,29 e CV = 5% (Confira!)
ESTATÍSTICA APLICADA: REVISAO
 Covariância: Mede a correlação (dependência) linear entre duas
variáveis x e y. É calculada como:

 A covariância entre as mesmas variáveis, isto é, Cov(x, x) por exemplo, é


igual a própria variância Var(x) = s 2 .
ESTATÍSTICA APLICADA: REVISAO
 Os seguintes valores de covariância dão uma indicação se os valores são
independentes, ou possuem correlação positiva ou negativa.

 Cov(x, y) = 0 Variáveis independentes

 Cov(x, y) > 0 Correlação linear positiva

 Cov(x, y) < 0 Correlação linear negativa


ESTATÍSTICA APLICADA: REVISAO

 Na prática quando as variáveis são independentes o valor da covariância


resulta em um valor próximo de 0 (entre -3 a 3), mas não sendo estes
valores fixos e, portanto, é sempre recomendável considerar o gráfico das
variáveis x e y para uma avaliação conjunta.
ESTATÍSTICA APLICADA: REVISAO
 Exemplo: Calcular a covariância dos dados abaixo, e verifique se a
correlação é positiva ou negativa.
ESTATÍSTICA APLICADA: REVISAO
Cov = 209,4 – 12,8 x 17,2 = - 10,76

A covariância resultou em um valor


negativo, indicando uma correlação
linear negativa que podemos
confirmar pelo gráfico.

Você também pode gostar