Você está na página 1de 7

UNIVERSIDADE FEDERAL DE SANTA CATARINA

CENTRO TECNOLÓGICO
DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA

Graduanda: Juliana Kmiecik


Estados RJ x Mg (etanol)

Nessa primeira etapa optou-se por realizar a analise apenas das regiões
metropolitana dos estados de MG e RJ

UNIDADE II - P II - ESTUDO DE CASO E RELATÓRIO TÉCNICO:


PREÇOS DE COMBUSTÍVEIS.

Critério de Sturges:
K = 1 + 3,322*log(N)
N = número de elementos da amostra

Para ETANOL estado de MG: K = 10,1625 N = 573


Para ETANOL estado de RJ K = 9,7247 N = 423

Amplitude das Classes


c = Range / K
Para ETANOL estado de MG: c = 0,098, na qual utilizaremos 15 classes.
Para ETANOL estado de RJ: c=0,245, na qual utilizaremos 12 classes.

Pi = ni/n
(Número de elementos de cada intervalo/número de elementos total)

Xi = (Diferença dos limites de cada intervalo/2)


Média Ponderada = Xi * Pi
Soma dos Desvios = (Xi – Média Ponderada) * Pi
Variância = (Xi – Média Ponderada)2 * Pi

Através dos dados de frequência de cada intervalo podemos perceber


que o etanol no estado de MG com maior frequência foi no intervalo de 5,13 a
5,21 com 121 amostras, porém no estado do RJ esse valor já aumentou
consideravelmente (5,89-6,09] com 88 amostras .Para a formação dos
histogramas tomamos o critério de Sturges para determinar o número de
classes e outros parâmetros para determinar os dados.
Ramo - folha
RIO DE JANEIRO
ETANOL Dados Agrupados Dados Originais Erro Relativo
Média (R$) 6,063 6,098 0,567%
Mediana (R$) 5,990 5,990 0,000%
Moda (R$) 5,990 5,990 0,000%
Variância (R$)^2 0,1922 0,1854 3,704%
Desvio Padrão (R$) 0,4384 0,4305 1,835%
Coeficiente de Variação 0,0723 0,0706 2,416%
Erro Padrão da Média (R$) 0,0185 0,0182 1,835%
Assimetria 0,1666 0,2500 33,347%

MINAS GERAIS
ETANOL Dados Agrupados Dados Originais Erro Relativo
Média (R$) 5,076 5,081 0,090%
Mediana (R$) 5,090 5,090 0,000%
Moda (R$) 4,990 4,990 0,000%
Variancia (R$)^2 0,0747 0,0762 1,999%
Desvio Padrão (R$) 0,2733 0,2760 1,005%
Coeficiente de Variação 0,0538 0,0543 0,916%
Erro Padrão da Média (R$) 0,0116 0,0117 1,005%
Assimetria 0,3165 0,3298 4,039%
Juliana Kmiecik 17100628

Entrega dia 04/07/2022

Gráfico box plot

Foi realizada uma análise exploratória dos dados através da análise dos
Diagramas em Caixa (Box-plot). O boxplot é essencial na análise dos dados,
ele dá um resumo visual dos dados em análise, o que contribui para melhorar a
interpretação de dados, detectar os outliers, comparar grupos amostrais e
também apresenta várias características da variável analisada como a
mediana, quartis, simetria e variação.

Comparação entre os valores encontrados entre os valores de MG e RJ


para o Etanol Hidratado.

8 Boxplot etanol

7.5

7
Valor (R$) Etanol

6.5

5.5

4.5

4
RJ MG
Estados
Tabela de valores utilizados para a construção do gráfico boxplot

RJ MG
Valor mínimo 5,290 4,290
Q1 5,790 4,890
Q2 5,990 5,090
Q3 6,390 5,200
Valor máx. 7,680 5,990

BOX 1 5,790 4,890


BOX 2 0,200 0,200
BOX 3 0,400 0,110

Analisando o boxplot podemos observar que os valores de etanol entre


os estados são valores muitos discrepantes podendo chegar a um real quando
comparamos as médias dos dois estados. Também quando comparamos os
valores, o estado do RJ apresenta os valores mais discrepantes.

Foi encontrado um outlier superior e um inferior para o etanol do estado


de MG e RJ.
Os outliers são valores individuais atípicos que podem ter sido
ocasionados por erros na hora da coleta de dados ou caso esta etapa tenha
sido feita corretamente, representa um evento atípico.
Os outliers tem grande influência na distorção dos valores de tendência
central e de dispersão. Neste caso, apenas foram encontrados outliers
moderados.
Do ponto de vista do consumidor, o outlier pode tanto atrapalhar a
análise dos dados, como também pode ser aquilo que estamos em busca de
saber. Por exemplo, quando analisamos apenas a média dos valores dos
postos, os outliers contribuem negativamente, pois eles distorcem esses
valores, então temos dificuldade de encontrar um conjunto de dados que
representam exatamente a realidade dos preços naquela localidade na qual
estamos analisando.
Porém, o lado positivo deles aparecerem, é que muitas vezes o
consumidor não tem ideia se algum posto está praticando preços muito
abusivos ou que está com preços muito baixos, estes dados podem ajudar a
trazer o questionamento sobre a confiabilidades desses postos, ou também
sobre a confiabilidade dos dados, visto que os outliers também podem ser
obtidos por erros na hora da coleta ou na transmissão dos dados. O fato é que
se deve investigar mais a fundo o porquê dessas ocorrências e qual a razão de
elas estarem acontecendo, buscando sempre aprimorar a técnica de coleta e a

fiscalização dos postos.

Você também pode gostar