Você está na página 1de 7

O USO DE MACHINE LEARNING NA INDÚSTRIA VINÍCOLA

A influência das características físico-químicas e sensoriais na


classificação do vinho

GARRONI, Leonardo Caixeta¹


UNIVERSIDADE JOSÉ DO ROSÁRIO VELLANO - UNIFENAS

CRUZ, Lucas Pereira da1


SANTOS, Flávia Aparecida Oliveira²

1
Discente – Ciência da Computação - Universidade José do Rosário Vellano
2
Docente – Ciência da Computação - Universidade José do Rosário Vellano
RESUMO

A partir de uma base de dados contendo duas wines was explored. The objective is to make the
variantes de vinhos, sendo eles, tinto e branco, foi quality of the wine, analyze twelve attributes
utilizada uma técnica na área de Inteligência existing in the database. To run the experiments,
201
/AB

9.
R

Artificial, chamada Machine Learning. Nessa it was used in the Weka 3.8.5 software. The
técnica, foi explorado o modelo de Classificação results obtained were compared with the
com base nas características físico-químicas dos classification previously made by experts.
vinhos. O objetivo é fazer previsões da qualidade
do vinho, analisando doze atributos existentes na Keywords
base de dados. Para executar os experimentos, foi Machine Learning, Classification, Supervised
usado o software Weka 3.8.5. Os resultados Learning
obtidos foram comparados com a classificação
feita previamente por especialistas.
1 INTRODUÇÃO
Palavras-chave
Machine Learning, Classificação, Aprendizado
Supervisionado
Durante o advento da pandemia da Covid-19, no
ABSTRACT ano de 2020, muitas mudanças aconteceram no
cenário mundial. Com a crise da situação
From a database containing two wine variants,
red and white, an Artificial Intelligence econômica e, consequentemente, com a
technique, called Machine Learning, was used.
desvalorização da moeda, as atividades de lazer
In this technique, the classification model based
on the physical-chemical characteristics of the de menor custo e com menor quantidade de

Pág. 20
Número 2, Volume 16, dez 2021
pessoas aglomeradas têm se destacado. Uma Neste trabalho, foi aplicada a técnica de
dessas atividades é a apreciação de vinhos. regressão para prever a qualidade do vinho tinto
Conforme informações do Ministério do e vinho branco (FORTI, 2018). Foi utilizada uma
Turismo (2020), a tecnologia e a industrialização base de dados que contém as características
tiveram uma grande importância para o aumento físico-químicas do vinho, por exemplo, valor de
da quantidade de vinho produzido. PH, acidez volátil e acidez fixa, além da sua
Um dos grandes desafios para os classificação de qualidade.
UNIVERSIDADE JOSÉ DO ROSÁRIO VELLANO - UNIFENAS

apreciadores de vinho é selecionar qual produto O algoritmo de classificação por árvore de


adquirir, considerando suas preferências de decisão foi utilizado para processamento dos
durabilidade e tempo para consumo. Segundo dados. Algoritmos que induzem árvores de
CARVALHO (2019), atualmente os vinhos decisão pertencem a família de algoritmos Top
tintos elaborados no Vale do São Francisco têm Down Induction of Decision Table - TDIDT
sido indicados para o rápido consumo, pois o (MONARD; BARANAUSKAS, 2003, p. 60).
mesmo não é apto ao envelhecimento. Tal Uma árvore de decisão é uma estrutura de
problemática deve-se às elevadas concentrações dados definida recursivamente como:
de potássio nos solos, que é transferido à bebida. ● um nó folha que corresponde a uma
Isso resulta em alto valor de pH e acidez titulável classe ou;
inferior nos vinhos, promovendo maior ● um nó de decisão que contém um teste
201
/AB

suscetibilidade do vinho a alterações químicas e sobre algum atributo. Para cada


9.
R

microbiológicas, além de sedimentação na resultado do teste existe uma aresta para


garrafa e modificação na coloração do vinho uma subárvore. Cada subárvore tem a
(CARVALHO et al, 2019) . mesma estrutura que a mesma.
Para adquirir o melhor vinho de acordo com
suas preferências pessoais, os apreciadores Para comparação dos resultados, foi utilizada a
devem conhecer e analisar suas características classificação feita por profissionais da área, que
físico-químicas, de forma a dar suporte à sua atribuíram notas entre 0 e 10, sendo 0 muito ruim
decisão. Dessa forma, um ponto a se destacar é a e 10 excelente (CORTEZ et al., 2009). Com este
aplicação da técnica de Inteligência Artificial, trabalho, espera-se aplicar os algoritmos
chamada Machine Learning, que pode ajudar a funcionais de machine learning na seleção dos
classificar a qualidade do vinho a partir da melhores vinhos, além de contribuir com a
análise inteligente de suas características físico- indústria na melhoria da qualidade dos vinhos
químicas (COSTA, 2016). produzidos.

Pág. 5
Número 2, Volume 16, dez 2021
2 METODOLOGIA maior será a dificuldade para as
bactérias acéticas se desenvolverem.
A técnica de machine learning para classificação • Acidez volátil. É a soma dos ácidos
foi utilizada na análise da base de dados. Foram voláteis, que se libertam por forma de
utilizados todos os atributos físico-químicos da ebulição ou destilação do vinho e traduz
base de dados para treinamento do modelo de o nível de ataque aceto bacteriano ao
classificação. Além da previsão da qualidade do vinho. O valor máximo permitido por
UNIVERSIDADE JOSÉ DO ROSÁRIO VELLANO - UNIFENAS

vinho, também foram obtidas análises gráficas lei é de 1,2 gramas de ácido acético por
dos dados. litro de vinho.
Os atributos do vinho presentes na base de • Ácido cítrico. É um ácido orgânico
dados são: acidez fixa, acidez volátil, ácido forte, normalmente presente em fracas
cítrico, açúcar residual, cloretos, dióxido de quantidades nos mostos de uva e
enxofre livre, dióxido de enxofre total, geralmente ausente nos vinhos. A sua
densidade, pH, sulfatos, álcool e a classificação concentração aumenta ligeiramente a
da qualidade. fermentação do álcool no vinho. A
De acordo com as questões de privacidade e adição do ácido cítrico é degradável
logística, apenas as variáveis físico-químicas pela grande maioria das bactérias
(entradas) e sensoriais (saída) estão disponíveis. lácticas do vinho.
201
/AB

Dessa forma, não há dados sobre os tipos de uva, • Açúcar residual. A concentração
9.
R

marca de vinho, preço de venda do vinho, entre residual do açúcar no vinho refere-se à
outras características. quantidade de sólidos de açúcar em um
As classes utilizadas são ordenadas e não determinado volume de vinho após o
balanceadas, conforme descrições a seguir final da fermentação, além de qualquer
(COLI et al, 2015): adição de açúcar. Sua principal função é
• Acidez fixa. É a soma dos ácidos fixos, equilibrar o sabor ácido do vinho tendo
que são os mais importantes, chamados um impacto muito importante na sua
de Tartárico e Málico. Quanto mais qualidade.
elevada for a acidez fixa, mais baixa • Cloretos. Geram no vinho um gosto
será a acidez volátil, que também é salgado que pode causar uma reação
levada em conta pela base de dados. negativa dos consumidores. Se a
Quanto maior a quantidade dos ácidos, concentração ultrapassar certos limites,

Pág. 6
Número 2, Volume 16, dez 2021
o vinho não terá permissão para ser transformado em etanol. Essa
comercializado. conversão é feita através de uma
• Dióxido de enxofre. É o resultado da complexa série de reações químicas.
fermentação do vinho. A maioria dos • Qualidade. A qualidade do vinho é
produtores utilizam o dióxido de avaliada neste banco de dados por
enxofre como um conservante do vinho. especialistas que dão uma nota ao
Uma grande característica do dióxido de saborear os vinhos analisados. Eles
UNIVERSIDADE JOSÉ DO ROSÁRIO VELLANO - UNIFENAS

enxofre é trazer condições melhores analisam conforme o sabor, textura e


para os processos de vinificação do aspectos físicos do vinho.
vinho, elimina bactérias e leveduras
frágeis e indesejáveis, o que permite que Para treino e avaliação do modelo, foi
apenas as melhores prossigam com o utilizado o software Weka, na versão 3.8.5. A
processo de fermentação. base de dados foi dividida, aleatoriamente, em
• Densidade. A densidade do vinho está dados para treino e dados para testes.
relacionada ao seu teor alcoólico e de
açúcares residuais do mesmo. 3 RESULTADOS E DISCUSSÃO
• pH. O pH, em termos simples, mede a
força da acidez. Sua escala pode variar Após o treinamento do modelo utilizando o
201
/AB

de 0 a 14, com 0 sendo muito ácido e 14 Weka 3.8.5, foram obtidas as classificações dos
9.
R

alcalino. O valor do pH sendo 7 é uma vinhos de acordo com a base de dados de treino
solução neutra, vinhos normalmente e testes utilizada. Na Figura 1, são apresentados
variam de 2,8 a 4,0. os resultados obtidos.
• Sulfatos. Eles formam-se naturalmente O resultado apresentado na Figura 1 foi
em comidas e bebidas, como resultado obtido utilizando o algortimo de árvore de
da fermentação do vinho. A maioria dos decisão. Os resultados apresentados na coluna
produtores utilizam o sulfitos com o Quality são as classificações feitas pelos
dióxido de enxofre para conservar o especialistas a partir dos atributos informados.
vinho. Por outro lado, na coluna Classification, são

• Álcool. O álcool é resultado da apresentados os resultados obtidos com o

fermentação sem oxigênio do vinho, algoritmo de árvore de decisão.

chamada de fermentação alcoólica, em De acordo com os resultados obtidos, é

que o açúcar contido nas frutas é possível observar que a maioria dos vinhos foram

Pág. 7
Número 2, Volume 16, dez 2021
UNIVERSIDADE JOSÉ DO ROSÁRIO VELLANO - UNIFENAS

Figura 1 - Resultados obtidos com o Weka 3.8.5

classificados como normais. Utilizando


201
/AB

9.
R

arredondamento, o algoritmo de Inteligência


Artificial acertou, aproximadamente, 63% das
classificações, comparando os resultados obtidos
com as classificações feitas pelos profissionais.
Nas Figuras 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 e 12
são apresentados os resultados individuais para Figura 3 - Representa o atributo cloretos
cada atributo da base de dados.

Figura 2 - Representa o atributo álcool Figura 4 - Representa o atributo ácido cítrico

Pág. 8
Número 2, Volume 16, dez 2021
Figura 5 - Representa o atributo densidade Figura 9 - Representa o atributo qualidade
UNIVERSIDADE JOSÉ DO ROSÁRIO VELLANO - UNIFENAS

Figura 6 - Representa o atributo acidez fixa Figura 10 - Representa o atributo açúcar residual
201
/AB

9.
R

Figura 7 - Representa o atributo dióxido de enxofre Figura 11 - Representa o atributo sulfatos

Figura 8 - Representa o atributo pH Figura 12 - Representa o atributo acidez volátil

Pág. 9
Número 2, Volume 16, dez 2021
4 CONCLUSÃO REFERÊNCIAS

Após a análise dos resultados, observa-se que há [1] EMBRAPA. Disponível em:
https://www.infoteca.cnptia.embrapa.br/bitstream/doc
mais vinhos com a classificação normal do que /871709/1/pub140.pdf Acesso
vinhos excelentes ou pobres. Isso ocorre pelo em: 28 jan. 2021.

fato de que as classes estudadas são ordenadas e [2] CINGOLANI, Mauro. POTENCIALIDADES DA
ENOGASTRONOMIA NO CONTEXTO DA
não balanceadas. Analisando a classificação feita ESTRATÉGIA EM DUAS VINÍCOLAS DA SERRA
GAÚCHA. 2021. 57F. Dissertação -
UNIVERSIDADE JOSÉ DO ROSÁRIO VELLANO - UNIFENAS

pela máquina e a classificação obtida por


UNIVERSIDADE DE CAXIAS DO SUL, Caxias do
especialistas, pode-se concluir que a máquina fez Sul, 2021.

previsões assertivas em relação aos especialistas, [3] COSTA, Nattane Luíza da. Mineração de dados
sendo que a menor nota dada por especialistas foi para a classificação de alguns vinhos Vitis Vinifera da
América do Sul. 2016. 99f. Dissertação -
entre 3 e 8. Após a utilização do algoritmo, pode- UNIVERSIDADE FEDERAL DE GOIÁS
INSTITUTO DE INFORMÁTICA, Goiânia, 2016.
se observar que, tanto na menor nota, quanto na
maior nota, obteve-se a mesma faixa de [4] CORTEZ, Paulo et al. Modeling wine preferences
by data mining from physicochemical properties. In
pontuação, que varia entre 3 e 8. A porcentagem Decision Support Systems. Disponível em:
<http://dx.doi.org/10.1016/j.dss.2009.05.016>.
de erros do algoritmo em relação a nota de Acesso em: 24 set. 2021.
qualidade, segundo especialistas, foi de apenas
[5] CARVALHO, Erika Samantha Santos de et al.
37%. Influência de correção do pH do Mosto do Vinho
Utilizando Diferentes Ácidos Orgânicos de Vinhos
201
/AB

A Inteligência Artificial é de suma


9.

Tintos do Vale do Submédio São Francisco. Anais da


R

importância para a melhoria dos processos II Jornada de Integração da Pós-graduação da Embrapa


Seminário. Salvador, v.2, n.1, p. 203-210, Jan/Jun.
industriais e, por consequência, auxilia na 2019.

melhoria dos produtos que chegam até o [6] MONARD, Maria Carolina; BARANAUSKAS,
consumidor. Neste trabalho, foi apresentado José Augusto. Indução de Regras e Árvores de
Decisão. 5 ed. São Paulo: Usp, 2003.
apenas uma, de tantas outras aplicações, onde a
[7] FORTI, Melissa. Técnicas de Machine Learning
técnica de machine learning pode ser aplicada Aplicadas na Recuperação de Crédito do Mercado
para trazer algum benefício à sociedade. Brasileiro. 2018. 75f. Dissertação - FUNDAÇÃO
GETÚLIO VARGAS ESCOLA DE ECONOMIA DE
SÃO PAULO, São Paulo, 2018.

[8] COLI, Marina Sonegheti et al. Conteúdo de


cloretos em vinhos brancos de diferentes países.
Revista de Ciências Farmacêuticas Básica e Aplicada.
Vitória, v.36, n.4, p. 503-507, Jan/Jun. 2015.

[9] LIMA, Isaías; PINHEIRO, Carlos AM; SANTOS,


Flávia A. Oliveira. Inteligência artificial. Elsevier
Brasil, 2016.

Pág. 10
Número 2, Volume 16, dez 2021

Você também pode gostar