Você está na página 1de 6

Universidad Distrital Francisco Jos de Caldas.

DETERMINACIN DE LA CALIDAD DEL VINO ROJO

ESTIMACIN DE UN MODELO ECONOMTRICO PARA


DETERMINAR LA CALIDAD DEL VINO ROJO A PARTIR
DE PROPIEDADES FSICO-QUMICAS
Estimation of an econometric model for determining red wine quality
from physical and chemical properties

Rubio Salazar, Oscar. Hurfano Barbosa, Nelson. Vargas Vargas, Aldemar


ogrubios@correo.udistrital.edu.co,nlhuerfanob@correo.udistrital.edu.co, eavargasv@correo.udistrital.edu.co
Universidad Distrital Francisco Jos de Caldas, Bogot.

RESUMEN ABSTRACT
En el presente articulo se desarrolla un anlisis
econometrico que intenta predecir la calidad del vino In this paper an econometric analysis which attempts
rojo a partir de propiedades fisicas y quimicas. En to predict red wine quality from physical and
este estudio se tomo como referencia una base de chemical properties is developed. This study was
datos del Repositorio de aprendizaje de la taken as reference a database Learning Repository
Universidad de California. Se realizara una regresin University of California. Multiple linear regression
lineal multiple para determinar si este modelo que analysis was conducted to determine whether this
proponemos cumple con todos los supuestos de un model that we propose meets all the assumptions of
modelo econometrico. Tambin se utiliza para esta an econometric model. It is also used for this
determinacion software de anlisis estadistico como determination as statistical analysis software
STATA para obtener el mejor modelo ajustado y as STATA to obtain the best-fitting model and so know
saber cuales son las propiedades que ms influyen al the properties that influence in determining red wine
momento de determinar la calidad del vino rojo. quality.

Palabras claves: calidad del vino, modelo Keywords: wine quality, econometric model,
economtrico, regresin lineal mltiple, propiedades multiple linear regressions, physical and chemical
fsico-qumicas. properties.

I. INTRODUCCIN
En este estudio economtrico trataremos de adems de estar respaldados por una Universidad de
determinar la relacin de algunas variables fsico- los Estados Unidos en California. A continuacin en
qumicas con la calidad del vino rojo, tales como este anlisis del modelo economtrico mostraremos
acidez, cido ctrico, azcar, cloruros, dixido los resultados y como se llev a cabo el anlisis, el
sulfrico, densidad, PH, sulfatos y alcohol. La procesamiento en el software STATA de estos datos
decisin de realizar este anlisis o estudio es porque y cules son las variables o factores ms
es interesante tocar este tema ya que la mayora de representativos para que se logre una adecuada
las personas desconocen que componentes son los estimacin del modelo economtrico y tambin los
que lleva una bebida como el vino tan antigua y por anlisis que con este trabajo llegamos a concluir.
la cantidad de los datos que hemos encontrado,

1
Universidad Distrital Francisco Jos de Caldas. DETERMINACIN DE LA CALIDAD DEL VINO ROJO
II. ANTECEDENTES Donde los parmetros 0, 1, 2,., k son fijos y
desconocidos [9]. Para evaluar la relevancia de los
Tradicionalmente el proceso de elaboracin del vino
modelos se requiere de una comparacin y
ha sido una vinificacin en el cual el proceso evaluacin de los mismos. Para desarrollar un
consiste en la maceracin de los hollejos junto con la modelo es indispensable investigar previamente si la
fermentacin alcohlica. El consumo moderado de informacin est disponible, si hay suficiente
vino tinto se ha relaciona con la reduccin del riesgo cantidad. Se genera una relacin en dos direcciones
de enfermedad de Alzheimer, en la zona de Burdeos
entre los datos tomados en campo y la construccin
tienen una reduccin del riesgo de la enfermedad de
conceptual terica. Se deben tener claras las
Alzheimer en un 75% y de un 80% para la demencia limitaciones de la informacin y el proceso
senil despus de tres aos de seguimiento (Truelson econmico que se quiere expresar en ecuaciones,
et al.,2002).Por una parte el vino tinto, acta cuando se logra un equilibrio de todas las
aumentando el tipo colesterol HDL (el buen posibilidades de los modelos mucho mejor va a ser
colesterol), que evaca al colesterol LDL, (el mal el resultado final. En esta parte, se realiza un estudio
colesterol), del flujo sanguneo y acta inhibiendo la comparativo de la capacidad de prediccin de
agregacin (acumulacin) de las placas de
algunos de los modelos macroeconmicos ya
colesterol(Seigneur y Gaziano, 1999). Estas
existentes para la economa despus de una previa
investigaciones han causado un enorme aumento del
discusin de la metodologa [2].
consumo en gran nmero de pases como es el caso
de Estados Unidos, Mxico y Amrica Latina (Ortiz, IV. METODOLOGIA
2007). Para que los vinos cumplan con la calidad
adecuada stos deben ajustarse a normas, por lo que
1. Descripcin de datos: Estos datos los obtuvimos
deben ser analizados de manera fisicoqumica con
del repositorio de datos de la Universidad de
mtodos eficaces, repetibles y comparables (Madrid-
California [5], y en ellos se muestra una previa
Cenzano, 2003). La cata de un vino no es ms que
descripcin de cada uno de los componentes que
un anlisis en el sentido de una composicin en
integran el estudio, con 1599 muestras vamos a
elementos simples. Empieza en efecto por ser un
ver la descripcin de cada uno de estos datos.
anlisis, pero se termina con un diagnstico general;
tal como: vino perfecto, mediocre o malo (Peynaud
y Blouin, 2001).El anlisis qumico no distingue un Acidez fija: Es la suma de todos los efectos
gran vino de otro corriente y por lo tanto es de los cidos presentes en el vino, y se
insuficiente para la valoracin de un vino. Cada vino refiere especialmente a las caractersticas
tiene su estilo, su silueta o su perfil que viene gustativas del mismo.
determinado fundamentalmente por una serie de
factores (Benavent, 2003). Acidez voltil: Depende principalmente de
la presencia de cido actico y se caracteriza
por estar presente en el proceso de
III. MARCO TEORICO destilacin.

cido ctrico: El cido ctrico da frescura al


En el modelo de regresin lineal mltiple, el vino, puede ser utilizado para la
regresando -que puede ser la variable endgena o acidificacin qumica de los vinos o por su
una transformacin de las variables endgenas, es accin estabilizante.
una funcin lineal de k regresores correspondientes a
las variables explicativas -o a transformaciones de Azcar residual: Se denomina azcar
las mismas y una perturbacin aleatoria o error. residual al azcar que tras la fermentacin
El modelo tambin incluye un trmino permanece en el vino. Dan la clasificacin al
independiente. Si designamos por y al regresando, vino.
por x2, x3,..., xk a los regresores y por u al error o
perturbacin aleatoria, el modelo poblacional de Cloruros: Estas sustancias ayudan a
regresin lineal mltiple vendr dado por la conservar el equilibrio apropiado del vino y
siguiente expresin: mantener el equilibrio acido bsico, es decir
=0+11+22++ + (1) regula el pH.

2
Universidad Distrital Francisco Jos de Caldas. DETERMINACIN DE LA CALIDAD DEL VINO ROJO

Dixido sulfrico libre: Protege al vino de la calidad: f (acidezfija, acidezvolatil, acidocitrico,


oxidacin enzimtica es decir en presencia azcarresidual, cloruros, dioxidosulfuricolibre,
de aire para regular el vino. dioxidosulfuricototal, densidad, ph, sulfatos
alcohol)
Dixido sulfrico total: este junto con otros
compuestos suprimen la actividad de las Con estos datos se realizaron pruebas iniciales
enzimas que causan oscurecimiento y otros como el grafico de dispersin, los intervalos de
problemas en el vino. confianza, el coeficiente de variacin para ver el
comportamiento de las variables pero solo de
Densidad: Es una medida del grado de una manera somera, junto con la prueba de
alcohol, cuanto ms alcohol tenga un vino Shapiro Wilk para ver si los datos sin procesar
ms baja ser su densidad. podran presentar una distribucin normal.
Luego se realizaron las correspondientes
pH: Es la medida de la diferencia de regresiones paso a paso del modelo logartmico
potencial entre dos electrodos sumergidos en y lineal, luego se realiz la prueba MWD para
el vino, mide la acidez real. saber qu modelo era el ms ptimo para nuestro
anlisis lo que nos afianzo la correcta eleccin
Sulfatos: El vino contiene al estado natural del modelo el cual fue el modelo logartmico,
una pequea cantidad de sulfatos, los cuales luego se realiz la regresin stepwise, la cual
provienen del racimo. Determina el color del nos arroj las variables ms significativas, para
vino en buena medida. luego hacer la prediccin de la media de Y y
tambin la prediccin del intervalo que ms se
Alcohol: El grado de alcohol es la medida ajuste a los valores del verdadero valor
del nmero de litros de etanol, contenidos en poblacional.
10 litros de vino.
V. RESULTADOS
Ac tenemos el resumen de la descripcin de los
datos en STATA. Se realiz la regresin lineal de la calidad del
vino en funcin de las variables explicadas
anteriormente arrojando como resultado:

Figura I. Estadstica de los datos. Fuente: Autora propia

Cabe resaltar que la variable calidad la cual Figura II. Regresin STATA. Fuente: Autora propia
entraremos a estudiar tiene como valor mnimo 3 y
como valor mximo 8, ms adelante veremos que Bondad del ajuste e intervalos de confianza
estos datos en intervalos son congruentes, adems de
tener una baja desviacin estndar. La bondad del ajuste radica en que las variables
independientes explican la variacin de y en
2. Metodologa: Para la funcin a analizar se un 36% segn R2 pero segn R2 ajustado tan
tom como variable dependiente la calidad solo es del 35,6 %.
del vino en funcin de las otras variables Tambin vemos todos los intervalos de
anteriormente mencionadas: confianza del modelo y su interpretacin radica
en que si construimos 100 intervalos como todos

3
Universidad Distrital Francisco Jos de Caldas. DETERMINACIN DE LA CALIDAD DEL VINO ROJO
los anteriores para cada parmetro en 95% de los figura III, no hay evidencia estadstica para aceptar
casos (se encontraran) dichos parmetros Ho, por lo tanto ninguna de las variables tiene un
poblacionales. comportamiento normal.

Significancia individual Prueba MWD

Ho: Bi =0 Esta prueba se realiza con el fin de escoger el mejor


Hi: Bi 0 modelo economtrico a partir de dos hiptesis las
t tablas (11,1587)= 1,96 cuales sugieren que Ho: modelo lineal y en Hi:
modelo log-lineal.
Algunos t calculados no se encuentran dentro del Se realiz la prueba de la siguiente manera:
intervalo (-1.96, 1.96) como se puede observar en la
figura II. Se concluye que no existe evidencia Se calcul el modelo lineal (fig. II) y luego se
estadstica para aceptar Ho, es decir acidez total, procedi a calcular los valores estimados (yf).
cloruros, dixido sulfrico libre, dixido sulfrico Luego se calcul el modelo log-lineal (fig. IV) y se
total, pH, sulfatos y alcohol son estadsticamente calcularon los valores estimados (lnf).
significativos.
Por otro lado algunos t calculados si se encuentran
dentro del intervalo (-1.96, 1.96). Se concluye que
no existe evidencia estadstica para rechazar Ho por
lo tanto acidez fija, cido ctrico, azcar residual y
densidad no son estadsticamente significativos.

Significancia Global

Ho: B2=B3= B4= B5= B6= B7= B8= B9=B10=B11=B12=0


Hi: B2=B3= B4= B5= B6= B7= B8= B9=B10=B11=B120
Fig. IV Modelo log-lineal. Fuente: Autoria propia
Fcalculado= 81,45
Ftablas (11,1587) = 1,84 Luego se calcula z1 y z2 y se incluyen como
variables adicionales en y y lny respectivamente, una
Dado que el Fcalculado es mayor al F terico se como regresora (z1) y otra como variable (z2).
concluye que no existe evidencia estadstica para
aceptar Ho, es decir el modelo es significativo.

Prueba de normalidad Shapiro-Wilk

Fig. V Calculo de z1. Fuente: Autoria propia


Figura III. Prueba Shapiro-Wilk. Fuente: Autoria propia

Planteamos una hiptesis nula y una hiptesis


alterna en la cual en Ho: Hay normalidad y en Hi:
No hay normalidad.
Como el p valor en todas las variables (Prob>z) es
significativo, es decir es menor al porcentaje de
significancia (0,05) como se puede observar en la

4
Universidad Distrital Francisco Jos de Caldas. DETERMINACIN DE LA CALIDAD DEL VINO ROJO

Prediccin puntual y por intervalo de la media de


Y

VI. CONCLUSIONES

REFERENCIAS

[1] (Benavent, 2003).Benavent, A. J.L. (2003).


La cultura del vino: Cata y degustacin.
Fig. VI Clculo de z2. Fuente: Autora propia Universidad Politcnica de Valencia. Univ.
Politc. Valencia.
Utilizando la regla de decisin, dado que el
coeficiente que acompaa a z1 es significativo no [2] (Cao & Kuiper, (1979) Cao, H., & Kuiper, J.
aceptamos la hiptesis nula Ho, es decir optamos por (1979). El Uso de Modelos Economtricos y
el modelo log-lineal ya que su coeficiente z2 no es la Planificacin del Desarrollo en el Per.
significativo de igual manera. Economa.
Regresin Stepwise [3] (Madrid-Cenzano, 2003). Madrid Cenzano,
J., (2003). Anlisis de vinos, mostos y
Ahora que hemos decidido optar por el modelo log- alcoholes. Mundi-Prensa, Madrid, Espaa.
lineal procedemos a realizar la regresin stepwise
con una probabilidad de 0.15, eliminando las [4] (Ortiz, 2007). Ortiz I., (2007). Atlas
variables que en la significancia individual nos Ilustrado del Vinos del Mundo. Susaeta,
arroj como no significativas. Madrid, Espaa.

[5] (P. Cortez et al., 2009) P. Cortez, A.


Cerdeira, F. Almeida, T. Matos and J. Reis.
UC Irving Machine Learning Repository.
Recuperado el 24 de abril de 2016 de
http://archive.ics.uci.edu/ml/datasets/Wine+
Quality.

[6] (Peynaud y Blouin, 2001).Peynaud, E.;


Blouin, J., (2000). El gran libro de la
degustacin. Mundi-Prensa, ed. 2da.,Paris
Figura VII. Regresin Stepwise. Fuente: autora propia.
[7] (Seigneur y Gaziano, 1999). Seigneur M.;
Bonnet H.; Dorian (1990). Effect of the
Tambin analizamos y definimos la matriz de betas
consumption of alcohol, white wine, and red
asociada.
wine on platelet function and serum lipids,
Journal of Applied Cardiology, 5: 215-222.

[8] (Truelson et al., 2002). Truelson T.;


Thudium D.; Gronbaeck M., (2002).
Amount and type of alcohol and risk of
dementia, National Institute of Public
Health, Copenhagen, Denmark 12;
59(9):1313-9.
Fig. VIII. Matriz betas asociados. Fuente: autoria propia

5
Universidad Distrital Francisco Jos de Caldas. DETERMINACIN DE LA CALIDAD DEL VINO ROJO
[9] (Uriel, 2013) Uriel, E. (2013). 3 Regresin
lineal mltiple: estimacin y propiedades,
138.

Você também pode gostar