El conjunto de datos se trata de un conjunto de atributos que definen la calidad de vino blanco, son alrededor de registros y tantas variables.
Las variables independiente son:
La variable dependiente es calidad de vino de manera cuantitativa.
Los datos originales tienen valores cuantitativos y se normalizarán de manera inicial para que todos los modelos entrenen con datos estandarizados con media igual a cero \(\mu=0\) y desviación estándar igual a 1 \(\sigma = 1\); \(z= \frac {x_i - \mu}{\sigma}\).
El caso de estudio se encuentra en rpubs.com en la dirección url siguiente: https://rpubs.com/rpizarrog/1434956 .
Los datos se encuentran para su descarga en el servicio github.com en el espacio del autor: PENDIENTE
Las funciones que permiten la adecuada ejecución de este caso de estudio se pueden encontrar en el servicio github.com en el espacio del autor: PENDIENTE
Construir modelos de regresión basados en los algoritmos de soporte de regresión SVR con kernel lineal, kernel polinomial grado dos y tres, kernel radial y regresión lineal múltiple.
Los modelos serán válidos estadísticamente si cumplen con los supuestos de linealidad, no multicolinealidad, homocedasticidad normalidad e independencia de residuos o al menos identificar e indicar la condición que tiene cada modelo de regresión con cada supuesto citado.
Los modelos tendrán calidad predictiva si superan con estos datos el 20% del estadístico r square ajustado.
Los datos serán particionados con el 70% para datos de entrenamiento y 30% datos de validación.
Al final, el caso de estudio deberá entregar los estadísticos de evaluación para indicar e interpretar cual es el mejor modelo de regresión multivariable de los aquí descritos, con los datos del caso en términos de calidad predictiva y validación de supuestos de regresión.