Contexto de los datos

El conjunto de datos se trata de un conjunto de atributos que definen la calidad de vino blanco, son alrededor de registros y tantas variables.

Las variables independiente son:

La variable dependiente es calidad de vino de manera cuantitativa.

Los datos originales tienen valores cuantitativos y se normalizarán de manera inicial para que todos los modelos entrenen con datos estandarizados con media igual a cero \(\mu=0\) y desviación estándar igual a 1 \(\sigma = 1\); \(z= \frac {x_i - \mu}{\sigma}\).

El caso de estudio se encuentra en rpubs.com en la dirección url siguiente: https://rpubs.com/rpizarrog/1434956 .

Los datos se encuentran para su descarga en el servicio github.com en el espacio del autor: PENDIENTE

Las funciones que permiten la adecuada ejecución de este caso de estudio se pueden encontrar en el servicio github.com en el espacio del autor: PENDIENTE

Objetivo

Construir modelos de regresión basados en los algoritmos de soporte de regresión SVR con kernel lineal, kernel polinomial grado dos y tres, kernel radial y regresión lineal múltiple.

Los modelos serán válidos estadísticamente si cumplen con los supuestos de linealidad, no multicolinealidad, homocedasticidad normalidad e independencia de residuos o al menos identificar e indicar la condición que tiene cada modelo de regresión con cada supuesto citado.

Los modelos tendrán calidad predictiva si superan con estos datos el 20% del estadístico r square ajustado.

Los datos serán particionados con el 70% para datos de entrenamiento y 30% datos de validación.

Al final, el caso de estudio deberá entregar los estadísticos de evaluación para indicar e interpretar cual es el mejor modelo de regresión multivariable de los aquí descritos, con los datos del caso en términos de calidad predictiva y validación de supuestos de regresión.

Descripción

Cargar librerías

Cargar funciones

Desarrollo

Interpretación