{r setup, include=FALSE} knitr::opts_chunk$set(echo = TRUE)
Se utiliza un modelo predictivopara tareas que implican la predicción de una salida determinada (o destino) mediante otras variables (o entidades) del conjunto de datos.
El modelado predictivo es “… el proceso de desarrollo de una herramienta matemática o modelo que genera una predicción precisa.” El algoritmo de aprendizaje de un modelo predictivo intenta descubrir y modelar las relaciones entre la variable de destino (la variable que se predice) y las demás entidades (también conocidos como variables predictoras).
Algunos ejemplos de modelado predictivo son:
utilizar atributos de cliente para predecir la probabilidad de que el cliente se mueva en las próximas 6 semanas;
utilizando atributos de vivienda para predecir el precio de venta;
utilizando atributos de los empleados para predecir la probabilidad de;
utilizando atributos y síntomas del paciente para predecir el riesgo de readmisión;
utilizando atributos de producción para predecir el tiempo de comercialización.
Cuando el objetivo de nuestro aprendizaje supervisado es predecir un resultado numérico, nos referimos a esto como un problema de regresión(no debe confundirse con el modelado de regresión lineal). Los problemas de regresión giran en torno a la predicción de la salida que cae sobre un continuo. Esto significa que, dada la combinación de valores predictores, el valor de respuesta podría caer en cualquier lugar a lo largo de algún espectro continuo (por ejemplo, el precio de venta previsto de una casa en particular podría estar entre $80,000 y $755,000).
Problemas de clasificación
Cuando el objetivo de nuestro aprendizaje supervisado es predecir un resultado categórico, nos referimos a esto como un problema de clasificación. Los problemas de clasificación generalmente giran en torno a la predicción de una medida de respuesta binaria o multinomial, como:
¿Un cliente canjeó un cupón (codificado como sí / no o 1/0)?
¿Un cliente abandonó (codificado como sí / no o 1/0)?
¿Un cliente hizo clic en nuestro anuncio en línea (codificado como sí / no o 1/0)?
Clasificación de las opiniones de los clientes:
Binario: positivo frente a negativo.
Sin embargo, cuando aplicamos modelos de aprendizaje automático para problemas de clasificación, en lugar de predecir una clase en particular (es decir, “sí” o “no”), a menudo queremos predecir la probabilidad de una clase en particular (es decir, sí: 0,65, no: 0,35). De forma predeterminada, la clase con la probabilidad predicha más alta se convierte en la clase predicha. En consecuencia, aunque estamos realizando un problema de clasificación, todavía estamos prediciendo una salida numérica (probabilidad). Sin embargo, la esencia del problema aún lo convierte en un problema de clasificación.
Aunque existen algoritmos de aprendizaje automático que se pueden aplicar a problemas de regresión, pero no a clasificación y viceversa, la mayoría de los algoritmos de aprendizaje supervisado que cubrimos en este libro se pueden aplicar a ambos. Estos algoritmos se han convertido en las aplicaciones de aprendizaje automático más populares en los últimos años.