Objetivo
- Objetivo: esta actividad tiene como propósito
construir modelos de regresión que permitan realizar predicciones de
nitrógeno en suelo con base en información satelital.
Entregables
Para esta actividad debe realizar la entrega de un documento
(pdf, word, html, entre otros) con los
siguientes resultados:
- Análisis exploratorio de datos. Métricas de resumen y gráficos serán
necesarios para desarrollar la actividad. Intente usar gráficos que le
permitan llegar a alguna conclusión.
- Comparación de modelos de regresión. Puede utilizar la métrica RMSE
para valorar el desempeño de sus modelos.
- Selección del modelo final para predicción en Kaggle
- Validación de supuestos matemáticos del modelo final
seleccionado
- ¿Cuáles fueron las variables de mayor importancia en su modelo?
Fechas
- Plazo máximo de entrega: 08 de abril de 2023.
Ejemplo
Para realizar las predicción deberá seguir los siguientes pasos.
1. Descargar los datos
- Descargar datos de traint, test y el ejemplo de
envío.
library(tidyverse)
train <- read_csv("train.csv")
test <- read_csv("test_sinY.csv")
ejemplo <- read_csv("ejemplo_submission.csv")
train %>% head()
2. Explore los datos…
3. Construya un modelo
- Nota: recuerde que su variable respuesta es el
nitrógeno (N)
- En este caso vamos a asumir que nuestro modelo va a realizar
predicciones con base en la precipitación.
modelo <- lm(N ~ prep, data = train)
4. Haga sus validaciones …
5. Predicciones en Test
predicciones <- predict(modelo, newdata = test)
predicciones %>% head()
## 1 2 3 4 5 6
## 0.1104975 0.1103863 0.1103999 0.1104188 0.1104137 0.1104905
6. Construya la tabla de predicciones
tabla_predicciones <- ejemplo %>%
mutate(N = predicciones)
tabla_predicciones %>% head()
7. Exporte sus predicciones
write_csv(x = tabla_predicciones, file = "ejemplo_predicciones.csv")