El formato de respuesta es el siguiente:
Abajo del encabezado, debe estar escrita la pregunta. Agregar los códigos en chunks e incluir el output de ser necesario.
La explicación de las respuestas (si es que hay análisis) debe ir como texto, fuera del chunk.
El título del informe debe ser “Tarea 5” y el nombre de todos los integrantes debe ir en autor. La actividad deberá ser entregado en formato HTML. Agregue el número del grupo.
También debe enviar su archivo en formato R Markdown como respaldo.
Recuerde que puede usar todo el material visto para apoyarse.
Todos los integrantes del grupo deben enviar el archivo de Rmarkdown
Tienen hasta el final de la clase para enviar la actividad
El formato tiene puntaje.(3 ptos)
Suprimir warning y mensajes(3 ptos)
Muestre un histograma de distribución del precio.(4 ptos)
Realice un gráfico de correlación entre las variables númericas, estas son, “wheelbase”, “carlength” “carwidth”,“carheight”, “curbweight”, “enginesize”,“boreratio”,“stroke”, “compressionratio”, “horsepower”, “peakrpm”,“citympg”, “highwaympg”,“price” (4 ptos)
Realice dos gráficos de puntos, uno que relacione el precio price, el rendimiento en ciudad citympg y que se diferencie por tipo de tracción drivewheel , el segundo entre precio price, el rendimiento en carretera highwaympgy que se diferencie por tipo de tracción drivewheel (8 ptos)
Realice una regresión múltiple entre precio con las variables enginetype y fuelsystem. ¿Qué podrian decir de la significacia de las variables?(5 ptos)
Calcule el predicho para cada observación.(2 ptos)
Dado el modelo anterior, calcule la predicción del precio con un tipo de motor rotor y sistema de gasolina igual a idi (5 puntos)
Realice usted un modelo a su preferencia, este debe predecir de mejor manera de mejor manera (7 ptos)
Calcule el predicho para cada observación.(2 ptos)
Interprete la diferencia en los errores de predicción entre el Modelo 1 y el Modelo 2. ¿Qué modelo hace una mejor predicción dentro de muestra? (5 puntos)
Realice validación cruzada (CV) a los modelos de la pregunta anterior por el método K-folds con 5 folds. ¿Se mantienen las conclusiones obtenidas en el análisis dentro de muestra? (9 puntos)