Contexto de los datos

El conjunto de datos trata con información asociada a los jugadores bateadores de Major League Baseball (MLB) con el propósito de construir y evaluar modelos de aprendizaje automático orientados a la predicción del porcentaje de bateo.

El dataset integra variables demográficas, antropométricas, deportivas y biomecánicas que pueden influir en el desempeño ofensivo de un jugador profesional de béisbol. La información simula registros históricos correspondientes a múltiples jugadores y temporadas, permitiendo aplicar técnicas de de regresión como arboles de regresión, bosques aleatorios y regresión lineal múltiple.

Objetivo

Construir, evaluar y comparar modelos de de regresión árboles de regresión, bosques aleatorios y regresión lineal mltiple con datos históricos relacioandos con el porcetaje de bateos de jugadores de beisbol.

Los modelos serán aceptados si tienen valores de rsuare y r square ajustado por encima del 60%

Los datos originales no se escalan ni se estandarizan, de tal forma que los modelos utilzian los datos originales

Las particiones serán 70% para datos de entrenamiento y 30% para datos de validación.

Al final el caso de estudio deberá indicar cual es el mejor modelo predictivo con estos datos.

El caso de estudio se puede encontrar en el enlae de rpus.com https://rpubs.com/rpizarrog/1436170

Los datos se pueden encontrar en el espació del autor github.com

Las funciones se pueden encontrar y reutilizar desde el espacio github.com en PENDIENTE

Descripción

Desarrollo

Interpretación