data <- read.csv("ipu.csv")
data$plan <- factor(data$plan)

1. Formule el modelo de regresión lineal adecuado.

El modelo propuesto busca explicar el ingreso mensual por usuario (ipu_usd) a partir del tipo de plan (plan) y las horas activas al mes (horas_activas_mes).

mod1 <- lm(ipu_usd ~ plan + horas_activas_mes, data = data)
summary(mod1)
## 
## Call:
## lm(formula = ipu_usd ~ plan + horas_activas_mes, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -8.1927 -2.0258  0.0218  2.1624 10.2951 
## 
## Coefficients:
##                   Estimate Std. Error t value Pr(>|t|)    
## (Intercept)        5.31963    0.75896   7.009 1.63e-11 ***
## planPremium        2.03619    0.74489   2.734  0.00664 ** 
## planStandard       3.26961    0.50047   6.533 2.81e-10 ***
## horas_activas_mes  0.16660    0.01664  10.010  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.36 on 296 degrees of freedom
## Multiple R-squared:  0.5561, Adjusted R-squared:  0.5516 
## F-statistic: 123.6 on 3 and 296 DF,  p-value: < 2.2e-16

Se usará Basic como categoría de referencia. Justificación: es el plan base y más común, por lo que funciona como punto de comparación natural para cuantificar los incrementos relativos de los planes Standard y Premium en el IPU, una vez controlado el tiempo de uso. De esta forma, los coeficientes de Standard y Premium indicarán cuánto difieren del plan Basic, manteniendo constantes las horas activas.

2. Interprete el significado de los coeficientes asociados al plan y a las horas activas.

Coeficientes del modelo

Intercepto (5.32): representa el ingreso mensual promedio (IPU) de los usuarios del plan Premium —la categoría de referencia— cuando las horas activas al mes son 0. Aunque este valor no tiene interpretación práctica directa (ya que 0 horas no es realista), sirve como punto base para el cálculo de las predicciones.

planStandard (3.27): los usuarios del plan Standard generan, en promedio, 3.27 unidades más de IPU que los del plan Premium, manteniendo constantes las horas activas.

planBasic: no se muestra porque es la referencia implícita. Todas las comparaciones de los demás planes se hacen respecto a Premium.

horas_activas_mes (0.17): por cada hora adicional de uso al mes, el IPU promedio aumenta en 0.17 unidades, sin importar el tipo de plan. Este efecto es positivo y estadísticamente significativo (p < 0.001).

El intercepto indica el valor promedio de IPU para el plan Premium cuando las horas activas son cero. Es el punto de partida del modelo y sirve para estimar los cambios relativos cuando aumentan las horas o cuando se cambia de plan.

El R² = 0.5561 muestra que el modelo explica el 55.6% de la variabilidad total del ingreso mensual (IPU). Esto significa que el tipo de plan y las horas activas son factores relevantes que explican más de la mitad del comportamiento del IPU, por lo que el modelo tiene un buen poder explicativo.

3. Genere predicciones con intervalo de confianza (90%).

# Predicciones con IC 90% para 60 horas activas

levels(data$plan)
## [1] "Basic"    "Premium"  "Standard"
new <- data.frame(
  plan = c("Basic","Standard","Premium"),
  horas_activas_mes = 60
)

new$plan <- factor(new$plan, levels = levels(data$plan))

pred90 <- predict(mod1, newdata = new, interval = "confidence", level = 0.90)
cbind(new, as.data.frame(pred90))
##       plan horas_activas_mes      fit      lwr      upr
## 1    Basic                60 15.31573 14.58927 16.04218
## 2 Standard                60 18.58534 18.03443 19.13625
## 3  Premium                60 17.35192 16.59909 18.10476

Para un usuario con 60 horas activas al mes, los valores estimados de ingreso mensual (IPU) son:

Conclusión: A igual número de horas activas (60), los usuarios del plan Standard presentan el ingreso promedio más alto, seguidos por los de Premium y luego Basic. Los intervalos de confianza son estrechos, lo que indica precisión en las estimaciones. Esto confirma que tanto el tipo de plan como las horas activas influyen en el IPU, y que el plan Standard es el más rentable en promedio para la empresa.

  1. Predicciones con intervalo de confianza (90%)

Predicciones para usuarios con 60 horas activas al mes

# Crear nuevo conjunto de datos con los tres planes
new <- data.frame(
  plan = c("Basic", "Standard", "Premium"),
  horas_activas_mes = 60
)
# Alinear niveles de 'plan' con el modelo
new$plan <- factor(new$plan, levels = levels(data$plan))
# Generar predicciones con intervalo de confianza del 90%
pred90 <- predict(mod1, newdata = new, interval = "confidence", level = 0.90)
# Combinar resultados en una tabla
resultados <- cbind(new, as.data.frame(pred90))
resultados
##       plan horas_activas_mes      fit      lwr      upr
## 1    Basic                60 15.31573 14.58927 16.04218
## 2 Standard                60 18.58534 18.03443 19.13625
## 3  Premium                60 17.35192 16.59909 18.10476

Los valores estimados del ingreso mensual (IPU) para un usuario con 60 horas activas al mes son los siguientes: Plan IPU estimado IC 90% inferior IC 90% superior Basic 15.32 14.59 16.04 Standard 18.59 18.03 19.14 Premium 17.35 16.60 18.10

Análisis: • El plan Standard presenta el mayor ingreso promedio (18.59), seguido por Premium (17.35) y finalmente Basic (15.32). • A igual número de horas activas, los usuarios del plan Standard generan aproximadamente un 21% más de ingreso que los del plan Basic y un 7% más que los del Premium. • Aunque el plan Premium ofrece más beneficios, podría estar asociado a mayores descuentos o incentivos, lo que reduce el ingreso promedio por usuario. • Los intervalos de confianza son estrechos, indicando precisión en las estimaciones del modelo.

  1. Conclusiones finales

Factores que más influyen en el ingreso promedio: El análisis muestra que tanto el tipo de plan como las horas activas al mes influyen significativamente en el IPU. Sin embargo, el número de horas activas tiene el efecto más fuerte, ya que cada hora adicional se traduce en un aumento constante del ingreso promedio.

###¿Se mantiene el efecto del tipo de plan al controlar por horas de uso?

Sí. Al incluir las horas en el modelo, las diferencias entre los planes siguen siendo estadísticamente significativas, lo que demuestra que el tipo de plan tiene un impacto propio en el ingreso, más allá del tiempo de uso.

Implicaciones para la estrategia de precios y promociones:

•   Se recomienda promover la migración de usuarios del plan Basic al Standard, ya que este es el plan más rentable en promedio.
•   Fomentar un mayor uso de la plataforma (más horas activas) incrementa directamente el IPU.
•   Evaluar las promociones del plan Premium, ya que los descuentos o beneficios excesivos podrían estar reduciendo su rentabilidad relativa.

Conclusión general:

El modelo confirma que el plan de suscripción y las horas activas mensuales son factores determinantes del ingreso mensual. El plan Standard resulta ser el más rentable, y el aumento en horas activas eleva consistentemente el IPU. Por tanto, la empresa debería enfocar su estrategia en potenciar el uso del servicio y promover planes intermedios rentables para maximizar los ingresos totales.