Introducción

El objetivo de este análisis es identificar los factores que influyen en el ingreso mensual por usuario en una plataforma de streaming. Para este estudio utilizamos 300 datos de clientes de esta empresa los cuales incluyen: el tipo de plan (Basic, Standard o Premium), las horas activas al mes y el ingreso mensual por usuario (IPU). Debido a que la gerencia sospecha que las promociones y descuentos ofrecidos frecuentemente del plan Premium reducen su ingreso promedio, ajustaremos un modelo de regresión para poder evaluar y comprobar el efecto del tipo de plan y del tiempo de uso con respecto al ingreso mensual. Comenzaremos creando el dataframe para el análisis…

data <- data.frame(
  n = 300,
  plan = streaming_ipu$plan,
  horas = streaming_ipu$horas_activas_mes,
  ipu = streaming_ipu$ipu_usd
)

Regresión del modelo

Para este modelo escogimos el plan Premium como la variable categórica de referencia ya que es el plan de interés para la plataforma de streaming. Al usar el plan Premium como referencia, los coeficientes de los otros planes mostrarán como varía el ingreso por usuario en comparación con el Premium. De esta forma lograremos tambien comprobar si los descuentos y promociones efectivamente reducen el ingreso promedio para este plan en comparación con el plan Standard.

data$plan <- factor(data$plan)
levels(data$plan)
## [1] "Basic"    "Premium"  "Standard"
data$plan<-relevel(data$plan, ref="Premium")
modelo <- lm(ipu ~ plan+horas, data = data)
summary(modelo)
## 
## Call:
## lm(formula = ipu ~ plan + horas, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -8.1927 -2.0258  0.0218  2.1624 10.2951 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   7.35582    1.30426   5.640 3.97e-08 ***
## planBasic    -2.03619    0.74489  -2.734  0.00664 ** 
## planStandard  1.23342    0.60320   2.045  0.04176 *  
## horas         0.16660    0.01664  10.010  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.36 on 296 degrees of freedom
## Multiple R-squared:  0.5561, Adjusted R-squared:  0.5516 
## F-statistic: 123.6 on 3 and 296 DF,  p-value: < 2.2e-16

Interpretación

  • Intercepto: La media del ingreso por usuario del plan premium es de 7.355 cuando las horas activas al mes son cero.
  • Basic: A la misma cantidad de horas activas al mes, el IPU del plan Basic es 2.036 menos que el IPU del plan Premium
  • Standard: El plan Standard tiene un ingreso por usuario mayor que el plan Premium por 1.233, cuando ambos tienen la misma cantidad de horas activas al mes.
  • Horas: El ingreso por usuario aumenta aproximádamente 0.166 por cada hora adicional de uso al mes.
  • R^2: Este modelo explica aproximadamente el 56% de la variación del ingreso por usuario al mes. En conclusión …

Predicción del modelo

Los resultados vistos del modelo de regresión lineal no muestran un significado práctico ya que se refieren al ingreso mensual por usuario cuando las horas activas de esos usuarios igualan a cero. Esto nos ayuda como punto de partida para comparar los planes unos a otros, pero no es muy realístico. Para entender mejor como cambia el ingreso entre los distintos planes, calcularemos el ingreso esperado (IPU) para usuarios con 60 horas activas al mes en cada uno de los tres planes. Manteniendo constante el nivel de uso, osea nuestra variable numérica, se nos hará más llevadero interpretar la variación del IPU entre los planes. Para esta predicción tendremos un análisis con un intérvalo de confianza de 90%.

ipu_esperado<- data.frame(
  plan=c("Basic", "Premium", "Standard"),
  horas=60
)
pred <-predict(modelo, ipu_esperado, interval="confidence", level=0.90)
cbind(ipu_esperado, pred)
##       plan horas      fit      lwr      upr
## 1    Basic    60 15.31573 14.58927 16.04218
## 2  Premium    60 17.35192 16.59909 18.10476
## 3 Standard    60 18.58534 18.03443 19.13625

A partir de estas estimaciones podemos notar que el plan Standard presenta el mayor ingreso promedio esperado para 60 horas activas al mes, con un valor estimado de 18.5 dólares por usuario. Con la misma cantidad de horas le sigue el plan Premium, esperando un ingreso promedio de 17.4 dólares por usuario. Y finalmente el plan Basic estima el menor ingreso promedio de 15.3 dólares por mes. El hecho de que el plan Premium genere un IPU menor que el Standard respalda la hipótesis de la gerencia: que los descuentos y promociones del plan Premium reducen el ingreso neto, a pesar de que sus usuarios tienden a acumular más horas de uso.

Conclusión

Los resultados del modelo muestran que tanto el tipo de plan como las horas activas al mes tienen un impacto significativo en el ingreso mensual por usuario (IPU). Con respecto a las horas activas al mes, estas muestran un efecto positivo. Osea que mientras más horas activas de uso de los servicios, mayor será el ingreso promedio. Al mantener constante el tiempo de uso, el tipo de plan sigue teniendo un efecto significativo. Las diferencias entre planes no se deben solo a las horas activas, sino también a los precios y promociones de cada uno. Los usuarios del plan Standard generan en promedio un IPU más alto que los de Premium, lo cual coincide con la idea de que los descuentos del plan Premium reducen su ingreso neto aunque sus usuarios lo usen más. A partir de los resultados podemos concluir que la estrategia de promociones para el plan Premium de la empresa debería ser revisada o de otro modo deberían ajustar los precios de los planes. Haciendo alguno de estos ajustes podrían lograr un mejor balance entre el nivel de uso e ingresos respecto al tipo de plan.