Resumen del caso

Lanzamiento de Express pool

En marzo de 2018, Uber estaba evaluando los resultados de su nuevo producto, Express POOL, que ofrecía tarifas más bajas a cambio de que los pasajeros caminaran una corta distancia y esperaran dos minutos antes de ser asignados a un conductor. Después de pruebas piloto en Boston y San Francisco, se realizó un experimento en Boston que mostró resultados mixtos: tiempos de espera más largos aumentaban las tasas de cancelación pero reducían los costos por viaje. A pesar de esto, Uber estaba llevando a cabo un nuevo experimento en doce ciudades de EE. UU., con seis ciudades “experimentales” y seis “de control”. Ante la posibilidad de aumentar los tiempos de espera de dos a cinco minutos en las ciudades experimentales, había un debate interno en Uber. Algunos argumentaban que las tasas de cancelación más altas indicaban que los clientes no querían esperar, mientras que otros destacaban la significativa reducción de los costos por viaje. El equipo de ciencias de datos quería esperar cinco semanas para evaluar adecuadamente los datos antes de tomar una decisión, mientras que el equipo de producto estaba ansioso por fijar los tiempos de espera de una vez por todas. La decisión final recaía en Ethan Stock, director de Gestión de Producto de viajes compartidos.

La industría de viajes compartidos

Uber, fundada en 2009, fue una pionera en la industria de viajes compartidos, pero para 2018, enfrentaba una competencia creciente de empresas como Lyft, Wingz y Didi Chuxing. Aunque estas empresas ofrecían variantes de transporte compartido, la industria aún se concentraba en zonas urbanas, y solo el 15% de los adultos en EE. UU. había utilizado servicios de transporte compartido en 2016. A pesar de la competencia global, Uber mantenía una posición dominante en el mercado estadounidense, con un 77% de participación. La industria enfrentaba desafíos regulatorios y tensiones laborales, ya que algunos conductores aspiraban a ser empleados asalariados. Los inversores mostraban optimismo, respaldando diversas empresas de viajes compartidos. La expansión global y la entrada de vehículos autónomos generaban incertidumbre regulatoria.

Uber

Uber experimentó un rápido crecimiento al ofrecer servicios inmediatos a través de coches privados. A pesar de enfrentar desafíos regulatorios, introdujo UberX en 2012, permitiendo que conductores con licencia se unieran. La empresa se expandió globalmente y mantuvo una cultura experimental, lanzando productos rápidamente. A pesar de controversias y cambios de liderazgo, Uber se convirtió en líder del mercado, con millones de usuarios y conductores, valorada en decenas de miles de millones de dólares.

- Plataforma y oferta de productos:

A principios de 2018, Uber ofrecía ocho productos de transporte, desde opciones compartidas más baratas hasta servicios premium. La disponibilidad variaba según la ciudad, y Uber solía enviar equipos para estimular la demanda y reclutar conductores al ingresar a nuevas áreas. La interfaz de usuario era similar para todos los productos, permitiendo a los usuarios elegir el tipo de servicio deseado. La aplicación emparejaba a los usuarios con conductores disponibles, proporcionando detalles como nombre, calificación y placa del vehículo. Los conductores, al recibir un pedido, podían aceptar o rechazar activamente a los usuarios. Las tarifas se basaban en la duración y distancia del viaje, y Uber se quedaba con el 25% de la tarifa bruta. Los conductores tenían flexibilidad para trabajar según su conveniencia. Además de los productos de transporte, Uber había lanzado servicios como UberEATS, Uber Freight y Uber Health, y estaba explorando la tecnología de vehículos autónomos en asociación con Daimler AG.

- Estructura organizacional:

En Uber, los equipos de producto se dividían en tres verticales clave: pasajero, conductor y mercado. Cada vertical tenía funciones específicas, como la aplicación para usuarios, la captación de pasajeros, el servicio al cliente, la captación de conductores, y la visión global de la salud de los productos. Los equipos desempeñaban roles como gestión de producto, ingeniería, ciencia de datos, operaciones de productos, diseño y mercadotecnia. La colaboración entre funciones y la retroalimentación local eran fundamentales para perfeccionar los productos, y el proceso de desarrollo incluía representantes de cuatro funciones: gerente de producto, científico de datos, diseñador e ingeniero. A pesar de los desafíos, la colaboración entre gerentes de producto e ingenieros era sólida, permitiendo crear productos pragmáticos que funcionaran en el mundo real.

- La innovación:

La innovación en Uber se dividía en tres categorías: mejoras incrementales en productos básicos, desarrollo de nuevos productos optimizados para diferentes preferencias, y apuestas arriesgadas que implicaban cambios fundamentales en el modelo de negocios y tecnología. La estrategia se basaba en la retroalimentación de usuarios y conductores, con un enfoque especial en la ciencia de datos. Uber invertía considerablemente en científicos de datos para resolver problemas complejos, utilizando experimentos A/B, alternancias y controles sintéticos para mejorar continuamente la experiencia del usuario y evaluar el impacto de las decisiones de la plataforma.

Solución del caso

- Análisis del Impacto de la Ampliación de Tiempos de Espera en Uber: Evaluación por Horas Pico y No Pico:

- Análisis descriptivo inicial:

##    city_id           period_start                  wait_time        
##  Length:126         Min.   :2018-02-19 07:00:00   Length:126        
##  Class :character   1st Qu.:2018-02-22 18:20:00   Class :character  
##  Mode  :character   Median :2018-02-26 05:40:00   Mode  :character  
##                     Mean   :2018-02-26 05:40:00                     
##                     3rd Qu.:2018-03-01 17:00:00                     
##                     Max.   :2018-03-05 04:20:00                     
##    treat          commute          trips_pool   trips_express 
##  Mode :logical   Mode :logical   Min.   : 771   Min.   :1638  
##  FALSE:63        FALSE:106       1st Qu.:1248   1st Qu.:2225  
##  TRUE :63        TRUE :20        Median :1397   Median :2428  
##                                  Mean   :1408   Mean   :2516  
##                                  3rd Qu.:1580   3rd Qu.:2662  
##                                  Max.   :2241   Max.   :4507  
##  rider_cancellations total_driver_payout total_matches  total_double_matches
##  Min.   : 95.0       Min.   :18770       Min.   :1588   Min.   : 728        
##  1st Qu.:147.8       1st Qu.:24722       1st Qu.:2172   1st Qu.:1060        
##  Median :166.0       Median :27353       Median :2361   Median :1282        
##  Mean   :177.7       Mean   :28237       Mean   :2536   Mean   :1322        
##  3rd Qu.:187.2       3rd Qu.:30586       3rd Qu.:2714   3rd Qu.:1482        
##  Max.   :355.0       Max.   :48600       Max.   :5005   Max.   :2739

Datos Generales:

-La información proviene de la ciudad de Boston durante un período específico (del 19 de febrero al 5 de marzo de 2018).

-El tiempo promedio de espera (“wait_time”) parece variar entre 2 y 5 minutos, según el grupo de tratamiento (“treat”).

Variables de Tratamiento:

-El grupo de tratamiento (espera de 5 minutos) y el grupo de control (espera de 2 minutos) están equilibrados, ya que hay un número igual de observaciones en ambos grupos (63 cada uno).

Variables de Viaje:

-La cantidad promedio de viajes compartidos (trips_pool) y viajes Express POOL (trips_express) parece estar dentro de un rango razonable.

-El número de cancelaciones por parte del pasajero (rider_cancellations) varía, con un mínimo de 95 y un máximo de 355. Esto podría indicar una variabilidad significativa en la experiencia del usuario.

Payout a Conductores:

-El pago total a los conductores (total_driver_payout) varía entre $18,770 y $48,600, con un promedio de $28,237. Esto proporciona una idea de los costos totales asociados con los viajes.

Matches y Double Matches:

-El número promedio de coincidencias (total_matches) y coincidencias dobles (total_double_matches) proporciona información sobre la eficiencia del sistema para emparejar a los pasajeros.

- Análisis del impacto general de cambiar los tiempos de espera:

## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
## # A tibble: 2 × 4
##   treat promedio_trips promedio_double_matches promedio_payout
##   <lgl>          <dbl>                   <dbl>           <dbl>
## 1 FALSE          2633.                   1287.          29291.
## 2 TRUE           2438.                   1358.          27183.

Promedio de Viajes (trips):

-El promedio de viajes para el grupo de control (2 minutos de espera) es de aproximadamente 2,633.

-El promedio de viajes para el grupo de tratamiento (5 minutos de espera) es ligeramente más bajo, alrededor de 2,438.

Promedio de Coincidencias Dobles (double_matches):

-El promedio de coincidencias dobles para el grupo de control es de aproximadamente 1,287.

-El promedio de coincidencias dobles para el grupo de tratamiento es ligeramente más alto, alrededor de 1,358.

Promedio de Pago a Conductores (payout):

-El promedio de pago total a los conductores para el grupo de control es de aproximadamente $29,291.

-El promedio de pago total a los conductores para el grupo de tratamiento es ligeramente más bajo, alrededor de $27,183.

- Análisis del impacto durante las horas pico:

## # A tibble: 2 × 4
##   treat promedio_trips promedio_double_matches promedio_payout
##   <lgl>          <dbl>                   <dbl>           <dbl>
## 1 FALSE          3789.                   1794.          39524.
## 2 TRUE           3474.                   1808.          35744.

Promedio de Viajes (trips):

-El promedio de viajes para el grupo de control (2 minutos de espera) es de aproximadamente 3,789 durante las horas pico.

-El promedio de viajes para el grupo de tratamiento (5 minutos de espera) es ligeramente más bajo, alrededor de 3,474 durante las horas pico.

Promedio de Coincidencias Dobles (double_matches):

-El promedio de coincidencias dobles para el grupo de control es de aproximadamente 1,794 durante las horas pico.

-El promedio de coincidencias dobles para el grupo de tratamiento es ligeramente más alto, alrededor de 1,808 durante las horas pico.

Promedio de Pago a Conductores (payout):

-El promedio de pago total a los conductores para el grupo de control es de aproximadamente $39,524 durante las horas pico.

-El promedio de pago total a los conductores para el grupo de tratamiento es ligeramente más bajo, alrededor de $35,744 durante las horas pico.

- Pruebas estadísticas:

## 
##  Welch Two Sample t-test
## 
## data:  total_matches by treat
## t = 1.8169, df = 123.12, p-value = 0.07166
## alternative hypothesis: true difference in means between group FALSE and group TRUE is not equal to 0
## 95 percent confidence interval:
##  -17.42906 407.23858
## sample estimates:
## mean in group FALSE  mean in group TRUE 
##            2633.206            2438.302
## 
##  Welch Two Sample t-test
## 
## data:  total_driver_payout by treat
## t = 2.2037, df = 122.31, p-value = 0.02942
## alternative hypothesis: true difference in means between group FALSE and group TRUE is not equal to 0
## 95 percent confidence interval:
##   214.4479 4001.6252
## sample estimates:
## mean in group FALSE  mean in group TRUE 
##            29291.24            27183.20

Total de Viajes (total_matches):

-El valor p (p-value) asociado a la prueba t para total_matches es de aproximadamente 0.07166.

-Este p-value sugiere que hay una diferencia significativa en el número total de viajes entre el grupo de control (2 minutos de espera) y el grupo de tratamiento (5 minutos de espera).

-Sin embargo, el valor de p está cerca del umbral convencional de 0.05, por lo que la significancia puede depender de la interpretación específica de la prueba y del umbral de significancia elegido.

Pago Total a Conductores (total_driver_payout):

-El valor p asociado a la prueba t para total_driver_payout es de aproximadamente 0.02942.

-Este p-value sugiere que hay una diferencia significativa en el pago total a los conductores entre el grupo de control y el grupo de tratamiento.

-El valor de p está por debajo del umbral de 0.05, lo que indica una mayor confianza en la significancia estadística.

Visualizaciones descriptivas

Conclusión:

Basándonos en el análisis exhaustivo de los datos, se han identificado patrones y tendencias significativas relacionadas con la ampliación de los tiempos de espera de 2 minutos (grupo de control) a 5 minutos (grupo de tratamiento). A continuación, se presentan las principales conclusiones extraídas del estudio:

  1. Impacto General:
    • No hay una diferencia estadísticamente significativa en el número total de viajes entre los dos grupos.
    • Sin embargo, se observa una disminución promedio en el pago total a conductores cuando el tiempo de espera se amplía a 5 minutos.
  2. Impacto Durante las Horas Pico:
    • Durante las horas pico, el número promedio de viajes también disminuye al ampliar los tiempos de espera a 5 minutos.

Recomendaciones:

  1. Considerar Estrategias Adicionales:
    • Dada la disminución en el número de viajes y el pago total a conductores, se podría considerar implementar estrategias adicionales para mitigar posibles impactos negativos.
  2. Segmentación de Usuarios:
    • Evaluar la posibilidad de segmentar aún más los resultados según diferentes perfiles de usuarios para comprender mejor cómo la ampliación de los tiempos de espera afecta a grupos específicos.
  3. Monitoreo Continuo:
    • Se recomienda un monitoreo continuo de las métricas clave a medida que se implementan cambios en los tiempos de espera. Esto permitirá una adaptación ágil a medida que evoluciona la dinámica del mercado.
  4. Recopilación de Retroalimentación:
    • Obtener la retroalimentación directa de los usuarios y conductores puede proporcionar información valiosa sobre cómo perciben estos cambios y si están dispuestos a aceptar tiempos de espera más largos.
  5. Optimización durante las Horas Pico:
    • Enfocarse en estrategias específicas para mitigar la disminución del número de viajes durante las horas pico, como incentivos especiales o promociones.
  6. Experimentación Adicional:
    • Continuar con la experimentación y realizar pruebas piloto adicionales para entender completamente las dinámicas del mercado en juego.

- Análisis de Ganancias por Trayecto en Horas Pico y No Pico:

##  No Pico     Pico 
## 40883.99 52673.50

El resultado muestra una diferencia en las ganancias por trayecto entre las horas pico y las horas no pico. En concreto, durante las horas pico, las ganancias promedio por trayecto son mayores (52,673.50) en comparación con las horas no pico (40,883.99).

Esto sugiere que, en términos generales, ampliar los tiempos de espera a 5 minutos durante las horas pico podría tener un impacto positivo en las ganancias por trayecto.

- Análisis de los beneficios para los dos grupos:

## 
##  Welch Two Sample t-test
## 
## data:  total_driver_payout by treat
## t = 2.2037, df = 122.31, p-value = 0.02942
## alternative hypothesis: true difference in means between group FALSE and group TRUE is not equal to 0
## 95 percent confidence interval:
##   214.4479 4001.6252
## sample estimates:
## mean in group FALSE  mean in group TRUE 
##            29291.24            27183.20

Interpretación de la Prueba t de Welch:

La prueba t de Welch compara las medias de dos grupos independientes, en este caso, el grupo de tratamiento (espera de 5 minutos) y el grupo de control (espera de 2 minutos) en términos de “total_driver_payout”. Aquí está la interpretación de los resultados:

  1. Estadísticas de la Prueba:
    • t-value: 2.2037
    • Grados de libertad (df): 122.31
    • p-value: 0.02942
  2. Hipótesis Nula y Alternativa:
    • Hipótesis Nula (H0): No hay diferencia significativa en las medias entre el grupo de tratamiento y el grupo de control en términos de “total_driver_payout”.
    • Hipótesis Alternativa (H1): Existe una diferencia significativa en las medias entre el grupo de tratamiento y el grupo de control en términos de “total_driver_payout”.
  3. Interpretación del p-value:
    • El p-value de 0.02942 es menor que el nivel de significancia común de 0.05. Por lo tanto, rechazamos la hipótesis nula.
  4. Intervalo de Confianza (95%):
    • El intervalo de confianza del 95% para la diferencia de medias está entre 214.45 y 4001.63.
  5. Estimaciones de Medias:
    • La media del grupo de control es $29,291.24.
    • La media del grupo de tratamiento es $27,183.20.

Conclusión: Hay evidencia estadística significativa para sugerir que existe una diferencia significativa en los pagos totales a conductores entre el grupo de tratamiento (espera de 5 minutos) y el grupo de control (espera de 2 minutos). La media de los pagos totales a conductores parece ser menor en el grupo de tratamiento en comparación con el grupo de control. Esto puede tener implicaciones importantes para la toma de decisiones, y se debe considerar cuidadosamente al evaluar la efectividad de cambiar los tiempos de espera.

- Análisis de cómo se vieron afectadas las cancelaciones de viajes en el grupo de tratamiento y control, así como cómo varía esto entre horas pico y no pico:

- Análisis general:

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    95.0   147.8   166.0   177.7   187.2   355.0

Este resumen estadístico proporciona información sobre la variable “rider_cancellations” en el conjunto de datos. Aquí hay algunas observaciones clave:

  • Mínimo (Min): La cancelación mínima registrada por un pasajero fue de 95.

  • Primer Cuartil (1st Qu.): El 25% de las cancelaciones están por debajo de 147.8.

  • Mediana (Median): La mediana es 166, lo que significa que el 50% de las cancelaciones están por encima y el 50% está por debajo de este valor.

  • Media (Mean): La media es 177.7, lo que sugiere un valor promedio de cancelaciones.

  • Tercer Cuartil (3rd Qu.): El 75% de las cancelaciones están por debajo de 187.2.

  • Máximo (Max): La cancelación máxima registrada por un pasajero fue de 355.

- Análisis por Horas Pico y No Pico:

- Pruebas estadísticas:

## 
##  Welch Two Sample t-test
## 
## data:  rider_cancellations by treat
## t = -2.764, df = 121.46, p-value = 0.0066
## alternative hypothesis: true difference in means between group FALSE and group TRUE is not equal to 0
## 95 percent confidence interval:
##  -42.524581  -7.030975
## sample estimates:
## mean in group FALSE  mean in group TRUE 
##            165.3492            190.1270
## 
##  Welch Two Sample t-test
## 
## data:  rider_cancellations by commute
## t = -10.515, df = 20.944, p-value = 8.218e-10
## alternative hypothesis: true difference in means between group FALSE and group TRUE is not equal to 0
## 95 percent confidence interval:
##  -138.55332  -92.79196
## sample estimates:
## mean in group FALSE  mean in group TRUE 
##            159.3774            275.0500

Estos resultados de las pruebas estadísticas muestran que hay diferencias significativas en las cancelaciones de pasajeros entre los grupos de tratamiento y control, así como entre las horas pico y no pico.

  1. Diferencia entre grupos de tratamiento y control:
    • La prueba t de Welch para las cancelaciones de pasajeros entre el grupo de tratamiento y el grupo de control muestra un valor p significativo (p = 0.0066). Esto sugiere que hay una diferencia significativa en las cancelaciones de pasajeros entre los dos grupos. Además, el intervalo de confianza no incluye cero, lo que respalda la significancia estadística.
  2. Diferencia entre horas pico y no pico:
    • La prueba t de Welch para las cancelaciones de pasajeros entre las horas pico y no pico también muestra un valor p muy pequeño (p = 8.218e-10), indicando una diferencia significativa. El intervalo de confianza tampoco incluye cero, respaldando la conclusión de que hay una diferencia estadísticamente significativa en las cancelaciones entre las horas pico y no pico.

Es decir, tanto el grupo de tratamiento frente al grupo de control como las horas pico frente a las no pico muestran diferencias significativas en las cancelaciones de pasajeros.

Conclusión:

Con base en los resultados obtenidos, se puede concluir que la ampliación de los tiempos de espera de 2 minutos a 5 minutos ha tenido un impacto significativo en las cancelaciones de viajes. Tanto en el análisis general comparando el grupo de tratamiento con el de control como en la desagregación por horas pico y no pico, se observa que hay diferencias estadísticamente significativas en las cancelaciones.

  • En comparación con el grupo de control, el grupo de tratamiento experimenta un aumento significativo en las cancelaciones de pasajeros.
  • La variación en las cancelaciones también muestra diferencias significativas entre las horas pico y no pico. Las horas pico tienden a tener una mayor cantidad de cancelaciones en ambos grupos.

Estos hallazgos sugieren que la ampliación de los tiempos de espera puede estar afectando negativamente la experiencia del usuario, especialmente durante las horas pico. Se recomienda una revisión más detallada de la implementación de esta estrategia y considerar ajustes para mitigar las cancelaciones y mejorar la satisfacción del cliente.

Cierre de los hallazgos en general

En resumen, este análisis exhaustivo de los efectos de la ampliación de los tiempos de espera de 2 minutos a 5 minutos en el servicio de Uber ha proporcionado valiosa información para la toma de decisiones. A continuación, se presentan los principales hallazgos:

  1. Impacto General:
    • Se observa una diferencia significativa en el número de cancelaciones entre el grupo de tratamiento (5 minutos de espera) y el grupo de control (2 minutos de espera).
    • La ampliación de los tiempos de espera parece tener un efecto negativo en la retención de pasajeros, con un aumento en las cancelaciones.
  2. Análisis por Horas Pico y No Pico:
    • La diferencia en cancelaciones entre los dos grupos se mantiene significativa tanto en horas pico como en horas no pico.
    • Las horas pico presentan, en general, un mayor número de cancelaciones, indicando que este período puede ser especialmente sensible a cambios en los tiempos de espera.
  3. Recomendaciones:
    • Considerando el aumento significativo en las cancelaciones, se recomienda una revisión detallada de la estrategia de ampliación de tiempos de espera.
    • Se sugiere explorar ajustes en la implementación para mitigar los efectos negativos, especialmente durante las horas pico.
  4. Cierre:
    • Este análisis proporciona una visión clara de los impactos operativos y de satisfacción del cliente relacionados con la modificación de los tiempos de espera.
    • La retroalimentación recopilada puede ser esencial para ajustar estrategias y mejorar la calidad del servicio.
    • Se destaca la importancia de equilibrar la eficiencia operativa con la satisfacción del cliente para garantizar una experiencia positiva en todos los momentos del día.

Para concluir, estos resultados ofrecen una base sólida para la toma de decisiones estratégicas en Uber, proporcionando una comprensión detallada de cómo los cambios en los tiempos de espera pueden influir en el comportamiento de los usuarios y, en última instancia, en el rendimiento del servicio.