En marzo de 2018, Uber estaba evaluando los resultados de su nuevo producto, Express POOL, que ofrecía tarifas más bajas a cambio de que los pasajeros caminaran una corta distancia y esperaran dos minutos antes de ser asignados a un conductor. Después de pruebas piloto en Boston y San Francisco, se realizó un experimento en Boston que mostró resultados mixtos: tiempos de espera más largos aumentaban las tasas de cancelación pero reducían los costos por viaje. A pesar de esto, Uber estaba llevando a cabo un nuevo experimento en doce ciudades de EE. UU., con seis ciudades “experimentales” y seis “de control”. Ante la posibilidad de aumentar los tiempos de espera de dos a cinco minutos en las ciudades experimentales, había un debate interno en Uber. Algunos argumentaban que las tasas de cancelación más altas indicaban que los clientes no querían esperar, mientras que otros destacaban la significativa reducción de los costos por viaje. El equipo de ciencias de datos quería esperar cinco semanas para evaluar adecuadamente los datos antes de tomar una decisión, mientras que el equipo de producto estaba ansioso por fijar los tiempos de espera de una vez por todas. La decisión final recaía en Ethan Stock, director de Gestión de Producto de viajes compartidos.
Uber, fundada en 2009, fue una pionera en la industria de viajes compartidos, pero para 2018, enfrentaba una competencia creciente de empresas como Lyft, Wingz y Didi Chuxing. Aunque estas empresas ofrecían variantes de transporte compartido, la industria aún se concentraba en zonas urbanas, y solo el 15% de los adultos en EE. UU. había utilizado servicios de transporte compartido en 2016. A pesar de la competencia global, Uber mantenía una posición dominante en el mercado estadounidense, con un 77% de participación. La industria enfrentaba desafíos regulatorios y tensiones laborales, ya que algunos conductores aspiraban a ser empleados asalariados. Los inversores mostraban optimismo, respaldando diversas empresas de viajes compartidos. La expansión global y la entrada de vehículos autónomos generaban incertidumbre regulatoria.
Uber experimentó un rápido crecimiento al ofrecer servicios inmediatos a través de coches privados. A pesar de enfrentar desafíos regulatorios, introdujo UberX en 2012, permitiendo que conductores con licencia se unieran. La empresa se expandió globalmente y mantuvo una cultura experimental, lanzando productos rápidamente. A pesar de controversias y cambios de liderazgo, Uber se convirtió en líder del mercado, con millones de usuarios y conductores, valorada en decenas de miles de millones de dólares.
A principios de 2018, Uber ofrecía ocho productos de transporte, desde opciones compartidas más baratas hasta servicios premium. La disponibilidad variaba según la ciudad, y Uber solía enviar equipos para estimular la demanda y reclutar conductores al ingresar a nuevas áreas. La interfaz de usuario era similar para todos los productos, permitiendo a los usuarios elegir el tipo de servicio deseado. La aplicación emparejaba a los usuarios con conductores disponibles, proporcionando detalles como nombre, calificación y placa del vehículo. Los conductores, al recibir un pedido, podían aceptar o rechazar activamente a los usuarios. Las tarifas se basaban en la duración y distancia del viaje, y Uber se quedaba con el 25% de la tarifa bruta. Los conductores tenían flexibilidad para trabajar según su conveniencia. Además de los productos de transporte, Uber había lanzado servicios como UberEATS, Uber Freight y Uber Health, y estaba explorando la tecnología de vehículos autónomos en asociación con Daimler AG.
En Uber, los equipos de producto se dividían en tres verticales clave: pasajero, conductor y mercado. Cada vertical tenía funciones específicas, como la aplicación para usuarios, la captación de pasajeros, el servicio al cliente, la captación de conductores, y la visión global de la salud de los productos. Los equipos desempeñaban roles como gestión de producto, ingeniería, ciencia de datos, operaciones de productos, diseño y mercadotecnia. La colaboración entre funciones y la retroalimentación local eran fundamentales para perfeccionar los productos, y el proceso de desarrollo incluía representantes de cuatro funciones: gerente de producto, científico de datos, diseñador e ingeniero. A pesar de los desafíos, la colaboración entre gerentes de producto e ingenieros era sólida, permitiendo crear productos pragmáticos que funcionaran en el mundo real.
La innovación en Uber se dividía en tres categorías: mejoras incrementales en productos básicos, desarrollo de nuevos productos optimizados para diferentes preferencias, y apuestas arriesgadas que implicaban cambios fundamentales en el modelo de negocios y tecnología. La estrategia se basaba en la retroalimentación de usuarios y conductores, con un enfoque especial en la ciencia de datos. Uber invertía considerablemente en científicos de datos para resolver problemas complejos, utilizando experimentos A/B, alternancias y controles sintéticos para mejorar continuamente la experiencia del usuario y evaluar el impacto de las decisiones de la plataforma.
## city_id period_start wait_time
## Length:126 Min. :2018-02-19 07:00:00 Length:126
## Class :character 1st Qu.:2018-02-22 18:20:00 Class :character
## Mode :character Median :2018-02-26 05:40:00 Mode :character
## Mean :2018-02-26 05:40:00
## 3rd Qu.:2018-03-01 17:00:00
## Max. :2018-03-05 04:20:00
## treat commute trips_pool trips_express
## Mode :logical Mode :logical Min. : 771 Min. :1638
## FALSE:63 FALSE:106 1st Qu.:1248 1st Qu.:2225
## TRUE :63 TRUE :20 Median :1397 Median :2428
## Mean :1408 Mean :2516
## 3rd Qu.:1580 3rd Qu.:2662
## Max. :2241 Max. :4507
## rider_cancellations total_driver_payout total_matches total_double_matches
## Min. : 95.0 Min. :18770 Min. :1588 Min. : 728
## 1st Qu.:147.8 1st Qu.:24722 1st Qu.:2172 1st Qu.:1060
## Median :166.0 Median :27353 Median :2361 Median :1282
## Mean :177.7 Mean :28237 Mean :2536 Mean :1322
## 3rd Qu.:187.2 3rd Qu.:30586 3rd Qu.:2714 3rd Qu.:1482
## Max. :355.0 Max. :48600 Max. :5005 Max. :2739
Datos Generales:
-La información proviene de la ciudad de Boston durante un período específico (del 19 de febrero al 5 de marzo de 2018).
-El tiempo promedio de espera (“wait_time”) parece variar entre 2 y 5 minutos, según el grupo de tratamiento (“treat”).
Variables de Tratamiento:
-El grupo de tratamiento (espera de 5 minutos) y el grupo de control (espera de 2 minutos) están equilibrados, ya que hay un número igual de observaciones en ambos grupos (63 cada uno).
Variables de Viaje:
-La cantidad promedio de viajes compartidos (trips_pool) y viajes Express POOL (trips_express) parece estar dentro de un rango razonable.
-El número de cancelaciones por parte del pasajero (rider_cancellations) varía, con un mínimo de 95 y un máximo de 355. Esto podría indicar una variabilidad significativa en la experiencia del usuario.
Payout a Conductores:
-El pago total a los conductores (total_driver_payout) varía entre $18,770 y $48,600, con un promedio de $28,237. Esto proporciona una idea de los costos totales asociados con los viajes.
Matches y Double Matches:
-El número promedio de coincidencias (total_matches) y coincidencias dobles (total_double_matches) proporciona información sobre la eficiencia del sistema para emparejar a los pasajeros.
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
## # A tibble: 2 × 4
## treat promedio_trips promedio_double_matches promedio_payout
## <lgl> <dbl> <dbl> <dbl>
## 1 FALSE 2633. 1287. 29291.
## 2 TRUE 2438. 1358. 27183.
Promedio de Viajes (trips):
-El promedio de viajes para el grupo de control (2 minutos de espera) es de aproximadamente 2,633.
-El promedio de viajes para el grupo de tratamiento (5 minutos de espera) es ligeramente más bajo, alrededor de 2,438.
Promedio de Coincidencias Dobles (double_matches):
-El promedio de coincidencias dobles para el grupo de control es de aproximadamente 1,287.
-El promedio de coincidencias dobles para el grupo de tratamiento es ligeramente más alto, alrededor de 1,358.
Promedio de Pago a Conductores (payout):
-El promedio de pago total a los conductores para el grupo de control es de aproximadamente $29,291.
-El promedio de pago total a los conductores para el grupo de tratamiento es ligeramente más bajo, alrededor de $27,183.
## # A tibble: 2 × 4
## treat promedio_trips promedio_double_matches promedio_payout
## <lgl> <dbl> <dbl> <dbl>
## 1 FALSE 3789. 1794. 39524.
## 2 TRUE 3474. 1808. 35744.
Promedio de Viajes (trips):
-El promedio de viajes para el grupo de control (2 minutos de espera) es de aproximadamente 3,789 durante las horas pico.
-El promedio de viajes para el grupo de tratamiento (5 minutos de espera) es ligeramente más bajo, alrededor de 3,474 durante las horas pico.
Promedio de Coincidencias Dobles (double_matches):
-El promedio de coincidencias dobles para el grupo de control es de aproximadamente 1,794 durante las horas pico.
-El promedio de coincidencias dobles para el grupo de tratamiento es ligeramente más alto, alrededor de 1,808 durante las horas pico.
Promedio de Pago a Conductores (payout):
-El promedio de pago total a los conductores para el grupo de control es de aproximadamente $39,524 durante las horas pico.
-El promedio de pago total a los conductores para el grupo de tratamiento es ligeramente más bajo, alrededor de $35,744 durante las horas pico.
##
## Welch Two Sample t-test
##
## data: total_matches by treat
## t = 1.8169, df = 123.12, p-value = 0.07166
## alternative hypothesis: true difference in means between group FALSE and group TRUE is not equal to 0
## 95 percent confidence interval:
## -17.42906 407.23858
## sample estimates:
## mean in group FALSE mean in group TRUE
## 2633.206 2438.302
##
## Welch Two Sample t-test
##
## data: total_driver_payout by treat
## t = 2.2037, df = 122.31, p-value = 0.02942
## alternative hypothesis: true difference in means between group FALSE and group TRUE is not equal to 0
## 95 percent confidence interval:
## 214.4479 4001.6252
## sample estimates:
## mean in group FALSE mean in group TRUE
## 29291.24 27183.20
Total de Viajes (total_matches):
-El valor p (p-value) asociado a la prueba t para total_matches es de aproximadamente 0.07166.
-Este p-value sugiere que hay una diferencia significativa en el número total de viajes entre el grupo de control (2 minutos de espera) y el grupo de tratamiento (5 minutos de espera).
-Sin embargo, el valor de p está cerca del umbral convencional de 0.05, por lo que la significancia puede depender de la interpretación específica de la prueba y del umbral de significancia elegido.
Pago Total a Conductores (total_driver_payout):
-El valor p asociado a la prueba t para total_driver_payout es de aproximadamente 0.02942.
-Este p-value sugiere que hay una diferencia significativa en el pago total a los conductores entre el grupo de control y el grupo de tratamiento.
-El valor de p está por debajo del umbral de 0.05, lo que indica una mayor confianza en la significancia estadística.
Basándonos en el análisis exhaustivo de los datos, se han identificado patrones y tendencias significativas relacionadas con la ampliación de los tiempos de espera de 2 minutos (grupo de control) a 5 minutos (grupo de tratamiento). A continuación, se presentan las principales conclusiones extraídas del estudio:
## No Pico Pico
## 40883.99 52673.50
El resultado muestra una diferencia en las ganancias por trayecto entre las horas pico y las horas no pico. En concreto, durante las horas pico, las ganancias promedio por trayecto son mayores (52,673.50) en comparación con las horas no pico (40,883.99).
Esto sugiere que, en términos generales, ampliar los tiempos de espera a 5 minutos durante las horas pico podría tener un impacto positivo en las ganancias por trayecto.
##
## Welch Two Sample t-test
##
## data: total_driver_payout by treat
## t = 2.2037, df = 122.31, p-value = 0.02942
## alternative hypothesis: true difference in means between group FALSE and group TRUE is not equal to 0
## 95 percent confidence interval:
## 214.4479 4001.6252
## sample estimates:
## mean in group FALSE mean in group TRUE
## 29291.24 27183.20
Interpretación de la Prueba t de Welch:
La prueba t de Welch compara las medias de dos grupos independientes, en este caso, el grupo de tratamiento (espera de 5 minutos) y el grupo de control (espera de 2 minutos) en términos de “total_driver_payout”. Aquí está la interpretación de los resultados:
Conclusión: Hay evidencia estadística significativa para sugerir que existe una diferencia significativa en los pagos totales a conductores entre el grupo de tratamiento (espera de 5 minutos) y el grupo de control (espera de 2 minutos). La media de los pagos totales a conductores parece ser menor en el grupo de tratamiento en comparación con el grupo de control. Esto puede tener implicaciones importantes para la toma de decisiones, y se debe considerar cuidadosamente al evaluar la efectividad de cambiar los tiempos de espera.
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 95.0 147.8 166.0 177.7 187.2 355.0
Este resumen estadístico proporciona información sobre la variable “rider_cancellations” en el conjunto de datos. Aquí hay algunas observaciones clave:
Mínimo (Min): La cancelación mínima registrada por un pasajero fue de 95.
Primer Cuartil (1st Qu.): El 25% de las cancelaciones están por debajo de 147.8.
Mediana (Median): La mediana es 166, lo que significa que el 50% de las cancelaciones están por encima y el 50% está por debajo de este valor.
Media (Mean): La media es 177.7, lo que sugiere un valor promedio de cancelaciones.
Tercer Cuartil (3rd Qu.): El 75% de las cancelaciones están por debajo de 187.2.
Máximo (Max): La cancelación máxima registrada por un pasajero fue de 355.
##
## Welch Two Sample t-test
##
## data: rider_cancellations by treat
## t = -2.764, df = 121.46, p-value = 0.0066
## alternative hypothesis: true difference in means between group FALSE and group TRUE is not equal to 0
## 95 percent confidence interval:
## -42.524581 -7.030975
## sample estimates:
## mean in group FALSE mean in group TRUE
## 165.3492 190.1270
##
## Welch Two Sample t-test
##
## data: rider_cancellations by commute
## t = -10.515, df = 20.944, p-value = 8.218e-10
## alternative hypothesis: true difference in means between group FALSE and group TRUE is not equal to 0
## 95 percent confidence interval:
## -138.55332 -92.79196
## sample estimates:
## mean in group FALSE mean in group TRUE
## 159.3774 275.0500
Estos resultados de las pruebas estadísticas muestran que hay diferencias significativas en las cancelaciones de pasajeros entre los grupos de tratamiento y control, así como entre las horas pico y no pico.
Es decir, tanto el grupo de tratamiento frente al grupo de control como las horas pico frente a las no pico muestran diferencias significativas en las cancelaciones de pasajeros.
Con base en los resultados obtenidos, se puede concluir que la ampliación de los tiempos de espera de 2 minutos a 5 minutos ha tenido un impacto significativo en las cancelaciones de viajes. Tanto en el análisis general comparando el grupo de tratamiento con el de control como en la desagregación por horas pico y no pico, se observa que hay diferencias estadísticamente significativas en las cancelaciones.
Estos hallazgos sugieren que la ampliación de los tiempos de espera puede estar afectando negativamente la experiencia del usuario, especialmente durante las horas pico. Se recomienda una revisión más detallada de la implementación de esta estrategia y considerar ajustes para mitigar las cancelaciones y mejorar la satisfacción del cliente.
En resumen, este análisis exhaustivo de los efectos de la ampliación de los tiempos de espera de 2 minutos a 5 minutos en el servicio de Uber ha proporcionado valiosa información para la toma de decisiones. A continuación, se presentan los principales hallazgos:
Para concluir, estos resultados ofrecen una base sólida para la toma de decisiones estratégicas en Uber, proporcionando una comprensión detallada de cómo los cambios en los tiempos de espera pueden influir en el comportamiento de los usuarios y, en última instancia, en el rendimiento del servicio.