Tamaño de la muestra: 150.000 registros (filas)
21 variables (columnas)
Periodo de tiempo: datos del año 2024 (fechas entre marzo y noviembre).
El análisis busca identificar los factores que influyen en la finalización, cancelación o éxito de los viajes, así como en la satisfacción de usuarios y conductores. Se evaluarán las tendencias en el uso de tipos de vehículo, ubicaciones y métodos de pago, las razones más frecuentes de cancelación, y cómo variables como la distancia, el valor del viaje o los tiempos promedio afectan las calificaciones. Además, se pretende detectar oportunidades de mejora en el servicio en zonas o condiciones con mayores tasas de cancelación o menor satisfacción. Los datos provienen de la plataforma Kaggle, especializada en la publicación y análisis de datos públicos.
Date Time Booking.ID
2024-11-16: 462 17:44:57: 16 "CNR2726142": 3
2024-05-09: 456 19:17:33: 12 "CNR3648267": 3
2024-09-18: 456 10:23:23: 11 "CNR5292943": 3
2024-01-26: 452 11:29:50: 11 "CNR6337479": 3
2024-02-06: 452 15:23:56: 11 "CNR7199036": 3
2024-10-12: 452 17:54:33: 11 "CNR7585544": 3
(Other) :147270 (Other) :149928 (Other) :149982
Booking.Status Customer.ID Vehicle.Type
Cancelled by Customer:10500 "CID4523979": 3 Auto :37419
Cancelled by Driver :27000 "CID5481002": 3 Bike :22517
Completed :93000 "CID6468528": 3 eBike :10557
Incomplete : 9000 "CID6715450": 3 Go Mini :29806
No Driver Found :10500 "CID7828101": 3 Go Sedan :27141
"CID8727691": 3 Premier Sedan:18111
(Other) :149982 Uber XL : 4449
Pickup.Location Drop.Location Avg.VTAT
Khandsa : 949 Ashram : 936 Min. : 2.000
Barakhamba Road: 946 Basai Dhankot : 917 1st Qu.: 5.300
Saket : 931 Lok Kalyan Marg: 916 Median : 8.300
Badarpur : 921 Narsinghpur : 913 Mean : 8.456
Pragati Maidan : 920 Cyber Hub : 912 3rd Qu.:11.300
Madipur : 919 Kalkaji : 912 Max. :20.000
(Other) :144414 (Other) :144494 NA's :10500
Avg.CTAT Cancelled.Rides.by.Customer
Min. :10.00 Min. :1
1st Qu.:21.60 1st Qu.:1
Median :28.80 Median :1
Mean :29.15 Mean :1
3rd Qu.:36.80 3rd Qu.:1
Max. :45.00 Max. :1
NA's :48000 NA's :139500
Reason.for.cancelling.by.Customer
AC is not working : 1155
Change of plans : 2353
Driver asked to cancel : 2295
Driver is not moving towards pickup location: 2335
Wrong Address : 2362
NA's :139500
Cancelled.Rides.by.Driver Driver.Cancellation.Reason
Min. :1 Customer related issue : 6837
1st Qu.:1 More than permitted people in there: 6686
Median :1 Personal & Car related issues : 6726
Mean :1 The customer was coughing/sick : 6751
3rd Qu.:1 NA's :123000
Max. :1
NA's :123000
Incomplete.Rides Incomplete.Rides.Reason Booking.Value Ride.Distance
Min. :1 Customer Demand : 3040 Min. : 50.0 Min. : 1.00
1st Qu.:1 Other Issue : 2948 1st Qu.: 234.0 1st Qu.:12.46
Median :1 Vehicle Breakdown: 3012 Median : 414.0 Median :23.72
Mean :1 NA's :141000 Mean : 508.3 Mean :24.64
3rd Qu.:1 3rd Qu.: 689.0 3rd Qu.:36.82
Max. :1 Max. :4277.0 Max. :50.00
NA's :141000 NA's :48000 NA's :48000
Driver.Ratings Customer.Rating Payment.Method
Min. :3.000 Min. :3.000 Cash :25367
1st Qu.:4.100 1st Qu.:4.200 Credit Card:10209
Median :4.300 Median :4.500 Debit Card : 8239
Mean :4.231 Mean :4.405 Uber Wallet:12276
3rd Qu.:4.600 3rd Qu.:4.800 UPI :45909
Max. :5.000 Max. :5.000 NA's :48000
NA's :57000 NA's :57000
Call:
lm(formula = y ~ x)
Residuals:
Min 1Q Median 3Q Max
-461.9 -274.3 -94.5 180.1 3771.0
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 504.69261 2.50816 201.220 <2e-16 ***
x 0.14626 0.08851 1.652 0.0984 .
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 395.8 on 101998 degrees of freedom
(48000 observations deleted due to missingness)
Multiple R-squared: 2.677e-05, Adjusted R-squared: 1.697e-05
F-statistic: 2.731 on 1 and 101998 DF, p-value: 0.09845
Del total de 150.000 registros, la mayoría de los viajes fueron completados exitosamente, aunque se observan 27.000 cancelaciones por parte de los conductores y 10.500 casos donde no se encontró conductor.
Estos resultados indican un sistema funcional, pero con oportunidades de mejora en la asignación y disponibilidad de vehículos.
El diagrama de barras apiladas evidencia que los vehículos tipo Auto, Go Mini y Go Sedan concentran la mayor cantidad de viajes completados, mientras que categorías como Uber XL y eBike presentan menor participación y una mayor proporción de cancelaciones.
Esto puede deberse a su menor disponibilidad o a una demanda más específica.
El estudio demuestra el valor del análisis de datos con R y FlexDashboard para visualizar patrones y generar conocimiento útil en la toma de decisiones dentro de plataformas de movilidad.
Aunque las correlaciones simples no muestran relaciones fuertes, los gráficos permiten detectar tendencias operativas y oportunidades para optimizar el servicio, especialmente en: