Información de los datos

Row

Descripción de variables

Row

Descripción de los datos

Tamaño de la muestra: 150.000 registros (filas)

21 variables (columnas)

Periodo de tiempo: datos del año 2024 (fechas entre marzo y noviembre).

El análisis busca identificar los factores que influyen en la finalización, cancelación o éxito de los viajes, así como en la satisfacción de usuarios y conductores. Se evaluarán las tendencias en el uso de tipos de vehículo, ubicaciones y métodos de pago, las razones más frecuentes de cancelación, y cómo variables como la distancia, el valor del viaje o los tiempos promedio afectan las calificaciones. Además, se pretende detectar oportunidades de mejora en el servicio en zonas o condiciones con mayores tasas de cancelación o menor satisfacción. Los datos provienen de la plataforma Kaggle, especializada en la publicación y análisis de datos públicos.

Uber

Histogramas

Row

         Date              Time               Booking.ID    
 2024-11-16:   462   17:44:57:    16   "CNR2726142":     3  
 2024-05-09:   456   19:17:33:    12   "CNR3648267":     3  
 2024-09-18:   456   10:23:23:    11   "CNR5292943":     3  
 2024-01-26:   452   11:29:50:    11   "CNR6337479":     3  
 2024-02-06:   452   15:23:56:    11   "CNR7199036":     3  
 2024-10-12:   452   17:54:33:    11   "CNR7585544":     3  
 (Other)   :147270   (Other) :149928   (Other)     :149982  
               Booking.Status        Customer.ID            Vehicle.Type  
 Cancelled by Customer:10500   "CID4523979":     3   Auto         :37419  
 Cancelled by Driver  :27000   "CID5481002":     3   Bike         :22517  
 Completed            :93000   "CID6468528":     3   eBike        :10557  
 Incomplete           : 9000   "CID6715450":     3   Go Mini      :29806  
 No Driver Found      :10500   "CID7828101":     3   Go Sedan     :27141  
                               "CID8727691":     3   Premier Sedan:18111  
                               (Other)     :149982   Uber XL      : 4449  
        Pickup.Location           Drop.Location       Avg.VTAT     
 Khandsa        :   949   Ashram         :   936   Min.   : 2.000  
 Barakhamba Road:   946   Basai Dhankot  :   917   1st Qu.: 5.300  
 Saket          :   931   Lok Kalyan Marg:   916   Median : 8.300  
 Badarpur       :   921   Narsinghpur    :   913   Mean   : 8.456  
 Pragati Maidan :   920   Cyber Hub      :   912   3rd Qu.:11.300  
 Madipur        :   919   Kalkaji        :   912   Max.   :20.000  
 (Other)        :144414   (Other)        :144494   NA's   :10500   
    Avg.CTAT     Cancelled.Rides.by.Customer
 Min.   :10.00   Min.   :1                  
 1st Qu.:21.60   1st Qu.:1                  
 Median :28.80   Median :1                  
 Mean   :29.15   Mean   :1                  
 3rd Qu.:36.80   3rd Qu.:1                  
 Max.   :45.00   Max.   :1                  
 NA's   :48000   NA's   :139500             
                            Reason.for.cancelling.by.Customer
 AC is not working                           :  1155         
 Change of plans                             :  2353         
 Driver asked to cancel                      :  2295         
 Driver is not moving towards pickup location:  2335         
 Wrong Address                               :  2362         
 NA's                                        :139500         
                                                             
 Cancelled.Rides.by.Driver                       Driver.Cancellation.Reason
 Min.   :1                 Customer related issue             :  6837      
 1st Qu.:1                 More than permitted people in there:  6686      
 Median :1                 Personal & Car related issues      :  6726      
 Mean   :1                 The customer was coughing/sick     :  6751      
 3rd Qu.:1                 NA's                               :123000      
 Max.   :1                                                                 
 NA's   :123000                                                            
 Incomplete.Rides      Incomplete.Rides.Reason Booking.Value    Ride.Distance  
 Min.   :1        Customer Demand  :  3040     Min.   :  50.0   Min.   : 1.00  
 1st Qu.:1        Other Issue      :  2948     1st Qu.: 234.0   1st Qu.:12.46  
 Median :1        Vehicle Breakdown:  3012     Median : 414.0   Median :23.72  
 Mean   :1        NA's             :141000     Mean   : 508.3   Mean   :24.64  
 3rd Qu.:1                                     3rd Qu.: 689.0   3rd Qu.:36.82  
 Max.   :1                                     Max.   :4277.0   Max.   :50.00  
 NA's   :141000                                NA's   :48000    NA's   :48000  
 Driver.Ratings  Customer.Rating     Payment.Method 
 Min.   :3.000   Min.   :3.000   Cash       :25367  
 1st Qu.:4.100   1st Qu.:4.200   Credit Card:10209  
 Median :4.300   Median :4.500   Debit Card : 8239  
 Mean   :4.231   Mean   :4.405   Uber Wallet:12276  
 3rd Qu.:4.600   3rd Qu.:4.800   UPI        :45909  
 Max.   :5.000   Max.   :5.000   NA's       :48000  
 NA's   :57000   NA's   :57000                      

Row

Metodo de pago

Lugares de partida mas escogidos en uber

Viajes de acuerdo al tipo de vehiculo utilizado

Analisis Univariados

Row

Puntuación de los clientes

Puntuación de los conductores

Row

Distancia de los viajes

Correlación

Row

Diagrama Correlación

Row

Diagrama de dispersión

Row

Interpretación


Call:
lm(formula = y ~ x)

Residuals:
   Min     1Q Median     3Q    Max 
-461.9 -274.3  -94.5  180.1 3771.0 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 504.69261    2.50816 201.220   <2e-16 ***
x             0.14626    0.08851   1.652   0.0984 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 395.8 on 101998 degrees of freedom
  (48000 observations deleted due to missingness)
Multiple R-squared:  2.677e-05, Adjusted R-squared:  1.697e-05 
F-statistic: 2.731 on 1 and 101998 DF,  p-value: 0.09845

Graficos bivariados

Row

Diagrama de cajas por grupos

Row

Diagrama de barras apiladas

Conclusiones y aprendizajes

Row

Eficiencia del servicio y comportamiento general

Del total de 150.000 registros, la mayoría de los viajes fueron completados exitosamente, aunque se observan 27.000 cancelaciones por parte de los conductores y 10.500 casos donde no se encontró conductor.

Estos resultados indican un sistema funcional, pero con oportunidades de mejora en la asignación y disponibilidad de vehículos.

Relación entre tipo de vehículo y estado del viaje

El diagrama de barras apiladas evidencia que los vehículos tipo Auto, Go Mini y Go Sedan concentran la mayor cantidad de viajes completados, mientras que categorías como Uber XL y eBike presentan menor participación y una mayor proporción de cancelaciones.

Esto puede deberse a su menor disponibilidad o a una demanda más específica.

Conclusiones generales

El estudio demuestra el valor del análisis de datos con R y FlexDashboard para visualizar patrones y generar conocimiento útil en la toma de decisiones dentro de plataformas de movilidad.

Aunque las correlaciones simples no muestran relaciones fuertes, los gráficos permiten detectar tendencias operativas y oportunidades para optimizar el servicio, especialmente en:

  • Tiempos de espera
  • Gestión de cancelaciones
  • Asignación de vehículos


🌟 ¡Muchas gracias! 🌟