Herramienta “El Generador de Valor de Datos”

Paso 1.Definir al area del negocio que buscamos impactar o mejorar y su KPI
El departamento que buscamos impactar es el departamento de mercadotecnia, ya que, el objetivo que deseamos cumplir es incrementar el numero de rentas y evitar que las rentas se vean afectadas de manera negativa en epocas menos rentables. Indicador clave de rendimiento: Numero de Rentas x Temperatura

Paso 2. Seleccionar plantilla (-s) para crear valor a partir de los datos de los clientes
vision / Segmantacion / Personalizacion / Contextualizacion

Paso 3. Generar ideas o conceptos especificos
Elaborar un modelo predictivo de rentas en base a la temperatura

Paso 4. Reunir los datos requeridos
Elaborar una base de datos con la veriable dependiente (numero de rentas) y variables independientes (temperatura y fecha)

Paso 5. Plan de ejecucion
Mercadotecnia elaborar plan para desplegar modelo predictivo que les ayude a generar estrategias para incrementar las rentas en empocas menos rentables.

Modelo Predictivo

Paso 1. Importar base de datos

bd <- read.csv("/Users/anita3/Documents/rentadebicis_2.csv")

Paso 2. Entender la base de datos

resumen <- summary(bd)
resumen
##       hora            dia              mes              año      
##  Min.   : 0.00   Min.   : 1.000   Min.   : 1.000   Min.   :2011  
##  1st Qu.: 6.00   1st Qu.: 5.000   1st Qu.: 4.000   1st Qu.:2011  
##  Median :12.00   Median :10.000   Median : 7.000   Median :2012  
##  Mean   :11.54   Mean   : 9.993   Mean   : 6.521   Mean   :2012  
##  3rd Qu.:18.00   3rd Qu.:15.000   3rd Qu.:10.000   3rd Qu.:2012  
##  Max.   :23.00   Max.   :19.000   Max.   :12.000   Max.   :2012  
##     estacion     dia_de_la_semana     asueto         temperatura   
##  Min.   :1.000   Min.   :1.000    Min.   :0.00000   Min.   : 0.82  
##  1st Qu.:2.000   1st Qu.:2.000    1st Qu.:0.00000   1st Qu.:13.94  
##  Median :3.000   Median :4.000    Median :0.00000   Median :20.50  
##  Mean   :2.507   Mean   :4.014    Mean   :0.02857   Mean   :20.23  
##  3rd Qu.:4.000   3rd Qu.:6.000    3rd Qu.:0.00000   3rd Qu.:26.24  
##  Max.   :4.000   Max.   :7.000    Max.   :1.00000   Max.   :41.00  
##  sensacion_termica    humedad       velocidad_del_viento
##  Min.   : 0.76     Min.   :  0.00   Min.   : 0.000      
##  1st Qu.:16.66     1st Qu.: 47.00   1st Qu.: 7.002      
##  Median :24.24     Median : 62.00   Median :12.998      
##  Mean   :23.66     Mean   : 61.89   Mean   :12.799      
##  3rd Qu.:31.06     3rd Qu.: 77.00   3rd Qu.:16.998      
##  Max.   :45.45     Max.   :100.00   Max.   :56.997      
##  rentas_de_no_registrados rentas_de_registrados rentas_totales 
##  Min.   :  0.00           Min.   :  0.0         Min.   :  1.0  
##  1st Qu.:  4.00           1st Qu.: 36.0         1st Qu.: 42.0  
##  Median : 17.00           Median :118.0         Median :145.0  
##  Mean   : 36.02           Mean   :155.6         Mean   :191.6  
##  3rd Qu.: 49.00           3rd Qu.:222.0         3rd Qu.:284.0  
##  Max.   :367.00           Max.   :886.0         Max.   :977.0
plot(bd$temperatura, bd$rentas_totales, main = "Influencia de la Temperatura sobre las Rentas Totales", xlab="Temperatura (ºC)", ylab= "Cantidad")

Observaciones

  1. Por que los dias llegan hasta el 19 y no hasta el 31
  2. ¿Que significan los numeros en las estaciones? R: 1 es primavera, 2 es verano, 3 es otoño y 4 es invierno.

Paso 3. Generar regresion lineal

regresion <- lm (rentas_totales ~ hora + dia + mes + año + estacion + dia_de_la_semana + asueto + temperatura + sensacion_termica + humedad + velocidad_del_viento, data=bd)

colnames(bd)
##  [1] "hora"                     "dia"                     
##  [3] "mes"                      "año"                     
##  [5] "estacion"                 "dia_de_la_semana"        
##  [7] "asueto"                   "temperatura"             
##  [9] "sensacion_termica"        "humedad"                 
## [11] "velocidad_del_viento"     "rentas_de_no_registrados"
## [13] "rentas_de_registrados"    "rentas_totales"
summary(bd)
##       hora            dia              mes              año      
##  Min.   : 0.00   Min.   : 1.000   Min.   : 1.000   Min.   :2011  
##  1st Qu.: 6.00   1st Qu.: 5.000   1st Qu.: 4.000   1st Qu.:2011  
##  Median :12.00   Median :10.000   Median : 7.000   Median :2012  
##  Mean   :11.54   Mean   : 9.993   Mean   : 6.521   Mean   :2012  
##  3rd Qu.:18.00   3rd Qu.:15.000   3rd Qu.:10.000   3rd Qu.:2012  
##  Max.   :23.00   Max.   :19.000   Max.   :12.000   Max.   :2012  
##     estacion     dia_de_la_semana     asueto         temperatura   
##  Min.   :1.000   Min.   :1.000    Min.   :0.00000   Min.   : 0.82  
##  1st Qu.:2.000   1st Qu.:2.000    1st Qu.:0.00000   1st Qu.:13.94  
##  Median :3.000   Median :4.000    Median :0.00000   Median :20.50  
##  Mean   :2.507   Mean   :4.014    Mean   :0.02857   Mean   :20.23  
##  3rd Qu.:4.000   3rd Qu.:6.000    3rd Qu.:0.00000   3rd Qu.:26.24  
##  Max.   :4.000   Max.   :7.000    Max.   :1.00000   Max.   :41.00  
##  sensacion_termica    humedad       velocidad_del_viento
##  Min.   : 0.76     Min.   :  0.00   Min.   : 0.000      
##  1st Qu.:16.66     1st Qu.: 47.00   1st Qu.: 7.002      
##  Median :24.24     Median : 62.00   Median :12.998      
##  Mean   :23.66     Mean   : 61.89   Mean   :12.799      
##  3rd Qu.:31.06     3rd Qu.: 77.00   3rd Qu.:16.998      
##  Max.   :45.45     Max.   :100.00   Max.   :56.997      
##  rentas_de_no_registrados rentas_de_registrados rentas_totales 
##  Min.   :  0.00           Min.   :  0.0         Min.   :  1.0  
##  1st Qu.:  4.00           1st Qu.: 36.0         1st Qu.: 42.0  
##  Median : 17.00           Median :118.0         Median :145.0  
##  Mean   : 36.02           Mean   :155.6         Mean   :191.6  
##  3rd Qu.: 49.00           3rd Qu.:222.0         3rd Qu.:284.0  
##  Max.   :367.00           Max.   :886.0         Max.   :977.0
summary(regresion)
## 
## Call:
## lm(formula = rentas_totales ~ hora + dia + mes + año + estacion + 
##     dia_de_la_semana + asueto + temperatura + sensacion_termica + 
##     humedad + velocidad_del_viento, data = bd)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -305.52  -93.64  -27.70   61.85  649.10 
## 
## Coefficients:
##                        Estimate Std. Error t value Pr(>|t|)    
## (Intercept)          -1.661e+05  5.496e+03 -30.217  < 2e-16 ***
## hora                  7.735e+00  2.070e-01  37.368  < 2e-16 ***
## dia                   3.844e-01  2.482e-01   1.549  0.12150    
## mes                   9.996e+00  1.682e+00   5.943 2.89e-09 ***
## año                   8.258e+01  2.732e+00  30.225  < 2e-16 ***
## estacion             -7.774e+00  5.177e+00  -1.502  0.13324    
## dia_de_la_semana      4.393e-01  6.918e-01   0.635  0.52545    
## asueto               -4.864e+00  8.365e+00  -0.582  0.56089    
## temperatura           1.582e+00  1.038e+00   1.524  0.12752    
## sensacion_termica     4.748e+00  9.552e-01   4.971 6.76e-07 ***
## humedad              -2.115e+00  7.884e-02 -26.827  < 2e-16 ***
## velocidad_del_viento  5.582e-01  1.809e-01   3.086  0.00203 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 141.7 on 10874 degrees of freedom
## Multiple R-squared:  0.3891, Adjusted R-squared:  0.3885 
## F-statistic: 629.6 on 11 and 10874 DF,  p-value: < 2.2e-16

Paso 4. Evaluar, y en caso necesario ajustar, la regresion lineal

regresion <- lm (rentas_totales ~ hora + mes + año + sensacion_termica + humedad + velocidad_del_viento, data=bd)
summary (regresion)
## 
## Call:
## lm(formula = rentas_totales ~ hora + mes + año + sensacion_termica + 
##     humedad + velocidad_del_viento, data = bd)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -308.60  -93.85  -28.34   61.05  648.09 
## 
## Coefficients:
##                        Estimate Std. Error t value Pr(>|t|)    
## (Intercept)          -1.662e+05  5.496e+03 -30.250  < 2e-16 ***
## hora                  7.734e+00  2.070e-01  37.364  < 2e-16 ***
## mes                   7.574e+00  4.207e-01  18.002  < 2e-16 ***
## año                   8.266e+01  2.732e+00  30.258  < 2e-16 ***
## sensacion_termica     6.172e+00  1.689e-01  36.539  < 2e-16 ***
## humedad              -2.121e+00  7.858e-02 -26.988  < 2e-16 ***
## velocidad_del_viento  6.208e-01  1.771e-01   3.506 0.000457 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 141.7 on 10879 degrees of freedom
## Multiple R-squared:  0.3886, Adjusted R-squared:  0.3883 
## F-statistic:  1153 on 6 and 10879 DF,  p-value: < 2.2e-16

Construir Modelo Predictivo

datos_nuevos <- data.frame(hora=12, mes=1:12, año=2013, sensacion_termica=24, humedad=62, velocidad_del_viento=13)
predict(regresion,datos_nuevos)
##        1        2        3        4        5        6        7        8 
## 279.1478 286.7215 294.2952 301.8690 309.4427 317.0164 324.5901 332.1638 
##        9       10       11       12 
## 339.7375 347.3112 354.8849 362.4587

Conclusión

De acuerdo con David L. Rogers la temperatura del ambiente puede inferir en nuestro comportamiento de compra.

Con el modelo predictivo anteriormente presentado pudimos notar que:
- Hay mayores rentas cuando la temperatura se encuntra entre los 20º y 30º grados centigrados.
- Hay menos rentas cuando la temperatura se encuentra en 5º grados centigrados o menos.
- Hay menos rentas cuando la temperatura se encuentra mayor a 40º grados centigrados.

Con dicho modelo afirmamos la teoria de que la temperatura afecta las ventas. De la misma manera, con este dato el departamento de marketing puede generar estrategias para los dias menos rentables donde la temperatura es de 5º grados centigrados o meno y 40º grados centigrados o mas.

LS0tCnRpdGxlOiAiTW9kZWxvIFByZWRpY3Rpdm8gUmVudGEgZGUgQmljaXMiCmF1dGhvcjogIkFuYSBQYXRyaWNpYSBBcG9udGUgLSBBMDEyODM5MjgiCmRhdGU6ICIyMDIyLTA5LTA1IgpvdXRwdXQ6IAogIGh0bWxfZG9jdW1lbnQ6CiAgICB0b2M6IHRydWUKICAgIHRvY19mbG9hdDogdHJ1ZQogICAgY29kZV9kb3dubG9hZDogdHJ1ZQotLS0KCjxpbWcgc3JjPSAiL1VzZXJzL2FuaXRhMy9EZXNrdG9wL3JiIGltZyByLnBuZyI+CgojIyA8c3BhbiBzdHlsZT0iY29sb3I6ICNDRDM3MDAiPiAqKkhlcnJhbWllbnRhICJFbCBHZW5lcmFkb3IgZGUgVmFsb3IgZGUgRGF0b3MiKiogPC9zcGFuPgoKKipQYXNvIDEuRGVmaW5pciBhbCBhcmVhIGRlbCBuZWdvY2lvIHF1ZSBidXNjYW1vcyBpbXBhY3RhciBvIG1lam9yYXIgeSBzdSBLUEkqKiAgIApFbCBkZXBhcnRhbWVudG8gcXVlIGJ1c2NhbW9zIGltcGFjdGFyIGVzIGVsICpkZXBhcnRhbWVudG8gZGUgbWVyY2Fkb3RlY25pYSosIHlhIHF1ZSwgZWwgb2JqZXRpdm8gcXVlIGRlc2VhbW9zIGN1bXBsaXIgZXMgaW5jcmVtZW50YXIgZWwgbnVtZXJvIGRlIHJlbnRhcyB5IGV2aXRhciBxdWUgbGFzIHJlbnRhcyBzZSB2ZWFuIGFmZWN0YWRhcyBkZSBtYW5lcmEgbmVnYXRpdmEgZW4gZXBvY2FzIG1lbm9zIHJlbnRhYmxlcy4KKkluZGljYWRvciBjbGF2ZSBkZSByZW5kaW1pZW50bzoqIE51bWVybyBkZSBSZW50YXMgeCBUZW1wZXJhdHVyYSAgCgoqKlBhc28gMi4gU2VsZWNjaW9uYXIgcGxhbnRpbGxhICgtcykgcGFyYSBjcmVhciB2YWxvciBhIHBhcnRpciBkZSBsb3MgZGF0b3MgZGUgbG9zIGNsaWVudGVzICoqICAgCioqdmlzaW9uKiogLyBTZWdtYW50YWNpb24gLyBQZXJzb25hbGl6YWNpb24gLyBDb250ZXh0dWFsaXphY2lvbiAgCgoqKlBhc28gMy4gR2VuZXJhciBpZGVhcyBvIGNvbmNlcHRvcyBlc3BlY2lmaWNvcyoqICAKRWxhYm9yYXIgdW4gbW9kZWxvIHByZWRpY3Rpdm8gZGUgcmVudGFzIGVuIGJhc2UgYSBsYSB0ZW1wZXJhdHVyYSAgCgoqKlBhc28gNC4gUmV1bmlyIGxvcyBkYXRvcyByZXF1ZXJpZG9zKiogIApFbGFib3JhciB1bmEgYmFzZSBkZSBkYXRvcyBjb24gbGEgdmVyaWFibGUgZGVwZW5kaWVudGUgKCpudW1lcm8gZGUgcmVudGFzKikgeSB2YXJpYWJsZXMgaW5kZXBlbmRpZW50ZXMgKCp0ZW1wZXJhdHVyYSB5IGZlY2hhKikgIAoKKipQYXNvIDUuIFBsYW4gZGUgZWplY3VjaW9uKiogICAKTWVyY2Fkb3RlY25pYSBlbGFib3JhciBwbGFuIHBhcmEgZGVzcGxlZ2FyIG1vZGVsbyBwcmVkaWN0aXZvIHF1ZSBsZXMgYXl1ZGUgYSBnZW5lcmFyIGVzdHJhdGVnaWFzIHBhcmEgaW5jcmVtZW50YXIgbGFzIHJlbnRhcyBlbiBlbXBvY2FzIG1lbm9zIHJlbnRhYmxlcy4KCiMjIDxzcGFuIHN0eWxlPSJjb2xvcjogI0NEMzcwMCI+ICoqTW9kZWxvIFByZWRpY3Rpdm8qKiA8L3NwYW4+CgojIyMgUGFzbyAxLiBJbXBvcnRhciBiYXNlIGRlIGRhdG9zIApgYGB7cn0KYmQgPC0gcmVhZC5jc3YoIi9Vc2Vycy9hbml0YTMvRG9jdW1lbnRzL3JlbnRhZGViaWNpc18yLmNzdiIpCmBgYAoKIyMjIFBhc28gMi4gRW50ZW5kZXIgbGEgYmFzZSBkZSBkYXRvcwpgYGB7cn0KcmVzdW1lbiA8LSBzdW1tYXJ5KGJkKQpyZXN1bWVuCnBsb3QoYmQkdGVtcGVyYXR1cmEsIGJkJHJlbnRhc190b3RhbGVzLCBtYWluID0gIkluZmx1ZW5jaWEgZGUgbGEgVGVtcGVyYXR1cmEgc29icmUgbGFzIFJlbnRhcyBUb3RhbGVzIiwgeGxhYj0iVGVtcGVyYXR1cmEgKMK6QykiLCB5bGFiPSAiQ2FudGlkYWQiKQpgYGAKCiMjIyMgT2JzZXJ2YWNpb25lcwoxLiBQb3IgcXVlIGxvcyBkaWFzIGxsZWdhbiBoYXN0YSBlbCAxOSB5IG5vIGhhc3RhIGVsIDMxCjIuIMK/UXVlIHNpZ25pZmljYW4gbG9zIG51bWVyb3MgZW4gbGFzIGVzdGFjaW9uZXM/IFI6IDEgZXMgcHJpbWF2ZXJhLCAyIGVzIHZlcmFubywgMyBlcyBvdG/DsW8geSA0IGVzIGludmllcm5vLgoKIyMjIFBhc28gMy4gR2VuZXJhciByZWdyZXNpb24gbGluZWFsCmBgYHtyfQpyZWdyZXNpb24gPC0gbG0gKHJlbnRhc190b3RhbGVzIH4gaG9yYSArIGRpYSArIG1lcyArIGHDsW8gKyBlc3RhY2lvbiArIGRpYV9kZV9sYV9zZW1hbmEgKyBhc3VldG8gKyB0ZW1wZXJhdHVyYSArIHNlbnNhY2lvbl90ZXJtaWNhICsgaHVtZWRhZCArIHZlbG9jaWRhZF9kZWxfdmllbnRvLCBkYXRhPWJkKQoKY29sbmFtZXMoYmQpCgpzdW1tYXJ5KGJkKQpzdW1tYXJ5KHJlZ3Jlc2lvbikKYGBgCgojIyMgUGFzbyA0LiBFdmFsdWFyLCB5IGVuIGNhc28gbmVjZXNhcmlvIGFqdXN0YXIsIGxhIHJlZ3Jlc2lvbiBsaW5lYWwKYGBge3J9CnJlZ3Jlc2lvbiA8LSBsbSAocmVudGFzX3RvdGFsZXMgfiBob3JhICsgbWVzICsgYcOxbyArIHNlbnNhY2lvbl90ZXJtaWNhICsgaHVtZWRhZCArIHZlbG9jaWRhZF9kZWxfdmllbnRvLCBkYXRhPWJkKQpzdW1tYXJ5IChyZWdyZXNpb24pCmBgYAoKIyMjIENvbnN0cnVpciBNb2RlbG8gUHJlZGljdGl2bwpgYGB7cn0KZGF0b3NfbnVldm9zIDwtIGRhdGEuZnJhbWUoaG9yYT0xMiwgbWVzPTE6MTIsIGHDsW89MjAxMywgc2Vuc2FjaW9uX3Rlcm1pY2E9MjQsIGh1bWVkYWQ9NjIsIHZlbG9jaWRhZF9kZWxfdmllbnRvPTEzKQpwcmVkaWN0KHJlZ3Jlc2lvbixkYXRvc19udWV2b3MpCmBgYAoKIyMgPHNwYW4gc3R5bGU9ImNvbG9yOiAjQ0QzNzAwIj4gKipDb25jbHVzacOzbioqIDwvc3Bhbj4KKkRlIGFjdWVyZG8gY29uIERhdmlkIEwuIFJvZ2VycyBsYSB0ZW1wZXJhdHVyYSBkZWwgYW1iaWVudGUgcHVlZGUgaW5mZXJpciBlbiBudWVzdHJvIGNvbXBvcnRhbWllbnRvIGRlIGNvbXByYS4qICAKCkNvbiBlbCBtb2RlbG8gcHJlZGljdGl2byBhbnRlcmlvcm1lbnRlIHByZXNlbnRhZG8gcHVkaW1vcyBub3RhciBxdWU6ICAKLSBIYXkgbWF5b3JlcyByZW50YXMgY3VhbmRvIGxhIHRlbXBlcmF0dXJhIHNlIGVuY3VudHJhIGVudHJlIGxvcyAyMMK6IHkgMzDCuiBncmFkb3MgY2VudGlncmFkb3MuICAgCi0gSGF5IG1lbm9zIHJlbnRhcyBjdWFuZG8gbGEgdGVtcGVyYXR1cmEgc2UgZW5jdWVudHJhIGVuIDXCuiBncmFkb3MgY2VudGlncmFkb3MgbyBtZW5vcy4gIAotIEhheSBtZW5vcyByZW50YXMgY3VhbmRvIGxhIHRlbXBlcmF0dXJhIHNlIGVuY3VlbnRyYSBtYXlvciBhIDQwwrogZ3JhZG9zIGNlbnRpZ3JhZG9zLiAgCgpDb24gZGljaG8gbW9kZWxvIGFmaXJtYW1vcyBsYSB0ZW9yaWEgZGUgcXVlIGxhIHRlbXBlcmF0dXJhIGFmZWN0YSBsYXMgdmVudGFzLiBEZSBsYSBtaXNtYSBtYW5lcmEsIGNvbiBlc3RlIGRhdG8gZWwgZGVwYXJ0YW1lbnRvIGRlIG1hcmtldGluZyBwdWVkZSBnZW5lcmFyIGVzdHJhdGVnaWFzIHBhcmEgbG9zIGRpYXMgbWVub3MgcmVudGFibGVzIGRvbmRlIGxhIHRlbXBlcmF0dXJhIGVzIGRlIDXCuiBncmFkb3MgY2VudGlncmFkb3MgbyBtZW5vIHkgNDDCuiBncmFkb3MgY2VudGlncmFkb3MgbyBtYXMuCg==