Conocer BD

Paso 1.

Importar archivo .csv

base_de_datos <- read.csv("/Users/ivannagarza/Downloads/rentadebicis 3.csv")

Paso 2.

Entenderle a la base de datos

resumen <- summary(base_de_datos)
resumen
##       hora            dia              mes              año      
##  Min.   : 0.00   Min.   : 1.000   Min.   : 1.000   Min.   :2011  
##  1st Qu.: 6.00   1st Qu.: 5.000   1st Qu.: 4.000   1st Qu.:2011  
##  Median :12.00   Median :10.000   Median : 7.000   Median :2012  
##  Mean   :11.54   Mean   : 9.993   Mean   : 6.521   Mean   :2012  
##  3rd Qu.:18.00   3rd Qu.:15.000   3rd Qu.:10.000   3rd Qu.:2012  
##  Max.   :23.00   Max.   :19.000   Max.   :12.000   Max.   :2012  
##     estacion     dia_de_la_semana     asueto         temperatura   
##  Min.   :1.000   Min.   :1.000    Min.   :0.00000   Min.   : 0.82  
##  1st Qu.:2.000   1st Qu.:2.000    1st Qu.:0.00000   1st Qu.:13.94  
##  Median :3.000   Median :4.000    Median :0.00000   Median :20.50  
##  Mean   :2.507   Mean   :4.014    Mean   :0.02857   Mean   :20.23  
##  3rd Qu.:4.000   3rd Qu.:6.000    3rd Qu.:0.00000   3rd Qu.:26.24  
##  Max.   :4.000   Max.   :7.000    Max.   :1.00000   Max.   :41.00  
##  sensacion_termica    humedad       velocidad_del_viento
##  Min.   : 0.76     Min.   :  0.00   Min.   : 0.000      
##  1st Qu.:16.66     1st Qu.: 47.00   1st Qu.: 7.002      
##  Median :24.24     Median : 62.00   Median :12.998      
##  Mean   :23.66     Mean   : 61.89   Mean   :12.799      
##  3rd Qu.:31.06     3rd Qu.: 77.00   3rd Qu.:16.998      
##  Max.   :45.45     Max.   :100.00   Max.   :56.997      
##  rentas_de_no_registrados rentas_de_registrados rentas_totales 
##  Min.   :  0.00           Min.   :  0.0         Min.   :  1.0  
##  1st Qu.:  4.00           1st Qu.: 36.0         1st Qu.: 42.0  
##  Median : 17.00           Median :118.0         Median :145.0  
##  Mean   : 36.02           Mean   :155.6         Mean   :191.6  
##  3rd Qu.: 49.00           3rd Qu.:222.0         3rd Qu.:284.0  
##  Max.   :367.00           Max.   :886.0         Max.   :977.0
plot(base_de_datos$temperatura,base_de_datos$rentas_totales,main="Influencia de la Temperatura sobre las Rentas", xlab="Temperatura (°C)",ylab="Cantidad de Rentas")

Herramienta “El Generador de Valor de Datos”

Paso 1. Definir el área de negocio que buscamos impactar o mejorar y su KPI.
El departamento de mercadotecnia y comercial de la empresa de renta de bicis, en el indicador de cantidad de rentas con relación a la temperatura

Paso 2. Seleccionar plantilla (-s) para crear valor a partir de los datos de los clientes.
Visión / Segmentación / Personalización / Contextualización

Paso 3. Generar ideas o conceptos específicos
Elaborar una regresión lineal de rentas totales.

Paso 4. Reunir los datos requeridos
Elaborar una predicción con el modelo predictivo utilizando variale dependiente (Rentas Totales) y las variables independientes.

Paso 5. Plan de ejecución
Mercadotecnia elaborará plan para poder incrementar rentas semanales en temporadas bajas.

Paso 3.

Generar regresión lineal

regresion <- lm(rentas_totales ~ hora + dia + mes + año + estacion + dia_de_la_semana + asueto + temperatura + sensacion_termica + humedad + velocidad_del_viento, data=base_de_datos)
summary(regresion)
## 
## Call:
## lm(formula = rentas_totales ~ hora + dia + mes + año + estacion + 
##     dia_de_la_semana + asueto + temperatura + sensacion_termica + 
##     humedad + velocidad_del_viento, data = base_de_datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -305.52  -93.64  -27.70   61.85  649.10 
## 
## Coefficients:
##                        Estimate Std. Error t value Pr(>|t|)    
## (Intercept)          -1.661e+05  5.496e+03 -30.217  < 2e-16 ***
## hora                  7.735e+00  2.070e-01  37.368  < 2e-16 ***
## dia                   3.844e-01  2.482e-01   1.549  0.12150    
## mes                   9.996e+00  1.682e+00   5.943 2.89e-09 ***
## año                   8.258e+01  2.732e+00  30.225  < 2e-16 ***
## estacion             -7.774e+00  5.177e+00  -1.502  0.13324    
## dia_de_la_semana      4.393e-01  6.918e-01   0.635  0.52545    
## asueto               -4.864e+00  8.365e+00  -0.582  0.56089    
## temperatura           1.582e+00  1.038e+00   1.524  0.12752    
## sensacion_termica     4.748e+00  9.552e-01   4.971 6.76e-07 ***
## humedad              -2.115e+00  7.884e-02 -26.827  < 2e-16 ***
## velocidad_del_viento  5.582e-01  1.809e-01   3.086  0.00203 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 141.7 on 10874 degrees of freedom
## Multiple R-squared:  0.3891, Adjusted R-squared:  0.3885 
## F-statistic: 629.6 on 11 and 10874 DF,  p-value: < 2.2e-16

Paso 4.

Evaluar, y en caso necesario, ajustar la regresión lineal

regresion <- lm(rentas_totales ~ hora + mes + año + sensacion_termica + humedad + velocidad_del_viento, data=base_de_datos)
summary(regresion)
## 
## Call:
## lm(formula = rentas_totales ~ hora + mes + año + sensacion_termica + 
##     humedad + velocidad_del_viento, data = base_de_datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -308.60  -93.85  -28.34   61.05  648.09 
## 
## Coefficients:
##                        Estimate Std. Error t value Pr(>|t|)    
## (Intercept)          -1.662e+05  5.496e+03 -30.250  < 2e-16 ***
## hora                  7.734e+00  2.070e-01  37.364  < 2e-16 ***
## mes                   7.574e+00  4.207e-01  18.002  < 2e-16 ***
## año                   8.266e+01  2.732e+00  30.258  < 2e-16 ***
## sensacion_termica     6.172e+00  1.689e-01  36.539  < 2e-16 ***
## humedad              -2.121e+00  7.858e-02 -26.988  < 2e-16 ***
## velocidad_del_viento  6.208e-01  1.771e-01   3.506 0.000457 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 141.7 on 10879 degrees of freedom
## Multiple R-squared:  0.3886, Adjusted R-squared:  0.3883 
## F-statistic:  1153 on 6 and 10879 DF,  p-value: < 2.2e-16

Modelo de predicción

Construir un modelo de predicción

datos_nuevos <- data.frame(hora=12, mes=1:12, año=2013, sensacion_termica=24, humedad=62, velocidad_del_viento=13)
predict(regresion,datos_nuevos)
##        1        2        3        4        5        6        7        8 
## 279.1478 286.7215 294.2952 301.8690 309.4427 317.0164 324.5901 332.1638 
##        9       10       11       12 
## 339.7375 347.3112 354.8849 362.4587

Conclusión

Para analizar la relación de dependencia entre variables, se usó la programación en R para poder obtener la regresión lineal.

En este código podemos observar como en el paso de entender la base de datos se usó la función de plot, la cuál da instrucción para hacer una representación visual de la base de datos con las variables indicadas, en este caso Temperatura y Cantidad de rentas. Esto se realizó para poder conocer la influencia que tenía la variable temperatura con la cantidad de rentas de bicis. Para asi poder ayudar al departamento comercial para que con apoyo del departamento de mercadotecnia se realice la estrategia que ayude a incrementar las rentas en temporadas bajas.

Finalmente, el saber hacer un modelo de predicción ayuda para “jugar” con la información y poder predecir acciones y/o tomar decisiones con fundamentos válidos.

LS0tCnRpdGxlOiAnTW9kZWxvIFByZWRpY3Rpdm86IFJlbnRhIGRlIEJpY2lzJwphdXRob3I6ICJJdmFubmEgR2FyemEgQTAxMjgzNzU5IgpkYXRlOiAiMjAyMi0wOS0wNSIKb3V0cHV0OiAKICBodG1sX2RvY3VtZW50OgogICAgdG9jOiB0cnVlCiAgICB0b2NfZmxvYXQ6IHRydWUKICAgIHRoZW1lOiBjZXJ1bGVhbgogICAgaGlnaGxpZ2h0OiB0YW5nbwogICAgY29kZV9kb3dubG9hZDogdHJ1ZQotLS0KCjxpbWcgc3JjPSAiL1VzZXJzL2l2YW5uYWdhcnphL0Rlc2t0b3AvYTUyMGI1NjIzYWRhMDEzZTIyOTJhZTQ3NzFiODcwZDkuZ2lmIj4KCiMgQ29ub2NlciBCRCAKCiMjIFBhc28gMS4gCioqSW1wb3J0YXIgYXJjaGl2byAuY3N2KioKCmBgYHtyfQpiYXNlX2RlX2RhdG9zIDwtIHJlYWQuY3N2KCIvVXNlcnMvaXZhbm5hZ2FyemEvRG93bmxvYWRzL3JlbnRhZGViaWNpcyAzLmNzdiIpCmBgYAoKIyMgUGFzbyAyLiAKKipFbnRlbmRlcmxlIGEgbGEgYmFzZSBkZSBkYXRvcyoqCgpgYGB7cn0KcmVzdW1lbiA8LSBzdW1tYXJ5KGJhc2VfZGVfZGF0b3MpCnJlc3VtZW4KCnBsb3QoYmFzZV9kZV9kYXRvcyR0ZW1wZXJhdHVyYSxiYXNlX2RlX2RhdG9zJHJlbnRhc190b3RhbGVzLG1haW49IkluZmx1ZW5jaWEgZGUgbGEgVGVtcGVyYXR1cmEgc29icmUgbGFzIFJlbnRhcyIsIHhsYWI9IlRlbXBlcmF0dXJhICjCsEMpIix5bGFiPSJDYW50aWRhZCBkZSBSZW50YXMiKQpgYGAKCiMgKipIZXJyYW1pZW50YSAiRWwgR2VuZXJhZG9yIGRlIFZhbG9yIGRlIERhdG9zIioqICAKCioqUGFzbyAxLiBEZWZpbmlyIGVsIMOhcmVhIGRlIG5lZ29jaW8gcXVlIGJ1c2NhbW9zIGltcGFjdGFyIG8gbWVqb3JhciB5IHN1IEtQSS4qKiAgCipFbCBkZXBhcnRhbWVudG8gZGUgbWVyY2Fkb3RlY25pYSB5IGNvbWVyY2lhbCBkZSBsYSBlbXByZXNhIGRlIHJlbnRhIGRlIGJpY2lzLCBlbiBlbCBpbmRpY2Fkb3IgZGUgY2FudGlkYWQgZGUgcmVudGFzIGNvbiByZWxhY2nDs24gYSBsYSB0ZW1wZXJhdHVyYSAqICAKCioqUGFzbyAyLiBTZWxlY2Npb25hciBwbGFudGlsbGEgKC1zKSBwYXJhIGNyZWFyIHZhbG9yIGEgcGFydGlyIGRlIGxvcyBkYXRvcyBkZSBsb3MgY2xpZW50ZXMuKiogIAoqKlZpc2nDs24qKiAqLyBTZWdtZW50YWNpw7NuIC8gUGVyc29uYWxpemFjacOzbiAvIENvbnRleHR1YWxpemFjacOzbioKCioqUGFzbyAzLiBHZW5lcmFyIGlkZWFzIG8gY29uY2VwdG9zIGVzcGVjw61maWNvcyoqICAKKkVsYWJvcmFyIHVuYSByZWdyZXNpw7NuIGxpbmVhbCBkZSByZW50YXMgdG90YWxlcy4qICAKCioqUGFzbyA0LiBSZXVuaXIgbG9zIGRhdG9zIHJlcXVlcmlkb3MqKiAgCipFbGFib3JhciB1bmEgcHJlZGljY2nDs24gY29uIGVsIG1vZGVsbyBwcmVkaWN0aXZvIHV0aWxpemFuZG8gdmFyaWFsZSBkZXBlbmRpZW50ZSAoUmVudGFzIFRvdGFsZXMpIHkgbGFzIHZhcmlhYmxlcyBpbmRlcGVuZGllbnRlcy4qICAKCioqUGFzbyA1LiBQbGFuIGRlIGVqZWN1Y2nDs24qKiAgCipNZXJjYWRvdGVjbmlhIGVsYWJvcmFyw6EgcGxhbiBwYXJhIHBvZGVyIGluY3JlbWVudGFyIHJlbnRhcyBzZW1hbmFsZXMgZW4gdGVtcG9yYWRhcyBiYWphcy4qCgojIyBQYXNvIDMuIAoqKkdlbmVyYXIgcmVncmVzacOzbiBsaW5lYWwqKgoKYGBge3J9CnJlZ3Jlc2lvbiA8LSBsbShyZW50YXNfdG90YWxlcyB+IGhvcmEgKyBkaWEgKyBtZXMgKyBhw7FvICsgZXN0YWNpb24gKyBkaWFfZGVfbGFfc2VtYW5hICsgYXN1ZXRvICsgdGVtcGVyYXR1cmEgKyBzZW5zYWNpb25fdGVybWljYSArIGh1bWVkYWQgKyB2ZWxvY2lkYWRfZGVsX3ZpZW50bywgZGF0YT1iYXNlX2RlX2RhdG9zKQpzdW1tYXJ5KHJlZ3Jlc2lvbikKYGBgCgojIyBQYXNvIDQuIAoqKkV2YWx1YXIsIHkgZW4gY2FzbyBuZWNlc2FyaW8sIGFqdXN0YXIgbGEgcmVncmVzacOzbiBsaW5lYWwqKgoKYGBge3J9CnJlZ3Jlc2lvbiA8LSBsbShyZW50YXNfdG90YWxlcyB+IGhvcmEgKyBtZXMgKyBhw7FvICsgc2Vuc2FjaW9uX3Rlcm1pY2EgKyBodW1lZGFkICsgdmVsb2NpZGFkX2RlbF92aWVudG8sIGRhdGE9YmFzZV9kZV9kYXRvcykKc3VtbWFyeShyZWdyZXNpb24pCmBgYAoKIyBNb2RlbG8gZGUgcHJlZGljY2nDs24gCioqQ29uc3RydWlyIHVuIG1vZGVsbyBkZSBwcmVkaWNjacOzbioqCgpgYGB7cn0KZGF0b3NfbnVldm9zIDwtIGRhdGEuZnJhbWUoaG9yYT0xMiwgbWVzPTE6MTIsIGHDsW89MjAxMywgc2Vuc2FjaW9uX3Rlcm1pY2E9MjQsIGh1bWVkYWQ9NjIsIHZlbG9jaWRhZF9kZWxfdmllbnRvPTEzKQpwcmVkaWN0KHJlZ3Jlc2lvbixkYXRvc19udWV2b3MpCmBgYAoKCiMgQ29uY2x1c2nDs24KUGFyYSBhbmFsaXphciBsYSByZWxhY2nDs24gZGUgZGVwZW5kZW5jaWEgZW50cmUgdmFyaWFibGVzLCBzZSB1c8OzIGxhIHByb2dyYW1hY2nDs24gZW4gKlIqIHBhcmEgcG9kZXIgb2J0ZW5lciBsYSByZWdyZXNpw7NuIGxpbmVhbC4gIAoKRW4gZXN0ZSBjw7NkaWdvIHBvZGVtb3Mgb2JzZXJ2YXIgY29tbyBlbiBlbCBwYXNvIGRlIGVudGVuZGVyIGxhIGJhc2UgZGUgZGF0b3Mgc2UgdXPDsyBsYSBmdW5jacOzbiBkZSAqcGxvdCosIGxhIGN1w6FsIGRhIGluc3RydWNjacOzbiBwYXJhIGhhY2VyIHVuYSByZXByZXNlbnRhY2nDs24gdmlzdWFsIGRlIGxhIGJhc2UgZGUgZGF0b3MgY29uIGxhcyB2YXJpYWJsZXMgaW5kaWNhZGFzLCBlbiBlc3RlIGNhc28gVGVtcGVyYXR1cmEgeSBDYW50aWRhZCBkZSByZW50YXMuIEVzdG8gc2UgcmVhbGl6w7MgcGFyYSBwb2RlciBjb25vY2VyIGxhIGluZmx1ZW5jaWEgcXVlIHRlbsOtYSBsYSB2YXJpYWJsZSB0ZW1wZXJhdHVyYSBjb24gbGEgY2FudGlkYWQgZGUgcmVudGFzIGRlIGJpY2lzLiBQYXJhIGFzaSBwb2RlciBheXVkYXIgYWwgZGVwYXJ0YW1lbnRvIGNvbWVyY2lhbCBwYXJhIHF1ZSBjb24gYXBveW8gZGVsIGRlcGFydGFtZW50byBkZSBtZXJjYWRvdGVjbmlhIHNlIHJlYWxpY2UgbGEgZXN0cmF0ZWdpYSBxdWUgYXl1ZGUgYSBpbmNyZW1lbnRhciBsYXMgcmVudGFzIGVuIHRlbXBvcmFkYXMgYmFqYXMuIAoKRmluYWxtZW50ZSwgZWwgc2FiZXIgaGFjZXIgdW4gbW9kZWxvIGRlIHByZWRpY2Npw7NuIGF5dWRhIHBhcmEgImp1Z2FyIiBjb24gbGEgaW5mb3JtYWNpw7NuIHkgcG9kZXIgcHJlZGVjaXIgYWNjaW9uZXMgeS9vIHRvbWFyIGRlY2lzaW9uZXMgY29uIGZ1bmRhbWVudG9zIHbDoWxpZG9zLiAK