Renta de Bicis

Renta de bicis

Paso 1: Importar base de datos .csv

#file.choose()
bd <- read.csv("/Users/mac/Downloads/rentadebicis.csv")

Paso 2: Entender la Base de Datos

resumen <- summary(bd)
resumen
##       hora            dia              mes              año      
##  Min.   : 0.00   Min.   : 1.000   Min.   : 1.000   Min.   :2011  
##  1st Qu.: 6.00   1st Qu.: 5.000   1st Qu.: 4.000   1st Qu.:2011  
##  Median :12.00   Median :10.000   Median : 7.000   Median :2012  
##  Mean   :11.54   Mean   : 9.993   Mean   : 6.521   Mean   :2012  
##  3rd Qu.:18.00   3rd Qu.:15.000   3rd Qu.:10.000   3rd Qu.:2012  
##  Max.   :23.00   Max.   :19.000   Max.   :12.000   Max.   :2012  
##     estacion     dia_de_la_semana     asueto         temperatura   
##  Min.   :1.000   Min.   :1.000    Min.   :0.00000   Min.   : 0.82  
##  1st Qu.:2.000   1st Qu.:2.000    1st Qu.:0.00000   1st Qu.:13.94  
##  Median :3.000   Median :4.000    Median :0.00000   Median :20.50  
##  Mean   :2.507   Mean   :4.014    Mean   :0.02857   Mean   :20.23  
##  3rd Qu.:4.000   3rd Qu.:6.000    3rd Qu.:0.00000   3rd Qu.:26.24  
##  Max.   :4.000   Max.   :7.000    Max.   :1.00000   Max.   :41.00  
##  sensacion_termica    humedad       velocidad_del_viento
##  Min.   : 0.76     Min.   :  0.00   Min.   : 0.000      
##  1st Qu.:16.66     1st Qu.: 47.00   1st Qu.: 7.002      
##  Median :24.24     Median : 62.00   Median :12.998      
##  Mean   :23.66     Mean   : 61.89   Mean   :12.799      
##  3rd Qu.:31.06     3rd Qu.: 77.00   3rd Qu.:16.998      
##  Max.   :45.45     Max.   :100.00   Max.   :56.997      
##  rentas_de_no_registrados rentas_de_registrados rentas_totales 
##  Min.   :  0.00           Min.   :  0.0         Min.   :  1.0  
##  1st Qu.:  4.00           1st Qu.: 36.0         1st Qu.: 42.0  
##  Median : 17.00           Median :118.0         Median :145.0  
##  Mean   : 36.02           Mean   :155.6         Mean   :191.6  
##  3rd Qu.: 49.00           3rd Qu.:222.0         3rd Qu.:284.0  
##  Max.   :367.00           Max.   :886.0         Max.   :977.0

Observaciones

Por que los dias llegan hasta el 19 y no hasta el 31?

¿Que significan los numeros en las estaciones? R: 1 es primavera, 2 es Verano, 3 es Otoño, 4 es Invierno

?plot
## Help on topic 'plot' was found in the following packages:
## 
##   Package               Library
##   graphics              /Library/Frameworks/R.framework/Versions/4.2/Resources/library
##   base                  /Library/Frameworks/R.framework/Resources/library
## 
## 
## Using the first match ...
plot(bd$temperatura,bd$rentas_totales, main="Influencia de la Temperatura sobre las Rentas Totales", xlab="Temperatura", ylab="Cantidad")

Generar Regresion Lineal

regresion <- lm (rentas_totales ~ hora + dia + mes + año + estacion + dia_de_la_semana +asueto + temperatura + sensacion_termica + humedad + velocidad_del_viento, data=bd)
summary (regresion)
## 
## Call:
## lm(formula = rentas_totales ~ hora + dia + mes + año + estacion + 
##     dia_de_la_semana + asueto + temperatura + sensacion_termica + 
##     humedad + velocidad_del_viento, data = bd)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -305.52  -93.64  -27.70   61.85  649.10 
## 
## Coefficients:
##                        Estimate Std. Error t value Pr(>|t|)    
## (Intercept)          -1.661e+05  5.496e+03 -30.217  < 2e-16 ***
## hora                  7.735e+00  2.070e-01  37.368  < 2e-16 ***
## dia                   3.844e-01  2.482e-01   1.549  0.12150    
## mes                   9.996e+00  1.682e+00   5.943 2.89e-09 ***
## año                   8.258e+01  2.732e+00  30.225  < 2e-16 ***
## estacion             -7.774e+00  5.177e+00  -1.502  0.13324    
## dia_de_la_semana      4.393e-01  6.918e-01   0.635  0.52545    
## asueto               -4.864e+00  8.365e+00  -0.582  0.56089    
## temperatura           1.582e+00  1.038e+00   1.524  0.12752    
## sensacion_termica     4.748e+00  9.552e-01   4.971 6.76e-07 ***
## humedad              -2.115e+00  7.884e-02 -26.827  < 2e-16 ***
## velocidad_del_viento  5.582e-01  1.809e-01   3.086  0.00203 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 141.7 on 10874 degrees of freedom
## Multiple R-squared:  0.3891, Adjusted R-squared:  0.3885 
## F-statistic: 629.6 on 11 and 10874 DF,  p-value: < 2.2e-16

Evaluar y en caso necesario ajustar la regresion lineal

regresion <- lm (rentas_totales ~ hora + año + sensacion_termica + humedad + velocidad_del_viento, data=bd)
summary (regresion)
## 
## Call:
## lm(formula = rentas_totales ~ hora + año + sensacion_termica + 
##     humedad + velocidad_del_viento, data = bd)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -319.25  -94.61  -27.27   60.26  671.26 
## 
## Coefficients:
##                        Estimate Std. Error t value Pr(>|t|)    
## (Intercept)          -1.656e+05  5.577e+03 -29.696   <2e-16 ***
## hora                  7.817e+00  2.100e-01  37.223   <2e-16 ***
## año                   8.235e+01  2.772e+00  29.706   <2e-16 ***
## sensacion_termica     6.990e+00  1.651e-01  42.342   <2e-16 ***
## humedad              -1.853e+00  7.830e-02 -23.663   <2e-16 ***
## velocidad_del_viento  3.805e-01  1.792e-01   2.124   0.0337 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 143.8 on 10880 degrees of freedom
## Multiple R-squared:  0.3704, Adjusted R-squared:  0.3701 
## F-statistic:  1280 on 5 and 10880 DF,  p-value: < 2.2e-16

Construir Modelo Predictivo

datos_nuevos <- data.frame(hora=12, mes=1, año=2013, sensacion_termica=24, humedad=62, velocidad_del_viento=13)
predict(regresion,datos_nuevos)
##        1 
## 320.7996

Gráfica para conocer relación

plot(bd$sensacion_termica,bd$rentas_totales, main= "Influencia de la sensación térmica sobre la renta total", xlab= "Sensación Térmica", ylab= "Rentas totales")

plot(bd$humedad,bd$rentas_totales, main= "Influencia de la humedad sobre la renta total", xlab= "Humedad", ylab= "Rentas totales")

plot(bd$velocidad_del_viento,bd$rentas_totales, main= "Influencia de la velocidad del viento sobre la renta total", xlab= "Velocidad del viento", ylab= "Rentas totales")

Conclusion

El modelo predictivo se construye con la recolección de datos, este nos sirve para predecir y pronosticar futuros resultados que permitan poder tomar decisiones.

Durante esta actividad realizamos un análisis en donde se construyó un modelo con una linea de regresión, pudimos notar que en la primera grafica entre más temperatura más son las rentas de bicis sin embargo, al momento de realizar la regresión los resultados mostraron que las variables día, estación, día de la semana, asueto y temperatura no tenían significancia ya que no muestran ni un asterisco, por lo que las variables con las que si hay significancia y forman parte del modelo predictivo son:

Hora, Mes, Año, Sensación térmica, Humedad, Velocidad del viento.

Por otro lado realizamos tres gráficas para observar el comportamiento de las variables en cuanto a su relación, eso quiere decir que cuando hay una humedad intermedia hay mas rentas y que entre menos viento haya la gente utiliza más las bicicletas.

Por ultimo el modelo tiene una Rsquared de 38.85%, lo que nos dice que es un buen modelo predictivo ya que entre más se acerque al 100% más efectivo tiene que ser.

LS0tCnRpdGxlOiAiUmVudGEgZGUgQmljaXMiCmF1dGhvcjogIkNhcmxvcyBDYXJyaWxsbyIKZGF0ZTogIjIwMjItMTAtMDQiCm91dHB1dDoKICBodG1sX2RvY3VtZW50OgogICB0b2M6IHRydWUKICAgdG9jX2Zsb2F0OiB0cnVlIAogICBjb2RlX2Rvd25sb2FkOiB0cnVlCi0tLQoKPGIgc3R5bGUgPSAnY29sb3IgOiBncmVlbjsgZm9udC1zaXplOiA1MHB4Oyc+CiBSZW50YSBkZSBCaWNpczwvYj4KCjxpbWcgc3JjPSIvVXNlcnMvbWFjL0Rvd25sb2Fkcy9CaWNpcyBJbWFnZW4uanBlZyI+CgoKIyBSZW50YSBkZSBiaWNpcwoKIyBQYXNvIDE6IEltcG9ydGFyIGJhc2UgZGUgZGF0b3MgLmNzdgpgYGB7cn0KCiNmaWxlLmNob29zZSgpCmJkIDwtIHJlYWQuY3N2KCIvVXNlcnMvbWFjL0Rvd25sb2Fkcy9yZW50YWRlYmljaXMuY3N2IikKYGBgCgoKIyBQYXNvIDI6IEVudGVuZGVyIGxhIEJhc2UgZGUgRGF0b3MKYGBge3J9CgpyZXN1bWVuIDwtIHN1bW1hcnkoYmQpCnJlc3VtZW4KYGBgCgoKIyBPYnNlcnZhY2lvbmVzCgojIyMjICBQb3IgcXVlIGxvcyBkaWFzIGxsZWdhbiBoYXN0YSBlbCAxOSB5IG5vIGhhc3RhIGVsIDMxPwojIyMjICDCv1F1ZSBzaWduaWZpY2FuIGxvcyBudW1lcm9zIGVuIGxhcyBlc3RhY2lvbmVzPyBSOiAxIGVzIHByaW1hdmVyYSwgMiBlcyBWZXJhbm8sIDMgZXMgT3Rvw7FvLCA0IGVzIEludmllcm5vCgpgYGB7cn0KCj9wbG90CgpwbG90KGJkJHRlbXBlcmF0dXJhLGJkJHJlbnRhc190b3RhbGVzLCBtYWluPSJJbmZsdWVuY2lhIGRlIGxhIFRlbXBlcmF0dXJhIHNvYnJlIGxhcyBSZW50YXMgVG90YWxlcyIsIHhsYWI9IlRlbXBlcmF0dXJhIiwgeWxhYj0iQ2FudGlkYWQiKQpgYGAKCgojIEdlbmVyYXIgUmVncmVzaW9uIExpbmVhbAoKYGBge3J9CgpyZWdyZXNpb24gPC0gbG0gKHJlbnRhc190b3RhbGVzIH4gaG9yYSArIGRpYSArIG1lcyArIGHDsW8gKyBlc3RhY2lvbiArIGRpYV9kZV9sYV9zZW1hbmEgK2FzdWV0byArIHRlbXBlcmF0dXJhICsgc2Vuc2FjaW9uX3Rlcm1pY2EgKyBodW1lZGFkICsgdmVsb2NpZGFkX2RlbF92aWVudG8sIGRhdGE9YmQpCnN1bW1hcnkgKHJlZ3Jlc2lvbikKYGBgCgojIEV2YWx1YXIgeSBlbiBjYXNvIG5lY2VzYXJpbyBhanVzdGFyIGxhIHJlZ3Jlc2lvbiBsaW5lYWwKCmBgYHtyfQoKcmVncmVzaW9uIDwtIGxtIChyZW50YXNfdG90YWxlcyB+IGhvcmEgKyBhw7FvICsgc2Vuc2FjaW9uX3Rlcm1pY2EgKyBodW1lZGFkICsgdmVsb2NpZGFkX2RlbF92aWVudG8sIGRhdGE9YmQpCnN1bW1hcnkgKHJlZ3Jlc2lvbikKYGBgCgojIENvbnN0cnVpciBNb2RlbG8gUHJlZGljdGl2bwoKYGBge3J9CgpkYXRvc19udWV2b3MgPC0gZGF0YS5mcmFtZShob3JhPTEyLCBtZXM9MSwgYcOxbz0yMDEzLCBzZW5zYWNpb25fdGVybWljYT0yNCwgaHVtZWRhZD02MiwgdmVsb2NpZGFkX2RlbF92aWVudG89MTMpCnByZWRpY3QocmVncmVzaW9uLGRhdG9zX251ZXZvcykKYGBgCgoKIyBHcsOhZmljYSBwYXJhIGNvbm9jZXIgcmVsYWNpw7NuCmBgYHtyfQoKcGxvdChiZCRzZW5zYWNpb25fdGVybWljYSxiZCRyZW50YXNfdG90YWxlcywgbWFpbj0gIkluZmx1ZW5jaWEgZGUgbGEgc2Vuc2FjacOzbiB0w6lybWljYSBzb2JyZSBsYSByZW50YSB0b3RhbCIsIHhsYWI9ICJTZW5zYWNpw7NuIFTDqXJtaWNhIiwgeWxhYj0gIlJlbnRhcyB0b3RhbGVzIikKCnBsb3QoYmQkaHVtZWRhZCxiZCRyZW50YXNfdG90YWxlcywgbWFpbj0gIkluZmx1ZW5jaWEgZGUgbGEgaHVtZWRhZCBzb2JyZSBsYSByZW50YSB0b3RhbCIsIHhsYWI9ICJIdW1lZGFkIiwgeWxhYj0gIlJlbnRhcyB0b3RhbGVzIikKCnBsb3QoYmQkdmVsb2NpZGFkX2RlbF92aWVudG8sYmQkcmVudGFzX3RvdGFsZXMsIG1haW49ICJJbmZsdWVuY2lhIGRlIGxhIHZlbG9jaWRhZCBkZWwgdmllbnRvIHNvYnJlIGxhIHJlbnRhIHRvdGFsIiwgeGxhYj0gIlZlbG9jaWRhZCBkZWwgdmllbnRvIiwgeWxhYj0gIlJlbnRhcyB0b3RhbGVzIikKCmBgYAoKCiMgKkNvbmNsdXNpb24qCgojIyMjICAqRWwgbW9kZWxvIHByZWRpY3Rpdm8gc2UgY29uc3RydXllIGNvbiBsYSByZWNvbGVjY2nDs24gZGUgZGF0b3MsIGVzdGUgbm9zIHNpcnZlIHBhcmEgcHJlZGVjaXIgeSBwcm9ub3N0aWNhciBmdXR1cm9zIHJlc3VsdGFkb3MgcXVlIHBlcm1pdGFuIHBvZGVyIHRvbWFyIGRlY2lzaW9uZXMuKgoKIyMjIyAgKkR1cmFudGUgZXN0YSBhY3RpdmlkYWQgcmVhbGl6YW1vcyB1biBhbsOhbGlzaXMgZW4gZG9uZGUgc2UgY29uc3RydXnDsyB1biBtb2RlbG8gY29uIHVuYSBsaW5lYSBkZSByZWdyZXNpw7NuLCBwdWRpbW9zIG5vdGFyIHF1ZSBlbiBsYSBwcmltZXJhIGdyYWZpY2EgZW50cmUgbcOhcyB0ZW1wZXJhdHVyYSBtw6FzIHNvbiBsYXMgcmVudGFzIGRlIGJpY2lzIHNpbiBlbWJhcmdvLCBhbCBtb21lbnRvIGRlIHJlYWxpemFyIGxhIHJlZ3Jlc2nDs24gbG9zIHJlc3VsdGFkb3MgbW9zdHJhcm9uIHF1ZSBsYXMgdmFyaWFibGVzIGTDrWEsIGVzdGFjacOzbiwgZMOtYSBkZSBsYSBzZW1hbmEsIGFzdWV0byB5IHRlbXBlcmF0dXJhIG5vIHRlbsOtYW4gc2lnbmlmaWNhbmNpYSB5YSBxdWUgbm8gbXVlc3RyYW4gbmkgdW4gYXN0ZXJpc2NvLCBwb3IgbG8gcXVlIGxhcyB2YXJpYWJsZXMgY29uIGxhcyBxdWUgc2kgaGF5IHNpZ25pZmljYW5jaWEgeSBmb3JtYW4gcGFydGUgZGVsIG1vZGVsbyBwcmVkaWN0aXZvIHNvbjoqCgojIyMjICAqSG9yYSwgTWVzLCBBw7FvLCBTZW5zYWNpw7NuIHTDqXJtaWNhLCBIdW1lZGFkLCBWZWxvY2lkYWQgZGVsIHZpZW50by4qCgojIyMjICAqUG9yIG90cm8gbGFkbyByZWFsaXphbW9zIHRyZXMgZ3LDoWZpY2FzIHBhcmEgb2JzZXJ2YXIgZWwgY29tcG9ydGFtaWVudG8gZGUgbGFzIHZhcmlhYmxlcyBlbiBjdWFudG8gYSBzdSByZWxhY2nDs24sIGVzbyBxdWllcmUgZGVjaXIgcXVlIGN1YW5kbyBoYXkgdW5hIGh1bWVkYWQgaW50ZXJtZWRpYSBoYXkgbWFzIHJlbnRhcyB5IHF1ZSBlbnRyZSBtZW5vcyB2aWVudG8gaGF5YSBsYSBnZW50ZSB1dGlsaXphIG3DoXMgbGFzIGJpY2ljbGV0YXMuKgoKIyMjIyAgKlBvciB1bHRpbW8gZWwgbW9kZWxvIHRpZW5lIHVuYSBSc3F1YXJlZCBkZSAzOC44NSUsIGxvIHF1ZSBub3MgZGljZSBxdWUgZXMgdW4gYnVlbiBtb2RlbG8gcHJlZGljdGl2byB5YSBxdWUgZW50cmUgbcOhcyBzZSBhY2VycXVlIGFsIDEwMCUgbcOhcyBlZmVjdGl2byB0aWVuZSBxdWUgc2VyLioKCgo=