library(readxl)
Excel_total <- read_excel("Excel total.xlsx")
## New names:
## • `` -> `...1`
## • `NO APLICA` -> `NO APLICA...6`
## • `SIN DATO` -> `SIN DATO...8`
## • `NO APLICA` -> `NO APLICA...41`
## • `SIN DATO` -> `SIN DATO...46`
cor(Excel_total[,2:5])
## CAIDA DE OCUPANTE CICLISTA ARROYADO
## CAIDA DE OCUPANTE 1.0000000 0.4746776
## CICLISTA ARROYADO 0.4746776 1.0000000
## COLISION CON OBJETO FIJO -0.2596467 0.3149295
## COLISION CON OBJETO MOVIL -0.1855783 -0.2428655
## COLISION CON OBJETO FIJO COLISION CON OBJETO MOVIL
## CAIDA DE OCUPANTE -0.2596467 -0.1855783
## CICLISTA ARROYADO 0.3149295 -0.2428655
## COLISION CON OBJETO FIJO 1.0000000 -0.2371988
## COLISION CON OBJETO MOVIL -0.2371988 1.0000000
Excel_total<-Excel_total[sapply(Excel_total,is.numeric)]
matriz_correlacion <-cor(Excel_total[,2:5])
library(corrplot)
## corrplot 0.95 loaded
# Visualizar la matriz de correlación
corrplot(matriz_correlacion, method = "number") #pueden sustituir number por: circle, color, pie, shade (cambia el aspecto visual de la matriz)
La matriz de correlación de la imagen muestra 4 variables:
* CAÍDA DE OCUPANTE
* CICLISTA ARROLLADO
* COLISIÓN CON OBJETO FIJO
* COLISIÓN CON OBJETO MÓVIL
Cada celda de la tabla muestra el coeficiente de correlación entre dos de estas variables. En la diagonal principal siempre aparece el valor de 1.00, pues ahí se muestra la correlación de cada variable consigo misma.
El valor de correlación es 0.47, que indica una correlación positiva moderada. Aunque es una correlación positiva, es moderada, lo que indica que no es un indicador muy fuerte como para poder establecer una relación entre los dos.
“CAÍDA DE OCUPANTE” con “COLISIÓN CON OBJETO FIJO”: -0.26
“CAÍDA DE OCUPANTE” con “COLISIÓN CON OBJETO MÓVIL”: -0.19 Ambas correlaciones son negativas y de magnitud relativamente baja (entre -0.19 y -0.26), lo que sugiere que cuando ocurren más caídas de ocupante, hay una ligera tendencia a que disminuyan las colisiones con objeto fijo o móvil, aunque la relación no es muy fuerte.
“CICLISTA ARROLLADO” con “COLISIÓN CON OBJETO FIJO”: 0.31
“CICLISTA ARROLLADO” con “COLISIÓN CON OBJETO MÓVIL”: -0.24
Esto señala que, en el caso de colisiones con objeto fijo, los casos de ciclistas arrollados tienden a aumentar, mientras que en colisiones con objeto móvil, se presenta una ligera tendencia a la baja en su ocurrencia.
El valor es -0.24, que indica una correlación negativa muy ligera. Esto refleja una relación negativa muy débil que sugiere que las variaciones en una de estas variables tienen poca asociación con las variaciones en la otra.
Años = seq(2004,2021)
datos = Excel_total[,2]
datosS=ts(datos, frequency = 2, start=c(2004,1))
datosS
## Time Series:
## Start = c(2004, 1)
## End = c(2012, 2)
## Frequency = 2
## CAIDA DE OCUPANTE
## [1,] 17
## [2,] 10
## [3,] 9
## [4,] 2
## [5,] 5
## [6,] 4
## [7,] 5
## [8,] 8
## [9,] 10
## [10,] 5
## [11,] 6
## [12,] 10
## [13,] 1
## [14,] 7
## [15,] 4
## [16,] 6
## [17,] 5
## [18,] 1
plot(datosS)
mod1= HoltWinters(datosS, seasonal="additive")
plot(mod1)
Para este caso el eje X, representa el tiempo, abarcando desde aproximadamente 2005 hasta 2013. Por el otro lado, el eje Y, muestra los valores observados y ajustados. Para entender el gráfico hay que tener presente que la línea azul representa los valores reales observados en la serie temporal, y la línea roja representa los valores ajustados generados por el modelo Holt-Winters. Se puede evidenciar patrones de tendencia general ya que al inicio (2005–2007) se observa una disminución en los valores reales, pero los años siguientes entre 2008 y 2010, los datos muestran un comportamiento irregular, donde destacan caídas bruscas y picos altos. Por último, de 2010 en adelante, se estabiliza por lo tanto no presenta mayor variabilidad. En cuanto al modelo Holt-Winters intenta seguir la serie observada, pero hay varios puntos donde el ajuste se desvía significativamente de los valores reales, especialmente en los años 2006–2009. Nuevamente, a partir de 2010, el modelo se aproxima más a los datos observados por lo que podemos considerar un mejor desempeño en esta etapa final.
ap.prediccion <- predict(mod1,n.ahead=2)##prediccion
ts.plot(datosS,ap.prediccion,lty=1:2,col=c("blue","red"))
A partir de la gráfica mostrada, se observa lo siguiente: 1. Eje de Tiempo y Comportamiento Histórico (2004 - 2012) - La serie inicia en 2004 con un valor relativamente alto (cerca de 15 en el eje vertical) y desciende de manera notable hasta aproximadamente 2006. - A partir de allí, se distinguen fluctuaciones con picos y valles que oscilan entre valores cercanos a 6 u 8 y otros por encima de 10 o incluso 12. - Hacia 2012, la serie presenta un descenso más marcado, rondando valores por debajo de 8. 2. Suavización/Modelo de Predicción - Este trazo rojo muestra una tendencia descendente o al menos en continuo descenso en el corto plazo (hasta donde alcanza la gráfica). 3. Interpretación de la Tendencia - El pronóstico sugiere que, de mantenerse las condiciones reflejadas en el historial de datos, los valores podrían continuar disminuyendo o permanecer relativamente bajos, sin vislumbrar un repunte inmediato. - No hay indicios claros de una estacionalidad muy marcada (como subidas y bajadas regulares en intervalos fijos) dentro del tramo visible, más allá de fluctuaciones anuales.