Análisis Exploratorio

library(readr)
Data<- read_delim("Precipitaciones_Totales_Mensuales_20240804E.csv", 
                  delim = ";", escape_double = FALSE, trim_ws = TRUE)
Warning: One or more parsing issues, call `problems()` on your data frame for details,
e.g.:
  dat <- vroom(...)
  problems(dat)
Rows: 6196 Columns: 19
── Column specification ────────────────────────────────────────────────────────
Delimiter: ";"
chr  (3): ESTACIÓN, MUNICIPIO, CUENCA
dbl (15): CÓDIGO, X=N, Y=E, AÑO, FEBRERO, MARZO, ABRIL, MAYO, JUNIO, JULIO, ...
num  (1): ENERO

ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
summary(Data)
   ESTACIÓN             CÓDIGO             X=N               Y=E         
 Length:6196        Min.   :2119022   Min.   :      0   Min.   :      0  
 Class :character   1st Qu.:2120156   1st Qu.:1018200   1st Qu.: 987380  
 Mode  :character   Median :2120565   Median :1053180   Median :1017125  
                    Mean   :2259878   Mean   :1046284   Mean   :1006884  
                    3rd Qu.:2401038   3rd Qu.:1077060   3rd Qu.:1031590  
                    Max.   :3509510   Max.   :1133250   Max.   :1134650  
                                                                         
  MUNICIPIO            CUENCA               AÑO           ENERO        
 Length:6196        Length:6196        Min.   :1919   Min.   :   0.00  
 Class :character   Class :character   1st Qu.:1977   1st Qu.:   8.60  
 Mode  :character   Mode  :character   Median :1993   Median :  26.05  
                                       Mean   :1991   Mean   :  39.42  
                                       3rd Qu.:2006   3rd Qu.:  53.40  
                                       Max.   :2019   Max.   :3097.00  
                                                                       
    FEBRERO           MARZO            ABRIL             MAYO      
 Min.   :  0.00   Min.   :  0.00   Min.   :  0.00   Min.   :  0.0  
 1st Qu.: 19.15   1st Qu.: 37.75   1st Qu.: 59.30   1st Qu.: 53.5  
 Median : 40.40   Median : 71.40   Median : 98.75   Median : 90.2  
 Mean   : 52.25   Mean   : 83.42   Mean   :115.18   Mean   :100.4  
 3rd Qu.: 71.00   3rd Qu.:113.40   3rd Qu.:154.50   3rd Qu.:134.6  
 Max.   :492.30   Max.   :670.70   Max.   :828.50   Max.   :823.5  
 NA's   :1        NA's   :1                                        
     JUNIO            JULIO            AGOSTO         SEPTIEMBRE    
 Min.   :  0.00   Min.   :  0.00   Min.   :  0.00   Min.   :  0.00  
 1st Qu.: 29.70   1st Qu.: 23.00   1st Qu.: 22.20   1st Qu.: 28.07  
 Median : 55.45   Median : 44.15   Median : 42.15   Median : 52.00  
 Mean   : 64.85   Mean   : 55.39   Mean   : 51.69   Mean   : 61.79  
 3rd Qu.: 88.00   3rd Qu.: 72.70   3rd Qu.: 69.50   3rd Qu.: 83.72  
 Max.   :791.00   Max.   :550.00   Max.   :500.50   Max.   :498.60  
                                                                    
    OCTUBRE        NOVIEMBRE       DICIEMBRE     
 Min.   :  0.0   Min.   :  0.0   Min.   :  0.00  
 1st Qu.: 58.5   1st Qu.: 52.9   1st Qu.: 18.20  
 Median :102.0   Median : 91.5   Median : 44.05  
 Mean   :113.5   Mean   :105.3   Mean   : 57.10  
 3rd Qu.:153.3   3rd Qu.:140.5   3rd Qu.: 80.53  
 Max.   :675.2   Max.   :767.0   Max.   :532.30  
                                                 
Data$CÓDIGO<- as.character(Data$CÓDIGO)
summary(Data)
   ESTACIÓN            CÓDIGO               X=N               Y=E         
 Length:6196        Length:6196        Min.   :      0   Min.   :      0  
 Class :character   Class :character   1st Qu.:1018200   1st Qu.: 987380  
 Mode  :character   Mode  :character   Median :1053180   Median :1017125  
                                       Mean   :1046284   Mean   :1006884  
                                       3rd Qu.:1077060   3rd Qu.:1031590  
                                       Max.   :1133250   Max.   :1134650  
                                                                          
  MUNICIPIO            CUENCA               AÑO           ENERO        
 Length:6196        Length:6196        Min.   :1919   Min.   :   0.00  
 Class :character   Class :character   1st Qu.:1977   1st Qu.:   8.60  
 Mode  :character   Mode  :character   Median :1993   Median :  26.05  
                                       Mean   :1991   Mean   :  39.42  
                                       3rd Qu.:2006   3rd Qu.:  53.40  
                                       Max.   :2019   Max.   :3097.00  
                                                                       
    FEBRERO           MARZO            ABRIL             MAYO      
 Min.   :  0.00   Min.   :  0.00   Min.   :  0.00   Min.   :  0.0  
 1st Qu.: 19.15   1st Qu.: 37.75   1st Qu.: 59.30   1st Qu.: 53.5  
 Median : 40.40   Median : 71.40   Median : 98.75   Median : 90.2  
 Mean   : 52.25   Mean   : 83.42   Mean   :115.18   Mean   :100.4  
 3rd Qu.: 71.00   3rd Qu.:113.40   3rd Qu.:154.50   3rd Qu.:134.6  
 Max.   :492.30   Max.   :670.70   Max.   :828.50   Max.   :823.5  
 NA's   :1        NA's   :1                                        
     JUNIO            JULIO            AGOSTO         SEPTIEMBRE    
 Min.   :  0.00   Min.   :  0.00   Min.   :  0.00   Min.   :  0.00  
 1st Qu.: 29.70   1st Qu.: 23.00   1st Qu.: 22.20   1st Qu.: 28.07  
 Median : 55.45   Median : 44.15   Median : 42.15   Median : 52.00  
 Mean   : 64.85   Mean   : 55.39   Mean   : 51.69   Mean   : 61.79  
 3rd Qu.: 88.00   3rd Qu.: 72.70   3rd Qu.: 69.50   3rd Qu.: 83.72  
 Max.   :791.00   Max.   :550.00   Max.   :500.50   Max.   :498.60  
                                                                    
    OCTUBRE        NOVIEMBRE       DICIEMBRE     
 Min.   :  0.0   Min.   :  0.0   Min.   :  0.00  
 1st Qu.: 58.5   1st Qu.: 52.9   1st Qu.: 18.20  
 Median :102.0   Median : 91.5   Median : 44.05  
 Mean   :113.5   Mean   :105.3   Mean   : 57.10  
 3rd Qu.:153.3   3rd Qu.:140.5   3rd Qu.: 80.53  
 Max.   :675.2   Max.   :767.0   Max.   :532.30  
                                                 
hist(Data$OCTUBRE,main="Histograma - Octubre", col="white")

boxplot(Data$OCTUBRE, main="Diagrama de Caja y Bigotes - Octubre", xlab="Octubre", ylab="Precipitación")

hist(Data$NOVIEMBRE,main="Histograma - Noviembre", col="white")

boxplot(Data$OCTUBRE, main="Diagrama de Caja y Bigotes - Noviembre", xlab="Noviembre", ylab="Precipitación")

hist(Data$DICIEMBRE,main="Histograma - Diciembre", col="white")

boxplot(Data$DICIEMBRE, main="Diagrama de Caja y Bigotes - Diciembre", xlab="Diciembre", ylab="Precipitación")

# Instalar y cargar kableExtra
library(kableExtra)

# Crear el data frame
cuadro_ope <- data.frame(
  Variable = c("estacion", "codigo", "x_n", "y_e", "municipio", "cuenca", "ano", "enero", "febrero", "marzo", "abril", "mayo", "junio", "julio", "agosto", "septiembre", "octubre", "noviembre", "diciembre"),
  Tipo = c("Cualitativa", "Cualitativa", "Cualitativa", "Cualitativa", "Cualitativa", "Cualitativa", "Cualitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa", "Cuantitativa"),
  Definición = c(
    "Nombre de la estación",
    "Código CAR de la estación",
    "Coordenada Este en metros desde el origen",
    "Coordenada Norte en metros desde el origen",
    "Municipio en el que se encuentra la estación",
    "Cuenca en la que se encuentra la estación",
    "Año de las observaciones",
    "Precipitación en enero (mm)",
    "Precipitación en febrero (mm)",
    "Precipitación en marzo (mm)",
    "Precipitación en abril (mm)",
    "Precipitación en mayo (mm)",
    "Precipitación en junio (mm)",
    "Precipitación en julio (mm)",
    "Precipitación en agosto (mm)",
    "Precipitación en septiembre (mm)",
    "Precipitación en octubre (mm)",
    "Precipitación en noviembre (mm)",
    "Precipitación en diciembre (mm)"
  ),
  stringsAsFactors = FALSE
)

# Crear tabla kable
cuadro_ope %>%
  kable("html", col.names = c("Variable", "Tipo", "Definición"), caption = "Cuadro de Operacionalización de Variables") %>%
  kable_styling(full_width = FALSE, position = "center", bootstrap_options = c("striped", "hover", "condensed", "bordered"))
Cuadro de Operacionalización de Variables
Variable Tipo Definición
estacion Cualitativa Nombre de la estación
codigo Cualitativa Código CAR de la estación
x_n Cualitativa Coordenada Este en metros desde el origen
y_e Cualitativa Coordenada Norte en metros desde el origen
municipio Cualitativa Municipio en el que se encuentra la estación
cuenca Cualitativa Cuenca en la que se encuentra la estación
ano Cualitativa Año de las observaciones
enero Cuantitativa Precipitación en enero (mm)
febrero Cuantitativa Precipitación en febrero (mm)
marzo Cuantitativa Precipitación en marzo (mm)
abril Cuantitativa Precipitación en abril (mm)
mayo Cuantitativa Precipitación en mayo (mm)
junio Cuantitativa Precipitación en junio (mm)
julio Cuantitativa Precipitación en julio (mm)
agosto Cuantitativa Precipitación en agosto (mm)
septiembre Cuantitativa Precipitación en septiembre (mm)
octubre Cuantitativa Precipitación en octubre (mm)
noviembre Cuantitativa Precipitación en noviembre (mm)
diciembre Cuantitativa Precipitación en diciembre (mm)
library(readr)

Análisis de Asimetría y Normalidad

Se ha realizado un análisis de la asimetría, curtosis y una prueba de normalidad (Shapiro-Wilk) para los datos de precipitación de los meses de octubre, noviembre y diciembre. A continuación se presentan los resultados:

  • Octubre:
    • Asimetría: 1.29 (asimetría positiva)
    • Curtosis: 3.48 (leptocúrtica)
    • Prueba de Shapiro-Wilk p-valor: 0.0 (no sigue una distribución normal)
  • Noviembre:
    • Asimetría: 1.69 (asimetría positiva)
    • Curtosis: 5.79 (leptocúrtica)
    • Prueba de Shapiro-Wilk p-valor: 0.0 (no sigue una distribución normal)
  • Diciembre:
    • Asimetría: 1.97 (asimetría positiva)
    • Curtosis: 6.50 (leptocúrtica)
    • Prueba de Shapiro-Wilk p-valor: 0.0 (no sigue una distribución normal)

Conclusiones

  • Los datos de los tres meses presentan asimetría positiva, indicando que la cola derecha es más larga y que hay más valores extremos a la derecha.
  • Los datos no se ajustan a una distribución normal, lo cual es confirmado por la prueba de Shapiro-Wilk y los valores de asimetría y curtosis.
Grupo1 <- subset(Data, Data$MUNICIPIO == "Zipaquirá")

Grupo2 <- subset(Data, Data$MUNICIPIO == "Cajicá")

#Precipitación del cuarto trimestre en el municipio de Zipaquirá
hist(Grupo1$OCTUBRE, main = "Precipitación" , ylim = c(0,50), , xlab = "Octubre Zipaquirá")

mean(Grupo1$OCTUBRE)
[1] 122.359
hist(Grupo1$NOVIEMBRE, main = "Precipitación" , ylim = c(0,50), , xlab = "Noviembre Zipaquirá")

mean(Grupo1$NOVIEMBRE)
[1] 100.764
hist(Grupo1$DICIEMBRE, main = "Precipitación" , ylim = c(0,50), , xlab = "Diciembre Zipaquirá")

mean(Grupo1$DICIEMBRE)
[1] 45.92298
#Precipitación de los últimos 3 meses en el municipio de Raquira
hist(Grupo2$OCTUBRE, main = "Precipitación" , ylim = c(0,50), , xlab = "Octubre Cajicá")

mean(Grupo2$OCTUBRE)
[1] 62.94595
hist(Grupo2$NOVIEMBRE, main = "Precipitación" , ylim = c(0,50), , xlab = "Noviembre Cajicá")

mean(Grupo2$NOVIEMBRE)
[1] 63.80811
hist(Grupo2$DICIEMBRE, main = "Precipitación" , ylim = c(0,50), , xlab = "Diciembre Cajicá")

mean(Grupo2$DICIEMBRE)
[1] 34.31081

Se puede evidenciar en los municipios de Cajicá y Zipaquirá, ubicaciones con una gran cercanía, mantienen en elúltimo trimestre durante los años unos valores de precipitación considerablemente distintos a pesar de ser dos localidades con diferencia de 20 minutos de trayecto en vehiculo.

Sin embargo, se aprecia en el análisis que ambos valores se mantienen estables, variando dentro de la media hasta llegar al mes de Diciembre donde en ambos casos ocurre una disminución significativa de la precipitación.