#UNIVERSIDAD CENTRAL DEL ECUADOR 
#FACULDA DE INGENIERIA EN GEOLOGIA MINAS PETROLEOS Y AMBIENTAL
#INGENIRIA MINAS_GEOLOGIA
#AUTOR:
#FECHA

#cargar datos
# Prueba este código (cambia solo tu nombre de usuario)
datos <- read.csv("C:/Users/li/Downloads/Estadistica datos.csv", 
                  sep = ";", 
                  fileEncoding = "UTF-8")
head(datos$MONTH_COLL)
## [1] 12 12 12 12 12 12
table(datos$MONTH_COLL)
## 
## -9999     1     2     3     4     5     6     7     8     9    10    11    12 
##  5189   104   665  1683  1136  2894  3633  3485  2786  2890  1897  1173   218 
##    13    14    15    16 
##     1     1     1     1
# Paso 3: Quitar los -9999 (datos faltantes) y volver a contar
meses <- datos$MONTH_COLL[datos$MONTH_COLL != -9999]
ni <- table(meses)
ni
## meses
##    1    2    3    4    5    6    7    8    9   10   11   12   13   14   15   16 
##  104  665 1683 1136 2894 3633 3485 2786 2890 1897 1173  218    1    1    1    1
# Paso 4: Poner nombres de meses en español (bonito)
names(ni) <- c("Enero", "Febrero", "Marzo", "Abril", "Mayo", "Junio",
               "Julio", "Agosto", "Septiembre", "Octubre", "Noviembre", "Diciembre")
ni
##      Enero    Febrero      Marzo      Abril       Mayo      Junio      Julio 
##        104        665       1683       1136       2894       3633       3485 
##     Agosto Septiembre    Octubre  Noviembre  Diciembre       <NA>       <NA> 
##       2786       2890       1897       1173        218          1          1 
##       <NA>       <NA> 
##          1          1
# Paso 5: Calcular total de muestras válidas
total <- sum(ni)
total
## [1] 22568
# Paso 6: Frecuencia relativa (hi) y en porcentaje
hi <- ni / total
hi_porcentaje <- round(hi * 100, 2)

# Paso 7: Hacer la tabla final perfecta
tabla_mes <- data.frame(
  Mes = names(ni),
  ni = as.numeric(ni),
  hi = round(as.numeric(hi), 4),
  "hi (%)" = hi_porcentaje
)

# Ver la tabla completa
print(tabla_mes, row.names = FALSE)
##         Mes   ni     hi hi.....Var1 hi.....Freq
##       Enero  104 0.0046       Enero        0.46
##     Febrero  665 0.0295     Febrero        2.95
##       Marzo 1683 0.0746       Marzo        7.46
##       Abril 1136 0.0503       Abril        5.03
##        Mayo 2894 0.1282        Mayo       12.82
##       Junio 3633 0.1610       Junio       16.10
##       Julio 3485 0.1544       Julio       15.44
##      Agosto 2786 0.1234      Agosto       12.34
##  Septiembre 2890 0.1281  Septiembre       12.81
##     Octubre 1897 0.0841     Octubre        8.41
##   Noviembre 1173 0.0520   Noviembre        5.20
##   Diciembre  218 0.0097   Diciembre        0.97
##        <NA>    1 0.0000        <NA>        0.00
##        <NA>    1 0.0000        <NA>        0.00
##        <NA>    1 0.0000        <NA>        0.00
##        <NA>    1 0.0000        <NA>        0.00
# Paso 8: Gráfico de barras 
barplot(ni,
        main = "Número de muestras por mes de recolección",
        xlab = "Mes",
        ylab = "Cantidad de muestras",
        col = "lightblue",
        las = 2)