ANÁLISIS ESTADÍSTICO

1. CARGA DE DATOS Y LIBRERÍAS

library(knitr)

datos <- read.csv("tablap.csv", header = TRUE, dec = ",", sep = ";")

2. TABLA DE DISTRIBUCION

cuenca_var <- datos$Basin 
ni <- table(cuenca_var)
hi <- round(prop.table(ni) * 100, 2) 

tabla_base <- data.frame(Cuenca = names(ni), ni = as.numeric(ni), hi = as.numeric(hi))
fila_total <- data.frame(Cuenca = "TOTAL", ni = sum(tabla_base$ni), hi = round(sum(tabla_base$hi)))
tabla_final_c <- rbind(tabla_base, fila_total)

kable(tabla_final_c, format = "markdown", col.names = c("Cuenca", "ni", "hi (%)"),
      caption = "Tabla N° 1. Distribución por Cuenca de los pozos de gas natural")
Tabla N° 1. Distribución por Cuenca de los pozos de gas natural
Cuenca ni hi (%)
Permian 3277 26.09
Rotan Ski 655 5.21
San Juan 8629 68.70
TOTAL 12561 100.00

3. GRAFICAS DE DISTRIBUCION

color_barras_abs <- "#76D7C4" 
color_barras_rel <- "#F1948A"

barplot(ni, 
        main = "Gráfica Nº1: Distribución de cantidad de las cuencas",
        xlab = "Cuenca", ylab = "Cantidad (ni)", 
        col = color_barras_abs, border = "white",
        ylim = c(0, max(ni)))

barplot(ni, 
        main = "Gráfica Nº2: Distribución de cantidad de las cuencas",
        xlab = "Cuenca", ylab = "Cantidad (ni)", 
        col = color_barras_abs, border = "white",
        ylim = c(0, 12561))

hi_local <- as.numeric(tabla_final_c$hi[1:(nrow(tabla_final_c)-1)])
barplot(hi_local, 
        main = "Gráfica Nº3: Distribución de cantidad en porcentaje de las cuenca",
        xlab = "Cuenca", ylab = "Porcentaje (%)", 
        col = color_barras_rel, border = "white",
        names.arg = tabla_final_c$Cuenca[1:(nrow(tabla_final_c)-1)])

barplot(hi_local, 
        main = "Gráfica Nº4: Distribución de cantidad en porcentaje de las cuencas",
        xlab = "Cuenca", ylab = "Porcentaje (%)", 
        col = color_barras_rel, border = "white",
        names.arg = tabla_final_c$Cuenca[1:(nrow(tabla_final_c)-1)],
        ylim = c(0, 100))

hi_TD <- as.numeric(tabla_final_c$hi[1:(nrow(tabla_final_c)-1)])
TD <- tabla_final_c$Cuenca[1:(nrow(tabla_final_c)-1)]

Colores <- colorRampPalette(c("#82E0AA", "#F8C471", "#BB8FCE"))
etiquetas <- paste0(round(hi_TD), "%")
pie(
  hi_TD,
  radius = 1.0,
  col = Colores(length(hi_TD)),
  labels = etiquetas,
  main = "Gráfica Nº5: Distribución de cantidad en porcentaje de las cuencas",
  cex.main = 1.1,
  border = "white"
)

legend(
  "bottomright",
  title = "Cuencas",
  legend = TD,
  fill = Colores(length(hi_TD)),
  cex = 1.2,
  bty = "n"
)

4. INDICADORES ESTADISTICOS

4.1 MODA

cuenca_limpia <- as.character(cuenca_var)
cuenca_limpia <- cuenca_limpia[!is.na(cuenca_limpia)]
tabla_cuenca <- table(cuenca_limpia)
moda_c <- names(tabla_cuenca)[which.max(as.numeric(tabla_cuenca))]
moda_c
## [1] "San Juan"

5. TABLA DE INDICADORES ESTADISTICOS

Variable <- c("Cuenca")
TablaIndicadores <- data.frame(Variable, moda_c)
colnames(TablaIndicadores) <- c("Variable", "Moda")
kable(TablaIndicadores, format = "markdown", 
      caption = "Tabla N° 2. Indicadores estadísticos de la variable cuenca")
Tabla N° 2. Indicadores estadísticos de la variable cuenca
Variable Moda
Cuenca San Juan

6. CONCLUSIÓN

cat("La variable Basin (Cuenca) tiene como valor más frecuente la cuenca de:", moda_c)
## La variable Basin (Cuenca) tiene como valor más frecuente la cuenca de: San Juan