ANÁLISIS DE LA VARIABLE ECOREGIÓN

1. CARGA DE DATOS

library(knitr)

setwd("C:/Users/HP/Documents/PROYECTO ESTADISTICA/RStudio")
datos <- read.csv("tablap.csv", header = TRUE, dec = ",", sep = ";")

2. TABLA DE DISTRIBUCION

eco_var <- datos$Ecoregion 
ni_eco <- table(eco_var)
hi_eco <- round(prop.table(ni_eco) * 100, 2) 

tabla_base_eco <- data.frame(Ecoregion = names(ni_eco), ni = as.numeric(ni_eco), hi = as.numeric(hi_eco))
fila_total_eco <- data.frame(Ecoregion = "TOTAL", ni = sum(tabla_base_eco$ni), hi = round(sum(tabla_base_eco$hi)))
tabla_final_eco <- rbind(tabla_base_eco, fila_total_eco)

kable(tabla_final_eco, format = "markdown", col.names = c("Ecorregión", "ni", "hi (%)"),
      caption = "Tabla N° 1. Distribución por Ecorregión de los pozos de gas natural")
Tabla N° 1. Distribución por Ecorregión de los pozos de gas natural
Ecorregión ni hi (%)
Chihuahuan Deserts 2150 17.12
Colorado Plateaus 3792 30.19
High Plains 946 7.53
New Mexico Mountains 4 0.03
New Mexico Plateau 3745 29.81
Southern Rockies 1747 13.91
Southwestern Tablelands 177 1.41
TOTAL 12561 100.00

3. GRAFICAS DE DISTRIBUCION

color_abs <- "#A9CCE3" 
color_rel <- "#EDBB99"

par(mar = c(10, 4, 4, 2)) 


barplot(ni_eco, 
        main = "Gráfica N°1: Distribución de cantidad por Ecorregión",
        xlab = "", ylab = "Cantidad (ni)", 
        col = color_abs, border = "white",
        ylim = c(0, max(ni_eco)),
        las = 2, cex.names = 0.8)

barplot(ni_eco, 
        main = "Gráfica N°2: Distribución de cantidad por Ecorregión",
        xlab = "", ylab = "Cantidad (ni)", 
        col = color_abs, border = "white",
        ylim = c(0, 12561),
        las = 2, cex.names = 0.8)

hi_local_eco <- as.numeric(tabla_final_eco$hi[1:(nrow(tabla_final_eco)-1)])
barplot(hi_local_eco, 
        main = "Gráfica N°3: Distribución porcentual por Ecorregión",
        xlab = "", ylab = "Porcentaje (%)", 
        col = color_rel, border = "white",
        names.arg = tabla_final_eco$Ecoregion[1:(nrow(tabla_final_eco)-1)],
        las = 2, cex.names = 0.8)

barplot(hi_local_eco, 
        main = "Gráfica N°4: Distribución porcentual por Ecorregión",
        xlab = "", ylab = "Porcentaje (%)", 
        col = color_rel, border = "white",
        names.arg = tabla_final_eco$Ecoregion[1:(nrow(tabla_final_eco)-1)],
        ylim = c(0, 100),
        las = 2, cex.names = 0.8)

par(mar = c(1, 1, 2, 7), xpd=TRUE) 

hi_TD_eco <- hi_local_eco
TD_eco <- tabla_final_eco$Ecoregion[1:(nrow(tabla_final_eco)-1)]

Colores <- colorRampPalette(c("#D7BDE2", "#A2D9CE", "#FAD7A0"))
etiquetas_eco <- paste0(round(hi_TD_eco), "%")

pie(
  hi_TD_eco,
  radius = 0.8,
  col = Colores(length(hi_TD_eco)),
  labels = etiquetas_eco,
  main = "Gráfica N°5: Distribución porcentual por Ecorregión",
  cex.main = 1.0,
  border = "white"
)

legend(
  x = 1.1,           
  y = 0.5,           
  title = "Ecorregiones",
  legend = TD_eco,
  fill = Colores(length(hi_TD_eco)),
  cex = 0.8,         
  bty = "n"
)

4. INDICADORES ESTADISTICOS

4.1 MODA

eco_limpia <- as.character(eco_var)
eco_limpia <- eco_limpia[!is.na(eco_limpia)]
tabla_eco <- table(eco_limpia)
moda_eco <- names(tabla_eco)[which.max(as.numeric(tabla_eco))]
moda_eco
## [1] "Colorado Plateaus"

5. TABLA DE INDICADORES ESTADISTICOS

Variable_eco <- c("Ecorregión")
TablaIndicadores_eco <- data.frame(Variable_eco, moda_eco)
colnames(TablaIndicadores_eco) <- c("Variable", "Moda")
kable(TablaIndicadores_eco, format = "markdown", 
      caption = "Tabla N° 2. Indicadores estadísticos de la variable Ecorregión")
Tabla N° 2. Indicadores estadísticos de la variable Ecorregión
Variable Moda
Ecorregión Colorado Plateaus

6. CONCLUSIÓN

cat("La variable Ecoregion tiene como valor más frecuente la zona de:", moda_eco)
## La variable Ecoregion tiene como valor más frecuente la zona de: Colorado Plateaus