ANÁLISIS ESTADÍSTICO
1. CARGA DE DATOS Y LIBRERÍAS
# 1. CARGA DE DATOS Y LIBRERÍAS
library(knitr)
library(dplyr)
setwd("C:/Users/HP/Documents/PROYECTO ESTADISTICA/RStudio")
datos <- read.csv("tablap.csv", header = TRUE, dec = ",", sep = ";")
2. TABLA DE DISTRIBUCION DE PROBABILIDAD
Eco_Raw <- datos$Ecoregion
Eco_Limpia <- ifelse(
is.na(Eco_Raw) | trimws(Eco_Raw) == "",
"Sin Registro",
trimws(Eco_Raw)
)
ECOREGION <- factor(Eco_Limpia)
TablaECO <- as.data.frame(table(ECOREGION))
colnames(TablaECO) <- c("ECOREGION", "ni")
TablaECO$hi <- round(TablaECO$ni / sum(TablaECO$ni), 4)
TablaECO$P <- round(TablaECO$hi * 100, 2)
Total_eco <- data.frame(
ECOREGION = "TOTAL",
ni = sum(TablaECO$ni),
hi = sum(TablaECO$hi),
P = sum(TablaECO$P)
)
# Tabla final
TablaFinalEco <- rbind(TablaECO, Total_eco)
kable(TablaFinalEco, format = "markdown",
caption = "Tabla N° 1: Distribución de probabilidad por Ecorregión")
Tabla N° 1: Distribución de probabilidad por
Ecorregión
| Chihuahuan Deserts |
2150 |
0.1712 |
17.12 |
| Colorado Plateaus |
3792 |
0.3019 |
30.19 |
| High Plains |
946 |
0.0753 |
7.53 |
| New Mexico Mountains |
4 |
0.0003 |
0.03 |
| New Mexico Plateau |
3745 |
0.2981 |
29.81 |
| Southern Rockies |
1747 |
0.1391 |
13.91 |
| Southwestern Tablelands |
177 |
0.0141 |
1.41 |
| TOTAL |
12561 |
1.0000 |
100.00 |
3. GRAFICO DE DISTRIBUCION DE PROBABILIDAD
P_global_eco <- as.numeric(TablaFinalEco$P[1:(nrow(TablaFinalEco)-1)])
Nombres_Eco <- TablaFinalEco$ECOREGION[1:(nrow(TablaFinalEco)-1)]
color_barras_eco <- "#A9CCE3"
# Ajuste de márgenes para etiquetas verticales (las = 2)
par(mar = c(12, 4, 4, 2))
barplot(
P_global_eco,
main = "Gráfica Nº1: Distribución de probabilidad de las ecorregiones",
cex.main = 0.9,
xlab = "",
ylab = "Probabilidad (%)",
col = color_barras_eco,
names.arg = Nombres_Eco,
cex.names = 0.7,
ylim = c(0, 100),
las = 2
)

4. CALCULO DE PROBABILIDA

5. CONCLUSION
## Los resultados muestran que la ecorregión Colorado Plateaus presenta la mayor probabilidad de actividad de pozos con un 30.19%.