# 1. Configurar directorio y cargar datos
setwd("/cloud/project/proyecto")
datos <- read.csv("archivo depurado nuevo 12.csv",
header = TRUE, sep = ";", dec = ".")
# Variable TIPO
tipo <- datos$TIPO
tabla_cruda_tipo <- sort(table(tipo), decreasing = TRUE)
top_n_tipo <- 3
top_n_valores_tipo <- names(tabla_cruda_tipo)[1:top_n_tipo]
tipo_agrupado <- ifelse(tipo %in% top_n_valores_tipo, tipo, "OTROS")
tabla_agrupada_tipo <- table(tipo_agrupado)
# TABLA DE FRECUENCIAS
Tabla_Tipo <- data.frame(
TIPO = names(tabla_agrupada_tipo),
ni = as.numeric(tabla_agrupada_tipo)
)
# Cálculo del porcentaje
Tabla_Tipo$hi_porcentaje <- round((Tabla_Tipo$ni / sum(Tabla_Tipo$ni)) * 100, 2)
# Agregar fila TOTAL
Tabla_Tipo <- rbind(
Tabla_Tipo,
data.frame(TIPO = "TOTAL",
ni = sum(Tabla_Tipo$ni),
hi_porcentaje = 100)
)
print(Tabla_Tipo)
## TIPO ni hi_porcentaje
## 1 Exploratório 8334 28.18
## 2 Explotatório 21241 71.82
## 3 TOTAL 29575 100.00
#----------------------------------------------------
# COLORES
#----------------------------------------------------
library(RColorBrewer)
colores_tipo <- brewer.pal(n = length(tabla_agrupada_tipo), name = "Set2")
## Warning in brewer.pal(n = length(tabla_agrupada_tipo), name = "Set2"): minimal value for n is 3, returning requested palette with 3 different levels
# GRÁFICOS DE BARRAS
# Frecuencia absoluta
barplot(tabla_agrupada_tipo,
main = "Gráfica No 12: Distribución de Tipo",
col = colores_tipo,
las = 1,
cex.names = 0.6,
cex.axis = 0.6,
xlab = "Tipo", ylab = "Cantidad")

# Frecuencia absoluta con límite Y
barplot(tabla_agrupada_tipo,
main = "Gráfica No 12.1: Distribución de la frecuencia de Tipo",
col = colores_tipo,
las = 1,
cex.names = 0.6,
cex.axis = 0.6,
ylim = c(0, max(tabla_agrupada_tipo) + 5),
xlab = "Tipo", ylab = "Cantidad")

# Frecuencia relativa (%)
barplot(Tabla_Tipo$hi_porcentaje[Tabla_Tipo$TIPO != "TOTAL"],
main = "Gráfica No 2.2: Distribución de la frecuencia relativa de Tipo (local)",
names.arg = Tabla_Tipo$TIPO[Tabla_Tipo$TIPO != "TOTAL"],
col = colores_tipo,
las = 1,
cex.names = 0.6,
cex.axis = 0.6,
xlab = "Tipo", ylab = "Porcentaje")

# Frecuencia relativa con límite Y
barplot(Tabla_Tipo$hi_porcentaje[Tabla_Tipo$TIPO != "TOTAL"],
main = "Gráfica No 12.3: Distribución de la frecuencia relativa de Tipo (global)",
names.arg = Tabla_Tipo$TIPO[Tabla_Tipo$TIPO != "TOTAL"],
col = colores_tipo,
las = 1,
cex.names = 0.6,
cex.axis = 0.6,
ylim = c(0, 100),
xlab = "Tipo", ylab = "Porcentaje")

# DIAGRAMA CIRCULAR
pie_data_tipo <- Tabla_Tipo$ni[Tabla_Tipo$TIPO != "TOTAL"]
pie_percent_tipo <- Tabla_Tipo$hi_porcentaje[Tabla_Tipo$TIPO != "TOTAL"]
etiquetas_pie_tipo <- paste0(pie_percent_tipo, "%")
n_colores_pie <- max(3, length(pie_data_tipo))
pie(pie_data_tipo,
labels = etiquetas_pie_tipo,
main = "Gráfica No 12.4: Distribución Porcentual de Tipo",
col = brewer.pal(n = n_colores_pie, name = "Set3"),
radius = 0.7,
cex = 0.8)
# Leyenda
legend(x = 1.2, y = -0.3,
legend = Tabla_Tipo$TIPO[Tabla_Tipo$TIPO != "TOTAL"],
fill = brewer.pal(n = n_colores_pie, name = "Set3"),
title = "Tipo",
cex = 0.5)

# Conclusion
conclusion <-"La variable Tipo muestra que el 71.82% de los pozos corresponden a Explotatório, mientras que solo el 28.18% son Exploratório. Esto indica que la mayoría de las actividades petroleras se centran en pozos de explotación en lugar de pozos de exploración."