#CARGAR LOS DATOS
setwd("/cloud/project/")
#datos<-read.csv(nombre_del_archivo,encabezado,los decimales,como esta separado)
datos<-read.csv("/cloud/project/proyecto inferencial/brasil depurada 12.csv",
header=T, dec=".",sep=";")
#Variable de tipo
tipo <- datos$TIPO
TDFtipo <- table(tipo)
TDFtipo
## tipo
## Exploratório Explotatório
## 8334 21241
Tabla_Tipo <- as.data.frame(TDFtipo)
names(Tabla_Tipo) <- c("TIPO", "ni")
Tabla_Tipo$hi_porcentaje <- (Tabla_Tipo$ni / sum(Tabla_Tipo$ni)) * 100
Tabla_Tipo <- rbind(Tabla_Tipo, data.frame(TIPO = "TOTAL",
ni = sum(Tabla_Tipo$ni),
hi_porcentaje = 100))
colnames(Tabla_Tipo)[colnames(Tabla_Tipo) == "c_ubicacion_renombrado"] <- "Ubicación"
colnames(Tabla_Tipo)[colnames(Tabla_Tipo) == "hi_porc"] <- "Probabilidad"
barplot(Tabla_Tipo$hi_porcentaje[Tabla_Tipo$TIPO != "TOTAL"],
main = "Grafica No 03: Tipo de pozo",
xlab = "Tipo", ylab = "Probabilidad",
col = "darkgreen", las = 1, cex.names = 0.9,
names.arg = Tabla_Tipo$TIPO[Tabla_Tipo$TIPO != "TOTAL"])

barplot(Tabla_Tipo$hi_porcentaje[Tabla_Tipo$TIPO != "TOTAL"],
main = "Grafica No 03: Tipo de pozo",
xlab = "Tipo", ylab = "Probabilidad",
col = "darkgreen", las = 1, ylim = c(0, 100), cex.names = 0.9,
names.arg = Tabla_Tipo$TIPO[Tabla_Tipo$TIPO != "TOTAL"])

# Conclusion
conclusion <- "La variable Tipo de Ubicación muestra que la mayoría de las observaciones (77.52%) corresponden a ubicaciones en tierra, mientras que solo el 22.48% ocurre en mar. Esto refleja una alta concentración de operaciones en tierra, indicando que, estadísticamente, es mucho más probable que una operación ocurra en tierra que en mar"