#CARGAR LOS DATOS
setwd("/cloud/project/")
#datos<-read.csv(nombre_del_archivo,encabezado,los decimales,como esta separado)
datos<-read.csv("/cloud/project/proyecto inferencial/brasil depurada 12.csv",
                header=T, dec=".",sep=";")



#Variable tipo de ubicacion
c_ubicacion<-datos$TERRA_MAR
TDFc_ubicacion<- table(c_ubicacion)
TDFc_ubicacion
## c_ubicacion
##     M     T 
##  6649 22926
Tabla_Ubicacion <- as.data.frame(TDFc_ubicacion)
hi <- Tabla_Ubicacion$Freq/sum(Tabla_Ubicacion$Freq)
hi
## [1] 0.2248183 0.7751817
sum(hi)
## [1] 1
hi_porc <- hi * 100
sum(hi_porc)
## [1] 100
Tabla_Ubicacion <- data.frame(Tabla_Ubicacion, hi_porc)

total_ubi <- data.frame(
  c_ubicacion = "Total", 
  Freq  = sum(Tabla_Ubicacion$Freq), 
  hi_porc  = "100%"  
)

Tabla_Ubicacion <- rbind(Tabla_Ubicacion, total_ubi)
colnames(Tabla_Ubicacion)[colnames(Tabla_Ubicacion) == "c_ubicacion"] <- "Ubicación"
colnames(Tabla_Ubicacion)[colnames(Tabla_Ubicacion) == "Freq"] <- "ni"
colnames(Tabla_Ubicacion)[colnames(Tabla_Ubicacion) == "hi_porc"] <- "Probabilidad"

#Tabla sin total
c_ubicacion <- datos$TERRA_MAR
c_ubicacion_renombrado <- factor(c_ubicacion, 
                                 levels = c("M", "T"), 
                                 labels = c("MAR", "TIERRA"))
TDFc_ubicacion <- table(c_ubicacion_renombrado)
TDFc_ubicacion
## c_ubicacion_renombrado
##    MAR TIERRA 
##   6649  22926
Tabla_Ubicacion_hi <- as.data.frame(TDFc_ubicacion)
hi <- Tabla_Ubicacion_hi$Freq/sum(Tabla_Ubicacion_hi$Freq)
hi
## [1] 0.2248183 0.7751817
sum(hi)
## [1] 1
hi_porc <- hi * 100
sum(hi_porc)
## [1] 100
Tabla_Ubicacion_hi <- data.frame(Tabla_Ubicacion_hi, hi_porc)

colnames(Tabla_Ubicacion_hi)[colnames(Tabla_Ubicacion_hi) == "c_ubicacion_renombrado"] <- "Ubicación" 
colnames(Tabla_Ubicacion_hi)[colnames(Tabla_Ubicacion_hi) == "hi_porc"] <- "hi"
Tabla_Ubicacion_hi$hi <- as.numeric(Tabla_Ubicacion_hi$hi)

barplot(Tabla_Ubicacion_hi$hi, 
        main = "Grafica No 02: Tipo de Ubicacion",
        xlab = "Tipo de Ubicacion", 
        ylab = "Probabilidad",
        col = "skyblue", 
        las = 1,
        cex.names = 1,
        names.arg = Tabla_Ubicacion_hi$Ubicación 
)

barplot(Tabla_Ubicacion_hi$hi, 
        main = "Grafica No 02: Tipo de Ubicacion",
        xlab = "Tipo de Ubicacion", 
        ylab = "Probabilidad",
        col = "skyblue", 
        las = 1,
        ylim = c(0, 100), 
        cex.names = 1,
        names.arg = Tabla_Ubicacion_hi$Ubicación 
)

# Conclusion

conclusion <- "Del total de observaciones, el 77.52% corresponde a ubicaciones en tierra, mientras que solo el 22.48% pertenece a ubicaciones en mar."