#CARGAR LOS DATOS
setwd("/cloud/project/")
#datos<-read.csv(nombre_del_archivo,encabezado,los decimales,como esta separado)
datos<-read.csv("/cloud/project/proyecto inferencial/brasil depurada 12.csv",
header=T, dec=".",sep=";")
#Variable tipo de ubicacion
c_ubicacion<-datos$TERRA_MAR
TDFc_ubicacion<- table(c_ubicacion)
TDFc_ubicacion
## c_ubicacion
## M T
## 6649 22926
Tabla_Ubicacion <- as.data.frame(TDFc_ubicacion)
hi <- Tabla_Ubicacion$Freq/sum(Tabla_Ubicacion$Freq)
hi
## [1] 0.2248183 0.7751817
sum(hi)
## [1] 1
hi_porc <- hi * 100
sum(hi_porc)
## [1] 100
Tabla_Ubicacion <- data.frame(Tabla_Ubicacion, hi_porc)
total_ubi <- data.frame(
c_ubicacion = "Total",
Freq = sum(Tabla_Ubicacion$Freq),
hi_porc = "100%"
)
Tabla_Ubicacion <- rbind(Tabla_Ubicacion, total_ubi)
colnames(Tabla_Ubicacion)[colnames(Tabla_Ubicacion) == "c_ubicacion"] <- "Ubicación"
colnames(Tabla_Ubicacion)[colnames(Tabla_Ubicacion) == "Freq"] <- "ni"
colnames(Tabla_Ubicacion)[colnames(Tabla_Ubicacion) == "hi_porc"] <- "Probabilidad"
#Tabla sin total
c_ubicacion <- datos$TERRA_MAR
c_ubicacion_renombrado <- factor(c_ubicacion,
levels = c("M", "T"),
labels = c("MAR", "TIERRA"))
TDFc_ubicacion <- table(c_ubicacion_renombrado)
TDFc_ubicacion
## c_ubicacion_renombrado
## MAR TIERRA
## 6649 22926
Tabla_Ubicacion_hi <- as.data.frame(TDFc_ubicacion)
hi <- Tabla_Ubicacion_hi$Freq/sum(Tabla_Ubicacion_hi$Freq)
hi
## [1] 0.2248183 0.7751817
sum(hi)
## [1] 1
hi_porc <- hi * 100
sum(hi_porc)
## [1] 100
Tabla_Ubicacion_hi <- data.frame(Tabla_Ubicacion_hi, hi_porc)
colnames(Tabla_Ubicacion_hi)[colnames(Tabla_Ubicacion_hi) == "c_ubicacion_renombrado"] <- "Ubicación"
colnames(Tabla_Ubicacion_hi)[colnames(Tabla_Ubicacion_hi) == "hi_porc"] <- "hi"
Tabla_Ubicacion_hi$hi <- as.numeric(Tabla_Ubicacion_hi$hi)
barplot(Tabla_Ubicacion_hi$hi,
main = "Grafica No 02: Tipo de Ubicacion",
xlab = "Tipo de Ubicacion",
ylab = "Probabilidad",
col = "skyblue",
las = 1,
cex.names = 1,
names.arg = Tabla_Ubicacion_hi$Ubicación
)

barplot(Tabla_Ubicacion_hi$hi,
main = "Grafica No 02: Tipo de Ubicacion",
xlab = "Tipo de Ubicacion",
ylab = "Probabilidad",
col = "skyblue",
las = 1,
ylim = c(0, 100),
cex.names = 1,
names.arg = Tabla_Ubicacion_hi$Ubicación
)

# Conclusion
conclusion <- "Del total de observaciones, el 77.52% corresponde a ubicaciones en tierra, mientras que solo el 22.48% pertenece a ubicaciones en mar."