# Leer el archivo
archivo <- "/cloud/project/proyecto inferencial/brasil depurada 12.csv"

if (file.exists(archivo)) {
  Datos <- read.csv(archivo, header = TRUE, sep = ";", dec = ",", fill = TRUE)
} else {
  stop("Error: El archivo no se encuentra en la ruta especificada.")
}

# Convertir a numérico
Datos$PROFUNDIDADE_SONDADOR_M <- as.numeric(gsub(",", ".", Datos$PROFUNDIDADE_SONDADOR_M))
Datos$PROFUNDIDADE_MEDIDA_M <- as.numeric(gsub(",", ".", Datos$PROFUNDIDADE_MEDIDA_M))

# Limpiar
Datos_limpios <- Datos[!is.na(Datos$PROFUNDIDADE_SONDADOR_M) & !is.na(Datos$PROFUNDIDADE_MEDIDA_M) &
                         Datos$PROFUNDIDADE_SONDADOR_M > 0 & Datos$PROFUNDIDADE_SONDADOR_M < 10000 &
                         Datos$PROFUNDIDADE_MEDIDA_M > 0, ]


modelo_simple <- lm(PROFUNDIDADE_MEDIDA_M ~ PROFUNDIDADE_SONDADOR_M, data = Datos_limpios)


# Graficar los puntos
plot(Datos_limpios$PROFUNDIDADE_SONDADOR_M, Datos_limpios$PROFUNDIDADE_MEDIDA_M,
     main = "Regresión Lineal Simple",
     xlab = "Profundidad del Sondador (m)",
     ylab = "Profundidad Medida (m)",
     pch = 19, col = "black")

# Agregar la línea de regresión
abline(modelo_simple, col = "red", lwd = 2)

# Conclusion

conclusion <-  "El análisis de regresión lineal muestra una relación positiva muy fuerte entre la profundidad del sondador y la profundidad medida. El modelo explica aproximadamente el 99.6 por ciento de la variabilidad, lo que indica un excelente ajuste y una alta capacidad predictiva. Por lo tanto, la profundidad del sondador es un indicador confiable para estimar la profundidad medida."