# Cargar los datos
setwd("/cloud/project")
library(readr)
datosbrasil<- read_delim("brasil depurada 12 (4).csv",
delim = ";", escape_double = FALSE, trim_ws = TRUE)
## Rows: 29575 Columns: 59
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (52): POCO, CADASTRO, OPERADOR, POCO_OPERADOR, ESTADO, BACIA, BLOCO, SIG...
## num (7): LONGITUDE_BASE_DD, PROFUNDIDADE_VERTICAL_M, PROFUNDIDADE_SONDADOR_...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
#########################
# MODELO N4 (LOGARÍTMICA)
#########################
# Reemplazar NA con la media
x <- datosbrasil$PROFUNDIDADE_SONDADOR_M
y <- datosbrasil$MESA_ROTATIVA
x[is.na(x)] <- mean(x, na.rm = TRUE)
y[is.na(y)] <- mean(y, na.rm = TRUE)
# Eliminar ceros y negativos para log(x) y y
datos <- data.frame(x = x, y = y)
datos <- subset(datos, x > 0 & y > 0)
# Suavizar usando menos bins (10 en lugar de 20)
n_bins <- 10
datos$bin <- cut(datos$x, breaks = n_bins)
datos_prom <- aggregate(cbind(x, y) ~ bin, data = datos, FUN = mean)
x_avg <- datos_prom$x
y_avg <- datos_prom$y
# Crear variable log(x)
x_log <- log(x_avg)
# Ajustar modelo logarítmico
modelo_log <- lm(y_avg ~ x_log)
# Coeficientes del modelo logarítmico
a_log <- coef(modelo_log)[1]
b_log <- coef(modelo_log)[2]
# Graficar puntos originales suavizados
plot(x_avg, y_avg, col = "dodgerblue", pch = 16,
main = "Regresión Logarítmica (con tendencia visible)",
xlab = "PROFUNDIDADE_SONDADOR_M",
ylab = "MESA_ROTATIVA",
ylim = c(min(y_avg)*0.95, max(y_avg)*1.05))
# Dibujar curva logarítmica ajustada
curve(a_log + b_log * log(x), from = min(x_avg), to = max(x_avg),
add = TRUE, col = "red", lwd = 2)

# Calcular R²
R2_log <- summary(modelo_log)$r.squared
# Mostrar R² para el modelo logarítmico
cat("R² del modelo logarítmico: ", R2_log, "\n")
## R² del modelo logarítmico: 0.7300991
#conclusion
conclusion <- "Entre la mesa rotativa y la profundidad del sondador existe una relación de tipo logarítmica, cuyo modelo matemático es Y = a + b * log(X), siendo (Y) la mesa rotativa en RPM y (X) la profundidad de sondador en metros. En donde que podemos decir que la mesa ratativa esta influenciada de un 73.01% por la profundidad de sondador y el otro 26.99% se deben a otros factores."