Comparativa entre regresión lineal simple y regresión logística

El pH del agua se afecta directamente con la temperatura, este es un resultado ligero pero medible. Por ejemplo, el agua pura tiene un pH de 7 unicamente a una temperatura de 25 grados Celsius. Cuando hay un incremento en la temperatura, el pH disminuye, de igual forma una disminución de temperatura implica un aumento en el pH.

La causa de que se afecte el pH del agua por la temperatura es que cuando aumenta la temperatura, las moleculas tienden a separarse en sus elementos: hidrogeno y oxigeno. Al aumentar la proporcion de moleculas descompuestas se produce mas hidrogeno, lo cual por supuesto aumenta a su vez el potencial de hidrogeno pH.

setwd("~/ESTADISTICA1011")
library(pacman)
p_load("readxl","prettydoc", "DT")
pozos <- read_excel("pozos.xlsx", col_types = c("numeric", 
    "numeric", "numeric"))
View(pozos)
datatable(pozos)

Analisis de correlacion

Matriz de diagramas de dispersion

pairs(pozos)

Matriz de coeficientes de correlacion

cor(pozos)
##             TEMP        PHB          PH
## TEMP  1.00000000 0.07826025 -0.02029087
## PHB   0.07826025 1.00000000  0.31999640
## PH   -0.02029087 0.31999640  1.00000000

Ecuacion de Recta de minimos cuadrados

regresion <- lm(PH ~ TEMP, data=pozos)
summary(regresion)
## 
## Call:
## lm(formula = PH ~ TEMP, data = pozos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.78955 -0.09220  0.01089  0.11089  0.59587 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  7.017231   0.366448  19.149   <2e-16 ***
## TEMP        -0.004418   0.012761  -0.346    0.729    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2219 on 291 degrees of freedom
## Multiple R-squared:  0.0004117,  Adjusted R-squared:  -0.003023 
## F-statistic: 0.1199 on 1 and 291 DF,  p-value: 0.7294

\[ y = 7.017231 -0.004418x\]

Grafica de la Recta de minimos cuadrados

plot(pozos$TEMP, pozos$PH, xlab="Temperatura del pozo", ylab="pH")
abline(regresion)

Regresion logistica

  • Se va a calcular la frecuencia con la cual se presentan los valores de 0 y de 1
table(pozos$PHB)
## 
##   0   1 
## 263  30
  • Una representacion grafica de los datos ALCALINOS/NEUTROS (0) Y ÁCIDOS (1)
colores <- NULL
colores [pozos$PHB==0] <- "pink"
colores [pozos$PHB==1] <- "yellow"
plot(pozos$TEMP, pozos$PHB, pch=21, bg=colores,  xlab = "Tempertura", ylab = "pH")

summary(pozos)
##       TEMP           PHB               PH      
##  Min.   :25.6   Min.   :0.0000   Min.   :6.10  
##  1st Qu.:28.0   1st Qu.:0.0000   1st Qu.:6.80  
##  Median :28.7   Median :0.0000   Median :6.90  
##  Mean   :28.7   Mean   :0.1024   Mean   :6.89  
##  3rd Qu.:29.2   3rd Qu.:0.0000   3rd Qu.:7.00  
##  Max.   :32.1   Max.   :1.0000   Max.   :7.50
datos <- data.frame(TEMP=seq(25.6,32.1,0.1))
probabilidades <- predict(regresion, datos, type = "response")
colores [pozos$PH<7] <- "green"
colores [pozos$PH>=7] <- "purple"
plot(pozos$TEMP, pozos$PH, pch = 21, bg = colores, xlab = 'Temperatura', ylab = 'Probabilidad de pH')
legend('bottomleft', c('ALCALINOS/NEUTROS', 'ÁCIDOS'), pch = 21, col = c('green', 'purple'))

lines(datos$TEMP, probabilidades, col= "green" , lwd = 3)

Segun estos datos: ¿Que tan relacionado esta la temperatura con el pH del agua de estos pozos?

Cuando la temperatura incrementa los acidos tienen aumento, se aprecia en la linea que sube incrementando la temperatura.La relación es que entre el agua mientras más fría se emcuentre mas alcalino es y mientras mas caliente mas ácida aunque tambien influyen la sal que esta contenga