U1A13

Bernardo Valenzuela

14/10/2020

library(prettydoc)
## Warning: package 'prettydoc' was built under R version 3.6.3

Comparativa entre regresión lineal simple y regresión logística

Caso de estudio: relación entre el pH y la temperatura de agua de pozos

Escala de pH

El pH del agua se afecta directamente con la temperatura, éste es un resultado ligero pero medible. Por ejemplo, el agua pura tiene un pH de 7 únicamente a una temperatura de 25 grados Celsius. Cuando hay un incremento en la temperatura, el pH disminuye, de igual forma una disminución de temperatura implica un aumento en el pH.

La causa de que se afecte el pH del agua por la temperatura es que cuando aumenta la temperatura, las moléculas tienden a separarse en sus elementos: hidrógeno y oxígeno. Al aumentar la proporción de moléculas descompuestas se produce más hidrógeno, lo cual por supuesto aumenta a su vez el potencial de hidrógeno pH.

  • Importar datos
library(pacman)
## Warning: package 'pacman' was built under R version 3.6.3
p_load("readxl", "prettydoc", "DT")
pozos <- read_excel("pozos.xlsx", col_types = c("numeric", 
    "numeric", "numeric"))
  • visualizar datos en una tabla interactiva
datatable(pozos)

Análisis de correlación

Matriz de diagramas de dispersión

pairs(pozos)

Matriz de coeficientes de correlación

cor(pozos)
##             TEMP        PHB          PH
## TEMP  1.00000000 0.07826025 -0.02029087
## PHB   0.07826025 1.00000000  0.31999640
## PH   -0.02029087 0.31999640  1.00000000

Ecuación de Recta de mínimos cuadrados

regresion <- lm(PH ~ TEMP, data=pozos)
summary(regresion)
## 
## Call:
## lm(formula = PH ~ TEMP, data = pozos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.78955 -0.09220  0.01089  0.11089  0.59587 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  7.017231   0.366448  19.149   <2e-16 ***
## TEMP        -0.004418   0.012761  -0.346    0.729    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2219 on 291 degrees of freedom
## Multiple R-squared:  0.0004117,  Adjusted R-squared:  -0.003023 
## F-statistic: 0.1199 on 1 and 291 DF,  p-value: 0.7294

\[ y = 7.017231 -0.004418x\]

Gráfica de la Recta de mínimos cuadrados

plot(pozos$TEMP, pozos$PH, xlab="Temperatura del pozo", ylab="pH")
abline(regresion)

Regresión logística

  • Se va a calcular la frecuencia con la cual se presentan los valores de 0 y de 1
table(pozos$PHB)
## 
##   0   1 
## 263  30
  • Una representación gráfica de los datos ALCALINOS/NEUTROS (0) Y ÁCIDOS (1)
colores <- NULL
colores[pozos$PHB==0] <- "red"
colores[pozos$PHB==1] <- "blue"
plot(pozos$TEMP, pozos$PHB, pch=21,bg=colores, xlab="Temperatura", ylab="pH" )

Asignación:

Terminar este análisis ajustando la curva de regresión logística

reg <- glm(PHB ~ TEMP, data=pozos, family=binomial)
summary(reg)
## 
## Call:
## glm(formula = PHB ~ TEMP, family = binomial, data = pozos)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -0.6781  -0.4814  -0.4540  -0.4130   2.3384  
## 
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)  
## (Intercept)  -9.3105     5.3634  -1.736   0.0826 .
## TEMP          0.2479     0.1854   1.337   0.1813  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 193.56  on 292  degrees of freedom
## Residual deviance: 191.79  on 291  degrees of freedom
## AIC: 195.79
## 
## Number of Fisher Scoring iterations: 5
datos <- data.frame(TEMP= seq(20,35,0.1))
probabilidades <- predict(reg, datos, type = "response")

#gráfica
plot(pozos$TEMP, pozos$PHB, pch = 21, bg = colores, xlab = 'Temperatura', ylab = 'Probabilidad alcalino o ácido')
legend('bottomleft', c('acido', 'alcalino'), pch = 21, col = c('blue', 'red'))

lines(datos$TEMP, probabilidades, col="blue", lwd=3)

Contestar la pregunta,según estos datos: ¿Que tan relacionado está la temperatura con el pH del agua de estos pozos?

Se puede oberservar mayor cantidad de datos alcalinos segun la temperatura aumenta, mas no directamente es proporcional, puede deberse que al ser un agua de pozo, los minerales afecten mas al pH que la temperatura.