Huatabampo17=read.table("C:\\Users\\juanl\\Downloads\\2017huat.txt", header=TRUE )
attach(Huatabampo17)
names(Huatabampo17)
## [1] "MODULO" "POZO" "X" "Y" "SNM" "ALTURA" "CE" "PPM"
## [9] "PH" "TEMP"
Se comienza a leer el archivo de texto donde tenemos los datos para saber con que vamos a trabajar, en esta caso son los pozos de huatabampo y sus diferentes caracteristcias como ubicacion, temperatura, sal, ect.
View(Huatabampo17)
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 3.5.3
library(ggmap)
## Warning: package 'ggmap' was built under R version 3.5.3
## Google's Terms of Service: https://cloud.google.com/maps-platform/terms/.
## Please cite ggmap if you use it! See citation("ggmap") for details.
library(readxl)
## Warning: package 'readxl' was built under R version 3.5.3
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 3.5.3
## -- Attaching packages ---------------------------------------- tidyverse 1.3.0 --
## v tibble 2.1.3 v dplyr 0.8.4
## v tidyr 1.0.2 v stringr 1.4.0
## v readr 1.3.1 v forcats 0.4.0
## v purrr 0.3.3
## Warning: package 'tibble' was built under R version 3.5.3
## Warning: package 'tidyr' was built under R version 3.5.3
## Warning: package 'readr' was built under R version 3.5.3
## Warning: package 'purrr' was built under R version 3.5.3
## Warning: package 'dplyr' was built under R version 3.5.3
## Warning: package 'stringr' was built under R version 3.5.3
## Warning: package 'forcats' was built under R version 3.5.3
## -- Conflicts ------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library(psych)
## Warning: package 'psych' was built under R version 3.5.3
##
## Attaching package: 'psych'
## The following objects are masked from 'package:ggplot2':
##
## %+%, alpha
Son algunas librerias
model=lm(SNM ~ PPM, data=Huatabampo17)
cor(Huatabampo17)
## MODULO POZO X Y SNM ALTURA
## MODULO 1.00000000 0.67048676 0.81667423 -0.04072659 0.20321457 0.02994264
## POZO 0.67048676 1.00000000 0.69205508 -0.27608144 0.01371495 -0.04346393
## X 0.81667423 0.69205508 1.00000000 -0.14478174 0.19072611 -0.01034979
## Y -0.04072659 -0.27608144 -0.14478174 1.00000000 0.82539434 0.48384694
## SNM 0.20321457 0.01371495 0.19072611 0.82539434 1.00000000 0.67310998
## ALTURA 0.02994264 -0.04346393 -0.01034979 0.48384694 0.67310998 1.00000000
## CE 0.02337933 0.02266501 0.01841886 -0.17156131 -0.32158148 -0.53521803
## PPM 0.02337416 0.02266998 0.01841261 -0.17156211 -0.32158319 -0.53522051
## PH -0.21925039 -0.12188365 -0.21107892 0.05822842 0.05119597 0.15939323
## TEMP -0.27047617 -0.06983899 -0.14315049 -0.12431846 -0.19907971 -0.26663371
## CE PPM PH TEMP
## MODULO 0.02337933 0.02337416 -0.21925039 -0.27047617
## POZO 0.02266501 0.02266998 -0.12188365 -0.06983899
## X 0.01841886 0.01841261 -0.21107892 -0.14315049
## Y -0.17156131 -0.17156211 0.05822842 -0.12431846
## SNM -0.32158148 -0.32158319 0.05119597 -0.19907971
## ALTURA -0.53521803 -0.53522051 0.15939323 -0.26663371
## CE 1.00000000 0.99999999 -0.54434801 0.20043946
## PPM 0.99999999 1.00000000 -0.54435240 0.20043300
## PH -0.54434801 -0.54435240 1.00000000 -0.02029087
## TEMP 0.20043946 0.20043300 -0.02029087 1.00000000
Mi inicio fue viendo cada dato que esta y su relacion se ve que algunos tienen puntos bajos y otros altos, pero nos interesa la sal (PPM), se ve que en algunos tiene algo muy bajo pero en particular se ve si sigues al CE tiene un alto indice de relacion, si uno incrementa el otro igual, veamos eso.
plot(Huatabampo17$CE~Huatabampo17$PPM, main= "Relacion entre salinidad y CE", xlab="PPM", ylab="CE")
el grafico muestra exactamente que mientras aumenta el CE tambien aumenta la sal, ya que son los mas relacionados, van casi en pareja, eso quiere decir que hay relacion y la tabla anterior no miente
pairs(~PPM+CE)
Ahora vemos que si hay relacion, si una crece la otra igual, se ve la linea initerrumpida, que si esto se hace de PPM A PPM tambien resulta lo mismo por eso tiene el .9999 de relacion las dos
pairs.panels(Huatabampo17[c(7,8)])
Los graficos dicen la fuerte relacion que existe entre ellos, cada modulo da la imagen muestra esa gran relacion que dan entre ellos, se aqui se puede decir o se puede predecir que si el CE es alto o sube el PPM tambien.
Correlacion= cor(Huatabampo17$PPM, Huatabampo17$CE)
Correlacion
## [1] 1
Su relacion es muy mayor
plot(Huatabampo17$TEMP~Huatabampo17$PPM, main= "Relacion entre salinidad y temperaturas", xlab="PPM", ylab="TEMP")
El grafico se muestra la tempreratura y la salinidad o PPM, no se puede ver muy claramente que relacion tienen si es creciente o decreciente, Pero se ve que en algunas partes donde la temperatura es baja puede haber mucha o poca sal
pairs(~PPM+TEMP)
Aqui se muestra que tienen una relacion creciente pero minima, no deben de tener mucha relacion por la separacion de los datos
pairs.panels(Huatabampo17[c(8,10)])
Los modulos de marco muestralesta mostrando que la relacion creciente que tienen es poca, pero es algo creciente por lo menos, pero no suficiente como para decir que si mayor la temperatura mayor sal. Se ve que ahy un punto de reuinion donde los puntos se vueleven mas chicos pero no para decir que la relacion sube mucho, solo que da la casualidad que dieron esas lecturas
Correlacion= cor(Huatabampo17$PPM, Huatabampo17$TEMP)
Correlacion
## [1] 0.200433
Su relacion es baja como se puede ver, casi no afecta una a la otra
plot(Huatabampo17$SNM~Huatabampo17$PPM, main= "Relacion entre salinidad y SNM", xlab="PPM", ylab="SNM")
En el grafico no se ve ninguna relacion etre los dos, su amplitud esta muy abierta y ademas se nota un ligero bajon, talves tiene una corelacion negativa entre ellas
pairs(~PPM+SNM)
Aqui se ve un poco el bajon pero mas abierto, se nota que los datos no se comportan con relacion, a lo que yo observo talves tenga casi nula corelacion o se muy baja, por los datos abiertos
pairs.panels(Huatabampo17[c(8,5)])
Pues aqui ya se puede ver la relacion, tienen una relacion negativa, con una curva de bajar que se ve en el u modulo, asi que si se ve esa relacion negativa, muestra que si uno crece en una formula matematica hay una posibilidad que la otra baje pero muy poco, por la poco relacion que tienen, es baja para decir que repercuten
Correlacion= cor(Huatabampo17$PPM, Huatabampo17$SNM)
Correlacion
## [1] -0.3215832
Aqui se ve que si es baja y no es suficiente relacion
vista= lm(SNM ~ PPM, data=Huatabampo17)
SNM_esperado= data.frame(PPM = 5875)
prediccion=predict(vista, SNM_esperado)
prediccion
## 1
## 5.460618
aqui vemos la formula que se saca con los datos si hacemos una prediccion con los datos se dice que si tenemos en un pozo una salinidad de 5875 se da 5.4606 de SNM pero segun las tablas eso es muy mayor, asi que se ve la poca corelacion que tienen
vista1= lm(TEMP ~ PPM, data=Huatabampo17)
TEMP_esperado= data.frame(PPM = 5875)
prediccion=predict(vista1, TEMP_esperado)
prediccion
## 1
## 29.01539
Ahora uan prediccion con la temperatura, esta cordinada y esta cercana pero no es suficiente como para predecir y decir esa relacion, los 5875 de salinidad no esta muy relacionado con esa tempreratura de 29.015, pero se hacerca
vista2= lm(CE ~ PPM, data=Huatabampo17)
CE_esperado= data.frame(PPM = 5875)
prediccion=predict(vista2, CE_esperado)
prediccion
## 1
## 9.179672
Aqui si esta mas relacionado y se nota esta en el porcentaje que debe de ser segun las tablas, se ve que hay una gran corelacion, los 5875 de salinidad da un numero muy cercaano a 9.1796 que da el CE, esto segun la tabla claro