Introducción

En este ejemplo se demostrara que variable de los pozos afecta más en la variación de las PPM. Para ello se usaran 293 ejemplares de pozos que se encuentran en Huatabampo con las variables o atributos: SNM, Altura, CE, PPM, PH, Temp.

pozos
## # A tibble: 293 x 6
##      SNM ALTURA    CE   PPM    PH  TEMP
##    <dbl>  <dbl> <dbl> <dbl> <dbl> <dbl>
##  1  3.91   2.68  2.83  1811   6.8  28.5
##  2  4.53   2.61  8.35  5344   6.9  29.2
##  3  2.80   1.3   8.66  5542   6.8  28.9
##  4  3.64   2.14  8.34  5338   7.1  29.4
##  5  3.49   2.01  9.18  5875   6.6  28.3
##  6  4.81   2     7.9   5056   6.8  28.4
##  7  4.18   1.63  9.64  6170   6.5  28  
##  8  5.61   2.82  7.17  4589   6.9  27.5
##  9  6.70   3     1.88  1203   7    28.7
## 10  5.94   3     1.93  1235   7    28.6
## # ... with 283 more rows


Gráfico de dispersión

pairs(pozos)

Con solo ver la gráfica podemos observar facilmente cual es la variable mas ifluyente para las PPM, la cual es la CE.Tambien podemos observar que las demas variables no presentan una relación muy directa con las PPM.



Tabla de correlación

Esta correlación de las variables es en base a las PPM.

cor(x = pozos, y = pozos$PPM)
##              [,1]
## SNM    -0.3215832
## ALTURA -0.5352205
## CE      1.0000000
## PPM     1.0000000
## PH     -0.5443524
## TEMP    0.2004330

hipotesis: Con la correlación podemos confirmar que la variable que mas influye en las PPM es la CE. La correlación de PPM y CE es de 1 a 1, esto quiere decir que PPM aumenta proporcionalmente con el aumento de la CE.
De esta manera tambien podemos observar que la variable que menos ifluye en las PPM es la temperatura con una 0.20 de correlación.