Durante el desarollo de este documento se estara realizando el examen de la primera unidad de competencia de la materia de estadistica aplicada impartida por el docente Juan Isaac Gámez Badouin. Para este analisis o estudio de interes se estaran usando datos de temperatura y Ph de agua subterranea de un Pozo. Mediante este estudio veremos la relacion que existe entre estos dos parametros en esta agua de Pozo en especifico. Para esto nos estaremos apoyando de esta rama de las matematicas que es la probabilidad y estadistica de forma aplicada. Para esto considere hipotesis la cual me indicara que probablemente otra corriente subterranea afecto o no a este analisis con respecto al potencial hidrogeno de la solucion acuosa y la temperatura.
H0: Otra corriente de agua interna o extera del poso no afecto las concentraciones y la temperatura lo cual, hace una diferencia al momento de evaluar las temperaturas en ciertos intervalos
HI: Otra corriente de agua interna o extera del poso afecto las concentraciones y la temperatura lo cual, hace una diferencia al momento de evaluar las temperaturas en ciertos intervalos
Para ello dare una introducción partiendo de:
¿Qué es la estadística y que aplicaciones tiene en la ingeniería química?
El Diccionario de la RAE define estadística como “estudio de los datos cuantitativos de la población, de los recursos naturales e industriales, del tráfico o de cualquier otra manifestación de las sociedades humanas”, y también como “rama de la matemática que utiliza grandes conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades”.
La estadística es, pues, una ciencia que obtiene conclusiones a partir de datos numéricos que nos dan información sobre la realidad en algún aspecto determinado.
Como ciencia es una rama de las matemáticas, que utiliza leyes de la probabilidad para analizar datos que son extraídos como muestra representativa de la realidad total, extrayendo conclusiones probables sobre fenómenos que pueden o no ser aleatorios. Nos proporciona modelos para explicar situaciones que implican incertidumbres.
Se utiliza, hoy en día, para estudiar la población, desde sus tendencias políticas hasta sus preferencias de consumo o sus hábitos y su comportamiento en otros aspectos de la vida.
También es utilizada en muchas otras investigaciones científicas como ciencia auxiliar, como en la física, la medicina, las ciencias económicas, etc.
Su aplicación a la toma de decisiones en los ámbitos políticos y empresariales es muy frecuente.
Aplicaciones en la ingeniería química:
La aplicación principal es en la experimentación, ya que nunca vas a tener una variable que se modifique cambiando otra obteniendo un modelo lineal x,y. Es en el análisis no lineal y en el multivariable donde interviene la estadística. Te pongo un ejemplo:
“El porcentaje de la concentración de madera en la pulpa bruta, la presión de la cuba y el tiempo de cocción de la pulpa se investigan en cuanto a sus efectos sobre la resistencia del papel. Se seleccionan tres niveles de la concentración de madera dura, tres niveles de la presión y dos tiempos de cocción.”
Aquí tiene que intervenir la estadística para decidir qué variable va a influir más, si es posible que para los valores de unas obtener el valor de otra con un intervalo de confianza, etc. y si es posible aplicar un modelo lineal.
El control estadístico de la calidad es una colección de herramientas aplicadas a procesos industriales (mano de obra, materias primas medidas, máquinas y medio ambiente), procesos administrativos y/o servicios con objeto de verificar si todas y cada una de las partes del proceso y servicio cumplen con unas ciertas exigencias de calidad y ayudar a cumplirlas, son fundamentales en las actividades de mejora de la calidad. La mejora de la calidad significa la sistemática eliminación del desperdicio.
Dentro de los modelos termodinamicos la fisica estadistica utiliza la teoria de la probabilidad para deducir el comportamiento de sistemas fisicos macroscopicos que es un tema de gran utilidad de intereses. Por otra parte tambien aplica la estadistica en el ambito en el analisis de la produccion ya que nos ayuda a determinar parametros que se involucran en el estudio de un proceso, asi como variables que afectan directamente y hacen eficiente la produccion para si poder evaluar el material producido y poder determinar si un producto es rentable, compararlo con la competencia en el mercado y con ello poder determinar su vida util en el mercado.
tipos de variables usados en estadística
Ejemplo variable cuantitativa
Un ejemplo de variable cuantitativa serían las horas que trabaja un empleado a lo largo de la semana. Otro ejemplo podría ser el número de kilómetros que realiza un ciclista profesional a lo largo de la temporada.
Ejemplo de variable continua
Las variables continuas son aquellas que toman valores infinitos dentro de un intervalo como puede ser el tiempo que un corredor tarda en recorrer los 100 metros lisos. Un ejemplo más puede ser el peso de un paquete de espaguetis.
Ejemplo de variable discreta
Podríamos mencionar el número de helados vendidos en una heladería o el número de clases que da un profesor a lo largo del curso lectivo.
Ejemplo de variable cualitativa
Los asistentes a un concierto que tienen entradas diferenciadas por la zona en la que se ubiquen como pista, grada o zona VIP sería una variable cualitativa.
Definicion de distribución de frecuencia: La distribucion de frecuencias es la manera en la que se ordena una serie de observaciones en diferentes grupos que normalmente se encuentran en orden ascendente o descendente.
Definicion de distribucion normal: Es la distribución continua que se utiliza más comúnmente en estadística, es un modelo que aproxima el valor de una variable aleatoria a una situación ideal, dependiendo de la media y la desviación típica. Se usa para entender fenomenos naturales, sociales, artificiales.
Paquetes a Utilizar
library(pacman)
p_load("rmdformats","readxl","plotly","xfun","gridExtra","leaflet","base64enc", "htmltools", "mime", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2","plotly", "gganimate","gifski","scales","psych","GGally","fdth","modeest", "dplyr","normtest","nortest","moments")
¿Qué es el Ph?
El pH es una medida de acidez o alcalinidad de una disolución acuosa. El pH indica la concentración de iones de hidrógeno presentes en determinadas disoluciones. La sigla significa potencial de hidrógeno o potencial de hidrogeniones. Existe una regla para el analisis de la determinacion de la sustancia acuosa,es decir, para saber si es una sustancia acida o alacalina (basica) para ello es necesario saber que la regla que lo mide va con valores en una escala de 1 al 14. Donde el numero 7 es el valor neutro de la sustancia. Por otro lado los valores de 1 a 6 son las sustancias que se consideran acidas y dependiendo de que tan cerca o alejadas del 7 se identifican fuertes o debiles. Por otro lado en la escala del 8 al 14 se encuentran las sustancias alcalinas o bien, las basicas. De igual modo dependera de que tan cerca o alejados del valor indique la regla en el analisis seran debiles o fuertes.
A modo visual ejemplos de esto son:
Insertando imagen
La relación que existe entre la temperatura y el potencial hidrogeno es que Cuando hay un incremento en la temperatura, el pH disminuye, de igual forma una disminución de temperatura implica un aumento en el pH. La causa de que se afecte el pH del agua por la temperatura es que cuando aumenta la temperatura, las moléculas tienden a separarse en sus elementos: hidrógeno y oxígeno.
#Importar datos
Datos de PH y Temperatura de pozos de agua subterranea
library(readxl)
pozos <- read_excel("pozos.xlsx")
#Importar libreria
library(readxl)
pozos <- read_excel("pozos.xlsx")
datatable(pozos)
Como se puede apreciar en este importe de libreria tenemos el orden de cada una de las variables en orden, los datos van desde 1 hasta 293 datos de Ph con una temperatura.
Ordenar datos de PH menor a mayor
sort(pozos$"PH", decreasing = FALSE)
## [1] 6.1 6.3 6.4 6.4 6.4 6.4 6.4 6.4 6.4 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5
## [19] 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6
## [37] 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.6 6.7 6.7 6.7 6.7 6.7
## [55] 6.7 6.7 6.7 6.7 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [73] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [91] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
## [109] 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [127] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9
## [145] 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 6.9 7.0 7.0
## [163] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [181] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [199] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [217] 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0 7.0
## [235] 7.0 7.0 7.0 7.0 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1
## [253] 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.1 7.2 7.2
## [271] 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.3 7.3 7.3 7.3 7.3 7.3 7.4 7.4
## [289] 7.4 7.4 7.4 7.4 7.5
El ph menor en este analisis es de 6.1, el cual indica que estamos hablando de una sustancia acida no fuerte, es decir; estamos cerca del rango del Ph neutro el cual indica que no es una sustancia ni acida ni basica.
Valor minimo de ph
min(pozos$"PH")
## [1] 6.1
Valor maximo de ph
max(pozos$"PH")
## [1] 7.5
##Rango total de los datos
rangoph <- range(pozos$"PH")
rangoph
## [1] 6.1 7.5
De acuerdo a este dato, la sustancia con el ph mayor fue de 7.5 dandonos un resultado de la sustancia mas neutra de todas las muestras.
Ordenar datos de temperatura: menor a mayor
sort(pozos$"TEMP", decreasing = FALSE)
## [1] 25.6 25.8 26.2 26.3 26.3 26.4 26.4 26.8 26.8 26.9 27.0 27.0 27.1 27.2 27.2
## [16] 27.3 27.3 27.3 27.3 27.4 27.4 27.4 27.4 27.4 27.5 27.5 27.5 27.5 27.5 27.5
## [31] 27.5 27.5 27.5 27.5 27.5 27.5 27.6 27.7 27.7 27.7 27.7 27.8 27.8 27.8 27.8
## [46] 27.8 27.8 27.8 27.8 27.8 27.8 27.8 27.9 27.9 27.9 27.9 27.9 27.9 27.9 27.9
## [61] 27.9 27.9 27.9 27.9 27.9 27.9 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0
## [76] 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.1 28.1 28.1 28.2 28.2 28.2
## [91] 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.2 28.3 28.3 28.3 28.3 28.3 28.3
## [106] 28.3 28.4 28.4 28.4 28.4 28.4 28.4 28.4 28.5 28.5 28.5 28.5 28.5 28.5 28.5
## [121] 28.5 28.5 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6 28.6
## [136] 28.6 28.6 28.6 28.6 28.6 28.6 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7 28.7
## [151] 28.7 28.7 28.7 28.7 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8 28.8
## [166] 28.8 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9 28.9
## [181] 28.9 28.9 28.9 28.9 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0
## [196] 29.0 29.0 29.0 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.1 29.2
## [211] 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.2 29.3 29.3
## [226] 29.3 29.3 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.4 29.5 29.5
## [241] 29.5 29.5 29.5 29.5 29.5 29.5 29.5 29.6 29.6 29.6 29.7 29.7 29.8 29.8 29.8
## [256] 29.8 29.8 29.8 29.9 29.9 29.9 29.9 30.0 30.0 30.0 30.0 30.0 30.0 30.1 30.1
## [271] 30.1 30.1 30.2 30.2 30.2 30.3 30.3 30.3 30.3 30.4 30.5 30.6 30.8 30.9 31.1
## [286] 31.1 31.1 31.2 31.4 31.5 31.7 31.9 32.1
De acuerdo a los valores de las temperaturas, la temperatura menor registrada fue de 25.6 grados mientras que la mayor fue de 31.2 grados.
De acuerdo al analisis con la descripcion del ph y la temperatura el agua por ejemplo se afecta directamente con la temperatura, éste es un resultado ligero pero medible. Por ejemplo, el agua pura tiene un pH de 7 únicamente a una temperatura de 25 grados Celsius. Cuando hay un incremento en la temperatura, el pH disminuye, de igual forma una disminución de temperatura implica un aumento en el pH.
Cuando hay un incremento en la temperatura, el pH disminuye, de igual forma una disminución de temperatura implica un aumento en el pH. La causa de que se afecte el pH del agua por la temperatura es que cuando aumenta la temperatura, las moléculas tienden a separarse en sus elementos: hidrógeno y oxígeno.
Resumidamente en la temperatura mayor de este analisis que es de 32.1 grados, estamos hbalando de la sustancia mas acida de las analizadas, mientras que en la temperatura menor encontraremos la sustancia con mayor alcalinidad.
Valor minimo de temperatura
min(pozos$"TEMP")
## [1] 25.6
Valor maximo de temperatura
max(pozos$"TEMP")
## [1] 32.1
Rango total de temperatura
rangotemp<- range(pozos$"TEMP")
rangotemp
## [1] 25.6 32.1
Numero de los intervalos usando la fórmula según Surges y el ancho de clase.
PH
nclass.Sturges(pozos$PH) # Número de intervalos
## [1] 10
A = diff(range(pozos$PH) / 10) # Ancho de intervalos
A
## [1] 0.14
Como se puede apreciar en los valores, el numero de intervalos totales dentro de los valores del ph son un total de 10 con una diferencia entre ellos de 0.14. Es decir, cada 0.14 de diferencia, encontraremos el dato siguiente del PH.
Temperatura
nclass.Sturges(pozos$TEMP) # Número de intervalos
## [1] 10
A = diff(range(pozos$TEMP) / 10) # Ancho de intervalos
A
## [1] 0.65
Para el caso de los valores que se tienen en la temperatura, el numero de intervalos totales es de 10, igual que en el potencial hidrogeno, pero en esta variable la distancia entre los intervalos es de 0.65.
Tabla de frecuencias que incluye: límites de clases, frecuencia absoluta, frecuencia relativa, frecuencia relativa porcentual, frecuencia acumulada.
- f= frecuencia absoluta
- rf= frecuencia relativa
- rf(%) frecuencia relativa porcentual
- cf= frecuencia acumulada
- cf(%)=frecuencia acumulada porcentual
Para valores de PH
distPH <- fdt(pozos$PH, breaks="Sturges")
distPH
## Class limits f rf rf(%) cf cf(%)
## [6.039,6.193) 1 0.00 0.34 1 0.34
## [6.193,6.346) 1 0.00 0.34 2 0.68
## [6.346,6.5) 7 0.02 2.39 9 3.07
## [6.5,6.653) 40 0.14 13.65 49 16.72
## [6.653,6.807) 67 0.23 22.87 116 39.59
## [6.807,6.961) 44 0.15 15.02 160 54.61
## [6.961,7.114) 108 0.37 36.86 268 91.47
## [7.114,7.268) 12 0.04 4.10 280 95.56
## [7.268,7.421) 12 0.04 4.10 292 99.66
## [7.421,7.575) 1 0.00 0.34 293 100.00
De acuerdo a los datos de la tabla de frecuencias con respecto a los valores del Ph, dentro de estos intervalos (10) los mas repetivos de los valores estan en el intervalo de 6.961 a 7.114 (intervalo 7) con una frecuencia repetitiva de 108 valores, es decir que del total de los valores (293) los indicadores de ph estuvieron dentro de estos rangos con un porcentaje de 91.47 % del 100%, lo cual indica que las soluciones acuosas fueron ligeramente acidas y neutras en su mayoria. Mientras que el resto de las demas, fueron sustancias consideradas acidas fuertes como por ejemplo los PH menores que se muestran en los primeros dos intervalos, o bien o sustancias menos alcalinas como lo es en el intervalo 10 con valores de 7.421 y 7.575.
Para valores de la temperatura
distTEMP <- fdt(pozos$TEMP, breaks="Sturges")
distTEMP
## Class limits f rf rf(%) cf cf(%)
## [25.344,26.052) 2 0.01 0.68 2 0.68
## [26.052,26.759) 5 0.02 1.71 7 2.39
## [26.759,27.467) 17 0.06 5.80 24 8.19
## [27.467,28.175) 63 0.22 21.50 87 29.69
## [28.175,28.883) 79 0.27 26.96 166 56.66
## [28.883,29.59) 81 0.28 27.65 247 84.30
## [29.59,30.298) 28 0.10 9.56 275 93.86
## [30.298,31.006) 9 0.03 3.07 284 96.93
## [31.006,31.713) 7 0.02 2.39 291 99.32
## [31.713,32.421) 2 0.01 0.68 293 100.00
Por otra parte en la tabla de frecuencias de la temperatura vemos que la temperatura o las temperaturas mas constantes se mantuvieron en el intervalo de 28.88 y 29.59 con un total de valores entre ellos de 81 del total que son 293. Esto indica que respectivamente la temperatura esta directamente relacionado con el potencial de hidrogeno que se encuentra en una solucion acuosa. Es decir, a mayor temperatura menor Ph y a menor temperatura mayor el ph.
Histograma, polígono de frecuencias, histograma de frecuencias acumulado
PH
hist(pozos$PH, main = "Histograma de pH", xlab = "pH", ylab = "Frecuencia")
En base al histograma de los valores de Ph vemos que la mayor frecuencia de las estos estuvo en sustancias mas neutras que el resto. Es por ello que la barra mayor que corresponde a la numero 5 representa la mayor cantidad de ph en el analisis dentro de estos rangos.
Histograma de Poligonos De PH
plot(distPH, type="fp", main = "Histograma de poligono de pH", xlab = "pH", ylab = "Frecuencia")
Otra manera de representar los datos es con el metodo de poligonos. Es un metodo grafico que nos permite visualizar lo mismo que la tabla anterior de barras, pero esta vez a manera de puntos y mucho mas facil de entender. Es por esta razon que se sigue mostrando que los valores de pg siguen en el intervalo de 6.90 - 7.20 aproximadamente considerandose los mas repetitivos de los valores totales del analisis.
Hsitograma de frecuencia acumulada de pH
plot(distPH, type="cfh", main = "Histograma de poligono de pH", xlab = "pH", ylab = "Frecuencia")
De acuerdo a la grafica del histograma de la freuencia acumulada con resptecto al Ph se púede observar que los valores de estos tienen una frecuencia mayor entre los intervalos del 7-10. Pero existe otra relacion entre los intervalos que estan de 4-6. Con valores de 6.5 a 6.96 y 7.11 a 7.58 respctivamente.
Histograma, polígono de frecuencias, histograma de frecuencias acumulado
Temperatura
hist(pozos$TEMP, main = "Histograma de TEMP", xlab = "TEMP", ylab = "Frecuencia")
Dentro de la frecuencia mayor que hubo de la temperatura estuvo entre el intervalo de la temperatura entre los 28.5 aproximadamente y los 29 grados. La frecuencia indica que enteas temperaturas se encontraron mayormente las sustancias con valores similares.
Histograma de Poligonos De PH
plot(distTEMP, type="fp", main = "Histograma de poligono de TEMP", xlab = "TEMP", ylab = "frecuancia")
Practicamente es lo mismo que la grafica de frecuencia anterior, son los mismo resultados pero mas mejor definidos por lo tanto, esto facilita la lectura ya que los valores no estan tan separados de los valores. Por lo que del mismo se puede apreciar que las temperaturas mayores disminuyeron el Ph lo cual ocurrio en las temperaturas mas altas que fueron de 80.
Histograma de frecuencia acumulada
plot(distTEMP, type="cfh", main = "Histograma de poligono de TEMP", xlab = "TEMP", ylab = "Frecuencia")
Las frecuancias acumuladas de la temperatura nos indican que los valores a partir de la temperatura de 26.76 tuvieron un incremento considerado hasta la temperatura de 32.42 como se puede observar en la grafica. Esto debido a que probablemtne hubo una corriente de agua que contenia otras sustancias que afectaron el ph tambien, es decir aumentaron o disminuyeron ya que hubo como ya se menciono un incremento de temperatura lo que afceto las concentraciones de los iones de hidrogeno en el agua del pozo. Sin embargo el Ph siguio aumentando debido a los residuos de esa corriente de agua.
pH
Media
mean(pozos$PH)
## [1] 6.890444
El valor de la media fue de 6.8904, lo que indica que este valor es el promedio de los datos del analisis, lo que hace que sea el numero representativo de los datos tales que se analizaron. Por ende este valor de 6.8904 nos indica que estamos hablando de un pH promedio de sustancias acidas muy debiles ya que se acercan al valor neutro de la escala.
Mediana
median(pozos$PH)
## [1] 6.9
Temperatura
Media
mean(pozos$TEMP)
## [1] 28.69795
El valor de la media fue de 28.69, lo que indica que la temperatura en promedio se mantuvo en los 28.69795 grados.
Mediana
median(pozos$TEMP)
## [1] 28.7
Dentro de los valores totales que se tienen en esta serie de datos (variables) el valor medio de ellos es de 28.7. Es decir que 28.7 representa el valor de la temperatura de la posicion central en este conjunto de datos.
Moda
mlv(pozos$TEMP)
## Warning: argument 'method' is missing. Data are supposed to be continuous.
## Default method 'shorth' is used
## Warning: encountered a tie, and the difference between minimal and
## maximal value is > length('x') * 'tie.limit'
## the distribution could be multimodal
## [1] 28.59864
A partir de este resultado que representa la moda, podemos decir que el valor que mas se repitio con respecto a la temperatura es de 28.59864.
Varianza y la desviación estándar
pH
Varianza pH
var(pozos$PH)
## [1] 0.04908645
Varianza temperatura
var(pozos$TEMP)
## [1] 1.035407
Con respecto a la varianza que se presentaron de los datos, vemos en base a los resultados que hubo mayor dispersion en los datos de la temperatura con valor de 1.035407, mientras que en el pH es de 0.04908645. Lo que significa que la variabilidad de la serie de datos esta relacionada con el valor de la media y a su vez estos valores indican que si hubo una varianza entre ellos.
Desviacion estandar
pH
sd(pozos$PH)
## [1] 0.2215546
Temperatura
sd(pozos$TEMP)
## [1] 1.017549
De acuerdo a los valores de la desviacion estandar vemos que sigue existiendo una desviacion mayor en los valores de la temperatura, debido a que los valores en esta variable del analisis tienen mayor separacion entre sus valores, o bien, dicho de otra manera, los valores del pH no tuvieron desviacion estandar tan significativa ya que el valor de estos datos fue de 0.2215546 lo que indica que los datos del potencial hidrogeno tienden a estar mas agruapados con respecto a su media a diferencia de la temperatura. Las desviaciones estandar no pueden dar valores negativos , ya que es matematicamente imposible que estas tengan un valor menor a 0, el valor mas pequeño que estas, puedan adoptar es el 0.
gráfico de caja y bigote
pH y Temperatura
par(mfrow=c(1, 2))
boxplot(pozos$PH, main = "pH de la solucion acuosa")
boxplot(pozos$TEMP, main = "Temperatura de la solucion acuosa")
El diagrama de caja y bigotes nos indican que tanto los valores del pH y la temperatura son datos normales, lo que caracteriza la simetria al rededor de la media de cada serie de datos en las variables. Se puede apreciar que en el diagrama del pH el valor de la mediana esta dividienedo perfectamente la caja, esto debido a que los datos tienen la misma separacion entre sus valores. Si nos colocamos en la grafica de la temperatura vemos que la linea de la mediana esta un poco mas hacia la parte superior de la caja debido a que los datos a partir de los 28 grados a estan mas separados. Es decir que el valor o el rango es mayor del valor de la mediana que es de 28.7. Vemos que el valor minimo de la temperatura es de 25.6 lo que indica que un poco mas del 50% de las temperaturas fue mayor de la temperatura minima pero menor de 30 grados, a su ves el pH se mantuvo con un comportamiento adecuado y consiso con respecto a la tempratura. Dando asi como resultado la mayor parte de los indicadores como sustancias ligeramente acidas o muy alcalinas dando asi como resultado dos valores con la alcalinidad mas baja con ph cerca de la escala 14.
Gráfica de dispersión de pH versus temperatura
versus <- ggplot(pozos)+
geom_point(aes(x=TEMP, y=PH, colour = "Temperatura vs pH"))
labs(title="pH vs Temperatura del agua",x="Orden",y="Temperatura")
## $x
## [1] "Orden"
##
## $y
## [1] "Temperatura"
##
## $title
## [1] "pH vs Temperatura del agua"
##
## attr(,"class")
## [1] "labels"
ggplotly(versus)
De acuerdo a los datos representantes de este análisis vemos que la temperatura y el ph si tienen mucha relación entre sí, esto debido a los efectos que existe de la transferencia de calor que existe entre los iones al subír la temperatura, afectan la concentración de los iones del hidrógeno. En otras palabras si aumenta la temperatura el potencial hidrógeno disminuye y viceversa ya que las moléculas tienden a separarse en sus elementos puros. Como se puede apreciar en la grafica con puntos, el ph tuvo un comportamiento más notorio en la temperatura de 28.5 a 28.6 con un ph de 6.8 a 7. Lo cual indica que la hipótesis alterna es aceptable en este caso, ya que esto no debería ser de esta manera porque al aumentar 0.1 la temperatura el ph debió de haber disminuido y pasó lo contrario.
Conclusión:
El agua de pozo en este caso de estudio tuvo una relación mínima entre el valor del ph y el valor de las temperaturas debido a que probablemente alguna corriente interna del pozo estuvo en contacto con esta provocando así la alteración en los iones de Hidrógeno dando así como resultado lo contrario en la mayoría de los valores, es decir que en la última grafica se puede ver claramente cómo los valores de ph aumentaban conforme se incrementaba la temperatura y esto no es un comportamiento químicamente normal ya que al aumentar la temperatura el ph debería de disminuir porque quedan más separados sus elementos. Aceptó la hipótesis alterna y mandaría analizar ese pozo porque si es de consumo humano, se debe de analizar el tipo de sustancias extras que se encuentran en su composición o bien, conocer sus propiedades mejor para darle el uso favorable a esta agua de pozo subterránea. Aunque bien, la mayoría de las temperaturas indicaron que se trata mayormente de sustancia alcalinas fuertes ( las cuales se pueden identificar al tacto: por ejemplo el jabón, que después de lavarlo o quitar el producto se queda la sensación resbalosa en la piel) también hubo un margen en el que existió la indicación de solución a acuosa ácida, aunque fuera débil.