library(readxl)
library(psych)
library(e1071)
library(lattice)
diseño_1 <- read_excel("diseño 1.xlsx",
col_types = c("skip", "skip", "skip",
"skip", "numeric", "numeric", "text",
"numeric"))
clase1 = diseño_1
head(clase1)
Datos creados por “Darlley Stiven Taborda Lozada” desde Excel e importados a R
describe(clase1$pH)
A través de la librería pysch se obtuvo un resumen detallado de los datos: media, mediana, desviación, media truncada, etc. Pero estos datos son de los dos horizontes juntos . por eso a través de la siguiente función miraremos la relación del pH en cada horizonte
describeBy(clase1$pH,clase1$HRZ)
##
## Descriptive statistics by group
## group: A1
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 25 4.55 0.4 4.52 4.53 0.39 3.93 5.45 1.52 0.37 -0.78 0.08
## ------------------------------------------------------------
## group: Ap
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 25 4.51 0.46 4.47 4.5 0.4 3.77 5.49 1.72 0.37 -0.78 0.09
Ambas medias y medianas están muy cerca una de la otra , y la media truncada no difiere de la media significativamente , la mayor diferencia de los horizontes es desviación estándar que es mayor en el horizonte Ap.
Revisaremos el min y máximo de los datos obtenidos para mirar si siguen dentro de la desviación estándar de los datos y que tanto afecta a la media
min(clase1$pH)
## [1] 3.77
max(clase1$pH)
## [1] 5.49
Con la siguiente función miraremos la ubicación de los datos es decir su posición
which.max(clase1$pH)
## [1] 7
which.min(clase1$pH)
## [1] 23
Como la media es tan sensible por números en sus extremos al eliminar ambos deberíamos ajustar más los valores para que sean exactamente a la media truncada
pH2 = clase1$pH[-c(7,23)]
mean(pH2)
## [1] 4.527292
Efectivamente sucedió de manera esperada esto con los datos globales este proceso tan bien puede hacerse con los datos por horizonte
Como observamos que las medias entre horizontes eran muy parecidas y solo a la desviación tenía un cambio notable, usaremos el coeficiente de variación para determinar que tanto están variando los datos y que tan confiables son
cvph_Ap = (sd(clase1$pH[clase1$HRZ=="Ap"])/mean(clase1$pH[clase1$HRZ=="Ap"]))*100
cvph_Ap
## [1] 10.09071
cvph_A1 = (sd(clase1$pH[clase1$HRZ=="A1"])/mean(clase1$pH[clase1$HRZ=="A1"]))*100
cvph_A1
## [1] 8.897707
Ambos coeficientes están por debajo del 20% sus datos no presentan una variabilidad que influya en la media .
Aunque sus coeficientes son diferentes entre los dos, ambas medias pueden usarse para tomar decisiones
veamos esto con un diagrama de cajas
boxplot(clase1$pH[clase1$HRZ=="Ap"],clase1$pH[clase1$HRZ=="A1"], col = c("darkred","darkgreen"), xlab= "horizontes",ylab = "pH",main = "Distribucion de los datos")
legend(x="topleft",legend = c("Ap","A1"),fill = c("darkred","darkgreen"),title = "horizontes")
points(mean(clase1$pH[clase1$HRZ=="Ap"]),pch=18,cex=2,col="darkblue")
points(x= 2, mean(clase1$pH[clase1$HRZ=="A1"]),pch=18,cex=2,col="salmon")
text(x=1.15,y= 4.65,"Media 4.51", col="darkblue")
text(x=2.15,y= 4.68,"Media 4.55", col="salmon")
Como se observa las medias son parecidas a las medianas , no presenta datos por fuera de los limites y son muy parecidos entre si.
Otra variable importante que nos mostró la librería es senes que hace referencia a la simetría, est6a simetría la calculamos con la función de movimiento en tercer orden pero en R podemos usar varias librerías o extraer el dato aportado por la función describe , por ende usamos dos librerías deferentes y la comparamos con el dato arrojado en el describe
skew(clase1$pH)
## [1] 0.3668266
skewness(clase1$pH)
## [1] 0.3668266
Cómo se puede observar es exactamente igual esto con los datos globales. Pero que quiere decir este número \[0.3668\] como el valor se encuentro entre -2 y 2 podemos decir que hay simetría ahora el signo y el valor determinara cual como el valor es muy cercano a cero podemos decir que es simétrico y de distribución normal pero como es positivo los datos van a estar ligeramente a la izquierda una simetría positiva para confirmar esto nos apoyaremos en la curtosis
kurtosi(clase1$pH)
## [1] -0.6651594
Como la curtosis es muy cercana a cero es mesocúrtica y esto es sinónimo de normalidad pero al tener el signo negativo tendrá un tendencia palticurtica esto con los datos de forma global y lo podemos ver en un histograma
histogram(pH2, col = "darkred", xlab= "pH",ylab = "",main = "Distribucion de los datos")
densityplot(pH2, col = "darkred", xlab= "pH",ylab = "",main = "Distribucion de los datos")
Esto tan bien lo podemos ver por horizontes y analizar este agrupamiento de cada uno tanto su simetría como la forma de la curva
skew_Ap = skewness(clase1$pH[clase1$HRZ=="Ap"])
skew_Ap
## [1] 0.3732161
skew_A1 = skewness(clase1$pH[clase1$HRZ=="A1"])
skew_A1
## [1] 0.3654931
No hay diferencia con la global y por sus valores de podemos ver que presentan simetría
kurtosis_Ap = kurtosi(clase1$pH[clase1$HRZ=="Ap"])
kurtosis_Ap
## [1] -0.7818276
kurtosis_A1 = kurtosi(clase1$pH[clase1$HRZ=="A1"])
kurtosis_A1
## [1] -0.776058
Siguen muy cercanas a cero por lo cual serian mesocurticas
histograma_Ap = histogram(clase1$pH[clase1$HRZ=="Ap"],col = "darkblue", xlab= "pH Horizonte Ap",ylab = "",main = "Distribucion de los datos Ap")
histograma_Ap
densityplot(clase1$pH[clase1$HRZ=="Ap"],col = "darkblue", xlab= "pH Horizonte Ap",ylab = "",main = "Distribucion de los datos Ap")
histograma_A1 = histogram(clase1$pH[clase1$HRZ=="A1"],col = "darkgreen", xlab= "pH Horizonte A1",ylab = "",main = "Distribucion de los datos A1")
histograma_A1
densityplot(clase1$pH[clase1$HRZ=="A1"],col = "darkgreen", xlab= "pH Horizonte A1",ylab = "",main = "Distribucion de los datos A1")
Como no son exactamente cero en su coeficiente de skewness si no un valor positivo muy cercano a cero puede verse ligeramente concentrada ala izquierda es decir una simetría positiva
\[ pH\ de\ 0\ a\ 14\]
Lo libros de manera general determinan que el rango normal del pH va de 0 a 14 de manera general pero no descargan variaciones en la escala , hay múltiples formas de medirlo ya sea por indicadores o por la concentración de hidronios e hidroxilos a través de un potenciómetro o cálculos.
En la teoría encontrar pH 0 y 14 son calculables ¿pero que es pH?
Para conocer la acidez o la basicidad de una disolución, es suficiente con conocer la concentración de iones hidronio o la concentración de iones hidroxilo. No obstante, estos valores de concentración son poco manejables, ya que suelen ser muy pequeños y se expresan como una potencia de base 10 con exponente negativo.
Es por esto por lo que Sorensen (en 1909) sugirió una escala logarítmica o escala de pH y la definición de este: logaritmo decimal, cambiado de signo, de la concentración de iones hidronio, es decir,
\[pH = -log[H3O+]\]
y la de
\[pOH = -log[OH–]\]
A 25ºC, la suma de ambos vale 14, es decir,
\[pH + pOH = 14\]
Esto nos permitirá determinar el valor del pH si disponemos del valor del pOH y viceversa. Además, se cumple que, a 25ºC:
\[pH < 7\ Solución\ ácida\] \[pH > 7\ Solución\ básica\] \[pH = 7\ Solución\ neutra\] Si estamos a una temperatura distinta de 25ºC, estos valores serán distintos basado en esta definición de pH para obtener valores de la escala 14 y 0 solo puede a ver presencian de una de las concentraciones lo cual teóricamente es posible incluso calcular la concentración atreves del método inverso
por ejemplo
sabiendo que su pH es 4,50 a 25ºC. Para ello aplicaremos la siguiente relación matemática que ya conoces: \[pH = -log[H3O+]\], es decir, que el pH es el logaritmo negativo de la concentración de iones hidronio; \[4,5 = -log[H3O+]\]. Para despejar, debemos saber que la \[[H3O+]\ será\ 10^{-4,5}\].
Después, una vez conocida la concentración de iones hidronio y sabiendo que \[ Kw = 10^{-14}\] y que, por tanto, \[[H3O+]·[OH-] = 10^{-14}\], despejaremos la concentración de iones hidroxilo.
pero que tan fácil es ver este tipo de concentraciones en la realidad el ácido clorhídrico al 96% concentrado tiene un pH de 1 o inferior pero no 0 por potenciómetro , pero pH 0 por papel indicador en que radica la diferencia en la sensibilidad del instrumento para determinar el pH, hay formas de medir concentración para realizar un proceso de estandarización (concentración real de la solución ) donde de manera directa o indirecta conocemos la concentración real de dicho elemento , porque se hace esto en química solo los patrones estándar de alta calidad aseguran una pureza muy cercana a 100 y otorgan una concentración real , por ende la mayoría de reactivos químicos tiene niveles de impurezas que alguna veces puede agua . el ácido clorhídrico al 96 % nos da una relación que por cada 100 mL de sustancia 96 son de ácido clorhídrico puro y ese 4 % restante es una traza de su extracción que puede afectar su pH porque para obtener pH 0 y 14 debe ser una concentración absoluta de hidronios o hidroxilos lo cual no se consigue de manera práctica muy fácilmente, incluso la sensibilidad de los instrumentos pueda medirla .
esta explicación con el fin de determinar si el cero es real o relativo en la escala del pH. desde mi punto de vista es real en la escala de sorensen, que obtenerlo en la práctica no es tan fácil como en la teoría es otra cuestión.
\[Fuentes\]
\[http://iio.ens.uabc.mx/hojas-seguridad/acido_clorhidrico.pdf\] \[Quimica\ genereal\ de\ Reymong\ Chang\ http://www.qfa.uam.es/fqf/material/l2.pdf \] \[https://www.quimitube.com/videos/teoria-3-concepto-de-ph/\]