En la agronomia el pH es una de las variables más importantes ya que en los suelos agrícolas, pues afecta directamente a la absorción de los nutrientes del suelo por las plantas, así como a la resolución de muchos procesos químicos que en él se producen. En general, el pH óptimo de estos suelos debe variar entre 6,5 y 7,0 para obtener los mejores rendimientos y la mayor productividad (Prasad & Power, 1997). Esta es una variable que usualmente se maneja de manera cuantitativa continua, y se calcula de la siguiente manera: \[pH = log[H^+]\]
En la practica se toma el pH como una medicion relativa ya que no se determina directamente la concentración de \(H^+\), sino que se compara el pH de una muestra con el de una disolución patrón de pH conocido; ademas para obtener un valor de pH de 0 se diria que se tiene una concentracion de \(H^+ = 1\) y esto no se ha encontrado en la naturaleza siendo el pH mas bajo de 3.5 lo mismo sucede con el extremo 14, no se han reportado suelos con estos valores sino aproximadamente de 9; por lo tanto al ser un valor relativo se puede decir que si se tomara un pH de 4 este no seria el doble de un valor de pH de 2.
*Codigo para importar datos desde Excel
library(readxl)
Excelldatosclase <- read_excel("Excelldatosclase.xlsx",
sheet = "data")
View(Excelldatosclase)
En el anterior excel se obtienen datos de:
+ Conductividad Electrica aparente: la cual es una variable cuantitativa continua; esta mide la capacidad del suelo para conducir corriente eléctrica al aprovechar la propiedad de las sales en la conducción de esta; por lo tanto, la CE mide la concentración de sales solubles presentes en la solución del suelo
+ Temperatura en °C: La cual decimos que es una variable cuantitativa continua pero contine que se mide en grados Celsius por lo cual indica que tiene un 0 relativo o tambien llamdo cero falso.
+ Los horizontes: Son una variable cualitativa ordinal, en primera instancia se tiene el horizonte Ap el cual designa a un horizonte perturbado, puede ser por acción humana; y en segunda instancia el horizonte A1 que se caracteriza por que la materia orgánica se halla íntimamente mezclada con los minerales y su forma original no es mayormente reconocible. La actividad biológica es máxima en este horizonte superior. Su color es más oscuro en general, que el del resto de los horizontes A y se presenta con mucho espesor en los suelos tipo “chernozem”.
En la estadistica descriptiva se realizan Mediciones, Graficas y Tablas para todos los datos o variable por variable para esto se recomienda intalar la libreria “psych” haciendo click en tools - instal packages- nombre de libreria; y se utulizan la funciones describe y describeBy para obtener calculos estadisticos basicos.
library(psych)
describe(Excelldatosclase$pH)
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 50 4.5 0.58 4.52 4.5 0.6 3.09 5.78 2.69 0.01 -0.22 0.08
describeBy(Excelldatosclase$pH, Excelldatosclase$HRZ)
##
## Descriptive statistics by group
## group: A1
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 25 4.55 0.5 4.52 4.59 0.34 3.09 5.43 2.34 -0.77 1.08 0.1
## ------------------------------------------------------------
## group: Ap
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 25 4.46 0.65 4.46 4.42 0.77 3.39 5.78 2.39 0.46 -0.81 0.13
v1 = c(4.5,4.9,5.3,4.6,5.8)
v2 = c(4.5,4.9,5.3,4.6,1.8)
media_v1 = mean(v1)
media_v2 = mean(v2)
mediana_v1 = median(v1)
mediana_v2 = median(v2)
min(Excelldatosclase$pH)
## [1] 3.09
max(Excelldatosclase$pH)
## [1] 5.78
Es un punto equidistante entre los datos recolectados sd = es la desviacion estandar (mean) ### Media truncada: Consiste en eliminar el 5% de los datos 2.5 por izquierda y 2.5 por derecha; Si observamos los valores de media truncada (trimmed) y estos son similares a la media (mean), no vale la pena truncar
which.min(Excelldatosclase$pH)
## [1] 32
which.max(Excelldatosclase$pH)
## [1] 13
pH2 = Excelldatosclase$pH[-c(13,32)]
mean(pH2)
## [1] 4.507292
#Para la asignacion de variables o vectores "=" o "<-"
Es una medida que se utiliza para cuantificar la variación o la dispersión de un conjunto de datos numéricos con respecto a la media. (sd)
(mad) Es otra forma de medir la desviasion de los datos esta se calcula donde a cada dato se le resta la media, y estos valores promedian.
Es la medida de variacion de los datos calculada de tal manera los valores negativos no afecten el resultado, este es un dato que no viene calculada en las funciones describe o describeBy pero se puede calcular elevando al cuadraro la sd
Se calcua como la diverencia entre el valor maximo y el valor minimo
Es un coeficiente que permite saber si la distribucion de los datos es asimetrica positiva, ya que la mayoria de los valores se agrupan a la izquierda; asimetrica negativa si la mayoria de los datos se agrupan a la derecha o simetrica si la mayoria de los valores se agrupan en el centro. Por ejemplo si los valores son muy cercanos a 0 como en este caso se puede decir que es simetrico
La curtosis es una medida estadística que determina el grado de concentración que presentan los valores de una variable alrededor de la zona central de la distribución de frecuencias.
Mesocúrtica: Cuando el valor de se dice que los datos se distribuyen forma normal o de campana; se obtienen valores = a 0
Leptocúrtica: Si la distribución es más empinada que la curva normal; el coeficiente obtendra valores > a 0
Platicúrtica:la distribución es más aplanada que la curva normal; se obtendran valores < a 0.
Teniendo en cuenta los valores anteriores se podria decir que el horizonte Ap es Leptocurtica al obtener un valor mayor a cero mientras que el horizonte Ap es Platicurtica por que obtiene un valor menor a cero.
#COEFICIENTE DE VARIACION = desviacion entre la media
cv_ph_Ap = sd(Excelldatosclase$pH[Excelldatosclase$HRZ=='Ap']) / mean(Excelldatosclase$pH[Excelldatosclase$HRZ=='Ap'])
cv_ph_A1 = sd(Excelldatosclase$pH[Excelldatosclase$HRZ=='A1']) / mean(Excelldatosclase$pH[Excelldatosclase$HRZ=='A1'])