# Codigo para importar datos desde excel
library(readxl)
Data1 <- read_excel("~/Rprojects/Computacion_e/Data1.xlsx",
sheet = "Data")
# View(Data1)
head(Data1)
## Warning: `...` is not empty.
##
## We detected these problematic arguments:
## * `needs_dots`
##
## These dots only exist to allow future extensions and should be empty.
## Did you misspecify an argument?
## # A tibble: 6 x 4
## pH `CEA(75cm)` HRZ Temp
## <dbl> <dbl> <chr> <dbl>
## 1 4.09 14.7 Ap 28.3
## 2 4.74 14.5 Ap 27.5
## 3 4.67 13.5 Ap 27.1
## 4 3.57 10.1 Ap 29.9
## 5 4.30 12.4 Ap 33.4
## 6 4.78 13.9 Ap 29.5
# install.packages("psych") # estadística descriptiva
library(psych)
describe(Data1$pH)
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 50 4.52 0.42 4.51 4.53 0.45 3.57 5.38 1.82 -0.13 -0.56 0.06
describeBy(Data1$pH, Data1$HRZ)
##
## Descriptive statistics by group
## group: A1
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 26 4.56 0.43 4.51 4.56 0.47 3.62 5.38 1.76 0.12 -0.8 0.08
## ------------------------------------------------------------
## group: Ap
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 24 4.47 0.41 4.53 4.5 0.4 3.57 5.11 1.54 -0.49 -0.8 0.08
v1 <- c(4.5, 4.9, 5.3, 4.6, 5.8)
v2 <- c(4.5, 4.9, 5.3, 4.6, 1.8)
media_v1 <- mean(v1); media_v1
## [1] 5.02
media_v2 <- mean(v2); media_v2
## [1] 4.22
mediana_v1 <- median(v1); mediana_v1
## [1] 4.9
mediana_v2 <- median(v2); mediana_v2
## [1] 4.6
# media truncada (trimmed)
min(Data1$pH)
## [1] 3.565808
max(Data1$pH)
## [1] 5.381914
which.min(Data1$pH)
## [1] 4
which.max(Data1$pH)
## [1] 39
# eliminando el mínimo y máximo
pH_trimmed <- Data1$pH[-c(4,39)]
mean(pH_trimmed) # no se produce un cambio apreciable
## [1] 4.522618
# CV: coeficiente de variacion (sd/mean)*100
cv_ph_Ap <- sd(Data1$pH[Data1$HRZ=='Ap']) /
mean(Data1$pH[Data1$HRZ=='Ap']); cv_ph_Ap
## [1] 0.09198098
cv_ph_A1 <- sd(Data1$pH[Data1$HRZ=='A1']) /
mean(Data1$pH[Data1$HRZ=='A1']); cv_ph_A1
## [1] 0.09496681
# ambos coeficientes presentan baja dispersión (9% aprox.)
library(ggplot2)
##
## Attaching package: 'ggplot2'
## The following objects are masked from 'package:psych':
##
## %+%, alpha
ggplot(data = Data1, aes(x = HRZ, y = pH)) +
geom_boxplot(col = "black", fill = c(3, 4)) +
scale_x_discrete()
ggplot(data = Data1, aes(x = pH, fill = HRZ)) +
geom_histogram() +
facet_wrap(~HRZ)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
set.seed(2020)
options(digits = 3)
germ <- rnorm(20, 80, 3)
media <- mean(germ)
mediana <- median(germ)
# histograma
hist(germ, main = "Histograma de germinación", col = "steelblue",
xlim = c(65, 90), ylim = c(0, 5), xlab = "Germinación",
ylab = "Frecuencia")
abline(v = media, col = "red", cex = 3) # media de color rojo
abline(v = mediana, col = "darkgreen", cex = 3) # mediana de color verde
rug(germ, col = "steelblue")
grid(nx = 0, ny = 10, col = "black")
Modelo de diseño experimental:
\[Y_{ij}=\mu+\tau_i+\beta_j+(\tau\beta)_{ij}+\epsilon_{ijk}\]
Matriz:
\[ A_{m,n} = \begin{pmatrix} 8 & 5 & 4 & -1\\ 5 & 7 & 11 & -5\\ 6 & 4 & -3 & -2\\ 0 & -1 & 7 & 6 \end{pmatrix} \]
Sistema de ecuaciones:
\[
\left.
2x + y = 1 \atop
x + y = 4
\right\}
\]
Expresion integral en LaTeX:
\[
\begin{equation}
y = \int_{x=0}^{x = 2 \pi + 10} f(x) dx
\end{equation}
\] Otro ejemplo:
\[ \begin{multline*} p(x) = 3x^6 + 14x^5y + 590x^4y^2 + 19x^3y^3 - 12x^2y^4 - 12xy^5 + 2y^6 - a^3b^3 \end{multline*} \]
Crear una función:
# my_function <- function(arg1, ...)){
# statement(s)
# }
# convertir grados centigrados a grados Kelvin
temp_conversor <- function(gc)
gc + 273.15
temp_conversor(seq(25, 35, 1))
## [1] 298 299 300 301 302 303 304 305 306 307 308
# sacar el logaritmo a un numero o conjunto de numeros dado
logaritmo <- function(x){
if(x > 0){
log(x)
}
else(print("Valor fuera del dominio de la funcion"))
}
logaritmo(0)
## [1] "Valor fuera del dominio de la funcion"
## [1] "Valor fuera del dominio de la funcion"
logaritmo(1:10)
## [1] 0.000 0.693 1.099 1.386 1.609 1.792 1.946 2.079 2.197 2.303
Acerca del pH:
Aunque por defecto se establece que el pH es una escala que va de 0 a 14, siendo el 0 lo más ácido alcanzable y el 14 lo más básico, lo cierto es que es una escala de proporción, por lo que:
Respecto a la conductividad electrica aparente del suelo (CEa):
Es una variable cuantitativa continua y mide la capacidad del suelo para conducir corriente eléctrica al aprovechar la propiedad de las sales en la conducción de esta, diferente de la conductividad electrica (CE) que mide la concentración de sales solubles presentes en la solución del suelo.
Respecto a la curtosis:
Es una medida estadística que determina el grado de concentración que presentan los valores de una variable alrededor de la zona central de la distribución de frecuencias.
Existen 3 formas para clasificar una curva:
La temperatura es una variable cuantitativa que puede poseer un 0 real o relativo, dependiendo del sistema que se utilice, siendo real para los grados Kelvin y relativo para los grados centígrados, ya que para el 0 K no hay choque de partículas mientras que para 0°C esto no sucede.
Horizonte del suelo: es una variable cualitativa nominal.