Semana # 1

Jorge Iván Rivera Bermúdez
CC: 1031164050


# Codigo para importar datos desde excel
library(readxl)
Data1 <- read_excel("~/Rprojects/Computacion_e/Data1.xlsx", 
                     sheet = "Data")
# View(Data1)
head(Data1)
## Warning: `...` is not empty.
## 
## We detected these problematic arguments:
## * `needs_dots`
## 
## These dots only exist to allow future extensions and should be empty.
## Did you misspecify an argument?
## # A tibble: 6 x 4
##      pH `CEA(75cm)` HRZ    Temp
##   <dbl>       <dbl> <chr> <dbl>
## 1  4.09        14.7 Ap     28.3
## 2  4.74        14.5 Ap     27.5
## 3  4.67        13.5 Ap     27.1
## 4  3.57        10.1 Ap     29.9
## 5  4.30        12.4 Ap     33.4
## 6  4.78        13.9 Ap     29.5
# install.packages("psych") # estadística descriptiva
library(psych)

describe(Data1$pH)
##    vars  n mean   sd median trimmed  mad  min  max range  skew kurtosis   se
## X1    1 50 4.52 0.42   4.51    4.53 0.45 3.57 5.38  1.82 -0.13    -0.56 0.06
describeBy(Data1$pH, Data1$HRZ)
## 
##  Descriptive statistics by group 
## group: A1
##    vars  n mean   sd median trimmed  mad  min  max range skew kurtosis   se
## X1    1 26 4.56 0.43   4.51    4.56 0.47 3.62 5.38  1.76 0.12     -0.8 0.08
## ------------------------------------------------------------ 
## group: Ap
##    vars  n mean   sd median trimmed mad  min  max range  skew kurtosis   se
## X1    1 24 4.47 0.41   4.53     4.5 0.4 3.57 5.11  1.54 -0.49     -0.8 0.08
v1 <- c(4.5, 4.9, 5.3, 4.6, 5.8)
v2 <- c(4.5, 4.9, 5.3, 4.6, 1.8)

media_v1 <- mean(v1); media_v1
## [1] 5.02
media_v2 <- mean(v2); media_v2
## [1] 4.22
mediana_v1 <- median(v1); mediana_v1
## [1] 4.9
mediana_v2 <- median(v2); mediana_v2
## [1] 4.6
# media truncada (trimmed)
min(Data1$pH)
## [1] 3.565808
max(Data1$pH)
## [1] 5.381914
which.min(Data1$pH)
## [1] 4
which.max(Data1$pH)
## [1] 39
# eliminando el mínimo y máximo
pH_trimmed <- Data1$pH[-c(4,39)]
mean(pH_trimmed) # no se produce un cambio apreciable
## [1] 4.522618
# CV: coeficiente de variacion (sd/mean)*100
cv_ph_Ap <- sd(Data1$pH[Data1$HRZ=='Ap']) / 
        mean(Data1$pH[Data1$HRZ=='Ap']); cv_ph_Ap
## [1] 0.09198098
cv_ph_A1 <- sd(Data1$pH[Data1$HRZ=='A1']) / 
        mean(Data1$pH[Data1$HRZ=='A1']); cv_ph_A1
## [1] 0.09496681
# ambos coeficientes presentan baja dispersión (9% aprox.)
library(ggplot2)
## 
## Attaching package: 'ggplot2'
## The following objects are masked from 'package:psych':
## 
##     %+%, alpha
ggplot(data = Data1, aes(x = HRZ, y = pH)) +
        geom_boxplot(col = "black", fill = c(3, 4)) +
        scale_x_discrete()

ggplot(data = Data1, aes(x = pH, fill = HRZ)) +
        geom_histogram() +
        facet_wrap(~HRZ)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.


set.seed(2020)
options(digits = 3)
germ <- rnorm(20, 80, 3)
media <- mean(germ)
mediana <- median(germ)

# histograma
hist(germ, main = "Histograma de germinación", col = "steelblue",
     xlim = c(65, 90), ylim = c(0, 5), xlab = "Germinación", 
     ylab = "Frecuencia")
abline(v = media, col = "red", cex = 3) # media de color rojo
abline(v = mediana, col = "darkgreen", cex = 3) # mediana de color verde
rug(germ, col = "steelblue")
grid(nx = 0, ny = 10, col = "black")


     Modelo de diseño experimental:

\[Y_{ij}=\mu+\tau_i+\beta_j+(\tau\beta)_{ij}+\epsilon_{ijk}\]
     Matriz:

\[ A_{m,n} = \begin{pmatrix} 8 & 5 & 4 & -1\\ 5 & 7 & 11 & -5\\ 6 & 4 & -3 & -2\\ 0 & -1 & 7 & 6 \end{pmatrix} \]


     Sistema de ecuaciones:

\[ \left. 2x + y = 1 \atop x + y = 4 \right\} \]
     Expresion integral en LaTeX:

\[ \begin{equation} y = \int_{x=0}^{x = 2 \pi + 10} f(x) dx \end{equation} \]      Otro ejemplo:

\[ \begin{multline*} p(x) = 3x^6 + 14x^5y + 590x^4y^2 + 19x^3y^3 - 12x^2y^4 - 12xy^5 + 2y^6 - a^3b^3 \end{multline*} \]


     Crear una función:

# my_function <- function(arg1, ...)){
# statement(s)
# }

# convertir grados centigrados a grados Kelvin
temp_conversor <- function(gc) 
        gc + 273.15

temp_conversor(seq(25, 35, 1))
##  [1] 298 299 300 301 302 303 304 305 306 307 308
# sacar el logaritmo a un numero o conjunto de numeros dado
logaritmo <- function(x){
        if(x > 0){
                log(x)
        }
        else(print("Valor fuera del dominio de la funcion"))
}
logaritmo(0)
## [1] "Valor fuera del dominio de la funcion"
## [1] "Valor fuera del dominio de la funcion"
logaritmo(1:10)
##  [1] 0.000 0.693 1.099 1.386 1.609 1.792 1.946 2.079 2.197 2.303

Acerca del pH:

Aunque por defecto se establece que el pH es una escala que va de 0 a 14, siendo el 0 lo más ácido alcanzable y el 14 lo más básico, lo cierto es que es una escala de proporción, por lo que:

  • en realidad, si se pueden alcanzar tales valores de los extremos, e incluso sobrepasarlos
  • tiene sentido medir distancias, pero no cocientes (por ser una escala de intervalo y no de razon)
  • No tiene sentido decir que un valor de pH = 4, es el doble de pH que una muestra con pH = 2, por la misma razón antes mencionada.

  • Respecto a la conductividad electrica aparente del suelo (CEa):

    Es una variable cuantitativa continua y mide la capacidad del suelo para conducir corriente eléctrica al aprovechar la propiedad de las sales en la conducción de esta, diferente de la conductividad electrica (CE) que mide la concentración de sales solubles presentes en la solución del suelo.

    Respecto a la curtosis:

    Es una medida estadística que determina el grado de concentración que presentan los valores de una variable alrededor de la zona central de la distribución de frecuencias.

    Existen 3 formas para clasificar una curva:

  • Mesocúrtica: cuando el valor es cero (0), se dice que los datos se distribuyen de forma normal o de campana.
  • Leptocúrtica: si la distribución es más empinada que la curva normal el coeficiente obtendra valores mayores a 0
  • Platicúrtica: la distribución es más aplanada que la curva normal y se obtienen valores menores a 0.

  • La temperatura es una variable cuantitativa que puede poseer un 0 real o relativo, dependiendo del sistema que se utilice, siendo real para los grados Kelvin y relativo para los grados centígrados, ya que para el 0 K no hay choque de partículas mientras que para 0°C esto no sucede.

    Horizonte del suelo: es una variable cualitativa nominal.