Conceptos
El entorno R es uno de los más utilizados para el análisis de datos en las ciencias biológicas. Su amplio uso radica en la gran comunidad que constantemente está innovando en la creación de nuevos paquetes (elementos complementarios) que permiten ampliar significativamente la versatilidad del software.
Una de las primeras funciones de R es la posiblidad de realizar operaciones binarias:
2+3 # suma
2-3 # resta
2*3 # multiplicación
2/3 # división
8^2 # exponente
7%/%3 # división entera
También permite realizar operaciones lógicas, las cuales por regla se evalúan de izquierda a derecha, verificando el primer elemento de cada vector. En el sistema R, el vector es el elemento mínimo, del cual podemos 1) seleccionar, 2) manipular y ordenar. Algunas características que tiene el vector es que sus elementos deben ser de la misma clase, si requerimo un vector con objetos de distinta clase utilizamos las listas. Esto es muy común de realizar, pero es importante tenerlo en cuenta cuando ingresamos nuestros datos.
Otra característica que tienen los objetos son los atributos. En los atributos de los objetos en R podemos tener las siguientes opciones:
- Names, dimnames.
- Dimensions (matrices, arreglos)
- Class
- Lenght
- Otros atributos definidos.
Para empezar a entender el entorno de R, debemos tener claro que para la entrada de objetos debemos utilizar el signo de asignación <-. Aunque también se podría utilizar el símbolo = esto podría generar incoherencias en algunos procesos, por lo cual no se recomienda.
Realice el siguiente ejercicio. 1. Primero creemos un objeto con nombre a, el cual contiene el número 45. Esto se ejecuta de la siguiente forma:
a <- 45
En ocasiones las funciones o indicaciones que le damos a R son incompletas, por lo cual el sistema nos lo va indicar con un símbolo +, por ejemplo, ejecute a <-. Para evitar estas situaciones, debemos dar un doble click de esc en la consola, con lo cual se elimina el error. En otras ocasiones, podríamos estar interesados en utilizar comentarios, que sirvan como notas para nuestros análisis, lo cual se puede lograr con el símbolo #.
Ejecute el siguiente comando:
b<-65
a+b
#¿Cuál es el resultado de este cálculo?
Notese que si utiliza el sign de # el sistema no va a reconocer lo que continúe en la línea en los análisis. Para crear elementos de una secuencia específica, podemos utilizar la siguiente opción: 1:25. En el caso de hola <- c(1:25), estaríamos creando un vector con una serie de números desde 1 a 25 (Intentelo ahora).
Por regla general, para crear vectores debemos utilizar la función c() [Concatenar], la cual se puede utilizar de las siguientes formas:
x <- c(0.3,0.9) # numérico
x <- c(FALSE, TRUE) # lógico
x <- c(T,F) # lógico
x <- c("a", "c", "d") #caracteres
x <- c(19:49) #enteros
Nótese que si utiliza un único nombre en la asignación (en este caso “x”), el sistema sustituye
En ocasiones podemos estar interesados en crear secuencias con características específicas, en las cuales tenemos un mayor control de los elementos, para lo cual podemos optar por las siguientes opciones:
d <- seq(1,20) # note que seq trabaja de la misma manera que " : "
d1 <- seq(0, 10, by=0.5) #secuenca de 0 a 10 cada 0.5 incrementos
d2 <- seq(5, 10, length=30) #¿Cuál es la diferencia del resultado?
También tenemos la opción ** rep ** [replicate], que permite crear secuencias:
e <- rep(1, times=15) # repetimos un valor 15 veces
e1 <- rep(c(0, 1, 2), times = 10) # repetimos una secuencia 10 veces
e2 <- rep(c(0, 1, 2), each = 10) # y ahora, ¿Qué obtenemos?
Una de las ventajas del entorno R es que permite crear operaciones a partir de los vectores que creamos.