R es un lenguaje orientado a objetos, condición que permite simplicidad y flexibilidad. Los objetos pueden ser entre otros: variables, datos, funciones, resultados; estos se guardan en la memoria activa de la computadora con el nombre asignado por la persona editora. Por ejemplo:
Crear el objeto “a” y el objeto “b”"
a <- 5
b <- 8
Para visualizar el valor del objeto creado, se escribe el nombre asignado
a
b
En R, con los objetos creados, es posible realizar operaciones aritméticas como suma, resta, división, y multiplicación.
Por ejemplo, realizar las siguientes operaciones:
a+b
a-b
a*b
a/b
El resultado de una operación, a su vez, puede ser guardado en un objeto
c<-2*a + 100/b
Todo objeto tiene dos atributos intrínsecos: tipo y longitud. El tipo puede ser: numérico, caracter, complejo y lógico. Mientras que la longitud es el número de elementos en el objeto. Para ver el tipo y la longitud se emplea las funciones mode y length.
mode(a)
length(a)
En R, un Vector es cualquier conjunto unidimensional de valores. Este objeto en particular tiene como limitante que los elementos deben ser del mismo tipo o clase. Para crear un vector se emplea la función de concatenar c() con los valores separados por comas al interior de los paréntesis.
d<-c(5,8,12,3.5,9,1)
Para verificar los valores ubicados dentro del vector “d”"
d
Para verificar la 4a posición del vector “d”"
d[4]
También se usan expresiones para generar sucesiones de números enteros. Por ejemplo del 1 hasta 10
e<-1:10
La función seq genera secuencias de números reales. Por ejemplo:
seq(1,10,0.5)
donde el primer número indica el principio de la secuencia, el segundo el final y el tercero el incremento a usar para generar la secuencia.
Para nombrar un vector se emplea la función assign()
assign("aves", c(22,28,37,34,13,24,39,5,33,32))
La función length arroja el número de observaciones (n) dentro del objeto
length(aves)
Los vectores también pueden contener caracteres como letras, o variables categóricas. Las variables representadas como caracteres se delimitan con comillas “”.
letras<-c("a","b","c","da","edw")
Para visualizar el contenido
letras
Para visualizar el tipo y la longitud del vector
mode(letras)
length(letras)
Algunos ejemplos de operaciones básicos para el objeto aves: Valor máximo contenido en el objeto aves
max(aves)
Valor minimo contenido en el objeto aves
min(aves)
Suma de los valores de aves
sum(aves)
Eleva al cuadrado cada valor del vector
aves^2
Número de observaciones (n)
n.aves<-length(aves)
Media aritmética
media.aves<-sum(aves)/n.aves
Media usando la función correspondiente en R para calcular su valor
mean(aves)
Una matriz es realmente un vector con un atributo adicional (dim), es decir un vector numérico con longitud 2, que define el número de filas y columnas de la matriz.
Una matriz se crea con la función matrix ()
m<-matrix(c(5,8,12,3.5,9,1),2,3)
Para visualizar la matriz
m
En las matrices también es posible referenciar una fila, una columna o un elemento. Por ejemplo: Fila 2 de la matriz m
m[2,]
Columna 3 de la matriz m
m[,3]
Elemento de la fila 1, columna 3
m[1,3]
Otro ejemplo
m1 <- matrix(1:12, ncol = 4)
m1
Número de elementos
length(m1)
Dimensiones de la matriz
dim(m1)
Número de filas de la matriz
nrow(m1)
Número de columnas de la matriz
ncol(m1)
La opción byrow indica si los valores al llenar la matriz siguen el orden de columnas sucesivas (por defecto) o las filas (if TRUE)
m2<-matrix(1:12, ncol = 3, byrow = T)
m2
Un data frame es una estructura de datos como especie de tabla, de estructura bidimensional de datos. Un data frame contiene números y strings de ser necesario. Además, las columnas son identificadas con nombres cortos. Para crear un data frame se utiliza la función data.frame(). Por ejemplo:
autos<-data.frame("Marca"=c("Wolks","Fiat","Ford"),"Precio"=c(32000,28000,29500))
autos
Se preparará un archivo desde Excel en formato “csv” (delimitado por comas). Cuidar que el archivo contenga nombres cortos para cada variable. Una vez preparado el archivo se procede a la importación, ubicando el archivo en la carpeta elegida por el analista de datos; “header” indica que el archivo a importar contiene nombres que identifican a cada variable. Abrir el archivo “AulaExcel.xls”
aula<- read.csv(file.choose(),header=T)
Para visualizar los datos del archivo aula, se utiliza la funcion de print
print(aula)