Actualmente, en el manejo de base de datos, el software usado por la gran mayoría de las personas es Microsoft Excel.
He tenido la oportunidad de iniciar a trabajar con R studio en clases de la matería de Métodos Cuantitativos Aplicados a la Administración, de la maestría de Administración con enfoque a las contribuciones.
Esta publicación será enfocada al uso del paquete .xls para importar y exportar archivos de Excel utilizando Rstudio.
Xlsx es uno de los potentes paquetes de R para leer, escribir y formatear archivos de Excel. Es una solución basada en java y está disponible para Windows, Mac y Linux. Funciona tanto para los formatos de archivo Excel (formatos de archivo xls y xlsx).
En CRAN (el repositorio de paquetes R) podemos encontrar múltiples paquetes para trabajar con hojas de cálculo Excel desde R. Uno de ellos es el paquete xlsx, con el que también puede trabajar con hojas de versiones previas de Excel. Para instalar este paquete no tenemos más que facilitar su nombre a install.packages desde la consola de R. Si la configuración del repositorio es correcta, se descargará el paquete y también sus dependencias, quedando instalados y listos para usar.
Para descargar el paquete: install.packages(“xlsx”) Cargar el paquete en archivo .Rdata: library(xlsx)
Es importante mencionar que mientras R esté ejecutando una actividad, se observará un botón rojo en la parte superior derecha de la consola, se debe de esperar a que se termine el proceso.
Ten en cuenta que los paquetes xlsx dependen de los paquetes rJava y xlsxjars.
En este tutorial, aprenderá a usar el paquete xlsx para:
Abre Microsoft excel, copia y pega los datos siguientes en la hoja de trabajo que llamaremos sheet1.
id, name, salary, start_date, dept
1 1 Rick 623.30 2012-01-01 IT
2 2 Dan 515.20 2013-09-23 Operations
3 3 Michelle 611.00 2014-11-15 IT
4 4 Ryan 729.00 2014-05-11 HR
5 9 Gary 843.25 2015-03-27 Finance
6 6 Nina 578.00 2013-05-21 IT
7 7 Simon 632.80 2013-07-30 Operations
8 8 Guru 722.50 2014-06-17 Finance
También copia y pega los datos siguientes en otra hoja de cálculo y cambia el nombre de esta hoja de cálculo a “city”.
name city
Rick Seattle
Dan Tampa
Michelle Chicago
Ryan Seattle
Gary Houston
Nina Boston
Simon Mumbai
Guru Dallas
Guarda el archivo de Excel como “input.xlsx”. Debes guardarlo en el directorio de trabajo actual del espacio de trabajo R. Para verificar el directorio de trabajo, basta con escribir en la consola getwd().
El input.xlsx se lee utilizando la función read.xlsx () como se muestra a continuación. El resultado se almacena como un marco de datos en el entorno R. Veamos dos maneras de hacerlo:
data <- read.xlsx("sheet1.xlsx", sheetIndex = 1)
read_excel("sheet1.xlsx", sheet = 1)
Cuando ejecutamos cualquiera de los códigos anteriores, se produce el siguiente resultado:
id, name, salary, start_date, dept
1 1 Rick 623.30 2012-01-01 IT
2 2 Dan 515.20 2013-09-23 Operations
3 3 Michelle 611.00 2014-11-15 IT
4 4 Ryan 729.00 2014-05-11 HR
5 9 Gary 843.25 2015-03-27 Finance
6 6 Nina 578.00 2013-05-21 IT
7 7 Simon 632.80 2013-07-30 Operations
8 8 Guru 722.50 2014-06-17 Finance
Para importar Dataset que queremos trabajar en R, debemos ir al directorio de trabajo de R, buscar el archivo .xlsx, dar clic en importar Dataset y se el archivo aparecerá en una pestaña de R.
Con estos datos, podemos realizar un histograma. Habiendo instalado previamiente el paquete ggplot2, hacemos lo siguiente:
Salarios <- read.csv(file="sheet1.csv", header=TRUE)
View(Salarios)
library(ggplot2)
qplot(salary, geom = "histogram")
Las funciones R write.xlsx () se pueden utilizar para exportar datos de R a un libro de Excel.
El formato simplificado de estas funciones es:
Write.xlsx (x, file, sheetName = "Sheet1",
Col.names = TRUE, row.names = TRUE, append = FALSE)
Ejemplos:
library (xlsx)
Write.xlsx (USArrests, file = "myworkbook.xlsx",
SheetName = "Detenciones de EE. UU.")
Para agregar varios conjuntos de datos en el mismo libro de Excel, tiene que utilizar el argumento append = TRUE. Esto se ilustra en el siguiente código R:
Escribir el primer conjunto de datos en un nuevo
librowrite.xlsx(USArrests, file="myworkbook.xlsx",
sheetName="USA-ARRESTS", append=FALSE)
Agregar el segundo conjunto de datos en un nuevo libro
write.xlsx(mtcars, file="myworkbook.xlsx", sheetName="MTCARS",
append=TRUE)
Agregar un tercer conjunto de datos
write.xlsx(Titanic, file="myworkbook.xlsx", sheetName="TITANIC",
append=TRUE)
Dentro de un archivo .Rdata, podemos importar un archivo de excel, ingresando el comando read_excel.
Ejemplo:
library(readxl)
Input <- read_excel("C:/Users/Toshiba/Desktop/MetodosCuanti/scripits3feb/Input.xlsx")
View(Input)
El importar y exportar archivos de excel a Rstudio con el paquete xlsx, proporciona funcionalidades para realizar análisis estadísticos, diagramas que sólo con las facilidades de Rstudio se pueden obtener. La implementación de Rstudio para cubrir las necesidades de análisis y toma de decisiones da como resultado una mejora en la forma de obtener información verificable, confiable y comparable.
Fuentes:
http://www.sthda.com/english/wiki/r-xlsx-package-a-quick-start-guide-to-manipulate-excel-files-in-r