Actualmente, en el manejo de base de datos, el software usado por la gran mayoría de las personas es Microsoft Excel.

He tenido la oportunidad de iniciar a trabajar con R studio en clases de la matería de Métodos Cuantitativos Aplicados a la Administración, de la maestría de Administración con enfoque a las contribuciones.

Esta publicación será enfocada al uso del paquete .xls para importar y exportar archivos de Excel utilizando Rstudio.

Xlsx es uno de los potentes paquetes de R para leer, escribir y formatear archivos de Excel. Es una solución basada en java y está disponible para Windows, Mac y Linux. Funciona tanto para los formatos de archivo Excel (formatos de archivo xls y xlsx).

En CRAN (el repositorio de paquetes R) podemos encontrar múltiples paquetes para trabajar con hojas de cálculo Excel desde R. Uno de ellos es el paquete xlsx, con el que también puede trabajar con hojas de versiones previas de Excel. Para instalar este paquete no tenemos más que facilitar su nombre a install.packages desde la consola de R. Si la configuración del repositorio es correcta, se descargará el paquete y también sus dependencias, quedando instalados y listos para usar.

Para descargar el paquete: install.packages(“xlsx”) Cargar el paquete en archivo .Rdata: library(xlsx)

Es importante mencionar que mientras R esté ejecutando una actividad, se observará un botón rojo en la parte superior derecha de la consola, se debe de esperar a que se termine el proceso.

Ten en cuenta que los paquetes xlsx dependen de los paquetes rJava y xlsxjars.

En este tutorial, aprenderá a usar el paquete xlsx para:

Entrada de datos como archivo xlsx

Abre Microsoft excel, copia y pega los datos siguientes en la hoja de trabajo que llamaremos sheet1.


      id,   name,    salary,   start_date,     dept
1      1    Rick     623.30    2012-01-01      IT
2      2    Dan      515.20    2013-09-23      Operations
3      3    Michelle 611.00    2014-11-15      IT
4      4    Ryan     729.00    2014-05-11      HR
5      9    Gary     843.25    2015-03-27      Finance
6      6    Nina     578.00    2013-05-21      IT
7      7    Simon    632.80    2013-07-30      Operations
8      8    Guru     722.50    2014-06-17      Finance

También copia y pega los datos siguientes en otra hoja de cálculo y cambia el nombre de esta hoja de cálculo a “city”.

name     city
Rick     Seattle
Dan      Tampa
Michelle Chicago
Ryan     Seattle
Gary     Houston
Nina     Boston
Simon    Mumbai
Guru     Dallas

Guarda el archivo de Excel como “input.xlsx”. Debes guardarlo en el directorio de trabajo actual del espacio de trabajo R. Para verificar el directorio de trabajo, basta con escribir en la consola getwd().

Leer el archivo de Excel(importar datos)

El input.xlsx se lee utilizando la función read.xlsx () como se muestra a continuación. El resultado se almacena como un marco de datos en el entorno R. Veamos dos maneras de hacerlo:

data <- read.xlsx("sheet1.xlsx", sheetIndex = 1)

read_excel("sheet1.xlsx", sheet = 1)

Cuando ejecutamos cualquiera de los códigos anteriores, se produce el siguiente resultado:

      id,   name,    salary,   start_date,     dept
1      1    Rick     623.30    2012-01-01      IT
2      2    Dan      515.20    2013-09-23      Operations
3      3    Michelle 611.00    2014-11-15      IT
4      4    Ryan     729.00    2014-05-11      HR
5      9    Gary     843.25    2015-03-27      Finance
6      6    Nina     578.00    2013-05-21      IT
7      7    Simon    632.80    2013-07-30      Operations
8      8    Guru     722.50    2014-06-17      Finance

Para importar Dataset que queremos trabajar en R, debemos ir al directorio de trabajo de R, buscar el archivo .xlsx, dar clic en importar Dataset y se el archivo aparecerá en una pestaña de R.

Con estos datos, podemos realizar un histograma. Habiendo instalado previamiente el paquete ggplot2, hacemos lo siguiente:

Salarios <- read.csv(file="sheet1.csv", header=TRUE)
View(Salarios)
library(ggplot2)
qplot(salary, geom = "histogram")

Exportar Datos de R a Excel

Las funciones R write.xlsx () se pueden utilizar para exportar datos de R a un libro de Excel.

El formato simplificado de estas funciones es:

Write.xlsx (x, file, sheetName = "Sheet1",
Col.names = TRUE, row.names = TRUE, append = FALSE)

Ejemplos:

library (xlsx)
Write.xlsx (USArrests, file = "myworkbook.xlsx",
SheetName = "Detenciones de EE. UU.")

Para agregar varios conjuntos de datos en el mismo libro de Excel, tiene que utilizar el argumento append = TRUE. Esto se ilustra en el siguiente código R:

Escribir el primer conjunto de datos en un nuevo

librowrite.xlsx(USArrests, file="myworkbook.xlsx",
      sheetName="USA-ARRESTS", append=FALSE)

Agregar el segundo conjunto de datos en un nuevo libro

write.xlsx(mtcars, file="myworkbook.xlsx", sheetName="MTCARS", 
           append=TRUE)

Agregar un tercer conjunto de datos

write.xlsx(Titanic, file="myworkbook.xlsx", sheetName="TITANIC", 
           append=TRUE)

Dentro de un archivo .Rdata, podemos importar un archivo de excel, ingresando el comando read_excel.

Ejemplo:

library(readxl)
Input <- read_excel("C:/Users/Toshiba/Desktop/MetodosCuanti/scripits3feb/Input.xlsx")
View(Input)

Conclusión

El importar y exportar archivos de excel a Rstudio con el paquete xlsx, proporciona funcionalidades para realizar análisis estadísticos, diagramas que sólo con las facilidades de Rstudio se pueden obtener. La implementación de Rstudio para cubrir las necesidades de análisis y toma de decisiones da como resultado una mejora en la forma de obtener información verificable, confiable y comparable.

Fuentes:

http://www.sthda.com/english/wiki/r-xlsx-package-a-quick-start-guide-to-manipulate-excel-files-in-r

https://www.tutorialspoint.com/r/r_excel_files.htm