El paquete de R “openxlsx” es un open source que nos ayuda a simplificar la creación de archivos de Excel con terminación .xlsx a través de una interfaz de alto nivel que nos ayuda a escribir, diseñar y editar hojas de cálculo, además de permitirnos realizar gráficas de alta calidad. Una de las ventajas del paquete “Openxlsx” es que el usuario tiene control para elegir colores, fuentes, formatos, tablas, agregar o remover filas y columnas, etc.
Para la instalación del paquete Openxlsx dentro de R studio necesitamos realizar los siguientes pasos:
Example Installation
Para la instalación de “Openxlsx” dentro de R, utilizaremos los siguientes comandos:
Openxlsx cuenta con diversos comandos que nos permiten el manejo de los datos dentro de los archivos de Excel. En este apartado comenzaremos a revisar algunos de ellos.
El comando “library” nos permite llamar el paquete openxlsx para comenzar a utilizarlo, como se muestra en el siguiente ejemplo:
library(openxlsx)
Para poder abrir el archivo de Excel, utilizaremos el comando “read”“, el cuál nos permitirá visualizar los datos que se encuentran dentro del archivo; asi mismo, se deberá especificar la hoja del documento que se quiere visualizar. Los datos los podremos visualizar en la consola del lado superior derecho dentro de R Studio. Antes del comando read, asignaremos un fichero donde se guardará la información, en este ejemplo lo denominaremos”test"
test<-read.xlsx("PIB.xlsx", sheet=1)
Example Read
Una alternativa de este comando es “readworkbook”, el cual al igual que “read”" nos permite visualizar los datos dentro de la hoja de Excel; sin embargo, podemos agregar algunos otros comandos para visualizar solo algunas columnas, filas o la hoja completa, como se muestra en el siguiente ejemplo:
test2<-readWorkbook("PIB.xlsx",sheet=1,colNames=FALSE,rows=1:10,cols=1:5)
Con la instrucción anterior estamos delimitando al sistema para que nos muestre el nombre de las columnas “colNames=FALSE”, donde solo visualizaremos de la fila 1 a la fila 3 “rows=1:3” y las dos columnas del documento “cols=1:2!”
Example Readworkbook
El comando “na.omit” nos ayuda a eliminar las celdas que no tienen datos. Al ingresar el comando, el sistema eliminará las celdas vacias que están representadas con NA dentro del dataset.
test3<-na.omit(test2)
Dentro de los paréntesis del comando, debemos ingresar el nombre del data set donde se eliminarán las celdas.
Example Na.Omit
El comando createworkbook, podra crear una nueva hoja de trabajo la cual se podra utilizar para crear datasets nuevos.
test5<-createWorkbook()
Una vez ingresado el comando, en la pantalla de Values se creara el nuevo workbook.
Example Createworkbook
Dentro del workbook se puede modificar los parámetros del tipo de letra, el color del relleno de la misma, el estilo con el comando “style<- createStyle(fontSize = 18, fontName =”Arial“,textDecoration =”bold“, halign =”left“, fgFill =”#1A33CC“, border=”TopBottomLeftRight“)”
test5<- createStyle(fontSize = 18, fontName = "Arial",
textDecoration = "bold", halign = "left", fgFill="#1A33CC",border="TopBottomLeftRight")
Posterior al haber ingresado el comando, se mostrarán los parámetros en la pantalla de Global Enviroment.
Example Style
Una vez creado el workbook se pueden agregar las hojas de calculo dentro del mismo, para ello utilizaremos el comando “addWorksheet”
wb<-createWorkbook("Test7")
addWorksheet(wb, "Sheet 1")
Tambien se pueden definir los parametros de la hoja, tanto el nombre, como el color de las lineas, si se quieren las lineas visibles o no, etc. dentro del mismo comando podemos definir estos parámetros como se muestra a continuación.
Example 1
wb<-createWorkbook("Test7")
addWorksheet(wb, "Sheet 2", gridLines = FALSE)
Example 2
wb<-createWorkbook("Test7")
addWorksheet(wb, "Sheet 3", tabColour = "red")
Example 3
wb<-createWorkbook("Test7")
addWorksheet(wb, "Sheet 4", gridLines = FALSE, tabColour = "#4F81BD")
Para finalizar este Manual, manipularemos un archivo de Excel utilizando algunos de los comandos revisados dentro de este documento, además de complementarlo con el paquete ggplot2, con el cual realizaremos una gráfica de la informacion del documento.
Los datos obtenidos del INEGI, muestran el PIB durante el año 2014 - 2017, donde se aprecia el desglose por Actividades Primarias, Secundarias y Terciarias, asi como, el Total del Período analizado.
Example PIB
Example PIB
Example PIB
Una vez ingresado el comando, dentro de la consola, R nos mostrará un mensaje confirmando las variables que se detectaron.
Posterior, podremos manipular estas variables, para realizar gráficos, realizar análisis estadísticos, etc.
Como ejemplo, realizaremos el análisis de la Mediana, Moda y Varianza, de la variable “Actividades.Primarias”.
Example PIB
Example PIB
Example PIB
Como podemos ver, el manejo del paquete es muy sencillo, a través de él, podemos realizar análisis estadísticos más prácticos y con mejor presentación que en Excel, en conjunto con “ggplot2”.