Introducción Openxlsx

El paquete de R “openxlsx” es un open source que nos ayuda a simplificar la creación de archivos de Excel con terminación .xlsx a través de una interfaz de alto nivel que nos ayuda a escribir, diseñar y editar hojas de cálculo, además de permitirnos realizar gráficas de alta calidad. Una de las ventajas del paquete “Openxlsx” es que el usuario tiene control para elegir colores, fuentes, formatos, tablas, agregar o remover filas y columnas, etc.

Instalación de Openxlsx

R Studio

Para la instalación del paquete Openxlsx dentro de R studio necesitamos realizar los siguientes pasos:

  1. Localizar el menú “Packages” en la consola inferior derecha.
  2. Seleccionar la opción “install”.
  3. En el dropbox del menu “Install from” seleccionaremos la opción “Repository (CRAN,CRAN extra)”.
  4. En el campo “Package Archive” escribiremos la palabra “openxlsx”, una vez ingresado la palabra, el sistema dará en automático las opciones de paquetes que existan con ese identificador.
  5. Seleccionar la opción “openxlsx”.
  6. En el campo “Install to Library”, se seleccionará la ubicación donde se guardarán los archivos de paquete de forma automática.
  7. Una vez realizado esto, el sistema comenzará a correr la instalación del paquete.
  8. Al finalizar, podemos corroborar que el paquete fue instalado correctamente a través de la lista que se visualiza en el menú “Packages”, si usted ve reflejado el nombre de “openxlsx” en esta lista, entonces la instalación fue existosa.
Example Installation

Example Installation

R

Para la instalación de “Openxlsx” dentro de R, utilizaremos los siguientes comandos:

  1. Ingresar el comando “install.packages(”openxlsx“, dependencies=TRUE)”.
  2. Una vez ingresado el comando, el sistema nos arrojará un menú donde debemos escoger la fuente de la instalación.
  3. Ya que haya sido seleccionada la fuente, el sistema comenzará la instalación.
  4. Al finalizar, nos arrojará un mensaje que indica la ubicación de la instalación del paquete.

Comandos Openxlsx

Openxlsx cuenta con diversos comandos que nos permiten el manejo de los datos dentro de los archivos de Excel. En este apartado comenzaremos a revisar algunos de ellos.

Library

El comando “library” nos permite llamar el paquete openxlsx para comenzar a utilizarlo, como se muestra en el siguiente ejemplo:

library(openxlsx)

Read.xlsx

Para poder abrir el archivo de Excel, utilizaremos el comando “read”“, el cuál nos permitirá visualizar los datos que se encuentran dentro del archivo; asi mismo, se deberá especificar la hoja del documento que se quiere visualizar. Los datos los podremos visualizar en la consola del lado superior derecho dentro de R Studio. Antes del comando read, asignaremos un fichero donde se guardará la información, en este ejemplo lo denominaremos”test"

test<-read.xlsx("PIB.xlsx", sheet=1)
Example Read

Example Read

Una alternativa de este comando es “readworkbook”, el cual al igual que “read”" nos permite visualizar los datos dentro de la hoja de Excel; sin embargo, podemos agregar algunos otros comandos para visualizar solo algunas columnas, filas o la hoja completa, como se muestra en el siguiente ejemplo:

test2<-readWorkbook("PIB.xlsx",sheet=1,colNames=FALSE,rows=1:10,cols=1:5)

Con la instrucción anterior estamos delimitando al sistema para que nos muestre el nombre de las columnas “colNames=FALSE”, donde solo visualizaremos de la fila 1 a la fila 3 “rows=1:3” y las dos columnas del documento “cols=1:2!”

Example Readworkbook

Example Readworkbook

Na.Omit

El comando “na.omit” nos ayuda a eliminar las celdas que no tienen datos. Al ingresar el comando, el sistema eliminará las celdas vacias que están representadas con NA dentro del dataset.

test3<-na.omit(test2)

Dentro de los paréntesis del comando, debemos ingresar el nombre del data set donde se eliminarán las celdas.

Example Na.Omit

Example Na.Omit

Createworkbook

El comando createworkbook, podra crear una nueva hoja de trabajo la cual se podra utilizar para crear datasets nuevos.

test5<-createWorkbook()

Una vez ingresado el comando, en la pantalla de Values se creara el nuevo workbook.

Example Createworkbook

Example Createworkbook

Dentro del workbook se puede modificar los parámetros del tipo de letra, el color del relleno de la misma, el estilo con el comando “style<- createStyle(fontSize = 18, fontName =”Arial“,textDecoration =”bold“, halign =”left“, fgFill =”#1A33CC“, border=”TopBottomLeftRight“)”

test5<- createStyle(fontSize = 18, fontName = "Arial",
textDecoration = "bold", halign = "left", fgFill="#1A33CC",border="TopBottomLeftRight")

Posterior al haber ingresado el comando, se mostrarán los parámetros en la pantalla de Global Enviroment.

Example Style

Example Style

Add a Worksheet

Una vez creado el workbook se pueden agregar las hojas de calculo dentro del mismo, para ello utilizaremos el comando “addWorksheet”

wb<-createWorkbook("Test7")
addWorksheet(wb, "Sheet 1")

Tambien se pueden definir los parametros de la hoja, tanto el nombre, como el color de las lineas, si se quieren las lineas visibles o no, etc. dentro del mismo comando podemos definir estos parámetros como se muestra a continuación.

Example 1

wb<-createWorkbook("Test7")
addWorksheet(wb, "Sheet 2", gridLines = FALSE)

Example 2

wb<-createWorkbook("Test7")
addWorksheet(wb, "Sheet 3", tabColour = "red")

Example 3

wb<-createWorkbook("Test7")
addWorksheet(wb, "Sheet 4", gridLines = FALSE, tabColour = "#4F81BD")

Ejemplo Practico

Para finalizar este Manual, manipularemos un archivo de Excel utilizando algunos de los comandos revisados dentro de este documento, además de complementarlo con el paquete ggplot2, con el cual realizaremos una gráfica de la informacion del documento.

Los datos obtenidos del INEGI, muestran el PIB durante el año 2014 - 2017, donde se aprecia el desglose por Actividades Primarias, Secundarias y Terciarias, asi como, el Total del Período analizado.

  1. Comenzamos solicitando a R la lectura del archivo de Excel, con el comando “read.xlsx”, como resultado, nos arroja los datos del documento de excel solicitado, como se muestra en el siguiente ejemplo.
Example PIB

Example PIB

  1. Posterior, realizaremos una limpieza de las celdas que se encuentran sin información dentro del documento. Para esta acción, utilizaremos el comando “na.omit”. Al ingresar este comando, veremos únicamente las celdas que contienen datos.
Example PIB

Example PIB

  1. Generaremos la Mediana del la variable “Actividades.Primarias”, para ello, primero necesitamos que R reconozca las variables dentro del documento, utilizaremos el comando “attach(file)”.
Example PIB

Example PIB

Una vez ingresado el comando, dentro de la consola, R nos mostrará un mensaje confirmando las variables que se detectaron.

Posterior, podremos manipular estas variables, para realizar gráficos, realizar análisis estadísticos, etc.

Como ejemplo, realizaremos el análisis de la Mediana, Moda y Varianza, de la variable “Actividades.Primarias”.

Example PIB

Example PIB

  1. Por último realizaremos un Histograma de las “Actividades Primarias”, utilizando los comandos de ggplot2.
Example PIB

Example PIB

Example PIB

Example PIB

Conclusión del Manual

Como podemos ver, el manejo del paquete es muy sencillo, a través de él, podemos realizar análisis estadísticos más prácticos y con mejor presentación que en Excel, en conjunto con “ggplot2”.