Para empezar

¿QUÉ ES R?

R es un potente lenguaje orientado a objetos y destinado al análisis estadístico y la representación de datos. Se trata de software que permite su utilización libre y gratuitamente.

R, es un entorno y un lenguaje para el cálculo estadístico y la generación de gráficos, provee un acceso relativamente sencillo a una amplia variedad de técnicas estadísticas y gráficas, además ofrece un lenguaje de programación completo con el que añadir nuevas técnicas mediante la definición de funciones.

Hoy en día el software más usado por la mayoría de las personas para el manejo de base de datos es el programa Excel. Así mismo, un gran porcentaje de la información que se maneja en el mundo de los negocios y algunos otros, se encuentra contenida en el formato estándar de Excel (.xls o .xlsx) el cual parecería incompatible con R.

Afortunadamente, el tiempo de incompatibilidad entre marcas, versiones y software ya quedó en el pasado y, por lo tanto, importar y exportar archivos de Excel a la plataforma de R, es una realidad. Pero para tales efectos, R requiere de un complemento, el cual se encuentra contenido en el software denominado xlsx, el cual le permite leer, escribir y editar archivos que de origen hayan sido guardados en Excel.

PAQUETE XLSX

Es un paquete en sistema R para leer, escribir y que trabaja con archivos de archivos de Excel. Es una solución basada en java y está disponible para Windows, Mac y Linux. Funciona para los formatos de archivo Excel (.xls o .xlsx.)

Algunas de las funciones son:

  1. Leer y escribir archivos Excel.
  2. Agregar conjuntos de datos e imágenes (o gráficos) en una hoja de cálculo de Excel.
  3. Formatear la apariencia de la hoja de cálculo de Excel estableciendo formatos de datos, fuentes, colores y bordes.

Manual para generar archivos .slsx para importar a Excel sin necesidad de abrir el programa.

Generar una base de datos que despues se pueda abrir con Excel.

1.- #Descargar alguno de los siguientes paquetes.Sigueindo las indicaciones.

1.1.- #clic en install.packages(‘XLConnect’)
# library(XLConnect)

# vignette(‘XLConnect’) # Manual (viñeta) es muy útil # wb <- loadWorkbook(‘Libro1.xls’, create = TRUE) excel1 <- # readWorksheet(wb, sheet = ‘Hoja1’)

2 # install.packages(‘gdata’) library(gdata) excel2 <- # read.xls(‘Libro1.xls’, sheet=1) 3 #La función read.xls permite importar archivos xls desde la web. #Por ejemplo, vamos a esta web e importaremos el fichero llamado ‘Cancer.xls’ # WebCancer <- ‘http://people.cst.cmich.edu/lee1c/spss/V16_materials/DataSets_v16/Cancer.xls’ # cancerXLS <- read.xls(WebCancer)

4 #Una vez descargado el archivo xlsx de la web, se podra ver la base de datos sin necesidad de abrir excel, #importando los datos al programa RStudio solamente dando clic en la opcion “import”.

La función complementaria, mediante la que podemos leer desde R información almacenada en un libro Excel sin necesidad de tener instalada esta aplicación, es read.xlsx.

El primer argumento será en este caso el nombre del archivo donde está almacenada la información, siendo obligatorio indicar un número de hoja con el parámetro sheetIndex o bien su nombre con el parámetro sheetName. Sin más parámetros la función leerá todo el contenido de la hoja indicada, generará un dataset incluyendo títulos de columnas y lo devolverá.

En caso de que nos interese leer un conjunto concreto de celdillas, no la hoja completa, recurriremos a los parámetros colIndex y rowIndex para especificar qué columnas y qué filas han de recuperarse. Estas no tienen necesariamente que ser contiguas.

Así con estas funciones podemos no solo leer una base de datos, además podemos filtrar la información que necesitamos sin necesidad de utilizar excel.

Conclusión

Rstudio en un paquete que esta en constante evolución y hoy en día son cada vez más las empresas y negocios, así como universidades de distintas partes del mundo, las que mediante el uso de R se dedican a analizar como ha sido el comportamiento de las mismas a través de un análisis de datos.

En muchas ocasiones se ha recurrido a la necesidad de análisis de datos mediante el uso de excel, sin embargo, empresas grandes o universidades donde el objetivo es analizar la mayor cantidad de datos posibles tienen que implementar otros métodos para poder llevar a cabo un adecuado análisis.

Por tal motivo el importar y exportar archivos de excel a Rstudio por medio del paquete slsx, vino a revolucionar la manera de presentar la información proporcionando las herramientas necesarias para realizar análisis estadísticos confiables, de tal forma que nos ayudaran a ejemplificar de una manera más sencilla estos datos mediante diagramas que seran de vital importancia para la toma de decisiones.