Marzo, 2017

Por qué usar R ?

“Cada persona en este país debería saber cómo programar una computadora… porque eso te enseña a pensar” Steve Jobs

R es un software libre

Cuenta con la licencia GNU GPL el cual consta de 4 libertades

  • Libertad 0: la libertad de ejecutar el programa como desee y con cualquier propósito
  • Libertad 1: libertad de estudiar el funcionamiento del programa y adaptarlo a sus necesidades.
  • Libertad 2: La libertad de rescribir copias para ayudar a los demás.
  • Libertad 3: La libertad de manejar el programa y publicar las mejorar, de manera que toda comunidad se beneficie.

Muchos de los software comerciales estadísticos cuestan cientos de dólares. Como SigmPlot cuesta cerca de 900 dólares, Minitab más de 1500 dólares, MatLab 2150 dólares, entre otros.

R es multiplataforma

R funciona en Mac, Windows, y en números sistemas UNIX. Esto significa que cualquier persona puede trabajar con tus datos, figuras, análisis y más importante aún usar tus instrucciones (también conocido como scripts o código) para generar las figuras y el análisis. Asi que cualquier persona, y en cualquier lugar del mundo, con acceso a cualquier SO puede usar R sin ninguna licencia.

R es de código abierto

Existe una gran comunidad de voluntarios trabajando para mejorar R, lo cual permite ser moldeado y dirigido a cuestiones específicas. Creando así programas y paquetes que funcionen en el entorno R. Programas tales como R-studio, Java GUI for R, R- commander, RKWard, ROpen, entre otros, y con más de 6000 paquetes indexado en CRAN, Biocoductor, GitHub y R-Forge.

R es una plataforma estadística actualizada

Esta comunidad de usuarios hace que se actualice constantemente, lo cual ofrece todas las técnicas de análisis de datos. Además de programar nuevos métodos científicos y rutinas estadísticas de una manera fácil y robusta.

Los gráficos disponibles en R son de gran calidad y de una versatilidad impresionante

Otros ejemplos de gráficos disponibles en R

Otros beneficios del software R

  • R remplaza la combinación de varios programas para el proceso de análisis de datos, por ejemplo Excel, Minitab, SAS, SigmaPlot, entre otros. Esto no solo resulta en el alto costo de las licencias de múltiples programas, si no también, en la gran cantidad de archivos con diferentes formatos que no podrían leer otros programas estadísticos. En cambio con solo utilizar R, puedes realizar todo el análisis de datos e inclusive leer archivos de diferentes formatos.

  • R se está convirtiendo en un estándar en la sociedad científica, por hacer figuras de calidad de publicación, además de poder exportarse a diferentes formatos incluidos PDFs.

http://www.rforscience.com/

http://r4ds.had.co.nz/index.html

Descargando R

La descarga del programa R se describe en los siguientes pasos:

  • Ingresamos a la CRAN para elegir un repositorio cercano a nuestra localidad. En nuestro caso seleccionamos el repositorio de la Escuela Politécnica de Litoral.

Descargando R

  • Nos dirigimos a la parte superior de la página, y nos ubicamos en Download and install R seguido elegimos el sistema operativo. Para nuestro caso hacemos click en Windows.

  • Elegimos entre los 3 subdirectorios: base, contrib y RTools. Damos click sobre base.

Descargando R

  • Finalmente, en la pantalla damos click sobre Download R ?.?.? for Windows, con lo cual descargamos la versión de R más reciente.

En la actualidad, el software R puede ser instalado incluso sobre la plataforma Android https://play.google.com/store/apps/details?id=com.appsopensource.R&hl=es_419, esto permite que muchos usuarios puedan tener acceso al programa en todo momento con tan sólo contar con un smartphone operativo.

Instalando R

Una vez obtenido el programa ejecutable procedemos a dar doble click.

  • Seleccionamos el idioma para la instalación

  • Aceptamos todo por default

Instalando R

  • Para el acceso a la CRAN desde redes con seguridad colocamos en: Internet 2.

  • Finalmente, esperamos que se instale el programa.

Revolution Analytics

Modificaron el código fuente de R, lo cual ha permitido que R sea multicore, es decir, a través de estas modificaciones se logra aprovechar al máximo la funcionalidad de todos los núcleos de los procesadores del computador. Puede ser obtenido a través de la página web http://www.revolutionanalytics.com como Revolution R Open de forma gratuita, sin embargo en el caso de requerir soporte se puede adquirir la versión pagada Revolution R Enterprise.

R Studio

RStudio es un conjunto de herramientas integradas diseñadas para ayudarle a ser más productivo con R. Incluye una consola, editor de resaltado de sintaxis que soporta la ejecución de código directa, así como herramientas para el trazado, la historia, la depuración y la gestión del espacio de trabajo.

Lo podemos descargar de la siguiente página, de acuerdo al sistema operativo que estemos utilizando:

https://www.rstudio.com/products/rstudio/download/

La instalación de R Studio se realiza con las opciones por default.

R Studio

Inicializamos R y para comenzar nuestras actividades nos ubicamos en File y luego en New Proyect .

Elegimos New Directory -> Empty Project ->Directory Name->Create Project

Repositorios y paquetes stándar

Las capacidades de R pueden ser ampliadas fácilmente mediante la incorporación de paquetes que se encuentran disponibles en varios repositorios, tales como:

  • CRAN
  • BioConductor
  • Github
  • Omegahat
  • MRAN
  • RForge

El programa R incluye 8 bibliotecas o paquetes estándar, mismos que pueden ser visualizados a través del siguiente comando:

search()
## [1] ".GlobalEnv"        "package:stats"     "package:graphics" 
## [4] "package:grDevices" "package:utils"     "package:datasets" 
## [7] "package:methods"   "Autoloads"         "package:base"

Instalación de paquetes

Repositorio CRAN La instalación de paquetes en R desde el repositorio CRAN es sencillo, una vez conocido el nombre del paquete a instalarse basta con introducir el siguiente comando en la consola:

install.packages("nombre_paquete", dependencies=TRUE)

En el caso que se desee instalar un lista de nn paquetes planteamos la siguiente solución:

install.packages("nombre_paquete", dependencies=TRUE)

paquetes <- c("pckg_1","pckg_2", ... , "pckg_n")
lapply(seq_along(paquetes), function(i){
      install.packages(paquetes[[i]], dependencies=TRUE)
      })

Repositorios externos repositorios adicionales al CRAN de entre los cuales destacan R-Forge, BioConductor y Omegahat

install.packages("pckgname", repos="http://r-forge.r-project.org")
install.packages("pckgname", repos="http://www.omegahat.org/R")
install.packages("pckgname", repos="http://www.bioconductor.org/
                                    packages/2.10/bioc")

Instalación de paquetes

Repositorios Github En la actualidad gran cantidad de usuarios R han alojado sus proyectos en el sistema de control de versiones GitHub, Inc. por lo cual se hace necesario contar con una solución al momento de instalar algún paquete alojado en dicho sistema.

install.packages('devtools', dependencies=TRUE)
devtools::install_github("rstudio/rmarkdown")

Iniciamos instalando el paquete devtools el cual nos provee la función install-github, esta última es la encargada de acceder al sistema Github e instalar el paquete deseado, para esta ocasión hemos seleccionado el paquete rmarkdown alojado en el repositorio del proyecto rstudio.

Una vez instalado un paquete el paso siguiente consiste en cargar las funciones y datos del mismo dentro del área de trabajo con: library( ) y require( )

library('paquete instalado')

Eliminación

Para ocasiones en las cuales se desee eliminar un paquete previamente instalado en R tenemos dos alternativas: la primera consiste básicamente en eliminar la carpeta que contiene dicho paquete del repositorio del computador mientras que la segunda alternativa consiste en emplear el siguiente comando:

remove.packages("nombre_paquete", "directorio")

donde:

  • nombre-paquete: Nombre o vector de nombres de los paquetes ha ser eliminados.
  • directorio: Es un vector de caracteres que proporcionan la dirección del directorio del cual se eliminará el paquete. Si se omite dicho parámetro se asume por default la dirección obtenida por .libPaths().

Espacio de trabajo de R

Podemos instalar y actualizar paquetes desde la ventana packages

Algunos paquetes útiles de R

PAQUETE CATEGORÍA DESCRIPCIÓN
devtools desarrollo e instalación de paquetes Mientras devtools tiene como objetivo ayudar a crear tus propios paquetes de R, también es esencial si se desea instalar fácilmente otros paquetes de GitHub.Instalarlo Requiere RTools en Windows y XCode en un Mac. CRAN
readxl importación de datos Forma rápida de leer archivos de Excel en R. CRAN
googlesheets importación y exportación de datos leer fácilmente los datos en R desde Hojas de cálculo de Google. CRAN
RMySQL importación y almacenamiento de datos rápida base de datos SQL que se instala y se ejecuta como un paquete de R. CRAN

Algunos paquetes útiles de R

PAQUETE CATEGORÍA DESCRIPCIÓN
readr importación y exportación de datos Si tiene archivos de gran tamaño, esta es una manera rápida y estandarizada para leer archivos tabulares como CSV en base de datos R, así como archivos de texto sin formato en cadenas de caracteres con read_file. CRAN.
sqldf análisis y procesamiento de datos Ejecutar consultas SQL en su base de datos con sqldf. CRAN.
XML importación y exportación de datos Para bases de datos XML y HTML. CRAN
dplyr análisis y procesamiento de datos Especialmente útil para operar en los datos por categorías. CRAN

Algunos paquetes útiles de R

PAQUETE CATEGORÍA DESCRIPCIÓN
plyr análisis de datos muy útil cuando se trabaja con otros tipos de datos tales como listas en R. CRAN
reshape2 análisis y procesamiento de datos cambios en los datos, en sus fila, columnas o desde formatos de los mismos; cambiar nombres de variables y mucho más. CRAN
data.table análisis y procesamiento de datos popular paquete de procesamiento de datos de alta resistencia. data.table tiene muchos fans por su velocidad con grandes conjuntos de datos. CRAN
stringr procesamiento de datos Numerosas funciones para la manipulación de texto

Algunos paquetes útiles de R

PAQUETE CATEGORÍA DESCRIPCIÓN
knitr visualización de datos Agrega R a un documento de Markdown y genera fácilmente informes en HTML, Word y otros formatos y si usted está interesado en la investigación reproducible y automatizada el paquete ayuda a ir desde análisis de datos hacia la creación de informes. CRAN
ggplot2 visualización de datos Potente, flexible y bien pensado para crear gráficos estadísticos. CRAN
shiny visualización de datos R convierte los datos en aplicaciones Web interactivas. CRAN