R es un excelente lenguaje de programación para visualización de datos e implementación de métodos estadísticos, y por lo tanto, es ideal para cualquier tipo de análisis de datos.
R tiene muchas ventajas que lo hacen una excelente opción para usarlo en estadística:
A diferencia de otros lenguajes de uso común como Python, !R fue concebido desde sus orígenes para hacer estadística!:
R es superior a muchos otros lenguajes; las vizualizaciones que son posibles de lograr con R son increíblemente poderosas para expresar ideas claras y contundentes.Dado que R es un lenguaje de programación orientado a objetos que no necesita compilar rutinas, le da al usuario mucha versatilidad única para probar sus comandos en tiempo real directamente en la consola (línea de comandos) del programa:
Gracias a su éxito tanto en industria como academia, hay disponibles miles de paquetes o librerías (módulos de acceso libre con funciones completamente listas para su uso) de todo tipo que le dan al usuario muchas opciones para llevar a cabo sus análisis sin necesidad de elaborarlos desde cero. Por ejemplo:
ggplot2 ofrece un sin fin de herramientas gráficas para hacer visualización de datosshiny permite hacer aplicaciones interactivas de todo tipoe1071 contiene variadas rutinas de aprendizaje automáticodplyr ofrece una sintaxis muy sencilla y fácil de usar para el manejo de bases de datossp es especialmente útil para hacer mapas y llevar a cabo análisis espaciales o geo-referenciados.El siguiente link https://www.rstudio.com/products/rpackages/ ofrece una lista detallada de paquetes de uso frecuente.
Una sesión típica de R se ve de la siguiente manera:
R permite interactuar fácilmente con otros lenguajes de programación para explotar las virtudes de otros programas; por ejemplo:
rPython permite ejecutar código de Python directamente desde RRcpp permite elaborar y compilar código de C++ y ejecutarlo desde RSparkR permite interactuar con Spark para llevar a cabo análisis con Big Data.La iniciativa de RStudio (plataforma interactiva para ejecutar R) proporciona una forma muy didáctica de realizar todo tipo de actividades. Rstudio, al igual que muchos otros entornos de desarrollo integrado (IDE, integrated development environments)
Comprende, entre otros, ditores de código y herramientas de depuración para ayudar a los desarrolladores a escribir scripts (en un script se escriben todos los comandos que se ejecutan en la consola).
RStudio se convirtió rápidamente en la alternativa número uno para interactuar directamente con R; toda la información al respecto se puede encontrar en https://www.rstudio.com/ o trabajar “online” desde https://rstudio.cloud
Desde la implementación de rutinas básicas, hasta la creación de paquetes y proyectos completos, RStudio ofrece un sin fin de ayudas y atajos que hacen la programación aún mas sencilla; por ejemplo:
RStudio permite accesar a muchas otras aplicaciones que se han popularizado recientemente; por ejemplo, es posible hacer documentos y presentaciones interactivos por medio de Swave y RMardown, que permiten elaborar textos en diversos formatos (pdf, html, xdoc) vinculados directamente con el código, y que a su vez, se actualizan automáticamente siguiendo las especificaciones del usuario.
Una sesión típica de RStudio se ve de la siguiente manera: Como se ve en la imagen,
RStudio tiene 4 componentes importantes:
R y, en ocasiones, se muestran los resultados de estas instrucciones.R mediante scripts y otro tipo de archivos.R. 3.2. History: Es donde queda el registro de cada una de las acciones que he ejecutado en la consola directamente, o que he enviado a la consola desde la fuente.R y exportarlas. 4.3. Packages: Contiene un listado de todos los paquetes instalados en R. Los paquetes marcados son paquetes que están activos. 4.4. Help: Muestra las páginas de ayuda de las funciones en R.Esta sección presenta una guía detallada para instalar R y RStudio. En la primera parte están las instrucciones de instalación para Windows y en la segunda están las instrucciones para Mac.
Si ya tienen instalado R y RStudio, les sugiero que se aseguren de que ambos estén actualizados.
Para instalar R en Windows se debe descargar e instalar la aplicación de https://cran.r-project.org/bin/windows/base/
Una vez ha sido descargado el archivo de instalación, se debe ejecutar la instalación como con cualquier otro programa o aplicación en Windows. Cuando haya terminado esta instalación, se procede con la instalación de RStudio.
Cuando R esté instalado deberá aparecer un ícono en la carpeta de aplicaciones o en el menu de inicio:
Para instalar RStudio en Windows se debe descargar e instalar la aplicación de https://rstudio.com/products/rstudio/download/
Una vez ha sido descargado el archivo de instalación, se debe ejecutar la instalación como con cualquier otro programa o aplicación en Windows.
Cuando RStudio esté instalado deberá aparecer un ícono en la carpeta de aplicaciones o en el menu de inicio:
Para instalar R en Mac se debe descargar e instalar la aplicación de https://cran.r-project.org/bin/macosx/
Una vez ha sido descargado el archivo de instalación, se debe ejecutar la instalación como con cualquier otro programa o aplicación en Mac. Cuando haya terminado esta instalación, se procede con la instalación de RStudio.
Cuando R esté instalado deberá aparecer un ícono en la carpeta de aplicaciones.
Para instalar RStudio en Windows se debe descargar e instalar la aplicación de https://rstudio.com/products/rstudio/download/
Una vez ha sido descargado el archivo de instalación, se debe ejecutar la instalación como con cualquier otro programa o aplicación en Mac.
Cuando RStudio esté instalado deberá aparecer un ícono en la carpeta de aplicaciones.
Realizar en la consola (i.e., donde encuentran el símbolo > azul) las siguientes operaciones:
## [1] 12
## [1] 5
## [1] 550
## [1] 4
## [1] 50
Así como R permite hacer operaciones básicas como las anteriores, también permite hacer operaciones avanzadas. A continuación se presentan algunos ejemplos de gráficas que podrían hacerse con R:
R funciona con base en paquetes. Cada operación estadística o función que se ejecute en R hace parte de un paquete (sea instalado por defecto o no).
R viene con un grupo de paquetes instalados.library()install.packages("Nombre del Paquete")descr debe escribir: install.packages("descr")library()R no carga todos los paquetes instalados cuando inicia.search( )library("nombre del paquete")descr se debe escribir: library("descr")search()R.RStudio http://support.rstudio.org/R http://stackoverflow.com/R http://stats.stackexchange.com/¿En qué consiste programar? https://www.linkedin.com/feed/update/urn:li:ugcPost:6466357719396872192/
R saca los archivos que se utilicen y en la que guarda los archivos que se creen.R inicia, utiliza como directorio de trabajo la carpeta “madre” de su computador.getwd()dir() o list.files() para ver qué archivos y carpetas hay en esa carpeta.Se puede fijar un directorio de trabajo de diversas maneras: - Utilizando los menús de RStudio. - Utilizando el atajo Ctrl + Shift + H - Utilizando la función setwd("ruta carpeta") - En Windows: Abrir la carpeta en el explorador de archivos, hacer click sobre la barra de dirección y copiar la ruta. R en Windows requiere que en lugar de un backslash se incluyan dos backslash \ o simplemente un slash entre las ubicaciones de la ruta. - En Mac: Hacer click derecho sobre la carpeta, presionar la tecla alt, y seleccionar la opción “Copiar R como ruta de acceso”. - La fijación del directorio de trabajo se debe hacer cada vez que se inicia R.
RStudio, para cada actividad que se realice.R dentro del cubo y un sígno +, ubicado en la parte superior izquierda de RStudio, y seguir las instrucciones.R es controlado por funcionesR se “llama” la función.Algunos ejemplos:
# crear conjunto de datos
x <- c(20, 21, 23, 19, 18)
# llamar la función mean para calcular el promedio
mean(x)## [1] 20.2
# crear un nuevo conjunto de datos con datos faltantes:
y <- c(18, NA, 20, 19, 21, 23, 19, 21, NA)
# llamar la función mean para calcular el promedio
mean(y)## [1] NA
# incluir el argumento na.rm = TRUE para que efectivamente calcule el promedio de los datos observados
mean(y, na.rm = TRUE)## [1] 20.14286
Observe el hashtag # se utiliza para escribir “comentarios” en R. Cualquier cosa que se escriba despues de este símbolo no será tenido en cuenta en la ejecución del programa.
Para ejecutar estos comandos desde un script y no desde la consola, solo hay que copiar estos comandos en un script y ejecutar cada línea oprimiendo la el botón Run que se encuentra en la parte superior del script.
R.RStudio.¿Cómo puedo ver las funciones que están contenidas en un paquete?
Para mirar el contenido de una función, se pone el nombre de la función sin los paréntesis:
## function (x, na.rm = FALSE)
## sqrt(var(if (is.vector(x) || is.factor(x)) x else as.double(x),
## na.rm = na.rm))
## <bytecode: 0x000000000fcbfbe0>
## <environment: namespace:stats>
Si se quiere listar los elementos en el espacio de trabajo se usa la función ls().
Para borrar un elemento del espacio de trabajo se usa la función rm:
Si se quiere borrar por completo el espacio de trabajo se usa la siguiente función:
Ctrl + L borra todo lo que este definido en la consola.Command + flecha arriba en Mac o Ctrl + flecha arriba en Windows muestra en la consola un listado completo de las últimas funciones usadas.Command + enter en Mac o Ctrl + enter en Windows ejecuta o “corre” la línea actual del script correspondiente.Alt + Command + R en Mac o Alt + Control + R en Windows ejecuta todo un script.