Datos generales

¿Es seminario? No

Fecha de inicio 21/enero/2019

Fecha de fin 25/enero/2019

Horario de clases: Lunes a Viernes de 9:00 – 15:00 h

Núm. mínimo de estudiantes: 4

Núm. máximo de estudiantes: 15

Costo propuesto: $1500

Tipo : OP

Créditos: 3

Horas: 30 horas

Coordinador: Salvador Mandujano Rodríguez

Presentación

Supongamos que estás analizando tus datos tanto en Excel y como en algún programa estadístico; también estás redactando el texto de tesis en Word; y posiblemente preparando una presentación de tus resultados en PowerPoint para el siguiente tutorial o para algún congreso próximo. Entonces, haces tus análisis estadísticos, copias/exportas los resultados y gráficos, y luego lo pegas en tu documento Word donde redactas los resultados y formateas para que todo cuadre bien. Luego abres tu documento PowerPoint, te entretienes en seleccionar un estilo, pegas el texto, importas tus figuras, le inviertes tiempo en seleccionar colores, tipo de texto, efectos y otras cosas. Terminas tu sesión de Microsoft ese día.

Al día siguiente te das cuenta que hubo un error en uno de los análisis, entonces lo ejecutas de nuevo en Excel (u otro programa). Exportas nuevamente los resultados gráficos y estadísticos, o bien lo pegas en el portapales. Abres tu documento Word, sustituyes el gráfico anterior por el nuevo actualizado, cambias el texto de redacción. Luego copias el texto, gráficos y otros, abres tu documento PowerPoint y modificas lo anterior con los nuevos datos. Termina tu sesión de ese día.

Pasado el tutorial (o el congreso) los asesores te sugieren cambios importantes. Entonces abres tu Excel (o el programa estadístico), modificas una vez más datos, análisis, creas gráficos. Nuevamente, copias y te llevas tus resultados actualizados a tu documento de tesis en Word donde nuevamente haces todos los cambios. Pero a la mejor esta vez se te olvida o no quieres hacer los cambios en tu presentación Power y dejas una versión anterior.

Luego días, semanas o meses después te piden una presetación de avances y abres el último archivo Power (que no fue actualizado) y mientras presentas te das cuenta que no son los datos ni gráficos finales. Te disculpas. Llegas a tu casa/oficina y tal vez haces los cambios, aunque ahora no sabes exactamente cuál es la versión última, ni los gráficos finales, ni la carpeta correcta ni la versión más reciente. Te fastidias y decides cerrar tu sesión Microsoft. Algún día tendrás la versión final de tu tesis en Excel, Word, Powerpoint y otros programas… todo por separado y con el detalle que en cada archivo tendrás que tener cuidado en actualizar todo…!

Una alternativa para evitar ese via crucis es integrar todos los documentos en uno solo, actualizado cada vez que haces algún nuevo cambio, y con la posibilidad de guardarlo en diferentes formatos, eso y mucho más se puede lograr con `R Markdown. El presente taller te dará las bases principales para lograr este y otros objetivos!

¿Qué es RMarkdown?

Markdown es un lenguaje muy sencillo empleado para escribir textos y documentos electrónicos. La versión R de Markdown es el paquete rmarkdown. Este paquete tiene como base los paquetes knitr y Pandoc lo que permite realizar un gran número de tareas con diferentes objetivos como:

  • Compilar documentos R Markdown en diferentes formatos tales como:
    • PDF
    • HTML
    • ebooks
    • Word
    • otros
  • Crear cuadernos de notas los cuales (similar a una libreta de biólogo en campo) sirven para ir haciendo anotaciones del proceso de análisis empleando iterativamente códigos R ejecutados en lo que se conoce como chunks.

  • Crear presentaciones en formatos como:
    • HTML5
    • Beamer Latex
    • Shiny
    • PowerPoint
    • otros
  • Construir aplicaciones interactivas en Shiny.

  • Escribir documentos como:
    • tesis
    • libros con múltiples capítulos para formatos impresos PDF y/o ebooks
    • artículos para someter a revistas
  • Crear y admnistrar websites y blogs.

Objetivos

General

Introducir a los alumnos al empleo práctico de RMarkdown empleando la plataforma RStudio para crear documentos científicos reproducibles y dinámicos para sus trabajos de tesis, elaboración de artículos, creación de libros, elaboración de presentaciones; en diferentes formatos: PDF, html, Word, ebooks, beamer y otros.

Específicos

  1. Comprender la importancia de crear documentos dinámicos reproducibles de manera sencilla integrando texto, análisis, gráficos, bibliografía y otros requerimientos.

  2. Comprender la importancia de estos documentos para facilitar el trabajo de escritura e integración de tesis, artículos, libros y otros.

  3. Comprender la ventaja de emplear RMarkdown para elaborar esos documentos.

  4. Comprender que RMarkdown se puede emplear sin necesidad de emplear R como herramienta de análisis de datos, pero si se emplea, entonces se tiene aun mayor ventaja.

  5. Practicar la redacción e integración de documentos en RMarkdown.

  6. Aplicar el documento para obtener diferentes formatos de salida: PDF, html, ebook, Word, presentaciones Beamer y otros.

  7. Proveer con material y sitios de apoyo para la creación de documentos en RMarkdown.

Metodología

Es un taller práctico en aula donde se utilizará R en la plataforma RStudio para ejecutar RMarkdown; aplicación de diversas herramientas de análisis en el programa R y otros de libre acceso; lectura de bibliografía reciente del tema; exposición de los alumnos de temas varios.

Prerrequisitos del curso

  1. Importante: cada alumno debe llevar el texto de su tesis, gráficos, análisis y bibliografía pues será el material con el que trabajará durante todo el curso. Si llevan su tesis, al final tendrán una versión de la misma pero como un documento integrado.

  2. Preferentemente, experiencia en el empleo de R.

  3. Se requiere que cada alumno lleve su laptop y cargue los programas y paquetes R (todos gratuitos).

Habilidades y destrezas

Se espera que el alumno aprenda de manera práctica a emplear de manera más profunda el R, RStudio y RMarkdown, principalmente para integrar documentos de tesis, presentaciones, manuscritos para someter a revistas, y publicaciones electrónicas.

Criterios de calificación

Práctica diarias en RMarkdown, participación en clase, y asistencia/puntualidad.

Contenido temático

  1. ¿Qué es RMarkdown y por qué emplearlo?

  2. Comandos principales para ejecutar RMarkdown

  3. Compilación de Knit, Pandoc y Latex

  4. Pasos básicos para crear documentos

  5. Importancia del YAML o preámbulo

  6. Crear documentos en diferentes formatos: tesis, libros, artículos, presentaciones beamer, PDF, HTML, Word, ebooks y otros

  7. Utilidad de los chunks para insertar códigos R, gráficos, tablas, imágenes

  8. Integrando bibliografía en formato Zotero, Bibtex y otros

  9. Revisión de literatura del tema, por ejemplo: Hadley Wickham and Grolemund (2016), Yihui Xie (2014), Yihui Xie, Allaire, and Grolemund (2018), Baumer and Udwin (2015), Allaire et al. (2015), H. Wickham (2015), Y. Xie (2016), Y. Xie (2015), Gandrud (2013), W. Chang (2012), Lehman et al. (2010), Walter Mora and Borbón (2016), Mata-Pérez (2014), RStudio Team (2015), R Core Team (2017), McLean (2014), McLean (2017), Hadley Wickham (2009)

Bibliografía

Allaire, JJ, Joe Cheng, Yihui Xie, Jonathan McPherson, Winston Chang, Jeff Allen, Hadley Wickham, and R Hyndman. 2015. “Rmarkdown: Dynamic Documents for R. R Package Version 0.6. 1.”

Baumer, Benjamin, and Dana Udwin. 2015. “R Markdown.” Wiley Interdisciplinary Reviews: Computational Statistics 7 (3). Wiley Online Library: 167–77.

Chang, W. 2012. R Graphics Cookbook: Practical Recipes for Visualizing Data. O’Reilly Media, Inc.

Gandrud, C. 2013. Reproducible Research with R and Rstudio. CRC Press.

Lehman, Philipp, A Boruvka, P Kime, and Joseph Wright. 2010. “The Biblatex Package: Programmable Bibliographies and Citations.” Available from CTAN: Http://Ctan. Org/Pkg/Biblatex.

Mata-Pérez, M. 2014. “Bibliografía En LATEX: Una Guía Concisa de BibTEX.” Disponible En: Http://Logistica.fime.uanl.mx/Miguel/Docs/BibTex.pdf.

McLean, Mathew William. 2014. Straightforward Bibliography Management in R Using the Refmanager Package. http://arxiv.org/abs/1403.2036.

———. 2017. “RefManageR: Import and Manage Bibtex and Biblatex References in R.” The Journal of Open Source Software x (x). doi:10.21105/joss.00338.

R Core Team. 2017. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing. https://www.R-project.org/.

RStudio Team. 2015. RStudio: Integrated Development Environment for R. Boston, MA: RStudio, Inc. http://www.rstudio.com/.

Walter Mora, F, and Alex Borbón. 2016. “Edición de Textos Científicos Latex 2017.” Escuela de Matemáticas, Instituto Tecnológico de Costa Rica.

Wickham, H. 2015. R Packages: Organize, Test, Document, and Share Your Code. O’Reilly Media, Inc.

Wickham, Hadley. 2009. Ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York. http://ggplot2.org.

Wickham, Hadley, and Garrett Grolemund. 2016. R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. “ O’Reilly Media, Inc.”

Xie, Y. 2015. Dynamic Documents with R and Knitr. Vol. 29. CRC Press.

———. 2016. Bookdown: Authoring Books and Technical Documents with R Markdown. CRC Press.

Xie, Yihui. 2014. “Knitr: A Comprehensive Tool for Reproducible Research in R.” Implement Reprod Res 1: 20.

Xie, Yihui, JJ Allaire, and Garrett Grolemund. 2018. R Markdown: The Definitive Guide. CRC Press.