The book R for Data Science (2nd edition) by Wickham, Çetinkaya-Rundel, and Grolemund (2023) is an essential reference in the field of data science. This work provides a practical guide on using R and the tidyverse package ecosystem for data manipulation, visualization, and modeling. The second edition incorporates significant updates that reflect current best practices. This article discusses its structure, content, and practical applications in the training and work of data science professionals.
Keywords: R programming, data science, tidyverse, data visualization, data manipulation.
La ciencia de datos es una disciplina fundamental en la era de la información, ya que permite transformar grandes volúmenes de datos en conocimiento accionable. Con la creciente digitalización y la generación masiva de datos, surge la necesidad de herramientas especializadas para la recolección, limpieza, análisis y visualización de datos. En este contexto, el lenguaje de programación R se ha consolidado como una de las principales opciones para la ciencia de datos debido a su flexibilidad, su ecosistema de paquetes en constante expansión y su comunidad activa de usuarios (Wickham et al., 2023).
El ecosistema tidyverse, desarrollado y promovido por Wickham y colaboradores, ha revolucionado la forma en que los científicos de datos trabajan con R, proporcionando un conjunto de herramientas coherente y eficiente para la manipulación de datos. R for Data Science (R4DS) tiene como objetivo enseñar a los lectores las mejores prácticas en ciencia de datos utilizando tidyverse, abarcando desde la importación de datos hasta la comunicación de resultados mediante informes reproducibles. La segunda edición del libro incorpora avances recientes en la comunidad R, incluyendo herramientas más modernas para la recolección de datos, mejores prácticas en la visualización y estrategias optimizadas para la programación funcional (Çetinkaya-Rundel, 2023).
Este libro es una guía esencial para estudiantes, investigadores y profesionales que buscan mejorar sus habilidades en ciencia de datos con R, proporcionando ejemplos prácticos, ejercicios aplicados y una metodología estructurada para el aprendizaje de este lenguaje de programación.
La segunda edición del libro se estructura en varias secciones:
Cada sección equipa al lector con habilidades aplicables en proyectos reales, enfatizando la eficiencia en el análisis de datos (Wickham et al., 2023).
Las técnicas y herramientas presentadas en el libro tienen aplicaciones prácticas como:
R for Data Science (2ª edición) es una obra fundamental en la formación de científicos de datos, proporcionando una guía completa y actualizada sobre el uso de R. Sus actualizaciones reflejan las mejores prácticas y las necesidades de la disciplina, consolidando su importancia en la educación y el ejercicio profesional de la ciencia de datos.
Çetinkaya-Rundel, M. (2023). R for Data Science, 2nd edition - tidyverse. Tidyverse. https://www.tidyverse.org/blog/2023/07/r4ds-2e/
Wickham, H., Çetinkaya-Rundel, M., & Grolemund, G. (2023). R for Data Science (2ª ed.). O’Reilly Media. https://r4ds.hadley.nz/
Wickham, H., Çetinkaya-Rundel, M., & Grolemund, G. (2023). R for Data Science: Import, Tidy, Transform, Visualize, and Model Data (2ª ed.). O’Reilly Media. https://www.amazon.com/Data-Science-Transform-Visualize-Model/dp/1492097403