class: flisol-slide # <div class="flisol-title">Análisis de datos con `R` y `Rstudio`</div> <br><br> <div class="disertante-box"> <em>DISERTANTE</em> <strong>Blás Antonio Benítez Cristaldo</strong> </div> <div class="bottom-bar"></div> --- # 🗂️ Actividades 1. 📊 Introducción a `R` 2. 💻 Instalación de `R` y `RStudio` 3. 🖥️ Introducción a ` RStudio` 4. ⚙️ Estructuras Básicas en `R` 5. 📦 Paquetes útiles 6. 📥 Importación de Archivos 7. 📊 Visualización con `ggplot2` 8. 🧪 Ejercicios prácticos 9. 🙌 Preguntas y cierre --- # 📊 Introducción ## ¿Qué es `R`? - **`R`** es un lenguaje de programación y entorno de desarrollo utilizado para el análisis estadístico y la visualización de datos. -- - Desarrollado principalmente para tareas estadísticas, permite realizar análisis complejos y visualizaciones de alta calidad. -- - **Ventajas**: - **Software libre y gratuito**: Accesible para todos. -- - **Comunidad activa**: Enorme cantidad de paquetes, soporte y documentación. -- - **Flexibilidad y poder**: Amplia gama de aplicaciones, desde análisis simples hasta técnicas avanzadas de machine learning. --- # 📊 Introducción ## ¿Por qué usar `R`? - Especialmente diseñado para análisis estadísticos. -- - Extensa gama de paquetes especializados en diversos tipos de análisis. -- - Integración fácil con otras herramientas como Python, SQL, y más. -- - Ideal para la creación de gráficos y visualizaciones interactivas. --- # 💻 Instalación de `R` y `RStudio` ## En Windows 1. **Instalar R:** - Visitar [https://cran.r-project.org](https://cran.r-project.org) y descargar la última versión de R para Windows. - Seguir el asistente de instalación. -- 2. **Instalar RStudio:** - Descargar RStudio desde [https://posit.co/download/rstudio-desktop/](https://posit.co/download/rstudio-desktop/). - Ejecutar el instalador y seguir las instrucciones. --- # Instalación de `R` en Windows <figure style="text-align: center;"> <video width="700" autoplay loop muted> <source src="instalacionRWin.mp4" type="video/mp4"> </video> <figcaption> <em>Video 1.</em> Página oficial de R en este <a href="https://posit.co/download/rstudio-desktop/" target="_blank">enlace</a>. </figcaption> </figure> --- # 💻 Instalación de `R` y `RStudio` ## En macOS 1. **Instalar R:** - Visitar [https://cran.r-project.org](https://cran.r-project.org) y descargar la versión para macOS. - Abrir el archivo `.pkg` y seguir los pasos de instalación. -- 2. **Instalar RStudio:** - Descargar desde [https://posit.co/download/rstudio-desktop/](https://posit.co/download/rstudio-desktop/). - Arrastrar RStudio a la carpeta de Aplicaciones. --- # Instalación de `R` en macOS <figure style="text-align: center;"> <video width="700" autoplay loop muted> <source src="ryrstudiomac.mp4" type="video/mp4"> </video> <figcaption> <em>Video 2.</em> Página oficial de R en este <a href="https://posit.co/download/rstudio-desktop/" target="_blank">enlace</a>. </figcaption> </figure> --- # 💻 Instalación de `R` y `RStudio` ## En Linux 1. **Instalar R:** - En la terminal, ejecutar: `sudo apt-get install r-base` -- 2. **Instalar RStudio:** - Descargar el archivo `.deb` desde [https://posit.co/download/rstudio-desktop/](https://posit.co/download/rstudio-desktop/). - Instalar el paquete con: `sudo dpkg -i rstudio-x.yy.zzz-amd64.deb` --- # Instalación de `R` en Linux <figure style="text-align: center;"> <video width="700" autoplay loop muted> <source src="ryrstudiolinux.mp4" type="video/mp4"> </video> <figcaption> <em>Video 3.</em> Página oficial de R en este <a href="https://posit.co/download/rstudio-desktop/" target="_blank">enlace</a>. </figcaption> </figure> --- # 🖥️ Introducción a `RStudio` - **RStudio** es un entorno de desarrollo integrado (IDE) diseñado específicamente para trabajar con `R`. -- - **Características**: - **Consola**: Donde se ejecutan los comandos. -- - **Editor de scripts**: Para escribir y ejecutar código `R`. -- - **Vista de objetos**: Donde se muestran los datos, variables y otros objetos. -- - **Gráficos**: Visualización de los gráficos generados por `R`. --- # Entorno de desarrollo integrado <figure style="text-align: center;"> <img src="ideR.png" width="800" height="400"> </div> <figcaption> IDE de Rstudio </figcaption> </figure> --- # ⚙️ Estructuras Básicas en `R` - **Vectores**: `c(1, 2, 3)` -- - **Matrices**: `matrix(1:6, nrow=2, ncol=3)` -- - **Data frames**: `data.frame(x = 1:5, y = 6:10)` -- - **Listas**: `list(a = 1, b = "hola")` --- # 📦 Paquetes Útiles - **`tidyverse`**: Paquete que agrupa herramientas esenciales para la manipulación de datos (`ggplot2`, `dplyr`, `tidyr`, `readr`). -- - **`dplyr`**: Manipulación de datos. Ejemplo: ``` r library(dplyr) data %>% filter(edad > 30) %>% select(edad, salario) ``` -- - **`readr`**: Lectura eficiente de archivos, como `.csv`. --- # 📥 Importación de Archivos #### Cargar paquetes necesarios ``` r install.packages("tidyverse") # Solo la primera vez ``` -- #### Cargar un conjunto de datos ``` r library(tidyverse) # Cargar el archivo (ajustar ruta si estás en otro entorno) datos <- read_csv("datos_estudiantes.csv") ``` -- #### Explorar los datos ``` r head(datos) # Primeras filas ``` ``` ## # A tibble: 6 × 3 ## horas_estudio asistencia calificacion ## <dbl> <dbl> <dbl> ## 1 6 76 4.6 ## 2 4.7 97 6.6 ## 3 6.3 83 6 ## 4 8 64 4.1 ## 5 4.5 93 5.3 ## 6 4.5 65 4.8 ``` ``` r summary(datos) # Estadísticas descriptivas ``` ``` ## horas_estudio asistencia calificacion ## Min. :0.000 Min. : 60.00 Min. :-0.100 ## 1st Qu.:3.875 1st Qu.: 74.50 1st Qu.: 3.975 ## Median :4.900 Median : 83.00 Median : 5.100 ## Mean :4.843 Mean : 82.03 Mean : 4.956 ## 3rd Qu.:5.800 3rd Qu.: 92.00 3rd Qu.: 6.025 ## Max. :9.900 Max. :100.00 Max. : 8.700 ``` ``` r str(datos) # Estructura del dataset ``` ``` ## spc_tbl_ [120 × 3] (S3: spec_tbl_df/tbl_df/tbl/data.frame) ## $ horas_estudio: num [1:120] 6 4.7 6.3 8 4.5 4.5 8.2 6.5 4.1 6.1 ... ## $ asistencia : num [1:120] 76 97 83 64 93 65 81 70 75 92 ... ## $ calificacion : num [1:120] 4.6 6.6 6 4.1 5.3 4.8 5.2 5.6 4.4 4.1 ... ## - attr(*, "spec")= ## .. cols( ## .. horas_estudio = col_double(), ## .. asistencia = col_double(), ## .. calificacion = col_double() ## .. ) ## - attr(*, "problems")=<externalptr> ``` --- # Limpiar / transformar datos ``` r # Transformar asistencia a categoría datos <- datos %>% mutate(asistencia_cat = case_when( asistencia >= 90 ~ "Alta", asistencia >= 75 ~ "Media", TRUE ~ "Baja" )) %>% mutate(asistencia_cat = factor(asistencia_cat, levels = c("Baja", "Media", "Alta"))) ``` --- # 📊 Visualización Inicial ### Crear un gráfico básico con `ggplot2` ``` r ggplot(datos, aes(x = asistencia_cat, y = calificacion, fill = asistencia_cat)) + geom_boxplot() + labs(title = "Distribución de calificaciones según nivel de asistencia", x = "Categoría de Asistencia", y = "Calificación") + theme_minimal() ``` <img src="Presentacion_flisol_files/figure-html/unnamed-chunk-6-1.png" style="display: block; margin: auto;" /> --- # 🧪 Probá tu primer script en R ``` r # Crear un vector de temperaturas temperaturas <- c(23, 25, 20, 19, 22, 24, 26) # Promedio mean(temperaturas) ``` ``` ## [1] 22.71429 ``` ``` r # Visualización básica plot(temperaturas, type = "o", col = "darkgreen", main = "Temperaturas Semanales") ``` <img src="Presentacion_flisol_files/figure-html/unnamed-chunk-7-1.png" style="display: block; margin: auto;" /> --- # 🔁 Convertí datos en insights ``` r library(dplyr) # Base de ejemplo alumnos <- data.frame( nombre = c("Ana", "Luis", "Marta", "Carlos"), edad = c(22, 20, 23, 21), carrera = c("Ing. Datos", "Matemática", "Ing. Datos", "Física") ) # Filtrar sólo estudiantes de Ing. Datos alumnos %>% filter(carrera == "Ing. Datos") ``` ``` ## nombre edad carrera ## 1 Ana 22 Ing. Datos ## 2 Marta 23 Ing. Datos ``` --- # 🌐 Explorá `R` sin instalarlo ## Alternativas online - [Posit Cloud](https://posit.cloud) <div style="text-align: center;"> <img src="posit.png" width="600"> </div> --- # 🛠️ Automatizaciones con` R` 1. Limpieza de encuestas (`janitor`, `dplyr`) -- 2. Generación automática de gráficos (`ggplot2`) -- 3. Informes PDF con `rmarkdown` -- 4. Cruce de bases de datos (`dplyr::join`) -- 5. Análisis exploratorio (`summary()`, `skimr`) --- # 🎯 Mini desafío práctico > Cambiá el color de las columnas y agregá un nuevo título ``` r ggplot(datos, aes(x = asistencia_cat, fill = asistencia_cat)) + geom_bar() + labs(title = "Cantidad de estudiantes por nivel de asistencia", x = "Nivel de Asistencia", y = "Cantidad de Estudiantes") + theme_minimal() ``` <img src="Presentacion_flisol_files/figure-html/unnamed-chunk-9-1.png" style="display: block; margin: auto;" /> --- # 🙌 ¡Gracias por tu atención! ## ¿Dudas o comentarios? - ¡Podés explorar más en https://docs.posit.co/ ! - ¡Experimentá, graficá, analizá! 📊📈