# ¿Qué es R, qué son los paquetes y qué son los datasets o data frames?
## ¿Qué es R?
**R** es un lenguaje de programación y entorno de software especializado en análisis estadístico, visualización de datos y computación científica. Es ampliamente utilizado en campos como la estadística, la ciencia de datos, la bioinformática y la investigación académica. R es de código abierto y cuenta con una comunidad activa que contribuye con herramientas y paquetes para diversas aplicaciones.
### Características principales de R:
- **Lenguaje interpretado**: No requiere compilación, lo que facilita la ejecución de código.
- **Orientado a datos**: Está diseñado para manipular y analizar grandes volúmenes de datos.
- **Extensible**: Permite la creación y uso de paquetes para ampliar sus funcionalidades.
- **Gráficos avanzados**: Ofrece herramientas poderosas para la visualización de datos.
---
## ¿Qué son los paquetes en R?
Los **paquetes** en R son colecciones de funciones, datos y documentación que amplían las capacidades del lenguaje. Estos paquetes son desarrollados por la comunidad y permiten realizar tareas específicas, como análisis estadísticos avanzados, visualizaciones gráficas, manipulación de datos, entre otros.
### Ejemplos de paquetes populares:
- **`dplyr`**: Para manipulación de datos.
- **`ggplot2`**: Para crear gráficos avanzados.
- **`tidyverse`**: Un conjunto de paquetes para ciencia de datos.
- **`caret`**: Para machine learning.
### Instalación y uso de paquetes:
```r
# Instalar un paquete
install.packages("dplyr")
# Cargar un paquete
library(dplyr)
En R, un dataset o data frame es una estructura de datos que almacena información en forma de tabla, similar a una hoja de cálculo. Cada columna representa una variable, y cada fila representa una observación o registro. Los data frames son fundamentales para el análisis de datos en R.
# Crear un data frame manualmente
df <- data.frame(
Nombre = c("Ana", "Juan", "María"),
Edad = c(25, 30, 22),
Ciudad = c("Madrid", "Barcelona", "Valencia")
)
# Ver el data frame
print(df)
# Filtrar filas
filter(df, Edad > 25)
# Seleccionar columnas
select(df, Nombre, Ciudad)
# Agregar una nueva columna
df$Pais <- c("España", "España", "España")
Con estas herramientas, R se convierte en una opción ideal para el análisis y visualización de datos en diversos campos. ```