# ¿Qué es R, los paquetes de R, y los datasets o dataframes?
A continuación, se explica brevemente qué es R, los paquetes de R, y los datasets o dataframes.
---
## ¿Qué es R?
**R** es un lenguaje de programación y entorno de software especializado en análisis estadístico, visualización de datos y computación científica. Es ampliamente utilizado en campos como la estadística, la ciencia de datos, la bioinformática y la investigación académica. R es de código abierto y cuenta con una gran comunidad de usuarios que contribuyen con herramientas y recursos.
---
## ¿Qué son los paquetes de R?
Los **paquetes de R** son colecciones de funciones, datos y documentación que extienden las capacidades del lenguaje R. Estos paquetes permiten realizar tareas específicas, como manipulación de datos, visualización, aprendizaje automático, entre otros. Algunos paquetes populares incluyen:
- **`dplyr`**: Para manipulación de datos.
- **`ggplot2`**: Para visualización de datos.
- **`tidyverse`**: Un conjunto de paquetes para ciencia de datos.
- **`caret`**: Para aprendizaje automático.
Para instalar y cargar un paquete en R, se utilizan los siguientes comandos:
```r
# Instalar un paquete
install.packages("nombre_del_paquete")
# Cargar un paquete
library(nombre_del_paquete)
En R, un dataset o dataframe es una estructura de datos tabular, similar a una hoja de cálculo o una tabla en una base de datos. Un dataframe está compuesto por filas (observaciones) y columnas (variables), donde cada columna puede contener un tipo de dato diferente (numérico, carácter, lógico, etc.).
# Crear un dataframe manualmente
mi_dataframe <- data.frame(
nombre = c("Ana", "Juan", "María"),
edad = c(25, 30, 22),
ciudad = c("Madrid", "Barcelona", "Valencia")
)
# Mostrar el dataframe
print(mi_dataframe)
Explorar el dataframe:
head(mi_dataframe) # Muestra las primeras filas
summary(mi_dataframe) # Resumen estadístico
Seleccionar columnas:
mi_dataframe$nombre # Acceder a la columna "nombre"
Filtrar filas:
subset(mi_dataframe, edad > 25) # Filtrar por edad
Agregar una nueva columna:
mi_dataframe$pais <- "España" # Agregar columna "pais"
¡Espero que esta explicación te haya sido útil! ```