# R, Paquetes y Dataframes en R
## ¿Qué es R?
**R** es un lenguaje de programación y un entorno de desarrollo para el análisis estadístico y gráfico. Es ampliamente utilizado en campos como la estadística, la minería de datos y la visualización de datos. Aquí algunas características clave:
- **Software libre**: R es de código abierto, lo que significa que cualquiera puede contribuir a su desarrollo.
- **Interactivo**: Permite trabajar de manera interactiva con datos, facilitando la experimentación y el análisis.
- **Extensible**: Su funcionalidad puede ser extendida mediante paquetes creados por la comunidad.
## Paquetes en R
**Paquetes** son colecciones de funciones, datos y documentación que amplían las capacidades de R. Aquí hay algunos puntos clave sobre los paquetes:
- **Instalación**: Se instalan desde repositorios como CRAN (Comprehensive R Archive Network) usando comandos como `install.packages("nombre_del_paquete")`.
- **Carga**: Para usar las funciones de un paquete, primero necesitas cargarlo en tu sesión de R con `library(nombre_del_paquete)` o `require(nombre_del_paquete)`.
- **Ejemplo**: `ggplot2` es un paquete muy popular para la creación de gráficos.
```r
# Instalación de un paquete
install.packages("ggplot2")
# Carga del paquete
library(ggplot2)
# Uso de una función del paquete
ggplot(data = iris, aes(x = Sepal.Length, y = Sepal.Width)) +
geom_point()
Dataframes (también conocidos como datasets en un contexto más general) son estructuras de datos bidimensionales en R, similares a una tabla de una base de datos o una hoja de cálculo en programas como Excel. Aquí están sus características principales:
Ejemplo de creación y manipulación de un dataframe:
# Crear un dataframe
df <- data.frame(
Nombre = c("Ana", "Juan", "María"),
Edad = c(22, 25, 30),
Altura = c(165, 170, 160)
)
# Ver el dataframe
print(df)
# Filtrar por edad
df[df$Edad > 25, ]
# Calcular la media de la altura
mean(df$Altura)
En resumen, R es una herramienta poderosa para el análisis de datos, los paquetes son extensiones que añaden funcionalidad específica, y los dataframes son la estructura de datos principal para manejar conjuntos de datos en R.