Diplomado: MANEJO DE ECOSISTEMAS MARINOS COSTEROS DEL CARIBE
Programa: Biología — Universidad de La Guajira
Facultad: Ciencias Básicas y Aplicadas
Esta guía ha sido elaborada con el objetivo de proporcionar a los estudiantes una introducción práctica y accesible al uso de RStudio para el análisis de datos biológicos.
El material está diseñado específicamente para estudiantes de biología, con ejemplos y aplicaciones relevantes para la disciplina, facilitando el aprendizaje de herramientas computacionales esenciales en la formación científica actual.
R es un lenguaje de programación y entorno de software libre para análisis estadístico y gráfico. RStudio es un entorno de desarrollo integrado (IDE) para R que facilita el trabajo con este lenguaje gracias a su interfaz gráfica amigable.
Para los estudiantes de biología, R y RStudio ofrecen herramientas poderosas para:
Antes de comenzar, debes tener instalados tanto R como RStudio:
RStudio está dividido en cuatro paneles principales:
| Panel | Descripción |
|---|---|
| Editor de Scripts | Aquí escribirás y editarás tus scripts de R |
| Consola | Donde se ejecutan los comandos y se muestran los resultados |
| Entorno / Historial | Muestra las variables creadas y el historial de comandos |
| Archivos / Gráficos / Ayuda | Panel multifuncional para explorar archivos, ver gráficos y consultar la ayuda |
Es una buena práctica organizar tu trabajo en proyectos:
Los proyectos facilitan la organización de tus archivos y hacen que tu trabajo sea más reproducible.
Para crear un nuevo script ve a File > New File > R Script. Luego escribe:
# Mi primer script en R
nombre <- "Estudiante de Biología"
print(paste("Hola", nombre, "¡Bienvenido a R!"))## [1] "Hola Estudiante de Biología ¡Bienvenido a R!"
| Atajo | Acción |
|---|---|
Ctrl + Enter |
Ejecuta la línea actual (o selección) |
Ctrl + Shift + Enter |
Ejecuta el script completo |
Ctrl + S |
Guarda el script |
Ctrl + Z |
Deshacer |
Alt + - |
Inserta el operador de asignación <- |
R trabaja con varios tipos de datos importantes para el análisis biológico:
# Vectores numéricos (para mediciones continuas)
longitudes <- c(12.5, 14.2, 15.8, 13.7, 11.9)
print(longitudes)## [1] 12.5 14.2 15.8 13.7 11.9
# Vectores de enteros (para conteos)
conteos <- c(5L, 8L, 12L, 7L, 9L) # La L indica que son enteros
print(conteos)## [1] 5 8 12 7 9
# Vectores de caracteres (nombres, categorías, etc.)
especies <- c("Quercus ilex", "Pinus pinaster", "Olea europaea")
print(especies)## [1] "Quercus ilex" "Pinus pinaster" "Olea europaea"
# Vectores lógicos (condiciones verdadero/falso)
sobrevivio <- c(TRUE, TRUE, FALSE, TRUE, FALSE)
print(sobrevivio)## [1] TRUE TRUE FALSE TRUE FALSE
# Factores (variables categóricas)
tratamiento <- factor(c("control", "bajo", "alto", "control", "bajo"))
print(tratamiento)## [1] control bajo alto control bajo
## Levels: alto bajo control
## [1] "alto" "bajo" "control"
R incluye numerosas funciones estadísticas útiles para biología:
# Medidas de longitud (mm) de especímenes
longitudes <- c(45, 42, 39, 47, 38, 43, 40, 45, 41, 44)
cat("Estadísticas descriptivas para longitudes de especímenes (mm):\n\n")## Estadísticas descriptivas para longitudes de especímenes (mm):
## Media: 42.4
## Mediana: 42.5
## Desviación estándar: 2.91357
## Mínimo: 38
## Máximo: 47
## Cuartiles:
## 0% 25% 50% 75% 100%
## 38.00 40.25 42.50 44.75 47.00
La visualización de datos es fundamental en biología. R ofrece excelentes herramientas para crear gráficos de calidad científica.
set.seed(123) # Fija la semilla para reproducibilidad
# Datos simulados de crecimiento bajo diferentes tratamientos
tratamientos <- rep(c("Control", "Fertilizante A", "Fertilizante B"), each = 10)
altura <- c(
rnorm(10, mean = 15, sd = 2), # Control
rnorm(10, mean = 22, sd = 3), # Fertilizante A
rnorm(10, mean = 18, sd = 2.5) # Fertilizante B
)
tratamientos <- factor(tratamientos,
levels = c("Control", "Fertilizante A", "Fertilizante B"))
boxplot(altura ~ tratamientos,
main = "Efecto de fertilizantes en el crecimiento de plantas",
xlab = "Tratamiento",
ylab = "Altura (cm)",
col = c("lightgreen", "lightblue", "lightyellow"))Efecto de fertilizantes en el crecimiento de plantas (datos simulados).
medias <- tapply(altura, tratamientos, mean)
error_estandar <- tapply(altura, tratamientos, function(x) sd(x) / sqrt(length(x)))
# Gráfico de barras
bp <- barplot(medias,
main = "Altura promedio por tratamiento",
xlab = "Tratamiento",
ylab = "Altura promedio (cm)",
col = c("darkgreen", "royalblue", "gold"),
ylim = c(0, max(medias) + max(error_estandar) * 3))
# Barras de error
arrows(bp, medias - error_estandar,
bp, medias + error_estandar,
angle = 90, code = 3, length = 0.1)Altura promedio por tratamiento con barras de error estándar.
Esta es la Parte 1 de la guía. En las siguientes partes exploraremos: