Diplomado: MANEJO DE ECOSISTEMAS MARINOS COSTEROS DEL CARIBE
Programa: Biología — Universidad de La Guajira
Facultad: Ciencias Básicas y Aplicadas


1 Prefacio

Esta guía ha sido elaborada con el objetivo de proporcionar a los estudiantes una introducción práctica y accesible al uso de RStudio para el análisis de datos biológicos.

El material está diseñado específicamente para estudiantes de biología, con ejemplos y aplicaciones relevantes para la disciplina, facilitando el aprendizaje de herramientas computacionales esenciales en la formación científica actual.


2 Introducción a RStudio

2.1 ¿Qué es R y RStudio?

R es un lenguaje de programación y entorno de software libre para análisis estadístico y gráfico. RStudio es un entorno de desarrollo integrado (IDE) para R que facilita el trabajo con este lenguaje gracias a su interfaz gráfica amigable.

Para los estudiantes de biología, R y RStudio ofrecen herramientas poderosas para:

  • Análisis estadístico de datos experimentales
  • Creación de gráficos y visualizaciones científicas
  • Modelado de sistemas biológicos
  • Análisis de secuencias biológicas
  • Análisis de biodiversidad

2.2 Instalación de R y RStudio

Antes de comenzar, debes tener instalados tanto R como RStudio:

  1. Instalar R: Visita CRAN y descarga la versión correspondiente a tu sistema operativo.
  2. Instalar RStudio: Visita RStudio Download y descarga la versión gratuita de RStudio Desktop.

2.3 Interfaz de RStudio

RStudio está dividido en cuatro paneles principales:

Panel Descripción
Editor de Scripts Aquí escribirás y editarás tus scripts de R
Consola Donde se ejecutan los comandos y se muestran los resultados
Entorno / Historial Muestra las variables creadas y el historial de comandos
Archivos / Gráficos / Ayuda Panel multifuncional para explorar archivos, ver gráficos y consultar la ayuda

3 Primeros Pasos en RStudio

3.1 Crear un Nuevo Proyecto

Es una buena práctica organizar tu trabajo en proyectos:

  1. En RStudio, ve a File > New Project…
  2. Selecciona New Directory o Existing Directory según tus necesidades
  3. Sigue las instrucciones para crear el proyecto

Los proyectos facilitan la organización de tus archivos y hacen que tu trabajo sea más reproducible.

3.2 Crear y Ejecutar tu Primer Script

Para crear un nuevo script ve a File > New File > R Script. Luego escribe:

# Mi primer script en R
nombre <- "Estudiante de Biología"
print(paste("Hola", nombre, "¡Bienvenido a R!"))
## [1] "Hola Estudiante de Biología ¡Bienvenido a R!"

3.2.1 Estadísticas básicas con un vector

# Crear un vector con datos numéricos
datos <- c(15, 23, 28, 35, 42)

# Calcular estadísticas básicas
media      <- mean(datos)
desviacion <- sd(datos)

print(paste("Media:", round(media, 2)))
## [1] "Media: 28.6"
print(paste("Desviación estándar:", round(desviacion, 2)))
## [1] "Desviación estándar: 10.45"

3.2.2 Mi primer gráfico

barplot(datos,
        main = "Mi primer gráfico",
        xlab = "Observaciones",
        ylab = "Valores",
        col  = "steelblue")
Gráfico de barras básico con cinco observaciones.

Gráfico de barras básico con cinco observaciones.

3.3 Atajos de Teclado Útiles

Atajo Acción
Ctrl + Enter Ejecuta la línea actual (o selección)
Ctrl + Shift + Enter Ejecuta el script completo
Ctrl + S Guarda el script
Ctrl + Z Deshacer
Alt + - Inserta el operador de asignación <-

4 Operaciones Básicas en R

4.1 Tipos de Datos

R trabaja con varios tipos de datos importantes para el análisis biológico:

# Vectores numéricos (para mediciones continuas)
longitudes <- c(12.5, 14.2, 15.8, 13.7, 11.9)
print(longitudes)
## [1] 12.5 14.2 15.8 13.7 11.9
# Vectores de enteros (para conteos)
conteos <- c(5L, 8L, 12L, 7L, 9L)   # La L indica que son enteros
print(conteos)
## [1]  5  8 12  7  9
# Vectores de caracteres (nombres, categorías, etc.)
especies <- c("Quercus ilex", "Pinus pinaster", "Olea europaea")
print(especies)
## [1] "Quercus ilex"   "Pinus pinaster" "Olea europaea"
# Vectores lógicos (condiciones verdadero/falso)
sobrevivio <- c(TRUE, TRUE, FALSE, TRUE, FALSE)
print(sobrevivio)
## [1]  TRUE  TRUE FALSE  TRUE FALSE
# Factores (variables categóricas)
tratamiento <- factor(c("control", "bajo", "alto", "control", "bajo"))
print(tratamiento)
## [1] control bajo    alto    control bajo   
## Levels: alto bajo control
print(levels(tratamiento))
## [1] "alto"    "bajo"    "control"

4.2 Estadística Descriptiva

R incluye numerosas funciones estadísticas útiles para biología:

# Medidas de longitud (mm) de especímenes
longitudes <- c(45, 42, 39, 47, 38, 43, 40, 45, 41, 44)

cat("Estadísticas descriptivas para longitudes de especímenes (mm):\n\n")
## Estadísticas descriptivas para longitudes de especímenes (mm):
cat("Media:               ", mean(longitudes),       "\n")
## Media:                42.4
cat("Mediana:             ", median(longitudes),     "\n")
## Mediana:              42.5
cat("Desviación estándar:", round(sd(longitudes), 5), "\n")
## Desviación estándar: 2.91357
cat("Mínimo:              ", min(longitudes),         "\n")
## Mínimo:               38
cat("Máximo:              ", max(longitudes),         "\n\n")
## Máximo:               47
cat("Cuartiles:\n")
## Cuartiles:
print(quantile(longitudes))
##    0%   25%   50%   75%  100% 
## 38.00 40.25 42.50 44.75 47.00

4.2.1 Resumen completo con summary()

summary(longitudes)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   38.00   40.25   42.50   42.40   44.75   47.00

5 Visualización Básica de Datos

La visualización de datos es fundamental en biología. R ofrece excelentes herramientas para crear gráficos de calidad científica.

5.1 Diagrama de Caja (Boxplot)

set.seed(123)   # Fija la semilla para reproducibilidad

# Datos simulados de crecimiento bajo diferentes tratamientos
tratamientos <- rep(c("Control", "Fertilizante A", "Fertilizante B"), each = 10)
altura <- c(
  rnorm(10, mean = 15, sd = 2),   # Control
  rnorm(10, mean = 22, sd = 3),   # Fertilizante A
  rnorm(10, mean = 18, sd = 2.5)  # Fertilizante B
)

tratamientos <- factor(tratamientos,
                       levels = c("Control", "Fertilizante A", "Fertilizante B"))

boxplot(altura ~ tratamientos,
        main = "Efecto de fertilizantes en el crecimiento de plantas",
        xlab = "Tratamiento",
        ylab = "Altura (cm)",
        col  = c("lightgreen", "lightblue", "lightyellow"))
Efecto de fertilizantes en el crecimiento de plantas (datos simulados).

Efecto de fertilizantes en el crecimiento de plantas (datos simulados).

5.2 Gráfico de Barras con Error Estándar

medias         <- tapply(altura, tratamientos, mean)
error_estandar <- tapply(altura, tratamientos, function(x) sd(x) / sqrt(length(x)))

# Gráfico de barras
bp <- barplot(medias,
              main  = "Altura promedio por tratamiento",
              xlab  = "Tratamiento",
              ylab  = "Altura promedio (cm)",
              col   = c("darkgreen", "royalblue", "gold"),
              ylim  = c(0, max(medias) + max(error_estandar) * 3))

# Barras de error
arrows(bp, medias - error_estandar,
       bp, medias + error_estandar,
       angle = 90, code = 3, length = 0.1)
Altura promedio por tratamiento con barras de error estándar.

Altura promedio por tratamiento con barras de error estándar.


6 Próximos Contenidos

Esta es la Parte 1 de la guía. En las siguientes partes exploraremos:

  • Importación y manejo de datos
  • Análisis estadísticos más avanzados
  • Gráficos especializados para datos biológicos
  • Análisis de biodiversidad
  • Aplicaciones específicas para biología molecular y ecología

Cristian Granados-Martínez — Programa de Biología, Universidad de La Guajira
2026