🎯 Aprender a crear, configurar y compilar un archivo R Markdown en RStudio para generar informes reproducibles en HTML o PDF.
📘 R Markdown es un formato de documento que permite combinar texto escrito en Markdown, código R y resultados en un mismo archivo. Es ampliamente utilizado para crear informes dinámicos, presentaciones, libros y sitios web reproducibles desde RStudio.
🛠️ R Markdown permite generar documentos automáticamente a partir de código y texto, facilitando el análisis de datos, informes estadísticos y materiales didácticos. Puedes exportar a formatos como HTML, PDF y Word con solo presionar el botón Knit.
🔍 E1. Pasos para crear y compilar un archivo R Markdown.
✔️ Abre RStudio y ve a File > New File > R
Markdown…
✔️ Escribe un título, autor y selecciona el
formato de salida (HTML o PDF)
✔️ Haz clic en
OK y se abrirá un archivo .Rmd
con
contenido de ejemplo
✔️ Borra el contenido y escribe tu propio
texto y código
✔️ Presiona el botón Knit para
compilar y ver el resultado
🎯 Aprender a leer e importar una base de datos (CSV o Excel) en RStudio utilizando código R dentro de un archivo R Markdown.
📘 Una base de datos es un conjunto organizado de datos que puede ser almacenado en distintos formatos, como archivos CSV, Excel o bases SQL. En R, estas bases se pueden importar fácilmente para su análisis.
🛠️ Para leer una base de datos en R, se pueden usar funciones como
read.csv()
para archivos .csv
, o
readxl::read_excel()
para archivos .xlsx
.
🔍 E1. Cargar un archivo CSV llamado
alumnos.csv
ubicado en tu carpeta de trabajo.
# Instalar si no lo tienes
# install.packages("readr")
# Cargar librería
library(readr)
# Leer archivo CSV
datos <- read_csv("alumnos.csv")
# Ver primeras filas
head(datos)
🔍 E2. Cargar un archivo Excel llamado
notas.xlsx
con la librería readxl
.
# Instalar si no lo tienes
# install.packages("readxl")
# Cargar librería
library(readxl)
# Leer hoja por defecto
notas <- read_excel("notas.xlsx")
# Ver primeras filas
head(notas)
🎯 Aprender a ocultar el código R de los chunks en el informe generado, manteniendo visibles solo los resultados o gráficos.
📘 En muchos informes, especialmente cuando están dirigidos a lectores no técnicos, puede ser útil mostrar únicamente los resultados (tablas, gráficos, conclusiones) y ocultar el código R utilizado para obtenerlos, dejando el documento más limpio y profesional.
🛠️ Para ocultar el código de un chunk en R Markdown, se debe agregar
el argumento echo = FALSE
dentro de la cabecera del chunk.
También se puede aplicar globalmente desde el bloque
setup
.
🎯 Aprender a crear un gráfico de barras con R a partir de una tabla de frecuencias o un vector de categorías.
📘 Un gráfico de barras es una representación gráfica que permite comparar cantidades o frecuencias entre diferentes categorías mediante barras rectangulares.
🛠️ En R, se puede utilizar la función barplot()
para
crear gráficos de barras simples. Se parte de un vector de frecuencias o
de una tabla categórica con table()
.
🔍 E1. Crear un gráfico de barras con los resultados de una encuesta sobre frutas favoritas.
# Datos categóricos
frutas <- c("Manzana", "Plátano", "Manzana", "Kiwi", "Plátano", "Plátano", "Kiwi", "Manzana")
# Tabla de frecuencias
tabla_frutas <- table(frutas)
# Gráfico de barras
barplot(tabla_frutas,
col = "steelblue",
main = "Frutas favoritas",
ylab = "Cantidad de personas")
🎯 Aprender a crear un gráfico de puntos en R, útil para representar distribuciones individuales o relaciones simples entre datos.
📘 Un gráfico de puntos es una visualización que muestra los datos como puntos individuales sobre un eje, generalmente útil para representar valores discretos o series simples. Es especialmente útil para conjuntos de datos pequeños.
🛠️ En R se puede utilizar la función stripchart()
para
generar un gráfico de puntos. También se pueden usar funciones como
plot()
cuando los datos son numéricos y tienen
correspondencia entre eje X e Y.
🔍 E1. Crear un gráfico de puntos con las edades de un grupo de personas.
# Vector de edades
edades <- c(18, 19, 18, 20, 21, 19, 18, 22, 20, 21)
# Gráfico de puntos
stripchart(edades,
method = "stack",
pch = 16,
col = "darkgreen",
main = "Distribución de edades",
xlab = "Edad")
🎯 Aprender a construir e interpretar un gráfico de caja (boxplot) en R, para describir la distribución, dispersión y posibles valores atípicos de un conjunto de datos numéricos.
📘 Un gráfico de caja o boxplot es una representación gráfica que resume cinco estadísticas clave: mínimo, primer cuartil (Q1), mediana (Q2), tercer cuartil (Q3) y máximo. También permite detectar valores atípicos (outliers).
🛠️ En R se utiliza la función boxplot()
. Se le entrega
un vector numérico y opcionalmente un título y etiquetas. También puede
agrupar por categorías usando fórmulas.
🔍 E1. Crear un gráfico de caja con las edades de un grupo de personas.
# Vector de edades
edades <- c(18, 19, 18, 20, 21, 19, 18, 22, 20, 21, 25, 26, 28, 18, 30)
# Gráfico de caja
boxplot(edades,
col = "orange",
main = "Gráfico de caja de edades",
ylab = "Edad")
🔍 E2. Comparar edades según grupo (ejemplo con categorías).
# Crear vectores
grupo <- c("A", "A", "A", "B", "B", "B", "B", "A", "A", "B")
edades <- c(18, 19, 20, 21, 22, 23, 24, 19, 20, 25)
# Gráfico de caja por grupo
boxplot(edades ~ grupo,
col = c("skyblue", "salmon"),
main = "Edades por grupo",
xlab = "Grupo",
ylab = "Edad")
table()
con archivos CSV o Excel🎯 Aprender a usar la función table()
para obtener
tablas de frecuencia a partir de columnas de archivos CSV o Excel
importados en R.
table()
?📘 La función table()
permite contar cuántas veces
aparece cada valor en un vector o columna. Es muy útil para obtener
frecuencias de respuestas categóricas, como colores, nombres, niveles,
etc.
🛠️ Primero se debe importar el archivo usando read_csv()
o read_excel()
, luego se aplica table()
a la
columna deseada. Por ejemplo: table(datos$genero)
🔍 E1. Crear tabla de frecuencias desde un archivo
CSV con una columna llamada genero
.
# Cargar paquete
library(readr)
# Leer archivo CSV
datos <- read_csv("alumnos.csv")
# Tabla de frecuencia de la columna 'genero'
table(datos$genero)
🔍 E2. Crear tabla de frecuencias desde un archivo
Excel con columna asignatura
.
# Cargar paquete
library(readxl)
# Leer archivo Excel
datos <- read_excel("notas.xlsx")
# Tabla de frecuencia de la columna 'asignatura'
table(datos$asignatura)