En el siguiente trabajo se presenta un diagrama de barras elaborado con el paquete ggplot2 a partir de una muestra aleatoria de 200 datos de la base de datos “encuesta”. El objetivo principal es representar de manera gráfica la distribución de la variable “raza” , la cual corresponde a una característica categórica de la población encuestada.
Dado que la base de datos encuesta contiene un conjunto amplio de observaciones, se selecciona una muestra aleatoria de 200 individuos con el fin de simplificar el análisis.
Para garantizar la reproducibilidad de los
resultados, se fija una semilla mediante la
función set.seed()
. De esta manera, aunque el muestreo es
aleatorio, nos permite que tanto el autor como cualquier lector siempre
observen exactamente la misma selección de datos.
datos.e <- encuesta
set.seed(3045) # Sembrar una semilla
datos.m <- sample_n(tbl = datos.e,size = 200,replace = FALSE)
Para crear el gráfico de barras de la variable Raza se emplea el siguiente código en R empleando ggplot2:
ggplot(datos.m, aes(x = raza, fill = raza)) +
geom_bar(width = 0.7, color = "Black") +
scale_fill_manual(values = c("#FFFF00","#030303","#FFFAFA")) +
labs(
title = "Gráfico de barras para raza",
x = "Categorías de raza",
y = "Frecuencia absoluta"
) +
ylim(0, 200) +
theme_classic() +
theme(plot.title = element_text(hjust = 0.5))
Para el desarrollo del trabajo en R Studio se utilizó el apoyo de ChatGPT (OpenAI, 2025), herramienta de inteligencia artificial para resolver dudas y generacion de código.