INTRODUCCIÓN

En este trabajo se construye un gráfico de barras utilizando el paquete ggplot2, a partir de un muestra aleatoria de 200 registros de base de datos encuesta. El propósito es mostrar de forma visual la distribución de la variable “raza”, la cual representa una característica cualitativa de la población considerada en la encuesta.

SEMILLAS Y MUESTREO

Debido a que la base de datos encuesta dispone de un número considerable de observaciones, se toma una muestra aleatoria de 200 personas con el propósito de facilitar el análisis. Para asegurar que los resultados puedan reproducirse, se establece una semilla con la funcion set.seed(). Asi, aunque el muestreo sea aleatorio, se garantiza que tanto el autor como los lectores obtengan siempre la misma selección de datos.

datos.e <- encuesta

set.seed(2548) # Sembrar una semilla

datos.m <- sample_n(tbl = datos.e,size = 200,replace = FALSE)

Diagrama de barras para la variable Raza

Para crear el gráfico de la variable Raza se emplea el siguiente código en R empleando ggplot2: