Elaborar un diagrama de barras para la variable raza de la base de datos encuesta.
Para realizar anális gráfico, se necesitarán los siguientes paquetes:
library(ggplot2)
library(datos)
library(dplyr)
Usaremos los datos de la base de datos “encuesta” de la librería “datos”:
datos.e <- encuesta
set.seed(8985)
datos.m <- sample_n(tbl = datos.e, size = 120, replace = FALSE)
head(datos.m, 10)
## # A tibble: 10 × 9
## anio estado_civil edad raza ingreso partido religion denominacion horas_tv
## <int> <fct> <int> <fct> <fct> <fct> <fct> <fct> <int>
## 1 2012 Divorciado 33 Negra Se nie… Fuerte… Cristia… No aplica 2
## 2 2006 Divorciado 22 Blan… 10000 … No fue… Protest… Bautistas d… NA
## 3 2000 Separado 62 Negra 15000 … Fuerte… Protest… Iglesia afr… 1
## 4 2014 Casado 53 Blan… Se nie… Otro p… Protest… No denomina… 2
## 5 2002 Viudo 37 Blan… 25000 … No fue… Protest… No denomina… 1
## 6 2002 Casado 49 Blan… 5000 -… No fue… Protest… Bautistas d… NA
## 7 2000 Casado 61 Blan… No apl… No fue… Protest… Bautistas d… 4
## 8 2014 Casado 55 Blan… 25000 … Ind, p… Judía No aplica 2
## 9 2006 Casado 47 Blan… No apl… No fue… Católica No aplica NA
## 10 2006 Nunca se ha… 55 Negra 4000 -… No fue… Protest… Convención … 3
tail(datos.m, 10)
## # A tibble: 10 × 9
## anio estado_civil edad raza ingreso partido religion denominacion horas_tv
## <int> <fct> <int> <fct> <fct> <fct> <fct> <fct> <int>
## 1 2008 Casado 36 Blan… 25000 … No fue… Ninguna No aplica NA
## 2 2002 Divorciado 40 Blan… 25000 … Ind, p… Católica No aplica 2
## 3 2006 Divorciado 63 Blan… No apl… No fue… Protest… Bautista, n… 3
## 4 2002 Divorciado 59 Negra No apl… Fuerte… Protest… Asociación … NA
## 5 2002 Divorciado 22 Blan… 10000 … Ind, p… Ninguna No aplica NA
## 6 2006 Casado 36 Negra 25000 … No fue… Protest… Bautista, n… 1
## 7 2014 Casado 44 Blan… 25000 … Ind, p… Ninguna No aplica NA
## 8 2002 Casado 48 Blan… 25000 … No fue… Protest… Bautistas d… NA
## 9 2000 Nunca se ha… 46 Negra 25000 … Fuerte… Protest… Bautistas d… 3
## 10 2000 Casado 37 Otra 25000 … No fue… Protest… Otra NA
ggplot(datos.m, aes(x = raza, fill = raza)) +
geom_bar() +
labs(title = "Distribución de la variable ‘Raza’ en los encuestados",
x = "Grupo racial",
y = "Frecuencia absoluta") +
scale_fill_manual(values = c("#FFFF00","#FF3E96","#00F5FF")) +
theme_minimal() + theme(plot.title = element_text(hjust = 0.5))
CONCLUSIONES
El análisis del diagrama de barras muestra que la mayor proporción de los encuestados se identifica como de raza blanca, seguida por la raza negra, mientras que la categoría “otra” presenta la menor frecuencia. Esto evidencia una distribución desigual en la muestra, donde predomina la población blanca frente a los demás grupos raciales.