##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
El dataset starwars contiene información sobre 87 personajes del universo ficticio de Star Wars. Para cada personaje se registran características físicas como altura, peso y color de cabello, ojos y piel; información biográfica como año de nacimiento, sexo, género, planeta natal y especie; y datos de apariciones en películas, vehículos y naves espaciales. Este conjunto de datos es útil para explorar relaciones entre variables físicas y demográficas dentro de un universo de ficción ampliamente conocido.
Los datos provienen de la SWAPI (Star Wars API), una API pública disponible en https://swapi.dev/ que centraliza información oficial del universo Star Wars basándose en las películas de Lucasfilm. El dataset fue incorporado al paquete dplyr de R por Hadley Wickham como ejemplo didáctico para trabajar con columnas de tipo lista (list-columns). Los datos fueron preprocesados y estructurados en formato data frame con 87 filas y 14 columnas. No provienen de un artículo académico publicado. Para consultarlo directamente en R puedes ejecutar ?dplyr::starwars.
| Variable | Descripción |
|---|---|
name |
Nombre del personaje |
height |
Altura del personaje en cm |
mass |
Peso del personaje en kg |
hair_color |
Color del pelo del personaje |
skin_color |
Color de piel dle personaje |
eye_color |
Color de los ojos del personaje |
birth_year |
Año de nacimiento BBY (Before Battle of Yavin) |
sex |
Sexo del personaje |
gender |
Género del personaje |
homeworld |
Nombre de su planeta de origen |
species |
Especie a la que pertenece el personaje |
films |
Lista de peliculas donde aparece este personaje |
vehicles |
Lista de vehículos que el personaje a conducido |
starships |
Lista de naves espaciales que el personaje a pilotado |
# Cargar el dataset (ya disponible al cargar dplyr)
data <- starwars
# Gráfico 1: Dispersión de altura vs. peso, coloreado por género
# Filtramos valores NA y el outlier extremo de Jabba (mass > 500)
data_filtrada <- data %>%
filter(!is.na(height), !is.na(mass), !is.na(gender), mass < 500)
ggplot(data_filtrada, aes(x = height, y = mass, color = gender)) +
geom_point(size = 3, alpha = 0.8) +
geom_text(
aes(label = ifelse(mass > 100 | height > 210, name, "")),
vjust = -0.8, size = 3, check_overlap = TRUE
) +
labs(
title = "Relación entre altura y peso de personajes de Star Wars",
subtitle = "Coloreado por género del personaje",
x = "Altura (cm)",
y = "Peso (kg)",
color = "Género"
) +
theme_minimal()
Este gráfico de dispersión muestra la relación entre la altura (eje X) y el peso (eje Y) de los personajes de Star Wars, diferenciando por género mediantecolor azul para masculino y rosa para femenino. Se eligieron estas variables porque son las dos principales medidas físicas numéricas del dataset y permiten explorarsi existe una correlación entre ambas.
Se observa una tendencia positiva clara: los personajes más altos tienden a pesar más, lo cual es consistente con lo esperado. Los personajes de género masculino dominan la distribución y se concentran entre 170 y 200 cm de altura. Los personajes femeninos tienden a ser más ligeros para una altura similar. Personajes como Chewbacca y Tarfful destacan como los más altos y pesados dentro del rango graficado.
# Gráfico 2: Diagrama de barras con las especies más frecuentes
# Contamos personajes por especie, tomamos top 8 y excluimos NA
especies_top <- data %>%
filter(!is.na(species)) %>%
count(species, sort = TRUE) %>%
head(8)
ggplot(especies_top, aes(x = reorder(species, n), y = n, fill = species)) +
geom_bar(stat = "identity", show.legend = FALSE) +
coord_flip() +
labs(
title = "Las 8 especies más frecuentes en Star Wars",
subtitle = "Número de personajes por especie en el dataset",
x = "Especie",
y = "Número de personajes"
) +
theme_minimal() +
geom_text(aes(label = n), hjust = -0.3, size = 4)
Este diagrama de barras horizontal muestra las 8 especies con
mayor número de personajes en el dataset, ordenadas de mayor a
menor frecuencia. Se eligió la variable species porque la
diversidad de especies es uno de los elementos más característicos del
universo Star Wars, y resulta interesante cuantificar cuáles dominan la
narrativa.
El resultado más notable es que los humanos son con diferencia la especie más representada con 35 personajes, lo que equivale a más del 40% del total. Le siguen a gran distancia los Droides con 6 personajes. Esta distribución tan desigual indica que aunque Star Wars presume de ser un universo diverso en especies, la mayoría de personajes con rol relevante en la historia son humanos.