## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Descripción de los datos

El dataset starwars contiene información sobre 87 personajes del universo ficticio de Star Wars. Para cada personaje se registran características físicas como altura, peso y color de cabello, ojos y piel; información biográfica como año de nacimiento, sexo, género, planeta natal y especie; y datos de apariciones en películas, vehículos y naves espaciales. Este conjunto de datos es útil para explorar relaciones entre variables físicas y demográficas dentro de un universo de ficción ampliamente conocido.

Fuente de Datos

Los datos provienen de la SWAPI (Star Wars API), una API pública disponible en https://swapi.dev/ que centraliza información oficial del universo Star Wars basándose en las películas de Lucasfilm. El dataset fue incorporado al paquete dplyr de R por Hadley Wickham como ejemplo didáctico para trabajar con columnas de tipo lista (list-columns). Los datos fueron preprocesados y estructurados en formato data frame con 87 filas y 14 columnas. No provienen de un artículo académico publicado. Para consultarlo directamente en R puedes ejecutar ?dplyr::starwars.

Tabla Resumen

Variable Descripción
name Nombre del personaje
height Altura del personaje en cm
mass Peso del personaje en kg
hair_color Color del pelo del personaje
skin_color Color de piel dle personaje
eye_color Color de los ojos del personaje
birth_year Año de nacimiento BBY (Before Battle of Yavin)
sex Sexo del personaje
gender Género del personaje
homeworld Nombre de su planeta de origen
species Especie a la que pertenece el personaje
films Lista de peliculas donde aparece este personaje
vehicles Lista de vehículos que el personaje a conducido
starships Lista de naves espaciales que el personaje a pilotado

Visualizaciones de datos

# Cargar el dataset (ya disponible al cargar dplyr)
data <- starwars
# Gráfico 1: Dispersión de altura vs. peso, coloreado por género

# Filtramos valores NA y el outlier extremo de Jabba (mass > 500)
data_filtrada <- data %>%
  filter(!is.na(height), !is.na(mass), !is.na(gender), mass < 500)

ggplot(data_filtrada, aes(x = height, y = mass, color = gender)) +
  geom_point(size = 3, alpha = 0.8) +
  geom_text(
    aes(label = ifelse(mass > 100 | height > 210, name, "")),
    vjust = -0.8, size = 3, check_overlap = TRUE
  ) +
  labs(
    title = "Relación entre altura y peso de personajes de Star Wars",
    subtitle = "Coloreado por género del personaje",
    x = "Altura (cm)",
    y = "Peso (kg)",
    color = "Género"
  ) +
  theme_minimal()

Este gráfico de dispersión muestra la relación entre la altura (eje X) y el peso (eje Y) de los personajes de Star Wars, diferenciando por género mediantecolor azul para masculino y rosa para femenino. Se eligieron estas variables porque son las dos principales medidas físicas numéricas del dataset y permiten explorarsi existe una correlación entre ambas.

Se observa una tendencia positiva clara: los personajes más altos tienden a pesar más, lo cual es consistente con lo esperado. Los personajes de género masculino dominan la distribución y se concentran entre 170 y 200 cm de altura. Los personajes femeninos tienden a ser más ligeros para una altura similar. Personajes como Chewbacca y Tarfful destacan como los más altos y pesados dentro del rango graficado.

# Gráfico 2: Diagrama de barras con las especies más frecuentes

# Contamos personajes por especie, tomamos top 8 y excluimos NA
especies_top <- data %>%
  filter(!is.na(species)) %>%
  count(species, sort = TRUE) %>%
  head(8)

ggplot(especies_top, aes(x = reorder(species, n), y = n, fill = species)) +
  geom_bar(stat = "identity", show.legend = FALSE) +
  coord_flip() +
  labs(
    title = "Las 8 especies más frecuentes en Star Wars",
    subtitle = "Número de personajes por especie en el dataset",
    x = "Especie",
    y = "Número de personajes"
  ) +
  theme_minimal() +
  geom_text(aes(label = n), hjust = -0.3, size = 4)

Este diagrama de barras horizontal muestra las 8 especies con mayor número de personajes en el dataset, ordenadas de mayor a menor frecuencia. Se eligió la variable species porque la diversidad de especies es uno de los elementos más característicos del universo Star Wars, y resulta interesante cuantificar cuáles dominan la narrativa.

El resultado más notable es que los humanos son con diferencia la especie más representada con 35 personajes, lo que equivale a más del 40% del total. Le siguen a gran distancia los Droides con 6 personajes. Esta distribución tan desigual indica que aunque Star Wars presume de ser un universo diverso en especies, la mayoría de personajes con rol relevante en la historia son humanos.