##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
El conjunto de datos starwars proviene del paquete dplyr y contiene información estructurada sobre diversos personajes del universo de Star Wars, una de las franquicias cinematográficas más influyentes y reconocidas a nivel mundial.
Cada fila del dataset representa a un personaje individual, mientras que las columnas capturan diferentes aspectos de su identidad y rol dentro de la saga. Estos aspectos incluyen tanto atributos físicos y biográficos como también elementos relacionados con su participación narrativa dentro de las películas.
La fuente original de los datos proviene de la Star Wars API (SWAPI), disponible en https://swapi.py4e.com/, una API pública diseñada para proporcionar acceso estructurado a datos sobre la franquicia. Según la documentación del paquete dplyr, los datos han sido posteriormente revisados y enriquecidos, enriquesimientos enfocados particularmente en las categorías de sexo y género de los personajes. Esto implica que el dataset ha sido procesado previamente, con adaptaciones para representar mejor la identidad biológica y de rol de cada personaje.
Fuente primaria: SWAPI - The Star Wars API. https://swapi.py4e.com/
| Variable | Descripción |
|---|---|
| name | Nombre del personaje |
| height | Altura del personaje en centímetros |
| mass | Peso del personaje en kilogramos |
| hair_color | Color del pelo del personaje |
| skin_color | Color de piel del personaje |
| eye_color | Color de ojos del personaje |
| birth_year | Año de nacimiento del personaje antes de la batalla de Yavin |
| sex | Sexo del personaje (male, female, hermaphroditic, none en caso de los droides) |
| gender | Rol de género del personaje |
| homeworld | Mundo donde nacio el personaje |
| species | Especie del personaje |
| films | Lista de películas donde aparece el personaje |
| vehicles | Lista de vehículos manejados por el personaje |
| starships | Lista de naves manejadas por el personaje |
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.4.3
dt <- starwars
datos_filtrados <- subset(dt, !is.na(height) & !is.na(mass))
ggplot(datos_filtrados, aes(x = height, y = mass)) +
geom_point() +
labs(
title = "Relación entre altura y masa de los personajes",
x = "Altura en cm",
y = "Masa en kg"
) +
theme_minimal()
Esta gráfica de dispersión muestra la relación entre la altura y la masa de los personajes. Cada punto representa un personaje. Se observa que la mayoría de los personajes tienen alturas entre 150 y 200 cm, y masas entre 50 y 100 kg. Existen algunos valores atípicos que representan personajes con características físicas excepcionales, posiblemente correspondientes a especies no humanas o personajes con estructuras corporales muy distintas. Aunque la relación no es perfectamente lineal, se identifica una tendencia general: a mayor altura, suele corresponder una mayor masa.
dt <- starwars
especies_filtradas <- subset(dt, !is.na(species))
ggplot(especies_filtradas, aes(y = species)) +
geom_bar() +
labs(
title = "Cantidad de personajes por especie",
x = "Cantidad",
y = "Especie"
) +
theme_minimal()
Este diagrama de barras muestra la distribución de personajes según su especie. Para su elaboración, se han considerado únicamente aquellos personajes cuyo campo species está definido, es decir, que no presentan NA.
La visualización permite identificar rápidamente cuáles son las especies con mayor representación en el dataset. Se observa que la especie más frecuente es la Humana, lo cual es coherente con el enfoque narrativo de la saga, donde la mayoría de los personajes protagonistas y secundarios pertenecen a esta especie.A continuación destacan los Droides, Gungan y los Wookiee. Además, el gráfico revela que muchas especies tienen una representación muy reducida, con uno o pocos personajes registrados. Esto sugiere una gran diversidad en cuanto a razas y especies en el universo de Star Wars, aunque no todas ellas cuentan con la misma visibilidad o presencia en el conjunto de datos.