En el presente documento se presenta un análisis del dataset stars de la librería dslabs. Este dataset contiene información sobre 96 estrellas, en el que se incluyen características físicas como la magnitud absoluta, temperatura superficial y clasificación espectral. A través de este análisis, se exploran diversos aspectos de los datos, tales como la relación entre las variables, la distribución de tipos espectrales y su influencia en las propiedades físicas de las estrellas.
Analizar las propiedades físicas de las estrellas contenidas en el dataset stars, con el fin de explorar la relación entre la magnitud absoluta, la temperatura superficial y el tipo espectral de las estrellas.
Identificar las características de las variables que componen el dataset stars, incluyendo el tipo de dato y la presencia de valores nulos.
Analizar la distribución de la magnitud absoluta de las estrellas y su relación con la temperatura superficial.
Examinar la distribución de los tipos espectrales de las estrellas y su influencia en las propiedades físicas como la temperatura y la luminosidad.
El dataset es parte de la libreria DSLabs (Data Science Labs). Al inspeccionar el dataframe de stars se observa que contiene información sobre caracteristicas fisicas de ciertas estrellas, este dataset cuenta con el nombre, la magnitud de la estrella en base a la luminosidad y distancia de la estrella, la temperatura de la superficie en grados Kelvin y el tipo en base al sistema OBAFGKM, donde cada letra del type indica el tipo de estrella y las diferentes temperaturas superficiales, colores y características.
El dataset de stars contiene 96 registros de estrellas donde se puede ver cada una de las caracteristicas mencionadas anteriormente. No se encuentran valores nulos en ningún registro, pues al ser datos de estrellas conocidas se tienen los registros de cada una de ellas. Además, al inspeccionar los datos, se observa que cada una de las caracteristicas tiene un tipo de dato en especifico.
Cada variable representa informacion de cada estrella, star es el nombre de la estrella, siendo de de tipo factor, magnitude representa la magnitud de la estrella en base a su luminosidad y de distancia a ella, siendo de tipo numeric, temp representa la temperatura en la superficie, siendo de tipo integer y type que representa a la clasificación en el sistema OBAFGKM siendo de tipo character, pues contiene unicamente solo un carácter. No se tiene un limite de periodo de observación daod que no se manejan tiempos, como horas, dias o años.
La unidad de la magnitud es una escala logarítmica, y no tiene una unidad física directa como los metros o los kelvins. En su lugar, la magnitud está relacionada con la luminosidad (brillo) de la estrella, donde una magnitud más baja indica un objeto más brillante.
Es interesante que filtrando por el type en base al del Sol, se encuentran otras 3 estrellas el type similar al del Sol, por ejemplo, la estrella AlphaCentauriA tiene la magnitud, tempratura y type con caracteristicas bastante similiares al Sol, lo que tiene como diferencia es la magnitud, siendo un poco más grande que el Sol.
Estos datos fueron recopilados de multiples referencias de VizieR, que es un servicio de catálogos astronómicos. Aunque es un dataset relativamente pequeño, es útil para poder conocer sobre datos de estrellas.
| Variable | Descripción |
|---|---|
| star | Indica el nombre de la estrella |
| magnitude | Es la magnitud de la estrella en base a su luminosidad y de su distancia a ella |
| temp | Es la temperatura de su superficie, en grados Kelvil |
| type | Se refiere a la clasificación espectral de una estrella usando el sistema OBAFGKM |
stars[stars$type == "G", ]
## star magnitude temp type
## 1 Sun 4.8 5840 G
## 5 AlphaCentauriA 4.3 5840 G
## 7 Capella -0.6 5150 G
## 72 TauCeti 5.7 5150 G
En esta consulta se muestra estrellas que contienen caracteristicas similares a las del Sol, una estrella que es conocida por todas las personas, por lo menos de manera visual. Se muestran estos datos para que se pueda tomar como referencia el Sol y poder comparar cuán grandes o pequeñas son las demás estrellas.
library(dslabs)
plot(
stars$magnitude,
stars$temp,
xlab = "Magnitud absoluta",
ylab = "Temperatura (K)",
main = "Magnitud vs Temperatura",
col = c("blue", "red","green", "yellow")
)
Este gráfico de dispersión muestra la relación entre la magnitud absoluta y la temperatura de las estrellas. Cada punto representa una estrella individual, ubicándose según su brillo y su temperatura. A través del gráfico, se puede observar que existe una tendencia donde las estrellas más brillantes suelen tener temperaturas más altas, mientras que las menos brillantes tienden a ser más frías. Este grafico permite clasificar estrellas según su luminosidad y temperatura superficial. Este dataset muestra que cuanto menor es la magnitud, la temperatura tiende a ser mayor, como se observa en la magnitud -5 con temperaturas mayores 35000 K°, mientras conforme va aumentando la magnitud, la temperatura va disminuyendo.
stripchart(
stars$temp ~ stars$type,
xlab = "Temperatura (K)",
ylab = "Tipo espectral",
main = "Temperatura según tipo de estrella",
pch = 19,
col = "red"
)
Este gráfico muestra como varía la temperatura de las estrellas en función de su tipo espectral. Cada grupo es un tipo espectral, y dentro de cada grupo se distribuyen las temperaturas individuales de las estrellas. Se puede observar que las estrellas de tipo O y B poseen las temperaturas más elevadas, mientras que las de tipo K y M son un poco más frías. Este comportamiento es lo que indica la clasificación espectral, donde las estrellas se ordenan de mayor a menor temperatura, mostrando así cómo el tipo espectral está directamente relacionado con la temperatura de las estrellas. En este caso, se observa que la temperatura y el tipo espectral esta estrechamente relacionado, las temperatura de 5000 K° tiene a estar en la clasificación de K y M, y las temperaturas mayores empiezan a estar en la clasificación de B y DB.
stripchart(
stars$magnitude ~ stars$type,
xlab = "Magnitud",
ylab = "Tipo espectral",
main = "Magnitud según tipo de estrella",
pch = 19,
col = rainbow(length(unique(stars$type))),
)
Esta gráfica de dispersión, se muestra la relación entre la magnitud y el tipo espectral de diferentes estrellas. Se observa que las estrellas de tipo A y B tienen magnitudes negativas o cercanas a cero, indicando que son muy brillantes. A medida que se va hacia los tipos espectrales F, G, K y M, la magnitud aumenta progresivamente, lo que significa que las estrellas se vuelven menos brillantes. Especialmente, las estrellas de tipo M presentan magnitudes bastante altas, lo que refleja su bajo brillo. Esta tendencia confirma que, en general, las estrellas más calientes y masivas son más luminosas, mientras que las estrellas más frías y pequeñas son menos brillantes. Además, la variabilidad dentro de cada tipo espectral sugiere que, aunque comparten características similares, las estrellas pueden diferir en su brillo de manera significativa.
hist(stars$magnitude, main="Distribución de magnitud de las estrellas", xlab= "Magnitud", ylab="Frecuencia",
col = c("blue","red", "pink","skyblue","green","yellow"))
El histograma analiza la distribución de la magnitud absoluta de las estrellas. Al dividir la magnitud en intervalos y contar cuantas estrellas caen en cada uno, el gráfico permite visualizar cuáles niveles de brillo son más frecuentes.El histograma muestra si el conjunto de datos está dominado por estrellas muy brillantes o por estrellas más tenues. En este caso, el dataset contiene una frecuencia mayor en cuanto a magnitud de la estrella de -5 a 0 y de 10 a 15. Esto indica que los datos que se cargaron al dataset incluyen dos grupos uno de estrellas extremadamente brillantes y otro de estrellas mucho menos brillantes. Esta doble concentración puede indicar que el conjunto de datos no sigue una distribución uniforme, sino que fue diseñado o recolectado para incluir tanto estrellas gigantes muy luminosas como estrellas pequeñas y tenues. Esta combinación puede resultar util para realizar comparaciones entre diferentes tipos de estrellas y para observar mejor las variaciones en las caracteristicas de las estrellas.
barplot(table(stars$type), main="Frecuencia de tipos espectrales de las estrellas", xlab="Clasificacion sistema OBAFGKM",
ylab="Cantidad", col = c("blue","red", "pink","skyblue","green","yellow","white","black","orange","brown"))
Este gráfico muestra la frecuencia de estrellas según su tipo espectral del sistema OBAFGKM, se observa que el tipo M presenta una gran cantidad de apariciones, lo que indica que las estrellas frías y de baja masa son las más comunes en el conjunto de datos, dado que según la astronomia las estrellas de tipo M, conocidas como enanas rojas, son las más abundantes en el universo. Por otro lado, los tipos DB, DF y O muestran una cantidad mucho menor de apariciones. Las estrellas de tipo O son extremadamente masivas y calientes, pero también muy escasas debido a su corta vida útil, mientras que los tipos DB y DF representan estrellas blancas degeneradas, que también son raras en comparación con otros tipos espectrales. En sí, el gráfico refleja la diversidad de estrellas del universo, destacando la predominancia de las estrellas más pequeñas y frías frente a las estrellas más masivas y brillantes.
tbl <- prop.table(table(stars$type))
pie(tbl,
main = "Distribución de tipos de estrella",
labels = paste0(round(tbl * 100, 2), "%"),
cex = 0.5,
radius = 0.9,
col = rainbow(length(tbl))
)
legend("bottom",
legend = names(tbl),
fill = rainbow(length(tbl)),
title = "Tipos de Estrella",
cex= 0.7,
inset = c(0, -0.3),
horiz = TRUE,
xpd = TRUE)
Este gráfico de pie muestra la distrución de cada tipo de estrella en el dataset. Se observa que el 33.33% de las estrellas son del tipo M, que es más de la tercera parte del dataset, mientras que DB y DF tienen aparecen menos en el dataset con un porcentaje de 1.04%, mostrando que estrellas en la clasificación del tipo M son más comunes tanto en el dataset como en el universo observado, mientras que estrellas del tipo DB y DF son menos comunes tanto en el dataset como en las observaciones realizadas en el universo.
boxplot(stars$magnitude ~ stars$type, data=stars, xlab= "Clasificación espectral", ylab="Magnitud", main="Distribución de la Magnitud por Tipo de Estrella")
Este gŕafico de cajas, se muestra que las estrellas de tipo B tienen las magnitudes más bajas, indicando gran luminosidad, mientras que las estrellas de tipo M y O presentan magnitudes significativamente mayores, lo que implica un brillo mucho menor. Las cajas muestran la dispersión de los datos: en los tipos espectrales F, G y K se aprecia una mayor variabilidad en la magnitud, mientras que en tipos como DA, DB y DF la magnitud es más constante y elevada. Además, algunos tipos espectrales como M muestran valores atípicos, indicando estrellas menos representativas en cuanto a su brillo
Se identificó que todas las variables del dataset están correctamente tipificadas y no presentan valores nulos, lo cual facilita el análisis y garantiza la integridad de los datos al momento de realizar cualquier exploración estadística o visualización.
A partir del gráfico de dispersión entre magnitud y temperatura, se observa una clara tendencia donde las estrellas más brillantes (menor magnitud) tienden a ser más calientes, mientras que las estrellas menos brillantes suelen tener temperaturas más bajas. Esto concuerda con las expectativas astronómicas, ya que las estrellas más luminosas generalmente son más grandes y calientes.
Se observó que existe una relación inversa entre la magnitud absoluta y la temperatura superficial: las estrellas más brillantes (menor magnitud) tienden a tener temperaturas más altas, mientras que las menos brillantes son más frías.
Los resultados muestran una predominancia de estrellas de tipo M en el dataset, lo que es consistente con la abundancia de enanas rojas en el universo. También se observa que los tipos espectrales más raros, como las estrellas de tipo O y DB, están poco representados, lo que refleja la distribución natural de las estrellas en el universo.
El análisis de la temperatura según el tipo espectral revela que las estrellas de tipos más fríos, como las de tipo K y M, tienen temperaturas de superficie más bajas, mientras que las estrellas más calientes pertenecen a los tipos O y B. Este comportamiento está alineado con la clasificación espectral que asocia temperaturas más altas con tipos espectrales más jóvenes y masivos.
En el conjunto de datos sobresalen dos grupos principales de estrellas, unas extremadamente brillantes (magnitud entre -5 y 0) y otras mucho más tenues (magnitud entre 10 y 15). Esto indica que el dataset incluye tanto estrellas gigantes brillantes como estrellas pequeñas y débiles, lo que proporciona un contraste interesante para realizar comparaciones entre diferentes tipos de estrellas.
El predominio de estrellas de tipo M en el dataset refleja la realidad del universo observable, donde las enanas rojas representan la mayoría de las estrellas, resaltando la importancia de estudiar este tipo de objetos astronómicos.