## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Descripción de los datos

El dataset o conjunto de datos msleep tiene información acerca sobre el comportamiento de sueño de varios animales mamíferos, tomando en cuenta tiempos y pesos de sueño actualizados que se obtuvieron de V. M. Savage y G. B. West. que son científicos reconocidos a nivel mundial en el ámbito de la biología teórica y la física aplicada a sistemas biológicos

Este dataset proviene del paquete ggplot2, y se basa de la publicacion en Proceedings of the National Academy of Sciences.

Referencia: Savage, V. M., & West, G. B. (2007). A quantitative, theoretical framework for understanding mammalian sleep. Proceedings of the National Academy of Sciences, 104(3), 1051-1056.

Plantilla de tabla resumen:

Variable Descripción
name Nombre comun del animal mamifero
genus Genero taxonomico al que pertenece el animal
vore Voracidad es decir si son carnivoros, omnivoros etc
order Categoria de clasificacion biologica (dada la data que se vio)
conservation Indicador del nivel de amenaza de extincion de cada especie
sleep_total Cantidad de horas totales de sueño
sleep_rem Cantidad de horas en fase del sueño mas intensos
sleep_cycle Duracion de horas del ciclo del sueño
awake Cantidad de horas que pasa despierto
brainwt Peso del cerebro del mamifero en kilogramos
bodywt Peso corporal del mamifero en kilogramos

Visualizaciones de datos

data("msleep")
g1 <- ggplot(msleep, aes(x = awake, y = sleep_total)) +
  geom_point(color = "blue") +
  scale_x_log10() +
  labs(title = "Relación entre horas despierto y horas de sueño",
       x = "Horas totales despierto",
       y = "Horas totales de sueño")

show(g1)

Dado que a nivel conceptual se contempla una relación entre horas despierto y horas de sueño, puede parecer una gráfica muy “sencilla”, pero realmente se comprueba con los datos la relación entre las variables “awake” y “sleep_total”, dada la fórmula → horas de sueño + horas despierto = 24.

Lo que buscamos es que los datos argumenten conceptos a nivel conceptual. A su vez, el gráfico de dispersión muestra esta relación inversamente proporcional entre las horas despierto y las horas de sueño en animales mamíferos. A medida que las horas despierto aumentan, las horas de sueño disminuyen, dado que el total de horas diarias es constante, siendo este número 24 horas, y no existe discrepancia en los datos, ya que no hay valores menores a 0 ni mayores a 24.

g2 <- ggplot(msleep, aes(x = vore)) +
  geom_bar(fill = "orange", color = "black") +
  geom_text(stat = "count", aes(label = ..count..), vjust = -0.3) +
  labs(title = "Distribución de tipos de dieta en mamíferos",
       x = "Tipo de dieta",
       y = "Número de especies")
show(g2)
## Warning: The dot-dot notation (`..count..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(count)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Este gráfico muestra la distribución de los tipos de dieta en las especies de mamíferos que existen en el conjunto de datos utilizado “msleep”. En el cual se observa que la mayoría de mamíferos estudiados son herbívoros (herbi) con un total de 32 especies, seguido así por los mamíferos omnívoros (omni) con 20 especies y los carnívoros (carni) con 19 especies en este dataset. Los insectívoros (insecti) son menos frecuentes, solamente con 5 especies registradas, y a su vez se contienen 7 especies de mamíferos de los cuales no se tiene información de su tipo de dieta esto puede deberse a que no se tomo esos datos, o esas especies se alimentan de distintas dientas lo cual es dificil poder mencionar a que conjunto de dieta pertenecen, y por lo cual se concluye que hay una representación alta de especies cuya alimentación es el consumo de plantas.

g3 <- ggplot(msleep, aes(x = sleep_total)) +
  geom_histogram(binwidth = 1, fill = "skyblue", color = "black") +
  labs(title = "Distribución de horas de sueño total",
       x = "Horas totales de sueño",
       y = "Número de especies")

show(g3)

Esta gráfica está dada mediante el uso de la variable “sleep_total”, la cual significa o corresponde a la cantidad total de horas de sueño por día de distintas especies de mamíferos. Esta se utiliza para poder visualizar la distribución de esta variable continua en todo el dataset.

La tendencia de los datos nos muestra que en su mayoría las especies duermen entre 8 y 12 horas diarias, con un pico de frecuencia alrededor de las 10 horas. También se puede ver que algunas especies duermen menos de 5 horas y otras más de 15 horas, aunque no es muy común. Igualmente, respetando que los datos son coherentes dado que no pasan más de 24 horas ni menos de 0, con esto se concluye que en general los animales mamíferos tienden a dormir de un tercio a la mitad del día.

g4 <- ggplot(msleep, aes(x = conservation)) +
  geom_bar(fill = "lightcoral", color = "black") +
  geom_text(stat = "count", aes(label = ..count..), vjust = -0.3) +
  labs(title = "Distribución del estado de conservación de especies",
       x = "Estado de conservación",
       y = "Número de especies")
show(g4)

La gráfica se basa en la variable “conservation”, la cual hace referencia a la conservación de las distintas especies de mamíferos registradas en el dataset. La gráfica de barras se utiliza para mostrar las especies contempladas en cada categoría.

La tendencia muestra que la mayoría de las especies están en “lc”, que indica preocupación menor, con 27 especies. También se observa un total de 10 especies domesticadas, mientras que las especies vulnerables (“vu”) y casi amenazadas (“nt”) presentan números más bajos, con 7 y 4 especies respectivamente para cada uno.

También, se contempla un número significativo de las especies que no tienen información registrada acerca de su conservación, por lo cual se puede concluir que la mayoría de mamíferos del dataset no están en un peligro crítico y se contempla una proporción importante de especies, pero llama la atención aquellas especies de las cuales no se tiene información.

msleep_not_null <- msleep %>% 
  filter(!is.na(bodywt), !is.na(brainwt), bodywt > 0, brainwt > 0)

g5 <- ggplot(msleep_not_null, aes(x = bodywt, y = brainwt)) +
  geom_point(color = "purple") +
  scale_x_log10() +
  scale_y_log10() +
  labs(title = "Relación entre peso corporal y peso del cerebro",
       x = "Peso corporal (kg, escala logarítmica)",
       y = "Peso del cerebro (kg, escala logarítmica)")

show(g5)

Esta gráfica pretende ver la relación entre las variables “bodywt”, que corresponde al peso corporal, y “brainwt”, que hace referencia al peso en kg del cerebro de las distintas especies de mamíferos. Se utilizó una escala logarítmica que permite visualizar mejor la gráfica, dado a la amplia variabilidad de pesos entre las especies.

La tendencia que se puede notar es que sí hay una relación positiva entre el peso corporal y el peso del cerebro, ya que a medida que aumenta el peso corporal, también tiende a aumentar el peso del cerebro, lo que permite comprobar y argumentar los conceptos lógicos. Aunque no es perfectamente lineal como en otra gráfica, se puede denotar un patrón que refuerza la idea general de que los mamíferos más grandes o más pesados tienden a tener cerebros más pesados y más grandes.

g6 <- ggplot(msleep, aes(x = genus)) +
  geom_bar(fill = "lightcoral", color = "black") +
  geom_text(stat = "count", aes(label = ..count..), vjust = -0.3) +
  labs(title = "Distribución del genero taxonomico de las especies",
       x = "Género Taxonomico ",
       y = "Número de especies")
show(g6)

Aquí se realizó una gráfica para poder utilizar la variable categórica del género taxonómico, que corresponde a cada especie de mamíferos en el dataset que hemos usado. El gráfico de barras se usó para visualizar cuántas especies pertenecen a cada género.

Dada la gráfica se puede denotar una tendencia que muestra que la mayoría de géneros taxonómicos registrados en el dataset tienen únicamente una especie asociada, lo que indica que existe una gran diversidad taxonómica sin mucha repetición de especies dentro del mismo género. Algunos géneros agrupan dos o tres especies, mostrando cierta concentración específica. Esta distribución refleja la diversidad de mamíferos que fueron estudiados.

g7 <- ggplot(msleep, aes(x = vore, y = sleep_total)) +
  geom_boxplot(fill = "lightblue") +
  labs(title = "Horas de sueño por tipo de dieta",
       x = "Tipo de dieta",
       y = "Horas totales de sueño")
show(g7)

Esta gráfica toma la variable “sleep_total”, que son las horas totales de sueño, comparándolas con la variable “vore”, que corresponde al tipo de dieta de cada especie de mamífero en el dataset que se está analizando. Se escogió un diagrama de caja para poder ver la distribución de horas dentro de cada categoría de dieta y así poder detectar patrones según la dieta.

La tendencia que se puede notar es que los insectívoros tienen un promedio más alto de horas de sueño comparado con otras especies de otro tipo de dieta, donde los carnívoros y herbívoros sí tienen una amplia variabilidad de las horas de sueño, mientras que los omnívoros muestran un rango más reducido, lo que nos indica que generalmente duermen menos horas.

Y podemos concluir que las comparaciones nos indican que puede haber cierta influencia en el patrón de sueño dada la dieta de las especies de mamíferos.

g8 <- ggplot(msleep, aes(x = awake)) +
  geom_histogram(binwidth = 1, fill = "pink", color = "black") +
  labs(title = "Distribución de horas despierto",
       x = "Horas despierto",
       y = "Número de especies")
show(g8)

Este gráfico utiliza la variable “awake”, que corresponde al número de horas que la especie mamífera pasa despierta durante el día, y la gráfica se utiliza para poder ver la distribución de esta variable continua en el dataset.

Los datos nos dan a denotar una tendencia en que la mayoría de especies permanecen despiertas entre 12 y 16 horas, lo cual es acertado dado que las horas de sueño nos indicaban que pasaban de 8 a 12 horas durmiendo, así que los datos nos siguen comprobando esa relación. También podemos ver que algunas especies permanecen despiertas menos de 8 horas y otras pueden estar despiertas hasta 22 horas.

Dada la gráfica podemos concluir que los mamíferos tienen la tendencia a pasar más de la mitad del día despiertos o activos, aunque sí existe una pequeña variabilidad a considerar entre las diferentes especies.

domesticados <- msleep %>% filter(conservation == "domesticated")

g9 <- ggplot(domesticados, aes(x = name)) +
  geom_bar(fill = "violet", color = "black") +
  theme(axis.text.x = element_text(angle = 90, hjust = 1)) +
  labs(title = "Especies domesticadas registradas",
       x = "Nombre común",
       y = "Número de registros")
show(g9)

Esta gráfica presenta ver las especies de mamíferos que han sido ya clasificadas como domesticadas dentro del dataset que se está estudiando. El gráfico muestra cuántos registros existen por cada especie domesticada, lo cual indica que por cada especie solo hay uno, así que no hay valores repetidos.

La gráfica nos permite denotar lo anteriormente dicho: que cada especie domesticada tiene exactamente un registro, lo cual refleja que nuestro dataset no tiene repetidos y así se podría ver por cada especie. Además, podemos ver, dada la gráfica, que existe una variedad de mamíferos domesticados y que se documenta de manera única.

g10 <- ggplot(msleep %>% filter(!is.na(sleep_cycle), !is.na(sleep_rem)), 
              aes(x = sleep_cycle, y = sleep_rem)) +
  geom_point(color = "orange") +
  labs(title = "Relación entre duración del ciclo de sueño y horas REM",
       x = "Duración del ciclo de sueño (horas)",
       y = "Horas de sueño REM")
show(g10)

Esta gráfica nos permite ver la relación entre la variable “sleep_cycle”, que contempla la duración del ciclo del sueño en horas, y la variable “sleep_rem”, que corresponde a la cantidad de horas de sueño REM o las horas de sueño más intensas o de mayor profundidad para las diferentes especies de mamíferos registradas en el dataset que estamos analizando.

La gráfica nos permite ver que realmente no existe una relación lineal entre la duración del ciclo del sueño y las horas de sueño REM, aunque se observa que las especies con ciclos de sueño más cortos tienden a acumular un mayor número de horas de sueño REM. Esto nos hace concluir que los mamíferos con ciclos más breves o cortos experimentan periodos frecuentes de sueño REM a lo largo del día.