María Isabel Solis Gonzales
Nicolle Stheyzy Ureña García
Valerie Marmolejo Molina
Hanna Lozano Orozco
Luis Alberto Cabrales Lampis
1.1 No es posible realizarlo debido a que el grupo de datos solo presenta una variable cuantitativa.
1.2
datosprobabilidad = read.table("datosprobabilidad.csv",header=TRUE,
sep=",", dec=".", stringsAsFactors = TRUE)
library(ggplot2)
ggplot(datosprobabilidad, aes(y=Edad, x=Uso, fill=Uso))+
geom_boxplot() +
labs(
title = "Uso vs Edad",
x = "Uso",
y = "Edad (en años)",
fill = "Distracción"
)
En este diagrama de caja Uso vs Edad, se puede observar que para la variable “No”, la mediana es más alta que para la variable “Yes”, lo que implica que las personas de mayor edad presentan menor uso de las redes sociales en comparación con las personas jóvenes. Por tal razón, se puede apreciar una distribución inversamente proporcional. Además de esto, la variable “No” tiene una mayor varianza que la variable “Yes”. Por otra parte, la variable “Yes” presenta una gran cantidad de datos atípicos, mientras que la variable “No” no presenta datos atípicos.
datosprobabilidad = read.table("datosprobabilidad.csv",header=TRUE,
sep=",", dec=".", stringsAsFactors = TRUE)
library(ggplot2)
ggplot(datosprobabilidad, aes(y=Edad, x=factor (Distracción), fill=factor (Distracción)))+
geom_boxplot() +
labs(
title = "Distracción vs Edad",
x = "Escala de Distracción (1 = poca, 5 = alta)",
y = "Edad (en años)",
fill = "Distracción"
)
Este es un diagrama de cajas que analiza la relación entre dos variables de nuestra investigación. Se observa que, a medida que el rango de nivel de distracción aumenta (de 1 a 5), las edades tienden a concentrarse más en un rango específico, especialmente en los jóvenes. Los niveles más bajos de distracción muestran una mayor dispersión en la edad, incluyendo tanto jóvenes como adultos, mientras que en los niveles más altos (4 y 5) la distribución es más homogénea y se aproxima más a un rango definido. Esto sugiere una posible relación inversa entre la edad y el nivel de distracción, donde los individuos de menor edad tienden a presentar mayores niveles de distracción.
datosprobabilidad = read.table("datosprobabilidad.csv",header=TRUE,
sep=",", dec=".", stringsAsFactors = TRUE)
library(ggplot2)
ggplot(datosprobabilidad, aes(x = factor(Inquietud), y = Edad, fill = factor(Inquietud))) +
geom_boxplot() +
labs(
title = "Inquietud vs Edad",
x = "Escala de Inquietud (1 = poca, 5 = alta)",
y = "Edad (en años)",
fill = "Inquietud"
)
De este diagrama de cajas se onserva que las personas que reportan menor inquietud al no usar redes sociales (escala 1) tienden a tener una edad significativamente mayor, con una mediana cercana a los 30 años y una gran dispersión que incluye adultos mayores.
En contraste, aquellos que se ubican en las escalas más altas de inquietud (4 y 5) presentan una edad mediana más baja, aproximadamente entre 20 y 22 años, y una distribución de edad más concentrada.
Esto sugiere que los jóvenes son más propensos a experimentar inquietud cuando no utilizan redes sociales, mientras que los adultos mayores tienden a sentir menos inquietud en estas circunstancias.
datosprobabilidad = read.table("datosprobabilidad.csv",header=TRUE,
sep=",", dec=".", stringsAsFactors = TRUE)
library(ggplot2)
ggplot(datosprobabilidad, aes(y=Edad, x=factor (Depresión), fill= factor (Depresión)))+
geom_boxplot()+
labs(
title = "Depresion vs Edad",
x = "Escala de Depresion (1 = poca, 5 = alta)",
y = "Edad (en años)",
fill = "Depresion"
)
En el gráfico se puede observar que, desde el gráfico 3 hasta el 5, la mediana no supera los 25 años, lo que permite entender que, entre más jóvenes sean las personas, mayor riesgo existe de tener depresión. Aunque tiene sus excepciones debido a la cantidad de datos atípicos presentes en los tres gráficos.
En el caso de los diagramas 1 y 2, los datos son más dispersos; sin embargo, al haber personas de mayor edad y datos más dispersos, se puede interpretar que, entre más edad tenga la persona, menor riesgo de depresión presenta. Se puede observar que en los gráficos 1 y 2 no hay datos atípicos que sean mayores o menores al valor máximo o mínimo. Por otra parte, en el gráfico 1 se observa que es el de mayor mediana, mientras que el de menor mediana se encuentra entre los gráficos 3 y 5. De igual forma, los gráficos 1 y 2 no presentan datos atípicos.
datosprobabilidad = read.table("datosprobabilidad.csv",header=TRUE,
sep=",", dec=".", stringsAsFactors = TRUE)
library(ggplot2)
ggplot(datosprobabilidad, aes(y=Edad, x=factor (Sueño), fill=factor (Sueño)))+ geom_boxplot() +
labs(
title = "Sueño vs Edad",
x = "Escala de Sueño (1 = poca, 5 = alta)",
y = "Edad (en años)",
fill = "Sueño"
)
En el gráfico “Sueño vs Edad” se observa que el gráfico 1 presenta la mayor dispersión, indicando que el impacto de las redes sociales en el sueño varía ampliamente entre distintas edades. Por el contrario, el gráfico 3 muestra la menor dispersión, lo que sugiere que las edades de las personas afectadas en esa escala son más similares. La mediana más alta se presenta en el gráfico 1, lo que implica que las personas de mayor edad reportan un menor impacto de las redes sociales en su sueño, mientras que las medianas más bajas, visibles en los gráficos 3, 4 y 5, indican que los jóvenes tienden a verse más afectados. Además, todos los gráficos presentan datos atípicos, especialmente los gráficos 1, 2, 4 y 5.
1.3
En la siguiente tabla cruzada se observan los datos de las variables de Tiempo de uso vs. Distracción en términos de frecuencia
table(datosprobabilidad$Tiempo, datosprobabilidad$`Distracción`)
##
## 1 2 3 4 5
## Between 1 and 2 hours 7 12 34 13 4
## Between 2 and 3 hours 5 17 40 20 19
## Between 3 and 4 hours 3 16 32 18 24
## Between 4 and 5 hours 2 7 21 20 17
## Less than an Hour 13 11 7 1 2
## More than 5 hours 3 14 27 37 35
En la siguiente tabla cruzada se observan los datos de las mismas variables de Tiempo de uso vs. Distracción en términos de probabilidad
round(prop.table(table(datosprobabilidad$Tiempo, datosprobabilidad$Distracción)) * 100, 2)
##
## 1 2 3 4 5
## Between 1 and 2 hours 1.46 2.49 7.07 2.70 0.83
## Between 2 and 3 hours 1.04 3.53 8.32 4.16 3.95
## Between 3 and 4 hours 0.62 3.33 6.65 3.74 4.99
## Between 4 and 5 hours 0.42 1.46 4.37 4.16 3.53
## Less than an Hour 2.70 2.29 1.46 0.21 0.42
## More than 5 hours 0.62 2.91 5.61 7.69 7.28
En la siguiente gráfica se observan el diagrama de frecuencias Tiempo de uso vs. Distracción
library(ggplot2)
ggplot(
datosprobabilidad,
aes(
x = factor(
Tiempo,
levels = c(
"Less than an Hour",
"Between 1 and 2 hours",
"Between 2 and 3 hours",
"Between 4 and 5 hours",
"More than 5 hours"
)
),
fill = factor(Distracción)
)
) +
geom_bar() +
labs(
title = "Frecuencia de Tiempo de uso vs Distracción",
x = "Tiempo de uso en redes sociales",
y = "Distracción",
fill = "Distracción"
) +
theme_linedraw() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
De esta gráfica primero podemos observar que son pocas las personas que están en el teléfono por menos de una hora, pero estas a su vez, se observa que son las que presentan menor distracción, lo cual se nota en el color naranja. Además a medida que aumenta el tiempo de uso (a excepción del intervalo de 4 a 5 horas) aumenta también el nivel de distracción 5. Por lo que podemos concluir que entre más uso de redes sociales presentan las personas, mayor es la tendencia a distraerse y a volver a usarlas.
En la siguiente tabla cruzada se observan los datos de las variables de Tiempo de uso vs. Sueño en términos de frecuencia
table(datosprobabilidad$Tiempo, datosprobabilidad$Sueño)
##
## 1 2 3 4 5
## Between 1 and 2 hours 19 13 9 16 13
## Between 2 and 3 hours 16 24 12 30 19
## Between 3 and 4 hours 11 21 17 19 25
## Between 4 and 5 hours 8 12 10 15 22
## Less than an Hour 13 6 4 5 6
## More than 5 hours 19 15 17 25 40
En la siguiente tabla cruzada se observan los datos de las mismas variables de Tiempo de uso vs. Sueño en términos de probabilidad
round(prop.table(table(datosprobabilidad$Tiempo, datosprobabilidad$Sueño)) * 100, 2)
##
## 1 2 3 4 5
## Between 1 and 2 hours 3.95 2.70 1.87 3.33 2.70
## Between 2 and 3 hours 3.33 4.99 2.49 6.24 3.95
## Between 3 and 4 hours 2.29 4.37 3.53 3.95 5.20
## Between 4 and 5 hours 1.66 2.49 2.08 3.12 4.57
## Less than an Hour 2.70 1.25 0.83 1.04 1.25
## More than 5 hours 3.95 3.12 3.53 5.20 8.32
En la siguiente gráfica se observan el diagrama de frecuencias Tiempo de uso vs. Sueño
ggplot(
datosprobabilidad,
aes(
x = factor(
Tiempo,
levels = c(
"Less than an Hour",
"Between 1 and 2 hours",
"Between 2 and 3 hours",
"Between 3 and 4 hours",
"Between 4 and 5 hours",
"More than 5 hours"
)
),
fill = factor(Sueño)
)
) +
geom_bar() +
labs(
title = "Frecuencia de Tiempo de uso vs Sueño",
x = "Tiempo de uso en redes sociales",
y = "Sueño",
fill = "Sueño"
) +
theme_linedraw() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
De manera similar, podemos observar de esta gráfica que el nivel de sueño número 5 (es decir el nivel que indica que las personas tienen problemas para dormir frecuentemente) aumenta a medida que las horas del tiempo de uso de redes sociales también incrementan. Esto se evidencia en el color rosado de cada barra. Mientras que los otros niveles de sueño se mantienen constantes (3), o son variantes (1). Se puede concluir entonces que hay una relación debido a que el uso en exceso de redes sociales, contribuye a la poca calidad de sueño, sin embargo no hay una relación para el poco uso con el sueño de las personas encuestadas.
En la siguiente tabla cruzada se observan los datos de las variables de Tiempo de uso vs. Inquietud en términos de frecuencia
table(datosprobabilidad$Tiempo, datosprobabilidad$Inquietud)
##
## 1 2 3 4 5
## Between 1 and 2 hours 32 22 12 4 0
## Between 2 and 3 hours 16 32 32 16 5
## Between 3 and 4 hours 23 23 23 14 10
## Between 4 and 5 hours 6 24 19 11 7
## Less than an Hour 25 5 4 0 0
## More than 5 hours 15 18 34 27 22
En la siguiente tabla cruzada se observan los datos de las mismas variables de Tiempo de uso vs. Inquietud en términos de probabilidad
round(prop.table(table(datosprobabilidad$Tiempo, datosprobabilidad$Inquietud)) * 100, 2)
##
## 1 2 3 4 5
## Between 1 and 2 hours 6.65 4.57 2.49 0.83 0.00
## Between 2 and 3 hours 3.33 6.65 6.65 3.33 1.04
## Between 3 and 4 hours 4.78 4.78 4.78 2.91 2.08
## Between 4 and 5 hours 1.25 4.99 3.95 2.29 1.46
## Less than an Hour 5.20 1.04 0.83 0.00 0.00
## More than 5 hours 3.12 3.74 7.07 5.61 4.57
En la siguiente gráfica se observan el diagrama de frecuencias Tiempo de uso vs. Inquietud
ggplot(
datosprobabilidad,
aes(
x = factor(
Tiempo,
levels = c(
"Less than an Hour",
"Between 1 and 2 hours",
"Between 2 and 3 hours",
"Between 3 and 4 hours",
"Between 4 and 5 hours",
"More than 5 hours"
)
),
fill = factor(Inquietud)
)
) +
geom_bar() +
labs(
title = "Frecuencia de Tiempo de uso vs Inquietud",
x = "Tiempo de uso en redes sociales",
y = "Inquietud",
fill = "Inquietud"
) +
theme_linedraw() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
En esta gráfica, al igual que en las anteriores, se puede ver una relación entre las variables de la muestra de investigación. Asimismo, el uso de redes sociales con más frecuencia está enlazado con una mayor presencia de inquietud moderada y alta, lo que significa que un factor de uso excesivo en redes sociales se da a partir de la frecuente inquietud que se da al no poder usarlas. Aunque la inquietud baja (de nivel 1), es frecuente en todos los grupos, esta aumenta cuando el uso de redes sociales supera las 3 horas diarias. Lo cual nos permite concluir que el uso excesivo de redes sociales incrementa la inquietud emocional o psicológica.
No es posible realizar dado que el conjunto de datos no cambia a lo largo del tiempo.