Avance 2

María Isabel Solis Gonzales

Nicolle Stheyzy Ureña García

Valerie Marmolejo Molina

Hanna Lozano Orozco

Luis Alberto Cabrales Lampis

Punto 1

1.1 No es posible realizarlo debido a que el grupo de datos solo presenta una variable cuantitativa.

1.2

Diagramas de cajas

datosprobabilidad = read.table("datosprobabilidad.csv",header=TRUE,
sep=",", dec=".", stringsAsFactors = TRUE)

library(ggplot2)
ggplot(datosprobabilidad, aes(y=Edad, x=Uso, fill=Uso))+
  geom_boxplot() +
  labs(
    title = "Uso vs Edad",
    x = "Uso",
    y = "Edad (en años)",
    fill = "Distracción"
  )

Interpretacion

En este diagrama de caja Uso vs Edad, se puede observar que para la variable “No”, la mediana es más alta que para la variable “Yes”, lo que implica que las personas de mayor edad presentan menor uso de las redes sociales en comparación con las personas jóvenes. Por tal razón, se puede apreciar una distribución inversamente proporcional. Además de esto, la variable “No” tiene una mayor varianza que la variable “Yes”. Por otra parte, la variable “Yes” presenta una gran cantidad de datos atípicos, mientras que la variable “No” no presenta datos atípicos.

datosprobabilidad = read.table("datosprobabilidad.csv",header=TRUE,
sep=",", dec=".", stringsAsFactors = TRUE)

library(ggplot2)
ggplot(datosprobabilidad, aes(y=Edad, x=factor (Distracción), fill=factor (Distracción)))+
  geom_boxplot() +
  labs(
    title = "Distracción vs Edad",
    x = "Escala de Distracción (1 = poca, 5 = alta)",
    y = "Edad (en años)",
    fill = "Distracción"
  )

Interpretación

Este es un diagrama de cajas que analiza la relación entre dos variables de nuestra investigación. Se observa que, a medida que el rango de nivel de distracción aumenta (de 1 a 5), las edades tienden a concentrarse más en un rango específico, especialmente en los jóvenes. Los niveles más bajos de distracción muestran una mayor dispersión en la edad, incluyendo tanto jóvenes como adultos, mientras que en los niveles más altos (4 y 5) la distribución es más homogénea y se aproxima más a un rango definido. Esto sugiere una posible relación inversa entre la edad y el nivel de distracción, donde los individuos de menor edad tienden a presentar mayores niveles de distracción.

datosprobabilidad = read.table("datosprobabilidad.csv",header=TRUE,
sep=",", dec=".", stringsAsFactors = TRUE)

library(ggplot2)

ggplot(datosprobabilidad, aes(x = factor(Inquietud), y = Edad, fill = factor(Inquietud))) +
  geom_boxplot() +
  labs(
    title = "Inquietud vs Edad",
    x = "Escala de Inquietud (1 = poca, 5 = alta)",
    y = "Edad (en años)",
    fill = "Inquietud"
  )

Interpretación

De este diagrama de cajas se onserva que las personas que reportan menor inquietud al no usar redes sociales (escala 1) tienden a tener una edad significativamente mayor, con una mediana cercana a los 30 años y una gran dispersión que incluye adultos mayores.

En contraste, aquellos que se ubican en las escalas más altas de inquietud (4 y 5) presentan una edad mediana más baja, aproximadamente entre 20 y 22 años, y una distribución de edad más concentrada.

Esto sugiere que los jóvenes son más propensos a experimentar inquietud cuando no utilizan redes sociales, mientras que los adultos mayores tienden a sentir menos inquietud en estas circunstancias.

datosprobabilidad = read.table("datosprobabilidad.csv",header=TRUE,
sep=",", dec=".", stringsAsFactors = TRUE)

library(ggplot2)
ggplot(datosprobabilidad, aes(y=Edad, x=factor (Depresión), fill= factor (Depresión)))+
  geom_boxplot()+
  labs(
    title = "Depresion vs Edad",
    x = "Escala de Depresion (1 = poca, 5 = alta)",
    y = "Edad (en años)",
    fill = "Depresion"
  )

Interpretación

En el gráfico se puede observar que, desde el gráfico 3 hasta el 5, la mediana no supera los 25 años, lo que permite entender que, entre más jóvenes sean las personas, mayor riesgo existe de tener depresión. Aunque tiene sus excepciones debido a la cantidad de datos atípicos presentes en los tres gráficos.

En el caso de los diagramas 1 y 2, los datos son más dispersos; sin embargo, al haber personas de mayor edad y datos más dispersos, se puede interpretar que, entre más edad tenga la persona, menor riesgo de depresión presenta. Se puede observar que en los gráficos 1 y 2 no hay datos atípicos que sean mayores o menores al valor máximo o mínimo. Por otra parte, en el gráfico 1 se observa que es el de mayor mediana, mientras que el de menor mediana se encuentra entre los gráficos 3 y 5. De igual forma, los gráficos 1 y 2 no presentan datos atípicos.

datosprobabilidad = read.table("datosprobabilidad.csv",header=TRUE,
sep=",", dec=".", stringsAsFactors = TRUE)

library(ggplot2)
ggplot(datosprobabilidad, aes(y=Edad, x=factor (Sueño), fill=factor (Sueño)))+ geom_boxplot() +
  labs(
    title = "Sueño vs Edad",
    x = "Escala de Sueño (1 = poca, 5 = alta)",
    y = "Edad (en años)",
    fill = "Sueño"
  )

Interpretación

En el gráfico “Sueño vs Edad” se observa que el gráfico 1 presenta la mayor dispersión, indicando que el impacto de las redes sociales en el sueño varía ampliamente entre distintas edades. Por el contrario, el gráfico 3 muestra la menor dispersión, lo que sugiere que las edades de las personas afectadas en esa escala son más similares. La mediana más alta se presenta en el gráfico 1, lo que implica que las personas de mayor edad reportan un menor impacto de las redes sociales en su sueño, mientras que las medianas más bajas, visibles en los gráficos 3, 4 y 5, indican que los jóvenes tienden a verse más afectados. Además, todos los gráficos presentan datos atípicos, especialmente los gráficos 1, 2, 4 y 5.

1.3

Tabla cruzada

Frecuencia absoluta

En la siguiente tabla cruzada se observan los datos de las variables de Tiempo de uso vs. Distracción en términos de frecuencia

table(datosprobabilidad$Tiempo, datosprobabilidad$`Distracción`)
##                        
##                          1  2  3  4  5
##   Between 1 and 2 hours  7 12 34 13  4
##   Between 2 and 3 hours  5 17 40 20 19
##   Between 3 and 4 hours  3 16 32 18 24
##   Between 4 and 5 hours  2  7 21 20 17
##   Less than an Hour     13 11  7  1  2
##   More than 5 hours      3 14 27 37 35

Porcentaje

En la siguiente tabla cruzada se observan los datos de las mismas variables de Tiempo de uso vs. Distracción en términos de probabilidad

round(prop.table(table(datosprobabilidad$Tiempo, datosprobabilidad$Distracción)) * 100, 2)
##                        
##                            1    2    3    4    5
##   Between 1 and 2 hours 1.46 2.49 7.07 2.70 0.83
##   Between 2 and 3 hours 1.04 3.53 8.32 4.16 3.95
##   Between 3 and 4 hours 0.62 3.33 6.65 3.74 4.99
##   Between 4 and 5 hours 0.42 1.46 4.37 4.16 3.53
##   Less than an Hour     2.70 2.29 1.46 0.21 0.42
##   More than 5 hours     0.62 2.91 5.61 7.69 7.28

Grafica

En la siguiente gráfica se observan el diagrama de frecuencias Tiempo de uso vs. Distracción

library(ggplot2)
ggplot(
  datosprobabilidad,
  aes(
    x = factor(
      Tiempo,
      levels = c(
        "Less than an Hour",
        "Between 1 and 2 hours",
        "Between 2 and 3 hours",

        "Between 4 and 5 hours",
        "More than 5 hours"
      )
    ),
    fill = factor(Distracción)
  )
) +  
  geom_bar() +
  labs(
    title = "Frecuencia de Tiempo de uso vs Distracción",
    x = "Tiempo de uso en redes sociales",
    y = "Distracción",
    fill = "Distracción"
  ) +
  theme_linedraw() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))

Interpretacion

De esta gráfica primero podemos observar que son pocas las personas que están en el teléfono por menos de una hora, pero estas a su vez, se observa que son las que presentan menor distracción, lo cual se nota en el color naranja. Además a medida que aumenta el tiempo de uso (a excepción del intervalo de 4 a 5 horas) aumenta también el nivel de distracción 5. Por lo que podemos concluir que entre más uso de redes sociales presentan las personas, mayor es la tendencia a distraerse y a volver a usarlas.

Frecuencia absoluta

En la siguiente tabla cruzada se observan los datos de las variables de Tiempo de uso vs. Sueño en términos de frecuencia

table(datosprobabilidad$Tiempo, datosprobabilidad$Sueño)
##                        
##                          1  2  3  4  5
##   Between 1 and 2 hours 19 13  9 16 13
##   Between 2 and 3 hours 16 24 12 30 19
##   Between 3 and 4 hours 11 21 17 19 25
##   Between 4 and 5 hours  8 12 10 15 22
##   Less than an Hour     13  6  4  5  6
##   More than 5 hours     19 15 17 25 40

Porcentaje

En la siguiente tabla cruzada se observan los datos de las mismas variables de Tiempo de uso vs. Sueño en términos de probabilidad

round(prop.table(table(datosprobabilidad$Tiempo, datosprobabilidad$Sueño)) * 100, 2)
##                        
##                            1    2    3    4    5
##   Between 1 and 2 hours 3.95 2.70 1.87 3.33 2.70
##   Between 2 and 3 hours 3.33 4.99 2.49 6.24 3.95
##   Between 3 and 4 hours 2.29 4.37 3.53 3.95 5.20
##   Between 4 and 5 hours 1.66 2.49 2.08 3.12 4.57
##   Less than an Hour     2.70 1.25 0.83 1.04 1.25
##   More than 5 hours     3.95 3.12 3.53 5.20 8.32

Grafica

En la siguiente gráfica se observan el diagrama de frecuencias Tiempo de uso vs. Sueño

ggplot(
  datosprobabilidad,
  aes(
    x = factor(
      Tiempo,
      levels = c(
        "Less than an Hour",
        "Between 1 and 2 hours",
        "Between 2 and 3 hours",
        "Between 3 and 4 hours",
        "Between 4 and 5 hours",
        "More than 5 hours"
      )
    ),
    fill = factor(Sueño)
  )
) +  
  geom_bar() +
  labs(
    title = "Frecuencia de Tiempo de uso vs Sueño",
    x = "Tiempo de uso en redes sociales",
    y = "Sueño",
    fill = "Sueño"
  ) +
  theme_linedraw() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))

Interpretacion

De manera similar, podemos observar de esta gráfica que el nivel de sueño número 5 (es decir el nivel que indica que las personas tienen problemas para dormir frecuentemente) aumenta a medida que las horas del tiempo de uso de redes sociales también incrementan. Esto se evidencia en el color rosado de cada barra. Mientras que los otros niveles de sueño se mantienen constantes (3), o son variantes (1). Se puede concluir entonces que hay una relación debido a que el uso en exceso de redes sociales, contribuye a la poca calidad de sueño, sin embargo no hay una relación para el poco uso con el sueño de las personas encuestadas.

Frecuencia absoluta

En la siguiente tabla cruzada se observan los datos de las variables de Tiempo de uso vs. Inquietud en términos de frecuencia

table(datosprobabilidad$Tiempo, datosprobabilidad$Inquietud) 
##                        
##                          1  2  3  4  5
##   Between 1 and 2 hours 32 22 12  4  0
##   Between 2 and 3 hours 16 32 32 16  5
##   Between 3 and 4 hours 23 23 23 14 10
##   Between 4 and 5 hours  6 24 19 11  7
##   Less than an Hour     25  5  4  0  0
##   More than 5 hours     15 18 34 27 22

Porcentaje

En la siguiente tabla cruzada se observan los datos de las mismas variables de Tiempo de uso vs. Inquietud en términos de probabilidad

round(prop.table(table(datosprobabilidad$Tiempo, datosprobabilidad$Inquietud)) * 100, 2)
##                        
##                            1    2    3    4    5
##   Between 1 and 2 hours 6.65 4.57 2.49 0.83 0.00
##   Between 2 and 3 hours 3.33 6.65 6.65 3.33 1.04
##   Between 3 and 4 hours 4.78 4.78 4.78 2.91 2.08
##   Between 4 and 5 hours 1.25 4.99 3.95 2.29 1.46
##   Less than an Hour     5.20 1.04 0.83 0.00 0.00
##   More than 5 hours     3.12 3.74 7.07 5.61 4.57

Grafica

En la siguiente gráfica se observan el diagrama de frecuencias Tiempo de uso vs. Inquietud

ggplot(
  datosprobabilidad,
  aes(
    x = factor(
      Tiempo,
      levels = c(
        "Less than an Hour",
        "Between 1 and 2 hours",
        "Between 2 and 3 hours",
        "Between 3 and 4 hours",
        "Between 4 and 5 hours",
        "More than 5 hours"
      )
   ),
    fill = factor(Inquietud)
  )
) +  
  geom_bar() +
  labs(
    title = "Frecuencia de Tiempo de uso vs Inquietud",
    x = "Tiempo de uso en redes sociales",
    y = "Inquietud",
    fill = "Inquietud"
  ) +
  theme_linedraw() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))

Interpretacion

En esta gráfica, al igual que en las anteriores, se puede ver una relación entre las variables de la muestra de investigación. Asimismo, el uso de redes sociales con más frecuencia está enlazado con una mayor presencia de inquietud moderada y alta, lo que significa que un factor de uso excesivo en redes sociales se da a partir de la frecuente inquietud que se da al no poder usarlas. Aunque la inquietud baja (de nivel 1), es frecuente en todos los grupos, esta aumenta cuando el uso de redes sociales supera las 3 horas diarias. Lo cual nos permite concluir que el uso excesivo de redes sociales incrementa la inquietud emocional o psicológica.

Punto 2

No es posible realizar dado que el conjunto de datos no cambia a lo largo del tiempo.