library(readxl) TV_and_movie_habits <- read_xlsx (“C:/Users/USUARIO/Desktop/TV and movie habits.xlsx”)

library(readxl)
TV_and_movie_habits <- read_xlsx("C:/Users/USUARIO/Desktop/TV and movie habits.xlsx")

#Taller 1 - TV and Movie Habits

Para clasificar las variables con el esquema visto en clase:

library(tidyverse)

str(TV_and_movie_habits)
## tibble [25 × 5] (S3: tbl_df/tbl/data.frame)
##  $ id             : num [1:25] 1 2 3 4 5 6 7 8 9 10 ...
##  $ Tv Source      : chr [1:25] "Hulu Plus" "Amazon Prime" "Hulu Plus" "Netflix" ...
##  $ Hours per week : num [1:25] 14 18 20 5 12 10 8 7 24 30 ...
##  $ Binge Frequency: chr [1:25] "Not at all" "Sometimes" "Frequently" "Frequently" ...
##  $ Sex            : chr [1:25] "Male" "Female" "Female" "Male" ...
#### id: Variable cualitativa (categórica), nominal
#### TV Source: Variable cualtivativa (categórica), nominal
#### Hours per week: Variable numérica, continua de razón
#### Binge frequency: Variable cualitativa (categórica), ordinal
#### Sex: Variable cualitativa (categórica), binaria

Representación gráfica de las variables “Tv source”, “binge frequency”, “sex”:

Gráfico circular - Pie Chart para la variable “sex”

Primero debo conocer la cantidad de hombres y mujeres en la variable “sex”

table(TV_and_movie_habits$Sex)
## 
## Female   Male 
##     13     12
Hay 13 mujeres y 12 hombres
porcentaje <- c (52,48)
etiqueta <- paste( porcentaje, "%", sep = "")
colores <- c ("pink","blue")
pie (porcentaje, labels = etiqueta, clockwise = TRUE, col = colores, main = "Sexo de los participantes")
legend ("topright", c("female", "male"), cex = 0.5, fill = colores)

En el gráfico de pastel titulado como “Sexo de los participantes” se puede observar como, del total de participantes en la base de datos “Tv_and_movie_habits”, el 48% son hombres y el 52% son mujeres.

table(TV_and_movie_habits$`Binge Frequency`)
## 
## Frequently Not at all  Sometimes 
##         11          2         12
#Gráfico diagrama de barras

Eje_Y <- c (12,11,2)
Eje_X <- c ("Sometimes","Frequently", "Not at all")
barplot (Eje_Y, xlab = "Frecuencia de atracones compulsivos de series de TV o películas", ylab = "Frecuencia", main = "Diagrama de barras - Atracones de series de TV o películas", names.arg = Eje_X, col = "orange", border = "brown")

El diagrama de barras titulado como “Atracones de series de TV o películas” muestra como la moda entre los encuestados estuvo en la categoría “Sometimes” donde 12 individuos tuvieron una frecuencia de atracones de series de TV o películas clasificada como “Sometimes - a veces”, seguido de 11 individuos que tuvieron una frecuencia “Frequently - frecuente” y finalmente se muestran 2 individuos que tuvieron una frecuencia “not at all”, es decir, no consumían este tipo de contenido.

table(TV_and_movie_habits$`Tv Source`)
## 
## Amazon Prime        Cable    Hulu Plus       iTunes      Netflix 
##            3            2            3            9            8
porcentajess <- c (12,8,12,36,32)
etiqueta <- paste (porcentajess, "%", sep = "")
colores <- c ("lightblue", "lightgrey", "lightyellow","lightgreen","white")
pie (porcentajess, labels = etiqueta, clockwise = TRUE, col = colores, main = "Plataformas de streaming populares")
legend ("topright", c("Amazon Prime", "Cable", "Hulu Plus", "Itunes", "Netflix"), cex = 0.5, fill = colores)

Recorganizar la variable “hours per week” por “hours per week groups” - hacer grupos

1. Lo llamo la tabla para conocer los valores que toma la variable y definir así los grupos en los que voy a recodificar la variable

table(TV_and_movie_habits$`Hours per week`)
## 
##  2  5  7  8 10 12 13 14 15 17 18 19 20 21 22 23 24 30 
##  1  1  1  2  3  2  1  3  1  1  2  1  1  1  1  1  1  1

2. Defino los nuevos grupos en los cuales voy a recodificar la variable, creando una nueva variable

La variable hoursperweek_new se convierte en un indice de riesgo de salud mental para el individuo, donde tener mas de 16 horas semanales consumidas en series de tv o peliculas se considera un riesgo para la salud mental, mientras que, menos de 16 horas semanales consumidas en este contenido no se considera un riesgo para la salud mental.

TV_and_movie_habits$hoursperweek_new <- ifelse(TV_and_movie_habits$`Hours per week` >= 16, 1, 0)
table(TV_and_movie_habits$hoursperweek_new)
## 
##  0  1 
## 15 10

Poner etiquetas a los valores de una variable categórica como “Hoursperweek_new”

TV_and_movie_habits$hours_per_week_new_label <- factor(TV_and_movie_habits$hoursperweek_new, labels = c("no","yes"))
table (TV_and_movie_habits$hours_per_week_new_label)
## 
##  no yes 
##  15  10
# Gráfico diagrama de barras
Eje_Y <- c (15,10)
Eje_X <- c ("No hay riesgo","Riesgo")
barplot (Eje_Y, xlab = "Índice de salud mental", ylab = "Frecuencia", main = "Diagrama de barras - Riesgo para la salud mental", names.arg = Eje_X, col = "Gray", border = "red")
legend ("topright", c("Riesgo = pantallas >16h", "No riesgo = pantallas <16h"), cex = 0.5)

En esta gráfica de barras, titulada “Riesgo para la salud mental”, se puede evidenciar como 10 individuos tuvieron riesgo para la salud mental asociado a una exposición a pantallas mayor a 16 horas por semana mientras que, la moda estuvo en no tener riesgo para la salud mental debido a una menor exposición a pantallas, inferior a 16 horas por semana en 15 individuos.