Datos

P3: Tercera entrega

Curso: Estadística y Probabilidades

Teoría: 2.01

Profesora: Brígida Molina Carabaño

Ciclo: 2021-2

Integrantes:

Integrantes Código Participación
Luna Ventocilla, Brighite Sefora 201910392 100%
Perez Laura, Beatriz 201810218 100%
Ticse Osorio, Kevin Williams 201310284 100%
Rodrigo Alexander Cuya Chaña 201910135 100%

CONTENIDO

DESCRIPCIÓN

1. Introducción

Con la coyuntura actual, los servicios de streaming nos han permitido pasar el tiempo de manera más conforme; por lo que buscamos encuestar a universitarios para cuantificar el tiempo en el que pasan en estas plataformas; además de buscar el motivo por el cual se han suscrito en estas plataformas ya que una serie o película puede generar más usuarios en estas.

Por último, se realizará una comparación del incremento de usuarios en las plataformas de Streaming en el 2019, cuando solo habían usuarios de Netflix, Amazon Prime Video, etc.; vs en el 2020, año en el que se han incrementado el número de plataformas, como de usuarios, en gran medida debido al confinamiento.

2. Objetivos

2.1. Objetivo principal

Brindar información relevante acerca del impacto que tuvo la cuarentena en el uso y la contratación de servicios de streaming audiovisual en estudiantes de Lima Metropolitana.

2.2. Objetivos secundarios
  • Analizar la preferencia de pago de los usuarios en cuanto las plataformas de streaming

  • Determinar la variación de tiempo en cuanto al uso de plataformas de streaming de los usuarios entre el 2019 y el 2020

  • Determinar la variación en cuanto al número de usuarios en las plataformas de streaming del 2019 al 2020.

  • Estudiar el dispositivo de preferencia para el uso de plataformas de streaming de los usuarios en el 2020

<div/>
2.2.1. Preguntas

-¿Cuál es la edad que usa más las plataformas de streaming?

-¿Cuánto tiempo promedio al día las personas utilizaban las plataformas de streaming?

-¿Cuál es la plataforma de preferencia para las personas?

-¿Cuánto están disponibles las personas a pagar por las plataformas de streaming?

-¿Cuántas personas incrementaron en el uso de plataformas de streaming?

-¿Qué plataformas aumentaron entre el 2019 y el 2020?

-¿Qué plataformas disminuyeron entre el 2019 y 2020?

-¿Cuánto influyó el cierre de cines para que las personas utilizarán las plataformas de streaming?

-¿Cuál es el contenido que se observa más en las plataformas de streaming?

-¿Qué tipo de pago fue el más utilizado?

-¿Qué plataforma tiene mayor tiempo de uso?

-¿Cuánto fue la influencia de contenido para que las personas se trasladen a otras plataformas de streaming?

3. Factibilidad

En la siguiente tabla se detalla las características y los logros de las 4 entregas que se van a cumplir. Así mismo se detalla las fechas de entrega y los días que tendremos que realizar cada actividad y un diagrama de Gantt que nos ayudará a organizarnos mejor desde el inicio hasta el final del proyecto.

4. Marco teórico

Las plataformas de Streaming, han tenido un impacto en la sociedad. Pues, al ser un medio de entretenimiento tanto para jóvenes, niños y adultos que permite acceder a múltiples contenidos (TV, películas, música, pódcast), desde cualquier ambiente (Hogar, escuela, trabajo) solo contando con conexión a internet, ha encontrado su momento de auge en el confinamiento nacional sucedido en el 2020.

El crecimiento constante de las plataformas de Streaming, y, las multiples investigaciones y análisis acerca de ello, como el realizado por el analista Brad Barrett, quien confirma las cifras y afirma “Aproximadamente un tercio de todo el consumo de contenido se hace actualmente a través de plataformas de streaming, pero en 2030 creo que va a aumentar a más del 80%”, esto generó un gran interés por el tema en nuestro equipo. Es por ello, que se planteó el siguiente tema de investigación: Incremento de los estudiantes de las universidades de Lima en las plataformas de streaming del 2019 al 2020.

5. Población objetivo

Jóvenes estudiantes universitarios del Lima Metropolitana que tengan y usen alguna plataforma de streaming.

5.1. Unidad muestral

Estudiantes universitarios de Lima que utilizaron plataformas de streaming en el periodo del 2019 al 2020.

5.2. Justificación de muestra

Se optó por la elección de estudiantes universitarios de Lima Metropolina, ya que por la limitaciones que tenemos no podremos acceder a los estudiantes de las demás regiones del país.

6. Variables de estudio

6.1. Clasificación de las variables
Variables categóricas ordinal
Variables Descripción Restricción
Cine_a_stream Puntuación el efecto e ausencia de los cines Entero positivo
Traslado_plat Puntuación del contenido añadido por las plataformas Entero positivo
Variables categóricas nominales
Variables Descripción Restricción
Sexo Sexo F o M
Universidad Entidad educativa Universidades de Lima
P_19 Plataforma más usada 2019 -
Plataforma19 Tipos de formas de pagar el consumo 2019 -
Pagregadas20 Plataformas agregadas 2020 -
Plataforma20 Tipos de formas de pagar el consumo 2020 -
Device Dispositivo en el usa -
Contenido El tipo de contenido que consume -
P_20 Plataforma más usada 2020 -
Variables numéricas continuas
Variables Descripción Restricción
Precio_19 Costo promedio de pago 2019 Racional positivo
Precio_20 Costo promedio de pago 2020 Racional positivo
Variables numéricas discretas
Variables Descripción Restricción
Pueblo Personas entrevistadas Mayor de 50 pero menor de 1000
Time_service20 Minutos de consumo promedio diario 2020 Entero positivo
Time_service19 Minutos de consumo promedio diario 2019 Entero positivo
Edad Edad Mayores de 16
6.2. Descripción de cada variable

1. Sexo: Esta variable identifica a cada observación de acuerdo a su característica biológica.

2. Universidad: Esta variable, puntualiza la casa de estudio de cada una de las observaciones.

3. P_19t : Esta variable, alude a las plataformas que fue la más usadas por los encuestados durante el 2019.

5. Plataforma19 : Esta variable, indica la manera de pago de las observaciones por los servicios de Streaming durante el año 2019.

6. Pagregadas20 : Esta variable, indica las nuevas plataformas que fueron agregadas por los encuestados en el año 2020, a su lista de plataformas de Streaming.

7. Plataforma20: Esta variable, indica la manera de pago de las observaciones por los servicios de Streaming durante el año 2020.

8. Device: Esta variable, indica el dispositivo mediante el que se consumía el contenido de las plataformas de Streaming.

9. Contenido Esta variable, alude al tipo de contenido que consumía nuestros encuestados.

10. P_20t : Esta variable, alude a las plataformas que fue la más usadas por los encuestados durante el 2020.

11. Time_service20: Esta variable, indica el número de minutos que consumía de los servicios de streaming en el año 2020.

12. Time_service19: Esta variable, indica el número de minutos que consumía de los servicios de streaming en el año 2019

13.Precio_19: Esta variable, indica la cantidad de dinero que gastó cada persona en pago de Suscripciones a plataformas de Streaming en promedio en el año 2019.

14. Edad: Esta variable, indica la cantidad de años que tiene la persona que responde la encuesta.

15. Precio_20: Esta variable, indica la cantidad de dinero que gastó cada persona en pago de Suscripciones a plataformas de Streaming en promedio en el año 2020

16. Cine_a_stream: Esta variable, indica una puntuación del 1 al 10 la influencia que tuvo la ausencia de los cines para que se utilicen plataformas de streaming.

17. Traslado_plat: Esta variable, indica indica una puntuación del 1 al 10 la influencia que tuvo el nuevo contenido agregado para el traslado de una plataforma a otra.

DATASET

7. Base de datos

Librerias

library(readr)
library(ggplot2)
library(tidyr)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(modeest)
library(Rlab)
## Rlab 2.15.1 attached.
## 
## Attaching package: 'Rlab'
## The following object is masked from 'package:dplyr':
## 
##     count
## The following objects are masked from 'package:stats':
## 
##     dexp, dgamma, dweibull, pexp, pgamma, pweibull, qexp, qgamma,
##     qweibull, rexp, rgamma, rweibull
## The following object is masked from 'package:datasets':
## 
##     precip
DF <- read_csv("ENCUESTA_FINAL_P2.csv")
## Rows: 157 Columns: 56
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (53): Marca temporal, Nombres y Apellidos, Sexo, ¿En qué Universidad est...
## dbl  (3): Edad, ¿En qué porcentaje, el no poder ir a los cines hizo que opte...
## 
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
names(DF)
##  [1] "Marca temporal"                                                                                                                                                            
##  [2] "Nombres y Apellidos"                                                                                                                                                       
##  [3] "Sexo"                                                                                                                                                                      
##  [4] "Edad"                                                                                                                                                                      
##  [5] "¿En qué Universidad estudias?"                                                                                                                                             
##  [6] "¿Qué plataformas usabas en el 2019? (Si no usabas alguna plataforma colocar NU)"                                                                                           
##  [7] "¿Cuánto tiempo al día utilizabas los servicios de streaming durante en el 2019? *en horas*"                                                                                
##  [8] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Netflix]"           
##  [9] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Youtube]"           
## [10] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Youtube premium]"   
## [11] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Movistar Play]"     
## [12] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Zoom]"              
## [13] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [HBO]"               
## [14] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Amazon Prime Video]"
## [15] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Twitch]"            
## [16] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Disney plus]"       
## [17] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Facebook Gaming]"   
## [18] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Claro Video]"       
## [19] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Star Plus]"         
## [20] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Discord]"           
## [21] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Crunchyroll]"       
## [22] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Spotify]"           
## [23] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Fox Sport]"         
## [24] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Hulu]"              
## [25] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Direct tv go]"      
## [26] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [America TV go]"     
## [27] "¿Cuáles eran tus series y/o películas de preferencia en estas plataformas? (máximo 2)"                                                                                     
## [28] "¿Qué tipo de contenido te interesaba más?"                                                                                                                                 
## [29] "¿Usas una plataforma personal o grupal?"                                                                                                                                   
## [30] "Al mes ¿Cuánto pagabas aproximadamente por las plataformas 2019? *solo colocar número*"                                                                                    
## [31] "¿Qué plataforma nueva has agregado durante el 2020? (Si no agregaste alguna colocar NU)"                                                                                   
## [32] "¿De qué manera te gustaba consumir el contenido?"                                                                                                                          
## [33] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Netflix]"           
## [34] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Youtube]"           
## [35] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Youtube premium]"   
## [36] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Movistar Play]"     
## [37] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Zoom]"              
## [38] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [HBO]"               
## [39] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Amazon Prime Video]"
## [40] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Twitch]"            
## [41] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Disney plus]"       
## [42] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Facebook Gaming]"   
## [43] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Claro Video]"       
## [44] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Star Plus]"         
## [45] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Discord]"           
## [46] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Crunchyroll]"       
## [47] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Spotify]"           
## [48] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Fox Sport]"         
## [49] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Hulu]"              
## [50] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Direct tv go]"      
## [51] "¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [America TV go]"     
## [52] "¿Pagabas la plataforma de manera personal o grupal?"                                                                                                                       
## [53] "Al mes ¿Cuánto pagabas aproximadamente por las plataformas 2020? *solo colocar número*"                                                                                    
## [54] "¿Cuánto tiempo al día utilizabas los servicios de streaming durante en el 2020?  *en horas*"                                                                               
## [55] "¿En qué porcentaje, el no poder ir a los cines hizo que optes por ver películas en algún servicio de streaming?  (siendo 1 un 10% y 10 un 100%)"                           
## [56] "En términos de porcentaje ¿Cuánto influyó la actualización del contenido de las plataformas de Streaming para trasladarte de una a otra? (siendo 1 un 10% y 10 un 100%)"

Limpieza de datos

DF %>% rename(Identidad = `Nombres y Apellidos`, Universidad = `¿En qué Universidad estudias?`, Plataformas_2019 = `¿Qué plataformas usabas en el 2019? (Si no usabas alguna plataforma colocar NU)`, Netflix_2019 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Netflix]`, Youtube_2019 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Youtube]`, Youtube_p_2019 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Youtube premium]`, Movistar_play_2019 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Movistar Play]`, Zoom_2019 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Zoom]`, HBO_2019 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [HBO]`, Amazon_p_2019 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Amazon Prime Video]`, Twitch_2019 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Twitch]`, Disney_plus_2019 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Disney plus]`, Fb_gaming_2019 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Facebook Gaming]`, Claro_video_2019 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Claro Video]`, Starplus_2019 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Star Plus]`, Discord_2019 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Discord]`, Crunchyroll_2019 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Crunchyroll]`, Spotify_2019 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Spotify]`, Foxsport_2019 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Fox Sport]`, Hulu_2019 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Hulu]`, DirecTVgo_2019 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Direct tv go]`, AmericaTVgo_2019 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2019? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [America TV go]`, SyP_fav = `¿Cuáles eran tus series y/o películas de preferencia en estas plataformas? (máximo 2)`, Contenido = `¿Qué tipo de contenido te interesaba más?`, Plataforma19 =  `¿Usas una plataforma personal o grupal?`, Precio_2019 = `Al mes ¿Cuánto pagabas aproximadamente por las plataformas 2019? *solo colocar número*`, Nueva_plat_2020 = `¿Qué plataforma nueva has agregado durante el 2020? (Si no agregaste alguna colocar NU)`) -> Aux
Aux %>% rename(Device = `¿De qué manera te gustaba consumir el contenido?`, Netflix_2020 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Netflix]`, Youtube_2020 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Youtube]`, Youtube_p_2020 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Youtube premium]`, Movistar_play_2020 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Movistar Play]`, Zoom_2020 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Zoom]`, HBO_2020 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [HBO]`, Amazon_p_2020 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Amazon Prime Video]`, Twitch_2020 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Twitch]`, Disney_plus_2020 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Disney plus]`, Fb_gaming_2020 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Facebook Gaming]`, Claro_video_2020 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Claro Video]`, Starplus_2020 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Star Plus]`, Discord_2020 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Discord]`, Crunchyroll_2020 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Crunchyroll]`, Spotify_2020 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Spotify]`, Foxsport_2020 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Fox Sport]`, Hulu_2020 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Hulu]`, DirecTVgo_2020 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [Direct tv go]`, AmericaTVgo_2020 = `¿Cuánto tiempo al día utilizabas estas plataformas en el 2020? (considerando que NU es que no usabas la plataforma) *desde 20min hasta más de 9horas* [America TV go]`, Plataforma2020 = `¿Pagabas la plataforma de manera personal o grupal?`) -> Aux2
Aux2 %>% rename(Time_service20 = `¿Cuánto tiempo al día utilizabas los servicios de streaming durante en el 2020?  *en horas*`, Cine_a_stream = `¿En qué porcentaje, el no poder ir a los cines hizo que optes por ver películas en algún servicio de streaming?  (siendo 1 un 10% y 10 un 100%)`, Traslado_plat = `En términos de porcentaje ¿Cuánto influyó la actualización del contenido de las plataformas de Streaming para trasladarte de una a otra? (siendo 1 un 10% y 10 un 100%)`, Precio_2020 = `Al mes ¿Cuánto pagabas aproximadamente por las plataformas 2020? *solo colocar número*`,Time_service19 = `¿Cuánto tiempo al día utilizabas los servicios de streaming durante en el 2019? *en horas*`) -> DFN
DFN$Identidad[DFN$Identidad == "ADRIANA JESUS VARGAS ALVAREZ"] <- "Adriana Jesus Vargas Alvarez"
DFN$Identidad[DFN$Identidad == "Cajilima Pozo Víctor Luciano Carlos"] <- "Víctor Luciano Carlos Cajilima Pozo"
DFN$Identidad[DFN$Identidad == "Cielo guerra"] <- "Cielo Guerra"
DFN$Identidad[DFN$Identidad == "Jeanpier matencio"] <- "Jeanpier Matencio"
DFN$Identidad[DFN$Identidad == "Jhoan danith flores cieza"] <- "Jhoan Danith Flores Cieza"
DFN$Identidad[DFN$Identidad == "luis adrian gonzales urcuhuaranga"] <- "Luis Adrian Gonzales Urcuhuaranga"
DFN$Identidad[DFN$Identidad == "Nicolas cayo"] <- "Nicolas Cayo"
DFN$Identidad[DFN$Identidad == "sebastian jair gomez albino"] <- "Sebastian Jair Gomez Albino"
DFN$Identidad[DFN$Identidad == "SONYA VASQUEZ"] <- "Sonya Vasquez"
DFN$Identidad[DFN$Identidad == "Rabanal Yalico Luz Mahilen"] <- "Luz Mahilen Rabanal Yalico"
DFN$Identidad[DFN$Identidad == "Chaupis Salgado Alvaro"] <- "Alvaro Chaupis Salgado"
DFN$Identidad[DFN$Identidad == "Nicolas cayo"] <- "Nicolas Cayo"
DFN$Identidad[DFN$Identidad == "Nicolas cayo"] <- "Nicolas Cayo"
DFN$Identidad[DFN$Identidad == "Nicolas cayo"] <- "Nicolas Cayo"
DFN$Universidad[DFN$Universidad == "Universidad Cesar Vallejo"] <- "UCV"
DFN$Universidad[DFN$Universidad == "Ninguna"] <- NA
DFN$Universidad[DFN$Universidad == "Na"] <- NA
DFN$Universidad[DFN$Universidad == "Universidad del Pacífico"] <- "UP"
DFN$Universidad[DFN$Universidad == "Universidad Peruana de Ciencias Aplicadas - UPC"] <- "UPC"
DFN$Universidad[DFN$Universidad == "Pacífico"] <- "UP"
DFN$Universidad[DFN$Universidad == "Universidad Ricardo Palma"] <- "URP"
DFN$Universidad[DFN$Universidad == "Sigo en colegio 🙆🏻‍♀️"] <- NA
DFN$Universidad[DFN$Universidad == "Upc"] <- "UPC"
DFN$Universidad[DFN$Universidad == "Universidad Privada del Norte"] <- "UPN"
DFN$Universidad[DFN$Universidad == "Universidad Tecnológica del Perú"] <- "UTP"
DFN$Universidad[DFN$Universidad == "Pucp"] <- "PUCP"
DFN$Universidad[DFN$Universidad == "Universidad Nacional de Ucayali"] <- "UNU"
DFN$Universidad[DFN$Universidad == "Pucp"] <- "PUCP"
DFN$Universidad[DFN$Universidad == "Utec"] <- "UTEC"
DFN$Universidad[DFN$Universidad == "Universidad de Piura"] <- "UDEP"
DFN$Universidad[DFN$Universidad == "Universidad de Lima"] <- "UL"
DFN$Universidad[DFN$Universidad == "UNIVERSIDAD César Vallejo"] <- "UCV"
DFN$Universidad[DFN$Universidad == "Universidad Nacional de Ingeniería"] <- "UNI"
DFN$Universidad[DFN$Universidad == "Universidad San Martín de Porres"] <- "USMP"
DFN$Universidad[DFN$Universidad == "Universidad nacional de ucayali"] <- "UNU"
DFN$Universidad[DFN$Universidad == "unac"] <- "UNAC"
DFN$Universidad[DFN$Universidad == "La gran UTEC"] <- "UTEC"
DFN$Universidad[DFN$Universidad == "Universidad del Pacifico"] <- "UP"
DFN$Universidad[DFN$Universidad == "U.Pacífico"] <- "UP"
DFN$Universidad[DFN$Universidad == "San Martín"] <- "USMP"
DFN$Universidad[DFN$Universidad == "Universidad de lima"] <- "UL"
DFN$Universidad[DFN$Universidad == "Federico Villarreal"] <- "UNFV"
DFN$Universidad[DFN$Universidad == "Usil"] <- "USIL"
DFN$Universidad[DFN$Universidad == "Unfv"] <- "UNFV"
DFN$Universidad[DFN$Universidad == "Universidad de Ingeniería y Tecnología"] <- "UTEC"
DFN$Universidad[DFN$Universidad == "UNIVERSIDAD NACIONAL DE TRUJILLO"] <- "UNT"
DFN$Universidad[DFN$Universidad == "Isil"] <- "ISIL"
DFN$Universidad[DFN$Universidad == "Universidad Nacional de Música"] <- "CNM"
DFN$Universidad[DFN$Universidad == "Cientifica del Sur"] <- "UCSUR"
DFN$Universidad[DFN$Universidad == "San Carlos de Guatemala"] <- "USAC"
DFN$Universidad[DFN$Universidad == "La vida"] <- NA
DFN$Universidad[DFN$Universidad == "UNIVERSIDAD PRIVADA DEL NORTE"] <- "UPN"
DFN$Universidad[DFN$Universidad == "Privada del Norte"] <- "UPN"
DFN$Universidad[DFN$Universidad == "Universidad de Ingeniería y Tecnología (UTEC)"] <- "UTEC"
DFN$Universidad[DFN$Universidad == "Universidad tecnológica del Perú"] <- "UTP"
DFN$Universidad[DFN$Universidad == "Universidad privada del norte"] <- "UPN"
DFN$Universidad[DFN$Universidad == "Pontificia Universidad Católica del Perú"] <- "PUCP"
DFN$Universidad[DFN$Universidad == "Universidad de San Martín de Porres"] <- "USMP"
DFN$Netflix_2019[DFN$Netflix_2019 == "NU"] <- NA
DFN$Netflix_2019[DFN$Netflix_2019 == 1] <- 60
DFN$Netflix_2019[DFN$Netflix_2019 == 2] <- 120
DFN$Netflix_2019[DFN$Netflix_2019 == 3] <- 180
DFN$Netflix_2019[DFN$Netflix_2019 == 4] <- 240
DFN$Netflix_2019[DFN$Netflix_2019 == 5] <- 300
DFN$Netflix_2019[DFN$Netflix_2019 == 6] <- 360
DFN$Netflix_2019[DFN$Netflix_2019 == 7] <- 420
DFN$Netflix_2019[DFN$Netflix_2019 == 8] <- 480
DFN$Netflix_2019[DFN$Netflix_2019 == "9+"] <- 540
DFN$Netflix_2019 <- as.numeric(DFN$Netflix_2019) 
DFN$Youtube_2019[DFN$Youtube_2019 == "NU"] <- NA
DFN$Youtube_2019[DFN$Youtube_2019== 1] <- 60
DFN$Youtube_2019[DFN$Youtube_2019 == 2] <- 120
DFN$Youtube_2019[DFN$Youtube_2019 == 3] <- 180
DFN$Youtube_2019[DFN$Youtube_2019 == 4] <- 240
DFN$Youtube_2019[DFN$Youtube_2019 == 5] <- 300
DFN$Youtube_2019[DFN$Youtube_2019 == 6] <- 360
DFN$Youtube_2019[DFN$Youtube_2019 == 7] <- 420
DFN$Youtube_2019[DFN$Youtube_2019 == 8] <- 480
DFN$Youtube_2019[DFN$Youtube_2019 == "9+"] <- 540
DFN$Youtube_2019 <- as.numeric(DFN$Youtube_2019) 
DFN$Youtube_p_2019[DFN$Youtube_p_2019 == "NU"] <- NA
DFN$Youtube_p_2019[DFN$Youtube_p_2019 == 1] <- 60
DFN$Youtube_p_2019[DFN$Youtube_p_2019 == 2] <- 120
DFN$Youtube_p_2019[DFN$Youtube_p_2019 == 3] <- 180
DFN$Youtube_p_2019[DFN$Youtube_p_2019 == 4] <- 240
DFN$Youtube_p_2019[DFN$Youtube_p_2019 == 5] <- 300
DFN$Youtube_p_2019[DFN$Youtube_p_2019 == 6] <- 360
DFN$Youtube_p_2019[DFN$Youtube_p_2019 == 7] <- 420
DFN$Youtube_p_2019[DFN$Youtube_p_2019 == 8] <- 480
DFN$Youtube_p_2019[DFN$Youtube_p_2019 == "9+"] <- 540
DFN$Youtube_p_2019 <- as.numeric(DFN$Youtube_p_2019) 
DFN$Movistar_play_2019[DFN$Movistar_play_2019 == "NU"] <- NA
DFN$Movistar_play_2019[DFN$Movistar_play_2019 == 1] <- 60
DFN$Movistar_play_2019[DFN$Movistar_play_2019 == 2] <- 120
DFN$Movistar_play_2019[DFN$Movistar_play_2019 == 3] <- 180
DFN$Movistar_play_2019[DFN$Movistar_play_2019 == 4] <- 240
DFN$Movistar_play_2019[DFN$Movistar_play_2019 == 5] <- 300
DFN$Movistar_play_2019[DFN$Movistar_play_2019 == 6] <- 360
DFN$Movistar_play_2019[DFN$Movistar_play_2019 == 7] <- 420
DFN$Movistar_play_2019[DFN$Movistar_play_2019 == 8] <- 480
DFN$Movistar_play_2019[DFN$Movistar_play_2019 == "9+"] <- 540
DFN$Movistar_play_2019<- as.numeric(DFN$Movistar_play_2019) 
DFN$Zoom_2019[DFN$Zoom_2019 == "NU"] <- NA
DFN$Zoom_2019[DFN$Zoom_2019 == 1] <- 60
DFN$Zoom_2019[DFN$Zoom_2019 == 2] <- 120
DFN$Zoom_2019[DFN$Zoom_2019 == 3] <- 180
DFN$Zoom_2019[DFN$Zoom_2019 == 4] <- 240
DFN$Zoom_2019[DFN$Zoom_2019 == 5] <- 300
DFN$Zoom_2019[DFN$Zoom_2019 == 6]<- 360
DFN$Zoom_2019[DFN$Zoom_2019 == 7]<- 420
DFN$Zoom_2019[DFN$Zoom_2019 == 8] <- 480
DFN$Zoom_2019[DFN$Zoom_2019 == "9+"] <- 540
DFN$Zoom_2019<- as.numeric(DFN$Zoom_2019)
DFN$HBO_2019[DFN$HBO_2019 == "NU"] <- NA
DFN$HBO_2019[DFN$HBO_2019 == 1] <- 60
DFN$HBO_2019[DFN$HBO_2019 == 2] <- 120
DFN$HBO_2019[DFN$HBO_2019 == 3] <- 180
DFN$HBO_2019[DFN$HBO_2019 == 4] <- 240
DFN$HBO_2019[DFN$HBO_2019 == 5] <- 300
DFN$HBO_2019[DFN$HBO_2019 == 6] <- 360
DFN$HBO_2019[DFN$HBO_2019 == 7] <- 420
DFN$HBO_2019[DFN$HBO_2019 == 8] <- 480
DFN$HBO_2019[DFN$HBO_2019 == "9+"] <- 540
DFN$HBO_2019<- as.numeric(DFN$HBO_2019)
DFN$Amazon_p_2019[DFN$Amazon_p_2019 == "NU"] <- NA
DFN$Amazon_p_2019[DFN$Amazon_p_2019 == 1] <- 60
DFN$Amazon_p_2019[DFN$Amazon_p_2019 == 2] <- 120
DFN$Amazon_p_2019[DFN$Amazon_p_2019 == 3] <- 180
DFN$Amazon_p_2019[DFN$Amazon_p_2019 == 4] <- 240
DFN$Amazon_p_2019[DFN$Amazon_p_2019 == 5] <- 300
DFN$Amazon_p_2019[DFN$Amazon_p_2019 == 6] <- 360
DFN$Amazon_p_2019[DFN$Amazon_p_2019 == 7] <- 420
DFN$Amazon_p_2019[DFN$Amazon_p_2019 == 8] <- 480
DFN$Amazon_p_2019[DFN$Amazon_p_2019 == "9+"] <- 540
DFN$Amazon_p_2019<- as.numeric(DFN$Amazon_p_2019)
DFN$Twitch_2019[DFN$Twitch_2019 == "NU"] <- NA
DFN$Twitch_2019[DFN$Twitch_2019 == 1] <- 60
DFN$Twitch_2019[DFN$Twitch_2019 == 2] <- 120
DFN$Twitch_2019[DFN$Twitch_2019 == 3] <- 180
DFN$Twitch_2019[DFN$Twitch_2019 == 4] <- 240
DFN$Twitch_2019[DFN$Twitch_2019 == 5] <- 300
DFN$Twitch_2019[DFN$Twitch_2019 == 6] <- 360
DFN$Twitch_2019[DFN$Twitch_2019 == 7] <- 420
DFN$Twitch_2019[DFN$Twitch_2019 == 8] <- 480
DFN$Twitch_2019[DFN$Twitch_2019 == "9+"] <- 540
DFN$Twitch_2019<- as.numeric(DFN$Twitch_2019)
DFN$Disney_plus_2019[DFN$Disney_plus_2019 == "NU"] <- NA
DFN$Disney_plus_2019[DFN$Disney_plus_2019 == 1] <- 60
DFN$Disney_plus_2019[DFN$Disney_plus_2019 == 2] <- 120
DFN$Disney_plus_2019[DFN$Disney_plus_2019 == 3] <- 180
DFN$Disney_plus_2019[DFN$Disney_plus_2019 == 4] <- 240
DFN$Disney_plus_2019[DFN$Disney_plus_2019 == 5] <- 300
DFN$Disney_plus_2019[DFN$Disney_plus_2019 == 6] <- 360
DFN$Disney_plus_2019[DFN$Disney_plus_2019 == 7] <- 420
DFN$Disney_plus_2019[DFN$Disney_plus_2019 == 8] <- 480
DFN$Disney_plus_2019[DFN$Disney_plus_2019 == "9+"] <- 540
DFN$Disney_plus_2019<- as.numeric(DFN$Disney_plus_2019)
DFN$Fb_gaming_2019[DFN$Fb_gaming_2019 == "NU"] <- NA
DFN$Fb_gaming_2019[DFN$Fb_gaming_2019 == "NU"] <- 60
DFN$Fb_gaming_2019[DFN$Fb_gaming_2019 == "NU"] <- 120
DFN$Fb_gaming_2019[DFN$Fb_gaming_2019 == "NU"] <- 180
DFN$Fb_gaming_2019[DFN$Fb_gaming_2019 == "NU"] <- 240
DFN$Fb_gaming_2019[DFN$Fb_gaming_2019 == "NU"] <- 300
DFN$Fb_gaming_2019[DFN$Fb_gaming_2019 == "NU"] <- 360
DFN$Fb_gaming_2019[DFN$Fb_gaming_2019 == "NU"] <- 420
DFN$Fb_gaming_2019[DFN$Fb_gaming_2019 == "NU"] <- 480
DFN$Fb_gaming_2019[DFN$Fb_gaming_2019 == "9+"] <- 540
DFN$Fb_gaming_2019<- as.numeric(DFN$Fb_gaming_2019)
DFN$Claro_video_2019[DFN$Claro_video_2019 == "NU"] <- NA
DFN$Claro_video_2019[DFN$Claro_video_2019 == 1] <- 60
DFN$Claro_video_2019[DFN$Claro_video_2019 == 2] <- 120
DFN$Claro_video_2019[DFN$Claro_video_2019 == 3] <- 180
DFN$Claro_video_2019[DFN$Claro_video_2019 == 4] <- 240
DFN$Claro_video_2019[DFN$Claro_video_2019 == 5] <- 300
DFN$Claro_video_2019[DFN$Claro_video_2019 == 6] <- 360
DFN$Claro_video_2019[DFN$Claro_video_2019 == 7] <- 420
DFN$Claro_video_2019[DFN$Claro_video_2019 == 8] <- 480
DFN$Claro_video_2019[DFN$Claro_video_2019 == "9+"] <- 540
DFN$Claro_video_2019<- as.numeric(DFN$Claro_video_2019)
DFN$Starplus_2019[DFN$Starplus_2019 == "NU"] <- NA
DFN$Starplus_2019[DFN$Starplus_2019 == 1] <- 60
DFN$Starplus_2019[DFN$Starplus_2019 == 2] <- 120
DFN$Starplus_2019[DFN$Starplus_2019 == 3] <- 180
DFN$Starplus_2019[DFN$Starplus_2019 == 4] <- 240
DFN$Starplus_2019[DFN$Starplus_2019 == 5] <- 300
DFN$Starplus_2019[DFN$Starplus_2019 == 6] <- 360
DFN$Starplus_2019[DFN$Starplus_2019 == 7] <- 420
DFN$Starplus_2019[DFN$Starplus_2019 == 8] <- 480
DFN$Starplus_2019[DFN$Starplus_2019 == "9+"] <- 540
DFN$Starplus_2019<- as.numeric(DFN$Starplus_2019)
DFN$Discord_2019[DFN$Discord_2019 == "NU"] <- NA
DFN$Discord_2019[DFN$Discord_2019 == 1] <- 60
DFN$Discord_2019[DFN$Discord_2019 == 2] <- 120
DFN$Discord_2019[DFN$Discord_2019 == 3] <- 180
DFN$Discord_2019[DFN$Discord_2019 == 4] <- 240
DFN$Discord_2019[DFN$Discord_2019 == 5] <- 300
DFN$Discord_2019[DFN$Discord_2019 == 6] <- 360
DFN$Discord_2019[DFN$Discord_2019 == 7] <- 420
DFN$Discord_2019[DFN$Discord_2019 == 8] <- 480
DFN$Discord_2019[DFN$Discord_2019 == "9+"] <- 540
DFN$Discord_2019<- as.numeric(DFN$Discord_2019)
DFN$Crunchyroll_2019[DFN$Crunchyroll_2019 == "NU"] <- NA
DFN$Crunchyroll_2019[DFN$Crunchyroll_2019 == 1] <- 60
DFN$Crunchyroll_2019[DFN$Crunchyroll_2019 == 2] <- 120
DFN$Crunchyroll_2019[DFN$Crunchyroll_2019 == 3] <- 180
DFN$Crunchyroll_2019[DFN$Crunchyroll_2019 == 4] <- 240
DFN$Crunchyroll_2019[DFN$Crunchyroll_2019 == 5] <- 300
DFN$Crunchyroll_2019[DFN$Crunchyroll_2019 == 6] <- 360
DFN$Crunchyroll_2019[DFN$Crunchyroll_2019 == 7] <- 420
DFN$Crunchyroll_2019[DFN$Crunchyroll_2019 == 8] <- 480
DFN$Crunchyroll_2019[DFN$Crunchyroll_2019 == "9+"] <- 540
DFN$Crunchyroll_2019<- as.numeric(DFN$Crunchyroll_2019)
DFN$Spotify_2019[DFN$Spotify_2019 == "NU"] <- NA
DFN$Spotify_2019[DFN$Spotify_2019 == 1] <- 60
DFN$Spotify_2019[DFN$Spotify_2019 == 2] <- 120
DFN$Spotify_2019[DFN$Spotify_2019 == 3] <- 180
DFN$Spotify_2019[DFN$Spotify_2019 == 4] <- 240
DFN$Spotify_2019[DFN$Spotify_2019 == 5] <- 300
DFN$Spotify_2019[DFN$Spotify_2019 == 6] <- 360
DFN$Spotify_2019[DFN$Spotify_2019 == 7] <- 420
DFN$Spotify_2019[DFN$Spotify_2019 == 8] <- 480
DFN$Spotify_2019[DFN$Spotify_2019 == "9+"] <- 540
DFN$Spotify_2019<- as.numeric(DFN$Spotify_2019)
DFN$Foxsport_2019[DFN$Foxsport_2019 == "NU"] <- NA
DFN$Foxsport_2019[DFN$Foxsport_2019 == 1] <- 60
DFN$Foxsport_2019[DFN$Foxsport_2019 == 2] <- 120
DFN$Foxsport_2019[DFN$Foxsport_2019 == 3] <- 180
DFN$Foxsport_2019[DFN$Foxsport_2019 == 4] <- 240
DFN$Foxsport_2019[DFN$Foxsport_2019 == 5] <- 300
DFN$Foxsport_2019[DFN$Foxsport_2019 == 6] <- 360
DFN$Foxsport_2019[DFN$Foxsport_2019 == 7] <- 420
DFN$Foxsport_2019[DFN$Foxsport_2019 == 8] <- 480
DFN$Foxsport_2019[DFN$Foxsport_2019 == "9+"] <- 540
DFN$Foxsport_2019<- as.numeric(DFN$Foxsport_2019)
DFN$Hulu_2019[DFN$Hulu_2019 == "NU"] <- NA
DFN$Hulu_2019[DFN$Hulu_2019 == 1] <- 60
DFN$Hulu_2019[DFN$Hulu_2019 == 2] <- 120
DFN$Hulu_2019[DFN$Hulu_2019 == 3] <- 180
DFN$Hulu_2019[DFN$Hulu_2019 == 4] <- 240
DFN$Hulu_2019[DFN$Hulu_2019 == 5] <- 300
DFN$Hulu_2019[DFN$Hulu_2019 == 6] <- 360
DFN$Hulu_2019[DFN$Hulu_2019 == 7] <- 420
DFN$Hulu_2019[DFN$Hulu_2019 == 8] <- 480
DFN$Hulu_2019[DFN$Hulu_2019 == "9+"] <- 540
DFN$Hulu_2019<- as.numeric(DFN$Hulu_2019)
DFN$DirecTVgo_2019[DFN$DirecTVgo_2019 == "NU"] <- NA
DFN$DirecTVgo_2019[DFN$DirecTVgo_2019 == 1] <- 60
DFN$DirecTVgo_2019[DFN$DirecTVgo_2019 == 2] <- 120
DFN$DirecTVgo_2019[DFN$DirecTVgo_2019 == 3] <- 180
DFN$DirecTVgo_2019[DFN$DirecTVgo_2019 == 4] <- 240
DFN$DirecTVgo_2019[DFN$DirecTVgo_2019 == 5] <- 300
DFN$DirecTVgo_2019[DFN$DirecTVgo_2019 == 6] <- 360
DFN$DirecTVgo_2019[DFN$DirecTVgo_2019 == 7] <- 420
DFN$DirecTVgo_2019[DFN$DirecTVgo_2019 == 8] <- 480
DFN$DirecTVgo_2019[DFN$DirecTVgo_2019 == "9+"] <- 540
DFN$DirecTVgo_2019<- as.numeric(DFN$DirecTVgo_2019)
DFN$AmericaTVgo_2019[DFN$AmericaTVgo_2019 == "NU"] <- NA
DFN$AmericaTVgo_2019[DFN$AmericaTVgo_2019 == 1] <- 60
DFN$AmericaTVgo_2019[DFN$AmericaTVgo_2019 == 2] <- 120
DFN$AmericaTVgo_2019[DFN$AmericaTVgo_2019 == 3] <- 180
DFN$AmericaTVgo_2019[DFN$AmericaTVgo_2019 == 4] <- 240
DFN$AmericaTVgo_2019[DFN$AmericaTVgo_2019 == 5] <- 300
DFN$AmericaTVgo_2019[DFN$AmericaTVgo_2019 == 6] <- 360
DFN$AmericaTVgo_2019[DFN$AmericaTVgo_2019 == 7] <- 420
DFN$AmericaTVgo_2019[DFN$AmericaTVgo_2019 == 8] <- 480
DFN$AmericaTVgo_2019[DFN$AmericaTVgo_2019 == "9+"] <- 540
DFN$AmericaTVgo_2019<- as.numeric(DFN$AmericaTVgo_2019)
DFN$Precio_2019[DFN$Precio_2019 == "34so"] <- 34
DFN$Precio_2019[DFN$Precio_2019 == "45 creo"] <- 45
DFN$Precio_2019[DFN$Precio_2019 == "0"] <- NA
DFN$Precio_2019[DFN$Precio_2019 == "24.90"] <- 25
DFN$Precio_2019[DFN$Precio_2019 == "10 dólares"] <- 40
DFN$Precio_2019[DFN$Precio_2019 == "14 al mes. (Nos dividimos el pago entre los usuarios)"] <- 14
DFN$Precio_2019[DFN$Precio_2019 == "39.90"] <- 40
DFN$Precio_2019[DFN$Precio_2019 == "50 soles aprox"] <- 50
DFN$Precio_2019[DFN$Precio_2019 == "28 $"] <- 110
DFN$Precio_2019[DFN$Precio_2019 == "12 c/u"] <- 12
DFN$Precio_2019[DFN$Precio_2019 == "100 soles"] <- 100
DFN$Precio_2019[DFN$Precio_2019 == "Youtube es gratis :D"] <- NA
DFN$Precio_2019[DFN$Precio_2019 == "10so solo por Netflix"] <- 10
DFN$Precio_2019[DFN$Precio_2019 == "12 c/u"] <- 12
DFN$Precio_2019[DFN$Precio_2019 == "40.00"] <- 40
DFN$Precio_2019[DFN$Precio_2019 == "35 soles por el servicio de cable (Fox Sports)"] <- 35
DFN$Precio_2019[DFN$Precio_2019 == "29.9"] <- 30
DFN$Precio_2019[DFN$Precio_2019 == "30 soles"] <- 30
DFN$Precio_2019 <- as.numeric(DFN$Precio_2019)
## Warning: NAs introducidos por coerción
DFN$Netflix_2020[DFN$Netflix_2020 == "NU"] <- NA
DFN$Netflix_2020[DFN$Netflix_2020 == "NU"] <- NA
DFN$Netflix_2020[DFN$Netflix_2020 == 1] <- 60
DFN$Netflix_2020[DFN$Netflix_2020 == 2] <- 120
DFN$Netflix_2020[DFN$Netflix_2020 == 3] <- 180
DFN$Netflix_2020[DFN$Netflix_2020 == 4] <- 240
DFN$Netflix_2020[DFN$Netflix_2020 == 5] <- 300
DFN$Netflix_2020[DFN$Netflix_2020 == 6] <- 360
DFN$Netflix_2020[DFN$Netflix_2020 == 7] <- 420
DFN$Netflix_2020[DFN$Netflix_2020 == 8] <- 480
DFN$Netflix_2020[DFN$Netflix_2020 == "9+"] <- 540
DFN$Netflix_2020<- as.numeric(DFN$Netflix_2020)
DFN$Youtube_2020[DFN$Youtube_2020 == "NU"] <- NA
DFN$Youtube_2020[DFN$Youtube_2020== 1] <- 60
DFN$Youtube_2020[DFN$Youtube_2020 == 2] <- 120
DFN$Youtube_2020[DFN$Youtube_2020 == 3] <- 180
DFN$Youtube_2020[DFN$Youtube_2020 == 4] <- 240
DFN$Youtube_2020[DFN$Youtube_2020 == 5] <- 300
DFN$Youtube_2020[DFN$Youtube_2020 == 6] <- 360
DFN$Youtube_2020[DFN$Youtube_2020 == 7] <- 420
DFN$Youtube_2020[DFN$Youtube_2020 == 8] <- 480
DFN$Youtube_2020[DFN$Youtube_2020 == "9+"] <- 540
DFN$Youtube_2020<- as.numeric(DFN$Youtube_2020)
DFN$Youtube_p_2020[DFN$Youtube_p_2020 == "NU"] <- NA
DFN$Youtube_p_2020[DFN$Youtube_p_2020 == 1] <- 60
DFN$Youtube_p_2020[DFN$Youtube_p_2020 == 2] <- 120
DFN$Youtube_p_2020[DFN$Youtube_p_2020 == 3] <- 180
DFN$Youtube_p_2020[DFN$Youtube_p_2020 == 4] <- 240
DFN$Youtube_p_2020[DFN$Youtube_p_2020 == 5] <- 300
DFN$Youtube_p_2020[DFN$Youtube_p_2020 == 6] <- 360
DFN$Youtube_p_2020[DFN$Youtube_p_2020 == 7] <- 420
DFN$Youtube_p_2020[DFN$Youtube_p_2020 == 8] <- 480
DFN$Youtube_p_2020[DFN$Youtube_p_2020 == "9+"] <- 540
DFN$Youtube_p_2020<- as.numeric(DFN$Youtube_p_2020)
DFN$Movistar_play_2020[DFN$Movistar_play_2020 == "NU"] <- NA
DFN$Movistar_play_2020[DFN$Movistar_play_2020 == 1] <- 60
DFN$Movistar_play_2020[DFN$Movistar_play_2020 == 2] <- 120
DFN$Movistar_play_2020[DFN$Movistar_play_2020 == 3] <- 180
DFN$Movistar_play_2020[DFN$Movistar_play_2020 == 4] <- 240
DFN$Movistar_play_2020[DFN$Movistar_play_2020 == 5] <- 300
DFN$Movistar_play_2020[DFN$Movistar_play_2020 == 6] <- 360
DFN$Movistar_play_2020[DFN$Movistar_play_2020 == 7] <- 420
DFN$Movistar_play_2020[DFN$Movistar_play_2020 == 8] <- 480
DFN$Movistar_play_2020[DFN$Movistar_play_2020 == "9+"] <- 540
DFN$Movistar_play_2020<- as.numeric(DFN$Movistar_play_2020)
DFN$Zoom_2020[DFN$Zoom_2020 == "NU"] <- NA
DFN$Zoom_2020[DFN$Zoom_2020 == "NU"] <- NA
DFN$Zoom_2020[DFN$Zoom_2020 == 1] <- 60
DFN$Zoom_2020[DFN$Zoom_2020 == 2] <- 120
DFN$Zoom_2020[DFN$Zoom_2020 == 3] <- 180
DFN$Zoom_2020[DFN$Zoom_2020 == 4] <- 240
DFN$Zoom_2020[DFN$Zoom_2020 == 5] <- 300
DFN$Zoom_2020[DFN$Zoom_2020 == 6]<- 360
DFN$Zoom_2020[DFN$Zoom_2020 == 7]<- 420
DFN$Zoom_2020[DFN$Zoom_2020 == 8] <- 480
DFN$Zoom_2020[DFN$Zoom_2020 == "9+"] <- 540
DFN$Zoom_2020<- as.numeric(DFN$Zoom_2020)
DFN$HBO_2020[DFN$HBO_2020 == "NU"] <- NA
DFN$HBO_2020[DFN$HBO_2020 == 1] <- 60
DFN$HBO_2020[DFN$HBO_2020 == 2] <- 120
DFN$HBO_2020[DFN$HBO_2020 == 3] <- 180
DFN$HBO_2020[DFN$HBO_2020 == 4] <- 240
DFN$HBO_2020[DFN$HBO_2020 == 5] <- 300
DFN$HBO_2020[DFN$HBO_2020 == 6] <- 360
DFN$HBO_2020[DFN$HBO_2020 == 7] <- 420
DFN$HBO_2020[DFN$HBO_2020 == 8] <- 480
DFN$HBO_2020[DFN$HBO_2020 == "9+"] <- 540
DFN$HBO_2020<- as.numeric(DFN$HBO_2020)
DFN$Amazon_p_2020[DFN$Amazon_p_2020 == "NU"] <- NA
DFN$Amazon_p_2020[DFN$Amazon_p_2020 == 1] <- 60
DFN$Amazon_p_2020[DFN$Amazon_p_2020 == 2] <- 120
DFN$Amazon_p_2020[DFN$Amazon_p_2020 == 3] <- 180
DFN$Amazon_p_2020[DFN$Amazon_p_2020 == 4] <- 240
DFN$Amazon_p_2020[DFN$Amazon_p_2020 == 5] <- 300
DFN$Amazon_p_2020[DFN$Amazon_p_2020 == 6] <- 360
DFN$Amazon_p_2020[DFN$Amazon_p_2020 == 7] <- 420
DFN$Amazon_p_2020[DFN$Amazon_p_2020 == 8] <- 480
DFN$Amazon_p_2020[DFN$Amazon_p_2020 == "9+"] <- 540
DFN$Amazon_p_2020<- as.numeric(DFN$Amazon_p_2020)
DFN$Twitch_2020[DFN$Twitch_2020 == "NU"] <- NA
DFN$Twitch_2020[DFN$Twitch_2020 == 1] <- 60
DFN$Twitch_2020[DFN$Twitch_2020 == 2] <- 120
DFN$Twitch_2020[DFN$Twitch_2020 == 3] <- 180
DFN$Twitch_2020[DFN$Twitch_2020 == 4] <- 240
DFN$Twitch_2020[DFN$Twitch_2020 == 5] <- 300
DFN$Twitch_2020[DFN$Twitch_2020 == 6] <- 360
DFN$Twitch_2020[DFN$Twitch_2020 == 7] <- 420
DFN$Twitch_2020[DFN$Twitch_2020 == 8] <- 480
DFN$Twitch_2020[DFN$Twitch_2020 == "9+"] <- 540
DFN$Twitch_2020<- as.numeric(DFN$Twitch_2020)
DFN$Disney_plus_2020[DFN$Disney_plus_2020 == "NU"] <- NA
DFN$Disney_plus_2020[DFN$Disney_plus_2020 == 1] <- 60
DFN$Disney_plus_2020[DFN$Disney_plus_2020 == 2] <- 120
DFN$Disney_plus_2020[DFN$Disney_plus_2020 == 3] <- 180
DFN$Disney_plus_2020[DFN$Disney_plus_2020 == 4] <- 240
DFN$Disney_plus_2020[DFN$Disney_plus_2020 == 5] <- 300
DFN$Disney_plus_2020[DFN$Disney_plus_2020 == 6] <- 360
DFN$Disney_plus_2020[DFN$Disney_plus_2020 == 7] <- 420
DFN$Disney_plus_2020[DFN$Disney_plus_2020 == 8] <- 480
DFN$Disney_plus_2020[DFN$Disney_plus_2020 == "9+"] <- 540
DFN$Disney_plus_2020<- as.numeric(DFN$Disney_plus_2020)
DFN$Fb_gaming_2020[DFN$Fb_gaming_2020 == "NU"] <- NA
DFN$Fb_gaming_2020[DFN$Fb_gaming_2020 == "NU"] <- 60
DFN$Fb_gaming_2020[DFN$Fb_gaming_2020 == "NU"] <- 120
DFN$Fb_gaming_2020[DFN$Fb_gaming_2020 == "NU"] <- 180
DFN$Fb_gaming_2020[DFN$Fb_gaming_2020 == "NU"] <- 240
DFN$Fb_gaming_2020[DFN$Fb_gaming_2020 == "NU"] <- 300
DFN$Fb_gaming_2020[DFN$Fb_gaming_2020 == "NU"] <- 360
DFN$Fb_gaming_2020[DFN$Fb_gaming_2020 == "NU"] <- 420
DFN$Fb_gaming_2020[DFN$Fb_gaming_2020 == "NU"] <- 480
DFN$Fb_gaming_2020[DFN$Fb_gaming_2020 == "9+"] <- 540
DFN$Fb_gaming_2020<- as.numeric(DFN$Fb_gaming_2020)
DFN$Claro_video_2020[DFN$Claro_video_2020 == "NU"] <- NA
DFN$Claro_video_2020[DFN$Claro_video_2020 == 1] <- 60
DFN$Claro_video_2020[DFN$Claro_video_2020 == 2] <- 120
DFN$Claro_video_2020[DFN$Claro_video_2020 == 3] <- 180
DFN$Claro_video_2020[DFN$Claro_video_2020 == 4] <- 240
DFN$Claro_video_2020[DFN$Claro_video_2020 == 5] <- 300
DFN$Claro_video_2020[DFN$Claro_video_2020 == 6] <- 360
DFN$Claro_video_2020[DFN$Claro_video_2020 == 7] <- 420
DFN$Claro_video_2020[DFN$Claro_video_2020 == 8] <- 480
DFN$Claro_video_2020[DFN$Claro_video_2020 == "9+"] <- 540
DFN$Claro_video_2020<- as.numeric(DFN$Claro_video_2020)
DFN$Starplus_2020[DFN$Starplus_2020 == "NU"] <- NA
DFN$Starplus_2020[DFN$Starplus_2020 == 1] <- 60
DFN$Starplus_2020[DFN$Starplus_2020 == 2] <- 120
DFN$Starplus_2020[DFN$Starplus_2020 == 3] <- 180
DFN$Starplus_2020[DFN$Starplus_2020 == 4] <- 240
DFN$Starplus_2020[DFN$Starplus_2020 == 5] <- 300
DFN$Starplus_2020[DFN$Starplus_2020 == 6] <- 360
DFN$Starplus_2020[DFN$Starplus_2020 == 7] <- 420
DFN$Starplus_2020[DFN$Starplus_2020 == 8] <- 480
DFN$Starplus_2020[DFN$Starplus_2020 == "9+"] <- 540
DFN$Starplus_2020<- as.numeric(DFN$Starplus_2020)
DFN$Discord_2020[DFN$Discord_2020 == "NU"] <- NA
DFN$Discord_2020[DFN$Discord_2020 == 1] <- 60
DFN$Discord_2020[DFN$Discord_2020 == 2] <- 120
DFN$Discord_2020[DFN$Discord_2020 == 3] <- 180
DFN$Discord_2020[DFN$Discord_2020 == 4] <- 240
DFN$Discord_2020[DFN$Discord_2020 == 5] <- 300
DFN$Discord_2020[DFN$Discord_2020 == 6] <- 360
DFN$Discord_2020[DFN$Discord_2020 == 7] <- 420
DFN$Discord_2020[DFN$Discord_2020 == 8] <- 480
DFN$Discord_2020[DFN$Discord_2020 == "9+"] <- 540
DFN$Discord_2020<- as.numeric(DFN$Discord_2020)
DFN$Crunchyroll_2020[DFN$Crunchyroll_2020 == "NU"] <- NA
DFN$Crunchyroll_2020[DFN$Crunchyroll_2020 == 1] <- 60
DFN$Crunchyroll_2020[DFN$Crunchyroll_2020 == 2] <- 120
DFN$Crunchyroll_2020[DFN$Crunchyroll_2020 == 3] <- 180
DFN$Crunchyroll_2020[DFN$Crunchyroll_2020 == 4] <- 240
DFN$Crunchyroll_2020[DFN$Crunchyroll_2020 == 5] <- 300
DFN$Crunchyroll_2020[DFN$Crunchyroll_2020 == 6] <- 360
DFN$Crunchyroll_2020[DFN$Crunchyroll_2020 == 7] <- 420
DFN$Crunchyroll_2020[DFN$Crunchyroll_2020 == 8] <- 480
DFN$Crunchyroll_2020[DFN$Crunchyroll_2020 == "9+"] <- 540
DFN$Crunchyroll_2020<- as.numeric(DFN$Crunchyroll_2020)
DFN$Spotify_2020[DFN$Spotify_2020 == "NU"] <- NA
DFN$Spotify_2020[DFN$Spotify_2020 == 1] <- 60
DFN$Spotify_2020[DFN$Spotify_2020 == 2] <- 120
DFN$Spotify_2020[DFN$Spotify_2020 == 3] <- 180
DFN$Spotify_2020[DFN$Spotify_2020 == 4] <- 240
DFN$Spotify_2020[DFN$Spotify_2020 == 5] <- 300
DFN$Spotify_2020[DFN$Spotify_2020 == 6] <- 360
DFN$Spotify_2020[DFN$Spotify_2020 == 7] <- 420
DFN$Spotify_2020[DFN$Spotify_2020 == 8] <- 480
DFN$Spotify_2020[DFN$Spotify_2020 == "9+"] <- 540
DFN$Spotify_2020<- as.numeric(DFN$Spotify_2020)
DFN$Foxsport_2020[DFN$Foxsport_2020 == "NU"] <- NA
DFN$Foxsport_2020[DFN$Foxsport_2020 == 1] <- 60
DFN$Foxsport_2020[DFN$Foxsport_2020 == 2] <- 120
DFN$Foxsport_2020[DFN$Foxsport_2020 == 3] <- 180
DFN$Foxsport_2020[DFN$Foxsport_2020 == 4] <- 240
DFN$Foxsport_2020[DFN$Foxsport_2020 == 5] <- 300
DFN$Foxsport_2020[DFN$Foxsport_2020 == 6] <- 360
DFN$Foxsport_2020[DFN$Foxsport_2020 == 7] <- 420
DFN$Foxsport_2020[DFN$Foxsport_2020 == 8] <- 480
DFN$Foxsport_2020[DFN$Foxsport_2020 == "9+"] <- 540
DFN$Foxsport_2020<- as.numeric(DFN$Foxsport_2020)
DFN$Hulu_2020[DFN$Hulu_2020 == "NU"] <- NA
DFN$Hulu_2020[DFN$Hulu_2020 == 1] <- 60
DFN$Hulu_2020[DFN$Hulu_2020 == 2] <- 120
DFN$Hulu_2020[DFN$Hulu_2020 == 3] <- 180
DFN$Hulu_2020[DFN$Hulu_2020 == 4] <- 240
DFN$Hulu_2020[DFN$Hulu_2020 == 5] <- 300
DFN$Hulu_2020[DFN$Hulu_2020 == 6] <- 360
DFN$Hulu_2020[DFN$Hulu_2020 == 7] <- 420
DFN$Hulu_2020[DFN$Hulu_2020 == 8] <- 480
DFN$Hulu_2020[DFN$Hulu_2020 == "9+"] <- 540
DFN$Hulu_2020<- as.numeric(DFN$Hulu_2020)
DFN$DirecTVgo_2020[DFN$DirecTVgo_2020 == "NU"] <- NA
DFN$DirecTVgo_2020[DFN$DirecTVgo_2020 == 1] <- 60
DFN$DirecTVgo_2020[DFN$DirecTVgo_2020 == 2] <- 120
DFN$DirecTVgo_2020[DFN$DirecTVgo_2020 == 3] <- 180
DFN$DirecTVgo_2020[DFN$DirecTVgo_2020 == 4] <- 240
DFN$DirecTVgo_2020[DFN$DirecTVgo_2020 == 5] <- 300
DFN$DirecTVgo_2020[DFN$DirecTVgo_2020 == 6] <- 360
DFN$DirecTVgo_2020[DFN$DirecTVgo_2020 == 7] <- 420
DFN$DirecTVgo_2020[DFN$DirecTVgo_2020 == 8] <- 480
DFN$DirecTVgo_2020[DFN$DirecTVgo_2020 == "9+"] <- 540
DFN$DirecTVgo_2020<- as.numeric(DFN$DirecTVgo_2020)
DFN$AmericaTVgo_2020[DFN$AmericaTVgo_2020 == "NU"] <- NA
DFN$AmericaTVgo_2020[DFN$AmericaTVgo_2020 == 1] <- 60
DFN$AmericaTVgo_2020[DFN$AmericaTVgo_2020 == 2] <- 120
DFN$AmericaTVgo_2020[DFN$AmericaTVgo_2020 == 3] <- 180
DFN$AmericaTVgo_2020[DFN$AmericaTVgo_2020 == 4] <- 240
DFN$AmericaTVgo_2020[DFN$AmericaTVgo_2020 == 5] <- 300
DFN$AmericaTVgo_2020[DFN$AmericaTVgo_2020 == 6] <- 360
DFN$AmericaTVgo_2020[DFN$AmericaTVgo_2020 == 7] <- 420
DFN$AmericaTVgo_2020[DFN$AmericaTVgo_2020 == 8] <- 480
DFN$AmericaTVgo_2020[DFN$AmericaTVgo_2020 == "9+"] <- 540
DFN$AmericaTVgo_2020<- as.numeric(DFN$AmericaTVgo_2020)
DFN$Precio_2020[DFN$Precio_2020 == "39.90"] <- 40
DFN$Precio_2020[DFN$Precio_2020 == "0"] <- NA
DFN$Precio_2020[DFN$Precio_2020 == "10 dólares"] <- 40
DFN$Precio_2020[DFN$Precio_2020 == "114 al mes"] <- 114
DFN$Precio_2020[DFN$Precio_2020 == "95 aprox"] <- 95
DFN$Precio_2020[DFN$Precio_2020 == "70soles"] <- 70
DFN$Precio_2020[DFN$Precio_2020 == "Q200"] <- 200
DFN$Precio_2020[DFN$Precio_2020 == "12 c/u"] <- 12
DFN$Precio_2020[DFN$Precio_2020 == "Netflix es la que tengo grupal, pero Disney plus y Movistar play es individual 300"] <- 300
DFN$Precio_2020[DFN$Precio_2020 == "10 so"] <- 10
DFN$Precio_2020[DFN$Precio_2020 == "40 soles"] <- 40
DFN$Precio_2020[DFN$Precio_2020 == "Entre Netflix y Spotify, 17 soles"] <- 17
DFN$Precio_2020[DFN$Precio_2020 == "No se paga por esos servicios"] <- NA
DFN$Precio_2020[DFN$Precio_2020 == "59.9"] <- 60
DFN$Precio_2020[DFN$Precio_2020 == "30soles"] <- 30
DFN$Precio_2020<- as.numeric(DFN$Precio_2020)
DFN$Time_service19[DFN$Time_service19 == "NU"] <- NA
DFN$Time_service19[DFN$Time_service19 == 1] <- 60
DFN$Time_service19[DFN$Time_service19 == 2] <- 120
DFN$Time_service19[DFN$Time_service19 == 3] <- 180
DFN$Time_service19[DFN$Time_service19 == 4] <- 240
DFN$Time_service19[DFN$Time_service19 == 5] <- 300
DFN$Time_service19[DFN$Time_service19 == 6] <- 360
DFN$Time_service19[DFN$Time_service19 == 7] <- 420
DFN$Time_service19[DFN$Time_service19 == 8] <- 480
DFN$Time_service19[DFN$Time_service19 == "9+"] <- 540
DFN$Time_service19<- as.numeric(DFN$Time_service19)
table(DFN$Time_service19)
## 
##  60 120 180 240 300 360 420 480 540 
##  22  27  20  23  13  15  23  11   3
DFN$Time_service20[DFN$Time_service20 == "NU"] <- NA
DFN$Time_service20[DFN$Time_service20 == 1] <- 60
DFN$Time_service20[DFN$Time_service20 == 2] <- 120
DFN$Time_service20[DFN$Time_service20 == 3] <- 180
DFN$Time_service20[DFN$Time_service20 == 4] <- 240
DFN$Time_service20[DFN$Time_service20 == 5] <- 300
DFN$Time_service20[DFN$Time_service20 == 6] <- 360
DFN$Time_service20[DFN$Time_service20 == 7] <- 420
DFN$Time_service20[DFN$Time_service20 == 8] <- 480
DFN$Time_service20[DFN$Time_service20 == "9+"] <- 540
DFN$Time_service20<- as.numeric(DFN$Time_service20)
DFN$Contenido[DFN$Contenido == "MÚSICA SALSA"] <- "Música"
DFN$Contenido[DFN$Contenido == "Animes, series, documentales,peliculas, transmisiones y podscas"] <- NA
DFN$Contenido[DFN$Contenido == "cualquier cosa"] <- NA
DFN$Contenido[DFN$Contenido == "Dibujitos o entretenimiento de juegos"] <- NA
DFN$Contenido[DFN$Contenido == "Series y películas"] <- NA
DFN$Contenido[DFN$Contenido == "Series y Películas"] <- NA
DFN$Contenido[DFN$Contenido == "Streams"] <- "Stream"
DFN$Contenido[DFN$Contenido == "Streams de Twich"] <- "Stream"
DFN$Contenido[DFN$Contenido == "Terror"] <- NA
DFN$Contenido[DFN$Contenido == "todos los anteriores"] <- NA
DFN$Contenido[DFN$Contenido == "Videojuegos"] <- "Stream"
DFN$Contenido[DFN$Contenido == "videos de entretenimiento"] <- NA
DFN$Contenido[DFN$Contenido == "Videos random"] <- NA
DFN$`Marca temporal` <- NULL
DFN$Identidad <- NULL
DFN$SyP_fav <- NULL
write.csv(DFN,'base_limpia.csv') #para guardad la limpieza en un csv
DF1 <- read_csv("Plataforma - Hoja 1.csv")
## Rows: 19 Columns: 4
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (1): PLATAFORMAS
## dbl (3): 2019, 2020, AOD
## 
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.

Funciones

Función del rango intercuartil

RIC <- function(x){
  return(as.numeric(quantile(x,0.75,na.rm=TRUE)-quantile(x,0.25,na.rm=TRUE)))
}

Función de coeficiente de variación

cv <- function(x){
  return(sd(x,na.rm=TRUE)/mean(x,na.rm=TRUE)*100)
}

Función de redondear a 2 decimales

r<- function(x){
  resul <- round(x,2)
  return(resul)
}

ANÁLISIS DE VARIABLES

8. Descriptores numéricos

table(is.na(DFN))
## 
## FALSE  TRUE 
##  4041  4280
names(DFN)
##  [1] "Sexo"               "Edad"               "Universidad"       
##  [4] "Plataformas_2019"   "Time_service19"     "Netflix_2019"      
##  [7] "Youtube_2019"       "Youtube_p_2019"     "Movistar_play_2019"
## [10] "Zoom_2019"          "HBO_2019"           "Amazon_p_2019"     
## [13] "Twitch_2019"        "Disney_plus_2019"   "Fb_gaming_2019"    
## [16] "Claro_video_2019"   "Starplus_2019"      "Discord_2019"      
## [19] "Crunchyroll_2019"   "Spotify_2019"       "Foxsport_2019"     
## [22] "Hulu_2019"          "DirecTVgo_2019"     "AmericaTVgo_2019"  
## [25] "Contenido"          "Plataforma19"       "Precio_2019"       
## [28] "Nueva_plat_2020"    "Device"             "Netflix_2020"      
## [31] "Youtube_2020"       "Youtube_p_2020"     "Movistar_play_2020"
## [34] "Zoom_2020"          "HBO_2020"           "Amazon_p_2020"     
## [37] "Twitch_2020"        "Disney_plus_2020"   "Fb_gaming_2020"    
## [40] "Claro_video_2020"   "Starplus_2020"      "Discord_2020"      
## [43] "Crunchyroll_2020"   "Spotify_2020"       "Foxsport_2020"     
## [46] "Hulu_2020"          "DirecTVgo_2020"     "AmericaTVgo_2020"  
## [49] "Plataforma2020"     "Precio_2020"        "Time_service20"    
## [52] "Cine_a_stream"      "Traslado_plat"

Variable Sexo

table(DFN$Sexo)
## 
##  Femenino Masculino 
##        68        89
r(prop.table(table(DFN$Sexo))*100)
## 
##  Femenino Masculino 
##     43.31     56.69

Variable edad

Variable Moda Media Mediana IQR Mínimo Máximo Rango Coeficiente de Variación Varianza Desviación Estándar
Edad 19 20.23 19 1 16 50 34 0.19 14.04 3.75

Device

table(DFN$Device)
## 
##     Celular Computadora  Televisión 
##          73          57          27
r(prop.table(table(DFN$Device))*100)
## 
##     Celular Computadora  Televisión 
##       46.50       36.31       17.20

Forma de pago

table(DFN$Plataforma19)
## 
##   Grupal Personal 
##       90       67
r(prop.table(table(DFN$Plataforma19))*100)
## 
##   Grupal Personal 
##    57.32    42.68
table(DFN$Plataforma2020)
## 
##   Grupal Personal 
##       99       58
r(prop.table(table(DFN$Plataforma2020))*100)
## 
##   Grupal Personal 
##    63.06    36.94

Time_service19

Variable Moda Media Mediana IQR Mínimo Máximo Rango Coeficiente de Variación Varianza Desviación Estándar
Time_service19 120 251.85 240 240 60 540 480 0.56 1.963567^{4} 140.13

Time_service20

Variable Moda Media Mediana IQR Mínimo Máximo Rango Coeficiente de Variación Varianza Desviación Estándar
Time_service20 240 301.91 300 240 60 540 480 0.5 2.249633^{4} 149.99

Influencia de cines cerrados

Variable Moda Media Mediana IQR Mínimo Máximo Rango Coeficiente de Variación Varianza Desviación Estándar
Cine_a_stream 10 6.71 8 6 1 10 9 0.46 9.59 3.1

Influencia del contenido

Variable Moda Media Mediana IQR Mínimo Máximo Rango Coeficiente de Variación Varianza Desviación Estándar
Traslado_plat 6, 8 6.24 7 3 1 10 9 0.44 7.62 2.76

Plataformas del 2019

colSums(is.na(DFN[6:24]))
##       Netflix_2019       Youtube_2019     Youtube_p_2019 Movistar_play_2019 
##                 15                 10                138                128 
##          Zoom_2019           HBO_2019      Amazon_p_2019        Twitch_2019 
##                100                131                132                115 
##   Disney_plus_2019     Fb_gaming_2019   Claro_video_2019      Starplus_2019 
##                135                135                146                147 
##       Discord_2019   Crunchyroll_2019       Spotify_2019      Foxsport_2019 
##                100                137                 58                139 
##          Hulu_2019     DirecTVgo_2019   AmericaTVgo_2019 
##                151                137                139

Trabajaremos con las 5 variables que tengan menor cantidad de datos incompletos

#De menos a más datos incompletos
colSums(is.na(DFN[7]))
## Youtube_2019 
##           10
colSums(is.na(DFN[6]))
## Netflix_2019 
##           15
colSums(is.na(DFN[20]))
## Spotify_2019 
##           58
colSums(is.na(DFN[10]))
## Zoom_2019 
##       100
colSums(is.na(DFN[18]))
## Discord_2019 
##          100

Youtube 2019

Variable Moda Media Mediana IQR Mínimo Máximo Rango Coeficiente de Variación Varianza Desviación Estándar
Youtube_2019 60 131.02 60 135 20 540 520 0.92 1.465169^{4} 121.04

Netflix 2019

Variable Moda Media Mediana IQR Mínimo Máximo Rango Coeficiente de Variación Varianza Desviación Estándar
Netflix_2019 60 119.4 60 120 20 540 520 0.94 1.259024^{4} 112.21

Spotify 2019

Variable Moda Media Mediana IQR Mínimo Máximo Rango Coeficiente de Variación Varianza Desviación Estándar
Spotify_2019 60 127.83 60 135 20 540 520 0.98 1.553478^{4} 124.64

Zoom 2019

Variable Moda Media Mediana IQR Mínimo Máximo Rango Coeficiente de Variación Varianza Desviación Estándar
Zoom_2019 45 151.58 60 195 20 540 520 1.09 2.746353^{4} 165.72

Discord 2019

Variable Moda Media Mediana IQR Mínimo Máximo Rango Coeficiente de Variación Varianza Desviación Estándar
Discord_2019 20 93.51 45 40 20 540 520 1.32 1.535086^{4} 123.9

` ### Plataformas del 2020

colSums(is.na(DFN[31:49]))
##       Youtube_2020     Youtube_p_2020 Movistar_play_2020          Zoom_2020 
##                 17                138                124                 38 
##           HBO_2020      Amazon_p_2020        Twitch_2020   Disney_plus_2020 
##                124                108                102                100 
##     Fb_gaming_2020   Claro_video_2020      Starplus_2020       Discord_2020 
##                133                149                149                 72 
##   Crunchyroll_2020       Spotify_2020      Foxsport_2020          Hulu_2020 
##                127                 60                143                151 
##     DirecTVgo_2020   AmericaTVgo_2020     Plataforma2020 
##                139                143                  0

Trabajaremos con las 5 variables que tengan menor cantidad de datos incompletos

#De menos a más datos incompletos
colSums(is.na(DFN[32]))
## Youtube_p_2020 
##            138
colSums(is.na(DFN[31]))
## Youtube_2020 
##           17
colSums(is.na(DFN[35]))
## HBO_2020 
##      124
colSums(is.na(DFN[45]))
## Foxsport_2020 
##           143
colSums(is.na(DFN[43]))
## Crunchyroll_2020 
##              127

Youtube 2020

Variable Moda Media Mediana IQR Mínimo Máximo Rango Coeficiente de Variación Varianza Desviación Estándar
Youtube_2020 60 146.29 120 195 20 540 520 0.9 1.745157^{4} 132.1

Netflix 2020

Variable Moda Media Mediana IQR Mínimo Máximo Rango Coeficiente de Variación Varianza Desviación Estándar
Netflix_2020 60 128.8 60 135 20 540 520 0.92 1.418889^{4} 119.12

Zoom 2020

Variable Moda Media Mediana IQR Mínimo Máximo Rango Coeficiente de Variación Varianza Desviación Estándar
Zoom_2020 360 241.6 240 300 20 540 520 0.63 2.302667^{4} 151.75

Spotify 2020

Variable Moda Media Mediana IQR Mínimo Máximo Rango Coeficiente de Variación Varianza Desviación Estándar
Spotify_2020 45 134.02 60 135 20 540 520 0.97 1.686596^{4} 129.87

Discord 2020

Variable Moda Media Mediana IQR Mínimo Máximo Rango Coeficiente de Variación Varianza Desviación Estándar
Discord_2020 45 118.88 60 75 20 540 520 1.07 1.618594^{4} 127.22

####Precio 2019

Variable Moda Media Mediana IQR Mínimo Máximo Rango Coeficiente de Variación Varianza Desviación Estándar
Precio_2019 30 52.01 35 25 0 600 600 1.44 5610.13 74.9

Precio 2020

Variable Moda Media Mediana IQR Mínimo Máximo Rango Coeficiente de Variación Varianza Desviación Estándar
Precio_2020 50 60.36 42 35 5 468 463 1.16 4865.28 69.75

Análisis de la variables

Variable Análisis
Sexo Al realizar la encuesta obtenemos que los hombres participaron más teniendo así un 56.41% , en cambio en el caso de la mujeres fue un 43.59%.
Edad La mayor cantidad de encuestados fue de 19 años, no obstante la media de todo el espacio muestral fue de 20.24 años ya que el rango de edad fue de 34 años, donde el mínimo fue de 16 años y el máximo de 50 años.
Device La mayor cantidad de encuestados prefiere ver el contenido de estas plataformas streaming mediante un celular , obteniendo así un 46.79% , mientras que un 35.90% prefiere por computadora y un 17.31% prefiere por televisión.
Forma de pago La forma de pago que prefieren la mayor cantidad de encuestados es grupal ya que así se pueden dividir los pagos , obteniendo un 62.82%, mientras que un 37.18% prefiere tener una cuenta personal
Time service 19 y Time service 20 Según la moda, la mayoria de los encuestados ha pasado más tiempo en las plataformas en el 2020 , eso lo podemos observar con ayuda de la media ya que en el 2019 los encuestados pasan 265.77 minutos mientrs que en el 2020 los encuestados pasaron 281.15 minutos.
Porcentaje de películas A los encuestados el no ir al cine durante el confinamiento social les afectó entre un 60% - 70% para que empiecen a usar las plataformas de streaming.
Translado plat Según la moda, influyó mucho la actualización de contenido en las plataformas para que los encuestados puedan trasladarse a otras plataformas de streaming.
Plataformas del 2019 Según los resultados de la encuesta, la plataforma de youtube es la más conocida ya que tuvo menos no utilizo por parte de nuestros encuestados, mientras que la plataforma de zoom es la plataforma que más tiempo a sido usado ya que su promedio del tiempo de uso es el más alto entre las 5 plataformas más conocidas del 2019.
Plataformas del 2020 Mismo caso que en el 2019, siendo Youtube siendo la plataforma de streaming más conocida pero Zoom siendo la más usada.
Precio 2019 y 2020 Según la moda, podemos observar que las personas encuestados no gastaban por las plataformas de streaming en el 2019, en cambio en el 2020 si hubo un mayoría crecimiento al momento de pagar por estas plataformas

Descriptores numéricos de interacción entre variables.

# Precio 2019 y Edad
cor(DFN$Precio_2019,DFN$Edad, use = "complete.obs")
## [1] 0.2488227
cov(DFN$Precio_2019,DFN$Edad, use = "complete.obs")
## [1] 73.30149
# Precio 2020 y Edad

cor(DFN$Precio_2020,DFN$Edad, use = "complete.obs")
## [1] 0.2072975
cov(DFN$Precio_2020,DFN$Edad, use = "complete.obs")
## [1] 56.08141
# Time service 2019 y Edad

cor(DFN$Time_service19,DFN$Edad, use = "complete.obs")
## [1] -0.06967671
cov(DFN$Time_service19,DFN$Edad, use = "complete.obs")
## [1] -36.58011
# Time service 2020 y Edad

cor(DFN$Time_service20,DFN$Edad, use = "complete.obs")
## [1] -0.0829177
cov(DFN$Time_service20,DFN$Edad, use = "complete.obs")
## [1] -46.59481
# Cine a stream y Edad


cor(DFN$Cine_a_stream, DFN$Edad, use = "complete.obs")
## [1] -0.1092166

Análisis de la variables

Variable Análisis
Precio - Edad Vemos como que a medida que una persona que tenga más años esta dispuesto a pagar más ya sea por los recursos o por la cantidad de plataformas que tiene.
Time Service - Edad El mayor tiempo se va a observar en el rango de menor edad en los 2 años. Por lo que, se puede decir que podríamos decir que los de menor edad tienen mayor tiempo para usar plataformas de steaming.
Cine a stream - Edad Vemos que donde se generó mayor puntuación, sobre el efecto de los cines cerrados en el incremento de las plataformas, ha sido en los jóvenes que los estudiantes adultos.

9. Descriptores gráficos

Edad

boxplot(DFN$Edad, horizontal = T,main="Diagrama de caja de la edad de nuestra población",col = c("orange"))  # con horizontal = T coloca el boxplot de manera horizontal. El defecto es vertical

Análisis

En este gráfico se puede observar que el 50% de los encuestados tiene aproximadamente entre 19 y casi 20 años. Además, se muestran 12 casos atípicos

Device

barplot(table(DFN$Device), main="Preferencia de dispositivos", col=c("red","green","yellow"),ylim = c(0,80),xlab = "Dispositivo", ylab = "Número de personas")

grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

Análisis

En este gráfico se puede observar que hay un mayor número de personas que prefieren hacer uso de las plataformas de streaming mediante un celular. Por otro lado, hay un menor número de personas que prefieren usar las plataformas de streaming a través de la televisión.

Plataformas

DFN %>% select(Sexo,"Netflix_2019":"Amazon_p_2019") %>%
  pivot_longer("Netflix_2019":"Amazon_p_2019",
               names_to="Tipo de Plataforma 2019",
               values_to="Tiempo") %>%
  ggplot(.,aes(x=`Tipo de Plataforma 2019`,y=`Tiempo`)) + geom_bar(stat = "identity")+facet_wrap(~Sexo,nrow=2)
## Warning: Removed 654 rows containing missing values (position_stack).

DFN %>% select(Sexo,"Netflix_2019":"Amazon_p_2019") %>%
  pivot_longer("Netflix_2019":"Amazon_p_2019",
               names_to="Tipo de Plataforma 2019",
               values_to="Tiempo") %>%
  ggplot(.,aes(x=`Tipo de Plataforma 2019`,y=`Tiempo`)) + geom_boxplot()+facet_wrap(~Sexo,nrow=2)
## Warning: Removed 654 rows containing non-finite values (stat_boxplot).

DFN %>% select(Sexo,"Twitch_2019":"Discord_2019") %>%
  pivot_longer("Twitch_2019":"Discord_2019",
               names_to="Tipo de Plataforma 2019",
               values_to="Tiempo") %>%
  ggplot(.,aes(x=`Tipo de Plataforma 2019`,y=`Tiempo` )) + geom_bar(stat = "identity")+facet_wrap(~Sexo,nrow=2)
## Warning: Removed 778 rows containing missing values (position_stack).

DFN %>% select(Sexo,"Twitch_2019":"Discord_2019") %>%
  pivot_longer("Twitch_2019":"Discord_2019",
               names_to="Tipo de Plataforma 2019",
               values_to="Tiempo") %>%
  ggplot(.,aes(x=`Tipo de Plataforma 2019`,y=`Tiempo` )) + geom_boxplot()+facet_wrap(~Sexo,nrow=2)
## Warning: Removed 778 rows containing non-finite values (stat_boxplot).

DFN %>% select(Sexo,"Crunchyroll_2019":"AmericaTVgo_2019") %>%
  pivot_longer("Crunchyroll_2019":"AmericaTVgo_2019",
               names_to="Tipo de Plataforma 2019",
               values_to="Tiempo") %>%
  ggplot(.,aes(x=`Tipo de Plataforma 2019`,y=`Tiempo`)) + geom_bar(stat = "identity")+facet_wrap(~Sexo,nrow=2)
## Warning: Removed 761 rows containing missing values (position_stack).

DFN %>% select(Sexo,"Crunchyroll_2019":"AmericaTVgo_2019") %>%
  pivot_longer("Crunchyroll_2019":"AmericaTVgo_2019",
               names_to="Tipo de Plataforma 2019",
               values_to="Tiempo") %>%
  ggplot(.,aes(x=`Tipo de Plataforma 2019`,y=`Tiempo`)) + geom_boxplot()+facet_wrap(~Sexo,nrow=2)
## Warning: Removed 761 rows containing non-finite values (stat_boxplot).

DFN %>% select(Sexo,"Netflix_2020":"Amazon_p_2020") %>%
  pivot_longer("Netflix_2020":"Amazon_p_2020",
               names_to="Tipo de Plataforma 2020",
               values_to="Tiempo") %>%
  ggplot(.,aes(x=`Tipo de Plataforma 2020`,y=`Tiempo`)) + geom_bar(stat = "identity")+facet_wrap(~Sexo,nrow=2)
## Warning: Removed 568 rows containing missing values (position_stack).

DFN %>% select(Sexo,"Netflix_2020":"Amazon_p_2020") %>%
  pivot_longer("Netflix_2020":"Amazon_p_2020",
               names_to="Tipo de Plataforma 2020",
               values_to="Tiempo") %>%
  ggplot(.,aes(x=`Tipo de Plataforma 2020`,y=`Tiempo`)) + geom_boxplot()+facet_wrap(~Sexo,nrow=2)
## Warning: Removed 568 rows containing non-finite values (stat_boxplot).

DFN %>% select(Sexo,"Twitch_2020":"Discord_2020") %>%
  pivot_longer("Twitch_2020":"Discord_2020",
               names_to="Tipo de Plataforma 2020",
               values_to="Tiempo") %>%
  ggplot(.,aes(x=`Tipo de Plataforma 2020`,y=`Tiempo` )) + geom_bar(stat = "identity")+facet_wrap(~Sexo,nrow=2)
## Warning: Removed 705 rows containing missing values (position_stack).

DFN %>% select(Sexo,"Twitch_2020":"Discord_2020") %>%
  pivot_longer("Twitch_2020":"Discord_2020",
               names_to="Tipo de Plataforma 2020",
               values_to="Tiempo") %>%
  ggplot(.,aes(x=`Tipo de Plataforma 2020`,y=`Tiempo` )) + geom_boxplot()+facet_wrap(~Sexo,nrow=2)
## Warning: Removed 705 rows containing non-finite values (stat_boxplot).

DFN %>% select(Sexo,"Crunchyroll_2020":"AmericaTVgo_2020") %>%
  pivot_longer("Crunchyroll_2020":"AmericaTVgo_2020",
               names_to="Tipo de Plataforma 2020",
               values_to="Tiempo") %>%
  ggplot(.,aes(x=`Tipo de Plataforma 2020`,y=`Tiempo`)) + geom_bar(stat = "identity")+facet_wrap(~Sexo,nrow=2)
## Warning: Removed 763 rows containing missing values (position_stack).

DFN %>% select(Sexo,"Crunchyroll_2020":"AmericaTVgo_2020") %>%
  pivot_longer("Crunchyroll_2020":"AmericaTVgo_2020",
               names_to="Tipo de Plataforma 2020",
               values_to="Tiempo") %>%
  ggplot(.,aes(x=`Tipo de Plataforma 2020`,y=`Tiempo`)) + geom_boxplot()+facet_wrap(~Sexo,nrow=2)
## Warning: Removed 763 rows containing non-finite values (stat_boxplot).

Análisis

Se puede concluir observando las gráficas que el sexo femenino utilizó más tiempo la plataforma de Netflix en el año 2019, mientras que el sexo masculino utilizó más tiempo la plataforma de YouTube durante el 2019. Por otro lado, se puede observar que ambos sexos utilizaron la plataforma de Zoom por más tiempo en el año 2020.

Tiempo de las plataformas más conocidas en el 2019

op <- par(mfrow = c(2,3))
net<-table(DFN$Youtube_2019)
hist<-barplot(net,main="Usuarios de Youtube en el 2019",xlab="Tiempo empleado",ylab="Número de personas",col=c("lightgreen","lightblue"),ylim = c(0, 30),las=2)
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

net1<-table(DFN$Netflix_2019)
hist1<-barplot(net1,main="Usuarios de Netflix en el 2019",xlab="Tiempo empleado",ylab="Número de personas",col=c("lightgreen","lightblue"),ylim = c(0, 50),las=2)
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

net2<-table(DFN$Spotify_2019)
hist2<-barplot(net2,main="Usuarios de Spotify en el 2019",xlab="Tiempo empleado",ylab="Número de personas",col=c("lightgreen","lightblue"),ylim = c(0, 25),las=2)
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

net3<-table(DFN$Zoom_2019)
hist3<-barplot(net3,main="Usuarios de Zoom en el 2019",xlab="Tiempo empleado",ylab="Número de personas",col=c("lightgreen","lightblue"),ylim = c(0, 17),las=2)
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")


net4<-table(DFN$Discord_2019 )
hist4<-barplot(net4,main="Usuarios de Discord en el 2019",xlab="Tiempo empleado",ylab="Número de personas",col=c("lightgreen","lightblue"),ylim = c(0, 30))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

Análisis

Observamos que aproximadamente 28 personas utilizaban la plataforma de YouTube en el 2019 por 60 minutos al día. Observamos que aproximadamente 47 personas utilizaban la plataforma de Netflix en el 2019 por 60 minutos al día. Observamos que aproximadamente 24 personas utilizaban la plataforma de Spotify en el 2019 por 60 minutos al día. Observamos que 15 personas utilizaban la plataforma de Zoom en el 2019 por 45 minutos al día. Observamos que aproximadamente 17 personas utilizaban la plataforma de Discord en el 2019 entre 20 a 60 minutos al día.

Tiempo de las plataformas más conocidas en el 2020

op <- par(mfrow = c(2,3))
net5<-table(DFN$Youtube_2020)
hist5<-barplot(net5,main="Usuarios de Youtube en el 2020",xlab="Tiempo empleado",ylab="Número de personas",col=c("blue","orange"),ylim = c(0, 35),las=2)
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

net6<-table(DFN$Netflix_2020)
hist6<-barplot(net6,main="Usuarios de Netflix en el 2020",xlab="Tiempo empleado",ylab="Número de personas",col=c("blue","orange"),ylim = c(0, 35),las=2)
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

net7<-table(DFN$Zoom_2020)
hist7<-barplot(net7,main="Usuarios de Zoom en el 2020",xlab="Tiempo empleado",ylab="Número de personas",col=c("blue","orange"),ylim = c(0, 25),las=2)
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

net8<-table(DFN$Spotify_2020)
hist8<-barplot(net8,main="Usuarios de Spotify en el 2020",xlab="Tiempo empleado",ylab="Número de personas",col=c("blue","orange"),ylim = c(0, 25),las=2)
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

net9<-table(DFN$Discord_2020)
hist9<-barplot(net9,main="Usuarios de Discord en el 2020",xlab="Tiempo empleado",ylab="Número de personas",col=c("blue","orange"),ylim = c(0, 25),las=2)
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

Análisis

Observamos que aproximadamente 33 personas utilizaban la plataforma de YouTube en el 2020 por 60 minutos al día. Observamos que aproximadamente 33 personas utilizaban la plataforma de Netflix en el 2020 por 60 minutos al día. Observamos que aproximadamente 22 personas utilizaban la plataforma de Zoom en el 2020 por 360 minutos al día. Observamos que aproximadamente 24 personas utilizaban la plataforma de Spotify en el 2020 por 45 minutos al día Observamos que aproximadamente 21 personas utilizaban la plataforma de Discord en el 2020 por 45 minutos al día

Plataforma más usada 2019

p19u <- table(DFN$Zoom_2019)
P_19U <- DFN$Zoom_2019
hist(P_19U, freq = T,main="Zoom 2019",  col=c("yellow","skyblue"), xlab="Minutos",ylab="Número de personas",ylim=c(0,40))

Análisis

Podemos observar gráficamente que la plataforma de zoom ha sido utilizado por aproximadamente 33 personas entre los 0 a 100 minutos al día.

Plataforma más usada 2020

p20u <- table(DFN$Zoom_2020)
P_20U <- DFN$Zoom_2020
hist(P_20U, freq = T,main="Zoom 2020",  col=c("yellow","skyblue"), xlab="Minutos",ylab="Número de personas",ylim=c(0,30))

op <- par(mfrow = c(1,2))
plot(DFN$Zoom_2019~DFN$Edad,main = "Zoom 2019" ,xlab = "Edad", ylab = "Tiempo")
plot(DFN$Zoom_2020~DFN$Edad,main = "Zoom 2020" ,xlab = "Edad", ylab = "Tiempo")

Análisis

Se observa gráficamente que la plataforma de zoom ha sido utilizado por aproximadamente 23 personas entre 350 a 400 minutos al día.

Precio

precio19 <- table(DFN$Precio_2019)
hist(DFN$Precio_2019, main = "Histograma de Precio 2019", ylab = "Número de personas", col = "lightblue", ylim= c(0,120), xlab = "Precio 2019")

precio20 <- table(DFN$Precio_2020)
hist(DFN$Precio_2020, main = "Histograma de Precio 2020", ylab = "Número de personas", col = "lightgreen", ylim= c(0,100), xlab = "Precio 2020")

op <- par(mfrow = c(1,2))
plot(DFN$Precio_2019~DFN$Edad, xlab = "Edad", ylab = "Soles",main="Precio 2019")
plot(DFN$Precio_2020~DFN$Edad,xlab = "Edad", ylab = "Soles",main="Precio 2020")

Análisis Para 2019: Se observa en la gráfica que entre 110 a 120 personas encuestadas gastaban como máximo alrededor de 50 soles al mes por las plataformas de streaming el 2019, siendo muy poca persona que pagaba entre 550 a 600 soles.

Para 2020: Se observa en la gráfica que aproximadamente 98 personas encuestadas gastaban como máximo alrededor de 50 soles al mes por las plataformas de streaming el 2020, vemos que muy pocas personas pagaban entre 400 a 500.

Vemos que tenemos más datos atípicos en el 2019 que en el 2020, se observa que en el 2019 existía un grupo de jóvenes entre 15 a 25 años que pagaban entre 0 a 100 soles además que en este rango se puede ver que una persona llego a pagar alrededor de 600 soles, pero en el 2020 vemos en este mismo grupo vemos que se disipo, haciendo que más jóvenes pagaran ente 150 a 200; además que el pago máximo se redujo del 600 soles a 450.

Forma de pago

op <- par(mfrow = c(1,2))
pag19<-table(DFN$Plataforma19)
barplot(pag19, main="Formas de pago en el 2019", col=c("skyblue","yellow"),ylim = c(0, 110))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")
pag20<-table(DFN$Plataforma2020)
barplot(pag20, main="Formas de pago en el 2020", col=c("skyblue","yellow"),ylim = c(0, 110))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

op <- par(mfrow = c(1,2))
boxplot(DFN$Precio_2019~ DFN$Plataforma19,col = c("green","red"),cex.main = 0.8,
        main = "Precio - Forma de pago 2019", horizontal = F,ylab="Precio", xlab="Forma de pago")
boxplot(DFN$Precio_2020~ DFN$Plataforma2020, col = c("green","red"),cex.main = 0.8,
        main = "Precio - Forma de pago 2020", horizontal = F,ylab="Precio", xlab="Forma de pago")

Análisis

Podemos observar de manera evidente que la gran mayoría de los encuestados prefieren pagar las plataformas de streaming de manera grupal. Esto puede ser debido a que no quieren gastar mucho dinero y les sale más económico pagarlo de forma grupal. Además, esto se confirma en el diagrama de caja donde las personas que hacen pago individual gastan menos que las personas hacen pago de manera individual.

Time Service 2019

time19<-table(DFN$Time_service19)
barplot(time19 , main="Tiempo en promedio por día en el 2019", col=c("skyblue","green"),ylim = c(0, 30))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

Análisis

Se puede observar que aproximadamente de 24 personas pasan alrededor de 100 a 150 minutos al día en las plataformas de streaming.

x <- DFN$Time_service19
hist(x, freq = T,main="Tiempo en promedio por día en el 2019",  col=c("yellow","skyblue"), xlab="Minutos",ylab="Número de personas",ylim=c(0,30))

grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

Time Service 2020

time20<-table(DFN$Time_service20)
barplot(time20 , main="Tiempo en promedio por día en el 2020", col=c("skyblue","green"),ylim = c(0, 30), xlab="Minutos")
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

Análisis

Se puede observar que aproximadamente de 26 personas pasan alrededor de 200 a 250 minutos al día en las plataformas de streaming.

x <- DFN$Time_service20
hist(x, freq = T,main="Tiempo en promedio por día en el 2020",  col=c("yellow","skyblue"), xlab="Minutos ",ylab="Número de personas",ylim=c(0,30))

grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

op <- par(mfrow = c(1,2))
boxplot(DFN$Time_service19, main="Minutos en una plataforma en 2019",cex.main=0.9,col=c("blue"))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")
boxplot(DFN$Time_service20,main="Minutos en una plataforma en 2020",cex.main=0.9,col=c("red"))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

Análisis

Se puede observar que en promedio a todos los encuestados, pasan 240 minutos al día en las plataformas de streaming. Eso quiere decir, que durante la cuarentena los encuestados han pasado más tiempo en estas plataformas.

Contenido

ggplot(DFN, aes(Contenido, fill=Contenido)) +
  geom_bar() +
  labs(title="Diagrama de barras",
       x= "Contendio",
       y=NULL) +
  
  geom_text(stat='count',aes(label=..count..), vjust=-0.5, size=3) 

Análisis

Como se puede observar de manera evidente, la gran mayoría de los encuestados prefieren el contenido de series en estas plataformas de streaming.

Incremento

barplot(DF1$`2019`[1:5]~DF1$PLATAFORMAS[1:5], main = "Cantidad de personas 2019",
        col = rainbow(6),xlab = "Plataforma", ylab = "Número de personas",border = "black",
        legend.text = c("Movistar Play","Netflix","Youtube","Youtube Premium","Zoom"),
        args.legend = list(title = "Plataforma",horiz = T, x = "top",  cex = 0.55),ylim = c(0, 160))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

barplot(DF1$`2020`[1:5]~DF1$PLATAFORMAS[1:5],main = "Cantidad de personas 2020",
        col = rainbow(6),xlab = "Plataforma", ylab = "Número de personas",border = "black",
        legend.text = c("Movistar Play","Netflix","Youtube","Youtube Premium","Zoom"),
        args.legend = list(title = "Plataforma",horiz = T, x = "top",  cex = 0.55),ylim = c(0, 100))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

barplot(DF1$AOD[1:5]~DF1$PLATAFORMAS[1:5],main = "Crecimiento de personas entre 2019-2020",
        col = rainbow(6),xlab = "Plataforma", ylab = "Número de personas",border = "black",
        legend.text = c("Movistar Play","Netflix","Youtube","Youtube Premium","Zoom"),
        args.legend = list(title = "Plataforma",horiz = T, x = "top",  cex = 0.55),ylim = c(-100, 55))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

Análisis: La gráfica refleja un incremento de aproximadamente 30 personas para la plataforma de Zoom entre el año 2019 y 2020 a comparación de las otras plataformas.

barplot(DF1$`2019`[6:9]~DF1$PLATAFORMAS[6:9], main = "Cantidad de personas 2019",
        col = rainbow(6),xlab = "Plataforma", ylab = "Número de personas",border = "black",
        legend.text = c("Amazon Prime Video","Disney Plus","HBO","Twitch"),
        args.legend = list(title = "Plataforma",horiz = T, x = "top",  cex = 0.55),ylim = c(0, 50))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

barplot(DF1$`2020`[6:9]~DF1$PLATAFORMAS[6:9],main = "Cantidad de personas 2020",
        col = rainbow(6),xlab = "Plataforma", ylab = "Número de personas",border = "black",
        legend.text = c("Amazon Prime Video","Disney Plus","HBO","Twitch"),
        args.legend = list(title = "Plataforma",horiz = T, x = "top",  cex = 0.55),ylim = c(0, 70))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

barplot(DF1$AOD[6:9]~DF1$PLATAFORMAS[6:9],main = "Crecimiento de personas entre 2019-2020",
        col = rainbow(6),xlab = "Plataforma", ylab = "Número de personas",border = "black",
        legend.text = c("Amazon Prime Video","Disney Plus","HBO","Twitch"),
        args.legend = list(title = "Plataforma",horiz = T, x = "top",  cex = 0.55),ylim = c(0, 50))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

Análisis: La gráfica refleja un incremento de aproximadamente 31 personas para la plataforma de Disney plus desde el año 2019 al 2020, además la plataforma de Amazon Primer Video tuvo un incremento de 19 personas entre 2019 y 2020.

barplot(DF1$`2019`[10:13]~DF1$PLATAFORMAS[10:13], main = "Cantidad de personas 2019",
        col = rainbow(6),xlab = "Plataforma", ylab = "Número de personas",border = "black",
        legend.text = c("Claro Video","Discord","Facebook Gaming","Star Plus"),
        args.legend = list(title = "Plataforma",horiz = T, x = "top",  cex = 0.55),ylim = c(0, 70))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

barplot(DF1$`2020`[10:13]~DF1$PLATAFORMAS[10:13],main = "Cantidad de personas 2020",
        col = rainbow(6),xlab = "Plataforma", ylab = "Número de personas",border = "black",
        legend.text = c("Claro Video","Discord","Facebook Gaming","Star Plus"),
        args.legend = list(title = "Plataforma",horiz = T, x = "top",  cex = 0.55),ylim = c(0, 70))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

Análisis

La gráfica refleja un incremento pequeño de aproximadamente 2 personas para la plataforma de Discord entre el 2019 y 2020 a comparación de las otras plataformas.

barplot(DF1$`2019`[14:17]~DF1$PLATAFORMAS[14:17], main = "Cantidad de personas 2019",
        col = rainbow(6),xlab = "Plataforma", ylab = "Número de personas",border = "black",
        legend.text = c("Crunchyroll","Fox Sport","Hulu","Spotify"),
        args.legend = list(title = "Plataforma",horiz = T, x = "top",  cex = 0.55),ylim = c(0, 120))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

barplot(DF1$`2020`[14:17]~DF1$PLATAFORMAS[14:17],main = "Cantidad de personas 2020",
        col = rainbow(6),xlab = "Plataforma", ylab = "Número de personas",border = "black",
        legend.text = c("Crunchyroll","Fox Sport","Hulu","Spotify"),
        args.legend = list(title = "Plataforma",horiz = T, x = "top",  cex = 0.55),ylim = c(0, 50))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

barplot(DF1$AOD[14:17]~DF1$PLATAFORMAS[14:17],main = "Crecimiento de personas entre 2019-2020",
        col = rainbow(6),xlab = "Plataforma", ylab = "Número de personas",border = "black",
        legend.text = c("Crunchyroll","Fox Sport","Hulu","Spotify"),
        args.legend = list(title = "Plataforma",horiz = T, x = "top",  cex = 0.55),ylim = c(-80, 30))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

Análisis

La gráfica refleja un pequeño incremento de aproximadamente 2 personas para la plataforma de Crunchyroll entre el 2019 y 2020 a comparación de las otras plataformas.

barplot(DF1$`2019`[18:19]~DF1$PLATAFORMAS[18:19], main = "Cantidad de personas 2019",
        col = rainbow(6),xlab = "Plataforma", ylab = "Número de personas",border = "black",
        legend.text = c("America TV Go","Direct TV Go"),
        args.legend = list(title = "Plataforma",horiz = T, x = "top",  cex = 0.55),ylim = c(0, 25))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

barplot(DF1$`2020`[18:19]~DF1$PLATAFORMAS[18:19],main = "Cantidad de personas 2020",
        col = rainbow(6),xlab = "Plataforma", ylab = "Número de personas",border = "black",
        legend.text = c("America TV Go","Direct TV Go"),
        args.legend = list(title = "Plataforma",horiz = T, x = "top",  cex = 0.55),ylim = c(0, 15))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

barplot(DF1$AOD[18:19]~DF1$PLATAFORMAS[18:19],main = "Crecimiento de personas entre 2019-2020",
        col = rainbow(6),xlab = "Plataforma", ylab = "Número de personas",border = "black",
        legend.text = c("America TV Go","Direct TV Go"),
        args.legend = list(title = "Plataforma",horiz = T, x = "top",  cex = 0.55),ylim = c(-20, 10))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

Análisis

La grafica refleja que ninguna de estas plataformas tuvo un incremento entre el 2019 y 2020.

Influencia

barplot(table(DFN$Cine_a_stream),main = "Influencia del cines cerrados",
        col = "blue",xlab = "Puntuación", ylab = "Número de personas",border = "black",ylim = c(0, 50))

Análisis

Se puede observar que aproximadamente entre 70 a 80 personas les afectó, entre un 8 a 10, el no poder ir a los cines, debido al confinamiento en el 2020, ocasionando que muchos empezar a utilizar las plataformas de streaming.

barplot(table(DFN$Traslado_plat),main = "Influencia la actualización del contenido",
        col = "red",xlab = "Puntuación", ylab = "Número de personas",border = "black")

Análisis

La gráfica nos muestra que aproximadamente 27 personas consideraban que el contenido que tenían las plataformas influenciaba para que así puedas empezar a usar otras.

TENDENCIAS

10. Patrones

Plataforma más usada

op <- par(mfrow = c(1,2))

hist(P_19U, freq = T,main="Zoom 2019",  col=c("yellow","skyblue"), xlab="Minutos",ylab="Número de personas",ylim=c(0,40))
hist(P_20U, freq = T,main="Zoom 2020",  col=c("yellow","skyblue"), xlab="Minutos",ylab="Número de personas",ylim=c(0,30))

Patrón

2019: En la gráfica se muestra la relación entre la variable número de personas que representará la variable dependiente “y” y la variable tiempo de uso en minutos que será la variable independiente “x”. La gráfica muestra que a medida que hay más tiempo usando está la plataforma al día la cantidad de personas disminución; hay más personas permaneciendo menos minutos.

2020: La gráfica superior se muestra la relación entre la variable número de personas que representará la variable dependiente “y” y la variable tiempo de uso en minutos que será la variable independiente “x”. Asimismo, la gráfica muestra que el tiempo donde más personas usan la plataforma de streaming es aproximadamente entre 350 y 400 minutos al día, mientras que entre 400 y 450, 500 y 550 se suele usar menos tiempo las plataformas de streaming.

Precio

op <- par(mfrow = c(1,2))
plot(DFN$Precio_2019~DFN$Edad, xlab = "Edad", ylab = "Soles",main="Precio 2019")
plot(DFN$Precio_2020~DFN$Edad,xlab = "Edad", ylab = "Soles",main="Precio 2020")

Patrón

En la gráfica superior se muestra la relación entre la variable número de personas que representará la variable dependiente “y” y la variable tiempo de uso en minutos que será la variable independiente “x”. La gráfica muestra que a medida que hay más tiempo usando está la plataforma al día la cantidad de personas disminución; hay más personas permaneciendo menos minutos.

Tiempo

op <- par(mfrow = c(1,2))
boxplot(DFN$Time_service19, main="Minutos en una plataforma en 2019",cex.main=0.9,col=c("blue"))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")
boxplot(DFN$Time_service20,main="Minutos en una plataforma en 2020",cex.main=0.9,col=c("red"))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

op <- par(mfrow = c(1,2))
plot(DFN$Time_service19~DFN$Edad, xlab = "Edad", ylab = "Min",main="Time 2019")
plot(DFN$Time_service20~DFN$Edad,xlab = "Edad", ylab = "Min",main="Time 2020")

Patrón

En las gráficas de tipo boxplot se muestran cómo es el tiempo diario que las personas utilizaron una plataforma, en minutos, en el 2019 y 2020. Podemos ver que durante todo el 2020 se incrementó el tiempo aproximadamente 60 minutos, 1 hora. Además, vemos cómo entre la edad de 15 a 25 años se presenta una mayor densidad de uso de plataformas de streaming. Así mismo, se incrementa más el tiempo, siendo en el 2019 donde más personas utilizaban una plataforma aproximadamente 100 minutos y en el 2020 subió a 300 minutos.

Mejor vista de tiempo, precio, edad

pairs(~DFN$Time_service19 + DFN$Precio_2019 + DF$Edad , col=4)

pairs(~DFN$Time_service20 + DFN$Precio_2020 + DF$Edad , col=2)

Forma de pago

op <- par(mfrow = c(1,2))
pag19<-table(DFN$Plataforma19)
barplot(pag19, main="Formas de pago en el 2019", col=c("skyblue","yellow"),ylim = c(0, 110))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")
pag20<-table(DFN$Plataforma2020)
barplot(pag20, main="Formas de pago en el 2020", col=c("skyblue","yellow"),ylim = c(0, 110))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

Patrón

En la siguiente gráfica superior se muestra la relación entre número de personas que representará la independiente “y” y la variable formas de pago que será la variable independiente “x”. Como se puede observar, en la gráfica que medida que los precios de las plataformas se incrementa las personas preferían pagar de manera grupal ya que así podrían reducir sus gastos a comparación si pagarían una plataforma de manera individual.

Influencia

barplot(table(DFN$Cine_a_stream),main = "Influencia del cines cerrados",
        col = "blue",xlab = "Puntuación", ylab = "Número de personas",border = "black",ylim = c(0, 50))

Patrón

En la gráfica superior se muestra la relación de número de personas que representará la variable dependiente “y” y la variable influencia que representará la variable independiente “x”. La gráfica nos muestra que a raíz de que los cines cerraron por el confinamiento hubo un incremento de personas que utilizaron más plataformas de streaming.

VARIABLES ALEATORIAS

11. Variables aleatorias

x <- DFN$Cine_a_stream
op <- par(mfrow = c(1,2))

# Creamos un histograma
hist(x, freq = FALSE,main="Influencia la actualización del contenido",cex.main=0.8, col=c("red","skyblue"), xlab="Puntuacion",ylab="Frecuencia")
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")


# Calculamos la densidad
dx <- density(x)

# Añadimos la línea de densidad
lines(dx, lwd = 2, col = "red")

# Curva de densidad sin histograma
plot(dx, lwd = 2, col = "red",
     main = "Densidad")

# Añadimos los datos con riudo en el eje X
rug(jitter(x))

x <- DFN$Traslado_plat
op <- par(mfrow = c(1,2))
# Creamos un histograma
hist(x, freq = FALSE,main="Influencia la actualización del contenido",cex.main=0.8, col=c("yellow","skyblue"), xlab="Minutos ",ylab="Frecuencia")
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")


# Calculamos la densidad
dx <- density(x)

# Añadimos la línea de densidad
lines(dx, lwd = 2, col = "red")

# Curva de densidad sin histograma
plot(dx, lwd = 2, col = "red",
     main = "Densidad")

# Añadimos los datos con riudo en el eje X
rug(jitter(x))

Bernoulli

# Plataforma 19
table(DFN$Plataforma19)
## 
##   Grupal Personal 
##       90       67
set.seed(156)                                  # Set seed for reproducibility
N <- 156
y_rbern <- rbern(N, prob = 90/156)                  # Draw N random values
    
hist(y_rbern,                                    # Plot of randomly drawn density
     breaks = 2,
     main = "Plataforma19 que salga grupal  " , ylim = c(0,100))

# Plataforma 20
table(DFN$Plataforma2020)
## 
##   Grupal Personal 
##       99       58
set.seed(156)                                  # Set seed for reproducibility
N <- 156
y_rbern <- rbern(N, prob = 99/156)                  # Draw N random values
    
hist(y_rbern,                                    # Plot of randomly drawn density
     breaks = 2,
     main = "Plataforma2020 que salga grupal " , ylim = c(0,100))

# Device
table(DFN$Device)
## 
##     Celular Computadora  Televisión 
##          73          57          27
set.seed(156)                                  # Set seed for reproducibility
N <- 156
y_rbern <- rbern(N, prob = 77/156)                  # Draw N random values
    
hist(y_rbern,                                    # Plot of randomly drawn density
     breaks = 2,
     main = "Device: Probabilidad que salga celular" , ylim = c(0,100))

Binomial

table(DFN$Cine_a_stream)
## 
##  1  2  3  4  5  6  7  8  9 10 
## 15  9 10  8 10  8 15 23 18 41
plot(0:9,dbinom(1:10, size = 10, prob =82/156 ))

table(DFN$Traslado_plat)
## 
##  1  2  3  4  5  6  7  8  9 10 
## 17  6  8  7 11 26 21 26 17 18
plot(0:9,dbinom(1:10, size = 10, prob =61/156 ))

Variables aleatoria Justificación
Plataforma19 Esta variable representa la preferencia de pago en el 2019. Es una variable aleatoria discreta y puede ser descrita por un modelo Bernoulli-p, siendo nuestro éxito si la forma de pago es grupal, X ~ Ber(1/2). Esto nos es indispensable para saber si la forma de pago fue grupal o no (Personal).
Plataforma2020 Esta variable representa la preferencia de pago en el 2020.Es una variable aleatoria discreta y puede ser descrita por un modelo Bernoulli-p, siendo nuestro éxito si la forma de pago es grupal, X ~ Ber(1/2). Esto nos es indispensable para saber si la forma de pago fue grupal o no (Personal)
Device Esta variable representa la preferencia de dispositivo a usar. Es una variable aleatoria discreta y puede ser descrita por un modelo Bernoulli-p, viendo así la probabilidad de cual es dispositivo con mayor uso, X ~ Ber(1/3). Esto nos es indispensable para saber si la preferencia va por ver en un celular, televisión o computadora, siendo nuestro éxito el celular.
Cine_a_stream Esta variable representa la Influencia del cines cerrados para que pasen a utilizar plataformas de streaming. Es una variable aleatoria discreta y puede ser descrita por un modelo Binomial, considerando como nuestro éxito que la puntuación sea de 8 a 10, X~Bin(156,3/10). Utilizando esto para observar la influencia de los cines cerrados en las personas para pasarse a una plataforma de streaming
Traslado_plat Esta variable representa la Influencia de la actualización del contenido de las plataformas de streaming. Es una variable aleatoria discreta y puede ser descrita por un modelo Binomial, considerando como nuestro éxito que la puntuación sea de 8 a 10, X~Bin(156,3/10). Utilizando esto para observar la influencia de la actualización del contenido de las plataformas de streaming

HIPÓTESIS

12. Hipótesis

INTERVALOS DE CONFIANZA

Las variables utilizadas en esta sección son: Tiempo de Servicio 2019 y Tiempo de Servicio 2020, Edad y Disney_plus

PARÁMETROS:

  • Nivel de confianza: 95%

  • Significancia: 0.05

1. TIEMPO DE SERVICIO 2020 Y 2021

intervalo(DFN$Time_service19)
## ( 229.9281 , 273.7662 )
intervalo(DFN$Time_service20)
## ( 278.4494 , 325.3722 )

2. EDAD

intervalo(DFN$Edad)
## ( 19.64325 , 20.81535 )

HIPÓTESIS 1: ¿Hay un incremento de minutos diarios de uso promedio por estudiante de antes de la pandemia a durante la pandemia?

  • Variable a analizar: Tiempo de servicio en el 2019 y Tiempo de servicio en el 2020
  • Resumen para time_service19 y time_service20:
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    60.0   120.0   240.0   251.8   360.0   540.0
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    60.0   180.0   300.0   301.9   420.0   540.0
  • Observaciones: Se puede distinguir que la media para el Tiempo de servicio del 2019 es de 251.8 minutos mientras que la media para el Tiempo de servicio del 2020 es de 301.9 minutos.

Se construye el gráfico de cajas para el Tiempo de servicio del 2019 y el Tiempo de servicio del 2020 para ver las diferencias de minutos de uso.

op <- par(mfrow = c(1,2))
boxplot(DFN$Time_service19, main="Minutos en una plataforma ANTES",cex.main=0.9,col=c("blue"))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")
boxplot(DFN$Time_service20,main="Minutos en una plataforma DURANTE",cex.main=0.9,col=c("red"))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")

Preguntas Inferenciales

_*A continuación, en la prueba de hipótesis, usaremos un nivel de confianza del 95% porque estamos trabajando en una encuesta y estaremos sesgados al recurrir a la cognición y al recuerdo del entrevistado de sus hábitos antes de la pandemia. Por esta razón, intentamos limitar la confianza obteniendo un 95% o más, no la precisión, porque los números precisos no son nuestro interés de investigación, pero tienen patrones confiables en nuestra muestra. El 95% es un valor que garantiza que tenemos la confianza suficiente para evaluar nuestra hipótesis. De manera similar, probaremos la distribución normal porque el tamaño de la muestra es lo suficientemente grande como para aproximarlo por el teorema del límite centra*_

  1. ¿Cuál ha sido el incremento de minutos de uso promedio por estudiante de antes de la pandemia a durante la pandemia?
lm1 <- lm(DFN$Time_service19 ~ DFN$Time_service20)
plot(lm1)

diagnostico se ve una homocedasticidad solamente en la primera mitad de esta, en la segunda gráfica a partir del segundo cuartil teórico se desordenan los residuos estandarizados, en la tercera gráfica al igual que en la primera solamente la primera mitad tiene una gráfica lineal y en la cuarta gráfica hay pocos puntos que se salen de las curvas de nivel. En general, podemos observar que las pruebas de diagnóstico son adecuadas para una gran parte de la muestra, pero existe otra parte llena de datos atípicos que altera los resultados de la regresión. Estos datos atípicos se deben principalmente a hábitos excesivos de empleo de servicios de streaming que conlleva a una gran cantidad de horas inusual de visualización.

smoothScatter(jitter(DFN$Time_service19), jitter(DFN$Time_service20), main="Minutos al día de uso antes y durante la pandemia", ylab = "Minutos durante", xlab="Minutos antes")
abline(lm1, col = "red")

OBSERVACIONES

  • Observamos en el gráfico que la nube de puntos, no revela ningún

    patrón específico, por lo que se concluye que: La varianza es constante;

    indicando de esta manera que el modelo de regresión analizado es

    “Homocedástico”.

Mediante una prueba de hipótesis verificaremos si hay una diferencia significativa entre ambas variables. Para ello estableceremos las siguientes hipótesis:

  • H0: No hay una variación significativa entre los minutos de uso diario
  • Ha: Hay una variación significativa entre los minutos de uso diario

En este caso, para no rechazar la hipótesis nula, esperaríamos que la media de las diferencias fuese 0.

Calcularemos primero la media y desviación estándar muestrales.

dif1 <- DFN$Time_service19 - DFN$Time_service20
mediaH <- mean(dif1)
desvH <- sd(dif1)
t.test(dif1, alternative = "two.sided", mu = 0, conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  dif1
## t = -2.9468, df = 156, p-value = 0.003704
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  -83.62249 -16.50490
## sample estimates:
## mean of x 
## -50.06369

PARÁMETROS DE LA HIPÓTESIS 1

  • Variable: Minutos de uso en la plataforma de streaming
  • Prueba de hipótesis: Unilateral derecha
  • Estimador puntual: Media
  • Modelo: z-Student
  • H0: No hay una variación significativa entre los minutos de uso diario
  • Ha: Hay una variación significativa entre los minutos de uso diario

HIPÓTESIS 2: ¿Existe una relación entre el precio y la edad ?

op <- par(mfrow = c(1,2))
plot(DFN$Precio_2019~DFN$Edad, xlab = "Edad", ylab = "Soles",main="Precio 2019")
plot(DFN$Precio_2020~DFN$Edad,xlab = "Edad", ylab = "Soles",main="Precio 2020")

smoothScatter(jitter(DFN$Edad), jitter(DFN$Precio_20), main="Minutos al día de uso antes y durante la pandemia", ylab = "Minutos durante", xlab="Minutos antes")
## Warning: Unknown or uninitialised column: `Precio_20`.
abline(lm1, col = "red")

HIPÓTESIS 3:

HIPÓTESIS 3:

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   20.00   45.00   45.00   77.27   60.00  540.00     135
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   20.00   45.00   60.00   93.68  120.00  420.00     100
dif2 <- DFN$Disney_plus_2019 - DFN$Disney_plus_2020
mediaC <- mean(dif2)
desvC <- sd(dif2)
ZH2 <- qnorm(0.05, lower.tail = F)
ID2 <- mediaC + ZH2*desvC/sqrt(length(dif2))
ID2
## [1] NA
round(ID2)
## [1] NA
t.test(dif2, mu = 1, conf.level = 0.95, alternative = "less")
## 
##  One Sample t-test
## 
## data:  dif2
## t = 0.3359, df = 14, p-value = 0.629
## alternative hypothesis: true mean is less than 1
## 95 percent confidence interval:
##     -Inf 23.8931
## sample estimates:
## mean of x 
##  4.666667

REGRESIONES LINEALES

REFERENCIAS BIBLIOGRAFICAS

1. Bibliografía

Tema Link
Contexto 1 Roa, M. (2020). Netflix sigue creciendo en medio de la pandemia. 2020, de Statista Sitio web: https://es.statista.com/21457/nuevos-suscriptores-netos-de-netflix-portrimestres/
Contexto 2 Antolín, R., Rayes, A. & Ruiz-Lacaci, N. (30 julio de 2021). Explorando los factores que afectan al comportamiento de los consumidores en plataformas de live streaming. Espacios. Vol. 42 (14), 29-44. DOI: 10.48082/espacios-a21v42n14p03
Encuestas https://forms.gle/KMJ1GH9hP5qBbj4M9