##Informe de participación de Netflix 2023 enero - junio

##Caso: Este conjunto de datos cubre más de 18,000 títulos, que representan el 99% de todo el visionado en Netflix, y casi 100 mil millones de horas vistas.

Cargar el conjunto de datos

#Cargar
netflix <- read.csv("Netflix.csv", sep = ",")
head(netflix)

Calcular e interpretar los cuartiles sobre las horas de vistas

quantile(netflix$Hours.Viewed)
##        0%       25%       50%       75%      100% 
##    100000    200000    700000   3400000 812100000

Resultados:

/## 0% 25% 50% 75% 100%

/## 100000 200000 700000 3400000 812100000

Según los resultados:

El valor mínimo de las horas de vistas es: 100000

Cuartil 1 \((Q_1)\)

Interpretación es: 200000 Segundos; El 25% de los usuarios que accedieron a netflix, su tiempo máximo es: 200000 Segundos.

Cuartil 2 \((Q_2)\)

Interpretación es: 700000 Segundos; El 50% de los usuarios que accedieron a netflix, su tiempo máximo es: 700000 Segundos.

Cuartil 3 \((Q_3)\)

Interpretación es: 3400000 Segundos; El 75% de los usuarios que accedieron al netflix, su tiempo máximo es: 3400000 Segundos.

Cuartil 4 \((Q_4)\)

Interpretación es: 812100000 Segundos; El 100% de los usuarios que accedieron al netflix, su tiempo máximo es: 812100000 Segundos.

Dividir en 10 Grupos (deciles)

quantile(netflix$Hours.Viewed, probs = seq(0, 1, 0.1))
##        0%       10%       20%       30%       40%       50%       60%       70% 
##    100000    100000    100000    200000    400000    700000   1300000   2400000 
##       80%       90%      100% 
##   4900000  11500000 812100000

Dividir en 100 Grupos (percentiles)

quantile(netflix$Hours.Viewed, probs = seq(0, 1, 0.01))
##        0%        1%        2%        3%        4%        5%        6%        7% 
##    100000    100000    100000    100000    100000    100000    100000    100000 
##        8%        9%       10%       11%       12%       13%       14%       15% 
##    100000    100000    100000    100000    100000    100000    100000    100000 
##       16%       17%       18%       19%       20%       21%       22%       23% 
##    100000    100000    100000    100000    100000    200000    200000    200000 
##       24%       25%       26%       27%       28%       29%       30%       31% 
##    200000    200000    200000    200000    200000    200000    200000    200000 
##       32%       33%       34%       35%       36%       37%       38%       39% 
##    300000    300000    300000    300000    300000    300000    400000    400000 
##       40%       41%       42%       43%       44%       45%       46%       47% 
##    400000    400000    400000    500000    500000    500000    600000    600000 
##       48%       49%       50%       51%       52%       53%       54%       55% 
##    600000    700000    700000    700000    800000    800000    900000    900000 
##       56%       57%       58%       59%       60%       61%       62%       63% 
##   1000000   1000000   1100000   1200000   1300000   1300000   1400000   1500000 
##       64%       65%       66%       67%       68%       69%       70%       71% 
##   1600000   1700000   1800000   2000000   2100000   2200000   2400000   2500000 
##       72%       73%       74%       75%       76%       77%       78%       79% 
##   2700000   2900000   3100000   3400000   3600000   3900000   4200000   4500000 
##       80%       81%       82%       83%       84%       85%       86%       87% 
##   4900000   5200000   5600000   6000000   6500000   7100000   7800000   8500000 
##       88%       89%       90%       91%       92%       93%       94%       95% 
##   9200000  10300000  11500000  12700000  14400000  16800000  19600000  23200000 
##       96%       97%       98%       99%      100% 
##  27548000  33461000  43674000  68061000 812100000

Asimetría y Curtosis

Asimetría

library(fBasics)
skewness(netflix$Hours.Viewed)
## [1] 16.54817
## attr(,"method")
## [1] "moment"

Resultado: [1] 16.54817, Como el valor es ligeramente asimétrica positiva, entonces la distribución de los datos de la cola derecha de la distribución es más larga que la cola izquierda.

hist(netflix$Hours.Viewed)

Curtosis

kurtosis(netflix$Hours.Viewed)
## [1] 469.8927
## attr(,"method")
## [1] "excess"

Resultado: [1] 469.8927, Como el valor es alto indica que la distribución tiene colas muy pesadas. Esto significa que hay muchos valores atípicos, es decir, valores que están muy alejados de la media.