##Informe de participación de Netflix 2023 enero - junio
##Caso: Este conjunto de datos cubre más de 18,000 títulos, que representan el 99% de todo el visionado en Netflix, y casi 100 mil millones de horas vistas.
#Cargar
netflix <- read.csv("Netflix.csv", sep = ",")
head(netflix)
quantile(netflix$Hours.Viewed)
## 0% 25% 50% 75% 100%
## 100000 200000 700000 3400000 812100000
Resultados:
/## 0% 25% 50% 75% 100%
/## 100000 200000 700000 3400000 812100000
Según los resultados:
El valor mínimo de las horas de vistas es: 100000
Interpretación es: 200000 Segundos; El 25% de los usuarios que accedieron a netflix, su tiempo máximo es: 200000 Segundos.
Interpretación es: 700000 Segundos; El 50% de los usuarios que accedieron a netflix, su tiempo máximo es: 700000 Segundos.
Interpretación es: 3400000 Segundos; El 75% de los usuarios que accedieron al netflix, su tiempo máximo es: 3400000 Segundos.
Interpretación es: 812100000 Segundos; El 100% de los usuarios que accedieron al netflix, su tiempo máximo es: 812100000 Segundos.
quantile(netflix$Hours.Viewed, probs = seq(0, 1, 0.1))
## 0% 10% 20% 30% 40% 50% 60% 70%
## 100000 100000 100000 200000 400000 700000 1300000 2400000
## 80% 90% 100%
## 4900000 11500000 812100000
quantile(netflix$Hours.Viewed, probs = seq(0, 1, 0.01))
## 0% 1% 2% 3% 4% 5% 6% 7%
## 100000 100000 100000 100000 100000 100000 100000 100000
## 8% 9% 10% 11% 12% 13% 14% 15%
## 100000 100000 100000 100000 100000 100000 100000 100000
## 16% 17% 18% 19% 20% 21% 22% 23%
## 100000 100000 100000 100000 100000 200000 200000 200000
## 24% 25% 26% 27% 28% 29% 30% 31%
## 200000 200000 200000 200000 200000 200000 200000 200000
## 32% 33% 34% 35% 36% 37% 38% 39%
## 300000 300000 300000 300000 300000 300000 400000 400000
## 40% 41% 42% 43% 44% 45% 46% 47%
## 400000 400000 400000 500000 500000 500000 600000 600000
## 48% 49% 50% 51% 52% 53% 54% 55%
## 600000 700000 700000 700000 800000 800000 900000 900000
## 56% 57% 58% 59% 60% 61% 62% 63%
## 1000000 1000000 1100000 1200000 1300000 1300000 1400000 1500000
## 64% 65% 66% 67% 68% 69% 70% 71%
## 1600000 1700000 1800000 2000000 2100000 2200000 2400000 2500000
## 72% 73% 74% 75% 76% 77% 78% 79%
## 2700000 2900000 3100000 3400000 3600000 3900000 4200000 4500000
## 80% 81% 82% 83% 84% 85% 86% 87%
## 4900000 5200000 5600000 6000000 6500000 7100000 7800000 8500000
## 88% 89% 90% 91% 92% 93% 94% 95%
## 9200000 10300000 11500000 12700000 14400000 16800000 19600000 23200000
## 96% 97% 98% 99% 100%
## 27548000 33461000 43674000 68061000 812100000
library(fBasics)
skewness(netflix$Hours.Viewed)
## [1] 16.54817
## attr(,"method")
## [1] "moment"
Resultado: [1] 16.54817, Como el valor es ligeramente asimétrica positiva, entonces la distribución de los datos de la cola derecha de la distribución es más larga que la cola izquierda.
hist(netflix$Hours.Viewed)
kurtosis(netflix$Hours.Viewed)
## [1] 469.8927
## attr(,"method")
## [1] "excess"
Resultado: [1] 469.8927, Como el valor es alto indica que la distribución tiene colas muy pesadas. Esto significa que hay muchos valores atípicos, es decir, valores que están muy alejados de la media.