Ver películas enriquece nuestra forma de pensar, nos ayuda a ver el mundo desde otra perspectiva, nos hace reflexionar, estimula nuestra creatividad y así podría seguir enumerando los múltiples beneficios que trae consigo el simple hecho de ver una película. Cada película es un mundo diferente, pero bien se puede apreciar la calidad del mundo en el que nos vamos a centrar, de ahí la importancia de conocer las valoraciones que ha recibido cada película.
Por eso Filmaffinity y IMDb nos brindan la información oportuna para elegir nuestra película ideal.
Estados Unidos VS Japón
Base <- subset(Movies,país=='Estados Unidos'| país=='Japón')
Filmaffinity<-Base %>%
tabyl(puntuación_filmaffinity,país) %>%
adorn_totals(where = c("row", "col"))%>%
adorn_percentages(denominator ="col")%>%
adorn_pct_formatting(digits=1)
Filmaffinity
## puntuación_filmaffinity Estados Unidos Japón Total
## 7.7 10.0% 11.5% 10.3%
## 7.8 18.0% 21.2% 18.5%
## 7.9 16.0% 15.4% 15.9%
## 8.0 17.2% 9.6% 15.9%
## 8.1 14.8% 23.1% 16.2%
## 8.2 10.0% 5.8% 9.3%
## 8.3 4.8% 7.7% 5.3%
## 8.4 3.6% 3.8% 3.6%
## 8.5 1.2% 1.9% 1.3%
## 8.6 3.2% 0.0% 2.6%
## 8.7 0.4% 0.0% 0.3%
## 8.9 0.4% 0.0% 0.3%
## 9.0 0.4% 0.0% 0.3%
## Total 100.0% 100.0% 100.0%
En la plataforma filmaffinity el 18.5% y 16.5% de los usuarios en Estados Unidos y Japón califican las películas entre valores de 7.8 y 8.1, casi nunca una película obtiene una calificación sobre 8.7,8.9 y 9.0
Estados Unidos VS Japón
Base <- subset(Movies,país=='Estados Unidos'| país=='Japón')
IMBd<-Base %>%
tabyl(puntuación_imdb,país) %>%
adorn_totals(where = c("row", "col"))%>%
adorn_percentages(denominator ="col")%>%
adorn_pct_formatting(digits=1)
IMBd
## puntuación_imdb Estados Unidos Japón Total
## 5.9 0.0% 1.9% 0.3%
## 7.1 0.4% 1.9% 0.7%
## 7.2 0.4% 0.0% 0.3%
## 7.3 1.2% 0.0% 1.0%
## 7.4 0.4% 3.8% 1.0%
## 7.5 1.6% 0.0% 1.3%
## 7.6 4.4% 0.0% 3.6%
## 7.7 6.0% 0.0% 5.0%
## 7.8 9.2% 1.9% 7.9%
## 7.9 14.8% 5.8% 13.2%
## 8.0 13.6% 13.5% 13.6%
## 8.1 11.6% 11.5% 11.6%
## 8.2 8.0% 9.6% 8.3%
## 8.3 6.4% 7.7% 6.6%
## 8.4 5.6% 11.5% 6.6%
## 8.5 4.4% 7.7% 5.0%
## 8.6 2.8% 5.8% 3.3%
## 8.7 1.2% 0.0% 1.0%
## 8.8 1.2% 1.9% 1.3%
## 8.9 0.8% 0.0% 0.7%
## 9.0 1.2% 0.0% 1.0%
## 9.2 0.4% 0.0% 0.3%
## 9.3 0.4% 0.0% 0.3%
## <NA> 4.0% 15.4% 6.0%
## Total 100.0% 100.0% 100.0%
Diferente de las puntuaciones registradas en filmaffinity, IMDb tiene mayor cantidad de valoraciones sobre las películas, el 13.2% y 13.6% de sus usuarios califican las películas vistas entre valores de 7.9 y 8.0, rara vez una película obtiene una calificación sobre 5.9, 7.2, 9.2 y 9.3
Votos por los usuarios de IMDb en término del total de países
Movies$país <- as.factor(Movies$país)
tabla<- data.frame (Minimo_votos= min(Movies$votos_imdb[Movies$país]),
Maximo_votos= max(Movies$votos_imdb[Movies$país]),
Media_País = mean(Movies$votos_imdb[Movies$país]),
cuartil_1= quantile(Movies$votos_imdb[Movies$país], 0.25),
Mediana_País= median(Movies$votos_imdb[Movies$país]),
cuartil_3= quantile(Movies$votos_imdb[Movies$país], 0.75),
Desviación= sd(Movies$votos_imdb[Movies$país]),
cv_País = sd(Movies$votos_imdb[Movies$país])/mean(Movies$votos_imdb[Movies$país]))
tabla
## Minimo_votos Maximo_votos Media_País cuartil_1 Mediana_País cuartil_3
## 25% 15720 2372335 213075.8 43822 43822 166390
## Desviación cv_País
## 25% 376028.3 1.764763
El promedio del total de votos de votos registrados en IMDb en todos los países es del 213075.8, por otro lado, encontramos la mediana que es 43822 el valor que ocupa la posición central de los datos. El valor mínimo de los votos en IMDb es de 15720 y el máximo de votos es 2372335 generando un rango de 2356615, como el rango es alto los datos son muy dispersos, también se evidencia la desviación estándar de los votos en IMDb en términos del total de los países con un resultado de 376028.3, lo que indica que existe un alto grado de variación en el conjunto de datos. Al comparar los datos encontramos un coeficiente de variación de 1.764763 por lo que indica que los datos son muy precisos y los resultados son altamente confiables.
Estados Unidos VS Japón
Para nadie es un secreto que el éxito de una película tiene mucho que ver con las personas que están detrás de cámara, por eso aquí presentamos los mejores 15 directores de Estados Unidos y Japón y el número de películas que han dirigido y alcanzado el estrellato.
Peliculas <- Movies %>%
filter(!is.na(dirección)) %>%
filter(país == "Estados Unidos") %>%
group_by(dirección) %>%
dplyr::count(dirección) %>%
select(dirección, Count = n) %>%
arrange(-Count)
Peliculas<-ggplot(Peliculas[1:15, ], aes(x = reorder(dirección, Count), y = Count)) +
geom_bar(stat = "identity", aes(fill = dirección)) +
labs(x = "Dirección", y = "No.Peliculas", title = "Directores en EEUU", subtitle= "Top 15") +
coord_flip() +
guides(fill = FALSE, alpha = FALSE) +
theme_bw()
## Warning: `guides(<scale> = FALSE)` is deprecated. Please use `guides(<scale> =
## "none")` instead.
Peliculas_1 <- Movies %>%
filter(!is.na(dirección)) %>%
filter(país == "Japón") %>%
group_by(dirección) %>%
dplyr::count(dirección) %>%
select(dirección, Count = n) %>%
arrange(-Count)
Peliculas_1<-ggplot(Peliculas_1[1:15, ], aes(x = reorder(dirección, Count), y = Count)) +
geom_bar(stat = "identity", aes(fill = dirección)) +
labs(x = "Dirección", y = "No.Peliculas", title = "Directores en Japón", subtitle= "Top 15") +
coord_flip() +
guides(fill = FALSE, alpha = FALSE) +
theme_bw()
## Warning: `guides(<scale> = FALSE)` is deprecated. Please use `guides(<scale> =
## "none")` instead.
grid.arrange(Peliculas, Peliculas_1, ncol =2 )
Los directores en Estados Unidos han tenido mayor éxito en sus películas, aunque no se puede desprestigiar el trabajo de los directores en Japón, pues las películas dirigidas por Yasujirō Ozu y Billy Wilder son igual de exitosos.
TOP 20 PELICULAS MAS VISTAS POR USUARIOS DE FILMAFFINITY Filmafinnity VS IMDb
Cuando se desea disfrutar de una buena película y no se tiene idea de cual elegir, lo más seguro es que las personas se dirijan al Ranking de mejores películas, de ahí la importancia de tener un “Top 20 de las películas más vistas”
Votos_Filmaffinity<- Movies %>%
filter(votos_filmaffinity > "126") %>%
group_by(título, votos_filmaffinity) %>%
distinct(votos_filmaffinity) %>%
select(título, votos_filmaffinity) %>%
arrange(-votos_filmaffinity)
Votos_Filmaffinity <- ggplot(Votos_Filmaffinity[1:20, ], aes(x = reorder(título, votos_filmaffinity), y = votos_filmaffinity)) +
geom_histogram(stat = "identity", aes(fill = votos_filmaffinity)) +
labs(x = "Nombre peliculas", y = "Total votos", title = "Top 20 Peliculas más vistas", subtitle = "Peliculas con mas vistas registradas en filmaffinity") +
coord_flip() +
theme_bw()
## Warning: Ignoring unknown parameters: binwidth, bins, pad
Votos_Filmaffinity
El top 20 de las películas más vistas por los usuarios de Filmaffinity registra un total de votos entre 160.000 y 190.000, los registros más altos de votos van dirigidos a las películas de Pulp Fiction y Forest Gump, catalogadas como las dos películas con más vistas en Filmaffinity.
TOP 20 PELICULAS MAS VISTAS POR USUARIOS DE IMDb Filmafinnity VS IMDb
Votos_IMDB<- Movies %>%
filter(votos_imdb > "126") %>%
group_by(título, votos_imdb) %>%
distinct(votos_imdb) %>%
select(título, votos_imdb) %>%
arrange(-votos_imdb)
Votos_IMDB <- ggplot(Votos_IMDB[1:20, ], aes(x = reorder(título, votos_imdb), y = votos_imdb)) +
geom_bar(stat = "identity", aes(fill = votos_imdb)) +
labs(x = "Nombre peliculas", y = "Total votos", title = "Top 20 Peliculas mas vistas", subtitle = "Peliculas con mas vistas registradas en IMDB") +
coord_flip() +
theme_bw()
Votos_IMDB
Los usuarios de IMDb son muchos más que los de Filmaffinity. El registro de total de votos en IMDb toma valores aproximados entre 1.000.000 y más de 2.000.000 el registro de votos más alto va dirigido a las películas de Cadena perpetua y El caballero oscuro, dos de las mejores películas según los usuarios de IMDb
EEUU FRANCIA ITALIA JAPÓN
filmaffinity_imdbPalette <- c("chartreuse2", "chocolate1", "cyan4", "deeppink3")
Dataset <- subset(Movies,país=='Estados Unidos'| país=='Japón' | país=='Italia' | país=='Francia')
View(Dataset)
boxIntel <- ggplot(Dataset, aes(x = país, y = puntuación_positiva, fill = país)) +
geom_boxplot() +
labs(x = "Paises", y="Puntuacion positiva", title = "Peliculas con mayor puntuación según el país", subtitle = "Comparación de puntuaciones") +
guides(fill = FALSE) +
theme_bw()+
scale_fill_manual(values=filmaffinity_imdbPalette)
## Warning: `guides(<scale> = FALSE)` is deprecated. Please use `guides(<scale> =
## "none")` instead.
boxIntel
## Warning: Removed 51 rows containing non-finite values (stat_boxplot).
Según la puntuación positiva de las películas en Estados Unidos se encuentran casos extremos leves, donde su puntuación máxima es de 54 y su mediana es 10, es decir se ubica justo en el medio de los cuartiles uno y tres, por consiguiente, hay simetría en la distribución de los datos, también existe una igualdad con la mediana de las películas de Francia, pero en este caso existe una asimetría negativa en la distribución de los datos. Por otra parte, en Italia el valor de posición central en la puntuación es 8 al igual que el país de Japón, su diferencia radica en la asimetría, en Italia existe asimetría hacia la izquierda mientras que en Japón hay simetría en la distribución de los datos.
Las producciones cinematográficas están en constante evolución, no es lo mismo ver una película producida en 1920 y ver una producida en el año 2000, para no ir muy lejos si se compara la calidad de resolución de una película antigua a una del siglo XX, la diferencia es mucha, pero, ¿Con el paso de los años también se ha visto afectado el tiempo de duración en las películas?
Movies$duración<- as.factor(Movies$duración)
attach(Movies)
View(Movies)
plot(año~duración,main="Duración de las peliculas en relación al año de producción",
xlab="Duración peliculas", ylab="Año de reproducción ",col="violetred1")
abline(lm(año~duración),col="violetred4")
## Warning in abline(lm(año ~ duración), col = "violetred4"): only using the first
## two of 134 regression coefficients
Existe una correlación de tipo negativo, desde aprox. el año 1920 y el año 1950 en relación a la duración de las películas podemos fijarnos que esta tendencia desciende e indicando una débil correlación negativa lo que significa que mientras los valores de la duración de las películas disminuye ligeramente a medida que aumenta el año de reproducción, mientras que después de año 1950 la duración de las películas no se ve afectado por el año en el que fueron producidas.
Link de la base “Top 500 movies from Filmaffinity and comparison with IMDb” https://zenodo.org/record/4670450#.YaKnK9DMLIW