Para continuar el desarrollo del objetivo planteado anteriormente, en este segundo avance se decidió realizar las respectivas gráficas y tablas para un mejor entendimiento de los datos y el análisis de estas para poder observar el comportamiento y las relaciones de las variables propuestas. En esta segunda parte del proyecto se planteó una nueva variable cuantitativa denominada Recibimiento por el público con el fin de ofrecer una mejor interpretación, esta variable categoriza cada videojuego según el porcentaje de calificaciones positivas y negativas frente al total de calificaciones obtenido. Además, se decidió presentar los datos de las variables Calificaciones Positivas y Calificaciones Negativas en unidades de decenas de mil para facilitar la observación de su comportamiento en gráficas y tablas.
## Empresas desarrolladoras Cantidad de juegos
## 1 1047 Games 1
## 2 2K 2
## 3 Activision 2
## 4 Amazon Games 1
## 5 Aspyr 1
## 6 Avalanche Studios 1
## 7 Axolot Games 2
## 8 Behaviour Interactive 1
## 9 Bethesda Softworks 6
## 10 Bohemia Interactive 1
## 11 Bungie 1
## 12 CAPCOM 2
## 13 CD PROJEKT RED 1
## 14 Chucklefish 1
## 15 Coffee Stain Publishing 2
## 16 ConcernedApe 1
## 17 Daybreak Game Company 1
## 18 Digital Extremes 1
## 19 Electronic Arts 1
## 20 Endnight Games 1
## 21 Expansive Worlds 1
## 22 Facepunch Studios 1
## 23 FromSoftware 2
## 24 Gaijin Distribution KFT 1
## 25 Gearbox Publishing 1
## 26 Grinding Gear Games 1
## 27 Hello Games 1
## 28 Hi-Rez Studios 1
## 29 Innersloth 1
## 30 Kinetic Games 1
## 31 Klei Entertainment 1
## 32 KRAFTON 1
## 33 Landfall 2
## 34 Ludeon Studios 1
## 35 Mega Crit Games 1
## 36 Monomi Park 1
## 37 Moon Studios GmbH 1
## 38 Motion Twin 1
## 39 NetEase Games Montreal 1
## 40 New World Interactive 1
## 41 Nicalis 1
## 42 Offworld Industries 1
## 43 Paradox Interactive 2
## 44 poncle 1
## 45 Private Division 1
## 46 Psyonix LLC 1
## 47 Re-Logic 1
## 48 Red Barrels 1
## 49 Red Hook Studios 1
## 50 RobTop Games 1
## 51 Rockstar Games 1
## 52 SCS Software 1
## 53 SEGA 1
## 54 Smartly Dressed Games 1
## 55 Square Enix 4
## 56 Starbreeze Publishing AB 1
## 57 Studio MDHR Entertainment 1
## 58 Studio Minus 1
## 59 Supergiant Games 1
## 60 System Era Softworks 1
## 61 The Behemoth 1
## 62 The Fun Pimps Entertainment 1
## 63 The Indie Stone 1
## 64 tobyfox 1
## 65 Ubisoft 4
## 66 Unknown Worlds Entertainment 1
## 67 Valve 5
## 68 vanripper 1
## 69 VRChat 1
## 70 Wallpaper Engine Team 1
## 71 Wargaming Group Limited 1
## 72 Wube Software 1
## 73 Xbox Game Studios 5
Para el análisis de la variable Empresas desarrolladoras se planteó una tabla de frecuencia con todos los datos de la muestra, y un diagrama de barras seleccionando las empresas más relevantes, aplicando un filtro para las empresas que tuviesen más de tres videojuegos. De la gráfica se puede concluir que muy pocas empresas han desarrollado tres o más videojuegos, ya que, según la tabla de frecuencia, el 62.72% de empresas desarrolladoras solo tienen un videojuego registrado en la lista, mientras que solo el 13.70% tienen más de 3 videojuegos. La empresa con mayor cantidad de juegos, de la muestra seleccionada, es Bethesda Softworks, con 6 videojuegos en total.
En este diagrama de caja y bigotes, de la variable Precio, se puede evidenciar que la mediana de los precios apunta a los valores máximos, lo que significa que posee una asimetría negativa. Analizando los cuartiles, se puede concluir que los la dispersión de datos en los valores mínimos (Q1) es poca en camparación a los valores máximos (Q3).
## Lim Inf Lim Sup xi ni fi Ni Fi
## 1 0 10 5 34 0.34 34 0.34
## 2 10 20 15 28 0.28 62 0.62
## 3 20 30 25 16 0.16 78 0.78
## 4 30 40 35 10 0.10 88 0.88
## 5 40 50 45 2 0.02 90 0.90
## 6 50 60 55 10 0.10 100 1.00
El histograma y la tabla de frecuencia anteriores nos presentan la frecuencia de los precios de los videojuegos en intervalos de 10 en 10, donde se logra apreciar que la gran mayoría de juegos poseen un precio entre 0 a 10 dólares y entre 10 a 20 dólares, mientras que son muy pocos los juegos que están más allá de los 30 dólares, observando como el intervalo de precio en donde menos juegos hay es entre los 40 y 50 dólares.
Se puede concluir que el comportamiento del histograma representa un sesgo positivo pues presenta una disminución de la frecuencia a medida que el precio va en aumento.
Para el análisis de la variable Género se planteó un diagrama circular y un diagrama de cajas y alambres, relacionando los distintos géneros con la variable Precio. Los diagramas se muestran a continuación:
En el diagrama circular se puede observar que hay una gran parte de los videojuegos que pertenecen a los géneros de Acción (Action) y Aventura (Adventure), seguido de Juegos de rol (RPG) y dejando en última posición a los juegos con el género de Carreras (Racing).
## Género Precio.Min. Precio.1st Qu. Precio.Median Precio.Mean
## 1 Action 0.00000 0.00000 14.99000 21.18189
## 2 Adventure 0.00000 14.99000 19.99000 21.49167
## 3 Casual 0.00000 2.99250 3.99000 9.49500
## 4 Racing 0.00000 14.99750 29.99500 29.99500
## 5 RPG 0.00000 9.99000 19.99000 22.32467
## 6 Simulation 9.99000 19.99000 19.99000 23.99000
## 7 Strategy 0.00000 19.99000 24.99000 26.42000
## Precio.3rd Qu. Precio.Max.
## 1 29.99000 59.99000
## 2 29.99000 59.99000
## 3 10.49250 30.00000
## 4 44.99250 59.99000
## 5 32.49000 59.99000
## 6 29.99000 39.99000
## 7 29.99000 59.99000
En este diagrama se puede analizar como varía el precio de los videojuegos en relación con el género. Se logra apreciar que casi siempre hay una dispersión de los datos mientras la mediana es diferentes en cada caja, pero sin superar la barrera de los 30 dólares. Por otra parte, los datos de algunos géneros presentan datos atípicos que se interpretan como cifras fuera del rango normal de precios, también se tiene presente que casi todos los géneros tratan de abarcar, de una u otra forma, los rangos de precios presentes, algunos desde lo gratis (0 dólares) hasta los 60 dólares, siendo este el precio máximo, habiendo otros buscando un equilibrio entre este rango, encontrándose en un punto medio.
Al igual que con la variable anteriormente analizada, la información de Recibimiento por el público fue analizada individualmente y posteriormente se relacionó con la variable Precio. Se plantearon los gráficos a continuación:
En el diagrama de barras, denominado con el nombre de la variable a analizar, se puede observar como gran parte de los videojuegos tomados para la muestra tienen un buen recibimiento por parte del público siendo estos poco más de 80 de los 100 seleccionados en total, y muy pocos son los que no han tenido un buen recibimiento.
## Recibimiento por el público Precio.Min. Precio.1st Qu. Precio.Median
## 1 Bueno 0.00000 9.99000 19.99000
## 2 Malo 0.00000 0.00000 0.00000
## 3 Medio 0.00000 0.00000 19.99000
## Precio.Mean Precio.3rd Qu. Precio.Max.
## 1 21.99171 29.99000 59.99000
## 2 0.00000 0.00000 0.00000
## 3 22.68062 33.74000 59.99000
Observando el grafico se puede decir que las figuras de los juegos que tuvieron un buen recibimiento es simétrico puesto que la mediana se encuentra en la mitad de la caja, pero su dispersión es amplia principalmente hacia los valores de precio maáimo. Además, cuenta con un dato atípico que está fuera del rango normal. En el caso del diagrama de mal recibimento, se obseerva la mediana ya que solo cuenta con dos juegos que fueron mal recibidos, la cantidad de datos no permite la realización de un mejor diaragama y se infiere que todos los juegos con mal recibimiento son gratis. Por otro lado, en el diagrama que indica un recibimento medio se observa una asimentria negativa, por ende la mediana busca los valores de precio máximo y cuenta con una dispersión elevada hacia estos valores.
## Lim Inf Lim Sup xi ni fi Ni Fi
## 1 0 100 50 96 0.96 96 0.96
## 2 100 200 150 3 0.03 99 0.99
## 3 200 300 250 0 0.00 99 0.99
## 4 300 400 350 0 0.00 99 0.99
## 5 400 500 450 0 0.00 99 0.99
## 6 500 600 550 1 0.01 100 1.00
Se puede evidenciar una asimetría positiva en los gráficos, ya que la gran mayoría de los datos están ubicados en los valores mínimos dejando una cola al lado contrario. Se logra observar un espacio vacío entre 200 y 500, lo que indica que no hay videojuegos que tengan calificaciones positivas que correspondan a estos valores, generando datos atípicos.
## Lim Inf Lim Sup xi ni fi Ni Fi
## 1 0 10 5 93 0.93 93 0.93
## 2 10 20 15 3 0.03 96 0.96
## 3 20 30 25 1 0.01 97 0.97
## 4 30 40 35 1 0.01 98 0.98
## 5 40 50 45 0 0.00 98 0.98
## 6 50 60 55 0 0.00 98 0.98
## 7 60 70 65 0 0.00 98 0.98
## 8 70 80 75 1 0.01 99 0.99
## 9 80 90 85 1 0.01 100 1.00
Al igual que con las calificaciones positivas, se puede evidenciar una asimetría positiva ya que la gran mayoría de los datos están ubicados en los valores mínimos, también se logra observar un espacio entre 40 a 65 aproximadamente, lo que indica que no hay videojuegos que tengan calificaciones negativas que correspondan a esos intervalos y genera datos atípicos con aquellos valores que están por encima de 65. Se puede evidenciar una gran diferencia entre el valor máximo y mínimo de las calificaciones negativas en comparación a las calificaciones positivas.