En la primera etapa del estudio, se llevarán a cabo cálculos, visualizaciones y un análisis detallado del conjunto de datos sobre videojuegos, que será descrito en la sección 1.2. Este proceso se abordará desde una perspectiva de estadística descriptiva multivariante, lo que permitirá no solo una visión general de los datos, sino también un análisis más enriquecido de las relaciones entre las diferentes variables involucradas, tales como género, plataforma, año de lanzamiento, ventas globales por región y puntuaciones de usuarios y críticos.
Este enfoque facilitará una comprensión más profunda de las relaciones entre las variables, ayudando a identificar patrones y tendencias relevantes en la industria de los videojuegos. Las visualizaciones jugarán un papel clave en la representación gráfica de estas relaciones, brindando una forma clara y accesible de explorar los datos y facilitar su comprensión. Todo esto se llevará a cabo utilizando las herramientas R y RStudio, que permitirán una ejecución eficiente y precisa de los cálculos y la creación de gráficos interactivos para una interpretación más completa de los resultados.
El objetivo de este proyecto es aplicar técnicas de análisis multivariado para gestionar el conjunto de datos aprobado, correspondiente a registros de videojuegos que incluyen información sobre títulos, géneros, plataformas, años de lanzamiento, ventas globales y puntuaciones de usuarios. El propósito es organizar y procesar eficazmente la información, desarrollando habilidades en la gestión y análisis de datos mediante la implementación de métodos estadísticos avanzados como análisis de componentes principales, correspondencias, conglomerados y regresión. Este trabajo se enmarca dentro del curso de Gestión de Datos, dictado por el Profesor Giancarlo Libreros Londoño en la Universidad del Valle.
El conjunto de datos fue obtenido en su totalidad desde la plataforma Kaggle:(https://www.kaggle.com/datasets/isaacmenard/playstation-games-info-2152025).Kaggle, es una plataforma en línea especializada en ciencia de datos y aprendizaje automático, propiedad de Google LLC. Se destaca por facilitar la participación en competencias en las que empresas e instituciones publican conjuntos de datos y problemas reales, permitiendo a los usuarios desarrollar modelos predictivos y poner a prueba sus habilidades analíticas. Además, la plataforma proporciona herramientas como notebooks interactivos en Python y R, una amplia biblioteca de conjuntos de datos de libre acceso y una sección educativa denominada Kaggle Learn, dedicada a la formación en programación, análisis y visualización de datos. El conjunto de datos seleccionado, fue elaborado por Isaac Menard (https://www.kaggle.com/isaacmenard), que recopila información detallada sobre diversos videojuegos de PlayStation.
En el contexto del analisis de conjuntos de datos, este estudio se relaciona con las siguientes areas de la ingenieria industrial. En el area 2. Investigación de Operaciones y Análisis,(Operations research & analysis) devido a que los datos de ventas y calificaciones sirven para aplicar modelos matemáticos orientados a la toma de decisiones estratégicas en la industria del entretenimiento digital; en el area 3. Análisis Económico de la Ingeniería,(Enginnering economic analysis) porque se consideran aspectos financieros mediante variables como el precio de venta o el modelo de negocio; en el area 13. Diseño y Desarrollo de Productos(Desing & manufacturing engineering), porque el estudio de variables como el género y la plataforma permite identificar tendencias de innovación y evolución en los videojuegos, reflejando la influencia de las preferencias de los usuarios y los avances tecnológicos en su diseño y mejora continua.
El conjunto de datos está compuesto por 12 campos y 3,526 registros que recopilan información sobre videojuegos de la marca PlayStation. Incluye variables relacionadas con el título, desarrollador, plataforma, género, precio, ventas y calificaciones, lo que permite analizar aspectos técnicos, comerciales y de preferencia del consumidor dentro de la industria del entretenimiento digital. La lista siguiente presenta las variables del conjunto de datos en el mismo orden en que aparecen en el archivo original, indicando para cada una su tipo de variable y escala de medición, siguiendo la nomenclatura (tipo_de_variable::escala_de_medición [ordenamiento]):
nombre_juego (cualitativa::nominal): es la denominación oficial del videojuego registrada en la PlayStation Store. Esta variable identifica de manera única cada título y se presenta en formato de texto, respetando la ortografía y estilo original establecido por la distribuidora.
precio_mas_alto (cuantitativa::razón): indica el Valor monetario máximo alcanzado por el videojuego dentro de la PlayStation Store, expresado en euros (€).
lanzamiento (cuantitativa::intervalo): indica la fecha o año correspondiente al estreno oficial del videojuego en el mercado. Esta variable permite establecer comparaciones temporales y analizar tendencias de lanzamiento a lo largo del tiempo.
genero (cualitativa::nominal):es la clasificación temática o tipológica del videojuego según su dinámica y estilo de juego (acción, aventura, rol, deportes, entre otros). Facilita la segmentación y el análisis comparativo entre distintos tipos de experiencias interactivas.
empresa_creadora (cualitativa::nominal): registra el nombre de la compañía desarrolladora o distribuidora responsable de la producción del videojuego. Esta variable permite identificar el origen empresarial y analizar la participación de distintas marcas dentro del mercado de PlayStation.
plataforma (cualitativa::nominal): señala el sistema o consola de la línea PlayStation en la cual fue lanzado el videojuego (ps3, ps4 o ps5). Su inclusión posibilita el estudio de la compatibilidad, la evolución tecnológica y las diferencias generacionales entre consolas.
metacritic_score (cuantitativa::razón):representa la puntuacion promedio ponderado de las calificaciones otorgadas por críticos especializados en el videojuego, en una escala de 0 a 100.
metacritic_rating_count (cuantitativa::razón): muestra el número total de reseñas profesionales recopiladas por Metacritic. Refleja el nivel de cobertura mediática y el grado de atención recibida por parte de la prensa especializada.
metacritic_user_score (cuantitativa::razón): registra el promedio de las valoraciones emitidas por los usuarios en la plataforma Metacritic, expresado en una escala de 0 a 10. Este indicador representa la percepción y satisfacción general del público.
Metacritic_user_rating_count (Cuantitativa::razón): indica el número de valoraciones emitidas por los usuarios. Mide la participación y popularidad del juego.
playstation_score (cuantitativa::razón): muestra la valoracion promedio de las puntuaciones otorgadas por los usuarios en la PlayStation Store, en una escala de 0 a 5. Constituye una medida directa de la valoración interna dentro de la plataforma oficial de Sony.
playstation_rating_count (cuantitativa::razón): refleja la cantidad total de reseñas o calificaciones emitidas por los usuarios en la PlayStation Store. Indica el nivel de interacción, aceptación y visibilidad del videojuego dentro del entorno digital de la consola.
Cabe resaltar que durante el proceso de depuración del conjunto de datos de reseñas de videojuegos se realizaron ajustes orientados a garantizar la coherencia y aprovechamiento máximo de la información disponible. En primer lugar, se eliminaron registros con datos en blanco cuando la ausencia de información afectaba variables clave, y en otros casos se procedió a completar valores faltantes mediante criterios consistentes con el comportamiento del resto de la muestra, con el fin de no reducir innecesariamente el tamaño del dataset. Además, la variable fecha_lanzamiento se estandarizó pasando de formatos como “Feb 15, 2012” a un formato de fecha homogéneo tipo “15/02/2012”, lo que facilita el ordenamiento cronológico y el uso de funciones de tiempo en el análisis. Adicionalmente, se corrigieron algunos valores atípicamente elevados en la variable Precio_mas_alto, revisando su magnitud y ajustándolos a rangos más realistas para evitar distorsiones en los análisis posteriores. Finalmente, se incorporó una variable de decisión que clasifica a los videojuegos según el nivel de participación o exposición publicitaria, lo cual permite estudiar de manera más precisa cómo la visibilidad comercial se relaciona con las puntuaciones de críticos, usuarios y el desempeño dentro de la PlayStation Store.
str(resenas_juegos_electronicos)
## tibble [3,526 × 12] (S3: tbl_df/tbl/data.frame)
## $ nombre_juego : chr [1:3526] "Grand Theft Auto IV" "Red Dead Redemption 2" "Red Dead Online" "Grand Theft Auto 3" ...
## $ precio_mas_alto : chr [1:3526] "€24.99" "€59.99" "€69.99" "€9.99" ...
## $ lanzamiento : chr [1:3526] "Feb 15, 2012" "Oct 26, 2018" "Oct 29, 2018" "Oct 4, 2012" ...
## $ genero : chr [1:3526] "Action / Shooter / Racing" "Action / Adventure / Unique" "Action / Adventure" "--" ...
## $ empresa_creadora : chr [1:3526] "Rockstar" "Rockstar Games" "Rockstar Games" "Rockstar Games" ...
## $ plataforma : chr [1:3526] "PS3" "PS4" "PS4" "PS3" ...
## $ metacritic_score : num [1:3526] 98 97 97 97 97 97 96 96 96 96 ...
## $ metacritic_rating_count : num [1:3526] 86 99 99 56 66 66 112 86 105 98 ...
## $ metacritic_user_score : num [1:3526] 8.3 8.9 8.9 8 8.5 8.5 9.2 8.3 8.9 8.9 ...
## $ metacritic_user_rating_count: num [1:3526] 5541 31932 31932 2079 14322 ...
## $ playstation_score : chr [1:3526] "4.32" "4.74" "4.74" "4.59" ...
## $ playstation_rating_count : num [1:3526] 48904 379257 379346 1437 40895 ...
resenas_juegos_electronicos
## # A tibble: 3,526 × 12
## nombre_juego precio_mas_alto lanzamiento genero empresa_creadora plataforma
## <chr> <chr> <chr> <chr> <chr> <chr>
## 1 Grand Theft A… €24.99 Feb 15, 20… Actio… Rockstar PS3
## 2 Red Dead Rede… €59.99 Oct 26, 20… Actio… Rockstar Games PS4
## 3 Red Dead Onli… €69.99 Oct 29, 20… Actio… Rockstar Games PS4
## 4 Grand Theft A… €9.99 Oct 4, 2012 -- Rockstar Games PS3
## 5 Grand Theft A… €69.99 Sep 17, 20… Actio… Rockstar Games PS3
## 6 Grand Theft A… €69.99 Nov 18, 20… Actio… Rockstar Games PS4
## 7 Baldur's Gate… €69.99 Sep 6, 2023 Role … Larian Studios … PS5 / PS4
## 8 ELDEN RING PS… €69.99 Feb 25, 20… Role … BANDAI NAMCO EN… PS5 / PS4
## 9 Uncharted 2: … <NA> Oct 15, 20… -- Sony Interactiv… PS3
## 10 Mass Effect™ 2 €14.99 Jan 21, 20… Role … EA Swiss Sarl PS3
## # ℹ 3,516 more rows
## # ℹ 6 more variables: metacritic_score <dbl>, metacritic_rating_count <dbl>,
## # metacritic_user_score <dbl>, metacritic_user_rating_count <dbl>,
## # playstation_score <chr>, playstation_rating_count <dbl>
str(resenas_de_juegos_electronicos_depurados)
## tibble [3,457 × 14] (S3: tbl_df/tbl/data.frame)
## $ nombre_juego : chr [1:3457] "Grand Theft Auto IV" "Red Dead Redemption 2" "Red Dead Online" "Grand Theft Auto 3" ...
## $ Precio_mas_alto : num [1:3457] 24.99 59.99 69.99 9.99 69.99 ...
## $ fecha_lanzamiento : Date[1:3457], format: "2012-02-15" "2018-10-26" ...
## $ genero_juego : chr [1:3457] "Action / Shooter / Racing" "Action / Adventure / Unique" "Action / Adventure" "Action/Adventure" ...
## $ empresa_creadora : chr [1:3457] "Rockstar" "Rockstar Games" "Rockstar Games" "Rockstar Games" ...
## $ plataforma_ps : chr [1:3457] "PS3" "PS4" "PS4" "PS3" ...
## $ punt_criticos_meta : num [1:3457] 98 97 97 97 97 97 96 96 96 96 ...
## $ n_criticos_meta : num [1:3457] 86 99 99 56 66 66 112 86 115 98 ...
## $ punt_usuarios_meta : num [1:3457] 8.3 8.9 8.9 8 8.5 8.5 9.2 8.3 8.9 8.9 ...
## $ n_usuarios_meta : num [1:3457] 5541 31932 31932 2179 14322 ...
## $ calif_ps_store : num [1:3457] 4.32 4.74 4.74 4.59 4.65 4.48 1 1 4.14 4.81 ...
## $ n_total_store : num [1:3457] 48914 379257 379346 1437 41895 ...
## $ participacion_publi_cat: num [1:3457] 2 2 2 1 2 2 2 2 2 1 ...
## $ alto : num [1:3457] 24.99 59.99 69.99 9.99 69.99 ...
resenas_de_juegos_electronicos_depurados
## # A tibble: 3,457 × 14
## nombre_juego Precio_mas_alto fecha_lanzamiento genero_juego empresa_creadora
## <chr> <dbl> <date> <chr> <chr>
## 1 Grand Theft … 25.0 2012-02-15 Action / Sh… Rockstar
## 2 Red Dead Red… 60.0 2018-10-26 Action / Ad… Rockstar Games
## 3 Red Dead Onl… 70.0 2018-10-29 Action / Ad… Rockstar Games
## 4 Grand Theft … 9.99 2012-10-04 Action/Adve… Rockstar Games
## 5 Grand Theft … 70.0 2013-09-17 Action / Ad… Rockstar Games
## 6 Grand Theft … 70.0 2014-11-18 Action / Ad… Rockstar Games
## 7 Baldur's Gat… 70.0 2023-09-06 Role playin… Larian Studios …
## 8 ELDEN RING P… 70.0 2022-02-25 Role playin… BANDAI NAMCO EN…
## 9 Uncharted 2:… 40.0 2009-10-15 Action/Adve… Sony Interactiv…
## 10 Mass Effect™… 65.0 2011-01-21 Action/Role… EA Swiss Sarl
## # ℹ 3,447 more rows
## # ℹ 9 more variables: plataforma_ps <chr>, punt_criticos_meta <dbl>,
## # n_criticos_meta <dbl>, punt_usuarios_meta <dbl>, n_usuarios_meta <dbl>,
## # calif_ps_store <dbl>, n_total_store <dbl>, participacion_publi_cat <dbl>,
## # alto <dbl>
El conjunto original resenas_juegos_electronicos_Original contiene 3.526 videojuegos y 12 variables, con precios y fechas almacenados como texto y algunos registros con información incompleta. Representa la base tal como fue obtenida de las fuentes, útil para describir el origen y la estructura inicial de los datos antes de cualquier tratamiento.
El conjunto depurado resenas_de_juegos_electronicos_depurados reduce a 3.457 registros y amplía a 13 variables, luego de eliminar observaciones con datos críticos en blanco, convertir el precio máximo a numérico (alto), estandarizar la fecha de lanzamiento y crear la variable part_publi sobre participación publicitaria. Esta versión ofrece una matriz de datos más limpia y homogénea, adecuada para las descripciones multivariantes y los análisis estadísticos aplicados al mercado de videojuegos.
El vector de medias y la matriz de varianzas-covarianzas son elementos fundamentales del análisis estadístico multivariado, pues permiten caracterizar el comportamiento central, la dispersión y las relaciones de dependencia entre las variables de un conjunto de datos. Estas herramientas facilitan la comprensión global de la estructura interna de la información analizada. El vector de medias resume el promedio o valor esperado de cada variable, representando el punto de equilibrio alrededor del cual se distribuyen los datos. Por otro lado, la matriz de varianzas-covarianzas proporciona una medida conjunta de la variabilidad y de las relaciones lineales entre las variables. En su diagonal principal se encuentran las varianzas, que reflejan la dispersión individual de cada variable, mientras que los elementos fuera de la diagonal expresan las covarianzas, es decir, el grado en que dos variables tienden a variar simultáneamente.
El siguiente conjunto de boxplots resume la distribución de cuatro variables cuantitativas clave del mercado de videojuegos analizado: el Precio_mas_alto registrado en la PS Store, la puntuación de críticos en Metacritic (punt_criticos_meta), el número de críticas de Metacritic (n_criticos_meta) y la puntuación de usuarios (punt_usuarios_meta). El gráfico de cajas es especialmente adecuado en esta fase exploratoria porque sintetiza en una sola figura la mediana, el rango intercuartílico y los valores atípicos de cada variable, permitiendo comparar de forma visual la dispersión, la simetría y la presencia de outliers entre indicadores que están en escalas diferentes. De esta manera, se obtiene una visión compacta del comportamiento central de los precios y de las evaluaciones críticas y de usuarios, lo que facilita detectar variables muy heterogéneas o con concentraciones extremas de valores antes de aplicar técnicas analíticas más avanzadas.
apply(resenas_de_juegos_electronicos_depurados[,-c(1,3,4,5,6,9,10,11,12,13)], 2, mean, na.rm = TRUE)
## Precio_mas_alto punt_criticos_meta n_criticos_meta alto
## 29.802898 20.282904 9.257159 29.802898
resenas_juegos_electronicos_reducido = resenas_de_juegos_electronicos_depurados[,-c(1,3,4,5,6,9,10,11,12,13)]
nombres_boxplots <- c("Precio_mas_alto","punt_criticos_meta","n_criticos_meta","punt_usuarios_meta")
par(mfrow = c(1, ncol(resenas_juegos_electronicos_reducido)))
invisible(lapply(1:ncol(resenas_juegos_electronicos_reducido), function(i) {
boxplot(resenas_juegos_electronicos_reducido[[i]],
main = nombres_boxplots[i],
ylim = quantile(resenas_juegos_electronicos_reducido[[i]], c(0.02, 0.99), na.rm = TRUE),
na.rm = TRUE)}))
En el boxplot de Precio_mas_alto se observa que la mediana del precio de los juegos se sitúa alrededor de un rango intermedio, mientras que el rango intercuartílico es relativamente estrecho, indicando que la mayoría de títulos se concentran en un intervalo de precios bastante homogéneo; sin embargo, la presencia de algunos valores atípicos hacia la parte alta revela juegos premium con precios sensiblemente superiores al resto, que representan ofertas de gama alta dentro del catálogo. En el caso de punt_criticos_meta y punt_usuarios_meta, las cajas se ubican mayoritariamente en rangos altos de la escala de puntuación, lo que sugiere que el conjunto de juegos reseñados presenta, en general, una calidad percibida buena o muy buena tanto para la crítica profesional como para los usuarios, aunque se aprecia cierta dispersión y algunos outliers que corresponden a títulos excepcionalmente valorados o, en menor medida, peor evaluados. Finalmente, el boxplot de n_criticos_meta muestra una gran asimetría y una concentración de valores bajos con una cola larga hacia la derecha, lo que indica que muchos juegos cuentan con pocas reseñas de críticos mientras que un grupo reducido acumula un número muy elevado de críticas, reflejando una visibilidad desigual donde unos pocos títulos concentran la atención mediática del mercado.
El conjunto de boxplots mostrado resume la distribución de tres variables relacionadas con la participación de los usuarios en las reseñas: el número de reseñas de usuarios en Metacritic (n_usuarios_meta), la calificación media en la PlayStation Store (calif_ps_store) y el número total de valoraciones en la tienda (n_total_store). El gráfico de cajas es especialmente adecuado para estos indicadores porque permite comparar, en una misma figura, la tendencia central (mediana), la dispersión (rango intercuartílico) y la presencia de valores atípicos, revelando de manera sintética si la interacción de los jugadores con cada título está concentrada en unos pocos niveles o si, por el contrario, existe una gran heterogeneidad en el volumen de reseñas y en las puntuaciones asignadas.
apply(resenas_de_juegos_electronicos_depurados[,-c(1,2,3,4,5,6,7,8,9,13)], 2, mean, na.rm = TRUE)
## n_usuarios_meta calif_ps_store n_total_store alto
## 270.29534 3.43149 5470.31386 29.80290
resenas_juegos_electronicos_reducido = resenas_de_juegos_electronicos_depurados[,-c(1,2,3,4,5,6,7,8,9,13)]
nombres_boxplots <- c("n_usuarios_meta","calif_ps_store","n_total_store")
par(mfrow = c(1, ncol(resenas_juegos_electronicos_reducido)))
invisible(lapply(1:ncol(resenas_juegos_electronicos_reducido), function(i) {
boxplot(resenas_juegos_electronicos_reducido[[i]],
main = nombres_boxplots[i],
ylim = quantile(resenas_juegos_electronicos_reducido[[i]], c(0.02, 0.99), na.rm = TRUE),
na.rm = TRUE)}))
En el boxplot de n_usuarios_meta se aprecia una distribución fuertemente asimétrica: la mayoría de juegos acumula un número relativamente bajo de reseñas de usuarios, mientras que una pequeña fracción presenta valores extremadamente altos, visibles como una larga cola de outliers hacia la parte superior. Esto indica que sólo ciertos títulos alcanzan un nivel de notoriedad suficiente como para generar miles de opiniones, concentrando buena parte de la conversación de la comunidad. En contraste, el boxplot de calif_ps_store muestra una caja estrecha y situada en valores altos
La siguiente tabla presenta la matriz de varianzas y covarianzas de las principales variables cuantitativas del estudio: Precio_mas_alto, punt_criticos_meta, n_criticos_meta, punt_usuarios_meta, n_usuarios_meta, calif_ps_store, n_total_store y alto (precio reescalado). La diagonal recoge las varianzas de cada variable, que miden su dispersión respecto a la media, mientras que los elementos fuera de la diagonal representan las covarianzas entre pares de variables, es decir, cómo tienden a variar conjuntamente en el mercado de videojuegos analizado. Esta matriz es un insumo fundamental en análisis multivariados, ya que resume la estructura de dependencia entre precio, puntuaciones y niveles de participación de usuarios y críticos, y sirve de base para técnicas posteriores como componentes principales, pruebas de normalidad multivariada y detección de outliers.
round(cov(resenas_de_juegos_electronicos_depurados[,-c(1,3,4,5,6,13)]),2)
## Precio_mas_alto punt_criticos_meta n_criticos_meta
## Precio_mas_alto 323.88 27.20 64.35
## punt_criticos_meta 27.20 1126.42 506.25
## n_criticos_meta 64.35 506.25 415.05
## punt_usuarios_meta 2.74 85.13 41.61
## n_usuarios_meta 5444.91 18776.60 21620.69
## calif_ps_store -3.41 -0.21 0.67
## n_total_store 89034.89 71242.60 99376.00
## alto 323.88 27.20 64.35
## punt_usuarios_meta n_usuarios_meta calif_ps_store
## Precio_mas_alto 2.74 5444.91 -3.41
## punt_criticos_meta 85.13 18776.60 -0.21
## n_criticos_meta 41.61 21620.69 0.67
## punt_usuarios_meta 7.38 1418.71 0.12
## n_usuarios_meta 1418.71 10194373.38 104.52
## calif_ps_store 0.12 104.52 2.39
## n_total_store 6083.61 27618456.67 5451.33
## alto 2.74 5444.91 -3.41
## n_total_store alto
## Precio_mas_alto 89034.89 323.88
## punt_criticos_meta 71242.60 27.20
## n_criticos_meta 99376.00 64.35
## punt_usuarios_meta 6083.61 2.74
## n_usuarios_meta 27618456.67 5444.91
## calif_ps_store 5451.33 -3.41
## n_total_store 715143353.92 89034.89
## alto 89034.89 323.88
Las varianzas muestran que n_usuarios_meta y n_total_store presentan una dispersión extremadamente elevada frente al resto de variables, lo que confirma que el volumen de reseñas de usuarios y de valoraciones en la tienda está muy concentrado en unos pocos títulos con altísima visibilidad, mientras que la mayoría de juegos recibe un número relativamente bajo de interacciones. Las covarianzas positivas entre Precio_mas_alto y las medidas de participación (n_usuarios_meta y n_total_store) sugieren que los juegos con precios más altos tienden a estar asociados a productos con mayor exposición y más reseñados, aunque esta relación deberá evaluarse con medidas estandarizadas como las correlaciones. Asimismo, las covarianzas elevadas entre punt_criticos_meta, punt_usuarios_meta y calif_ps_store indican que las distintas métricas de calidad percibida se mueven en la misma dirección, lo que respalda la idea de coherencia entre la valoración de la crítica, la opinión de los usuarios y la calificación agregada en la PS Store para los videojuegos del conjunto de datos.
La siguiente matriz de correlaciones muestra la intensidad y dirección de la relación lineal entre las variables cuantitativas del estudio (Precio_mas_alto, punt_criticos_meta, n_criticos_meta, punt_usuarios_meta, n_usuarios_meta, calif_ps_store, n_total_store y alto). Cada coeficiente toma valores entre -1 y 1, donde valores cercanos a 1 indican asociación positiva fuerte, valores cercanos a -1 asociación negativa fuerte y valores próximos a 0 ausencia de relación lineal apreciable.
round(cor(resenas_de_juegos_electronicos_depurados[,-c(1,3,4,5,6,13)]),3)
## Precio_mas_alto punt_criticos_meta n_criticos_meta
## Precio_mas_alto 1.000 0.045 0.176
## punt_criticos_meta 0.045 1.000 0.740
## n_criticos_meta 0.176 0.740 1.000
## punt_usuarios_meta 0.056 0.933 0.752
## n_usuarios_meta 0.095 0.175 0.332
## calif_ps_store -0.123 -0.004 0.021
## n_total_store 0.185 0.079 0.182
## alto 1.000 0.045 0.176
## punt_usuarios_meta n_usuarios_meta calif_ps_store
## Precio_mas_alto 0.056 0.095 -0.123
## punt_criticos_meta 0.933 0.175 -0.004
## n_criticos_meta 0.752 0.332 0.021
## punt_usuarios_meta 1.000 0.164 0.030
## n_usuarios_meta 0.164 1.000 0.021
## calif_ps_store 0.030 0.021 1.000
## n_total_store 0.084 0.323 0.132
## alto 0.056 0.095 -0.123
## n_total_store alto
## Precio_mas_alto 0.185 1.000
## punt_criticos_meta 0.079 0.045
## n_criticos_meta 0.182 0.176
## punt_usuarios_meta 0.084 0.056
## n_usuarios_meta 0.323 0.095
## calif_ps_store 0.132 -0.123
## n_total_store 1.000 0.185
## alto 0.185 1.000
Se observa una correlación muy alta entre punt_criticos_meta y punt_usuarios_meta, así como entre estas puntuaciones y el número de críticas (n_criticos_meta), lo que indica que los juegos mejor valorados tienden también a recibir más reseñas y a ser bien evaluados por ambos grupos. Por el contrario, el Precio_mas_alto y la calif_ps_store presentan correlaciones bajas o incluso ligeramente negativas con el resto de variables, sugiriendo que ni el precio ni la valoración agregada en la tienda se relacionan de forma lineal fuerte con la popularidad o el volumen de reseñas de los videojuegos analizados.
El vector de medias y la matriz de varianzas-covarianzas son elementos fundamentales del análisis estadístico multivariado, pues permiten caracterizar el comportamiento central, la dispersión y las relaciones de dependencia entre las variables de un conjunto de datos. Estas herramientas facilitan la comprensión global de la estructura interna de la información analizada.
El siguiente diagrama conjunto generado con ggpairs combina, en una sola figura, los histogramas univariados de cada variable numérica (precio, puntuaciones, número de críticas y valoraciones totales) con los diagramas de dispersión bivariados y los coeficientes de correlación entre todas ellas. Este tipo de visualización es especialmente útil en análisis multivariado porque permite, de un vistazo, explorar la forma de las distribuciones individuales, detectar posibles relaciones lineales o no lineales entre pares de variables y evaluar la fuerza de dichas relaciones mediante los coeficientes de correlación mostrados en la parte superior de cada panel.
ggpairs(resenas_de_juegos_electronicos_depurados[,-c(1,3,4,5,6,13)])
En los paneles se observa una correlación fuerte y positiva entre
punt_criticos_meta, punt_usuarios_meta y n_criticos_meta, lo que indica
que los juegos mejor valorados tienden a recibir más reseñas y que
existe coherencia entre la opinión de críticos y usuarios. También se
aprecia que variables como Precio_mas_alto y calif_ps_store presentan
nubes de puntos muy dispersas y coeficientes de correlación bajos
respecto al resto, lo que sugiere que ni el precio máximo ni la
calificación agregada en la PS Store guardan una relación lineal clara
con la popularidad medida por el número de reseñas o con las
puntuaciones de Metacritic.
El siguiente diagrama ggpairs muestra, de forma conjunta, las distribuciones, los diagramas de dispersión y los coeficientes de correlación de las variables numéricas relacionadas con evaluaciones y participación de usuarios (Precio_mas_alto, punt_criticos_meta, n_criticos_meta, punt_usuarios_meta, n_usuarios_meta y calif_ps_store), diferenciando dos grupos según la variable categórica part_publi que clasifica la participación publicitaria de los juegos en niveles bajo (B) y medio (M). El coloreo por grupos permite comparar si la estructura de relaciones entre precio, puntuaciones y volumen de reseñas cambia según el nivel de inversión o visibilidad publicitaria.
resenas_de_juegos_electronicos_depurados$part_publi <- factor(
resenas_de_juegos_electronicos_depurados$participacion_publi_cat,
levels = c(1, 2),
labels = c("B", "M"))
ggpairs(resenas_de_juegos_electronicos_depurados,columns = c(2, 7, 8, 9, 10, 11), aes(color = part_publi, alpha = 0.5), upper = list(continuous = wrap("cor", size = 2.5)))
En los paneles de dispersión se observa que los juegos con mayor
participación publicitaria (grupo M) tienden a concentrarse en rangos
más altos de n_criticos_meta, n_usuarios_meta y n_total_store, lo que
sugiere que la publicidad se asocia con una mayor visibilidad y número
de reseñas tanto críticas como de usuarios. Sin embargo, las
correlaciones entre puntuaciones (punt_criticos_meta,
punt_usuarios_meta, calif_ps_store) y el precio parecen similares en
ambos grupos, lo que indica que la publicidad influye más en el volumen
de interacción que en la valoración media de los juegos, la cual sigue
determinada principalmente por la calidad percibida del producto.
El diagrama de estrellas presenta el perfil multivariado de 20 videojuegos seleccionados aleatoriamente, usando como radios las variables numéricas Precio_mas_alto, punt_criticos_meta, n_criticos_meta, punt_usuarios_meta, n_usuarios_meta, calif_ps_store y n_total_store. Cada estrella resume simultáneamente el nivel de precio, las puntuaciones y el volumen de reseñas, permitiendo comparar de forma visual qué títulos destacan en determinadas dimensiones del mercado.
resenas_de_juegos_electronicos_depurados$alto <- NULL
set.seed(120522)
resenas_de_juegos_electronicos_depurados_Muestreado = resenas_de_juegos_electronicos_depurados[sample(1:nrow(resenas_de_juegos_electronicos_depurados),20),-c(1,3,4,5,6,13)]
stars(resenas_de_juegos_electronicos_depurados_Muestreado, len = 1, cex = 0.4, key.loc = c(12, 2), draw.segments = TRUE)
Las estrellas con segmentos más largos en n_usuarios_meta y
n_total_store corresponden a juegos con gran popularidad y alta
participación de la comunidad, mientras que aquellas con radios cortos
en estas variables representan títulos con baja visibilidad. Algunas
estrellas muestran combinaciones de precio elevado y participación
moderada, indicando productos de gama alta aún en consolidación,
mientras que otras presentan perfiles más equilibrados, propios de
juegos con precios y evaluaciones intermedias en el catálogo
analizado.
El siguiente gráfico de caras de Chernoff representa 23 videojuegos seleccionados aleatoriamente a partir de las variables numéricas del conjunto de datos (Precio_mas_alto, puntuaciones y conteos de reseñas), transformando cada vector de valores en un rostro con rasgos faciales distintos. La forma y el tamaño de elementos como ojos, boca, orejas o cabeza codifican combinaciones de las variables, de modo que diferencias en la expresión de las caras reflejan patrones multivariados diferenciados entre los juegos analizados.
set.seed(120522)
no_numericas <- which(!sapply(resenas_de_juegos_electronicos_depurados, is.numeric))
resenas_de_juegos_electronicos_depurados_1_Muestreado =resenas_de_juegos_electronicos_depurados[
sample(1:nrow(resenas_de_juegos_electronicos_depurados), 23),-no_numericas]
faces(resenas_de_juegos_electronicos_depurados_1_Muestreado)
## effect of variables:
## modified item Var
## "height of face " "Precio_mas_alto"
## "width of face " "punt_criticos_meta"
## "structure of face" "n_criticos_meta"
## "height of mouth " "punt_usuarios_meta"
## "width of mouth " "n_usuarios_meta"
## "smiling " "calif_ps_store"
## "height of eyes " "n_total_store"
## "width of eyes " "participacion_publi_cat"
## "height of hair " "Precio_mas_alto"
## "width of hair " "punt_criticos_meta"
## "style of hair " "n_criticos_meta"
## "height of nose " "punt_usuarios_meta"
## "width of nose " "n_usuarios_meta"
## "width of ear " "calif_ps_store"
## "height of ear " "n_total_store"
Las caras más “extremas”, con cabezas más grandes, ojos más abiertos u orejas más alargadas, corresponden a títulos con valores altos simultáneamente en varias dimensiones, típicamente juegos con precios elevados, altas puntuaciones y gran número de reseñas, que se distinguen visualmente del resto. En cambio, los rostros más homogéneos y pequeños representan videojuegos con perfiles más modestos en precio, calidad percibida y participación de usuarios, lo que indica que el mercado incluye tanto productos estrella claramente diferenciados como una mayoría de títulos con características medias o bajas.
La prueba de normalidad multivariada de Mardia evalúa si el vector formado por las variables cuantitativas del estudio (precio_mas_alto, punt_criticos, n_criticos, punt_usuarios, n_usuarios, calif_ps y n_ps) puede considerarse procedente de una distribución normal conjunta. Para ello calcula dos estadísticas, una asociada al sesgo (skewness) y otra a la curtosis, y contrasta hipótesis de normalidad tanto a nivel multivariado como de forma univariante para cada variable.
library(MVN)
datos_mvn <- resenas_de_juegos_electronicos_depurados[
, c("Precio_mas_alto", "punt_criticos_meta", "n_criticos_meta",
"punt_usuarios_meta", "n_usuarios_meta", "calif_ps_store",
"n_total_store", "participacion_publi_cat")]
datos_mvn <- na.omit(datos_mvn)
mvn_result <- mvn(data = datos_mvn,mvn_test = "mardia")
print(mvn_result)
## $multivariate_normality
## Test Statistic p.value Method MVN
## 1 Mardia Skewness 1642898.81 <0.001 asymptotic ✗ Not normal
## 2 Mardia Kurtosis 7632.91 <0.001 asymptotic ✗ Not normal
##
## $univariate_normality
## Test Variable Statistic p.value Normality
## 1 Anderson-Darling Precio_mas_alto 101.852 <0.001 ✗ Not normal
## 2 Anderson-Darling punt_criticos_meta 758.520 <0.001 ✗ Not normal
## 3 Anderson-Darling n_criticos_meta 768.379 <0.001 ✗ Not normal
## 4 Anderson-Darling punt_usuarios_meta 795.200 <0.001 ✗ Not normal
## 5 Anderson-Darling n_usuarios_meta 1172.159 <0.001 ✗ Not normal
## 6 Anderson-Darling calif_ps_store 435.598 <0.001 ✗ Not normal
## 7 Anderson-Darling n_total_store 956.080 <0.001 ✗ Not normal
## 8 Anderson-Darling participacion_publi_cat 1312.857 <0.001 ✗ Not normal
##
## $descriptives
## Variable n Mean Std.Dev Median Min Max 25th
## 1 Precio_mas_alto 3457 29.803 17.997 24.99 0 100.0 15.99
## 2 punt_criticos_meta 3457 20.283 33.562 1.00 1 98.0 1.00
## 3 n_criticos_meta 3457 9.257 20.373 1.00 1 145.0 1.00
## 4 punt_usuarios_meta 3457 2.446 2.717 1.00 1 9.5 1.00
## 5 n_usuarios_meta 3457 270.295 3192.863 1.00 1 165959.0 1.00
## 6 calif_ps_store 3457 3.431 1.546 4.22 1 5.0 1.00
## 7 n_total_store 3457 5470.314 26742.164 127.00 1 854788.0 1.00
## 8 participacion_publi_cat 3457 1.016 0.125 1.00 1 2.0 1.00
## 75th Skew Kurtosis
## 1 39.99 1.015 3.594
## 2 65.00 1.208 2.557
## 3 4.00 3.063 12.726
## 4 1.00 1.419 3.155
## 5 1.00 41.801 2109.524
## 6 4.56 -0.845 1.887
## 7 1577.00 14.849 354.212
## 8 1.00 7.738 60.871
##
## $data
## # A tibble: 3,457 × 8
## Precio_mas_alto punt_criticos_meta n_criticos_meta punt_usuarios_meta
## <dbl> <dbl> <dbl> <dbl>
## 1 25.0 98 86 8.3
## 2 60.0 97 99 8.9
## 3 70.0 97 99 8.9
## 4 9.99 97 56 8
## 5 70.0 97 66 8.5
## 6 70.0 97 66 8.5
## 7 70.0 96 112 9.2
## 8 70.0 96 86 8.3
## 9 40.0 96 115 8.9
## 10 65.0 96 98 8.9
## # ℹ 3,447 more rows
## # ℹ 4 more variables: n_usuarios_meta <dbl>, calif_ps_store <dbl>,
## # n_total_store <dbl>, participacion_publi_cat <dbl>
##
## $subset
## NULL
##
## $outlierMethod
## [1] "none"
##
## attr(,"class")
## [1] "mvn"
Los valores obtenidos para Mardia (sesgo = 1 394 600.419 y curtosis = 7 583.488, con p‑valores < 0.001) llevan a rechazar claramente la normalidad multivariada, indicando que el conjunto de variables, incluido precio_mas_alto, presenta una estructura muy alejada de la distribución normal. De forma consistente, las pruebas univariantes de Anderson‑Darling muestran que cada variable por separado tampoco es normal (p‑valores < 0.001), con asimetrías y curtosis especialmente extremas en n_usuarios y n_ps, donde unos pocos videojuegos concentran valores muy altos de reseñas o ventas mientras la mayoría se mantiene en niveles bajos.
La prueba de Henze–Zirkler es un contraste global de normalidad multivariada que evalúa si el vector formado por precio_mas_alto, punt_criticos, n_criticos, punt_usuarios, n_usuarios, calif_ps y n_ps puede considerarse procedente de una distribución normal conjunta. Se basa en una medida de distancia entre la distribución empírica de los datos y la distribución normal teórica equivalente, generando una estadística H Z y un valor p asociado.
mvn(resenas_de_juegos_electronicos_depurados[, -c(1, 3, 4, 5, 6, 13)], mvn_test = "hz")
## Warning in hz(data, use_population = use_population, tol = tol, bootstrap =
## bootstrap, : Dropping non-numeric columns: part_publi
## Warning in test_univariate_normality(data, test = "AD"): Dropping non-numeric
## columns: part_publi
## Warning in descriptives(data): Dropping non-numeric columns: part_publi
## $multivariate_normality
## Test Statistic p.value Method MVN
## 1 Henze-Zirkler 380.187 <0.001 asymptotic ✗ Not normal
##
## $univariate_normality
## Test Variable Statistic p.value Normality
## 1 Anderson-Darling Precio_mas_alto 101.852 <0.001 ✗ Not normal
## 2 Anderson-Darling punt_criticos_meta 758.520 <0.001 ✗ Not normal
## 3 Anderson-Darling n_criticos_meta 768.379 <0.001 ✗ Not normal
## 4 Anderson-Darling punt_usuarios_meta 795.200 <0.001 ✗ Not normal
## 5 Anderson-Darling n_usuarios_meta 1172.159 <0.001 ✗ Not normal
## 6 Anderson-Darling calif_ps_store 435.598 <0.001 ✗ Not normal
## 7 Anderson-Darling n_total_store 956.080 <0.001 ✗ Not normal
##
## $descriptives
## Variable n Mean Std.Dev Median Min Max 25th 75th
## 1 Precio_mas_alto 3457 29.803 17.997 24.99 0 100.0 15.99 39.99
## 2 punt_criticos_meta 3457 20.283 33.562 1.00 1 98.0 1.00 65.00
## 3 n_criticos_meta 3457 9.257 20.373 1.00 1 145.0 1.00 4.00
## 4 punt_usuarios_meta 3457 2.446 2.717 1.00 1 9.5 1.00 1.00
## 5 n_usuarios_meta 3457 270.295 3192.863 1.00 1 165959.0 1.00 1.00
## 6 calif_ps_store 3457 3.431 1.546 4.22 1 5.0 1.00 4.56
## 7 n_total_store 3457 5470.314 26742.164 127.00 1 854788.0 1.00 1577.00
## Skew Kurtosis
## 1 1.015 3.594
## 2 1.208 2.557
## 3 3.063 12.726
## 4 1.419 3.155
## 5 41.801 2109.524
## 6 -0.845 1.887
## 7 14.849 354.212
##
## $data
## # A tibble: 3,457 × 8
## Precio_mas_alto punt_criticos_meta n_criticos_meta punt_usuarios_meta
## <dbl> <dbl> <dbl> <dbl>
## 1 25.0 98 86 8.3
## 2 60.0 97 99 8.9
## 3 70.0 97 99 8.9
## 4 9.99 97 56 8
## 5 70.0 97 66 8.5
## 6 70.0 97 66 8.5
## 7 70.0 96 112 9.2
## 8 70.0 96 86 8.3
## 9 40.0 96 115 8.9
## 10 65.0 96 98 8.9
## # ℹ 3,447 more rows
## # ℹ 4 more variables: n_usuarios_meta <dbl>, calif_ps_store <dbl>,
## # n_total_store <dbl>, part_publi <fct>
##
## $subset
## NULL
##
## $outlierMethod
## [1] "none"
##
## attr(,"class")
## [1] "mvn"
La estadística de Henze–Zirkler obtenida es 380.187, con un p‑valor < 0.001, por lo que se rechaza la hipótesis de normalidad multivariada para el conjunto de variables, confirmando el resultado observado previamente con la prueba de Mardia. De nuevo, las pruebas univariantes de Anderson–Darling muestran que cada variable por separado, incluido precio_mas_alto, se desvía significativamente de la normalidad, con fuertes asimetrías y curtosis muy elevadas en n_usuarios y n_ps, lo que refleja la presencia de colas largas y valores extremos característicos del mercado de videojuegos.
mvn(resenas_de_juegos_electronicos_depurados[, -c(1, 3, 4, 5, 6, 13)], mvn_test = "doornik_hansen")
## Warning in doornik_hansen(data, bootstrap = bootstrap, B = B, cores = cores):
## Dropping non-numeric columns: part_publi
## Warning in test_univariate_normality(data, test = "AD"): Dropping non-numeric
## columns: part_publi
## Warning in descriptives(data): Dropping non-numeric columns: part_publi
## $multivariate_normality
## Test Statistic df p.value Method MVN
## 1 Doornik-Hansen 88299.04 14 <0.001 asymptotic ✗ Not normal
##
## $univariate_normality
## Test Variable Statistic p.value Normality
## 1 Anderson-Darling Precio_mas_alto 101.852 <0.001 ✗ Not normal
## 2 Anderson-Darling punt_criticos_meta 758.520 <0.001 ✗ Not normal
## 3 Anderson-Darling n_criticos_meta 768.379 <0.001 ✗ Not normal
## 4 Anderson-Darling punt_usuarios_meta 795.200 <0.001 ✗ Not normal
## 5 Anderson-Darling n_usuarios_meta 1172.159 <0.001 ✗ Not normal
## 6 Anderson-Darling calif_ps_store 435.598 <0.001 ✗ Not normal
## 7 Anderson-Darling n_total_store 956.080 <0.001 ✗ Not normal
##
## $descriptives
## Variable n Mean Std.Dev Median Min Max 25th 75th
## 1 Precio_mas_alto 3457 29.803 17.997 24.99 0 100.0 15.99 39.99
## 2 punt_criticos_meta 3457 20.283 33.562 1.00 1 98.0 1.00 65.00
## 3 n_criticos_meta 3457 9.257 20.373 1.00 1 145.0 1.00 4.00
## 4 punt_usuarios_meta 3457 2.446 2.717 1.00 1 9.5 1.00 1.00
## 5 n_usuarios_meta 3457 270.295 3192.863 1.00 1 165959.0 1.00 1.00
## 6 calif_ps_store 3457 3.431 1.546 4.22 1 5.0 1.00 4.56
## 7 n_total_store 3457 5470.314 26742.164 127.00 1 854788.0 1.00 1577.00
## Skew Kurtosis
## 1 1.015 3.594
## 2 1.208 2.557
## 3 3.063 12.726
## 4 1.419 3.155
## 5 41.801 2109.524
## 6 -0.845 1.887
## 7 14.849 354.212
##
## $data
## # A tibble: 3,457 × 8
## Precio_mas_alto punt_criticos_meta n_criticos_meta punt_usuarios_meta
## <dbl> <dbl> <dbl> <dbl>
## 1 25.0 98 86 8.3
## 2 60.0 97 99 8.9
## 3 70.0 97 99 8.9
## 4 9.99 97 56 8
## 5 70.0 97 66 8.5
## 6 70.0 97 66 8.5
## 7 70.0 96 112 9.2
## 8 70.0 96 86 8.3
## 9 40.0 96 115 8.9
## 10 65.0 96 98 8.9
## # ℹ 3,447 more rows
## # ℹ 4 more variables: n_usuarios_meta <dbl>, calif_ps_store <dbl>,
## # n_total_store <dbl>, part_publi <fct>
##
## $subset
## NULL
##
## $outlierMethod
## [1] "none"
##
## attr(,"class")
## [1] "mvn"
datos_limpios <- na.omit(resenas_de_juegos_electronicos_depurados[, -c(1,3,4,5,6,13)])
datos_royston <- datos_limpios[1:2000, ]
mvn(datos_royston, mvn_test = "royston")
## Warning in royston(data, tol = tol, bootstrap = bootstrap, B = B, cores =
## cores): Dropping non-numeric columns: part_publi
## Warning in test_univariate_normality(data, test = "AD"): Dropping non-numeric
## columns: part_publi
## Warning in descriptives(data): Dropping non-numeric columns: part_publi
## $multivariate_normality
## Test Statistic p.value Method MVN
## 1 Royston 1451.886 <0.001 asymptotic ✗ Not normal
##
## $univariate_normality
## Test Variable Statistic p.value Normality
## 1 Anderson-Darling Precio_mas_alto 67.914 <0.001 ✗ Not normal
## 2 Anderson-Darling punt_criticos_meta 473.579 <0.001 ✗ Not normal
## 3 Anderson-Darling n_criticos_meta 452.923 <0.001 ✗ Not normal
## 4 Anderson-Darling punt_usuarios_meta 474.064 <0.001 ✗ Not normal
## 5 Anderson-Darling n_usuarios_meta 653.439 <0.001 ✗ Not normal
## 6 Anderson-Darling calif_ps_store 276.139 <0.001 ✗ Not normal
## 7 Anderson-Darling n_total_store 532.648 <0.001 ✗ Not normal
##
## $descriptives
## Variable n Mean Std.Dev Median Min Max 25th 75th
## 1 Precio_mas_alto 2000 29.982 18.737 24.99 0 100.0 14.99 39.99
## 2 punt_criticos_meta 2000 20.656 35.627 1.00 1 98.0 1.00 1.00
## 3 n_criticos_meta 2000 11.213 24.150 1.00 1 145.0 1.00 1.00
## 4 punt_usuarios_meta 2000 2.532 2.881 1.00 1 9.2 1.00 1.00
## 5 n_usuarios_meta 2000 432.748 4179.334 1.00 1 165959.0 1.00 1.00
## 6 calif_ps_store 2000 3.480 1.585 4.33 1 5.0 1.00 4.62
## 7 n_total_store 2000 7372.048 33040.661 192.50 1 854788.0 1.00 2478.00
## Skew Kurtosis
## 1 1.012 3.419
## 2 1.274 2.656
## 3 2.649 9.557
## 4 1.390 3.015
## 5 32.103 1237.580
## 6 -0.860 1.867
## 7 12.934 257.141
##
## $data
## # A tibble: 2,000 × 8
## Precio_mas_alto punt_criticos_meta n_criticos_meta punt_usuarios_meta
## <dbl> <dbl> <dbl> <dbl>
## 1 25.0 98 86 8.3
## 2 60.0 97 99 8.9
## 3 70.0 97 99 8.9
## 4 9.99 97 56 8
## 5 70.0 97 66 8.5
## 6 70.0 97 66 8.5
## 7 70.0 96 112 9.2
## 8 70.0 96 86 8.3
## 9 40.0 96 115 8.9
## 10 65.0 96 98 8.9
## # ℹ 1,990 more rows
## # ℹ 4 more variables: n_usuarios_meta <dbl>, calif_ps_store <dbl>,
## # n_total_store <dbl>, part_publi <fct>
##
## $subset
## NULL
##
## $outlierMethod
## [1] "none"
##
## attr(,"class")
## [1] "mvn"
El Análisis de Componentes Principales (ACP) tiene como finalidad transformar el conjunto original de variables numéricas en un nuevo conjunto de componentes que concentren la mayor parte de la información contenida en los datos. En el presente estudio, el ACP se aplica sobre un grupo de variables cuantitativas que describen el desempeño y la recepción de los videojuegos, tales como las puntuaciones otorgadas por críticos y usuarios, así como la cantidad de reseñas registradas en diferentes plataformas. Mediante este procedimiento estadístico, se busca reducir la complejidad del conjunto de datos, identificando las combinaciones lineales de variables que mejor explican la variabilidad total observada. De esta manera, el ACP facilita una interpretación más clara de las relaciones entre las distintas medidas de valoración, permitiendo representar la información en un espacio de menor dimensión sin perder la esencia del comportamiento general de los datos.
El Análisis de Componentes Principales (ACP) se desarrolla a través de distintas etapas que incluyen la construcción de nuevas variables, la reducción de la dimensionalidad del conjunto de datos, la identificación y eliminación de variables con baja relevancia, y la interpretación de los componentes obtenidos dentro del contexto del problema analizado.
Estimado lector, si desea profundizar en los fundamentos teóricos que respaldan este análisis, los detalles del conjunto de datos se encuentran expuestos en la Sección 1.2,mientras que los principios conceptuales sobre los que se apoya este estudio se desarrollan con detalle en la Fase 1.
datos_pca <- resenas_de_juegos_electronicos_depurados[,
c("Precio_mas_alto","punt_criticos_meta","n_criticos_meta","punt_usuarios_meta","n_usuarios_meta","calif_ps_store")]
res.pca <- PCA(datos_pca, ncp = 6, scale.unit = TRUE, graph = FALSE)
get_eigenvalue(res.pca)
## eigenvalue variance.percent cumulative.variance.percent
## Dim.1 2.72428898 45.404816 45.40482
## Dim.2 1.13244757 18.874126 64.27894
## Dim.3 0.97778641 16.296440 80.57538
## Dim.4 0.83202932 13.867155 94.44254
## Dim.5 0.26801775 4.466962 98.90950
## Dim.6 0.06542997 1.090499 100.00000
datos_cor <- resenas_de_juegos_electronicos_depurados[,
c("Precio_mas_alto","punt_criticos_meta","n_criticos_meta","punt_usuarios_meta","n_usuarios_meta","calif_ps_store", "n_total_store")]
round(cor(datos_cor, use = "pairwise.complete.obs"), 2)
## Precio_mas_alto punt_criticos_meta n_criticos_meta
## Precio_mas_alto 1.00 0.05 0.18
## punt_criticos_meta 0.05 1.00 0.74
## n_criticos_meta 0.18 0.74 1.00
## punt_usuarios_meta 0.06 0.93 0.75
## n_usuarios_meta 0.09 0.18 0.33
## calif_ps_store -0.12 0.00 0.02
## n_total_store 0.19 0.08 0.18
## punt_usuarios_meta n_usuarios_meta calif_ps_store
## Precio_mas_alto 0.06 0.09 -0.12
## punt_criticos_meta 0.93 0.18 0.00
## n_criticos_meta 0.75 0.33 0.02
## punt_usuarios_meta 1.00 0.16 0.03
## n_usuarios_meta 0.16 1.00 0.02
## calif_ps_store 0.03 0.02 1.00
## n_total_store 0.08 0.32 0.13
## n_total_store
## Precio_mas_alto 0.19
## punt_criticos_meta 0.08
## n_criticos_meta 0.18
## punt_usuarios_meta 0.08
## n_usuarios_meta 0.32
## calif_ps_store 0.13
## n_total_store 1.00
datos_pca <- resenas_de_juegos_electronicos_depurados[,
c("Precio_mas_alto","punt_criticos_meta","n_criticos_meta","punt_usuarios_meta","n_usuarios_meta","calif_ps_store","n_total_store")]
datos_pca <- na.omit(datos_pca)
datos_pca <- datos_pca[is.finite(rowSums(datos_pca)), ]
valores_propios <- princomp(datos_pca, cor = TRUE)$sdev^2
vectores_propios <- princomp(datos_pca, cor = TRUE)$loadings[, 1:5]
print(round(valores_propios, 2))
## Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7
## 2.77 1.32 1.12 0.83 0.62 0.27 0.07
print(round(vectores_propios, 3))
## Comp.1 Comp.2 Comp.3 Comp.4 Comp.5
## Precio_mas_alto 0.114 0.394 0.580 0.621 0.305
## punt_criticos_meta 0.551 -0.249 -0.012 0.029 -0.098
## n_criticos_meta 0.539 -0.016 0.029 0.011 0.098
## punt_usuarios_meta 0.553 -0.245 -0.031 0.069 -0.087
## n_usuarios_meta 0.243 0.514 -0.065 -0.605 0.517
## calif_ps_store 0.022 0.134 -0.797 0.491 0.321
## n_total_store 0.164 0.663 -0.148 0.037 -0.714
datos_num <- resenas_de_juegos_electronicos_depurados[,
c("Precio_mas_alto",
"punt_criticos_meta",
"n_criticos_meta",
"punt_usuarios_meta",
"n_usuarios_meta",
"calif_ps_store",
"n_total_store")]
datos_num <- na.omit(datos_num)
resultado_pca <- princomp(datos_num, cor = TRUE)
corrplot(cor(datos_num), method = "color", type = "upper", number.cex = 0.4)
datos_num <- resenas_de_juegos_electronicos_depurados[,
c("Precio_mas_alto",
"punt_criticos_meta",
"n_criticos_meta",
"punt_usuarios_meta",
"n_usuarios_meta",
"calif_ps_store",
"n_total_store")]
datos_num <- na.omit(datos_num)
res.pca <- PCA(datos_num, ncp = 8, scale.unit = TRUE, graph = FALSE)
fviz_eig(res.pca, addlabels = TRUE, ylim = c(0, 90), main = "")
## Warning in geom_bar(stat = "identity", fill = barfill, color = barcolor, :
## Ignoring empty aesthetic: `width`.
datos_num <- resenas_de_juegos_electronicos_depurados[,
c("Precio_mas_alto","punt_criticos_meta","n_criticos_meta","punt_usuarios_meta","n_usuarios_meta","calif_ps_store","n_total_store")]
scree(datos_num, factors = FALSE, pc = TRUE, main = "")
datos_num <- resenas_de_juegos_electronicos_depurados[,
c("Precio_mas_alto","punt_criticos_meta","n_criticos_meta","punt_usuarios_meta","n_usuarios_meta","calif_ps_store","n_total_store")]
datos_num <- na.omit(datos_num)
res.pca <- PCA(datos_num, ncp = 8, scale.unit = TRUE, graph = FALSE)
fviz_pca_var(res.pca,col.var = "#3B83BD",repel = TRUE,col.circle = "#CDCDCD",ggtheme = theme_bw())
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## ℹ The deprecated feature was likely used in the ggpubr package.
## Please report the issue at <https://github.com/kassambara/ggpubr/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: `aes_string()` was deprecated in ggplot2 3.0.0.
## ℹ Please use tidy evaluation idioms with `aes()`.
## ℹ See also `vignette("ggplot2-in-packages")` for more information.
## ℹ The deprecated feature was likely used in the factoextra package.
## Please report the issue at <https://github.com/kassambara/factoextra/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
datos_num <- resenas_de_juegos_electronicos_depurados[,
c("Precio_mas_alto","punt_criticos_meta","n_criticos_meta","punt_usuarios_meta","n_usuarios_meta","calif_ps_store","n_total_store")]
datos_num <- na.omit(datos_num)
res.pca <- PCA(datos_num, ncp = 6, scale.unit = TRUE, graph = FALSE)
fviz_contrib(
res.pca,
choice = "var",
axes = 1,
top = 10
)
datos_num <- resenas_de_juegos_electronicos_depurados[,
c("Precio_mas_alto","punt_criticos_meta","n_criticos_meta","punt_usuarios_meta","n_usuarios_meta","calif_ps_store","n_total_store")]
datos_num <- na.omit(datos_num)
res.pca <- PCA(datos_num, ncp = 5, scale.unit = TRUE, graph = FALSE)
var <- get_pca_var(res.pca)
var$cos2
## Dim.1 Dim.2 Dim.3 Dim.4
## Precio_mas_alto 0.035736414 0.2058008399 0.3747099919 3.211479e-01
## punt_criticos_meta 0.841850201 0.0823035291 0.0001672585 6.958026e-04
## n_criticos_meta 0.805611206 0.0003232891 0.0009637689 9.592625e-05
## punt_usuarios_meta 0.848544659 0.0794190332 0.0011047883 3.964005e-03
## n_usuarios_meta 0.163740585 0.3493399831 0.0047036441 3.052284e-01
## calif_ps_store 0.001308774 0.0238563614 0.7095483582 2.006934e-01
## n_total_store 0.074737166 0.5813662436 0.0245942349 1.140365e-03
## Dim.5
## Precio_mas_alto 0.058049952
## punt_criticos_meta 0.006045692
## n_criticos_meta 0.005960149
## punt_usuarios_meta 0.004769527
## n_usuarios_meta 0.166558921
## calif_ps_store 0.064332038
## n_total_store 0.318154575
datos_num <- resenas_de_juegos_electronicos_depurados[,
c("Precio_mas_alto","punt_criticos_meta","n_criticos_meta","punt_usuarios_meta","n_usuarios_meta","calif_ps_store","n_total_store")]
datos_num <- na.omit(datos_num)
res.pca <- PCA(datos_num, ncp = 5, scale.unit = TRUE, graph = FALSE)
fviz_pca_var( res.pca, col.var = "cos2",
gradient.cols = c("#D7263D", "#1A1AFF", "#FF9800"),repel = TRUE)
datos_num <- resenas_de_juegos_electronicos_depurados[,
c("Precio_mas_alto","punt_criticos_meta","n_criticos_meta","punt_usuarios_meta","n_usuarios_meta","calif_ps_store","n_total_store")]
datos_num <- na.omit(datos_num)
res.pca <- PCA(datos_num, ncp = 5, scale.unit = TRUE, graph = FALSE)
head(res.pca$ind$coord, n = 20L)
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
## 1 5.150071 0.73285400 0.94724318 -0.56722259 -0.2523484
## 2 9.864860 13.92062745 2.39554983 -3.75196976 -4.0770507
## 3 9.928512 14.14207054 2.07399092 -3.40677406 -3.9099061
## 4 3.640097 -1.23360693 1.27706999 -0.45157345 0.1419571
## 5 5.559100 2.99251765 -0.16132201 -0.59067556 2.0882738
## 6 10.549097 23.13547503 4.26458955 0.48022360 -19.6576221
## 7 6.983748 2.36929899 -2.23157903 -2.73688630 3.4782081
## 8 6.307049 2.88227475 -2.15246537 -3.25848143 3.7964336
## 9 5.967017 0.12758991 0.10906654 -0.56471987 1.7541407
## 10 5.360400 0.11128124 -0.39610930 1.37769007 1.3817204
## 11 5.138079 0.26925069 -0.57647960 1.40010389 1.5810868
## 12 5.289006 0.36018270 -2.29333562 -0.61508191 1.3206736
## 13 5.126060 -0.58329644 0.68118514 -0.07517554 1.0466558
## 14 4.615794 -0.19868033 -1.74099535 -0.98128092 0.7468456
## 15 6.417290 2.20077331 -0.54352333 -1.11511968 3.6238097
## 16 6.362353 2.03115567 0.04333922 -1.35144880 3.4949006
## 17 4.320887 -0.49511706 -2.15903441 0.03370713 0.3701613
## 18 5.266380 -0.01536507 0.74931298 -0.07425578 0.3874144
## 19 8.507616 12.93327327 2.86640457 -2.08083730 -7.1832280
## 20 6.096352 3.10701329 -0.26346761 -1.96969181 4.2415091
Los autores (Díaz Morales & Morales Rivera, 2012) destacan que la interpretación de los resultados en el análisis de componentes principales depende estrechamente del cálculo de elementos como coordenadas, contribuciones y cosenos cuadrados. En el contexto de los datos sobre videojuegos, es fundamental que variables como las puntuaciones de críticos, número de reseñas, calificaciones de usuarios, géneros o cifras de ventas estén correctamente conceptualizadas y contextualizadas para una comprensión clara y precisa.
La Matriz de Contribuciones muestra cómo cada variable contribuye a la retención de variabilidad en la construcción de cada componente. Los diagramas de barras, que se visualizan en las pestañas desde Contribuciones a D1 hasta Contribuciones a D5, ilustran las contribuciones específicas de las variables para explicar la variabilidad en cada componente. Cada gráfico incluye una línea que indica la contribución media, lo que facilita la identificación de las variables que tienen mayor impacto en la explicación de la variabilidad de los componentes.
En Contribuciones a D1 se observa que las variables punt_usuarios, punt_criticos y n_criticos presentan una contribución claramente superior a la media, reteniendo aproximadamente el \(90%\) de la variabilidad explicada por el primer componente principal.
datos_num <- resenas_de_juegos_electronicos_depurados[,
c("Precio_mas_alto","punt_criticos_meta","n_criticos_meta","punt_usuarios_meta","n_usuarios_meta","calif_ps_store","n_total_store")]
datos_num <- na.omit(datos_num)
res.pca <- PCA(datos_num, ncp = 6, scale.unit = TRUE, graph = FALSE)
var <- get_pca_var(res.pca)
var$contrib
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
## Precio_mas_alto 1.28941152 15.56256774 33.58242189 38.55475082 9.3048027
## punt_criticos_meta 30.37493742 6.22375617 0.01499012 0.08353316 0.9690615
## n_criticos_meta 29.06739222 0.02444698 0.08637532 0.01151623 0.9553499
## punt_usuarios_meta 30.61648126 6.00563187 0.09901382 0.47589049 0.7645055
## n_usuarios_meta 5.90795133 26.41693374 0.42155204 36.64356886 26.6976602
## calif_ps_store 0.04722211 1.80400741 63.59145160 24.09383621 10.3117556
## n_total_store 2.69660414 43.96265609 2.20419522 0.13690422 50.9968646
## Dim.6
## Precio_mas_alto 1.697481080
## punt_criticos_meta 13.897510624
## n_criticos_meta 69.772133603
## punt_usuarios_meta 10.665913603
## n_usuarios_meta 3.884337666
## calif_ps_store 0.079859268
## n_total_store 0.002764156
datos_num <- resenas_de_juegos_electronicos_depurados[,
c("Precio_mas_alto","punt_criticos_meta","n_criticos_meta","punt_usuarios_meta","n_usuarios_meta","calif_ps_store","n_total_store")]
datos_num <- na.omit(datos_num)
res.pca <- PCA(datos_num, ncp = 6, scale.unit = TRUE, graph = FALSE)
fviz_contrib(res.pca, choice = "var", axes = 1, top = 10)
datos_num <- resenas_de_juegos_electronicos_depurados[,
c("Precio_mas_alto","punt_criticos_meta","n_criticos_meta","punt_usuarios_meta","n_usuarios_meta","calif_ps_store","n_total_store")]
datos_num <- na.omit(datos_num)
res.pca <- PCA(datos_num, ncp = 6, scale.unit = TRUE, graph = FALSE)
fviz_contrib(res.pca, choice = "var", axes = 2, top = 10)
datos_num <- resenas_de_juegos_electronicos_depurados[,
c("Precio_mas_alto","punt_criticos_meta","n_criticos_meta","punt_usuarios_meta","n_usuarios_meta","calif_ps_store","n_total_store")]
datos_num <- na.omit(datos_num)
res.pca <- PCA(datos_num, ncp = 6, scale.unit = TRUE, graph = FALSE)
fviz_contrib(res.pca, choice = "var", axes = 3, top = 10)
datos_num <- resenas_de_juegos_electronicos_depurados[,
c("Precio_mas_alto","punt_criticos_meta","n_criticos_meta","punt_usuarios_meta","n_usuarios_meta","calif_ps_store","n_total_store")]
datos_num <- na.omit(datos_num)
res.pca <- PCA(datos_num, ncp = 6, scale.unit = TRUE, graph = FALSE)
fviz_contrib(res.pca, choice = "var", axes = 4, top = 10)
datos_num <- resenas_de_juegos_electronicos_depurados[,
c("Precio_mas_alto","punt_criticos_meta","n_criticos_meta","punt_usuarios_meta","n_usuarios_meta","calif_ps_store","n_total_store")]
datos_num <- na.omit(datos_num)
res.pca <- PCA(datos_num, ncp = 6, scale.unit = TRUE, graph = FALSE)
fviz_contrib(res.pca, choice = "var", axes = 5, top = 10)
resenas_de_juegos_electronicos_depurados <- read_excel ("C:/Users/juane_xt82f/OneDrive/Escritorio/GSD_6/resenas_de_juegos_electronicos_depurados.xlsx")
resenas_de_juegos_electronicos_depurados_Muestreado <- resenas_de_juegos_electronicos_depurados[
sample(1:nrow(resenas_de_juegos_electronicos_depurados), 100),
-c(1,3,4,5,6,13)]
resenas_de_juegos_electronicos_depurados_Muestreado$punt_usuarios_cat <- cut(
resenas_de_juegos_electronicos_depurados_Muestreado$punt_usuarios_meta,
breaks = c(-Inf, 3, 5, 7.5, Inf),
labels = c("Muy Malo", "Malo", "Bueno", "Muy Bueno"))
fviz_pca_biplot(PCA(resenas_de_juegos_electronicos_depurados_Muestreado[,], ncp = 5, scale.unit = TRUE, graph = FALSE, quali.sup = "punt_usuarios_cat"),axes = c(1, 2),repel = TRUE, habillage = "punt_usuarios_cat")
resenas_de_juegos_electronicos_depurados <- read_excel("C:/Users/juane_xt82f/OneDrive/Escritorio/GSD_6/resenas_de_juegos_electronicos_depurados.xlsx")
set.seed(780729)
resenas_de_juegos_electronicos_depurados_Muestreado <- resenas_de_juegos_electronicos_depurados[ sample(1:nrow(resenas_de_juegos_electronicos_depurados), 150), -c(1,3,4,5,6,13)]
resenas_de_juegos_electronicos_depurados_Muestreado$calif_ps_cat <- cut(
resenas_de_juegos_electronicos_depurados_Muestreado$calif_ps_store,
breaks = c(-Inf, 3, 4.5, Inf),
labels = c("Baja", "Media", "Alta"))
num_cols <- sapply(resenas_de_juegos_electronicos_depurados_Muestreado, is.numeric)
df_pca <- resenas_de_juegos_electronicos_depurados_Muestreado[, num_cols]
df_pca$calif_ps_cat <- resenas_de_juegos_electronicos_depurados_Muestreado$calif_ps_cat
pca_result <- PCA(df_pca,ncp = 5,scale.unit = TRUE,graph = FALSE,quali.sup = which(names(df_pca) == "calif_ps_cat"))
fviz_pca_biplot(pca_result,axes = c(1,2),repel = TRUE,habillage = "calif_ps_cat")
set.seed(220512)
resenas_de_juegos_electronicos_depurados_Muestreado= resenas_de_juegos_electronicos_depurados[sample(1:nrow(resenas_de_juegos_electronicos_depurados),47),-c(1,3,4,5,6,13)]
resenas_de_juegos_electronicos_depurados_Muestreado$n_usuarios_cat <- cut(
resenas_de_juegos_electronicos_depurados_Muestreado$n_usuarios_meta,
breaks = c(-Inf, 5, 50, Inf),
labels = c("Bajo", "Medio", "Alto"))
head(PCA(resenas_de_juegos_electronicos_depurados_Muestreado,ncp = 4,scale.unit = TRUE,graph = FALSE, quali.sup = "n_usuarios_cat")$ind$coord, n = 40L)
## Dim.1 Dim.2 Dim.3 Dim.4
## 1 -1.2428635 3.86894018 0.270585598 -2.475409417
## 2 5.0730916 0.54313785 -0.941729960 0.292716756
## 3 -0.8111002 -0.33540899 -1.692038724 0.029698083
## 4 -1.3152366 3.63260229 1.499014606 -0.813583675
## 5 0.2819718 -1.11196812 0.924598534 -0.471241978
## 6 3.3370721 -1.08748939 1.097537744 -0.777513845
## 7 1.2097552 -0.58005126 -0.635030743 -0.511254107
## 8 -1.1297920 -0.42233260 1.513870768 0.543677514
## 9 -0.9568925 0.14408247 -0.297688616 0.656916282
## 10 -1.0128424 -1.03013145 0.426523988 -0.127618548
## 11 5.6885726 1.53862635 -0.154030084 2.192174662
## 12 -0.9660626 -1.27325099 -0.008414724 -0.396136972
## 13 2.7977246 -1.17282744 0.973039869 -0.779084055
## 14 -1.0128424 -1.03013145 0.426523988 -0.127618548
## 15 -0.9148832 0.28442827 -0.865080830 0.225537079
## 16 -0.9959701 0.84863093 -0.021457369 1.196970258
## 17 -1.0150290 0.93725707 0.079490979 1.016157896
## 18 -0.7918780 -0.42725153 -1.891945714 -0.147465280
## 19 -1.0362323 -0.90857168 0.643993344 0.006640665
## 20 -1.0128424 -1.03013145 0.426523988 -0.127618548
## 21 -0.8702366 -0.06622178 -1.138280707 0.335337889
## 22 1.5794809 -1.16665961 1.104074807 -0.736121191
## 23 -0.8666117 -0.37627324 -1.128649145 0.104841769
## 24 -1.0260919 0.80514184 0.218222052 0.970954870
## 25 -0.9894525 -1.15169122 0.209054632 -0.261877760
## 26 -0.8643552 -0.09168414 -1.219838914 0.210357883
## 27 -0.9312686 0.15253182 -0.588282995 0.498149964
## 28 -1.0262650 1.54769696 -0.501343164 -0.713439343
## 29 -0.8421838 -0.16889033 -1.408077346 0.196075505
## 30 4.6948415 1.94694645 -0.216208655 -0.052614630
## 31 -0.9904699 0.58278060 -0.044862240 0.967038639
## 32 -1.2233516 0.06390649 2.383748192 1.080714363
## 33 -0.9988085 -1.10306731 0.296042374 -0.208174075
## 34 -0.9183162 -0.16167003 -0.645179432 0.343376280
## 35 -1.2701315 0.30702603 2.818686905 1.349232788
## 36 -0.9660626 -1.27325099 -0.008414724 -0.396136972
## 37 -0.8352924 -0.30382198 -1.488911986 -0.029347565
## 38 1.4532819 -1.55890618 0.557526269 -1.194667051
## 39 -1.1181251 0.90632470 0.848351965 0.204203624
## 40 1.2736905 -0.37123673 -0.566416101 -0.392759648
El análisis de correspondencias se emplea para estudiar la asociación entre variables categóricas, como puede ser género y plataforma, o género y región de ventas. Este enfoque permite visualizar en un plano reducido la relación entre categorías, facilitando la interpretación de cómo se vinculan los diferentes grupos dentro del dataset. Así, por ejemplo, se puede identificar si ciertos géneros son preferidos en determinadas plataformas o regiones, descubriendo patrones relevantes en el consumo de videojuegos.
En esta tercera fase del estudio se presentarán los cálculos, visualizaciones e interpretaciones correspondientes al análisis de las variables cualitativas del conjunto de datos previamente trabajado en la fase 1 y fase 2. El propósito de esta etapa es aplicar el Análisis de Correspondencias Simples y Múltiples (ACS y ACM), con el fin de explorar las relaciones entre categorías y representar gráficamente las asociaciones existentes.Para ello, se llevará a cabo la construcción de tablas de contingencia y tablas disyuntivas completas, así como la evaluación de la calidad de representación, las contribuciones y la interpretación de los ejes factoriales obtenidos.
Según (Aldás & Uriel, 2017),el análisis de correspondencias simple (ACS) tiene como propósito reducir la dimensionalidad de las relaciones entre categorías de dos variables categóricas, representándolas en un espacio multidimensional. Este método permite analizar gráficamente las distancias entre las categorías de las variables, facilitando la interpretación de tablas de contingencia. El número máximo de dimensiones necesarias para explicar dichas relaciones corresponde a uno menos el número de categorías de la variable con menor cantidad de niveles.
Asimismo, el ACS, basado en tablas de contingencia, puede ampliarse para incluir más de dos variables categóricas, lo que se conoce como Análisis de correspondencias múltiples (ACM). Este enfoque utiliza una tabla disyuntiva completa, permitiendo explorar y representar relaciones más complejas entre múltiples variables categóricas.
resenas_de_juegos_electronicos_depurados_V2 <- read_excel("C:/Users/juane_xt82f/OneDrive/Escritorio/GSD_6/resenas_de_juegos_electronicos_depurados_V2.xlsx")
resenas_de_juegos_electronicos_depurados_V2$lanzamiento <- as.Date(resenas_de_juegos_electronicos_depurados_V2$lanzamiento, origin = "1899-12-30")
set.seed(780729)
resenas_de_juegos_electronicos_depurados_V2.active<-resenas_de_juegos_electronicos_depurados_V2[sample(1:nrow(resenas_de_juegos_electronicos_depurados_V2),15), 1:5]
suppressWarnings(round(MCA(resenas_de_juegos_electronicos_depurados_V2.active, graph = FALSE, ncp = 5)$eig, 3))
## eigenvalue percentage of variance cumulative percentage of variance
## dim 1 1.000 8.929 8.929
## dim 2 0.982 8.765 17.693
## dim 3 0.800 7.143 24.836
## dim 4 0.800 7.143 31.979
## dim 5 0.800 7.143 39.122
## dim 6 0.800 7.143 46.265
## dim 7 0.800 7.143 53.408
## dim 8 0.800 7.143 60.551
## dim 9 0.800 7.143 67.693
## dim 10 0.800 7.143 74.836
## dim 11 0.800 7.143 81.979
## dim 12 0.800 7.143 89.122
## dim 13 0.618 5.521 94.643
## dim 14 0.600 5.357 100.000
resenas_de_juegos_electronicos_depurados_V2 <- read_excel("C:/Users/juane_xt82f/OneDrive/Escritorio/GSD_6/resenas_de_juegos_electronicos_depurados_V2.xlsx")
resenas_de_juegos_electronicos_depurados_V2$lanzamiento <- as.Date(resenas_de_juegos_electronicos_depurados_V2$lanzamiento, origin = "1899-12-30")
set.seed(780729)
resenas_de_juegos_electronicos_depurados_V2.active<-resenas_de_juegos_electronicos_depurados_V2[sample(1:nrow(resenas_de_juegos_electronicos_depurados_V2),100), 1:5]
res.mca <- MCA(resenas_de_juegos_electronicos_depurados_V2.active, graph = FALSE)
#resenas_de_juegos_electronicos_depurados$genero <- as.factor(resenas_de_juegos_electronicos_depurados$genero)
#habillage = "genero",
fviz_mca_biplot(res.mca, repel = TRUE, col.var = "#E7B800", addEllipses = TRUE, ellipse.level = 0.95)
resenas_de_juegos_electronicos_depurados_V2 <- read_excel("C:/Users/juane_xt82f/OneDrive/Escritorio/GSD_6/resenas_de_juegos_electronicos_depurados_V2.xlsx")
resenas_de_juegos_electronicos_depurados_V2$lanzamiento <- as.Date(resenas_de_juegos_electronicos_depurados_V2$lanzamiento, origin = "1899-12-30")
set.seed(780729)
resenas_de_juegos_electronicos_depurados_V2.active<-resenas_de_juegos_electronicos_depurados_V2[sample(1:nrow(resenas_de_juegos_electronicos_depurados_V2),50), 1:5]
res.mca <- MCA(resenas_de_juegos_electronicos_depurados_V2.active, graph = FALSE)
#resenas_de_juegos_electronicos_depurados_V2$genero <- as.factor(resenas_de_juegos_electronicos_depurados_V2$genero)
fviz_mca_var(res.mca, col.var ="cos2", gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"), repel = TRUE)
res.mca$var$cos2
## Dim 1 Dim 2
## Batman™: Arkham VR 0.0004164931 3.757682e-03
## Battle Princess Madelyn 0.0004164931 3.757682e-03
## Before We Leave 0.0004164931 8.384742e-03
## Blackguards 2 0.0004164931 6.026689e-04
## Blue Prince 0.0004164931 1.166176e-01
## Conarium 0.0004164931 6.026689e-04
## DEADCRAFT 0.0004164931 1.184052e-02
## Dragon Age™: Inquisition 0.0004164931 2.359591e-03
## DRAGON QUEST BUILDERS™ 0.0004164931 4.406076e-03
## Earth Atlantis 0.0004164931 5.501176e-03
## Fabledom 0.0004164931 1.166176e-01
## Fall of Porcupine 0.0004164931 1.166176e-01
## Flinthook 0.0004164931 3.757682e-03
## Genesis Alpha One 0.0004164931 5.262675e-03
## HARDCORE MECHA 0.0004164931 5.617038e-03
## Hellblade: Senua’s Sacrifice 0.0004164931 3.757682e-03
## Help Will Come Tomorrow 0.0004164931 5.501176e-03
## Hoa 0.0004164931 3.757682e-03
## HOT WHEELS UNLEASHED™ 0.0004164931 1.307665e-04
## LOST SPHEAR 0.0004164931 5.620523e-03
## Magicka 2 0.0004164931 5.661506e-03
## Monster Energy Supercross - The Official Videogame 2 0.0004164931 1.307665e-04
## Monster Energy Supercross - The Official Videogame 4 0.0004164931 3.842487e-02
## Monster Truck Championship 0.0004164931 3.757682e-03
## Nano Assault NEO-X 0.0004164931 3.757682e-03
## NOBUNAGA'S AMBITION: Sphere of Influence - Ascension 0.0004164931 6.204651e-03
## Pillars of Eternity II: Deadfire - Ultimate Edition 0.0004164931 3.757682e-03
## Please Fix The Road 0.0004164931 1.166176e-01
## Raiden IV x MIKADO remix 0.0004164931 1.113768e-02
## Resistance: Fall of Man™ 0.0004164931 1.092093e-02
## REVEIL 0.0004164931 2.883022e-02
## River City: Rival Showdown 0.0004164931 3.757682e-03
## Russian Subway Dogs 1.0000000000 5.428848e-28
## SAMURAI WARRIORS 4 0.0004164931 1.173451e-02
## Shadowrun: Dragonfall - Director's Cut 0.0004164931 9.767908e-03
## SILENT HILL 2 0.0004164931 1.166176e-01
## SILT 0.0004164931 1.184052e-02
## Sophstar 0.0004164931 9.205287e-03
## Soulstice 0.0004164931 3.427864e-02
## Splasher 0.0004164931 5.501176e-03
## STAR WARS Jedi: Fallen Order™ 0.0004164931 7.315840e-04
## STAR WARS™ Republic Commando™ 0.0004164931 5.617038e-03
## Strayed Lights 0.0004164931 3.109284e-07
## Styx: Shards of Darkness 0.0004164931 3.757682e-03
## The Legend of Heroes: Trails of Cold Steel II 0.0004164931 1.138280e-02
## The Office Quest 0.0004164931 3.757682e-03
## ULTIMATE MARVEL VS, CAPCOM 3 0.0004164931 3.757682e-03
## Unbound: Worlds Apart 0.0004164931 9.205287e-03
## Unplugged - Air Guitar 0.0004164931 1.166176e-01
## Weedcraft Inc 0.0004164931 9.205287e-03
## 2014-04-16 0.0004164931 1.092093e-02
## 2014-10-29 0.0004164931 3.757682e-03
## 2014-11-19 0.0004164931 1.173451e-02
## 2014-11-20 0.0004164931 2.359591e-03
## 2015-05-26 0.0004164931 5.661506e-03
## 2016-10-13 0.0004164931 3.757682e-03
## 2016-11-11 0.0004164931 1.138280e-02
## 2016-11-15 0.0004164931 4.406076e-03
## 2016-11-25 0.0004164931 6.204651e-03
## 2016-12-04 0.0004164931 3.757682e-03
## 2017-03-14 0.0004164931 3.757682e-03
## 2017-04-18 0.0004164931 3.757682e-03
## 2017-08-08 0.0004164931 3.757682e-03
## 2017-09-15 0.0004164931 6.026689e-04
## 2017-09-27 0.0004164931 5.501176e-03
## 2018-01-23 0.0004164931 5.620523e-03
## 2018-06-01 0.0004164931 5.501176e-03
## 2019-01-29 0.0004164931 5.262675e-03
## 2019-02-08 0.0004164931 1.307665e-04
## 2019-02-12 0.0004164931 6.026689e-04
## 2019-10-18 0.0004164931 3.757682e-03
## 2020-01-14 0.0004164931 5.617038e-03
## 2020-01-28 0.0004164931 3.757682e-03
## 2020-04-21 0.0004164931 5.501176e-03
## 2020-06-03 0.0004164931 3.757682e-03
## 2020-10-15 0.0004164931 3.757682e-03
## 2021-03-11 0.0004164931 3.842487e-02
## 2021-04-06 0.0004164931 5.617038e-03
## 2021-06-11 0.0004164931 7.315840e-04
## 2021-09-27 0.0004164931 3.757682e-03
## 2021-09-30 0.0004164931 1.307665e-04
## 2022-02-09 0.0004164931 9.205287e-03
## 2022-04-05 0.0004164931 8.384742e-03
## 2022-05-19 0.0004164931 1.184052e-02
## 2022-06-01 0.0004164931 1.184052e-02
## 2022-06-21 0.0004164931 9.767908e-03
## 2022-09-20 0.0004164931 3.427864e-02
## 2022-10-28 0.0004164931 9.205287e-03
## 2023-02-03 0.0004164931 1.113768e-02
## 2023-02-22 0.0004164931 1.166176e-01
## 2023-04-25 0.0004164931 3.109284e-07
## 2023-06-15 0.0004164931 1.166176e-01
## 2023-06-28 1.0000000000 5.511377e-28
## 2023-10-12 0.0004164931 3.757682e-03
## 2023-11-18 0.0004164931 9.205287e-03
## 2024-03-06 0.0004164931 2.883022e-02
## 2024-05-16 0.0004164931 1.166176e-01
## 2024-09-12 0.0004164931 1.166176e-01
## 2024-10-08 0.0004164931 1.166176e-01
## 2025-04-10 0.0004164931 1.166176e-01
## Action / Adventure / Arcade 0.0004164931 3.757682e-03
## Action / Shooter / Arcade 0.0004164931 3.757682e-03
## Action/Adventure 0.0013026487 8.747481e-03
## Action/Adventure/Co-op 0.0004164931 5.661506e-03
## Action/Adventure/Strategy 0.0004164931 1.173451e-02
## Action/Adventure/VR 0.0004164931 3.757682e-03
## Action/Beat'em up/RPG 0.0004164931 3.757682e-03
## Action/Horror/Survival 0.0004164931 1.166176e-01
## Action/Platformer 0.0008503401 1.477085e-02
## Action/Platformer/Roguelike 0.0004164931 3.757682e-03
## Action/Role playing games 0.0004164931 1.166176e-01
## Action/Shooter 0.0017746229 3.187449e-02
## Action/Shooter/Adventure 0.0004164931 2.359591e-03
## Action/Shooter/Arcade 0.0008503401 1.477085e-02
## Action/Stealth/Adventure 0.0004164931 3.757682e-03
## Action/Survival/RPG 0.0004164931 1.184052e-02
## Adventure 0.0008503401 2.131819e-02
## Adventure/Horror 0.0004164931 1.166176e-01
## Adventure/Narrative/Puzzle 0.0004164931 1.166176e-01
## Arcade/Action 1.0000000000 5.511377e-28
## Aventura/Narrativa/Misterio 0.0004164931 3.757682e-03
## Fighting 0.0004164931 3.757682e-03
## Horror/Adventure 0.0008503401 1.927822e-02
## Music/rhythm 0.0004164931 1.166176e-01
## Platformer/Puzzle/Adventure 0.0004164931 3.757682e-03
## Puzzle 0.0004164931 1.166176e-01
## Puzzle/Adventure/Comedy 0.0004164931 3.757682e-03
## Puzzle/Adventure/Horror 0.0004164931 1.184052e-02
## Racing 0.0004164931 3.842487e-02
## Racing/Arcade 0.0004164931 1.307665e-04
## Role playing games 0.0004164931 3.757682e-03
## Role playing games/JRPG 0.0008503401 1.684399e-02
## Shooter 0.0004164931 5.262675e-03
## Simulación/Estrategia 0.0004164931 9.205287e-03
## Simulación/Estrategia/Supervivencia 0.0004164931 5.501176e-03
## Simulation/Role playing games 0.0004164931 4.406076e-03
## Sports/Racing 0.0004164931 1.307665e-04
## Strategy/Card game/Role playing games 0.0004164931 3.757682e-03
## Strategy/Role playing games 0.0004164931 6.026689e-04
## Strategy/Simulation 0.0004164931 6.204651e-03
## 11 Sheep 0.0004164931 3.757682e-03
## Arc System Works Co 0.0004164931 3.757682e-03
## ASPYR MEDIA 0.0004164931 5.617038e-03
## ASSEMBLE ENTERTAINMENT GMBH 0.0004164931 1.166176e-01
## CE EUROPE LIMITED 0.0004164931 3.757682e-03
## DAEDALIC ENTERTAINMENT 0.0008503401 1.927822e-02
## Dear Villagers 0.0004164931 1.166176e-01
## DIGERATI DISTRIBUTION 0.0004164931 9.205287e-03
## EA Swiss Sarl 0.0008503401 2.919024e-03
## Embers SAS 0.0004164931 3.109284e-07
## Fireshine Games 0.0004164931 1.184052e-02
## HEADUP GAMES 0.0004164931 5.501176e-03
## ICEBERG INTERACTIVE BV 0.0004164931 6.026689e-04
## KLABATER 0.0008503401 1.477085e-02
## Koei Tecmo Europe Ltd 0.0008503401 1.786700e-02
## Konami 0.0004164931 1.166176e-01
## Marvelous Europe Limited 0.0004164931 1.184052e-02
## Maximum Entertainment 0.0004164931 3.427864e-02
## Microsoft Corporation 0.0004164931 3.757682e-03
## MILESTONE SRL 0.0013026487 1.665106e-02
## Monster Bath Studios Inc, 0.0004164931 3.757682e-03
## NACON SA 0.0008503401 7.671933e-03
## NINJA THEORY LIMITED 0.0004164931 3.757682e-03
## NIS America 0.0008503401 2.298897e-02
## PARADOX INTERACTIVE AB 0.0008503401 1.546682e-02
## Plug In Digital 0.0004164931 5.501176e-03
## PM Studios 0.0004164931 3.757682e-03
## RAW FURY 0.0004164931 1.166176e-01
## RED ART GAMES 0.0004164931 9.205287e-03
## ROCKETPUNCH (BEIJING) TECHNOLOGY CO,, LTD, 0.0004164931 5.617038e-03
## SHIN EN MULTIMEDIA GMBH 0.0004164931 3.757682e-03
## SILESIA GAMES SP, Z O,O, 0.0004164931 1.166176e-01
## Sony Interactive Entertainment Europe 0.0004164931 1.092093e-02
## SPOOKY SQUID GAMES INC, 1.0000000000 5.511377e-28
## Square Enix LTD 0.0008503401 1.019781e-02
## Team 17 Digital LTD 0.0008503401 1.374701e-02
## TRIBUTE GAMES 0.0004164931 3.757682e-03
## VERTIGO GAMES 0.0004164931 1.166176e-01
## WARNER BROS, INTERACTIVE 0.0004164931 3.757682e-03
## PS Vita 0.0004164931 1.138280e-02
## PS3 0.0008503401 2.311996e-02
## PS4 0.0259740260 1.676960e-01
## PS4 / PS Vita 1.0000000000 5.511377e-28
## PS5 0.0044798407 8.976149e-01
## PS5 / PS4 0.0044798407 9.113747e-02
## Dim 3 Dim 4
## Batman™: Arkham VR 1.161946e-02 1.659836e-02
## Battle Princess Madelyn 1.161946e-02 1.659836e-02
## Before We Leave 3.301019e-03 1.578115e-02
## Blackguards 2 5.599192e-03 7.309122e-03
## Blue Prince 1.132089e-03 2.457674e-03
## Conarium 5.599192e-03 7.309122e-03
## DEADCRAFT 1.291787e-01 1.958373e-02
## Dragon Age™: Inquisition 2.398067e-06 3.299366e-03
## DRAGON QUEST BUILDERS™ 3.213232e-03 1.232366e-02
## Earth Atlantis 1.169172e-03 1.813790e-03
## Fabledom 1.132089e-03 2.457674e-03
## Fall of Porcupine 1.132089e-03 2.457674e-03
## Flinthook 1.161946e-02 1.659836e-02
## Genesis Alpha One 1.270833e-03 7.400969e-05
## HARDCORE MECHA 9.503417e-03 5.243133e-03
## Hellblade: Senua’s Sacrifice 1.161946e-02 1.659836e-02
## Help Will Come Tomorrow 1.169172e-03 1.813790e-03
## Hoa 1.161946e-02 1.659836e-02
## HOT WHEELS UNLEASHED™ 6.262725e-03 8.220835e-03
## LOST SPHEAR 8.593298e-05 8.301926e-03
## Magicka 2 1.952625e-03 1.739620e-03
## Monster Energy Supercross - The Official Videogame 2 6.262725e-03 8.220835e-03
## Monster Energy Supercross - The Official Videogame 4 5.600756e-04 7.159216e-04
## Monster Truck Championship 1.161946e-02 1.659836e-02
## Nano Assault NEO-X 1.161946e-02 1.659836e-02
## NOBUNAGA'S AMBITION: Sphere of Influence - Ascension 4.294797e-02 5.107057e-02
## Pillars of Eternity II: Deadfire - Ultimate Edition 1.161946e-02 1.659836e-02
## Please Fix The Road 1.132089e-03 2.457674e-03
## Raiden IV x MIKADO remix 7.995688e-02 3.436210e-03
## Resistance: Fall of Man™ 5.099470e-02 2.195214e-01
## REVEIL 1.042333e-03 1.376969e-03
## River City: Rival Showdown 1.161946e-02 1.659836e-02
## Russian Subway Dogs 2.106809e-29 6.243453e-30
## SAMURAI WARRIORS 4 1.126096e-01 3.870204e-01
## Shadowrun: Dragonfall - Director's Cut 5.775470e-02 3.086694e-03
## SILENT HILL 2 1.132089e-03 2.457674e-03
## SILT 1.291787e-01 1.958373e-02
## Sophstar 4.727478e-02 2.883247e-03
## Soulstice 2.446919e-03 2.392509e-04
## Splasher 1.169172e-03 1.813790e-03
## STAR WARS Jedi: Fallen Order™ 1.837681e-02 4.956982e-04
## STAR WARS™ Republic Commando™ 9.503417e-03 5.243133e-03
## Strayed Lights 3.606153e-05 2.346857e-03
## Styx: Shards of Darkness 1.161946e-02 1.659836e-02
## The Legend of Heroes: Trails of Cold Steel II 5.121008e-02 8.472618e-04
## The Office Quest 1.161946e-02 1.659836e-02
## ULTIMATE MARVEL VS, CAPCOM 3 1.161946e-02 1.659836e-02
## Unbound: Worlds Apart 4.727478e-02 2.883247e-03
## Unplugged - Air Guitar 1.132089e-03 2.457674e-03
## Weedcraft Inc 4.727478e-02 2.883247e-03
## 2014-04-16 5.099470e-02 2.195214e-01
## 2014-10-29 1.161946e-02 1.659836e-02
## 2014-11-19 1.126096e-01 3.870204e-01
## 2014-11-20 2.398067e-06 3.299366e-03
## 2015-05-26 1.952625e-03 1.739620e-03
## 2016-10-13 1.161946e-02 1.659836e-02
## 2016-11-11 5.121008e-02 8.472618e-04
## 2016-11-15 3.213232e-03 1.232366e-02
## 2016-11-25 4.294797e-02 5.107057e-02
## 2016-12-04 1.161946e-02 1.659836e-02
## 2017-03-14 1.161946e-02 1.659836e-02
## 2017-04-18 1.161946e-02 1.659836e-02
## 2017-08-08 1.161946e-02 1.659836e-02
## 2017-09-15 5.599192e-03 7.309122e-03
## 2017-09-27 1.169172e-03 1.813790e-03
## 2018-01-23 8.593298e-05 8.301926e-03
## 2018-06-01 1.169172e-03 1.813790e-03
## 2019-01-29 1.270833e-03 7.400969e-05
## 2019-02-08 6.262725e-03 8.220835e-03
## 2019-02-12 5.599192e-03 7.309122e-03
## 2019-10-18 1.161946e-02 1.659836e-02
## 2020-01-14 9.503417e-03 5.243133e-03
## 2020-01-28 1.161946e-02 1.659836e-02
## 2020-04-21 1.169172e-03 1.813790e-03
## 2020-06-03 1.161946e-02 1.659836e-02
## 2020-10-15 1.161946e-02 1.659836e-02
## 2021-03-11 5.600756e-04 7.159216e-04
## 2021-04-06 9.503417e-03 5.243133e-03
## 2021-06-11 1.837681e-02 4.956982e-04
## 2021-09-27 1.161946e-02 1.659836e-02
## 2021-09-30 6.262725e-03 8.220835e-03
## 2022-02-09 4.727478e-02 2.883247e-03
## 2022-04-05 3.301019e-03 1.578115e-02
## 2022-05-19 1.291787e-01 1.958373e-02
## 2022-06-01 1.291787e-01 1.958373e-02
## 2022-06-21 5.775470e-02 3.086694e-03
## 2022-09-20 2.446919e-03 2.392509e-04
## 2022-10-28 4.727478e-02 2.883247e-03
## 2023-02-03 7.995688e-02 3.436210e-03
## 2023-02-22 1.132089e-03 2.457674e-03
## 2023-04-25 3.606153e-05 2.346857e-03
## 2023-06-15 1.132089e-03 2.457674e-03
## 2023-06-28 2.183756e-29 5.851492e-30
## 2023-10-12 1.161946e-02 1.659836e-02
## 2023-11-18 4.727478e-02 2.883247e-03
## 2024-03-06 1.042333e-03 1.376969e-03
## 2024-05-16 1.132089e-03 2.457674e-03
## 2024-09-12 1.132089e-03 2.457674e-03
## 2024-10-08 1.132089e-03 2.457674e-03
## 2025-04-10 1.132089e-03 2.457674e-03
## Action / Adventure / Arcade 1.161946e-02 1.659836e-02
## Action / Shooter / Arcade 1.161946e-02 1.659836e-02
## Action/Adventure 1.113759e-02 3.987920e-05
## Action/Adventure/Co-op 1.952625e-03 1.739620e-03
## Action/Adventure/Strategy 1.126096e-01 3.870204e-01
## Action/Adventure/VR 1.161946e-02 1.659836e-02
## Action/Beat'em up/RPG 1.161946e-02 1.659836e-02
## Action/Horror/Survival 1.132089e-03 2.457674e-03
## Action/Platformer 3.231602e-02 6.297065e-05
## Action/Platformer/Roguelike 1.161946e-02 1.659836e-02
## Action/Role playing games 1.132089e-03 2.457674e-03
## Action/Shooter 3.515574e-02 1.454238e-01
## Action/Shooter/Adventure 2.398067e-06 3.299366e-03
## Action/Shooter/Arcade 3.231602e-02 6.297065e-05
## Action/Stealth/Adventure 1.161946e-02 1.659836e-02
## Action/Survival/RPG 1.291787e-01 1.958373e-02
## Adventure 1.396610e-01 6.654014e-03
## Adventure/Horror 1.132089e-03 2.457674e-03
## Adventure/Narrative/Puzzle 1.132089e-03 2.457674e-03
## Arcade/Action 2.183756e-29 5.851492e-30
## Aventura/Narrativa/Misterio 1.161946e-02 1.659836e-02
## Fighting 1.161946e-02 1.659836e-02
## Horror/Adventure 5.856102e-03 7.672068e-03
## Music/rhythm 1.132089e-03 2.457674e-03
## Platformer/Puzzle/Adventure 1.161946e-02 1.659836e-02
## Puzzle 1.132089e-03 2.457674e-03
## Puzzle/Adventure/Comedy 1.161946e-02 1.659836e-02
## Puzzle/Adventure/Horror 1.291787e-01 1.958373e-02
## Racing 5.600756e-04 7.159216e-04
## Racing/Arcade 6.262725e-03 8.220835e-03
## Role playing games 1.161946e-02 1.659836e-02
## Role playing games/JRPG 2.832381e-02 7.377302e-03
## Shooter 1.270833e-03 7.400969e-05
## Simulación/Estrategia 4.727478e-02 2.883247e-03
## Simulación/Estrategia/Supervivencia 1.169172e-03 1.813790e-03
## Simulation/Role playing games 3.213232e-03 1.232366e-02
## Sports/Racing 6.262725e-03 8.220835e-03
## Strategy/Card game/Role playing games 1.161946e-02 1.659836e-02
## Strategy/Role playing games 5.599192e-03 7.309122e-03
## Strategy/Simulation 4.294797e-02 5.107057e-02
## 11 Sheep 1.161946e-02 1.659836e-02
## Arc System Works Co 1.161946e-02 1.659836e-02
## ASPYR MEDIA 9.503417e-03 5.243133e-03
## ASSEMBLE ENTERTAINMENT GMBH 1.132089e-03 2.457674e-03
## CE EUROPE LIMITED 1.161946e-02 1.659836e-02
## DAEDALIC ENTERTAINMENT 5.856102e-03 7.672068e-03
## Dear Villagers 1.132089e-03 2.457674e-03
## DIGERATI DISTRIBUTION 4.727478e-02 2.883247e-03
## EA Swiss Sarl 9.166753e-03 6.315583e-04
## Embers SAS 3.606153e-05 2.346857e-03
## Fireshine Games 1.291787e-01 1.958373e-02
## HEADUP GAMES 1.169172e-03 1.813790e-03
## ICEBERG INTERACTIVE BV 5.599192e-03 7.309122e-03
## KLABATER 3.231602e-02 6.297065e-05
## Koei Tecmo Europe Ltd 1.503919e-01 3.671272e-01
## Konami 1.132089e-03 2.457674e-03
## Marvelous Europe Limited 1.291787e-01 1.958373e-02
## Maximum Entertainment 2.446919e-03 2.392509e-04
## Microsoft Corporation 1.161946e-02 1.659836e-02
## MILESTONE SRL 1.150367e-02 1.504865e-02
## Monster Bath Studios Inc, 1.161946e-02 1.659836e-02
## NACON SA 2.372307e-02 3.388833e-02
## NINJA THEORY LIMITED 1.161946e-02 1.659836e-02
## NIS America 1.322720e-01 4.445344e-04
## PARADOX INTERACTIVE AB 4.131633e-02 9.789911e-05
## Plug In Digital 1.169172e-03 1.813790e-03
## PM Studios 1.161946e-02 1.659836e-02
## RAW FURY 1.132089e-03 2.457674e-03
## RED ART GAMES 4.727478e-02 2.883247e-03
## ROCKETPUNCH (BEIJING) TECHNOLOGY CO,, LTD, 9.503417e-03 5.243133e-03
## SHIN EN MULTIMEDIA GMBH 1.161946e-02 1.659836e-02
## SILESIA GAMES SP, Z O,O, 1.132089e-03 2.457674e-03
## Sony Interactive Entertainment Europe 5.099470e-02 2.195214e-01
## SPOOKY SQUID GAMES INC, 2.183756e-29 5.851492e-30
## Square Enix LTD 1.147528e-03 2.085322e-02
## Team 17 Digital LTD 2.426985e-04 6.989502e-03
## TRIBUTE GAMES 1.161946e-02 1.659836e-02
## VERTIGO GAMES 1.132089e-03 2.457674e-03
## WARNER BROS, INTERACTIVE 1.161946e-02 1.659836e-02
## PS Vita 5.121008e-02 8.472618e-04
## PS3 1.608643e-01 6.071392e-01
## PS4 3.017006e-01 3.225309e-01
## PS4 / PS Vita 2.183756e-29 5.851492e-30
## PS5 5.069840e-03 8.236705e-03
## PS5 / PS4 5.785014e-01 6.563338e-02
## Dim 5
## Batman™: Arkham VR 7.734375e-04
## Battle Princess Madelyn 7.734375e-04
## Before We Leave 3.899842e-03
## Blackguards 2 2.424820e-04
## Blue Prince 3.278831e-04
## Conarium 2.424820e-04
## DEADCRAFT 3.854145e-02
## Dragon Age™: Inquisition 3.747282e-03
## DRAGON QUEST BUILDERS™ 3.370787e-02
## Earth Atlantis 7.929197e-03
## Fabledom 3.278831e-04
## Fall of Porcupine 3.278831e-04
## Flinthook 7.734375e-04
## Genesis Alpha One 2.264162e-03
## HARDCORE MECHA 4.757778e-04
## Hellblade: Senua’s Sacrifice 7.734375e-04
## Help Will Come Tomorrow 7.929197e-03
## Hoa 7.734375e-04
## HOT WHEELS UNLEASHED™ 2.784371e-04
## LOST SPHEAR 1.173332e-01
## Magicka 2 1.025487e-04
## Monster Energy Supercross - The Official Videogame 2 2.784371e-04
## Monster Energy Supercross - The Official Videogame 4 1.714852e-05
## Monster Truck Championship 7.734375e-04
## Nano Assault NEO-X 7.734375e-04
## NOBUNAGA'S AMBITION: Sphere of Influence - Ascension 1.462004e-03
## Pillars of Eternity II: Deadfire - Ultimate Edition 7.734375e-04
## Please Fix The Road 3.278831e-04
## Raiden IV x MIKADO remix 5.945189e-02
## Resistance: Fall of Man™ 7.752660e-04
## REVEIL 4.058041e-05
## River City: Rival Showdown 7.734375e-04
## Russian Subway Dogs 2.668043e-31
## SAMURAI WARRIORS 4 7.725020e-03
## Shadowrun: Dragonfall - Director's Cut 1.493747e-03
## SILENT HILL 2 3.278831e-04
## SILT 3.854145e-02
## Sophstar 1.824781e-02
## Soulstice 1.359542e-03
## Splasher 7.929197e-03
## STAR WARS Jedi: Fallen Order™ 7.452757e-03
## STAR WARS™ Republic Commando™ 4.757778e-04
## Strayed Lights 2.442072e-03
## Styx: Shards of Darkness 7.734375e-04
## The Legend of Heroes: Trails of Cold Steel II 6.082774e-01
## The Office Quest 7.734375e-04
## ULTIMATE MARVEL VS, CAPCOM 3 7.734375e-04
## Unbound: Worlds Apart 1.824781e-02
## Unplugged - Air Guitar 3.278831e-04
## Weedcraft Inc 1.824781e-02
## 2014-04-16 7.752660e-04
## 2014-10-29 7.734375e-04
## 2014-11-19 7.725020e-03
## 2014-11-20 3.747282e-03
## 2015-05-26 1.025487e-04
## 2016-10-13 7.734375e-04
## 2016-11-11 6.082774e-01
## 2016-11-15 3.370787e-02
## 2016-11-25 1.462004e-03
## 2016-12-04 7.734375e-04
## 2017-03-14 7.734375e-04
## 2017-04-18 7.734375e-04
## 2017-08-08 7.734375e-04
## 2017-09-15 2.424820e-04
## 2017-09-27 7.929197e-03
## 2018-01-23 1.173332e-01
## 2018-06-01 7.929197e-03
## 2019-01-29 2.264162e-03
## 2019-02-08 2.784371e-04
## 2019-02-12 2.424820e-04
## 2019-10-18 7.734375e-04
## 2020-01-14 4.757778e-04
## 2020-01-28 7.734375e-04
## 2020-04-21 7.929197e-03
## 2020-06-03 7.734375e-04
## 2020-10-15 7.734375e-04
## 2021-03-11 1.714852e-05
## 2021-04-06 4.757778e-04
## 2021-06-11 7.452757e-03
## 2021-09-27 7.734375e-04
## 2021-09-30 2.784371e-04
## 2022-02-09 1.824781e-02
## 2022-04-05 3.899842e-03
## 2022-05-19 3.854145e-02
## 2022-06-01 3.854145e-02
## 2022-06-21 1.493747e-03
## 2022-09-20 1.359542e-03
## 2022-10-28 1.824781e-02
## 2023-02-03 5.945189e-02
## 2023-02-22 3.278831e-04
## 2023-04-25 2.442072e-03
## 2023-06-15 3.278831e-04
## 2023-06-28 3.081585e-31
## 2023-10-12 7.734375e-04
## 2023-11-18 1.824781e-02
## 2024-03-06 4.058041e-05
## 2024-05-16 3.278831e-04
## 2024-09-12 3.278831e-04
## 2024-10-08 3.278831e-04
## 2025-04-10 3.278831e-04
## Action / Adventure / Arcade 7.734375e-04
## Action / Shooter / Arcade 7.734375e-04
## Action/Adventure 1.035506e-02
## Action/Adventure/Co-op 1.025487e-04
## Action/Adventure/Strategy 7.725020e-03
## Action/Adventure/VR 7.734375e-04
## Action/Beat'em up/RPG 7.734375e-04
## Action/Horror/Survival 3.278831e-04
## Action/Platformer 2.564052e-02
## Action/Platformer/Roguelike 7.734375e-04
## Action/Role playing games 3.278831e-04
## Action/Shooter 1.629755e-03
## Action/Shooter/Adventure 3.747282e-03
## Action/Shooter/Arcade 2.564052e-02
## Action/Stealth/Adventure 7.734375e-04
## Action/Survival/RPG 3.854145e-02
## Adventure 4.072770e-02
## Adventure/Horror 3.278831e-04
## Adventure/Narrative/Puzzle 3.278831e-04
## Arcade/Action 3.081585e-31
## Aventura/Narrativa/Misterio 7.734375e-04
## Fighting 7.734375e-04
## Horror/Adventure 2.457433e-04
## Music/rhythm 3.278831e-04
## Platformer/Puzzle/Adventure 7.734375e-04
## Puzzle 3.278831e-04
## Puzzle/Adventure/Comedy 7.734375e-04
## Puzzle/Adventure/Horror 3.854145e-02
## Racing 1.714852e-05
## Racing/Arcade 2.784371e-04
## Role playing games 7.734375e-04
## Role playing games/JRPG 6.430832e-01
## Shooter 2.264162e-03
## Simulación/Estrategia 1.824781e-02
## Simulación/Estrategia/Supervivencia 7.929197e-03
## Simulation/Role playing games 3.370787e-02
## Sports/Racing 2.784371e-04
## Strategy/Card game/Role playing games 7.734375e-04
## Strategy/Role playing games 2.424820e-04
## Strategy/Simulation 1.462004e-03
## 11 Sheep 7.734375e-04
## Arc System Works Co 7.734375e-04
## ASPYR MEDIA 4.757778e-04
## ASSEMBLE ENTERTAINMENT GMBH 3.278831e-04
## CE EUROPE LIMITED 7.734375e-04
## DAEDALIC ENTERTAINMENT 2.457433e-04
## Dear Villagers 3.278831e-04
## DIGERATI DISTRIBUTION 1.824781e-02
## EA Swiss Sarl 1.111144e-02
## Embers SAS 2.442072e-03
## Fireshine Games 3.854145e-02
## HEADUP GAMES 7.929197e-03
## ICEBERG INTERACTIVE BV 2.424820e-04
## KLABATER 2.564052e-02
## Koei Tecmo Europe Ltd 8.119880e-03
## Konami 3.278831e-04
## Marvelous Europe Limited 3.854145e-02
## Maximum Entertainment 1.359542e-03
## Microsoft Corporation 7.734375e-04
## MILESTONE SRL 4.890603e-04
## Monster Bath Studios Inc, 7.734375e-04
## NACON SA 1.579101e-03
## NINJA THEORY LIMITED 7.734375e-04
## NIS America 5.349483e-01
## PARADOX INTERACTIVE AB 1.214314e-03
## Plug In Digital 7.929197e-03
## PM Studios 7.734375e-04
## RAW FURY 3.278831e-04
## RED ART GAMES 1.824781e-02
## ROCKETPUNCH (BEIJING) TECHNOLOGY CO,, LTD, 4.757778e-04
## SHIN EN MULTIMEDIA GMBH 7.734375e-04
## SILESIA GAMES SP, Z O,O, 3.278831e-04
## Sony Interactive Entertainment Europe 7.752660e-04
## SPOOKY SQUID GAMES INC, 3.081585e-31
## Square Enix LTD 1.412933e-01
## Team 17 Digital LTD 6.179627e-03
## TRIBUTE GAMES 7.734375e-04
## VERTIGO GAMES 3.278831e-04
## WARNER BROS, INTERACTIVE 7.734375e-04
## PS Vita 6.082774e-01
## PS3 6.836904e-03
## PS4 6.816069e-03
## PS4 / PS Vita 3.081585e-31
## PS5 4.983691e-04
## PS5 / PS4 5.858144e-02
resenas_de_juegos_electronicos_depurados_V2 <- read_excel("C:/Users/juane_xt82f/OneDrive/Escritorio/GSD_6/resenas_de_juegos_electronicos_depurados_V2.xlsx")
resenas_de_juegos_electronicos_depurados_V2$lanzamiento <- as.Date(resenas_de_juegos_electronicos_depurados_V2$lanzamiento, origin = "1899-12-30")
set.seed(780729)
resenas_de_juegos_electronicos_depurados_V2.active<-resenas_de_juegos_electronicos_depurados_V2[sample(1:nrow(resenas_de_juegos_electronicos_depurados_V2), 1000), 1:5]
res.mca <- MCA(resenas_de_juegos_electronicos_depurados_V2.active, graph = FALSE)
fviz_contrib(res.mca, choice = "var", axes = 1, top = 15)
fviz_contrib(res.mca, choice = "var", axes = 2, top = 15)
fviz_contrib(res.mca, choice = "var", axes = 3, top = 15)
fviz_contrib(res.mca, choice = "var", axes = 4, top = 15)
fviz_contrib(res.mca, choice = "var", axes = 5, top = 15)
resenas_de_juegos_electronicos_depurados_V2 <- read_excel("C:/Users/juane_xt82f/OneDrive/Escritorio/GSD_6/resenas_de_juegos_electronicos_depurados_V2.xlsx")
resenas_de_juegos_electronicos_depurados_V2$lanzamiento <- as.Date(resenas_de_juegos_electronicos_depurados_V2$lanzamiento, origin = "1899-12-30")
set.seed(780729)
resenas_de_juegos_electronicos_depurados_V2.active<-resenas_de_juegos_electronicos_depurados_V2[sample(1:nrow(resenas_de_juegos_electronicos_depurados_V2),20), 1:5]
res.mca <- MCA(resenas_de_juegos_electronicos_depurados_V2.active, graph = FALSE)
fviz_mca_var(res.mca, col.var ="contrib", gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"), repel = TRUE)
El análisis de conglomerados busca agrupar los videojuegos en subconjuntos homogéneos según sus características multivariantes, como puntuación, ventas, género y plataforma. Utilizando algoritmos como K-means o jerárquicos, se identifican grupos de títulos que comparten similitudes, lo cual ayuda a entender la segmentación del mercado, identificar nichos o establecer perfiles de videojuegos más exitosos. Los conglomerados pueden usarse para enfocar estrategias de desarrollo o mercadeo según los grupos detectados.
En esta cuarta etapa del estudio se llevarán a cabo cálculos, representaciones gráficas e interpretaciones empleando el conjunto de datos previamente procesado en las Fases (1, 2 y 3). El objetivo principal de esta etapa es aplicar el Análisis de Conglomerados, tanto en su modalidad jerárquica, a través de la construcción e interpretación de dendrogramas, como en su versión no jerárquica, mediante la aplicación del método de K-medias, con el propósito de identificar grupos homogéneos dentro del conjunto de observaciones.
El análisis de regresión se emplea para modelar las relaciones entre una variable dependiente y una o varias variables independientes dentro del conjunto de datos. En el contexto de videojuegos, es común intentar predecir las ventas en función de variables como el año de lanzamiento, la puntuación de usuarios, la plataforma, o el género. Se interpreta qué factores tienen más influencia sobre el éxito comercial del videojuego y cómo pueden usarse estos hallazgos para la toma de decisiones en la industria.
Este estudio tiene como propósito establecer la relación entre dos o más variables mediante la obtención de información sobre una de ellas, basada en el conocimiento de los valores de las otras. Las relaciones establecidas son de carácter no determinístico, es decir, se plantearán relaciones probabilísticas y se implementarán procedimientos para realizar inferencias sobre los modelos utilizados. Además, se obtendrán medidas cuantitativas que indiquen el grado de relación entre las variables. Los modelos considerados en este trabajo corresponden a casos específicos del modelo lineal generalizado: Regresión Lineal Simple, Regresión Lineal Múltiple* y Regresión Logística. Cada modelo será descrito teóricamente en su respectiva sección, y se aplicará a un conjunto de datos específico descrito en la sección 2.