Taller agrupamiento

Autores/as

Anderson Guarín

Tatiana Camacho

Steven Bejarano

Edwin Alvarez

Andrés Fabian Rondón

Punto 1

Construir una agrupación de los países con los indicadores del Scimago por el método de K− medias seleccionado el número de grupos K con el indicador de Carlinski-Harabasz y tipificar los grupos obtenidos por los promedios y las varianzas.

Desarrolo Punto 1

Dado que el ranking Scimago incluye diferentes tipos de medidas, se realizó una estandarización de las variables. Esto permite que el agrupamiento no se vea influenciado por las diferencias en las escalas y facilita la comparación entre las variables.

Usando los datos estandarizados, el método k-means con el criterio de Calinski-Harabasz determinó que el número óptimo de grupos es 2.

A continuación, se presenta la asignación de cada universidad a su respectivo grupo.

Asignación de grupo a cada universidad usando Calinski-Harabasz

Resultados de Clustering
Agrupamiento C-H
DE SAO PAULO (USP) - BRA 1
NAL AUTONO DE (UM) - MEX 1
Es DE CAMPIS (UNICAMP) - BRA 1
BUENOS AIRES - ARG 1
DO RD Janeiro FED - BRA 1
EEs PAULISTA JULIO MESQU - BRA 1
Fe DO RG D SUL - BRA 1
Fe MG - BRA 1
U de - CHL 1
POTFIC CATOLICA DE - CHL 2
Fe DE SAO PAULO (UNIFESP) - BRA 1
NAL DPL - ARG 1
Fe SCT - BRA 1
DO ESTADO DO R de Janeiro (UERJ) - BRA 1
DE BRASILIA - BRA 1
Fe DE SAO CARLOS - BRA 1
LA REPUBLICA (UDELAR) - URY 2
Fe DO PARA (UFPR) - BRA 1
Fe DO PERMBUCO - BRA 1
CONCEPCION - CHL 1
LOS ANDES - COL 2
INSTITUTO POLITECNICO NAL (IPN) - MEX 1
Fe DA BAHIA - BRA 1
NAL DE CORDOBA - ARG 1
NAL DE - COL 1
FLUMINENSE Fe - BRA 1
PUERTO RICO - PRI 2
AUTONOMA METROPOLITA (UAM) - MEX 1
TECNICA FEDERICO SANTA MARIA - CHL 2
ANTIOQUIA - COL 1
POTFIC CATOLICADORIOGRANDEDOSUL - BRA 1
POTFIC CATOLICA DO R de Janeiro -PUC - BRA 1
Fe DE VIÇOSA - BRA 1
IBEROAMERICA (UIA) - MEX 2
Fe DE GOIAS - BRA 1
BENEMERITA AUTONOMA DE PUEBLA - MEX 1
SANTIAGO DE (USACH) - CHL 1
AUTONOMA DE SAN LUIS DE POTOSI - MEX 2
NAL DE ROSARIO - ARG 1
U CRica - CRI 2
NAL MAR DPL - ARG 1
CENTRAL DE VENEZUELA (UCV) - VEN 1
NAL DEL LITORAL - ARG 1
AUSTRAL DE - CHL 1
NAL DE CUYO - ARG 2
NAL DEL SUR - ARG 1
PERUA CAYETANO HEREDIA - PER 2
AUTONOMA DE NUEVO LEON (UANL) - MEX 1
Es DE LONDRI - BRA 1
SAN FRANCISCO DE QUITO - ECU 2
GUAJUATO - MEX 1
Fe DE LAVRAS - BRA 1
POTFIC CATOLICA DO PARA -PUCPR - BRA 1
TECNOLOGICO DE MONTERREY (ITESM) - MEX 1
DEL VALLE - COL 1
GUADALAJARA (UDG) - MEX 1
VP - CHL 1
NAL DE TUCUMAN - ARG 1
LOS ANDES MERIDA - VEN 1
CATOLICA DEL NORTE - CHL 1
AUTONOMA DEL ESTADO DE MORELOS - MEX 1
NAL DE SAN MARTIN (UNSAM) - ARG 2
INDUSTRIAL DE SANTANDER - COL 1
AUTONOMA DE YUCATAN - MEX 1
DO NORTE FLUMINENSE Es - BRA 1
Fe DO ESPIRITO SANTO - BRA 1
NAL DE SAN LUIS - ARG 1
AUTONOMA DE BAJA CALIFORNIA - MEX 1
SIMON BOLIVAR VENEZUELA - VEN 1
POTFIC CATOLICA DE VP - CHL 1
POTFIC JAVERIA - COL 1
TALCA - CHL 1
LA FRONTERA (UFRO) - CHL 1
ANDRES BELLO - UB - CHL 1
TECNOLOGICA NAL (UTN) - ARG 1
POTFIC CATOLICA MG - BRA 1
AUTONOMA DEL ESTADO DE - MEX 1
DEL ROSARIO - COL 1
DIEGO PORTALES - CHL 1
LA SERE - CHL 2
POTFIC CATOLICA DEL PERU - PER 2
Es DE PONTA GROSSA - BRA 1
PRESBITERIA MACKENZIE - BRA 1
DEL ZULIA - VEN 1
Fe DE SAO JOAO DEL-REI UFSJ - BRA 2
NAL MAYOR DE SAN MARCOS - PER 1
DO VALE DO RIO DOS SINOS - BRA 1
VERACRUZA - MEX 1
DO ESTADO SCT - BRA 1
DEL NORTE - COL 2
LAS AMERICAS PUEBLA (UDLAP) - MEX 1
NAL DE ASUNCION - PY 2
POTFIC CATOLICA DEL ECUADOR - ECU 2
COLIMA - MEX 1
DEL DESARROLLO - CHL 1
DEL BIO-BIO - CHL 1
POTFIC BOLIVARIA - COL 1
CARABOBO - VEN 1
ANTOFAGASTA - CHL 1
AUSTRAL - ARG 1
UCA POTFIC CATOLICA ARGENTI - ARG 1
ADOLFO IBAÑEZ - CHL 1
LOS ANDES - CHL 1
I Tec AUTONOMO DE (ITAM) - MEX 1
POTFIC CATOLICADESAOPAULO(PUC-SP) - BRA 1
PAMERICA (UP) - MEX 1
LA SABA - COL 1
JORGETADEOLOZANO - COL 1
NAL AGRARIA LA MOLI - PER 2
SAN ANDRES - ARG 2
EAFIT - COL 1
ALBERTO HURTADO - CHL 1

Tabla conteo

Resultados de Clustering
Agrupamiento C-H Número por agrupamiento
1 92
2 20

Tabla de las medias

Dado que nuestras variables están estandarizadas, podemos interpretar directamente las medias de cada grupo.

  • Se observa una clara diferencia en las medias de las variables entre los grupos, lo que sugiere que el proceso de agrupamiento fue efectivo al identificar patrones diferenciados.

  • Ninguna de las medias supera las 2 o -2 desviaciones estándar, lo que indica que los grupos no presentan valores extremos en sus características.

Medias por Clúster
Agrupamiento.C.H SC.Productividad SC.Colaboracion.Interciol SC.Impacto.normalizado SC.Publicaciones.de.alta.calidad SC.Indice.de.especializacion SC.Indice.de.excelencia SC.Liderazgo.cientifico SC.Excelencia.con.liderazgo
1 0.0722537 -0.301573 -0.3326369 -0.252326 -0.1355711 -0.3312939 0.264773 -0.0214096
2 -0.3323668 1.387236 1.5301297 1.160700 0.6236271 1.5239520 -1.217956 0.0984841

Tabla de desviaciones estándar

Dado que nuestras variables están estandarizadas, podemos interpretar directamente las desviaciones estandar de cada grupo.

  • Se observa que en varias variables la desviación estándar supera el valor de 1 ( \(\sigma > 1\)) lo que indica que la dispersión dentro de esos grupos es mayor que en el conjunto original. Esto sugiere que, dentro de los agrupamientos, las universidades presentan una mayor heterogeneidad en esas características específicas en comparación con el total de los datos estandarizados.

  • Dada esta heterogeneidad dentro de los grupos, es posible que la cantidad de agrupamientos seleccionada no sea suficiente para capturar adecuadamente la estructura de los datos. Esto sugiere que podría ser necesario considerar un mayor número de grupos para reflejar con mayor precisión las diferencias entre las universidades.

sd por Clúster
Agrupamiento.C.H SC.Productividad SC.Colaboracion.Interciol SC.Impacto.normalizado SC.Publicaciones.de.alta.calidad SC.Indice.de.especializacion SC.Indice.de.excelencia SC.Liderazgo.cientifico SC.Excelencia.con.liderazgo
1 1.0828768 0.6967836 0.4871444 0.8320159 0.8523085 0.4407659 0.5730061 0.8759583
2 0.2903474 1.0250368 1.3058438 0.8945224 1.3654718 1.3912300 1.5390269 1.4678893

Gráfico de interpretación del agrupamiento “Óptimo” usando Calinski-Harabasz

Punto 2

Construir una agrupación de los países con los indicadores del Scimago por el método de K− medias seleccionado el número de grupos K con el indicador de Hartigan y tipificar los grupos obtenidos por los promedios y las varianzas.

Sin estandarizar.

Como veremos al no estadarizar la variable vamos a tener problemas en la interpretabilidad dado que las variables no tiene las mismas escalas.

Resultados de Clustering
SC.Productividad SC.Colaboracion.Interciol SC.Impacto.normalizado SC.Publicaciones.de.alta.calidad SC.Indice.de.especializacion SC.Indice.de.excelencia SC.Liderazgo.cientifico SC.Excelencia.con.liderazgo
DE SAO PAULO (USP) - BRA 52908 26.36 0.86 38.33 0.38 8.76 60.26 4.01
NAL AUTONO DE (UM) - MEX 21423 39.98 0.81 43.82 0.30 8.10 59.53 3.29
Es DE CAMPIS (UNICAMP) - BRA 18649 22.56 0.85 37.67 0.51 8.78 59.77 4.35
BUENOS AIRES - ARG 12825 41.02 1.03 51.25 0.18 10.68 61.53 3.87
DO RD Janeiro FED - BRA 16590 28.54 0.90 39.45 0.47 8.94 56.40 3.31

Selección de k optimo del k-means usando el método de Hartigan: el número optimo fué el 8 grupos

A continuación, se presenta la asignación de cada universidad a su respectivo grupo.

Asignación de grupo a cada universidad usando Hartigan

Resultados de Clustering
Cluster H
DE SAO PAULO (USP) - BRA 3
NAL AUTONO DE (UM) - MEX 7
Es DE CAMPIS (UNICAMP) - BRA 7
BUENOS AIRES - ARG 7
DO RD Janeiro FED - BRA 7
EEs PAULISTA JULIO MESQU - BRA 7
Fe DO RG D SUL - BRA 7
Fe MG - BRA 7
U de - CHL 2
POTFIC CATOLICA DE - CHL 2
Fe DE SAO PAULO (UNIFESP) - BRA 2
NAL DPL - ARG 2
Fe SCT - BRA 2
DO ESTADO DO R de Janeiro (UERJ) - BRA 6
DE BRASILIA - BRA 2
Fe DE SAO CARLOS - BRA 6
LA REPUBLICA (UDELAR) - URY 1
Fe DO PARA (UFPR) - BRA 2
Fe DO PERMBUCO - BRA 2
CONCEPCION - CHL 6
LOS ANDES - COL 1
INSTITUTO POLITECNICO NAL (IPN) - MEX 2
Fe DA BAHIA - BRA 6
NAL DE CORDOBA - ARG 6
NAL DE - COL 2
FLUMINENSE Fe - BRA 6
PUERTO RICO - PRI 6
AUTONOMA METROPOLITA (UAM) - MEX 6
TECNICA FEDERICO SANTA MARIA - CHL 8
ANTIOQUIA - COL 1
POTFIC CATOLICADORIOGRANDEDOSUL - BRA 1
POTFIC CATOLICA DO R de Janeiro -PUC - BRA 1
Fe DE VIÇOSA - BRA 6
IBEROAMERICA (UIA) - MEX 5
Fe DE GOIAS - BRA 1
BENEMERITA AUTONOMA DE PUEBLA - MEX 1
SANTIAGO DE (USACH) - CHL 8
AUTONOMA DE SAN LUIS DE POTOSI - MEX 8
NAL DE ROSARIO - ARG 8
U CRica - CRI 8
NAL MAR DPL - ARG 8
CENTRAL DE VENEZUELA (UCV) - VEN 1
NAL DEL LITORAL - ARG 8
AUSTRAL DE - CHL 8
NAL DE CUYO - ARG 5
NAL DEL SUR - ARG 8
PERUA CAYETANO HEREDIA - PER 5
AUTONOMA DE NUEVO LEON (UANL) - MEX 1
Es DE LONDRI - BRA 1
SAN FRANCISCO DE QUITO - ECU 4
GUAJUATO - MEX 8
Fe DE LAVRAS - BRA 1
POTFIC CATOLICA DO PARA -PUCPR - BRA 8
TECNOLOGICO DE MONTERREY (ITESM) - MEX 8
DEL VALLE - COL 8
GUADALAJARA (UDG) - MEX 1
VP - CHL 5
NAL DE TUCUMAN - ARG 8
LOS ANDES MERIDA - VEN 8
CATOLICA DEL NORTE - CHL 5
AUTONOMA DEL ESTADO DE MORELOS - MEX 8
NAL DE SAN MARTIN (UNSAM) - ARG 5
INDUSTRIAL DE SANTANDER - COL 5
AUTONOMA DE YUCATAN - MEX 5
DO NORTE FLUMINENSE Es - BRA 6
Fe DO ESPIRITO SANTO - BRA 1
NAL DE SAN LUIS - ARG 5
AUTONOMA DE BAJA CALIFORNIA - MEX 5
SIMON BOLIVAR VENEZUELA - VEN 8
POTFIC CATOLICA DE VP - CHL 8
POTFIC JAVERIA - COL 8
TALCA - CHL 5
LA FRONTERA (UFRO) - CHL 5
ANDRES BELLO - UB - CHL 5
TECNOLOGICA NAL (UTN) - ARG 5
POTFIC CATOLICA MG - BRA 5
AUTONOMA DEL ESTADO DE - MEX 5
DEL ROSARIO - COL 5
DIEGO PORTALES - CHL 5
LA SERE - CHL 4
POTFIC CATOLICA DEL PERU - PER 4
Es DE PONTA GROSSA - BRA 5
PRESBITERIA MACKENZIE - BRA 5
DEL ZULIA - VEN 8
Fe DE SAO JOAO DEL-REI UFSJ - BRA 5
NAL MAYOR DE SAN MARCOS - PER 5
DO VALE DO RIO DOS SINOS - BRA 5
VERACRUZA - MEX 5
DO ESTADO SCT - BRA 2
DEL NORTE - COL 4
LAS AMERICAS PUEBLA (UDLAP) - MEX 4
NAL DE ASUNCION - PY 4
POTFIC CATOLICA DEL ECUADOR - ECU 4
COLIMA - MEX 4
DEL DESARROLLO - CHL 4
DEL BIO-BIO - CHL 4
POTFIC BOLIVARIA - COL 4
CARABOBO - VEN 5
ANTOFAGASTA - CHL 4
AUSTRAL - ARG 4
UCA POTFIC CATOLICA ARGENTI - ARG 4
ADOLFO IBAÑEZ - CHL 4
LOS ANDES - CHL 4
I Tec AUTONOMO DE (ITAM) - MEX 4
POTFIC CATOLICADESAOPAULO(PUC-SP) - BRA 4
PAMERICA (UP) - MEX 4
LA SABA - COL 4
JORGETADEOLOZANO - COL 4
NAL AGRARIA LA MOLI - PER 4
SAN ANDRES - ARG 4
EAFIT - COL 4
ALBERTO HURTADO - CHL 4

f

Resultados de Clustering
Cluster H Conteo
1 13
2 11
3 1
4 25
5 25
6 10
7 7
8 20

Tabla de las medias

Dado que nuestras variables no están estandarizadas, es dificil interpretar directamente las medias de cada grupo.

  • Aun así, podemos ver que la que mayores diferencias entre las medias hay es Productividad

  • La variable que menos tiene diferencias entre las medias es Impacto normalizado

Medias por Clúster
Cluster.H SC.Productividad SC.Colaboracion.Interciol SC.Impacto.normalizado SC.Publicaciones.de.alta.calidad SC.Indice.de.especializacion SC.Indice.de.excelencia SC.Liderazgo.cientifico SC.Excelencia.con.liderazgo
1 2873.538 33.45231 0.7792308 31.16615 0.1738462 7.972308 56.40692 2.833077
2 7479.455 31.34545 0.8145455 35.88182 0.2709091 8.185455 59.31182 3.529091
3 52908.000 26.36000 0.8600000 38.33000 0.3800000 8.760000 60.26000 4.010000
4 358.600 49.90600 0.8248000 34.73760 0.4420000 9.092000 50.77520 2.202000
5 999.960 38.20760 0.8312000 36.34080 0.2308000 8.722400 51.73880 2.466800
6 4844.500 31.60100 0.8130000 38.61400 0.2690000 8.084000 56.06400 2.982000
7 16416.000 28.41286 0.8585714 39.12571 0.3214286 8.674286 60.12714 3.767143
8 1744.550 42.54300 0.8325000 37.58000 0.1665000 8.601000 59.23750 3.260500

Tabla de desviaciones estándar

Dado que nuestras variables no están estandarizadas, no podemos interpretar directamente las desviaciones de cada grupo.

  • Como el grupo 3 sólo está la universidad de Sao Pablo (USP) no tiene desviación ya que se utiliza la desviación muestral.
Desviaciones estándar por Clúster
Cluster.H SC.Productividad SC.Colaboracion.Interciol SC.Impacto.normalizado SC.Publicaciones.de.alta.calidad SC.Indice.de.especializacion SC.Indice.de.excelencia SC.Liderazgo.cientifico SC.Excelencia.con.liderazgo
1 414.0794 15.554637 0.2507808 7.178165 0.1833275 3.233618 3.973639 1.0252267
2 1224.4659 10.724371 0.1767124 7.285049 0.1337501 2.276547 2.649920 0.9128905
3 NA NA NA NA NA NA NA NA
4 181.5411 19.945657 0.4063672 14.557991 0.2767520 6.136838 15.783449 1.6461166
5 189.9929 14.805188 0.4224958 12.305113 0.1772691 5.272393 9.611941 0.9458317
6 643.3465 15.927425 0.2125533 8.845805 0.1783536 3.095241 4.132011 0.7973122
7 3489.5473 8.790254 0.0954688 6.774474 0.1792046 1.192964 1.826424 0.6419427
8 263.0628 11.637787 0.3507867 11.713199 0.1029192 3.541996 6.718854 1.3594793

Gráfico de interpretación del agrupamiento “Óptimo” Hartigan

Como podemos observar, las diferencias en las escalas, especialmente en la variable de productividad, pueden enmascarar las variaciones en las medias de las demás variables. Por este motivo, repetiremos el mismo procedimiento utilizando variables estandarizadas, lo que permitirá una comparación más equitativa entre ellas.

Punto 2 Estandarizado

Dado que el ranking Scimago incluye diferentes tipos de medidas, se realizó una estandarización de las variables. Esto permite que el agrupamiento no se vea influenciado por las diferencias en las escalas y facilita la comparación entre las variables.

Resultados de Clustering Estandarizado
UniPais SC.Productividad SC.Colaboracion.Interciol SC.Impacto.normalizado SC.Publicaciones.de.alta.calidad SC.Indice.de.especializacion SC.Indice.de.excelencia SC.Liderazgo.cientifico SC.Excelencia.con.liderazgo
DE SAO PAULO (USP) - BRA DE SAO PAULO (USP) - BRA 52908 26.36 0.86 38.33 0.38 8.76 60.26 4.01
NAL AUTONO DE (UM) - MEX NAL AUTONO DE (UM) - MEX 21423 39.98 0.81 43.82 0.30 8.10 59.53 3.29
Es DE CAMPIS (UNICAMP) - BRA Es DE CAMPIS (UNICAMP) - BRA 18649 22.56 0.85 37.67 0.51 8.78 59.77 4.35
BUENOS AIRES - ARG BUENOS AIRES - ARG 12825 41.02 1.03 51.25 0.18 10.68 61.53 3.87
DO RD Janeiro FED - BRA DO RD Janeiro FED - BRA 16590 28.54 0.90 39.45 0.47 8.94 56.40 3.31

Asignación de grupo a cada universidad usando Hartigan con variables estandarizadas

Resultados de Clustering Estandarizado
agrupamiento_H_estandarizado
DE SAO PAULO (USP) - BRA 3
NAL AUTONO DE (UM) - MEX 1
Es DE CAMPIS (UNICAMP) - BRA 1
BUENOS AIRES - ARG 1
DO RD Janeiro FED - BRA 1
EEs PAULISTA JULIO MESQU - BRA 1
Fe DO RG D SUL - BRA 1
Fe MG - BRA 1
U de - CHL 1
POTFIC CATOLICA DE - CHL 2
Fe DE SAO PAULO (UNIFESP) - BRA 1
NAL DPL - ARG 1
Fe SCT - BRA 1
DO ESTADO DO R de Janeiro (UERJ) - BRA 1
DE BRASILIA - BRA 1
Fe DE SAO CARLOS - BRA 1
LA REPUBLICA (UDELAR) - URY 2
Fe DO PARA (UFPR) - BRA 1
Fe DO PERMBUCO - BRA 1
CONCEPCION - CHL 1
LOS ANDES - COL 2
INSTITUTO POLITECNICO NAL (IPN) - MEX 1
Fe DA BAHIA - BRA 1
NAL DE CORDOBA - ARG 1
NAL DE - COL 1
FLUMINENSE Fe - BRA 1
PUERTO RICO - PRI 2
AUTONOMA METROPOLITA (UAM) - MEX 1
TECNICA FEDERICO SANTA MARIA - CHL 2
ANTIOQUIA - COL 1
POTFIC CATOLICADORIOGRANDEDOSUL - BRA 1
POTFIC CATOLICA DO R de Janeiro -PUC - BRA 1
Fe DE VIÇOSA - BRA 1
IBEROAMERICA (UIA) - MEX 2
Fe DE GOIAS - BRA 1
BENEMERITA AUTONOMA DE PUEBLA - MEX 1
SANTIAGO DE (USACH) - CHL 1
AUTONOMA DE SAN LUIS DE POTOSI - MEX 2
NAL DE ROSARIO - ARG 1
U CRica - CRI 2
NAL MAR DPL - ARG 1
CENTRAL DE VENEZUELA (UCV) - VEN 1
NAL DEL LITORAL - ARG 1
AUSTRAL DE - CHL 1
NAL DE CUYO - ARG 2
NAL DEL SUR - ARG 1
PERUA CAYETANO HEREDIA - PER 2
AUTONOMA DE NUEVO LEON (UANL) - MEX 1
Es DE LONDRI - BRA 1
SAN FRANCISCO DE QUITO - ECU 2
GUAJUATO - MEX 1
Fe DE LAVRAS - BRA 1
POTFIC CATOLICA DO PARA -PUCPR - BRA 1
TECNOLOGICO DE MONTERREY (ITESM) - MEX 1
DEL VALLE - COL 1
GUADALAJARA (UDG) - MEX 1
VP - CHL 1
NAL DE TUCUMAN - ARG 1
LOS ANDES MERIDA - VEN 1
CATOLICA DEL NORTE - CHL 1
AUTONOMA DEL ESTADO DE MORELOS - MEX 1
NAL DE SAN MARTIN (UNSAM) - ARG 2
INDUSTRIAL DE SANTANDER - COL 1
AUTONOMA DE YUCATAN - MEX 1
DO NORTE FLUMINENSE Es - BRA 1
Fe DO ESPIRITO SANTO - BRA 1
NAL DE SAN LUIS - ARG 1
AUTONOMA DE BAJA CALIFORNIA - MEX 1
SIMON BOLIVAR VENEZUELA - VEN 1
POTFIC CATOLICA DE VP - CHL 1
POTFIC JAVERIA - COL 1
TALCA - CHL 1
LA FRONTERA (UFRO) - CHL 1
ANDRES BELLO - UB - CHL 1
TECNOLOGICA NAL (UTN) - ARG 1
POTFIC CATOLICA MG - BRA 1
AUTONOMA DEL ESTADO DE - MEX 1
DEL ROSARIO - COL 1
DIEGO PORTALES - CHL 1
LA SERE - CHL 2
POTFIC CATOLICA DEL PERU - PER 2
Es DE PONTA GROSSA - BRA 1
PRESBITERIA MACKENZIE - BRA 1
DEL ZULIA - VEN 1
Fe DE SAO JOAO DEL-REI UFSJ - BRA 2
NAL MAYOR DE SAN MARCOS - PER 1
DO VALE DO RIO DOS SINOS - BRA 1
VERACRUZA - MEX 1
DO ESTADO SCT - BRA 1
DEL NORTE - COL 2
LAS AMERICAS PUEBLA (UDLAP) - MEX 1
NAL DE ASUNCION - PY 2
POTFIC CATOLICA DEL ECUADOR - ECU 2
COLIMA - MEX 1
DEL DESARROLLO - CHL 1
DEL BIO-BIO - CHL 1
POTFIC BOLIVARIA - COL 1
CARABOBO - VEN 1
ANTOFAGASTA - CHL 1
AUSTRAL - ARG 1
UCA POTFIC CATOLICA ARGENTI - ARG 1
ADOLFO IBAÑEZ - CHL 1
LOS ANDES - CHL 1
I Tec AUTONOMO DE (ITAM) - MEX 1
POTFIC CATOLICADESAOPAULO(PUC-SP) - BRA 1
PAMERICA (UP) - MEX 1
LA SABA - COL 1
JORGETADEOLOZANO - COL 1
NAL AGRARIA LA MOLI - PER 2
SAN ANDRES - ARG 2
EAFIT - COL 1
ALBERTO HURTADO - CHL 1

Tabla conteo

  • Es importante resaltar que el grupo 1 tiene el 85% de todas las universidades

  • El grupo 3 tiene solo una universidad la cual es la Universidad de Sao Paulo (USP) esto quiere decir que esta universidad se comporta de manera muy distinta de las demás universidades.

Resultados de Clustering Estandarizado
agrupamiento_H_estandarizado Conteo
1 91
2 20
3 1

Tabla de las medias

Dado que nuestras variables están estandarizadas, podemos interpretar directamente las medias de cada grupo.

  • Se observa una clara diferencia en las medias de las variables entre los grupos, lo que sugiere que el proceso de agrupamiento fue efectivo al identificar patrones diferenciados.

  • En el grupo 3, la variable de Productividad presenta una media de 7.85 desviaciones estándar por encima de la media general. Esto indica que este grupo se caracteriza por un valor excepcionalmente alto en esta variable, sugiriendo la presencia de una característica extrema dentro del agrupamiento.

  • En general, las medias del grupo 2 muestran diferencias significativas en la mayoría de las variables en comparación con los demás grupos, lo que sugiere que este grupo posee características distintivas que lo separan claramente del resto.

Medias por Clúster Estandarizado
agrupamiento_H_estandarizado SC.Productividad SC.Colaboracion.Interciol SC.Impacto.normalizado SC.Publicaciones.de.alta.calidad SC.Indice.de.especializacion SC.Indice.de.excelencia SC.Liderazgo.cientifico SC.Excelencia.con.liderazgo
1 -0.0133221 -0.2963925 -0.3375317 -0.2574249 -0.1425413 -0.3353801 0.2620275 -0.0317430
2 -0.3323668 1.3872359 1.5301297 1.1606996 0.6236271 1.5239520 -1.2179556 0.0984841
3 7.8596472 -0.7730030 0.1127873 0.2116700 0.4987165 0.0405444 0.5146065 0.9189329

Gráfico de interpretación del agrupamiento “Óptimo” Hartigan Estandarizado

Punto 3

Comparar las agrupaciones obtenidas en los ejercicios 1 y 2 y explicar las diferencias, si las hay, tanto en número de grupos como en países que quedaron en cada ejercicio.

Desarrollo punto 3

Método Número de Grupos Descripción
Calinski-Harabasz 2 Representa más simplicidad pero menos representación
Hartigan 3 Mayor representación pero menos simplicidad

Comparaciones destacables

Dado que la Universidad de São Paulo (USP) presenta características atípicas, es preferible que se agrupe por separado de las demás instituciones. Al ser un dato atípico, su inclusión en el grupo 1 distorsiona (apalanca) el promedio de productividad, reduciendo la representatividad del grupo.

En este sentido, el número óptimo de agrupamientos determinado por el criterio de Hartigan resulta más adecuado, ya que permite aislar a las universidades con valores extremos, evitando que influyan desproporcionadamente en la caracterización de los demás grupos.