Anualmente se celebra en el primer sábado de marzo el Día de los Datos Abiertos (Open Data Day), con la finalidad de dar a conocer los beneficios y utilidades de los datos abiertos.
Esta efeméride ha sido creada en el año 2010 y es impulsada por la Open Knowledge Foundation. En el año 2022 se celebró el 5 de marzo.
Los Datos Abiertos son aquellos datos que pueden ser utilizados, compartidos y distribuidos libremente, sin restricción alguna por derechos de autor o patentes. Algunos ejemplos de datos abiertos son información geográfica, fórmulas matemáticas y científicas, compuestos químicos, entre otros datos. Para la celebración de este día se llevan a cabo eventos locales por parte de grupos en todo el mundo, conformado por servidores públicos, diseñadores, desarrolladores, estadísticos y público en general. Se utilizarán datos abiertos en esas localidades, para la creación de aplicaciones, visualizaciones, liberación de datos y publicación de análisis.
El término “Datos Abiertos” tiene un significado muy preciso. Los datos o el contenido son abiertos cuando cualquier persona los puede utilizar, reutilizar o redistribuir, tomando a lo sumo medidas para preservar el origen y la condición de Datos Abiertos.
Los Datos Abiertos tienen dos dimensiones:
Deben de ser abiertos en términos jurídicos, lo que significa que deben ponerse en un sitio de acceso público u ofrecerse en condiciones liberales de uso y con mínimas restricciones.
Deben ser técnicamente abiertos, lo que significa que deben publicarse en formatos electrónicos que puedan leerse con máquinas y que preferentemente no sean exclusivos, de modo que cualquier persona puede acceder a ellos y usarlos mediante herramientas de software comunes y gratuitas. Los datos también deben de estar disponibles en un servidor público sin contraseñas ni restricciones de firewalls. Para que los Datos Abiertos sean más fáciles de encontrar, la mayoría de las organizaciones crea y administra catálogos de Datos Abiertos.
Licencias de Datos Abiertos Las organizaciones y los Gobiernos utilizan las licencias de Datos Abiertos para explicar claramente las condiciones en que estos pueden utilizarse. Muchas licencias de uso incluyen tanto una versión resumida, en la que se intenta transmitir los conceptos más importantes a todos los usuarios, y una versión detallada que proporciona toda la justificación legal. Estos son algunos ejemplos:
Licencias estándar y reutilizables, diseñadas para establecer las mismas condiciones de uso ampliamente reconocidas, por ejemplo, Creative Commons, específicamente CC-By y CC0, así como Open Database License. Asociar datos con CC0 es básicamente lo mismo que ponerlos en un sitio de acceso público.
En este enlace se puede encontrar más información sobre la definición y las licencias de uso de los Datos Abiertos.
http://opendatatoolkit.worldbank.org/es/essentials.html
El pasado 16 de marzo del 2022 se llevó a cabo un evento con motivo del día de los datos abiertos (5 de marzo) en el cual se aplicó una encuesta a los asistentes a dicho evento https://drive.google.com/file/d/1ztdCq12NIlb1_ix7tUBNevRSzptoe45I/view?usp=sharing.
• Clasificar a los asistentes al evento para el diseño de un programa de capacitación de acuerdo con su conocimiento del tema.
• Identificar grupos de asistentes al evento.
• Determinar los perfiles de los grupos.
Se recibieron respuestas en esta encuesta obteniendo una base datos con 14 variables y 70 individuos https://docs.google.com/spreadsheets/d/1R3dmhptWW92Ba2FvkUHIvc4iC02xIwso/edit?usp=sharing&ouid=102618542080230373104&rtpof=true&sd=true .
Durante la exploración de la base se encontraron algunas inconsistencias notables en dos de las repuestas que se recibieron decidiendo quitarlas para evitar sesgos y llegar a conclusiones muy alejadas a la realidad, quedándonos así con una muestra de 68 https://docs.google.com/spreadsheets/d/1y0oZ43Rd7MA8n0EIEhqF22c8j9KLV8wX/edit?usp=sharing&ouid=102618542080230373104&rtpof=true&sd=true
Sexo: sexo de los asistentes al evento: (Mujer o Hombre)
Edad: edad en años cumplidos de los asistentes al evento de entre 15 años en adelante.
Escolaridad: grado de estudios del asistente al momento de asistir al evento: (Educación Media Superior, Educación Superior, Especialidad, Maestría o Doctorado).
Ocupación: ocupación de las personas que asistieron al evento; (Ciudadanos, Servidor Público, Diseñador, Desarrollador, Estadístico, informático, Docente o Estudiante)
¿Qué Carrera que cursas?: Carrera que cursan las personas que indicaron que son estudiantes
¿A qué institución perteneces?: Institución a la que pertenecen las personas que asistieron al evento (universidad Veracruzana, Conalep u Otro);
¿Cómo te enteraste del evento?: medio por el que se enteraron del evento (Correo electrónico, página web, Redes sociales, Recibí una invitación, WhatsApp, Por un enlace, Otro)
¿Sabes que son los datos abiertos?: indica si los asistentes al evento tienen conocimiento del tema de Datos Abiertos (Sí, He escuchado hablar de ellos o No sé nada sobre ellos)
¿Con que frecuencia usas los datos abiertos? frecuencia con la que los asistentes al evento usan los datos abiertos (Una vez al mes, Una vez al semestre, dos o más al semestre, Una vez al año, A veces, Nunca)
¿Conoces algún repositorio de datos abiertos?: número de repositorios que conocen las personas que asistieron al evento (Conozco muchos, Conozco tres o menos o No conozco ninguno)
Repositorios de los datos abiertos que conozcas: nombre de los repositorios que conocen los asistentes que indicaron que si conocen algún repositorio de datos abiertos.
¿Sobre qué temas generalmente buscas datos abiertos?: temas de los que regularmente los asistentes al evento buscan en repositorios de datos abiertos (Agronomía, Industria, Salud, Economía u Otro).
¿Con qué frecuencia das crédito a la fuente de los datos?: frecuencia con la que los asistentes que asistieron al evento y que hace uso de datos abiertos citan o dan crédito al repositorio de donde obtuvieron los datos (Siempre, Casi siempre, A veces, Nunca).
¿Cuentas con los conocimientos básicos para manejar bases de datos?: criterio de los asistentes al evento que cuentan o no con los conocimientos básicos para manejar bases de datos (Sí o No).
El análisis que se ve a continuación se realizó en el software estadístico R Studio con el fin de poder replicarlo. Se utilizaron las paqueterías ggplo2 y factoextra.
Se realizo un análisis clúster para identificar grupos de asistentes al evento para luego determinar los perfiles de estos grupos con el fin de clasificar a los asistentes al evento para el diseño de un programa de capacitación de acuerdo con el conocimiento del tema es decir si estos saben qué son los datos abiertos, la frecuencia con la que los usan, si conocen algún repositorio de datos abiertos y cuantos conocen.
Luego de identificar los grupos se determinó el perfil de cada uno de estos y para concluir se proponen los o el enfoque principal para el diseño del programa de capacitación.
Par este análisis se necesita llamar a la base llamada datos que contiene las variables codificadas en escala ordinal que se ocuparán: 1: ¿Sabes que son los datos abiertos?, 2:¿Con qué frecuencia usas los datos abiertos?, 3:¿Conoces algún repositorio de datos abiertos?, 4:Menciona uno o varios de los repositorios de datos abiertos que conozcas
library(readxl)
Datos<- read_excel("C:/Users/Marlen Becerra/Downloads/Datos.xlsx")
# Matriz de distancias euclideas
mat_dist <- dist(x = Datos, method = "euclidean")
mat_dist
## 1 2 3 4 5 6 7 8
## 2 2.449490
## 3 2.449490 2.449490
## 4 4.582576 3.000000 3.000000
## 5 5.477226 3.464102 3.741657 1.732051
## 6 3.741657 2.000000 2.449490 1.000000 2.000000
## 7 3.000000 1.000000 2.236068 2.000000 2.645751 1.000000
## 8 4.795832 2.645751 3.316625 2.000000 1.000000 1.732051 2.000000
## 9 4.123106 3.605551 2.236068 2.000000 3.316625 2.236068 2.828427 3.464102
## 10 2.236068 1.000000 3.000000 4.000000 4.358899 3.000000 2.000000 3.464102
## 11 2.645751 1.000000 2.236068 3.162278 3.316625 2.236068 1.414214 2.449490
## 12 6.244998 4.358899 4.358899 2.000000 1.000000 2.645751 3.464102 2.000000
## 13 5.744563 3.872983 3.872983 2.449490 1.000000 2.645751 3.162278 1.414214
## 14 1.414214 1.414214 2.449490 4.123106 4.690416 3.162278 2.236068 3.872983
## 15 2.645751 1.000000 2.236068 3.162278 3.316625 2.236068 1.414214 2.449490
## 16 6.244998 4.358899 4.358899 2.000000 1.000000 2.645751 3.464102 2.000000
## 17 2.236068 2.236068 1.000000 2.828427 3.872983 2.236068 2.000000 3.464102
## 18 2.449490 0.000000 2.449490 3.000000 3.464102 2.000000 1.000000 2.645751
## 19 4.358899 3.316625 2.236068 1.414214 2.236068 1.732051 2.449490 2.449490
## 20 4.242641 2.449490 3.464102 3.872983 3.162278 3.162278 2.645751 2.236068
## 21 6.164414 4.242641 4.472136 1.732051 1.414214 2.449490 3.316625 2.236068
## 22 4.123106 1.732051 3.316625 2.449490 2.236068 1.732051 1.414214 1.414214
## 23 3.000000 1.000000 2.236068 2.000000 2.645751 1.000000 0.000000 2.000000
## 24 1.000000 1.732051 2.645751 4.242641 5.000000 3.316625 2.449490 4.242641
## 25 6.480741 4.690416 4.472136 2.645751 1.414214 3.162278 3.872983 2.236068
## 26 1.414214 2.000000 1.414214 3.605551 4.472136 2.828427 2.236068 3.872983
## 27 2.236068 2.236068 1.000000 2.828427 3.872983 2.236068 2.000000 3.464102
## 28 3.162278 1.414214 2.000000 2.236068 2.449490 1.414214 1.000000 1.732051
## 29 5.744563 3.872983 3.872983 2.449490 1.000000 2.645751 3.162278 1.414214
## 30 2.000000 1.414214 3.162278 4.123106 4.690416 3.162278 2.236068 3.872983
## 31 2.449490 2.828427 1.414214 4.123106 4.472136 3.464102 3.000000 3.872983
## 32 5.744563 3.872983 3.872983 2.449490 1.000000 2.645751 3.162278 1.414214
## 33 4.123106 2.645751 3.872983 4.690416 4.123106 3.872983 3.162278 3.162278
## 34 6.480741 4.690416 4.472136 2.645751 1.414214 3.162278 3.872983 2.236068
## 35 2.000000 1.414214 3.162278 4.123106 4.690416 3.162278 2.236068 3.872983
## 36 1.414214 2.449490 2.000000 4.582576 5.099020 3.741657 3.000000 4.358899
## 37 4.123106 3.605551 2.236068 2.000000 3.316625 2.236068 2.828427 3.464102
## 38 6.244998 4.358899 4.358899 2.000000 1.000000 2.645751 3.464102 2.000000
## 39 3.872983 1.732051 3.316625 3.464102 3.000000 2.645751 2.000000 2.000000
## 40 6.480741 4.690416 4.472136 2.645751 1.414214 3.162278 3.872983 2.236068
## 41 6.480741 4.690416 4.472136 2.645751 1.414214 3.162278 3.872983 2.236068
## 42 3.162278 1.414214 3.741657 4.123106 4.242641 3.162278 2.236068 3.316625
## 43 5.099020 3.162278 3.464102 2.645751 1.414214 2.449490 2.645751 1.000000
## 44 4.582576 3.000000 3.000000 0.000000 1.732051 1.000000 2.000000 2.000000
## 45 1.732051 2.236068 1.000000 3.741657 4.358899 3.000000 2.449490 3.741657
## 46 2.236068 1.000000 3.000000 4.000000 4.358899 3.000000 2.000000 3.464102
## 47 1.000000 1.732051 2.645751 4.242641 5.000000 3.316625 2.449490 4.242641
## 48 2.645751 1.732051 1.000000 2.449490 3.000000 1.732051 1.414214 2.449490
## 49 2.236068 1.000000 3.000000 4.000000 4.358899 3.000000 2.000000 3.464102
## 50 3.000000 2.236068 3.000000 4.472136 4.358899 3.605551 2.828427 3.464102
## 51 2.449490 1.414214 1.414214 2.236068 3.162278 1.414214 1.000000 2.645751
## 52 5.477226 3.464102 3.741657 1.732051 0.000000 2.000000 2.645751 1.000000
## 53 2.236068 1.000000 3.000000 4.000000 4.358899 3.000000 2.000000 3.464102
## 54 3.000000 1.000000 2.236068 2.000000 2.645751 1.000000 0.000000 2.000000
## 55 2.449490 0.000000 2.449490 3.000000 3.464102 2.000000 1.000000 2.645751
## 56 3.162278 1.414214 2.000000 2.236068 2.449490 1.414214 1.000000 1.732051
## 57 5.477226 3.464102 3.741657 1.732051 0.000000 2.000000 2.645751 1.000000
## 58 2.449490 1.414214 1.414214 2.236068 3.162278 1.414214 1.000000 2.645751
## 59 3.000000 1.000000 2.236068 2.000000 2.645751 1.000000 0.000000 2.000000
## 60 4.582576 2.645751 3.316625 3.162278 2.236068 2.645751 2.449490 1.414214
## 61 4.000000 3.741657 2.449490 2.236068 3.741657 2.449490 3.000000 3.872983
## 62 2.236068 1.000000 3.000000 4.000000 4.358899 3.000000 2.000000 3.464102
## 63 4.690416 3.162278 2.828427 1.000000 1.414214 1.414214 2.236068 1.732051
## 64 4.582576 3.000000 3.000000 0.000000 1.732051 1.000000 2.000000 2.000000
## 65 3.000000 1.732051 2.236068 2.449490 3.000000 1.732051 1.414214 2.449490
## 66 4.358899 3.316625 2.236068 1.414214 2.236068 1.732051 2.449490 2.449490
## 67 4.795832 2.645751 3.316625 2.000000 1.000000 1.732051 2.000000 0.000000
## 68 1.732051 1.000000 1.732051 3.162278 3.872983 2.236068 1.414214 3.162278
## 9 10 11 12 13 14 15 16
## 2
## 3
## 4
## 5
## 6
## 7
## 8
## 9
## 10 4.472136
## 11 3.741657 1.414214
## 12 3.464102 5.291503 4.242641
## 13 3.741657 4.690416 3.464102 1.414214
## 14 4.123106 1.000000 1.732051 5.567764 5.000000
## 15 3.741657 1.414214 0.000000 4.242641 3.464102 1.732051
## 16 3.464102 5.291503 4.242641 0.000000 1.414214 5.567764 4.242641
## 17 2.000000 2.828427 2.449490 4.472136 4.242641 2.236068 2.449490 4.472136
## 18 3.605551 1.000000 1.000000 4.358899 3.872983 1.414214 1.000000 4.358899
## 19 1.414214 4.242641 3.162278 2.449490 2.449490 4.123106 3.162278 2.449490
## 20 4.795832 2.645751 1.732051 4.123106 3.000000 3.162278 1.732051 4.123106
## 21 3.316625 5.196152 4.358899 1.000000 2.236068 5.477226 4.358899 1.000000
## 22 3.741657 2.449490 2.000000 3.162278 2.828427 3.000000 2.000000 3.162278
## 23 2.828427 2.000000 1.414214 3.464102 3.162278 2.236068 1.414214 3.464102
## 24 4.242641 1.414214 2.000000 5.830952 5.291503 1.000000 2.000000 5.830952
## 25 3.872983 5.567764 4.358899 1.000000 1.000000 5.830952 4.358899 1.000000
## 26 3.000000 2.236068 2.236068 5.196152 4.795832 1.414214 2.236068 5.196152
## 27 2.000000 2.828427 2.449490 4.472136 4.242641 2.236068 2.449490 4.472136
## 28 3.000000 2.236068 1.000000 3.316625 2.645751 2.449490 1.000000 3.316625
## 29 3.741657 4.690416 3.464102 1.414214 0.000000 5.000000 3.464102 1.414214
## 30 4.582576 1.000000 1.732051 5.567764 5.000000 1.414214 1.732051 5.567764
## 31 3.605551 3.000000 2.236068 5.196152 4.358899 2.449490 2.236068 5.196152
## 32 3.741657 4.690416 3.464102 1.414214 0.000000 5.000000 3.464102 1.414214
## 33 5.477226 2.449490 2.000000 5.099020 4.000000 3.000000 2.000000 5.099020
## 34 3.872983 5.567764 4.358899 1.000000 1.000000 5.830952 4.358899 1.000000
## 35 4.582576 1.000000 1.732051 5.567764 5.000000 1.414214 1.732051 5.567764
## 36 4.123106 2.236068 2.236068 5.916080 5.196152 1.414214 2.236068 5.916080
## 37 0.000000 4.472136 3.741657 3.464102 3.741657 4.123106 3.741657 3.464102
## 38 3.464102 5.291503 4.242641 0.000000 1.414214 5.567764 4.242641 0.000000
## 39 4.472136 2.000000 1.414214 4.000000 3.162278 2.645751 1.414214 4.000000
## 40 3.872983 5.567764 4.358899 1.000000 1.000000 5.830952 4.358899 1.000000
## 41 3.872983 5.567764 4.358899 1.000000 1.000000 5.830952 4.358899 1.000000
## 42 5.000000 1.000000 1.732051 5.196152 4.582576 2.000000 1.732051 5.196152
## 43 3.872983 3.872983 2.645751 2.236068 1.000000 4.242641 2.645751 2.236068
## 44 2.000000 4.000000 3.162278 2.000000 2.449490 4.123106 3.162278 2.000000
## 45 3.162278 2.449490 2.000000 5.099020 4.472136 1.732051 2.000000 5.099020
## 46 4.472136 0.000000 1.414214 5.291503 4.690416 1.000000 1.414214 5.291503
## 47 4.242641 1.414214 2.000000 5.830952 5.291503 1.000000 2.000000 5.830952
## 48 2.449490 2.449490 1.414214 3.741657 3.162278 2.236068 1.414214 3.741657
## 49 4.472136 0.000000 1.414214 5.291503 4.690416 1.000000 1.414214 5.291503
## 50 4.898979 2.000000 1.414214 5.291503 4.242641 2.236068 1.414214 5.291503
## 51 2.236068 2.236068 1.732051 3.872983 3.605551 2.000000 1.732051 3.872983
## 52 3.316625 4.358899 3.316625 1.000000 1.000000 4.690416 3.316625 1.000000
## 53 4.472136 0.000000 1.414214 5.291503 4.690416 1.000000 1.414214 5.291503
## 54 2.828427 2.000000 1.414214 3.464102 3.162278 2.236068 1.414214 3.464102
## 55 3.605551 1.000000 1.000000 4.358899 3.872983 1.414214 1.000000 4.358899
## 56 3.000000 2.236068 1.000000 3.316625 2.645751 2.449490 1.000000 3.316625
## 57 3.316625 4.358899 3.316625 1.000000 1.000000 4.690416 3.316625 1.000000
## 58 2.236068 2.236068 1.732051 3.872983 3.605551 2.000000 1.732051 3.872983
## 59 2.828427 2.000000 1.414214 3.464102 3.162278 2.236068 1.414214 3.464102
## 60 4.242641 3.162278 2.000000 3.162278 2.000000 3.605551 2.000000 3.162278
## 61 1.000000 4.582576 3.872983 3.872983 4.123106 4.242641 3.872983 3.872983
## 62 4.472136 0.000000 1.414214 5.291503 4.690416 1.000000 1.414214 5.291503
## 63 2.236068 4.123106 3.000000 1.732051 1.732051 4.242641 3.000000 1.732051
## 64 2.000000 4.000000 3.162278 2.000000 2.449490 4.123106 3.162278 2.000000
## 65 3.162278 2.449490 1.414214 3.741657 3.162278 2.645751 1.414214 3.741657
## 66 1.414214 4.242641 3.162278 2.449490 2.449490 4.123106 3.162278 2.449490
## 67 3.464102 3.464102 2.449490 2.000000 1.414214 3.872983 2.449490 2.000000
## 68 3.162278 1.414214 1.414214 4.690416 4.242641 1.000000 1.414214 4.690416
## 17 18 19 20 21 22 23 24
## 2
## 3
## 4
## 5
## 6
## 7
## 8
## 9
## 10
## 11
## 12
## 13
## 14
## 15
## 16
## 17
## 18 2.236068
## 19 2.449490 3.316625
## 20 3.872983 2.449490 3.872983
## 21 4.358899 4.242641 2.645751 4.472136
## 22 3.162278 1.732051 3.162278 2.236068 3.000000
## 23 2.000000 1.000000 2.449490 2.645751 3.316625 1.414214
## 24 2.449490 1.732051 4.242641 3.605551 5.744563 3.464102 2.449490
## 25 4.795832 4.690416 2.645751 4.000000 2.000000 3.605551 3.872983 6.082763
## 26 1.000000 2.000000 3.316625 3.741657 5.099020 3.316625 2.236068 1.732051
## 27 0.000000 2.236068 2.449490 3.872983 4.358899 3.162278 2.000000 2.449490
## 28 2.236068 1.414214 2.236068 2.000000 3.464102 1.732051 1.000000 2.645751
## 29 4.242641 3.872983 2.449490 3.000000 2.236068 2.828427 3.162278 5.291503
## 30 3.000000 1.414214 4.358899 3.162278 5.477226 3.000000 2.236068 1.000000
## 31 2.236068 2.828427 3.316625 3.162278 5.477226 3.872983 3.000000 2.645751
## 32 4.242641 3.872983 2.449490 3.000000 2.236068 2.828427 3.162278 5.291503
## 33 4.242641 2.645751 4.690416 1.000000 5.385165 2.828427 3.162278 3.464102
## 34 4.795832 4.690416 2.645751 4.000000 2.000000 3.605551 3.872983 6.082763
## 35 3.000000 1.414214 4.358899 3.162278 5.477226 3.000000 2.236068 1.000000
## 36 2.236068 2.449490 4.123106 3.464102 6.000000 3.872983 3.000000 1.732051
## 37 2.000000 3.605551 1.414214 4.795832 3.316625 3.741657 2.828427 4.242641
## 38 4.472136 4.358899 2.449490 4.123106 1.000000 3.162278 3.464102 5.830952
## 39 3.464102 1.732051 3.741657 1.000000 4.123106 1.414214 2.000000 3.162278
## 40 4.795832 4.690416 2.645751 4.000000 2.000000 3.605551 3.872983 6.082763
## 41 4.795832 4.690416 2.645751 4.000000 2.000000 3.605551 3.872983 6.082763
## 42 3.605551 1.414214 4.582576 2.449490 5.099020 2.236068 2.236068 2.236068
## 43 3.872983 3.162278 2.645751 2.000000 2.828427 2.236068 2.645751 4.582576
## 44 2.828427 3.000000 1.414214 3.872983 1.732051 2.449490 2.000000 4.242641
## 45 1.414214 2.236068 3.162278 3.316625 5.196152 3.464102 2.449490 2.000000
## 46 2.828427 1.000000 4.242641 2.645751 5.196152 2.449490 2.000000 1.414214
## 47 2.449490 1.732051 4.242641 3.605551 5.744563 3.464102 2.449490 0.000000
## 48 1.414214 1.732051 2.000000 2.645751 3.872983 2.449490 1.414214 2.449490
## 49 2.828427 1.000000 4.242641 2.645751 5.196152 2.449490 2.000000 1.414214
## 50 3.464102 2.236068 4.242641 1.732051 5.567764 3.162278 2.828427 2.449490
## 51 1.000000 1.414214 2.236068 3.162278 3.741657 2.236068 1.000000 2.236068
## 52 3.872983 3.464102 2.236068 3.162278 1.414214 2.236068 2.645751 5.000000
## 53 2.828427 1.000000 4.242641 2.645751 5.196152 2.449490 2.000000 1.414214
## 54 2.000000 1.000000 2.449490 2.645751 3.316625 1.414214 0.000000 2.449490
## 55 2.236068 0.000000 3.316625 2.449490 4.242641 1.732051 1.000000 1.732051
## 56 2.236068 1.414214 2.236068 2.000000 3.464102 1.732051 1.000000 2.645751
## 57 3.872983 3.464102 2.236068 3.162278 1.414214 2.236068 2.645751 5.000000
## 58 1.000000 1.414214 2.236068 3.162278 3.741657 2.236068 1.000000 2.236068
## 59 2.000000 1.000000 2.449490 2.645751 3.316625 1.414214 0.000000 2.449490
## 60 3.741657 2.645751 3.162278 1.000000 3.605551 2.000000 2.449490 4.000000
## 61 2.236068 3.741657 1.732051 5.099020 3.741657 4.123106 3.000000 4.123106
## 62 2.828427 1.000000 4.242641 2.645751 5.196152 2.449490 2.000000 1.414214
## 63 3.000000 3.162278 1.000000 3.464102 2.000000 2.645751 2.236068 4.358899
## 64 2.828427 3.000000 1.414214 3.872983 1.732051 2.449490 2.000000 4.242641
## 65 2.449490 1.732051 2.449490 2.645751 3.872983 2.449490 1.414214 2.449490
## 66 2.449490 3.316625 0.000000 3.872983 2.645751 3.162278 2.449490 4.242641
## 67 3.464102 2.645751 2.449490 2.236068 2.236068 1.414214 2.000000 4.242641
## 68 1.414214 1.000000 3.162278 3.000000 4.582576 2.449490 1.414214 1.414214
## 25 26 27 28 29 30 31 32
## 2
## 3
## 4
## 5
## 6
## 7
## 8
## 9
## 10
## 11
## 12
## 13
## 14
## 15
## 16
## 17
## 18
## 19
## 20
## 21
## 22
## 23
## 24
## 25
## 26 5.477226
## 27 4.795832 1.000000
## 28 3.464102 2.449490 2.236068
## 29 1.000000 4.795832 4.242641 2.645751
## 30 5.830952 2.449490 3.000000 2.449490 5.000000
## 31 5.099020 2.000000 2.236068 2.449490 4.358899 3.162278
## 32 1.000000 4.795832 4.242641 2.645751 0.000000 5.000000 4.358899
## 33 5.000000 3.872983 4.242641 2.645751 4.000000 3.000000 3.316625 4.000000
## 34 0.000000 5.477226 4.795832 3.464102 1.000000 5.830952 5.099020 1.000000
## 35 5.830952 2.449490 3.000000 2.449490 5.000000 0.000000 3.162278 5.000000
## 36 6.000000 1.414214 2.236068 2.828427 5.196152 2.449490 1.414214 5.196152
## 37 3.872983 3.000000 2.000000 3.000000 3.741657 4.582576 3.605551 3.741657
## 38 1.000000 5.196152 4.472136 3.316625 1.414214 5.567764 5.196152 1.414214
## 39 4.123106 3.316625 3.464102 1.732051 3.162278 2.645751 3.316625 3.162278
## 40 0.000000 5.477226 4.795832 3.464102 1.000000 5.830952 5.099020 1.000000
## 41 0.000000 5.477226 4.795832 3.464102 1.000000 5.830952 5.099020 1.000000
## 42 5.477226 3.162278 3.605551 2.449490 4.582576 1.414214 3.741657 4.582576
## 43 2.000000 4.242641 3.872983 2.000000 1.000000 4.242641 3.741657 1.000000
## 44 2.645751 3.605551 2.828427 2.236068 2.449490 4.123106 4.123106 2.449490
## 45 5.196152 1.000000 1.414214 2.236068 4.472136 2.645751 1.000000 4.472136
## 46 5.567764 2.236068 2.828427 2.236068 4.690416 1.000000 3.000000 4.690416
## 47 6.082763 1.732051 2.449490 2.645751 5.291503 1.000000 2.645751 5.291503
## 48 3.872983 1.732051 1.414214 1.000000 3.162278 2.645751 1.732051 3.162278
## 49 5.567764 2.236068 2.828427 2.236068 4.690416 1.000000 3.000000 4.690416
## 50 5.196152 3.000000 3.464102 2.236068 4.242641 2.236068 2.236068 4.242641
## 51 4.242641 1.414214 1.000000 1.414214 3.605551 2.449490 2.449490 3.605551
## 52 1.414214 4.472136 3.872983 2.449490 1.000000 4.690416 4.472136 1.000000
## 53 5.567764 2.236068 2.828427 2.236068 4.690416 1.000000 3.000000 4.690416
## 54 3.872983 2.236068 2.000000 1.000000 3.162278 2.236068 3.000000 3.162278
## 55 4.690416 2.000000 2.236068 1.414214 3.872983 1.414214 2.828427 3.872983
## 56 3.464102 2.449490 2.236068 0.000000 2.645751 2.449490 2.449490 2.645751
## 57 1.414214 4.472136 3.872983 2.449490 1.000000 4.690416 4.472136 1.000000
## 58 4.242641 1.414214 1.000000 1.414214 3.605551 2.449490 2.449490 3.605551
## 59 3.872983 2.236068 2.000000 1.000000 3.162278 2.236068 3.000000 3.162278
## 60 3.000000 3.872983 3.741657 1.732051 2.000000 3.605551 3.316625 2.000000
## 61 4.242641 3.162278 2.236068 3.162278 4.123106 4.472136 3.741657 4.123106
## 62 5.567764 2.236068 2.828427 2.236068 4.690416 1.000000 3.000000 4.690416
## 63 2.000000 3.741657 3.000000 2.000000 1.732051 4.242641 3.741657 1.732051
## 64 2.645751 3.605551 2.828427 2.236068 2.449490 4.123106 4.123106 2.449490
## 65 3.872983 2.645751 2.449490 1.000000 3.162278 2.236068 2.645751 3.162278
## 66 2.645751 3.316625 2.449490 2.236068 2.449490 4.358899 3.316625 2.449490
## 67 2.236068 3.872983 3.464102 1.732051 1.414214 3.872983 3.872983 1.414214
## 68 5.000000 1.000000 1.414214 1.732051 4.242641 1.732051 2.236068 4.242641
## 33 34 35 36 37 38 39 40
## 2
## 3
## 4
## 5
## 6
## 7
## 8
## 9
## 10
## 11
## 12
## 13
## 14
## 15
## 16
## 17
## 18
## 19
## 20
## 21
## 22
## 23
## 24
## 25
## 26
## 27
## 28
## 29
## 30
## 31
## 32
## 33
## 34 5.000000
## 35 3.000000 5.830952
## 36 3.316625 6.000000 2.449490
## 37 5.477226 3.872983 4.582576 4.123106
## 38 5.099020 1.000000 5.567764 5.916080 3.464102
## 39 1.414214 4.123106 2.645751 3.316625 4.472136 4.000000
## 40 5.000000 0.000000 5.830952 6.000000 3.872983 1.000000 4.123106
## 41 5.000000 0.000000 5.830952 6.000000 3.872983 1.000000 4.123106 0.000000
## 42 2.236068 5.477226 1.414214 3.162278 5.000000 5.196152 1.732051 5.477226
## 43 3.000000 2.000000 4.242641 4.472136 3.872983 2.236068 2.236068 2.000000
## 44 4.690416 2.645751 4.123106 4.582576 2.000000 2.000000 3.464102 2.645751
## 45 3.464102 5.196152 2.645751 1.000000 3.162278 5.099020 3.162278 5.196152
## 46 2.449490 5.567764 1.000000 2.236068 4.472136 5.291503 2.000000 5.567764
## 47 3.464102 6.082763 1.000000 1.732051 4.242641 5.830952 3.162278 6.082763
## 48 3.162278 3.872983 2.645751 2.236068 2.449490 3.741657 2.449490 3.872983
## 49 2.449490 5.567764 1.000000 2.236068 4.472136 5.291503 2.000000 5.567764
## 50 1.414214 5.196152 2.236068 2.236068 4.898979 5.291503 2.000000 5.196152
## 51 3.605551 4.242641 2.449490 2.449490 2.236068 3.872983 2.645751 4.242641
## 52 4.123106 1.414214 4.690416 5.099020 3.316625 1.000000 3.000000 1.414214
## 53 2.449490 5.567764 1.000000 2.236068 4.472136 5.291503 2.000000 5.567764
## 54 3.162278 3.872983 2.236068 3.000000 2.828427 3.464102 2.000000 3.872983
## 55 2.645751 4.690416 1.414214 2.449490 3.605551 4.358899 1.732051 4.690416
## 56 2.645751 3.464102 2.449490 2.828427 3.000000 3.316625 1.732051 3.464102
## 57 4.123106 1.414214 4.690416 5.099020 3.316625 1.000000 3.000000 1.414214
## 58 3.605551 4.242641 2.449490 2.449490 2.236068 3.872983 2.645751 4.242641
## 59 3.162278 3.872983 2.236068 3.000000 2.828427 3.464102 2.000000 3.872983
## 60 2.000000 3.000000 3.605551 3.872983 4.242641 3.162278 1.414214 3.000000
## 61 5.744563 4.242641 4.472136 4.242641 1.000000 3.872983 4.795832 4.242641
## 62 2.449490 5.567764 1.000000 2.236068 4.472136 5.291503 2.000000 5.567764
## 63 4.358899 2.000000 4.242641 4.472136 2.236068 1.732051 3.316625 2.000000
## 64 4.690416 2.645751 4.123106 4.582576 2.000000 2.000000 3.464102 2.645751
## 65 3.162278 3.872983 2.236068 3.000000 3.162278 3.741657 2.449490 3.872983
## 66 4.690416 2.645751 4.358899 4.123106 1.414214 2.449490 3.741657 2.645751
## 67 3.162278 2.236068 3.872983 4.358899 3.464102 2.000000 2.000000 2.236068
## 68 3.162278 5.000000 1.732051 1.732051 3.162278 4.690416 2.449490 5.000000
## 41 42 43 44 45 46 47 48
## 2
## 3
## 4
## 5
## 6
## 7
## 8
## 9
## 10
## 11
## 12
## 13
## 14
## 15
## 16
## 17
## 18
## 19
## 20
## 21
## 22
## 23
## 24
## 25
## 26
## 27
## 28
## 29
## 30
## 31
## 32
## 33
## 34
## 35
## 36
## 37
## 38
## 39
## 40
## 41
## 42 5.477226
## 43 2.000000 3.741657
## 44 2.645751 4.123106 2.645751
## 45 5.196152 3.316625 3.872983 3.741657
## 46 5.567764 1.000000 3.872983 4.000000 2.449490
## 47 6.082763 2.236068 4.582576 4.242641 2.000000 1.414214
## 48 3.872983 3.000000 2.645751 2.449490 1.414214 2.449490 2.449490
## 49 5.567764 1.000000 3.872983 4.000000 2.449490 0.000000 1.414214 2.449490
## 50 5.196152 2.236068 3.316625 4.472136 2.449490 2.000000 2.449490 2.449490
## 51 4.242641 2.828427 3.162278 2.236068 1.732051 2.236068 2.236068 1.000000
## 52 1.414214 4.242641 1.414214 1.732051 4.358899 4.358899 5.000000 3.000000
## 53 5.567764 1.000000 3.872983 4.000000 2.449490 0.000000 1.414214 2.449490
## 54 3.872983 2.236068 2.645751 2.000000 2.449490 2.000000 2.449490 1.414214
## 55 4.690416 1.414214 3.162278 3.000000 2.236068 1.000000 1.732051 1.732051
## 56 3.464102 2.449490 2.000000 2.236068 2.236068 2.236068 2.645751 1.000000
## 57 1.414214 4.242641 1.414214 1.732051 4.358899 4.358899 5.000000 3.000000
## 58 4.242641 2.828427 3.162278 2.236068 1.732051 2.236068 2.236068 1.000000
## 59 3.872983 2.236068 2.645751 2.000000 2.449490 2.000000 2.449490 1.414214
## 60 3.000000 3.000000 1.000000 3.162278 3.464102 3.162278 4.000000 2.449490
## 61 4.242641 5.099020 4.242641 2.236068 3.316625 4.582576 4.123106 2.645751
## 62 5.567764 1.000000 3.872983 4.000000 2.449490 0.000000 1.414214 2.449490
## 63 2.000000 4.242641 2.000000 1.000000 3.605551 4.123106 4.358899 2.236068
## 64 2.645751 4.123106 2.645751 0.000000 3.741657 4.000000 4.242641 2.449490
## 65 3.872983 2.645751 2.645751 2.449490 2.449490 2.449490 2.449490 1.414214
## 66 2.645751 4.582576 2.645751 1.414214 3.162278 4.242641 4.242641 2.000000
## 67 2.236068 3.316625 1.000000 2.000000 3.741657 3.464102 4.242641 2.449490
## 68 5.000000 2.236068 3.605551 3.162278 1.414214 1.414214 1.414214 1.414214
## 49 50 51 52 53 54 55 56
## 2
## 3
## 4
## 5
## 6
## 7
## 8
## 9
## 10
## 11
## 12
## 13
## 14
## 15
## 16
## 17
## 18
## 19
## 20
## 21
## 22
## 23
## 24
## 25
## 26
## 27
## 28
## 29
## 30
## 31
## 32
## 33
## 34
## 35
## 36
## 37
## 38
## 39
## 40
## 41
## 42
## 43
## 44
## 45
## 46
## 47
## 48
## 49
## 50 2.000000
## 51 2.236068 3.000000
## 52 4.358899 4.358899 3.162278
## 53 0.000000 2.000000 2.236068 4.358899
## 54 2.000000 2.828427 1.000000 2.645751 2.000000
## 55 1.000000 2.236068 1.414214 3.464102 1.000000 1.000000
## 56 2.236068 2.236068 1.414214 2.449490 2.236068 1.000000 1.414214
## 57 4.358899 4.358899 3.162278 0.000000 4.358899 2.645751 3.464102 2.449490
## 58 2.236068 3.000000 0.000000 3.162278 2.236068 1.000000 1.414214 1.414214
## 59 2.000000 2.828427 1.000000 2.645751 2.000000 0.000000 1.000000 1.000000
## 60 3.162278 2.449490 3.000000 2.236068 3.162278 2.449490 2.645751 1.732051
## 61 4.582576 5.000000 2.449490 3.741657 4.582576 3.000000 3.741657 3.162278
## 62 0.000000 2.000000 2.236068 4.358899 0.000000 2.000000 1.000000 2.236068
## 63 4.123106 4.123106 2.449490 1.414214 4.123106 2.236068 3.162278 2.000000
## 64 4.000000 4.472136 2.236068 1.732051 4.000000 2.000000 3.000000 2.236068
## 65 2.449490 2.449490 1.732051 3.000000 2.449490 1.414214 1.732051 1.000000
## 66 4.242641 4.242641 2.236068 2.236068 4.242641 2.449490 3.316625 2.236068
## 67 3.464102 3.464102 2.645751 1.000000 3.464102 2.000000 2.645751 1.732051
## 68 1.414214 2.449490 1.000000 3.872983 1.414214 1.414214 1.000000 1.732051
## 57 58 59 60 61 62 63 64
## 2
## 3
## 4
## 5
## 6
## 7
## 8
## 9
## 10
## 11
## 12
## 13
## 14
## 15
## 16
## 17
## 18
## 19
## 20
## 21
## 22
## 23
## 24
## 25
## 26
## 27
## 28
## 29
## 30
## 31
## 32
## 33
## 34
## 35
## 36
## 37
## 38
## 39
## 40
## 41
## 42
## 43
## 44
## 45
## 46
## 47
## 48
## 49
## 50
## 51
## 52
## 53
## 54
## 55
## 56
## 57
## 58 3.162278
## 59 2.645751 1.000000
## 60 2.236068 3.000000 2.449490
## 61 3.741657 2.449490 3.000000 4.582576
## 62 4.358899 2.236068 2.000000 3.162278 4.582576
## 63 1.414214 2.449490 2.236068 2.645751 2.449490 4.123106
## 64 1.732051 2.236068 2.000000 3.162278 2.236068 4.000000 1.000000
## 65 3.000000 1.732051 1.414214 2.449490 3.000000 2.449490 2.236068 2.449490
## 66 2.236068 2.236068 2.449490 3.162278 1.732051 4.242641 1.000000 1.414214
## 67 1.000000 2.645751 2.000000 1.414214 3.872983 3.464102 1.732051 2.000000
## 68 3.872983 1.000000 1.414214 3.162278 3.316625 1.414214 3.316625 3.162278
## 65 66 67
## 2
## 3
## 4
## 5
## 6
## 7
## 8
## 9
## 10
## 11
## 12
## 13
## 14
## 15
## 16
## 17
## 18
## 19
## 20
## 21
## 22
## 23
## 24
## 25
## 26
## 27
## 28
## 29
## 30
## 31
## 32
## 33
## 34
## 35
## 36
## 37
## 38
## 39
## 40
## 41
## 42
## 43
## 44
## 45
## 46
## 47
## 48
## 49
## 50
## 51
## 52
## 53
## 54
## 55
## 56
## 57
## 58
## 59
## 60
## 61
## 62
## 63
## 64
## 65
## 66 2.449490
## 67 2.449490 2.449490
## 68 2.000000 3.162278 3.162278
hc_euclidea_completo <- hclust(d = mat_dist, method = "complete")
hc_euclidea_completo
##
## Call:
## hclust(d = mat_dist, method = "complete")
##
## Cluster method : complete
## Distance : euclidean
## Number of objects: 68
#Correlación
cor(x = mat_dist, cophenetic(hc_euclidea_completo))
## [1] 0.7536729
#Gráfico: "Cortar el árbol para generar los clusters"
library(factoextra)
## Loading required package: ggplot2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
fviz_dend(x = hc_euclidea_completo, k = 5, cex = 0.5) +
geom_hline(yintercept = 3.4, linetype = "dashed", color="blue") +
labs(title = "Dendograma",
subtitle = "K-medias= 5")
## Warning: `guides(<scale> = FALSE)` is deprecated. Please use `guides(<scale> =
## "none")` instead.
En el dendograma observamos 5 grupos que son observados de diferentes colores. Podemos observar qué se diferencian muy bien por lo que un K-medias de 5 puede ser el número de grupos ideal.
#Definir K-medias después del dendograma
km_clusters <- kmeans(x = Datos, centers = 5, nstart = 70)
#Clústers
fviz_cluster(object = km_clusters, data = Datos, show.clust.cent = TRUE,
ellipse.type = "euclid", star.plot = TRUE, repel = TRUE,
pointsize=0.2,outlier.color="darkred") +
labs(title = "Resultados clustering K-means") +
theme_bw() + theme(legend.position = "none")
Ahora que identificamos los 5 grupos es momento de detrminar sus perfiles, para esto la siguiente tabla:
| Clúster | Individuos | Perfil |
|---|---|---|
| 1. Rojo | 32,13,29,41,40,25,34,57,5,52,8,67,21,38,12,16 | Este grupo está formado por estudiantes, que cursan y cursaron la educación superior, por lo menos una vez al año hacen uso de los datos abiertos, y a su vez dan crédito con poca frecuencia al repositorio de donde se obtuvieron los datos que les dieron uso. |
| 2. Verde pasto | 61,9,37,6,64,4,44,63,19,66 | Estudiantes con los conocimientos básicos. |
| 3. Verde menta | 50,39,20,33,22,43,60 | Usan muy poco los datos abiertos. |
| 4. Azul | 1,24,47,3,17,27,26,45,31,36 | Son estudiantes que tienen como mínimo la educación superior. Buscan datos de hasta por lo menos de tres temas, por lo que, SÍ cuentan con los conocimientos básicos para manejar bases de datos. |
| 5. Fiusha | 65,55,2,18,59,54,7,23,11,15,28,56,68,48,51,58,42,30,35,14,62,53,49,10,46 | Estudiantes y profesionistas que saben un poco más que los otros usuarios sobre el tema. |
Grupos<-(km_clusters$cluster)
R <- Datos$`Menciona uno o varios de los repositorios de datos abiertos que conozcas:`
SDA <- Datos$`¿Sabes que son los datos abiertos?`
FDA <- Datos$`¿Con qué frecuencia usas los datos abiertos?`
CDA <- Datos$`¿Conoces algún repositorio de datos abiertos?`
ANOVA <- aov(Grupos~R+SDA+FDA+CDA)
summary(ANOVA)
## Df Sum Sq Mean Sq F value Pr(>F)
## R 1 1.07 1.065 0.755 0.388083
## SDA 1 11.67 11.673 8.278 0.005471 **
## FDA 1 17.62 17.620 12.496 0.000771 ***
## CDA 1 5.87 5.868 4.162 0.045543 *
## Residuals 63 88.83 1.410
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Podemos observar en el ANOVA que todos los factores son significativamente diferentes, considerando a los Grupos como variable dependiente. Es decir que son significativamente diferentes para cada grupo.
El diseño de un programa de capacitación de acuerdo con la clasificación de los asistentes al evento debe estar enfocado a los conocimientos de sus asistentes. En este análisis quedo reflejado que solo una pequeña parte de las personas que asistieron al evento cuentan con los conocimientos básicos para manejar bases de datos, y que la frecuencia con la que los grupos de asistentes dan crédito al repositorio de dónde obtuvieron los datos abiertos es muy poca.
Considerando lo anterior, el diseño de un programa de capacitación debe promover el uso de los datos abiertos, así como enseñar al asistente a dar crédito a la fuente de donde obtiene sus datos y presentar un panorama general sobre el manejo de las bases de datos abiertos, es decir: formatos de descarga, lectura del diccionario de los datos y los elementos que conforman las bases de datos.