ANÁLISIS DATOS ACEPTACIÓN METODOLOGÍA

INTRODUCCIÓN

Por tratarse de una investigación en el ámbito aeronáutico de la innovación y desarrollo tecnológico, específicamente centrada en la validación de la metodología de gestión de la innovación, el estudio se aplicará a seis grupos de investigación que generan productos dentro de la institución. Los investigadores que participarán en este estudio están distribuidos en diferentes puntos a nivel nacional, lo que hace necesario utilizar herramientas digitales para la recolección de datos.

El presente informe pretende realizar un análisis holístico de los datos recopilados en una encuesta efectuada a seis 6 centros de investigación y desarrollo para identificar patrones, relaciones y segmentaciones relevantes que permitan determinar y evaluar la satisfacción y usabilidad del modelo metodológico propuesto.

Objetivo

Este informe pretende presentar un análisis descriptivo exhaustivo de los datos recopilados para validar la adopción de la metodología propuesta.

Diccionario de datos.

-Satisfacción: 1=Muy insatisfecho, 2=Insatisfecho 3=Neutral, 4=Satisfecho, 5=Muy satisfecho

-Usabilidad: 1=Totalmente en desacuerdo, 2=En desacuerdo 3= Neutral, 4= De acuerdo, 5=Totalmente de acuerdo

1. ANÁLISIS EXPLORATORIO DE DATOS

1.1 Revisión de los datos

La siguiente sección pretende efectuar una verificación de las variables contenidas en la base de datos, donde se pudieron identificar un total de 17 variables y 279 registros, identificando variables tipo categórico y numérico, para su posterior análisis se realizará la división de estas variables en dos grandes grupos, el primero relacionado con características propias del nivel de satisfacción de la metodología y el segundo referente a usabilidad.

## Rows: 279
## Columns: 17
## $ Edad                            <dbl> 34, 31, 33, 26, 32, 28, 30, 29, 34, 33…
## $ Género                          <chr> "Masculino", "Masculino", "Masculino",…
## $ `Tipo de vinculación`           <chr> "Investigador en formación (Estudiante…
## $ `Grupo de investigación`        <chr> "Aviación militar - ESAVE", "Aviación …
## $ `1. Satisfacción metodología`   <dbl> 4, 5, 3, 5, 5, 4, 4, 5, 4, 4, 4, 5, 4,…
## $ `2. Disposición implementación` <dbl> 4, 5, 4, 4, 5, 4, 4, 5, 4, 4, 4, 5, 4,…
## $ `3. Alineación con el Ejército` <dbl> 4, 5, 4, 4, 5, 5, 3, 5, 4, 5, 4, 5, 4,…
## $ `4. Claridad y estructura`      <dbl> 3, 5, 4, 4, 5, 4, 4, 4, 4, 4, 4, 4, 4,…
## $ `5. Mejora gestión innovación`  <dbl> 3, 4, 4, 4, 5, 5, 4, 4, 3, 5, 4, 5, 4,…
## $ `1. Uso frecuente`              <dbl> 4, 4, 5, 4, 5, 4, 4, 4, 4, 4, 4, 4, 4,…
## $ `2. Facilidad comprensión`      <dbl> 3, 4, 4, 4, 4, 3, 5, 4, 5, 4, 3, 4, 4,…
## $ `3. Aprendizaje rápido`         <dbl> 5, 2, 4, 5, 4, 4, 4, 3, 4, 3, 4, 5, 3,…
## $ `4. Confianza lineamientos`     <dbl> 4, 4, 5, 3, 3, 4, 4, 3, 5, 3, 4, 3, 4,…
## $ `5. Estructura organizada`      <dbl> 4, 4, 5, 4, 4, 4, 5, 3, 3, 3, 4, 3, 4,…
## $ Índice_Satisfacción             <chr> "NO", "SI", "NO", "SI", "SI", "SI", "N…
## $ Índice_Usabilidad               <chr> "SI", "NO", "SI", "SI", "SI", "NO", "S…
## $ Puntaje_Adopción_Global         <chr> "NO", "SI", "SI", "SI", "SI", "SI", "S…
Data summary
Name datos_encuesta
Number of rows 279
Number of columns 17
_______________________
Column type frequency:
character 6
numeric 11
________________________
Group variables None

Variable type: character

skim_variable n_missing complete_rate min max empty n_unique whitespace
Género 0 1 8 21 0 3 0
Tipo de vinculación 0 1 19 50 0 7 0
Grupo de investigación 0 1 5 39 0 6 0
Índice_Satisfacción 0 1 2 2 0 2 0
Índice_Usabilidad 0 1 2 2 0 2 0
Puntaje_Adopción_Global 0 1 2 2 0 2 0

Variable type: numeric

skim_variable n_missing complete_rate mean sd p0 p25 p50 p75 p100 hist
Edad 0 1 30.71 6.30 0 29 31 34 42 ▁▁▁▇▅
1. Satisfacción metodología 0 1 4.15 0.64 2 4 4 5 5 ▁▂▁▇▃
2. Disposición implementación 0 1 4.13 0.64 2 4 4 5 5 ▁▂▁▇▃
3. Alineación con el Ejército 0 1 4.16 0.65 3 4 4 5 5 ▂▁▇▁▅
4. Claridad y estructura 0 1 4.15 0.62 3 4 4 5 5 ▂▁▇▁▃
5. Mejora gestión innovación 0 1 4.15 0.63 3 4 4 5 5 ▂▁▇▁▃
1. Uso frecuente 0 1 3.95 0.78 2 4 4 4 5 ▁▃▁▇▃
2. Facilidad comprensión 0 1 4.08 0.75 2 4 4 5 5 ▁▃▁▇▆
3. Aprendizaje rápido 0 1 3.94 0.81 2 3 4 5 5 ▁▅▁▇▅
4. Confianza lineamientos 0 1 3.95 0.76 2 3 4 4 5 ▁▃▁▇▃
5. Estructura organizada 0 1 3.98 0.75 2 3 4 5 5 ▁▅▁▇▅

Los datos anteriores, permiten realizar una revisión y evaluación inicial de los datos, donde se puede observar un total de 279 registros que equivalen al total de encuestas realizadas, hay un total de 6 datos de tipo categórico y 11 de tipo numérico, cada uno de los registros cuentan con 17 columnas de información suministrada por el personal encuestado. De acuerdo con el censo poblacional se esperaba obtener un total de 354 muestras que es el total de la población.

Para nuestro análisis se obtuvo un total de 279 muestras del total de la población N, lo cual es una buena muestra, que abarca el 78.8% de la población, con un margen de error de +-2.71% (mejor que el estándar de +-5), esta muestra n tiene la capacidad de detectar diferencias y efectos sutiles entre variables y un mayor poder estadístico para efectuar análisis multivariados, con una representatividad que reduce significativamente el sesgo de muestreo, cumpliendo con los requisitos estadísticos para que los resultados sean generalizables a toda la población N.

1.2 Datos faltantes

## Valores cero en edad: 7

De acuerdo con el análisis realizado en la sección 1.1, no se observaron datos faltantes en los datos de las encuestas, sin embargo, los resultados estadísticos para las variables numéricas permiten identificar que hay datos de edad que fueron diligenciados con valor cero, por lo tanto, estos datos deben limpiarse para que no afecten las medidas estadísticas de los mismo.

Teniendo en cuenta que la variable edad es la única afectada, debido a un mal diligenciamiento, realizaremos la imputación de datos de los 7 encuestados identificados, se empleara la mediana considerando que como medida de tendencia central es más resistente a valores extremos representando mejor el valor central real del dato.

## Mediana de edad calculada:32
## Valores imputados:7
## Imputación completada: CEROS → NA → MEDIANA(32)

Una vez limpiado los datos procedemos al análisis de los mismos, planteando las hipótesis que nos permitan confirmar o desvirtuar el comportamiento de los encuestados hacia la aceptación o no de la metodología propuesta.

2. PLANTEAMIENTO DE HIPÓTESIS

2.1 Hipótesis Variables Cuantitativas

Edad: Se espera que entre menor sea la edad exista una mayor aceptación/usabilidad de la metodología propuesta, teniendo en cuenta que las personas con menor edad pueden estar más influenciadas a seguir una metodología de investigación dentro de su área laboral, caso contrario una persona con mayor edad, donde se espera que debido a su experiencia sea menos perceptivo a adoptar una nueva metodología propuesta, presentando una resistencia al cambio.

2.2 Hipótesis Variables Categóricas

Género: se espera que los hombres tengan mayor aceptación de la metodología, considerando que son una representación mayoritaria dentro de la institución, por lo tanto, se espera que el género femenino tenga una menor aceptación que el masculino debido a que son minoría dentro de la institución.

Tipo de vinculación: se espera que los estudiantes de pregrado tengan una mayor adopción de la metodología considerando que es personal nuevo dentro de los centros de investigación, mientras que el personal de senior es posible que no sean tan receptivos a la adopción de la metodología.

Grupo de investigación: se espera que los grupos de investigación que se encuentren en el nivel central tengan más aceptación de la metodología, mientras que los grupos descentralizados no.

3. ANÁLISIS UNIVARIADO

A continuación, se realizará un análisis univariado de las variables seleccionadas en las diferentes hipótesis planteadas.

3.1 Gráficas variable númericas

La anterior gráfica permite analizar la distribución de edad, donde se pueden evidenciar que el 75% de los datos se encuentran por debajo de los 34 años, el primer cuartil Q1 representa el 25% de los datos con edades inferiores a 29 años y encontramos algunos datos atípicos que está por encima del valor máximo (41) y por debajo del valor mínimo (22).

Se puede concluir que existe una simetría moderada de los datos debido a su distribución, ligeramente sesgada a hacia la izquierda, donde el 50% de la información se encuentra entre las edades de 29 y 34 años (personas adultas), lo que significa que la fuerza laboral de los centros de investigación se encuentra en este rango y representa la mitad de los datos recolectados. También se puede resaltar que existe poca participación de personas con edades menores a los 23 años y superiores a los 36, sin valores atípicos extremos evidentes.

3.2 Gráficas variable categóricas

La distribución de genero nos permite identificar presencia de un 77.4% de personal masculino versus un 19.7% de personal de sexo femenino, esto tiene mucho que ver con la capacidad actual de fuerza, donde el personal masculino es mayoría, finalmente un 2.9% prefirió no responder.

La gráfica anterior permite visualizar la distribución de acuerdo con el tipo de vinculación, donde los estudiantes de pregrado tienen mayor participación (33%), mientras que los investigadores emérito solo de 0.7% dentro de la muestra n.

Finalmente, se puede visualizar la distribución por grupos de investigación, donde la ESAVE (31.2%) y ESCOM (30.8%) son los que tienen mayor participación en comparación con el BRIAV (4.37%).

4. ANÁLISIS RESULTADOS ENCUESTAS

En esta sección detallaremos los resultados obtenidos de las preguntas realizadas en la encuesta realizada:

4.1 Categoría satisfación

En las gráficas anteriores se puede observar de manera general como en la mayoría de las preguntas, los encuestados manifestaron estar entre satisfecho y muy satisfecho para la categoría de satisfacción, ya que los valores de 4 y 5 representan más del 80% en todas respuestas obtenidas, lo que indica de manera general, existe una alta satisfacción con respecto a la metodología propuesta por parte del personal encuestado.

En la gráfica de boxplot se puede observar la congruencia de la información al poder verificar como los valores de 4 y 5 son predominantes y es donde se concentra la mayoría de los datos.

4.2 Categoría usabilidad

Para el caso de usabilidad, se puede observar que la mayoría de los encuestados se inclinan por número 4, es decir, manifiestan estar de acuerdo con la usabilidad de la metodología y una porción entre el 20 y 25 % se sitúa en (totalmente de acuerdo), sin embargo, también se puede evidenciar que existe una gran porción (entre el 20-26%) que manifiesto una posición neutral frente al uso de la metodología, lo que significa que no están muy seguros de implementar o no la metodología.

El gráfico de boxplot, permite identificar como están agrupados los datos, a diferencia de la categoría satisfacción que estaban entre 4 y 5, para la categoría de usabilidad están entre 3, 4 y 5, incluso se obtuvieron algunas respuestas de valor 2 (en desacuerdo), lo cual sugiere que hay un grupo de personas que no está de acuerdo con el uso de la metodología.

4.3 Correlaciones categorias (Satisfacción/Usabilidad)

La matriz de correlación indica que las preguntas fueron correctamente estructuradas y divididas en dos categorías, teniendo en cuenta que existe correlación solo entre las preguntas dentro de la misma categoría, se puede observar en la parte superior derecha de la gráfica como obtenemos valores casi nulos (alrededor de cero) que indican que no hay correlación entre estas variables cuando se cruzan diferentes categorías, caso contrario sucede con la categoría de satisfacción en la cual se puede observar que hay una correlación moderada entre la mayoría de sus variables (0.40-0.59) y que existe una correlación alta (0.60-0.79) entre la variable “Disposición de la implementación” y “claridad y estructura”.

Para el caso de la categoría usabilidad, tenemos que las variables entre si se relacionan de manera débil (0.20-0.39) y moderadamente existe relación entre las variables “facilidad de comprensión” y “aprendizaje rápido”, así como con la variable “uso frecuente”, lo que sugiere que estas variables están asociadas, pero no son causales.

4.4 Dendograma

La gráfica anterior nos permite identificar como se están agrupando jerárquicamente las categorías de las variables de estudio, el dendograma muestra un análisis de clusters de las variables basado en sus patrones de correlación.

En resumen, se puede concluir que existen dos dimensiones o cluster distintos, que dentro de cada cluster hay una cohesión interna entre las variables, por lo tanto, se deben presentar y proponer estrategias de manera separada para mejorar cada grupo. por ejemplo, para el grupo de usabilidad, el uso frecuente tiene correlación con la confianza de lineamientos y estructura organizada, lo que significa que la variable 1 podría estar influenciada por las variables 4 y 5.

4.5 Coeficiente de cronbach

con el fin de establecer una métrica que nos permita conocer la confiabilidad del cuestionario propuesto se empleará el coeficiente de cronbach, medida estadística empleada para determinar la consistencia de un conjunto de datos, si las preguntas están relacionadas entre sí y miden el mismo constructo se espera obtener un alto coeficiente, indicándonos una alta confiabilidad.

El Alfa de Cronbach nos da una forma de asegurarnos que las preguntas de nuestro cuestionario midan lo mismo, proporcionando resultados más confiables y precisos.

## Coeficiente Alpha de Cronbach para grupo Satisfacción: 0.857
## Coeficiente Alpha de Cronbach para grupo Usabilidad: 0.755

El anterior resultado nos permite identificar que se cuentan con unos coeficientes altos de cronbach que garantizan que internamente las preguntas de nuestro cuestionario midan lo mismo, proporcionando resultados más confiables y precisos para nuestra investigación, demostrando la correlación de cada grupo y concluyendo que los constructos para usabilidad y satisfacción son altamente confiables y consistentes.

5 ANÁLISIS BIVARIADO

Se realiza un análisis de bivariado en donde la variable respuesta es “aceptación de la metodología” codificada de la siguiente manera (y=1 si se adopta, y=0 si no se adopta), lo anterior, con el fin de verificar las hipótesis planteadas. Como bien se mencionó anteriormente existen dos grupos o categoría conocidas, que son satisfacción y usabilidad. Sin embargo, es importante tener en cuenta que para nuestro análisis se dispone como métrica que para que una persona adopte la metodología debe tener un puntaje de 4 o superior en ambas categorías, un puntaje menor significa que la persona no es a fin con la metodología propuesta.

De acuerdo con la hipótesis planteada se esperaba que entre menor edad se tuviera, mayor aceptación a la propuesta, se confirma esta hipótesis considerando que las personas con edades menores a los 20 años tienen mayor aceptación de usabilidad (60%) y satisfacción (80%), lo cual sugiere que las personas jóvenes tienden a adoptar más fácil la metodología implementada.

Para el caso de las personas entre 41 a 50 años, se puede observar que contrario a la hipótesis planteada también poseen una alta posibilidad de adoptar la metodología, pero es importante resaltar que las muestras son muy bajas.

ahora bien, analizando las edades donde está la mayor concentración de datos 21 a 40 años, se puede observar que estas personas son más a fin al grupo de satisfacción donde su representación es casi del 70% de posibilidades de adoptar la metodología, mientras que, en usabilidad, encontramos datos más parejos, sin embargo, hay tendencia hacia el uso de la metodología. Esto significa que se deben implementar estrategias para enfocar los esfuerzos de usabilidad en las personas con este rango de edad.

5.1 Variables categóricas bivariadas

La hipótesis planteada inicialmente se esperaba que los hombres tuvieran mayor representación respecto al personal femenino, sin embargo, esta hipótesis no es validada que encontramos que el personal femenino tuvo mayor aceptación de usabilidad con un 69.1% en comparación con el personal masculino, lo que sugiere que más mujeres tienden a ser más receptivas respecto al uso de la tecnología. Respecto a la categoría de satisfacción encontramos que los hombres si se encuentran más satisfechos (73.6%) en comparación con las mujeres (60%), lo que indica que un porcentaje alto de los hombres presenta una mejor disposición a la implementación de la tecnología.

Se esperaba para esta hipótesis que los estudiantes de pregrado tuvieran mayor adopción a la tecnología, sin embargo, se puede desvirtuar esta teoría, considerando que para la categoría de usabilidad, los estudiantes tienen opiniones divididas (50%), lo cual podría indicar que no tienen mucha claridad del impacto de la metodología y tienden a no saber si usarla o no, por otro lado, respecto a la categoría de satisfacción vemos que un porcentaje alto indica tener una mejor disposición para la implementación enmarcada en claridad, estructura, alineación y oportunidad de mejora para la gestión e innovación.

ahora bien, analizando cargos como el investidaro emérito podemos observar que estan 100 alineados, con la implementación de la metodología.(muestras bajas, solo dos de los encuestados)

De acuerdo con esta hipótesis se esperaba que los grupos de investigación del nivel central (ESCAB-ESAVE-BAIDI-ESMIC) tuvieran mayor aceptación, sin embargo, se puede observar como ESCAB presenta un 25% de usabilidad de la metodología, mientras que los grupos externos como ESCOM (59.3%) y BRIAV (69.2%) mostraron mejor recepción de la metodología.

Por otro lado, respecto a la categoría de satisfacción, se puede observar que BAIDI fue el grupo con menor puntaje (57.1%) y las otras dependencias parecen estar más satisfechos con la metodología propuesta con porcentajes que superan los 60% hasta el 81.6%.

5.2 Análisis de correspondencias

El análisis por correspondencia nos va a permitir analizar las variables, con el fin de determinar su asociación, es muy importante definir el objetivo de nuestro MCA.

Objetivo: Entender como las percepciones de satisfacción y usabilidad (10 preguntas), varían según el género, tipo de vinculación y grupo de investigación. Responder a la pregunta ¿Qué piensa la gente? y luego ¿Quiénes son los que piensan así?.

Para este caso particular se consideraron como variables activas las respuestas a las 10 preguntas (5 de satisfacción + 5 de usabilidad), y como variables complementarias el género, tipo de vinculación y grupo de investigación.

Es importante fijar el objetivo teniendo en cuenta que el MCA analiza las relaciones entre todas las categorías. Si sumamos las puntuaciones de las preguntas para crear un índice único estamos perdiendo información clave sobre que aspecto específico de la satisfacción o usabilidad están influyendo en la relación de variables.

Gráfica MCA preguntas satifacción

En la gráfica anterior se puede evidenciar como las variables activas son consistentes en la parte superior, mientras que las variables complementarias están en la parte inferior, donde parece que las respuestas de las personas encuestadas tienen más asociación con el grupo de investigación al que pertenecen. las dos primeras dimensiones explican el 22% de la varianza de los datos.

Gráfica distribución variables activas vs complementarias (Satisfacción)

La anterior gráfica nos permite concluir como es el comportamiento de las respuestas obtenidas en contraste con las variables activas, las variables que se encuentran más lejos del centro son aquellas que presentan mayor contribución para la interpretación, por ejemplo se puede observar que las preguntas que fueron respondidas con calificación 4 (satisfecho) están más cercanas a las variables de género, grupo de investigación y tipo de vinculación, lo que sugiere que estos datos fueron más comunes para las variables suplementarias.

Por ejemplo, las respuestas neutrales (3) se encuentran más lejos del centro, lo que significa que tienen mayor asociación con respecto a las que están en el centro, pero se logra observar que no hay variables complementarias cercanas.

Una cercanía entre las categorías significa una alta asociación entre esas categorías, por ejemplo, el género masculino está muy cerca de estudiante de pregrado, lo que puede sugerir que los estudiantes de pregrado sean de género masculino debido a su cercanía.

Gráfica MCA preguntas usabilidad

La anterior gráfica permite identificar que las preguntas parecen ser más diversas y menos consistentes, esto quiere decir que existe más personas que contestaron con niveles de 2 (desacuerdo) y 3 (neutral), se puede también afirmar que las variables de grupo de investigación y tipo de vinculación parecen tener alguna asociación con la pregunta de estructura organizada.

Gráfica distribución variables activas vs complementarias (Usabilidad)

La gráfica anterior, permite evidenciar que existen diferentes respuestas entre 2 y 5, se puede observar que existe una fuerte relación entre investigador asociado y el grupo BRIAV, lo que sugiere que este tipo de investigadores suelen encontrarse dentro del grupo BRIAV.

Otro ejemplo fácil de evidenciar es el sexo, ya que tienen una asociación negativa y son opuestos al sexo, lo que sugiere que una persona de sexo masculino no puede pertenecer al género femenino.

También se puede observar como las preguntas de aprendizaje rápido y estructurase encuentran asociadas con el grupo de ESAVE.