Los programas de formación técnica laboral ofrecen a sus estudiantes la posibilidad de optar por una modalidad de práctica orientada al emprendimiento. Al inicio de este proceso, el orientador aplica un diagnóstico que permite clasificar al participante y derivarlo hacia la ruta de acompañamiento más adecuada para su perfil.
El Diagnóstico de Madurez Empresarial clasifica cada caso en una de cuatro categorías:
| Diagnóstico | Descripción | Ruta |
|---|---|---|
| Activo Con Potencial | Negocio en marcha con condiciones favorables para crecer | Fortalecimiento |
| Activo Sin Potencial | Negocio operando pero con limitaciones estructurales | Fortalecimiento |
| Idea en Experimentación | Ha realizado validaciones en el mercado y está próximo a activar | Ideación avanzada |
| Idea Conceptual | Solo tiene la idea; no ha realizado validaciones ni acciones concretas | Ideación básica |
Este diagnóstico inicial permite derivar al participante hacia dos grandes rutas:
Pregunta de investigación:
¿Qué variables sociodemográficas y del perfil del emprendimiento permiten predecir el Diagnóstico de Madurez Empresarial de un participante del programa de emprendimiento?
| Característica | Valor |
|---|---|
| Total de participantes | 547 |
| Total de variables | 25 |
| Emprendimientos Activos | 361 (66%) |
| Emprendimientos en Idea | 186 (34%) |
| Ciudades representadas | 6 |
| Período de recolección | Programa vigente |
📊 Tipo de gráfico: Gráfico de barras verticales con etiquetas de frecuencia absoluta y relativa. Es el tipo más directo para mostrar la distribución de una variable categórica. Se usa como punto de partida porque el diagnóstico es la variable central del estudio.
✅ Conclusión: El diagnóstico más frecuente es Activo Con Potencial (41.5%), lo que indica que la mayoría de los participantes ya opera un negocio con condiciones favorables. Sin embargo, el 24.5% presenta un emprendimiento activo con limitaciones estructurales (Activo Sin Potencial). El 34% restante está en etapa de idea: un 21.6% solo tiene el concepto (Idea Conceptual) y un 12.4% ya realizó alguna validación (Idea en Experimentación). Estos datos confirman la necesidad de rutas diferenciadas de acompañamiento desde el inicio del proceso formativo.
📊 Tipo de gráfico: Panel de seis gráficos de barras apiladas al 100%, organizados en una cuadrícula 3×2. Cada gráfico muestra la composición proporcional del diagnóstico para cada categoría de una variable sociodemográfica. Este formato permite comparar múltiples variables en un solo vistazo, similar al análisis exploratorio de referencia.
✅ Conclusión: Las mujeres presentan mayor proporción de Activo Con Potencial que los hombres, posiblemente por su alta participación en sectores de servicios con demanda estable. A mayor nivel educativo (Tecnólogo, Profesional), aumenta la proporción de diagnósticos favorables. El rango de edad 25–44 años concentra los mejores perfiles de madurez. Respecto al trabajo formal: quienes no trabajan actualmente tienen mayor proporción de Activo Con Potencial, confirmando que la carga laboral reduce el tiempo disponible para el emprendimiento. Los Cotizantes (trabajadores formales) muestran mayor concentración de ideas sin madurar, coherente con su menor disponibilidad. Los Cesantes (desempleados) recurren al emprendimiento como alternativa, pero muchos llegan en etapa conceptual. El estrato 3 presenta la mayor proporción de Activo Con Potencial, mientras que estrato 1 concentra más ideas.
📊 Tipo de gráfico: Diagrama de caja (boxplot). Muestra la mediana (línea central), el rango intercuartílico Q1–Q3 (caja), los bigotes (valores dentro de 1.5×IQR) y los valores atípicos (puntos). Se usa para comparar la distribución de variables numéricas entre grupos, permitiendo ver diferencias en tendencia central y dispersión simultáneamente.
✅ Conclusión: Los Activo Con Potencial muestran ventas medianas cercanas a $2.000.000 COP y tiempo en mercado mediano de ~18 meses, confirmando que el desempeño económico y la experiencia operativa son los factores más diferenciadores. Los Activo Sin Potencial tienen ventas muy bajas (mediana ~$500.000) y alta dispersión. La edad y el estrato no muestran diferencias marcadas entre grupos, siendo variables de menor poder discriminante individual, aunque los estratos 2–3 concentran la mayor parte de los casos en todos los diagnósticos.
📊 Tipo de gráfico: Gráficos de barras apiladas al 100% con etiquetas proporcionales. Permiten comparar la composición del diagnóstico según variables binarias clave. Se usan para evidenciar el efecto directo de haber validado en el mercado y de tener empleo formal sobre el nivel de madurez del emprendimiento.
✅ Conclusión: Quienes sí realizaron validaciones concentran la mayoría de diagnósticos favorables (Activo Con Potencial e Idea en Experimentación), confirmando que las validaciones son un indicador directo de avance en la madurez emprendedora. Por el contrario, quienes no validaron se acumulan casi completamente en Idea Conceptual. Respecto al trabajo formal: quienes no trabajan actualmente presentan más emprendimientos activos y con potencial, mientras que los Cotizantes (con empleo formal) muestran mayor concentración en etapas de idea, lo que sustenta la percepción de que el empleo formal limita el tiempo y dedicación al emprendimiento.
📊 Tipo de gráfico: Barras apiladas al 100% comparativas. Permite ver si el acceso a herramientas digitales y la formalización (Cámara de Comercio/RUT) se asocian con mejores diagnósticos de madurez. Son variables proxy de capacidad digital y de integración al ecosistema empresarial formal.
✅ Conclusión: El manejo de TIC muestra una asociación positiva clara con diagnósticos favorables: quienes manejan herramientas digitales tienen mayor proporción de Activo Con Potencial, mientras que quienes no las manejan concentran más Activo Sin Potencial e Ideas Conceptuales. El registro en Cámara de Comercio/RUT es el indicador de formalización más fuerte: prácticamente todos los registrados se clasifican como Activo Con Potencial, lo que convierte esta variable en un proxy muy potente de madurez empresarial.
📊 Tipo de gráfico: Correlograma (matriz de correlaciones visualizada como mapa de calor). Muestra el coeficiente de correlación de Pearson entre pares de variables numéricas. Los colores azules indican correlación positiva; los rojos, correlación negativa. Los números permiten cuantificar la fuerza de cada relación. Se usa para identificar qué variables tienen mayor relación lineal con el diagnóstico y detectar multicolinealidad entre predictores.
✅ Conclusión: Las variables con mayor correlación positiva con el Diagnóstico son: Ventas (r ≈ 0.78), Tiempo en el mercado (r ≈ 0.71), Estado Activo (r ≈ 0.80) y Registro Cámara/RUT (r ≈ 0.65). Las Validaciones en el mercado muestran correlación positiva significativa. El Trabajo Formal presenta correlación negativa leve con el diagnóstico, apoyando la hipótesis de que el empleo formal limita la madurez emprendedora. La edad tiene correlación ligeramente negativa, indicando que los más jóvenes tienden a diagnósticos más favorables. El correlograma también revela alta correlación entre Ventas y Estado Activo (esperada), lo que confirma que estas variables capturan el mismo fenómeno desde ángulos diferentes.
📊 Tipo de gráfico: Treemap (mapa de árbol). Representa datos jerárquicos mediante rectángulos anidados cuyo tamaño es proporcional a la frecuencia y cuyo color representa la categoría diagnóstica dominante. Es útil para mostrar simultáneamente volumen y composición en múltiples categorías, algo difícil de lograr con gráficos de barras cuando hay muchos grupos.
✅ Conclusión: Comercio y ventas al por menor es la categoría más representada, con alta variabilidad diagnóstica, lo que indica heterogeneidad en el sector. Servicios de alimentos y gastronomía y Manufactura de alimentos concentran muchos casos de Idea Conceptual e Idea en Experimentación, sugiriendo que muchos participantes de estas áreas llegan con conceptos no maduros. Cultura y educación y Servicios profesionales muestran mayor proporción de Activo Con Potencial, asociados a perfiles de mayor escolaridad y capacidad de diferenciación. Esta distribución justifica adaptar los contenidos de cada ruta según el sector productivo del participante.
📊 Tipo de gráfico: Mapa interactivo de burbujas (Leaflet). Cada círculo representa una ciudad; su tamaño y color son proporcionales al número de emprendedores registrados. El mapa permite identificar patrones de concentración territorial y zonas con menor cobertura del programa. Hacer clic en cada burbuja despliega el nombre de la ciudad y el número de participantes.
✅ Conclusión: La distribución geográfica evidencia una fuerte concentración en Cali (256 participantes, 47% del total), seguida de Palmira (91), Yumbo (84) y Jamundí (48). Esta concentración refleja la mayor densidad poblacional y acceso a los servicios del programa en el área metropolitana. Municipios como Cartago (22) y Tuluá (46) tienen presencia menor pero relevante en el norte del departamento. El mapa revela una oportunidad clara de expansión hacia municipios intermedios del Valle del Cauca, donde la cobertura actual del programa es limitada.
📊 Tipo de gráfico: Biplot de PCA (Análisis de Componentes Principales). Es una técnica de reducción de dimensionalidad lineal que proyecta múltiples variables en dos ejes ortogonales que capturan la mayor varianza posible. Los puntos representan participantes coloreados por diagnóstico; las flechas representan variables y su dirección indica la asociación con cada componente. Las elipses delimitan el 95% de los casos por grupo. Se usa para identificar estructuras de agrupamiento y entender qué variables definen mejor cada grupo diagnóstico.
✅ Conclusión: El PCA revela una clara separación entre emprendimientos activos e ideas a lo largo del primer componente (PC1), que captura principalmente la varianza de ventas, tiempo en mercado y registro en Cámara/RUT. Los Activo Con Potencial se agrupan hacia la derecha (alto desempeño económico, mayor formalización). Los grupos de Idea se ubican a la izquierda. La variable trabajo formal apunta en sentido contrario al eje de potencial, reforzando la hipótesis de que tener empleo formal es un factor limitante para la madurez emprendedora. Las validaciones en el mercado apuntan hacia Idea en Experimentación, diferenciándola de Idea Conceptual.
📊 Tipo de gráfico: T-SNE (t-Distributed Stochastic Neighbor Embedding). Es una técnica de reducción de dimensiones no lineal que preserva las relaciones de proximidad entre observaciones en el espacio original multidimensional. A diferencia del PCA (que es lineal), el T-SNE puede capturar estructuras curvilíneas y clústeres complejos. Se usa para validar si los cuatro diagnósticos son realmente distinguibles cuando se consideran todas las variables simultáneamente, sin asumir linealidad.
✅ Conclusión: El T-SNE confirma y amplía lo observado en el PCA: existen dos nubes principales bien separadas — emprendimientos activos (azul/rojo) e ideas (naranja/verde). Los Activo Con Potencial forman la nube más compacta y definida, lo que indica alta homogeneidad en su perfil. Los Activo Sin Potencial muestran mayor dispersión. Las dos categorías de idea presentan cierto solapamiento, esperado dado que su diferencia principal es cualitativa (haber validado o no). Esta separación en el espacio no lineal valida la pertinencia de las cuatro categorías diagnósticas y anticipa que un modelo de clasificación posterior tendría buen desempeño diferenciando activos de ideas, con mayor dificultad entre las dos subcategorías de idea.
📊 Tipo de gráfico: Dendrograma (árbol jerárquico de agrupamiento). Agrupa objetos (en este caso, categorías de negocio) según su similitud en un perfil multivariado. Los objetos más similares se unen primero (ramas bajas), formando clústeres que se fusionan progresivamente. El método Ward minimiza la varianza intragrupo. Se usa para identificar qué sectores productivos comparten características similares de participantes, orientando el diseño curricular diferenciado.
✅ Conclusión: El dendrograma revela dos grandes clústeres. El primero agrupa sectores de manufactura y comercio tradicional (alimentos, textil, comercio al por menor), cuyos participantes comparten perfiles de mayor edad, menor escolaridad y ventas más bajas. El segundo agrupa sectores de mayor valor agregado (tecnología, servicios profesionales, turismo, cultura y educación), con participantes más jóvenes, mayor escolaridad y mejores diagnósticos de madurez. Esta segmentación natural puede orientar el diseño curricular: los sectores del primer clúster requieren énfasis en estructuración básica del negocio y acceso a mercados, mientras que los del segundo pueden enfocarse en escalamiento y digitalización.
📊 Tipo de gráfico: Grafo de red bipartito (network graph). Los nodos representan dos tipos de entidades: categorías de negocio y diagnósticos. Los enlaces entre ellos tienen un grosor proporcional al número de participantes que comparten esa combinación. El algoritmo de posicionamiento Fruchterman-Reingold distribuye los nodos de forma que los más conectados quedan más cercanos. Se usa para visualizar simultáneamente las relaciones entre sector productivo y madurez empresarial, revelando patrones que las tablas no muestran fácilmente.
✅ Conclusión: La red muestra que el nodo Activo Con Potencial tiene los enlaces más gruesos, con fuerte conexión hacia Comercio y ventas al por menor, Manufactura de alimentos y Cultura y educación. El nodo Activo Sin Potencial se conecta principalmente con sectores de alta competencia y baja diferenciación. Las categorías de Idea tienen conexiones más uniformes y delgadas, indicando distribución más homogénea entre sectores. La posición central del nodo Activo Con Potencial en el grafo refleja su mayor volumen y diversidad sectorial.
📊 Tipo de gráfico: Gráfico de barras apiladas con facetas. Permite comparar tres variables simultáneamente: zona (urbano/rural), tipo de emprendimiento y diagnóstico. Se usa para identificar si hay interacciones entre el contexto territorial y el tipo de emprendimiento sobre la madurez empresarial.
✅ Conclusión: En ambos tipos de emprendimiento, la zona urbana concentra mayor proporción de Activo Con Potencial, lo que refleja el mayor acceso a mercados, redes y clientes en el entorno urbano. Los emprendimientos por Oportunidad muestran diagnósticos consistentemente mejores que los de Subsistencia, independientemente de la zona. Los emprendedores rurales por Subsistencia presentan la concentración más alta de Activo Sin Potencial e Idea Conceptual, lo que sugiere la necesidad de estrategias de acompañamiento con mayor énfasis en validación de mercado y acceso a canales de distribución.
📊 Tipo de gráfico: Gráfico de barras agrupadas con valores promedio. Permite comparar el desempeño económico entre categorías de negocio y diagnósticos simultáneamente. Se usa para identificar qué sectores generan mayores ingresos y cómo se diferencia este desempeño entre los diagnósticos de los emprendimientos activos.
✅ Conclusión: Los Activo Con Potencial superan en ventas a los Sin Potencial en todas las categorías. Cultura y educación, Servicios profesionales y Tecnología y software presentan las ventas promedio más altas entre los Con Potencial, lo que refleja la mayor capacidad de diferenciación y cobro de valor en sectores de conocimiento. Manufactura textil y Comercio al por menor muestran ventas más bajas incluso en el grupo de mayor potencial, lo que indica que estos sectores enfrentan mayor presión competitiva y márgenes más ajustados. Esto tiene implicaciones directas para el contenido de la ruta de fortalecimiento: los sectores de manufactura necesitan énfasis en diferenciación y canales alternativos de venta.
¿Qué variables sociodemográficas y del perfil del emprendimiento permiten predecir el Diagnóstico de Madurez Empresarial de un participante del programa de emprendimiento?
| Variable | Asociación con el diagnóstico | Ruta sugerida |
|---|---|---|
| Ventas mensuales promedio | Muy alta (+) – más ventas → Activo Con Potencial | Fortalecimiento |
| Tiempo en el mercado (meses) | Muy alta (+) – más tiempo → mayor madurez | Fortalecimiento |
| Estado del emprendimiento (Activo/Idea) | Determinante – define la rama Activo vs. Idea | Fortalecimiento / Ideación |
| ¿Realizó validaciones en el mercado? | Alta (+) – validaciones → Idea en Experimentación o Activo | Ideación avanzada |
| Registro Cámara de Comercio / RUT | Alta (+) – formalización → mayor potencial | Fortalecimiento |
| ¿Tiene trabajo formal actualmente? | Moderada (−) – trabajo formal reduce tiempo para emprender | Ideación (si trabaja formalmente) |
| Manejo de TIC | Moderada (+) – TIC favorece diagnósticos positivos | Ambas rutas |
| Nivel de escolaridad | Moderada (+) – Técnico en adelante → mejores diagnósticos | Ambas rutas |
| Zona (Urbano / Rural) | Moderada (+) – zona urbana favorece madurez | Ajuste por contexto territorial |
| Tipo de emprendimiento (Oportunidad/Subsistencia) | Moderada (+) – Oportunidad > Subsistencia en madurez | Fortalecimiento prioritario |
| Edad | Leve (−) – emprendedores más jóvenes → mejor diagnóstico | Ambas rutas |
| Tipo de población (Cotizante/Cesante/Beneficiario) | Leve – Cesantes concentran más ideas sin madurar | Ideación básica (Cesante sin historial) |
Las ventas mensuales y el tiempo en el mercado son los indicadores más diferenciadores entre diagnósticos de madurez. Un emprendimiento con ventas superiores a $1.500.000 COP y más de 12 meses activo tiene alta probabilidad de clasificarse como Activo Con Potencial.
Las validaciones de mercado son el criterio clave para distinguir una Idea en Experimentación de una Idea Conceptual. Este dato debería recogerse en la primera sesión de diagnóstico como criterio de derivación inmediata.
Tener trabajo formal actualmente reduce la probabilidad de un diagnóstico favorable. Los participantes Cotizantes requieren estrategias de acompañamiento que respeten su disponibilidad de tiempo, posiblemente con sesiones más cortas y herramientas digitales asíncronas.
El registro ante Cámara de Comercio/RUT es el proxy de formalización más fuerte del dataset: prácticamente todos los registrados se clasifican como Activo Con Potencial, lo que lo convierte en un indicador de diagnóstico de alta fiabilidad.
La zona urbana favorece consistentemente diagnósticos más positivos, lo que sugiere que los participantes rurales requieren estrategias adicionales de acceso a mercados y canales de distribución dentro de la ruta de fortalecimiento.
Recomendación operativa: Implementar un formulario de diagnóstico inicial que recoja las variables identificadas como más relevantes (estado del emprendimiento, ventas, tiempo en mercado, validaciones, registro, trabajo formal, TIC) permitirá al orientador derivar al participante a la ruta correcta —Ruta Ideación o Ruta Fortalecimiento— desde la primera sesión, con contenidos ajustados a su perfil específico.
Trabajo Final – Métodos Cuantitativos para el Análisis de la Información Universidad del Valle – Maestría en Analítica e Inteligencia de Negocios