Propuesta de Proyecto Productivo: MontelibanoGen

Logo SENA

MontelibanoGen

Eduardo Andrés Martínez Martínez
22 de diciembre de 2025

Identificación del Proyecto

Nombre del proyecto: MontelibanoGen – Plataforma de Biología Molecular y Medicina de Precisión

Aprendiz responsable: Eduardo Andrés Martínez Martínez

Programa de formación: Tecnólogo en Análisis y Desarrollo de Software

Ficha: 2846574

Centro de formación: Centro de Agropecuario y de biotecnología, El Porvenir – Regional Córdoba

Fecha de presentación: 22 de diciembre de 2025

Planteamiento del Problema

En la región de Córdoba, especialmente en instituciones como la IPS San Jorge de Montelíbano, existe una brecha significativa entre los sistemas clínicos tradicionales (como Odin) y las herramientas avanzadas de análisis genómico necesarias para la medicina de precisión.

La falta de plataformas locales que integren datos moleculares con registros clínicos limita el acceso a diagnósticos personalizados, terapias dirigidas y análisis predictivos, afectando la calidad de la atención en salud y la investigación regional.

Justificación

El proyecto MontelibanoGen es relevante porque:

  • Contribuye al desarrollo de soluciones tecnológicas en salud digital para regiones apartadas de Colombia.

  • Fomenta la medicina de precisión en entornos clínicos reales (integración con IPS San Jorge).

  • Cumple con la normativa colombiana de protección de datos (Habeas Data) mediante anonimización robusta.

  • Genera impacto social al facilitar diagnósticos tempranos y tratamientos más efectivos en oncología, enfermedades genéticas y farmacogenómica.

  • Aplica competencias adquiridas en el SENA en desarrollo de software, bioinformática y gestión de proyectos.

Objetivos

Objetivo General

Desarrollar una plataforma web interoperable llamada MontelibanoGen para el análisis genómico y la visualización de datos moleculares, que opere en paralelo con sistemas clínicos existentes en Córdoba, Colombia.

Objetivos Específicos

  • Diseñar una arquitectura modular y escalable basada en microservicios.
  • Implementar integraciones con herramientas bioinformáticas (PyMOL, NAMD, DNAdynamo, TinkerCell) y sistemas clínicos locales.
  • Garantizar la seguridad y anonimización de datos según la Ley de Habeas Data.
  • Desarrollar visualizaciones interactivas de análisis genómico (volcano plot, heatmap, etc.).
  • Validar la viabilidad técnica y económica del proyecto.

Arquitectura técnica

La plataforma adopta un diseño modular basado en microservicios para garantizar escalabilidad y mantenibilidad.

Integración Interoperable

MontelibanoGen se integra con:

  • Sistemas clínicos locales (software de IPS San Jorge y Odin) mediante APIs RESTful y estándares HL7/FHIR.
  • Herramientas bioinformáticas: PyMOL, NAMD, DNAdynamo y TinkerCell para simulación y visualización molecular.
  • Bases de datos genómicas públicas (NCBI, Ensembl, INSignia) para anotación automática.

Seguridad y Protección de Datos

Se implementa un esquema de seguridad compliant con la Ley 1581 de 2012 (Habeas Data):

  • Anonimización irreversible mediante hashing salado y privacidad diferencial.
  • Capa middleware de desidentificación automática.
  • Registros inmutables de acceso y consentimiento informado.

Demostración de Visualizaciones Interactivas

Ejemplos de análisis genómico generados con la plataforma (datos simulados):

Gráfico de barras para comparación eficacia

Gráficos de Análisis Genómico

Gráfico de distribución de variantes genómicas

Es una representación visual que muestra cómo se distribuyen las variaciones genéticas (como polimorfismos de un solo nucleótido -SNPs-, inserciones/deleciones -indels-, variaciones en el número de copias -CNVs- o mutaciones estructurales) a lo largo del genoma humano o en una población específica. Típicamente, se presenta como un histograma, gráfico de barras, diagrama circular o un Manhattan plot (para distribución cromosómica), donde el eje X representa categorías como tipos de variantes, cromosomas o frecuencias alélicas, y el eje Y indica la frecuencia o conteo. Este gráfico resalta patrones, como variantes raras vs. comunes, y puede incluir anotaciones para impacto funcional (e.g., sinónimas, no sinónimas, patogénicas).

Aplicación en la práctica médica: En medicina de precisión, este gráfico es esencial para analizar datos de secuenciación (e.g., NGS o WGS) en pacientes con enfermedades genéticas, como cáncer o trastornos hereditarios. Permite identificar variantes asociadas a riesgos (e.g., BRCA1 en cáncer de mama), estratificar pacientes para terapias dirigidas (e.g., inhibidores de PARP), evaluar diversidad poblacional en regiones como Córdoba, Colombia, y apoyar decisiones clínicas, como screening genético o farmacogenómica, mejorando diagnósticos tempranos y reduciendo tratamientos ineficaces.

Gráfico vulcano para expresión diferencial

Este gráfico muestra el cambio en la expresión génica (eje X: log2 fold change) versus la significancia estadística (eje Y: -log10 p-valor ajustado). Los puntos rojos/azules destacan genes sobre/sub-expresados significativamente.

Aplicación médica: Identifica biomarcadores para diagnósticos (ej. genes oncogénicos en cáncer) o respuesta a tratamientos, permitiendo seleccionar terapias personalizadas en oncología o enfermedades raras.

Gráfico MA para genes diferencialmente expresados

Representa la diferencia en expresión (eje Y: M = log ratio) contra la media de expresión (eje X: A = log average), destacando sesgos por nivel de expresión.

Aplicación médica: Detecta genes diferencialmente expresados en comparaciones control vs. paciente, útil para validar datos RNA-seq en estudios de farmacogenómica y ajustar tratamientos según perfiles genéticos.

Gráfico Heatmap de Genes Top (simulado)

Mapa de calor que muestra niveles de expresión de los genes más significativos en muestras (filas: genes, columnas: muestras/pacientes), con colores indicando alta/baja expresión.

Aplicación médica: Clasifica subtipos de enfermedades (ej. subtipos de cáncer de mama) y predice pronóstico o respuesta a quimioterapia, apoyando decisiones clínicas personalizadas.

Gráfico Dot de Enriquecimiento de Vías

Muestra vías biológicas enriquecidas (eje Y), proporción de genes involucrados (eje X), tamaño del punto por conteo y color por significancia.

Aplicación médica: Revela mecanismos patológicos alterados (ej. vías inflamatorias en enfermedades autoinmunes), guiando la selección de fármacos dirigidos (targeted therapies) en medicina de precisión.

Gráfico Violin de Expresión por Grupo

Muestra la distribución de niveles de expresión génica entre grupos (control vs. tratamiento/paciente), combinando densidad y boxplot.

Aplicación médica: Compara variabilidad en expresión entre pacientes sanos y enfermos, identificando heterogeneidad en respuestas terapéuticas y apoyando estratificación de pacientes para ensayos clínicos.

Gráfico Ramachandran

El diagrama de Ramachandran es una herramienta clave en biología estructural para validar modelos de proteínas. Las regiones densas corresponden a estructuras secundarias comunes:

Azul: Hélice alfa (α-helix).

Naranja: Lámina beta (β-sheet).

Puntos fuera de regiones favorecidas indican posibles errores en el modelo.

Proyecciones Económicas

Estimacion de Costos - Proyecto MontelibanoGen
Item Horas Estimadas Costo USD Costo COP
Analisis y diseno 480 US$ 35.000 $ 150.500.000
Desarrollo MVP 1.280 US$ 90.000 $ 387.000.000
Integraciones y cumplimiento 640 US$ 50.000 $ 215.000.000
Infraestructura cloud (1 ano)
US$ 12.000 $ 51.600.000
Licencias y herramientas
US$ 8.000 $ 34.400.000
Capacitacion y documentacion 160 US$ 10.000 $ 43.000.000
Contingencias (10%)
US$ 20.500 $ 88.150.000
Total Estimado 2.560 US$ 225.500 $ 969.650.000

Conclusión

MontelibanoGen representa un proyecto productivo de alto impacto tecnológico y social, alineado con las competencias del SENA y las necesidades de salud digital en Colombia. Su implementación permitirá avanzar hacia una medicina de precisión accesible en regiones como Córdoba, mejorando la calidad de vida de la población y posicionando al aprendiz como desarrollador de soluciones innovadoras en biotecnología y software.