La saturación en investigación cualitativa: de criterio analítico a ficción metodológica y sus implicaciones en salud pública

Author

Ilich H. De La Hoz Siegler, MD. MPH. MPP. FMS. HM

Introducción

La saturación constituye uno de los conceptos más recurrentes en la investigación cualitativa contemporánea, especialmente como criterio para justificar el cierre del trabajo de campo. Sin embargo, su uso extendido no ha sido acompañado por una problematización equivalente de sus supuestos ni de sus implicaciones metodológicas y epistemológicas. En la práctica, la saturación se ha transformado en un recurso declarativo que permite clausurar el análisis sin haber alcanzado necesariamente una comprensión suficiente del fenómeno.

Este desplazamiento no es menor. En campos como la salud pública, donde la investigación cualitativa informa diagnósticos, intervenciones y políticas, la simplificación analítica tiene consecuencias directas en la eficacia de la acción pública. Afirmar que se ha alcanzado saturación implica sostener que el fenómeno ha sido comprendido en un grado suficiente. Cuando esta afirmación se sostiene sobre bases débiles, lo que se produce es evidencia engañosamente suficiente.

En este documento sostengo que la saturación, tal como se aplica actualmente en muchos estudios, funciona con frecuencia como una ficción metodológica que legitima cierres prematuros del análisis. Al mismo tiempo, reconozco la diversidad de enfoques cualitativos existentes: no todos comparten los mismos supuestos ontológicos ni exigen el mismo nivel de exhaustividad. Frente a ello, el concepto de poder de la información ofrece un complemento más riguroso y pragmático, orientado a evaluar la capacidad explicativa del análisis sin pretender un cierre absoluto.

Al final del documento he puesto un anexo metodológico que aterriza como aplicar los conceptos discutidos de forma clara y precisa, el código en R ha quedado para fácil lectura y reuso.

Marco conceptual: saturación, significado y poder de la información

La saturación fue concebida originalmente como el punto en el que nuevos datos dejan de aportar propiedades teóricas adicionales a las categorías analíticas (Glaser y Strauss, 1967). Esta definición enfatiza un proceso de densificación conceptual, no de simple repetición empírica.

Posteriormente, la literatura ha diferenciado entre saturación de código y saturación de significado (Hennink et al., 2017). La primera consiste en la aparición recurrente de temas; la segunda implica comprender cómo esos temas varían, qué los explica y en qué condiciones se manifiesta de manera diferenciada. Esta distinción es crucial porque evidencia que la recurrencia de un tema no equivale a su comprensión analítica.

El concepto de poder de la información (Malterud et al., 2016) introduce un giro adicional al desplazar el criterio de suficiencia desde la cantidad de datos hacia su capacidad explicativa. La pregunta deja de ser cuántas entrevistas son necesarias para convertirse en qué tan informativos son los datos para sostener interpretaciones robustas.

Esta perspectiva resulta especialmente relevante frente a los límites epistemológicos de la saturación. En enfoques interpretativos, el significado no se concibe como finito ni agotable: es relacional, situado y dinámico. No obstante, en enfoques máspragmáticos y orientados a la acción, frecuentes en salud pública, el cierre analítico se entiende como una decisión práctica de suficiencia, no como una afirmación de completitud ontológica. El poder de la información actúa como un complemento que enriquece ambos enfoques.

La saturación como práctica problemática

En la práctica empírica, la saturación ha sido reducida a la fórmula “no emergieron nuevos temas”. Este uso simplificado transforma un concepto analítico en un procedimiento técnico mínimo. La saturación se declara sin que se evidencie cómo evolucionaron las categorías, cómo se exploró su variación o en qué momento alcanzaron densidad conceptual. Esta reducción es particularmente visible en salud pública. En estudios sobre vacunación, la “desconfianza” emerge rápidamente como tema central y, tras algunas repeticiones, se considera saturada. Sin embargo, análisis más profundos muestran que esta categoría encierra múltiples dimensiones: institucional, biomédica, relacional y cultural, que no pueden ser captadas mediante una lógica de repetición simple. La saturación de código produce etiquetas; la saturación de significado produce explicaciones.

Un fenómeno similar ocurre en estudios sobre adherencia a tratamientos, donde categorías como “olvido” aparecen recurrentemente. En análisis superficiales, esta repetición es interpretada como evidencia de saturación. Sin embargo, cuando el análisis se profundiza, el “olvido” se revela como un fenómeno complejo vinculado a condiciones laborales, estrategias frente al estigma o efectos secundarios. Sin esta diferenciación, el análisis permanece en un nivel descriptivo que no permite comprender el fenómeno.

Validación de la saturación: operacionalización y límites

Ante las críticas al uso declarativo de la saturación, se han desarrollado enfoques más sistemáticos para su evaluación, especialmente mediante el seguimiento de la aparición de nuevos códigos(Guest et al., 2006; Namey et al., 2016). Estos modelos buscan introducir transparencia al proceso mediante el monitoreo de la “tasa de novedad” en cada entrevista.

En términos operativos, esto implica codificar entrevistas de manera secuencial y registrar cuántos códigos nuevos emergen en cada una. Por ejemplo, en un estudio sobre resistencia a la vacunación, podría observarse una progresión como la siguiente :

Entrevista	Nuevos códigos	Total acumulado
E1	10	10
E2	7	17
E3	5	22
E4	3	25
E5	2	27
E6	1	28
E7	1	29
E8	0	29

Desde un punto de vista técnico, podría argumentarse que la saturación se alcanza hacia la entrevista 6 o 7, donde la proporción de códigos nuevos cae por debajo de umbrales como el 5%. Sin embargo, esta interpretación es limitada. El modelo mide la aparición de nuevos códigos, pero no captura la evolución del significado. Si una categoría como “desconfianza” aparece desde las primeras entrevistas, el modelo registrará su repetición como ausencia de novedad. No obstante, en entrevistas posteriores pueden emerger formas diferenciadas de esa misma categoría: desconfianza hacia el Estado, hacia los profesionales o de carácter cultural.

Límites epistemológicos: la ficción del cierre

El problema de fondo es que la saturación, cuando se interpreta como cierre definitivo, presupone que el conocimiento puede agotarse. En enfoques interpretativos más radicales, esta premisa es insostenible. Los significados no son entidades fijas que puedan ser completamente capturadas: son procesos en constante reconfiguración. No obstante, en muchos diseños cualitativos aplicados, el cierre representa una decisión pragmática legítima orientada a la suficiencia para la intervención.

Declarar saturación implica transformar una decisión pragmática en una afirmación epistemológica de completitud. Esta ficción resulta particularmente problemática en salud pública, donde los fenómenos están atravesados por complejidad social y cultural. El poder de la información ayuda a mitigar este riesgo al centrar la evaluación en la densidad explicativa más que en el agotamiento.

Implicaciones para políticas públicas

Las consecuencias de esta problemática son especialmente relevantes en el ámbito de la política sanitaria. La simplificación analítica derivada de la saturación superficial produce diagnósticos igualmente simplificados, que tienden a traducirse en intervenciones genéricas.

En el caso de la vacunación, la identificación de la “desconfianza” conduce frecuentemente a campañas de información. Sin embargo, si no se diferencian sus formas, estas campañas difícilmente afectan los mecanismos que producen la resistencia. De manera similar, en la adherencia a tratamientos, la reducción del problema al “olvido” conduce a intervenciones individualizantes que ignoran condiciones estructurales.

En salud mental, la identificación del estigma como barrera ha dado lugar a políticas centradas en la sensibilización. No obstante, cuando el estigma es institucional, por ejemplo en la interacción con servicios de salud, estas intervenciones resultan insuficientes. La falta de diferenciación analítica limita la capacidad de intervención.

Poder de la información: hacia una alternativa analítica

El concepto de poder de la información propone una forma distinta y complementaria de abordar la suficiencia del conocimiento. En lugar de buscar el agotamiento del fenómeno, se orienta a evaluar si los datos disponibles permiten sostener interpretaciones densas y contextualmente relevantes.

Esto implica considerar la calidad de las entrevistas, la diversidad de la muestra, la claridad del objetivo y la profundidad del análisis. Pero, sobre todo, implica reconocer que el conocimiento producido es siempre parcial. En salud pública, este enfoque permite producir evidencia que, sin pretender exhaustividad, es capaz de identificar mecanismos, diferencias y condiciones contextuales relevantes para la intervención. La diferencia no es de cantidad de datos, sino de capacidad explicativa.

Aplicación del poder de la información en salud pública

A diferencia de la saturación tradicional, que suele centrarse en la ausencia de nuevos códigos o temas, el poder de la información (Malterud et al., 2016) evalúa la suficiencia de la muestra según cinco dimensiones clave que resultan especialmente útiles en el ámbito sanitario:

Objetivo del estudio (específico versus amplio)
Cuando el objetivo es acotado y preciso (por ejemplo, comprender las barreras para la adherencia a un tratamiento antirretroviral en un grupo etario concreto), se requiere un menor número de participantes, ya que cada caso aporta alta densidad informativa. Por el contrario, objetivos más amplios demandan mayor diversidad y volumen de datos.
Especificidad de la muestra
En salud pública es frecuente trabajar con muestras relativamente homogéneas (pacientes con una misma enfermedad, profesionales de un mismo servicio). Esta homogeneidad aumenta el poder de la información y permite alcanzar suficiencia con muestras más pequeñas. Las muestras heterogéneas (diferentes niveles socioeconómicos, culturas o trayectorias de enfermedad) reducen el poder de cada caso y suelen necesitar un tamaño muestral mayor.
Uso de teoría
Incorporar marcos teóricos sólidos (teoría del comportamiento planificado, modelos de creencias en salud, enfoques de estigma estructural, entre otros) guía el muestreo y el análisis, aumentando significativamente el poder interpretativo de los datos.
Calidad del diálogo
Las entrevistas o grupos focales profundos, que favorecen la narración personal y la exploración detallada, generan mayor información por participante. En salud pública, esto implica capacitar a los entrevistadores para explorar no solo qué piensan o hacen las personas, sino por qué, en qué condiciones y con qué consecuencias, estableciendo una buena relación de confianza.
Estrategia de análisis
Un análisis intensivo, iterativo y orientado a mecanismos (más que meramente descriptivo) maximiza el poder de la información. En este punto cobra especial relevancia la distinción entre saturación de código y saturación de significado.

Ejemplos prácticos de aplicación en salud

Vacunación: En lugar de detener la recolección al aparecer repetidamente la categoría “desconfianza”, se evalúa si se han explorado suficientemente sus distintas dimensiones (institucional, cultural, experiencial, mediática) y las condiciones que las activan. Si los datos permiten explicar por qué algunos padres rechazan ciertas vacunas pero aceptan otras, el poder de la información es alto aunque no se hayan realizado 30 entrevistas.

Adherencia a tratamientos crónicos: Se valora si los datos permiten distinguir entre olvido situacional, olvido estructural (por jornadas laborales extenuantes), olvido intencional (miedo a efectos secundarios) y olvido estigmatizante. Cuando el análisis logra mapear estas variaciones y sus implicaciones prácticas, se considera que se ha alcanzado un poder de la información suficiente.

Salud mental y estigma: En vez de concluir prematuramente que “existe estigma”, se indaga si se han identificado sus diferentes niveles (auto-estigma, estigma familiar, estigma institucional y estigma estructural) y sus efectos concretos sobre la búsqueda de ayuda. Esto permite diseñar intervenciones más precisas y efectivas.

Criterios operativos recomendados

En la práctica, los investigadores en salud pública pueden combinar ambos enfoques: utilizar el monitoreo de saturación de códigos como señal de alerta temprana y, simultáneamente, evaluar el poder de la información mediante una matriz que valore las cinco dimensiones propuestas por Malterud. El cierre del trabajo de campo se justifica cuando se logra una combinación aceptable de estabilidad empírica (saturación de código) y densidad interpretativa (alto poder de la información).

Esta aproximación híbrida evita tanto los cierres prematuros como la recolección indefinida de datos, ofreciendo un equilibrio pragmático especialmente adecuado para la investigación aplicada en salud.

Conclusión

La saturación, tal como se utiliza en gran parte de la investigación cualitativa contemporánea, ha sido reducida con frecuencia a un criterio técnico que facilita el cierre del trabajo de campo sin garantizar la profundidad analítica requerida. Esta transformación tiene consecuencias relevantes tanto en la producción de conocimiento como en su aplicación a las políticas públicas.

Frente a este panorama, y reconociendo la pluralidad de enfoques que existen en la investigación cualitativa, el concepto de poder de la información representa un complemento valioso y más exigente. Al centrar la evaluación en la densidad conceptual y en la capacidad explicativa del análisis, permite justificar de manera más sólida que se ha comprendido lo suficiente para intervenir, sin pretender un cierre definitivo ni ocultar la complejidad inherente a los fenómenos sociales.

En contextos aplicados como la salud pública, donde comprender implica necesariamente actuar, esta integración entre saturación y poder de la información no constituye solo una mejora metodológica. Se trata de una cuestión decisiva para mejorar la calidad y la pertinencia de las intervenciones sanitarias.

Referencias

Charmaz, K. (2014). Constructing grounded theory (2nd ed.). Sage.

Denzin, N. K., & Lincoln, Y. S. (2018). The Sage handbook of qualitative research (5th ed.). Sage.

Gadamer, H.-G. (2004). Truth and method (2nd rev.ed.). Continuum. (Trabajo original publicado en 1960 en alemán)

Glaser, B. G., & Strauss, A. L. (1967). The discovery of grounded theory: Strategies for qualitative research. Aldine.

Green, J., & Thorogood, N. (2018). Qualitative methods for health research (4th ed.). Sage.

Guest, G., Bunce, A., & Johnson, L. (2006). How many interviews are enough?An experiment with data saturation and variability. Field Methods, 18(1), 59–82. https://doi.org/10.1177/1525822X05279903

Hennink, M. M., Kaiser, B. N., & Marconi, V. C. (2017). Code saturation versus meaning saturation: How many interviews are enough? Qualitative Health Research, 27(4), 591–608. https://doi.org/10.1177/1049732316665344

Hennink, M. M., Kaiser, B. N., & Weber, M. B. (2019). What influences saturation? Estimating sample sizes in focus group research. Qualitative Health Research, 29(10), 1483–1496. https://doi.org/10.1177/1049732318821692

Lincoln, Y. S., & Guba, E. G. (1985). Naturalistic inquiry. Sage.

Malterud, K., Siersma, V. D., & Guassora, A. D. (2016). Sample size in qualitative interview studies: Guided by information power. Qualitative Health Research, 26(13), 1753–1760. https://doi.org/10.1177/1049732315617444

Maxwell, J. A. (2013). Qualitative research design: An interactive approach (3rd ed.). Sage.

Namey, E., Guest, G., McKenna, K., & Chen, M. (2016). Evaluating bang-for-the-buck: A cost-effectiveness comparison between individual interviews and focus groups based on thematic saturation levels. American Journal of Evaluation, 37(3), 425–440. https://doi.org/10.1177/1098214016630406

Patton, M. Q. (2015). Qualitative research & evaluation methods (4th ed.). Sage.

Pope, C., & Mays, N. (2020). Qualitative research in health care(4th ed.). Wiley-Blackwell.

Ritchie, J., Lewis, J., McNaughton Nicholls, C., & Ormston, R. (2014). Qualitative research practice: A guide for social science students and researchers (2nd ed.). Sage.

Saunders, B., Sim, J., Kingstone, T., Baker, S., Waterfield, J., Bartlam, B., Burroughs, H., & Jinks, C. (2018). Saturation in qualitative research: Exploring its conceptualization and operationalization. Quality & Quantity, 52, 1893–1907. https://doi.org/10.1007/s11135-017-0574-8

Schwandt, T. A. (2014). The Sage dictionary of qualitative inquiry (4th ed.). Sage.

Tracy, S. J. (2010). Qualitative quality: Eight“big-tent” criteria or excellent qualitative research. Qualitative Inquiry, 16(10), 837–851. https://doi.org/10.1177/1077800410383121

Anexo metodológico

Pipeline reproducible para evaluación de saturación y poder de la información en investigación cualitativa.

1. Justificación

Con el objetivo de superar el uso declarativo de la saturación y avanzar hacia una evaluación más transparente del proceso analítico, implementé un pipeline reproducible en R orientado a:

monitorear la acumulación de códigos a lo largo del proceso de recolección de datos
estimar la tasa de aparición de nueva información (saturación de código)
evaluar la evolución de dimensiones internas de significado (saturación de significado)

Este enfoque se inspira en propuestas de seguimiento de saturación (Guest et al., 2006; Namey et al., 2016), pero incorpora una extensión analítica basada en la distinción entre código y significado (Hennink et al., 2017).

2. Estructura del pipeline

El pipeline se organiza en cuatro etapas:

preparación de datos
cálculo de saturación de códigos
estimación de tasa de novedad
evaluación de saturación de significado

3. Implementación en R

3.1 Carga de librería

Aquí está el código R y lo puedes copiar

# Cargar paquetes
installed.packages("tidyverse")
installed.packages("ggplot2")
installed.packages("purrr")
installed.packages("stringr")
library(tidyverse)
library(ggplot2)
library(purrr)
library(stringr)

3.2 Estructura de datos

Se trabaja con un formato largo, donde cada fila corresponde a un código identificado en una entrevista:

Aquí está el código R y lo puedes copiar

datos <- tibble(  entrevista = c(rep("E1",4), rep("E2",3), rep("E3",3),                 rep("E4",3), rep("E5",2), rep("E6",1),                 rep("E7",1), rep("E8",1)),  codigo = c(    "desconfianza","riesgo","efectos","acceso",    "desconfianza","efectos","rapidez",    "desconfianza","redes","informacion_falsa",    "desconfianza","trato_medico","experiencia",    "desconfianza","corrupcion",    "desconfianza institucional",    "desconfianza relacional",    "desconfianza cultural"  )

Este formato es compatible con exportaciones desde software de análisis cualitativo (NVivo, Atlas.ti)

4. Saturación de código

4.1 Lógica analítica

Se evalúa la aparición de códigos nuevos en cada entrevista, acumulando progresivamente el repertorio total.

4.2 Implementación

Aquí está el código R y lo puedes copiar

calcular_saturacion_codigo <- function(df) {
  
  entrevistas <- unique(df$entrevista)
  acumulado <- c()
  
  resultados <- map_dfr(seq_along(entrevistas), function(i) {
    
    e <- entrevistas[i]
    codigos_actuales <- df %>% filter(entrevista == e) %>% pull(codigo)
    
    nuevos <- setdiff(codigos_actuales, acumulado)
    acumulado <<- union(acumulado, codigos_actuales)
    
    tibble(
      entrevista = e,
      orden = i,
      nuevos_codigos = length(nuevos),
      total_acumulado = length(acumulado)
    )
    
  })
  
  resultados %>%
    mutate(
      tasa_novedad = nuevos_codigos / total_acumulado
    )
}

sat_codigo <- calcular_saturacion_codigo(datos)

4.3 Interpretación

La tasa de novedad permite identificar la disminución progresiva de nueva información:

Aquí está el código R y lo puedes copiar

sat_codigo %>%
  mutate(saturacion = tasa_novedad < 0.05)

Un umbral del 5% es común en la literatura, pero debe interpretarse críticamente.

5. Visualización

Aquí está el código R y lo puedes copiar

ggplot(sat_codigo, aes(x = orden, y = total_acumulado)) +
  geom_line(color = "blue") +
  geom_point() +
  labs(title = "Acumulación de códigos")

ggplot(sat_codigo, aes(x = orden, y = tasa_novedad)) +
  geom_line(color = "red") +
  geom_point() +
  geom_hline(yintercept = 0.05, linetype = "dashed") +
  labs(title = "Tasa de novedad")

Estas curvas permiten observar la estabilización empírica del sistema de códigos.

6. Limitación crítica

Este enfoque presenta una limitación clave: mide la aparición de códigos, pero no su transformación conceptual.

Por ejemplo, la categoría “desconfianza” puede aparecer tempranamente y repetirse sin registrar nuevas entradas, aun cuando su significado se diversifique posteriormente.

7. Saturación de significado

7.1 Enfoque analítico

Para capturar la evolución interna de los conceptos, se introduce una capa de análisis basada en la identificación de dimensiones.

7.2 Mapeo conceptual

Aquí está el código R y lo puedes copiar

mapa <- tibble(
  codigo = c("desconfianza",
             "desconfianza institucional",
             "desconfianza relacional",
             "desconfianza cultural"),
  dimension = c("general",
                "institucional",
                "relacional",
                "cultural")
)

7.3 Integración de dimensiones

Aquí está el código R y lo puedes copiar

datos_dim <- datos %>%
  left_join(mapa, by = "codigo") %>%
  mutate(dimension = ifelse(is.na(dimension), codigo, dimension))

7.4 Cálculo acumulativo

Aquí está el código R y lo puedes copiar

calcular_saturacion_significado <- function(df) {
  
  entrevistas <- unique(df$entrevista)
  acumulado <- c()
  
  resultados <- map_dfr(seq_along(entrevistas), function(i) {
    
    e <- entrevistas[i]
    
    dims <- df %>%
      filter(entrevista == e) %>%
      pull(dimension) %>%
      unique()
    
    nuevos <- setdiff(dims, acumulado)
    acumulado <<- union(acumulado, dims)
    
    tibble(
      entrevista = e,
      orden = i,
      nuevas_dim = length(nuevos),
      total_dim = length(acumulado)
    )
  })
  
  resultados
}

sat_significado <- calcular_saturacion_significado(datos_dim)

7.5 Visualización de saturación de significado

Aquí está el código R y lo puedes copiar

ggplot(sat_significado, aes(x = orden, y = total_dim)) +
  geom_line(color = "darkgreen") +
  geom_point() +
  labs(title = "Saturación de significado")

8. Interpretación integrada

El análisis combinado permite observar dos procesos distintos:

la saturación de códigos ocurre tempranamente
la saturación de significado ocurre más tarde

Este resultado reproduce empíricamente la distinción teórica de Hennink et al. (2017), evidenciando que la repetición empírica no implica comprensión.

9. Conexión con el poder de la información

Desde la perspectiva del poder de la información, este pipeline no busca determinar un punto absoluto de saturación, sino apoyar el juicio de suficiencia considerando:
• La estabilidad de los códigos
• La densidad de los significados
• La diversidad de casos y la profundidad del diálogo
• La capacidad explicativa del análisis en relación con los objetivos del estudio.

De esta forma, el criterio de suficiencia se construye de manera analítica e iterativa, combinando evidencia empírica con valoración interpretativa.

10. Síntesis metodológica

Este pipeline permite:
• Documentar de forma transparente el proceso de análisis
• Identificar diferencias entre repetición y comprensión
• Evitar declaraciones prematuras de saturación
• Fortalecer la validez analítica al combinar saturación con poder de la información

En consecuencia, constituye una herramienta útil para desplazar la evaluación metodológica desde la noción de cierre definitivo hacia la de suficiencia pragmática y capacidad explicativa del conocimiento producido.