1 Introducción

Antes de empezar de lleno con el análisis estadístico, es preciso conocer algunos de los conceptos básicos sobre metodologías cuantitativas para investigación en el área de la salud y de estadística, así como los tipos de variables y escalas de medición de las mismas.

2 Objetivos

  • Comprender los conceptos básicos en estadística.

  • Comprender los pasos básicos de un proceso de investigación.

  • Identificar las fortalezas y limitaciones de algunos diseños de estudios para abordar una pregunta de investigación en el área de la salud.

3 Resultados previstos de aprendizaje

Al finalizar este módulo, el estudiante comprenderá el concepto de estadística, su conexión con los diferentes tipos de investigación.

4 ¿Qué es estadística?

Según la RAE, la estadística es:

- “Estudio de los datos cuantitativos de la población, de los recursos naturales e industriales, del tráfico o de cualquier otra manifestación de las sociedades humanas.”

- “Rama de la matemática que utiliza grandes conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades.”

En las últimas décadas la estadística ha alcanzado un alto grado de desarrollo, hasta el punto de involucrarse en la mayoría de las áreas del conocimiento.

  • La estadística es la ciencia que se ocupa de los métodos y las técnicas para recoger, clasificar, resumir y analizar conjuntos de datos; así como de realizar inferencias a partir de ellos, con la finalidad de tomar decisiones racionales en situaciones que impliquen incertidumbre.

  • La estadística es una ciencia de apoyo para todas las ramas del saber, y su utilidad es evidente teniendo en cuenta que la mayoría de los quehaceres y las decisiones en cualquier disciplina involucran grados de incertidumbre o incerteza.

¿En qué momentos han escuchado hablar de estadística?

4.1 Definiciones básicas en estadística

Población: Conjunto de individuos o elementos que tienen características en común. Ej:

-Estudiantes activos del curso de Bioestadística.

-Mujeres mayores de 30 años que viven en Bogotá.

-Pacientes con infección activa por SARS-CoV2 en el mes de agosto.

Muestra: Es un subconjunto de la población.

Individuos o elementos: Son aquellos que conforman la población

La mayoría de las veces trabajamos con los datos de una muestra, ante la imposibilidad de tener la medición de todos los individuos de la población (censo).

4.2 Tipos de estadística

Hay dos tipos de métodos estadísticos: descriptivos e inferenciales. Estas dos ramas no son independientes; por el contrario, son complementarias, y juntas proporcionan suficiente información sobre la realidad, para que quien tenga poder de decisión pueda tomar las mejores decisiones, con el mayor grado de certeza posible.

4.2.1 Estadística descriptiva

  • Es aquella cuyo objetivo es caracterizar un grupo de datos (población o muestra).

  • Las conclusiones aplican únicamente para los elementos estudiados.

4.2.2 Estadística inferencial

Apoyándose en el cálculo de probabilidades:

  • Es aquella que permite sacar conclusiones para una población, a partir una muestra de ella.

  • La inferencia estadística se puede hacer de dos formas: vía estimación (puntual, intervalo) o por medio de pruebas de hipótesis.

5 Proceso de investigación

  1. Identificación de un vacío en el conocimiento (Justificación: es relevante, ¿cuál es su propósito -para qué-?).

  2. Planteamiento de una pregunta de investigación.

  3. Planteamiento de objetivos (¿Qué?) e hipótesis de investigación.

  4. Planteamiento de la metodología: ¿Cómo resolver la pregunta de investigación?

  5. Conducción del estudio.

  6. Análisis de datos.

  7. Resultados.

  8. Discusión y conclusiones: En éstas debe estar resuelta la pregunta de investigación y por lo tanto los objetivos de la misma.

5.1 Tipos de investigación

En Bioestadística podemos pensar en dos tipos de estudios: descriptivos y analíticos.

5.1.1 Estudios descriptivos

Consisten en estudios que pretenden explicar el comportamiento de una población o un fenómeno. Sus conclusiones se pueden aplicar únicamente sobre la población estudiada. Éstos a su vez pueden ser transversales o longitudinales y en general, su objetivo es determinar la frecuencia de una condición de salud.

Ej: ¿Cuál es la prevalencia de ansiedad en la población de los estudiantes de bioestadística?

¿Cuál es la incidencia de enfermedades respiratorias en los estudiantes de la Facultad de Medicina durante el mes de febrero de 2024?

5.1.2 Estudios analíticos

Los estudios analíticos son aquellos que pretenden determinar si existe una relación entre un factor o exposición y un desenlace. Generalmente se realizan con una muestra de la población, a la cual se quiere extrapolar dichos resultados. Entre este tipo de estudios se encuentran, en orden de rigurosidad:

5.1.2.1 Estudios transversales

\label{fig:tabla_snow}*Estudio transversal.* \newline{}Fuente: Kleinbaum et al., 2013.

Estudio transversal. Fuente: Kleinbaum et al., 2013.

5.1.2.1.1 Fortalezas
  • Es posible obtener muestras representativas.

  • Son estudios económicos (tiempo y dinero).

  • Son más apropiados para estudiar enfermedades crónicas, de alta frecuencia o cuándo se requiera la planeación de servicios de salud.

  • Sugieren relaciones etiológicas.

  • Se pueden estudiar simultáneamente varios factores de exposición.

5.1.2.1.2 Debilidades
  • No permite determinar la temporalidad entre exposición y desenlace.

  • No es posible plantear sistemas de hipótesis.

  • No permiten establecer asociación o causalidad.

  • Al ser algunos casos, no es posible hacer inferencia.

  • No es útil para estudiar enfermedades agudas o altamente letales (de corta duración): muestreo con sesgo de duración de la enfermedad.

    • Ejemplo (Modificado de Kleinbaum et al, 2013, pág. 52):

      • Se quiere determinar si existe relación entre realizar actividad física intensa por 30 minutos, 3 veces a la semana y enfermedad coronaria.

      • Quienes hacen actividad física sobreviven por mucho más tiempo que quienes no.

      • A la hora de seleccionar una muestra para un estudio transversal, no estarán bien representados quienes fallecen y por lo tanto, se podría concluir erróneamente que hacer actividad física incrementa la prevalencia de enfermedad coronaria.

5.1.2.2 Estudios de casos y controles

\label{fig:tabla_snow}*Estudio de casos y controles.* \newline{}Fuente: Kleinbaum et al., 2013.

Estudio de casos y controles. Fuente: Kleinbaum et al., 2013.

5.1.2.2.1 Fortalezas
  • Suelen ser estudios más económicos que uno longitudinal, a menos que se tome la decisión de trabajar con casos incidentes.

  • Son prácticos para:

    • Estudiar enfermedades con periodos de latencia largos, de baja frecuencia o enfermedades crónicas.

    • Estudios en dónde se tiene una hipótesis a priori (como los relacionados con brotes epidémicos).

    • Estudios exploratorios en los que no se tiene una hipótesis a priori (en relación con la exposición).

  • Es posible evaluar la asociación diferentes exposiciones y el desenlace.

5.1.2.2.2 Debilidades
  • Sesgos de información:

    • Son muy sensibles a la calidad de la información relacionada con las exposiciones.

    • Mala clasificación tanto en el desenlace como en la exposición.

    • Sesgo de memoria para determinar la exposición.

  • No es posible calcular riesgos.

  • Susceptibles a sesgos de selección: Cuando la selección de los participantes está relacionada con la exposición.

    • Ejemplo:

      • Supongamos que se diseña un estudio de casos y controles cuyo objetivo es determinar si existe asociación entre el bajo peso al nacer y la aparición de diabetes tipo 2 en la edad adulta.

      • Se seleccionan los casos atendidos en por una EPS del régimen subsidiado, ¿por qué está selección estaría relacionada con el bajo peso al nacer?.

  • Solo permiten evaluar un desenlace.

5.1.2.3 Estudios de cohorte

\label{fig:tabla_snow}*Estudio de cohorte.* \newline{}Fuente: Kleinbaum et al., 2013.

Estudio de cohorte. Fuente: Kleinbaum et al., 2013.

5.1.2.3.1 Fortalezas
  • Dado que su direccionalidad es “hacia adelante”, por lo que estos estudios son de mayor calidad a la hora de determinar causalidad (temporalidad claramente definida).

  • Es posible calcular riesgos y tasas de incidencia.

  • Como al inicio del estudio todos participantes son sanos en términos de la condición a estudiar, no se presentan sesgos de selección en los que la enfermedad influya en el método de selección.

  • Los estudios de cohorte prospectivos suelen tener menos sesgos de información en comparación con los demás estudios observacionales.

  • Son prácticos para estudiar exposiciones poco frecuentes (al seleccionar los individuos en función de la exposición, se garantiza un tamaño de muestra suficiente).

  • En caso de contar con buenos registros (hospitalarios, laborales, demográficos), se podría plantear un estudio de cohorte retrospectivo, que podría resultar mucho más económico que uno prospectivo.

  • Es posible estudiar el efecto de una exposición en diferentes desenlaces.

  • Permiten analizar el tiempo hasta la ocurrencia de un evento (supervivencia)

  • Es posible evaluar factores pronóstico (curso clínico o historia natural de la enfermedad, esta última únicamente en el caso en el que no haya tratamiento o el paciente no lo acepta) y factores de riesgo.

5.2 Debilidades

  • Los estudios prospectivos suelen ser costosos en términos de dinero y tiempo.

  • Pueden presentarse pérdidas en el seguimiento, que podrían sesgar el resultado del estudio (“sesgo de selección”): directamente proporcionales a la duración del periodo de seguimiento.

  • No es recomendable para el estudio de desenlaces poco frecuentes pues se necesitaría un periodo de seguimiento largo y un tamaño de muestra grande.

  • Sesgo de información: Podría indagarse con mayor intensidad el desenlace en el grupo de expuestos que en el de no expuestos.

    • ¿Cómo afectaría a la evaluación de la asociación?.

    • ¿Cómo podría controlarse?.

5.2.0.1 Experimentos clínicos

\label{fig:tabla_snow}*Experimento clínico.*

Experimento clínico.

5.2.0.1.1 Fortalezas
  • Son los estudios de mayor calidad a la hora de pensar en causalidad.

  • La aleatorización controla en gran medida los sesgos de confusión.

  • Como son diseños con mucha rigurosidad, es posible controlar en gran medida sesgos de información y de selección (en caso de estar bien diseñados).

5.2.0.1.2 Debilidades
  • Son estudios muy costosos.

  • En algunos casos, solo es posible determinar una población de estudio muy limitada y por lo tanto no es posible generalizar hacia otra población.

Para reflexionar: ¿Cuál sería el mejor diseño para contestar la pregunta: ¿cuáles son los factores de riesgo para la complicación por COVID-19?

6 Bibliografía

Barón F.J. Bioestadística. Universidad de Málaga. Disponible en: http://www.bioestadistica.uma.es/baron/bioestadistica.pdf

Kleinbaum, D., Calles, D., y Sullivan, K.(2013). ActivEpi Español. Disponible en: https://web1.sph.emory.edu/activepi/ActivEpi-Espanol-Libro-Acompanamiento.pdf

Soto O, Franco D. Fundamentos conceptuales de estadística. Universidad Nacional de Colombia. Notas de clase.