1 Introducción

  • Una de las formas más sencillas de describir variables es a través de tablas de contingencia.
  • Permiten detectar algunos comportamientos tales como los valores más o menos frecuentes de la variable.
  • En general se puede utilizar para analizar variables en cualquier escala, aunque si el rango de la variable es muy amplio, resulta dispendioso y poco aprovechable.

2 Objetivo

  • Ilustrar la forma adecuada de construir y analizar tablas de contingencia

3 Competencias

En esta sección el estudiante comprenderá:

  • En qué consiste el proceso de construcción y análisis de una tabla de contingencia (frecuencias absolutas, realativas y condicionales).
  • En qué cuáles casos es pertinente el uso de tablas de contingencia.

4 Problema de investigación

Para planear la demanda de los servicios de salud y adicionalmente hacer una detección temprana de la enfermedad, el gerente de una EPS quiere saber cuál es el resultado de la mamografía de las mujeres afiliadas y que tienen más de 50 años.

Pregunta de investigación ¿Cuál es la prevalencia de BIRADS 4,5 y 6 en las mujeres mayores de 50 años, en dicha EPS?

5 Conceptos preliminares

  • Población: Conjunto de unidades de una misma naturaleza.

  • Variable: Característica que varía de una unidad a otra dentro de la poclación.

  • Medición: Valor asignado u observado de la variable(expresión cualitativa o cuantitativa).

5.1 Ejercicio: Problema de investigación

Población: Mujeres mayores de 50 años afiliadas a la EPS

Variable Medición Escala de medición
BIRADS 0,1,2,3,4,5,6 Ordinal
Edad
Raza
Estatura

6 Clasificación a una vía

  • Partimos de los datos sin agrupar
  • \(n\): número de casos en estudio
  • \(C\): Característica observada para cada caso
  • Determinar las diferentes clases de la característica \(C_1, C_2, ..., C_j, ..., C_m\)
  • \(m\): número de clases
  • Ubicar cada caso en la clase correspondiente y contar los casos, \(n_j\): frecuencia absoluta (número de casos que pertenecen a la categoría \(j\))
\(C_j\) \(n_j\)
\(C_1\) \(n_1\)
\(C_2\) \(n_2\)
\(C_j\) \(n_j\)
\(C_m\) \(n_m\)
——— ———
Total \(n\)

6.1 Propiedades de \(n_j\)

  • El valor mínimo de \(n_j\) es cero
  • EL valor máximo de \(n_j\) es \(n\), \(0\leq n_j\leq n\)
  • \(\sum_{j=1}^{m}n_j=n\)

6.2 Frecuencias relativas

Las frecuencias relativas son la proporción de casos que pertenecen a determinada clase:

\[h_j=\frac{n_j}{n}\]

6.2.1 Propiedades de \(h_j\)

  • \(0\leq h_j\leq 1\)
  • \(\sum_{j=1}^{m}h_j=1\)

6.2.1.1 Ejercicio: Problema de investigación

Complete la tabla de contingencia

BIRADS \(n_j\) \(h_j\)
0 145
1 2415
2 3456
3 852
4 0.0603
5 157
6
——– ——– ——
Total 7614

6.3 Análisis gráfico

En general las variables categóricas y las cuantitativas discretas se grafican en diagramas de barras: - eje \(x\): Categorías de la característica observada - eje \(y\): Frecuencia absoluta o frecuencia relativa

6.3.0.1 Ejemplo: Problema de investigación

7 Clasificación a dos vías

Se miden dos o más características (variables) en cada individuo

  • Partimos de los datos sin agrupar
  • \(n\): número de casos en estudio
  • \(C\) y \(B\): Características observadas para cada individuo
  • Determinar las diferentes clases de la características \(C_1, C_2, ..., C_j, ..., C_m\), \(B_1, B_2,...,B_k,..., B_w\)
  • \(m\): número de clases de la característica \(C\)
  • \(w\): número de clases de la característica \(B\)
  • \(n_{jk}\): frecuencia absoluta (número de individuos que pertenecen a la categorías \(C_j\) y \(B_k\))
  • \(n_{j.}\): frecuencia absoluta de la clase \(C_j\) (marginal de \(C\))
  • \(n_{.k}\): frecuencia absoluta de la clase \(B_k\) (marginal de \(B\))
\(C_j\)~\(B_k\) \(B_1\) \(B_k\) \(B_w\) Total
\(C_1\) \(n_{11}\) \(n_{1k}\) \(n_{1w}\) \(n_{1.}\)
\(C_2\) \(n_{21}\) \(n_{2k}\) \(n_{2w}\) \(n_{2.}\)
\(C_j\) \(n_{j1}\) \(n_{jk}\) \(n_{jw}\) \(n_{j.}\)
\(C_m\) \(n_{m1}\) \(n_{mk}\) \(n_{mw}\) \(n_{m.}\)
——— ——-
Total \(n_{.1}\) \(n_{.k}\) \(n_{.w}\) \(n_{..}\)

7.1 Propiedades \(n_{jk}\)

  • \(0\leq n_{jk}\leq n\)
  • \(\sum_{j=1}^{m}n_{jk}=n_{.k}\): Frecuencia marginal de \(B_k\)
  • \(\sum_{k=1}^{w}n_{jk}=n_{j.}\): Frecuencia marginal de \(C_j\)
  • \(\sum_{j=1}^{m}\sum_{k=1}^{w}n_{jk}=n_{..}\)

7.2 Frecuencias relativas

Las frecuencias relativas son la proporción de casos que pertenecen simultáneamenta a \(C_j\) y \(B_k\) :

\[h_{jk}=\frac{n_{jk}}{n}\] ### Propiedades \(h_{jk}\)

  • \(0\leq h_{jk}\leq 1\)
  • \(\sum_{j=1}^{m}h_{jk}=h_{.k}\): Frecuencia relativa marginal de \(B_k\)
  • \(\sum_{k=1}^{w}h_{jk}=h_{j.}\): Frecuencia relativa marginal de \(C_j\)
  • \(\sum_{j=1}^{m}\sum_{k=1}^{w}h_{jk}=1\)

7.3 Frecuencias relativas condicionales

Las frecuencias relativas condicionales describen el comportamiento de una categoría limitando la población a un grupo específico:

  • Comportamiento de \(B_k\) en la categoría \(C_j\) (¿De los \(C_j\) qué proporción son \(B_k\)?-Perfil fila):

\[h_{k|j}=\frac{n_{jk}}{n_j.}\] - Comportamiento de \(C_j\) en la categoría \(B_k\) (¿De los \(B_k\) qué proporción son \(C_j\)?-Perfil columna):

\[h_{j|k}=\frac{n_{jk}}{n_{.k}}\] ### Ejercicio: Problema de investigación Suponga además que se quiere mirar la distribución del BIRADS de acuerdo a si ha amamantado o no, econtrándose lo siguiente:

\(C_j\)~\(B_k\) Si No Total
\(0\) \(76\) \(69\)
\(1\) \(1670\) \(745\)
\(2\) \(1975\) \(1481\)
\(3\) \(394\) \(458\)
\(4\) \(95\) \(364\)
\(5\) \(54\) \(103\)
\(6\) \(41\) \(89\)
——— —– —- —-
Total

Las características a evaluar son: \(C\): BIRADS

\(B\): Lactancia

  1. Complete la tabla
  2. ¿Qué proporción de mujeres con BIRADS 6 amamantaron en algún momento de su vida?
  3. ¿Qué propoción de las mujeres que no amamantaron tuvieron como resultado un BIRADS 4?
  4. De acuerdo con la tabla, ¿quiénes presentaron mayor frecuencia de sospecha de cáncer (BIRADS>3)?
##  femenino masculino 
##        47        53

## [1] 100   5
## [1] 100
## [1] 5
## [1] 100
##  femenino masculino 
##      0.47      0.53

##    
##      0  1
##   0 28 22
##   1 19 31
## 
## No Si 
## 50 50

##         
##          femenino masculino
##   No int     0.56      0.44
##   Si int     0.38      0.62
##         
##           femenino masculino
##   No int 0.5957447 0.4150943
##   Si int 0.4042553 0.5849057

8 Bibliografía

  1. Barón F.J. Bioestadística. Universidad de Málaga. http://www.bioestadistica.uma.es/baron/bioestadistica.pdf
  2. Soto O, Franco D. Fundamentos conceptuales de estadística. Universidad Nacional de Colombia. Notas de clase.