Web publicada en: https://rpubs.com/jocamso/1434641

1. Contrastes de hipótesis

Un contraste de hipótesis es un procedimiento estadístico que permite decidir si una afirmación sobre un parámetro poblacional es compatible con la evidencia observada. Los elementos clave se muestran en la Tabla 1 (Triola, 2009, cap. 8).

Concepto Descripción
Hipótesis nula (\(H_0\)) Afirmación de partida; normalmente “no hay efecto”.El valor de un parámetro de población (como una proporción, media o desviación estándar) es igual a un valor predefinido.
Hipótesis alternativa (\(H_1\)) Afirmación que compite con \(H_0\); el parámetro tiene un valor que, de alguna manera, difiere de la hipótesis nula. Puede ser unilateral (mayor o menor) o bilateral (diferente).
Estadístico de contraste Función de los datos: \(z\), \(t\), \(\chi^2\), etc., cuya distribución bajo \(H_0\) es conocida.
Nivel de significación (\(\alpha\)) Probabilidad máxima tolerada de rechazar \(H_0\) siendo cierta (error tipo I).
p-valor Probabilidad de obtener un resultado al menos tan extremo como el observado, asumiendo \(H_0\).
Región crítica Conjunto de valores del estadístico para los cuales se rechaza \(H_0\).

Tabla 1. Elementos fundamentales de un contraste de hipótesis. Se resumen los conceptos clave del marco teórico con sus definiciones.

Existen dos métodos equivalentes de decisión:

  • Método del p-valor: Se calcula el p-valor y se rechaza \(H_0\) si p-valor \(< \alpha\).
  • Método tradicional (región crítica): Se define un valor crítico a partir de \(\alpha\) y se rechaza \(H_0\) si el estadístico cae en la región crítica.

Las distribuciones más utilizadas son: normal (\(z\)), t de Student, Poisson y binomial. Refs: Martin (2012); Triola (2009).

2. Algoritmo general

A continuación, sintetizamos los pasos del algoritmo general de un contraste de hipótesis (Triola, 2009, cap. 8):

Paso 1 — Formular \(H_0\) y \(H_1\).

Paso 2 — Elegir el nivel de significación \(\alpha\) (habitualmente 0.05).

Paso 3 — Identificar el estadístico relevante y determinar su distribución muestral (normal, \(t\), \(\chi^2\)).

Paso 4 — Obtener los datos y calcular el valor del estadístico.

Paso 5 — Tomar la decisión por p-valor (\(p < \alpha \Rightarrow\) rechazar \(H_0\)) o por región crítica.

Paso 6 — Formular la conclusión en el contexto del problema.

3. Onda gravitacional

Planteamiento del problema

Los detectores como LIGO registran \(x(t) = h(t) + n(t)\), con ruido gaussiano \(n(t)\) y una posible señal \(h(t)\). El contraste es:

  • \(H_0\): \(x(t) = n(t)\) — solo ruido.
  • \(H_1\): \(x(t) = A \cdot s(t) + n(t)\) — hay señal con amplitud \(A > 0\).

Generamos datos sintéticos: señal sinusoidal (\(f = 150\) Hz), ruido gaussiano (\(\sigma_n = 0.5\)), 10 realizaciones con amplitudes aleatorias \(A_i \in [0, 1]\) y una realización \(r_0\) de solo ruido.

Distribuciones

Distribuciones de amplitud. Izquierda: ruido puro $r_0$ con densidad gaussiana teórica $N(0, 0.5)$. Derecha: realización $r_5$ con señal, cuya distribución es más ancha.

Figure 1: Distribuciones de amplitud. Izquierda: ruido puro \(r_0\) con densidad gaussiana teórica \(N(0, 0.5)\). Derecha: realización \(r_5\) con señal, cuya distribución es más ancha.

El resultado esperado para la muestra de ruido puro es una distribución gaussiana, mientras que la presencia de señal ensancha la distribución, como se observa en la Figura 1.

Estadístico elegido y método de contraste

Para cada realización calculamos la correlación \(\rho\) con la señal esperada (template): bajo \(H_0\), \(\rho \approx 0\); bajo \(H_1\), \(\rho > 0\). Con muchos puntos, \(\rho\) se distribuye aproximadamente como una normal, lo que permite un contraste \(z\) unilateral derecho (\(H_0\): \(\rho = 0\); \(H_1\): \(\rho > 0\)) aplicando ambos métodos: p-valor y región crítica (\(\alpha = 0.05\)).

Correlación con el template y regresión

Calculamos \(\rho_i = \text{cor}(r_i, s)\) para cada realización y ajustamos una regresión lineal \(\rho = \beta_0 + \beta_1 A\). El coeficiente de determinación \(R^2\) indica qué fracción de la variabilidad de \(\rho\) explica la amplitud. Como se observa en la Figura 2, la correlación crece linealmente con la amplitud.

Correlación con el template en función de la amplitud. Cada punto representa una realización; la regresión lineal confirma la relación proporcional entre $\rho$ y $A$.

Figure 2: Correlación con el template en función de la amplitud. Cada punto representa una realización; la regresión lineal confirma la relación proporcional entre \(\rho\) y \(A\).

Contraste: p-valor y región crítica

Simulamos 10,000 realizaciones de solo ruido para obtener la distribución de \(\rho\) bajo \(H_0\), determinar el valor crítico \(\rho_c\) (método tradicional) y calcular p-valores (método del p-valor). En el panel izquierdo de la Figura 3, las líneas verticales marcan los valores críticos de \(\rho\): naranja para \(\alpha = 0.05\) y roja para \(\alpha = 0.01\). Todo \(\rho\) a la derecha cae en la región crítica y lleva a rechazar \(H_0\). El panel derecho muestra la decisión por realización con \(\alpha = 0.05\).

Contraste de hipótesis para la detección de señal. Izquierda: distribución nula de $\rho$ con valores críticos. Derecha: decisión (detectado o no) por realización.

Figure 3: Contraste de hipótesis para la detección de señal. Izquierda: distribución nula de \(\rho\) con valores críticos. Derecha: decisión (detectado o no) por realización.

Conclusiones del escenario de ondas gravitacionales

  1. La correlación con la señal esperada es un estadístico eficaz para detectar señales en ruido gaussiano.
  2. Aplicando el método del p-valor y el método de la región crítica (\(\alpha = 0.05\)), ambos coinciden en detectar las realizaciones con amplitud suficiente.
  3. La regresión lineal \(\rho\) vs. \(A\) muestra un alto \(R^2\), lo que confirma que la correlación crece proporcionalmente a la amplitud: a mayor SNR, mayor capacidad de detección.
  4. Con 2001 puntos el umbral \(\rho_c \approx 0.04\) es muy bajo y todas las realizaciones se detectan con \(\alpha = 0.05\). Con \(\alpha = 0.001\) (\(\sim 3.1\sigma\)), \(r_6\) (\(A = 0.046\)) ya no superaría el umbral. LIGO exige \(5\sigma\), lo que reduce drásticamente las falsas alarmas (Abbott et al., 2016).

4. Bosón de Higgs

Planteamiento del problema

La búsqueda del Higgs se basa en contar eventos en un rango de energía y comprobar si hay un exceso respecto al número esperado de eventos de fondo, \(B\). Un pico de señal en torno a 125 GeV, indicaría la presencia del bosón de Higgs (ver Figura 4). El conteo de eventos en cada bin de energía sigue una distribución de Poisson porque se trata de sucesos discretos, independientes entre sí, que ocurren con una tasa media conocida \(\lambda\) en un intervalo fijo de energía (Martin, 2012). La varianza de una Poisson es igual a su media (\(\sigma^2 = \lambda\)), por lo que la incertidumbre estadística del fondo es \(\sqrt{B}\).

  • \(H_0\): \(\mu = B\) — solo fondo.
  • \(H_1\): \(\mu > B\) — hay exceso (posible señal).

Para \(B\) grande, el conteo se aproxima por una normal \(N(B, B)\) y el exceso se estandariza como \[z = \frac{n - B}{\sqrt{B}}\] donde \(n\) es el número de eventos observados y \(B\) el fondo esperado. Bajo \(H_0\), \(z \sim N(0,1)\); un valor alto de \(z\) indica un exceso incompatible con las fluctuaciones estadísticas del fondo.

Espectro de energía del escenario Higgs. Izquierda: densidades teóricas de fondo, señal y total. Derecha: histograma de datos simulados con curvas teóricas superpuestas.

Figure 4: Espectro de energía del escenario Higgs. Izquierda: densidades teóricas de fondo, señal y total. Derecha: histograma de datos simulados con curvas teóricas superpuestas.

Estadístico y método de contraste

Con \(B\) grande, \(z = (n - B)/\sqrt{B}\) sigue una normal estándar bajo \(H_0\).

Del p-valor a la significancia \(\sigma\): el p-valor se convierte en número de desviaciones estándar mediante \(z = \Phi^{-1}(1-p)\), donde \(\Phi^{-1}\) es la inversa de la normal acumulada. Por ejemplo, \(p = 0.05\) equivale a \(z = 1.64\) (\(\sim 1.6\sigma\)), mientras que el criterio de descubrimiento de \(5\sigma\) exige \(p \approx 2.87 \times 10^{-7}\). La significancia \(S/\sqrt{B}\) es precisamente este estadístico \(z\).

Decisión: rechazar \(H_0\) si \(p < 2.87 \times 10^{-7}\) (método del p-valor) o si \(z_{\text{obs}} > z_c = 5\) (método de la región crítica).

Significancia del exceso

En la ventana [119, 131] GeV: señal esperada \(S\) = 263.3, fondo esperado \(B\) = 1935.7.

  • Estadístico \(z\) = \(S / \sqrt{B}\) = 5.98.
  • Método del p-valor: \(p\) = \(1.09 \times 10^{-9}\) \(<\) \(2.87 \times 10^{-7}\) → se rechaza \(H_0\).
  • Método tradicional: \(z_{\text{obs}}\) = 5.98 > \(z_c\) = 5 → cae en la región crítica → se rechaza \(H_0\).

Simulación: distribución bajo \(H_0\) y \(H_1\)

Simulamos 5000 realizaciones bajo cada hipótesis para visualizar la separación entre las distribuciones. Representamos estos datos en forma de histograma en la Figura 5, y se confirma que las distribuciones bajo \(H_0\) y \(H_1\) están claramente separadas, haciendo el exceso fácilmente detectable.

Simulación del conteo de eventos en la ventana de señal. Izquierda: distribuciones bajo $H_0$ y $H_1$. Derecha: la media observada bajo $H_1$ resulta incompatible con $H_0$.

Figure 5: Simulación del conteo de eventos en la ventana de señal. Izquierda: distribuciones bajo \(H_0\) y \(H_1\). Derecha: la media observada bajo \(H_1\) resulta incompatible con \(H_0\).

¿Cuántos eventos se necesitan para detectar la señal?

Variamos \(n_s\) y calculamos \(z = S/\sqrt{B}\) para determinar el umbral de detección. La Figura 6 muestra que se necesitan aproximadamente 150 eventos de señal para alcanzar el umbral de \(5\sigma\).

Significancia estadística. La curva $z = S/\sqrt{B}$ crece con $n_s$; se indican los umbrales de $3\sigma$ y $5\sigma$.

Figure 6: Significancia estadística. La curva \(z = S/\sqrt{B}\) crece con \(n_s\); se indican los umbrales de \(3\sigma\) y \(5\sigma\).

Conclusiones del escenario Higgs

  1. El conteo de eventos sigue una distribución de Poisson, que para \(B\) grande se aproxima bien por una normal, permitiendo usar el contraste \(z\).
  2. Tanto el método del p-valor como el de la región crítica coinciden en rechazar \(H_0\) cuando la señal es suficientemente intensa.
  3. La significancia \(z = S/\sqrt{B}\) crece como \(\sim \sqrt{n_s}\): para duplicar \(z\) hay que cuadruplicar los eventos de señal.
  4. En física de partículas se exige \(z \geq 5\) (\(5\sigma\)) para reclamar un descubrimiento, un criterio mucho más estricto que el \(\alpha = 0.05\) habitual.

5. Conclusiones generales

Aspecto Onda gravitacional Bosón de Higgs
Datos Serie temporal \(x(t)\) Conteo de eventos (histograma)
Distribución bajo \(H_0\) Normal (ruido gaussiano) Poisson (→ aprox. normal)
Estadístico Correlación \(\rho\) (test \(z\)) \(z = S/\sqrt{B}\) (test \(z\))
Parámetro clave Amplitud \(A\) (→ SNR) \(n_s\) (→ \(S/\sqrt{B}\))
Requisito Conocer señal esperada (template) Conocer fondo \(B\) con precisión

Tabla 2. Comparación de los dos escenarios analizados. Se contrastan los datos, distribuciones, estadísticos y requisitos de cada caso.

Ambos escenarios demuestran que el contraste de hipótesis es la herramienta fundamental en física experimental para cuantificar evidencia, controlar falsos positivos y evaluar la potencia del experimento. La Tabla 2 sintetiza las principales características de cada caso, mostrando cómo el marco teórico se adapta a contextos muy distintos pero con la misma lógica inferencial.

Referencias

  • Martin, B. R. (2012). Statistics for Physical Sciences: An Introduction. Academic Press.
  • Triola, M. F. (2009). Estadística (10.ª ed.). Pearson Educación.
  • Weiss, R. (2022). Republication of: Electromagnetically coupled broadband gravitational antenna. Gen. Relat. Gravit., 54(11), Art. 153.
  • Abbott, B. P. et al. (2016). Observation of Gravitational Waves from a Binary Black Hole Merger. Phys. Rev. Lett., 116, 061102.
  • ATLAS Collaboration & CMS Collaboration (2024). Evidence for the Higgs Boson Decay to a \(Z\) Boson and a Photon at the LHC. Phys. Rev. Lett., 132, 021803. doi: 10.1103/PhysRevLett.132.021803.
  • Wanner, G. (2026). Ten years since the first reported observation of gravitational waves. Nature News and Views.