Sesión 4

Antonio Martínez Pineda

12/11/2021

Significancia

La significancia estadística representa la probabilidad de que las asociaciones medidas se deban únicamente al error de muestreo. A la representación matemática de la significancia se le denomina nivel de significancia.

Niveles de significancia

Los niveles de significancia o niveles alfa (\(\alpha\)) se derivan de un modelo lógico obtenido de varias muestras de la población. Generalmente se manejan tres niveles de significancia de acuerdo al rigor que se desee tener en los resultados: 0.05, 0.01, 0.001.

Así el nivel de significancia es un acuerdo que se toma a priori para determinar si los resultados obtenidos se deben únicamente al error de muestreo.

Los niveles de significancia se utilizan en la prueba de hipótesis si un análisis obtiene un nivel de significancia mayor al acordado no se rechaza la hipótesis nula. Al tomar decisiones con respecto a la hipótesis nula se pueden cometer dos tipos de error.

Tipos de error

Error tipo I

Consiste en rechazar la hipótesis nula cuando es verdadera. El nivel de significancia limita la probabilidad de cometer este tipo de error.

Error tipo II

No rechazar la hipótesis nula cuando ésta es falsa.

Diferencia entre un falso positivo y un falso negativo

Poder estadístico y tamaño del efecto

Poder estadístico

El poder estadístico de una prueba se define como la probabilidad rechazar la hipótesis nula cuando ciertamente es falsa dado cierto tamaño del efecto, nivel de significancia, tamaño de la muestra y la prueba estadística utilizada. Así como la significancia estadística (α) reduce la posibilidad de cometer un error tipo I, el poder estadístico (1−β) reduce la posibilidad de cometer un error tipo II.

\(\alpha\) \(p\) Decisión \(H_0\) es verdadera \(H_0\) es falsa
0.01 0.02 No rechazar \(H_0\) Decisión correcta Error tipo II
0.05 0.02 Rechazar \(H_0\) Error tipo I Decisión correcta

Tamaño del efecto

El tamaño del efecto (ES, por sus siglas en inglés) no es otra cosa que la cantidad de algo que es de interés. Por ejemplo, si un investigador postula una hipótesis nula en la que la prevalencia de trastorno de ansiedad generalizada es la misma en tres poblaciones y la prevalencia en las muestras utilizadas es la misma entonces el tamaño del efecto es cero. En la medida en que la prevalencia de las muestras varíe de lo postulado en la hipótesis nula, el tamaño del efecto variará con respecto del cero.

Intervalos de confianza

Contextualizando en el tamaño del efecto, los intervalos de confianza (IC) es un intervalo estimado para el tamaño del efecto observado en una población en el cuál se espera encontrar el ES real en la población.

El rango de este intervalo se extiende hacia ambos lados de la estimación del ES y su amplitud indica la precisión de la estimación. La extensión hacia cada uno de los lados de la estimación se conoce como margen de error o error de medición.

Tamaño del efecto y significancia estadística

En 1999 la Fuerza de tarea en inferencia estadística de la Asociación Americana de Psicología (APA), instó a los autores a reportar el tamaño del efecto: “Siempre proporcione una estimación del tamaño del efecto cuando reporte un valor p” (Wilkinson & APA Task Force on Statistical Inference, 1999, p. 599).

Por lo anterior, la cuarta edición del Manual de publicación de la APA (1999, p.18) alentó a los autores a reportar el tamaño del efecto.

Para la quinta edición (APA, 2001), esta recomendación se convirtió en una necesidad:

“Para que el lector comprenda completamente la importancia de sus hallazgos, casi siempre es necesario incluir un índice del tamaño del efecto o de la fuerza de asociación en su sección de Resultados… El principio general a seguir… es proporcionar al lector no solo información sobre la significancia estadística sino también suficiente información para evaluar la magnitud del efecto observado o la relación.” (pp. 25-26).

La prueba de hipótesis es todavía una práctica dominante en las ciencias sociales aún cuando existe evidencia de que no hay una buena comprensión de ella y frecuentemente se hace un uso indebido que conduce a conclusiones incorrectas. Además de las recomendaciones de la Fuerza de tarea en inferencia estadística de la APA, existen otros autores como Kline (2004) que instan a un cambio en las ciencias sociales de la prueba de hipótesis a otras técnicas con mejores resultados como el ES con sus IC.

library(pwr)
pwr.r.test(n = 30, sig.level = 0.05, power = 0.8)

     approximate correlation power calculation (arctangh transformation) 

              n = 30
              r = 0.4866474
      sig.level = 0.05
          power = 0.8
    alternative = two.sided