STATISTICAL ERRORS P values, the ‘gold standard’ of statistical validity, are not as reliable as many scientists assume.By Regina Nuzzo

Resumen y opinión

Método científico: Errores estadísticos “Por un breve período en 2010, Matt Motyl estuvo en el borde de la gloria científica: había descubierto que los extremistas casi literalmente ven el mundo en blanco y negro.”

Para Motyl un estudiante de doctorado en psicología, en la Universidad de Virginia, en Charlottesville. Los datos permitían evidenciar como según la ideología se concebían las diferentes maneras de apreciar las situaciones. Esto como análisis de un estudio realizado en una muestra de cerca de 2000 personas, cuyo resultado podía ser interpretado como “muy significativo”, pero debido a los distintos escenarios Motyl y su asesor Nosek tomarón la determinación de realizar un nuevo estudio, en el cual se replicara el inicial, pero muy distinto a lo esperado, los datos que arrojo este (un valor de 0,59) hizo que desapareciera la tesis que se tenía.

Distintas teorías con el paso del tiempo surgieron, de diferentes científicos a quienes les preocupaban la interpretación de los resultados debido a la ambivalencia de estos, mostrando que los valores P no son tan confiables como se requiere para la toma de decisiones, debido a que la falta de certeza incurrirá en falsos resultados.

La interpretación de los datos se basa en la metologia utilizada para el hallazgo de los resultados, es por ello que frente a la aparente precisión del valor P, Fisher pretendía que fuese solo una parte de un proceso fluido, no numérico en el que se mezclara datos, así como conocimientos de fondo para llegar a tener conclusiones científicas.

A finales de los 1920s, el matemático polaco Jerzy Neyman y el estadístico británico Egon Pearson, introdujeron un marco alternativo para el análisis de datos que incluía el poder estadístico, falsos positivos, falsos negativos, y otros conceptos ahora familiares en las clases de introducción a la estadística.

En lo que se debatían las diferentes teorías de uso y mientras cada quien emitia juicios entre que Neyman llamaba a parte del trabajo de Fisher matemáticamente “peor que inútil”; Fisher calificaba el enfoque de Neyman de “infantil” y “horrible [para] la libertad intelectual en occidente”- otros investigadores perdieron la paciencia y empezaron a escribir manuales de estadística para científicos en ejercicio, lo cual permitió que en la búsqueda de la mejor aplicación de las teorías se creara un sistema hibrido y es allí cuando “un valor P de 0,05 se consagró como “estadísticamente significativo”, otros críticos han planteado que la forma en que los valores P se dictan, pueden fomentar el pensamiento confuso entre los investigadores.

Dando “una mirada superficial a una muestra de artículos recientemente publicados”, dice, “es convincente que los valores P son aún muy, muy populares”. Con esto evidenciando como la estructura de la estadística es aquella que mediante el análisis de los datos permiten ser interpretados. “El trabajo de investigadores como Ioannidis muestra el vínculo entre quejas teóricas de estadística y las dificultades actuales, dice Goodman.”

Esto implica una cierta subjetividad -algo que los pioneros pioneros de la estadística trataron de evitar.

Opinión:

Pese a la gran cantidad de esfuerzos que se han realizado de las diversas teorías, uno de los grandes problemas a la hora de hallar los resultados se basa en la subjetividad, ya que el hallazgo se obtiene con base en P, el cual crea con su valor un indicativo para la resaca de datos, lo cual no permite ver los diferentes aspectos en los resultados, y mostrando así que sin importar cual es el valor original de P, siempre existirá un margen de probabilidad en donde el resultado puede ser erróneo. El método es sin lugar a dudas el despertar del camino hacia el resultado, concatenando datos encaminados en las diferentes hipótesis que el investigador se halla planteado, ya que la estadística es una ciencia que no permite dar garantía a la hora de replicar resultados, puesto que si la muestra cambia en alguna o algunas de sus características el resultados que se obtenga no dará el resultado obtenido con anterioridad.