Punto 3

Con base a los artículos “Statistical Errors: P values, the gold standard of statistical validity, are not as reliable as many scientists assume” & “Statisticians issue warning on P values: Statement aims to halt missteps in the quest for certainty” escriba un resumen (máximo 2 páginas) sobre ambos artículos e incluya en este sus opiniones en cuanto al uso del valor p como criterio de decisión en inferencia estadística.

De manera general las personas tienden a estandarizar procesos dada la competencia y afán de productividad, esto trae consigo el riesgo en la calidad de la metodología propuesta y empleada. En particular, en el campo estadístico, inicialmente el autor británico Ronald Fisher introdujo el concepto de valor P con el objetivo de juzgar si los resultados de una experimento eran consistentes con lo que podría reproducir el azar, originalmente como idea informal que consitía en formular una hipótesis nula que se desea refutar, esta se formula de acuerdo con información apriori o exploratoria de los datos disponibles, luego, se supone que dicha hipótesis nula es cierta y se procede a calcular las posibilidades de obtener resultados al menos tan extremos como los que realmente se observaron, a esta probabilidad le denominó valor P, así, cuánto más pequeño fuera, mayor probabilidad de que la hipótesis nula planteada fuera falsa, sin mebargo, esto no siempre es cierto.

El planteamiento a lo largo de los largos ha sido ampliamente juzgado por diversos científicos en múltiples ramas del conocimiento, ya sea estadístico u otro, su principal preocupación subyace de tomar como confirmaciones sólidas a cuestiones que deben tratarse con falta de confianza. Ahora bien, sus críticas se sustentan en la reproducibilidad de una decisión puesto que, han evaluado las metodologías de algunos resultados científicos publicados, usando otros datos de la misma naturaleza y se han llegado a conclusiones muy diferentes usando como criterio el valor P. Esto se posiciona como evidencia de la insuficiencia de la rigurosidad actual en la toma de decisiones. Como conclusión, se tiene que cuánto más difícil de creer sea la hipótesis, mayor será la posibilidad de que un hallazgo emocionante sea una falsa alarma, sin importar cuál sea el valor P.

La forma deliberada del uso del valor P ha conllevado a prácticas que denominan como P-hacking identificadas en artículos de psicología que reportan valores P que se agrupan sospechosamente alrededor de 0,05, tal como se esperaría si los investigadores buscaran valores de P significativos hasta que encontraran uno. Finalmente, se invita a los investigadores a ser críticos respecto a las estadísticas convencionales y complementarlas con análisis en estudios similares, argumentos para plantemiento de la hipótesis, comparación con alternativas estadísticas (intervalos de confianza), etc. Luego de asegurarse un resultado más confiable, se debe reconocer que la discusión no termina con el resultado numérico sino que ahí empieza y que la estadística no debe actuar como una recta sino como una ciencia.

El uso del valor p como criterio de decisión en inferencia estadística acompañado de una reflexión consciente acerca de su planteamiento desde un análisis exploratorio tanto descriptivamente como conceptualmente, proporciona una idea para juzgar la hipótesis planteada, teniendo cuidado con no asumirlo con un resultado para tomar decisiones absolutas. Si bien, se considera como un insumo e el estudio, se debe hacer uso adecuado de esta herramienta sin perder como objetivo principal la objetividad en la certeza que se desea adquirir en el problema en cuestión.