CORRELACIÓN NO ES CAUSALIDAD
Diferencias entre Correlación y Causalidad For Dummies.
Introdución
La correlación entre dos variables estimada con el coeficiente R de Pearson permite abstraer las relaciones concretas asociadas a una variable X y una variable Y. Esto significa que la correlación mide la fuerza de asociación entre dos variables (Lirios, 2009). Existen diversos tipos de correlación dependiendo del número de variables involucradas. Coven (2003) los define de la siguiente manera: o Correlación simple: Se centra en la relación entre dos variables. Es útil para comprender asociaciones directas y sencillas. o Correlación parcial: Analiza la relación entre dos variables, manteniendo constante el efecto de una tercera variable. o Correlación múltiple: Estudia la relación entre tres o más variables simultáneamente. Es especialmente útil en ciencias sociales, donde los fenómenos suelen ser complejos y multifactoriales. o Correlación lineal: Las variables cambian en proporción constante. o Correlación no lineal: Las variables cambian de forma desproporcionada. El coeficiente de correlación es el indicador usado para medir la relación entre dos variables, con un valor que oscila entre -1 y +1. Este valor toma en cuenta la fuerza y la dirección de la asociación. La fuerza se describe como débil, moderada o fuerte, según la cercanía del coeficiente a los extremos o al cero. La dirección puede ser positiva (+), indicando que las variables se mueven juntas, o negativa (-), cuando se mueven en direcciones opuestas. El coeficiente de correlación es una medida altamente empleada en la investigación aplicada a ciencias sociales, y es prácticamente inevitable en los estudios cuantitativos que involucran el análisis de variables (Maiwada & Okey, 2015). A pesar de su importancia como medida, es necesario ser cauteloso en la interpretación de coeficientes de correlación cuando se hace investigación en ciencias sociales. Esto debido a que, aunque una gran mayoría de teorías en las ciencias sociales son bivariadas, es decir, involucran únicamente la relación entre dos variables, la realidad suele ser multivariada, lo cual hace que muchas veces la correlación sea insuficiente para analizar una relación entre dos variables, pues en ocasiones estas dos forman parte de un sistema más complejo (Kellstedt & Whitten, 2018). Por este motivo es que es imposible afirmar que la correlación de dos variables implica causalidad. Encontrar una ley de causalidad es una de las tareas más complejas al momento de hacer investigación, tanto así que una vez se declaró la siguiente frase: Prefiero descubrir una ley causal a ser rey de Persia. -Demócrito En su libro The Fundamentals of Political Science Research Kellstedt y Whitten (2018) establecen las siguientes condiciones a evaluar para determinar si una variable X es causante directa de una variable Y Condiciones necesarias para evaluar si X causa Y: 1) ¿Hay un mecanismo causal creíble que conecte X con Y en la literatura? 2) ¿Es posible eliminar la posibilidad de que Y cause X? 3) ¿Hay covarianza entre X y Y? 4) ¿Controlamos todas las variables de confusión que podrían causar una correlación espuria? El cuarto punto de esta lista es el eje central del presente documento, pues a continuación, se procederán a mostrar dos ejemplos de correlaciones espuria que no cumplen con estos requisitos, y que únicamente son una anécdota para contarle a tus amigos cuando te quedes sin temas de conversación
Correlaciones Espurias
La primera correlación que es interesante analizar es la existente entre la Producción de Petróleo Crudo en México (Statista Research Department, 2024) y el Porcentaje de Población Rural en México (World Bank Open Data, s. f.a). Antes de seguir leyendo te invitamos a preguntarte ¿Cuál crees que sea la causa de esta curiosa correlación espuria?
Si la primera correlación fue rural, esta tiene un componente digital e industrial. Se trata de la correlación entre la Producción de Vehículos en México (Expansión, 2023) y el Porcentaje de Individuos que Utilizan Internet en México (World Bank Open Data, s. f.b). A no ser que las personas estén usando internet dentro de sus automóviles nuevos producidos en México, esta correlación no tiene sustento, ni mucho menos cumple con los sustentos causales anteriormente presentados, lo cual lo hace una correlación espuria.
Causalidades
Estimado lector, agradecemos tu paciencia y persistencia por haber llegado hasta este punto, sin duda muestras mucho interés en las correlaciones espuria y las causalidades en ciencias sociales, esperamos que este blog esté siendo de tu agrado. Esperamos que hayas pensado bien tu respuesta pues ahora es momento de que contrastes las respuestas de la primera correlación espuria con las que nosotros sugerimos en la siguiente tabla en la cual seleccionamos posibles causas para cada fenómeno en la primera correlación. En esta tabla identificamos los posibles factores que hacen que aumente la variable con este signo (+) y los fenómenos que hacen que disminuya con este signo (-). Te la presentamos a continuación:
| Producción de petróleo crudo en México | Porcentaje de población rural en México |
|---|---|
| Producción de petróleo crudo en México | Porcentaje de población rural en México |
| Precio internacional del petróleo (+) | Expansión de ciudades y crecimiento de zonas metropolitanas (-) |
| Costos de extracción y producción (-) | Aumento de empleos en sectores industriales y de servicios (-) |
| Inversión pública y privada en el sector energético (+) | Crecimiento de la infraestructura urbana (carreteras, transporte público) (-) |
| Exportaciones y demanda global (+) | Mejor acceso a vivienda y servicios básicos en ciudades (-) |
| Innovaciones en perforación y extracción (+) | Programas de reubicación y desarrollo urbano (-) |
| Políticas fiscales e incentivos para la producción (+) | Disminución de oportunidades en el sector agrícola (-) |
| Desarrollo de nuevas técnicas de refinación (+) | Crisis en la producción rural y bajos ingresos para campesinos (-) |
| Uso de inteligencia artificial en exploración petrolera (+) | Automatización del trabajo en el campo (-) |
| Automatización en plantas y refinerías (+) | Falta de financiamiento para pequeños productores rurales (-) |
| Investigación en energías fósiles y su eficiencia (+) | Expansión de la agroindustria con menor necesidad de mano de obra (-) |
| Reforma energética y apertura a inversión extranjera (+) | Mayor acceso a la educación en ciudades (-) |
| Regulaciones ambientales sobre extracción de petróleo (-) | Cambios en las expectativas laborales de las nuevas generaciones (-) |
| Relación con organismos internacionales (OPEP, tratados comerciales) (+) | Influencia de los medios de comunicación en la percepción del campo vs. la ciudad (-) |
| Políticas de subsidios o restricciones a la producción (-) | Crecimiento de universidades y centros tecnológicos urbanos (-) |
| Estrategias gubernamentales de autosuficiencia energética (+) | Disminución del tamaño de las familias rurales (-) |
| Impacto de la contaminación en comunidades cercanas a pozos petroleros (-) | Desastres naturales que afectan la vida rural (-) |
| Presión social y activismo ambiental contra los hidrocarburos (-) | Expansión de parques industriales en áreas rurales (-) |
| Reubicación de poblaciones por extracción petrolera (-) | Inseguridad y presencia del crimen organizado en zonas rurales (-) |
| Fenómenos climáticos que afectan la infraestructura (-) | Contaminación del suelo y falta de acceso a agua potable en comunidades rurales (-) |
| Dependencia laboral de comunidades en torno a la industria petrolera (+) | Desarrollo del turismo rural como alternativa económica (+) |
Conclusión
Esperamos que hayas disfrutado este gran viaje entre los conceptos de correlación y causalidad, sin duda fue muy divertido para nosotros redactar este artículo. Te invitamos a cuestionar cada declaración de causalidad que veas en medios, tik-toks, o investigaciones, ya que si esperamos haberte dejado una lección es que el mundo esta lleno de correlaciones espurias y que las leyes causales son más difíciles de encontrar que un diamante. ¡Hasta la Próxima!
Referencias
Coven, V. (2003). A History of Statistics in Social Science. Gateway: An Academic Journal on the Web. Expansión. (2023). México - Producción de vehículos. https://datosmacro.expansion.com/negocios/produccion-vehiculos/mexico Kellstedt, P. M., & Whitten, G. D. (2018). The Fundamentals of Political Science Research. https://doi.org/10.1017/9781108131704 Lirios, C. G. (2009). Las investigaciones correlacionales de las ciencias sociales en torno a las problemáticas hidrológicas. Barataria Revista Castellano-Manchega de Ciencias Sociales, 10, 141-147. https://doi.org/10.20932/barataria.v0i10.172 Maiwada, S., & Okey, L. E. (2015). The relevance and significance of correlation in social science research. International Journal of Sociology and Anthropology Research, 1(3), 1 22-28 Statista Research Department. (2024). Producción de petróleo crudo de Petróleos Mexicanos (Pemex) de 2007 a 2023 (en miles de barriles por día). https://es.statista.com/estadisticas/611875/produccion-anual-de-petroleo-crudo-de-la-empresa-petroleos-mexicanos/ World Bank Open Data. (s. f.a). Población rural (% de la población total) – Mexico. https://datos.bancomundial.org/indicador/SP.RUR.TOTL.ZS?locations=MX World Bank Open Data. (s. f.b). Población rural (% de la población total) – Mexico. https://datos.bancomundial.org/indicador/SP.RUR.TOTL.ZS?locations=MX