ENCUESTAS PRESIDENCIALES

Andrés Felipe Díaz Oviedo - Johann Camilo Rincón Real

30/5/2022

Se pretende exhibir un total de tres encuestas presidenciales de diferentes firmas consultoras. Con base en estas, se construye un intervalo de confianza para la media poblacional para cada una. Posteriormente se determina si existe o no un posible amaño en la intención de voto.

A continuación, se realiza el análisis para maximizar la varianza y la manera de estimar un intervalo de confianza para la media poblacional.

ANÁLISIS PARA MAXIMIZAR LA VARIANZA \(\sigma^{2}\)

Sea \(X_i:=\) ‘El i-ésimo ciudadano vota o no por YYYYYY candidato’. Sabemos que \(X_i \sim Bernoulli(p)\) donde \(p\) corresponde a la intención de voto por YYYYYY candidato presidencial.

La varianza bajo una distribución \(Bernoulli\) es \(p(1-p)\). Sea \(f(p)=p(1-p)\). En este sentido queremos hallar el máximo de \(f\) con \(p \in (0,1)\). Para ello hacemos uso del criterio de la primera derivada para extremos locales, luego:

Sabemos que \(f^{\prime}(p)= -2p+1\), hallando el intercepto (donde p es cero) tenemos \(-2p+1=0\) es decir \(p=\dfrac{1}{2}\). Además \(f^{\prime}(p)>0\) para los \(p<\dfrac{1}{2}\). Por otro lado \(f^{\prime}(p)<0\) para los \(p>\dfrac{1}{2}\). Gracias al criterio anterior, \(f\) tiene un punto máximo local en \(p=\dfrac{1}{2}\), es decir \(f(\dfrac{1}{2})= 0.25\)

Otro método para hallar el máximo de \(f\) con \(p\in(0,1)\) es el gráfico. Tal como se observa en la siguiente figura:

Dado que en las tres encuestas la intención de voto por un candidato YYYYYY se puede modelar mediante una distribución \(Bernoulli\) de parámetro \(p\), entonces se usará el mismo valor de la varianza para los tres casos.

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL \(\mu\)

El IC para \(\mu\) está dado por: \[ \begin{align*} IC_{(1-\alpha)}(\mu)= \left[\bar{x} \pm Z_{(\alpha/2)} \cdot \sqrt{\dfrac{\sigma^{2}}{n}}\right] \end{align*} \]

De cada candidato se recoge la cifra de intención de voto del mes de mayo ya que es la más reciente y con base en esto se calcula el IC.

ENCUESTA INVAMER

Para Noticias Caracol, Blu Radio y El Espectador

La firma Invamer reveló la intención de voto para las presidenciales durante el 13 y 18 de mayo. A continuación se muestran los resultados de su estudio:

ASPECTOS TÉCNICOS

De acuerdo con la ficha técnica de la firma se manejó un \(\textbf{n}=2000\) y una confianza \(\mathbf{(1-\alpha)}\) del \(95\%\). Para ahondar en las particularidades de la ficha técnica se recomienda ver este enlace.

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL \(\mu\)

FEDERICO GUTIÉRREZ

Con el candidato Gutiérrez se tiene \(\bar{x}= 0.271\).

\[\begin{align*} IC_{(1-0.05)}(\mu) &= \left[0.271 \pm Z_{(0.05/2)} \cdot \sqrt{\dfrac{0.25}{2000}}\right] \\ &= 0.271 \pm 1.96 \cdot 0.01118\\ &= \left[0.2490, \hspace{0.25cm} 0.2929\right] \end{align*}\]

El IC para la media poblacional \(\mu\) del candidato Gutiérrez está entre el \(24.9\%\) y el \(29.29\%\). El resultado de la primera vuelta presidencial del día 29 de mayo indica que \(\mu=0.2391\notin IC_{(1-0.05)}(\mu)\). Dado el anterior parámetro \(\mu\) es muy posible que la intención de voto hacia el candidato Gutierréz haya sido amañada. Los resultados muestran es probable que estaban inflando a este candidato, pues se sale casi \(1\) punto porcentual del intervalo de confianza.

GUSTAVO PETRO

Con el candidato Petro se tiene \(\bar{x}= 0.406\)

\[\begin{align*} IC_{(1-0.05)}(\mu) &= \left[0.406 \pm Z_{(0.05/2)} \cdot \sqrt{\dfrac{0.25}{2000}}\right] \\ &= 0.406 \pm 1.96 \cdot 0.01118\\ &= \left[0.3840, \hspace{0.25cm} 0.4279\right] \end{align*}\]

El IC para la media poblacional \(\mu\) del candidato Petro está entre el \(38.4\%\) y el \(42.79\%\). El resultado de la primera vuelta presidencial del día 29 de mayo indica \(\mu=0.4032\) \(\in IC_{(1-0.05)}(\mu)\). Dado el anterior parámetro \(\mu\) se afirma que la intención de voto hacia el candidato Petro no fue amañada.

RODOLFO HERNÁNDEZ

Con el candidato Hernández se tiene \(\bar{x}= 0.209\)

\[\begin{align*} IC_{(1-0.05)}(\mu) &= \left[0.209 \pm Z_{(0.05/2)} \cdot \sqrt{\dfrac{0.25}{2000}}\right] \\ &= 0.209 \pm 1.96 \cdot 0.01118\\ &= \left[0.1870, \hspace{0.25cm} 0.2309\right] \end{align*}\]

El IC para la media poblacional \(\mu\) del candidato Hernández está entre el \(18.7\%\) y el \(23\%\). El resultado de la primera vuelta presidencial del día 29 de mayo indica \(\mu=0.2815 \notin IC_{(1-0.05)}(\mu)\), cSe puede ver que el límite superior del intervalo de confianza dista un poco más de cinco puntos porcentuales, por lo que se puede deducir que los datos de la encuesta estaban maquillados en contra del candidato Hernández.

SERGIO FAJARDO

Con el candidato Fajardo se tiene \(\bar{x}= 0.051\)

\[\begin{align*} IC_{(1-0.05)}(\mu) &= \left[0.051 \pm Z_{(0.05/2)} \cdot \sqrt{\dfrac{0.25}{2000}}\right] \\ &= 0.051 \pm 1.96 \cdot 0.01118\\ &= \left[0.0290 \hspace{0.25cm} 0.0729 \right] \end{align*}\]

El IC para la media poblacional \(\mu\) del candidato Fajardo está entre el \(2.9\%\) y el \(7.29\%\). Veamos que \(\mu=0.042\in IC_{(1-0.05)}(\mu)\). AAsí que es posible afirmar que la intención de voto hacia este candidato no ha sido maquillada o inflada por la firma encuestadora.

ENCUESTA GUARUMO Y ECOANALÍTICA

Para El Tiempo

La encuesta Guarumo y EcoAnalítica dio a conocer las proyecciones para la primera vuelta presidencial recogida entre el 25 y 29 de abril, justo un mes antes de la contienda. A continuación se muestran los resultados del estudio:

ASPECTOS TÉCNICOS

Según datos recogidos de la ficha técnica publicada por la empresa que realizó la encuesta sabemos que se tiene un tamaño de muestra de \(2132\) y una confianza \(\mathbf{(1-\alpha)}\) del \(95\%\). Se direcciona a la ficha técnica completa en este enlace.

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL \(\mu\)

FEDERICO GUTIÉRREZ

Con el candidato Gutiérrez se tiene \(\bar{x}= 0.306\)

\[\begin{align*} IC_{(1-0.05)}(\mu) &= \left[ 0.306 \pm Z_{(0.05/2)} \cdot \sqrt{\dfrac{0.25}{2132}}\right] \\ &= 0.306 \pm 1.96 \cdot 0.010828\\ &= \left[0.2847, \hspace{0.25cm} 0.3272\right] \end{align*}\]

El IC para la media poblacional \(\mu\) del candidato Federico en la encuesta para el diario El Tiempo está entre el \(28.47\%\) y el \(32.72\%\).

El resultado de la primera vuelta presidencial del día 29 de mayo indica \(\mu=0.2391 \notin IC_{(1-0.05)}(\mu)\) por tanto la encuesta muy posiblemente está amañada a favor de este candidato ya que \(\mu\) se sale por más de 4 puntos porcentuales.

GUSTAVO PETRO

Con el candidato Petro se tiene \(\bar{x}= 0.364\)

\[\begin{align*} IC_{(1-0.05)}(\mu) &= \left[0.364 \pm Z_{(0.05/2)} \cdot \sqrt{\dfrac{0.25}{2132}}\right] \\ &= 0.364 \pm 1.96 \cdot 0.010828\\ &= \left[0.3427, \hspace{0.25cm} 0.3852\right] \end{align*}\]

El IC para la media poblacional \(\mu\) del candidato Petro en la encuesta para el diario El Tiempo está entre el \(34.27\%\) y el \(38.52\%\). El resultado de la primera vuelta presidencial del día 29 de mayo indica \(\mu=0.4032 \notin IC_{(1-0.05)}(\mu)\) luego posiblemente la encuesta está amañada, perjudicando de esta manera su intención de voto.

RODOLFO HERNÁNDEZ

Con el candidato Hernández se tiene \(\bar{x}= 0.124\)

\[\begin{align*} IC_{(1-0.05)}(\mu) &= \left[ 0.124 \pm Z_{(0.05/2)} \cdot \sqrt{\dfrac{0.25}{2132}}\right] \\ &= 0.124 \pm 1.96 \cdot 0.010828\\ &= \left[0.1027, \hspace{0.25cm} 0.1452\right] \end{align*}\]

El IC para la media poblacional \(\mu\) del candidato Hernández en la encuesta para el diario El Tiempo está entre el \(10.27\%\) y el \(14.5\%\).

El resultado de la primera vuelta presidencial del día 29 de mayo indica \(\mu=0.2815 \notin IC_{(1-0.05)}(\mu)\), luego la encuesta contrasta fuertemente con la realidad pues el extremo superior del IC para \(\mu\) dista por más de 13 puntos porcentuales. En este sentido muy probablemente la encuesta maquilla la verdadera intención de voto hacia el candidato Rodolfo Hernández.

SERGIO FAJARDO

Con el candidato Fajardo se tiene \(\bar{x}= 0.069\)

\[\begin{align*} IC_{(1-0.05)}(\mu) &= \left[ 0.069 \pm Z_{(0.05/2)} \cdot \sqrt{\dfrac{0.25}{2132}}\right] \\ &= 0.069 \pm 1.96 \cdot 0.010828\\ &= \left[0.0477, \hspace{0.25cm} 0.0902\right] \end{align*}\]

El IC para la media poblacional \(\mu\) del candidato Fajardo en la encuesta para el diario El Tiempo está entre el \(4.7\%\) y el \(9\%\). El resultado de la primera vuelta presidencial del día 29 de mayo indica \(\mu=0.042\notin IC_{(1-0.05)}(\mu)\) sin embargo el extremo inferior del intervalo de confianza no dista mucho del parámetro \(\mu\). Luego es posible que haya sido un error metodológico y no como tal un acto para inflar los valores del candidato Fajardo.

ENCUESTA YANHAAS

Para RCN Radio, La FM, NTN24, El Heraldo, entre otras

La firma YanHaas Advanced Market Research reveló los resultados de su encuesta que llevaron a cabo durante el pasado 30 de abril hasta el 7 de mayo. A continuación se muestran dichos resultados:

ASPECTOS TÉCNICOS

Se realizaron \(1232\) encuestas en 60 municipios del país y una confianza del \(95\%\) Se puede ver la ficha técnica completa en el siguiente enlace

ANÁLISIS PARA MAXIMIXAR LA VARIANZA \(\sigma^{2}\)

Como en los casos anteriores, tenemos que “Sea \(X_i:=\) ‘El i-ésimo ciudadano vota o no por YYYYYY candidato’. Sabemos que \(X_i \sim Bernoulli(p)\) donde \(p\) corresponde a la intención de voto por YYYYYY candidato presidencial”.

Por lo que la varianza será la misma que en los casos anteriores y tenemos que su valor máximo será de \(0.25\)

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL \(\mu\)

Sabemos que el IC para \(\mu\) está dado por:

\[\begin{align*} IC_{(1-\alpha)}(\mu)= \left[\bar{x} \pm Z_{(\alpha/2)} \cdot \sqrt{\dfrac{\sigma^{2}}{n}}\right] \end{align*}\]

En este caso vamos a hacer el análisis personalizado para cada candidato y recordamos que tenemos un \(n = 1232\) y \(\sigma^{2} = 0.25\)

FEDERICO GUTIÉRREZ

Gracias a los datos recogidos por la firma YanHaas, sabemos que Federico Gutiérrez tiene \(\bar{x}= 0.21\), por lo tanto su intervalo de confianza será:

\[\begin{align*} IC_{(1-0.05)}(\mu) &= \left[0.21 \pm Z_{(0.05/2)} \cdot \sqrt{\dfrac{0.25}{1232}}\right] \\ &= 0.21 \pm 1.96 \cdot 0.014245\\ &= \left[0.1820, \hspace{0.25cm} 0.2379\right] \end{align*}\]

El IC para la media poblacional \(\mu\) del candidato Gutiérrez está entre el \(18.2\%\) y el \(23.79\%\). El resultado de la primera vuelta presidencial del día 29 de mayo indica \(\mu=0.2391 \notin IC_{(1-0.05)}(\mu)\), sin embargo notemos que el parámetro \(\mu\) está muy cerca del extremo superior del intervalo de confianza, por lo cual es posible afirmar que la encuesta no está amañada para este candidato.

GUSTAVO PETRO

Gracias a los datos recogidos por la firma YanHaas, sabemos que Gustavo Petro tiene \(\bar{x}= 0.4\), por lo tanto su intervalo de confianza será:

\[\begin{align*} IC_{(1-0.05)}(\mu) &= \left[0.4 \pm Z_{(0.05/2)} \cdot \sqrt{\dfrac{0.25}{1232}}\right] \\ &= 0.4 \pm 1.96 \cdot 0.014245\\ &= \left[0.3720, \hspace{0.25cm} 0.4279\right] \end{align*}\]

El IC para la media poblacional \(\mu\) del candidato Petro está entre el \(37.2\%\) y el \(42.79\%\). El resultado de la primera vuelta presidencial del día 29 de mayo indica \(\mu=0.4032 \in IC_{(1-0.05)}(\mu)\) por tanto la encuesta no está amañada para este candidato..

RODOLFO HERNÁNDEZ

Gracias a los datos recogidos por la firma YanHaas, sabemos que Rodolfo Hernández tiene \(\bar{x}= 0.12\), por lo tanto su intervalo de confianza será:

\[\begin{align*} IC_{(1-0.05)}(\mu) &= \left[0.12 \pm Z_{(0.05/2)} \cdot \sqrt{\dfrac{0.25}{1232}}\right] \\ &= 0.12 \pm 1.96 \cdot 0.014245\\ &= \left[0.0920, \hspace{0.25cm} 0.1479\right] \end{align*}\]

El IC para la media poblacional \(\mu\) del candidato Hernández está entre el \(9.2\%\) y el \(14.79\%\). El resultado de la primera vuelta presidencial del día 29 de mayo indica \(\mu=0.2815 \notin IC_{(1-0.05)}(\mu)\). Es bastante notoria la diferencia entre el extremo superior del intervalo de confianza y el parámetro \(\mu\). No obstante, notemos que la fecha de realización de esta encuesta fue la primera semana de mayo y este candidato creció una cantidad considerable en las semanas cercanas a la primera vuelta; esto puede explicar un poco la imprecisión del intervalo de confianza. Aún así no se descarta que la encuesta haya sido amañada.

SERGIO FAJARDO

Gracias a los datos recogidos por la firma YanHaas, sabemos que Sergio Fajardo tiene \(\bar{x}= 0.07\), por lo tanto su intervalo de confianza será:

\[\begin{align*} IC_{(1-0.05)}(\mu) &= \left[0.07 \pm Z_{(0.05/2)} \cdot \sqrt{\dfrac{0.25}{1232}}\right] \\ &= 0.07 \pm 1.96 \cdot 0.014245\\ &= \left[0.0420, \hspace{0.25cm} 0.0979\right] \end{align*}\]

El IC para la media poblacional \(\mu\) del candidato Gutiérrez está entre el \(4.2\%\) y el \(9.79\%\). El resultado de la primera vuelta presidencial del día 29 de mayo indica \(\mu=0.042 \in IC_{(1-0.05)}(\mu)\), de este modo la encuesta parece no haber sido alterada con fines de perjudicar o favorecer al candidato Fajardo.

CONTRASTE DE ENCUESTAS

En la siguiente figura se observa la intención de voto a los cuatro candidatos considerados en este documento diferenciando las proyecciones de cada una de las firmas encuestadoras.

A grandes rasgos como se contempla en la figura anterior todas las firmas encuestadoras fueron bastante imprecisas, en particular con un candidato. Invamer y la firma YanHaas S.A.S reflejan más precisión en sus estudios, mientras que Guarumo y EcoAnalítica resulta ser la menos acertada de las tres: Con el candidato Gutiérrez la que más cerca estuvo fue YanHaas y la que más se rajó fue la firma Guarumo; con respecto al candidato Petro todas estuvieron muy cerca del parámetro que se estimaba; con el candidato Hernández todas estuvieron bastante lejos de predecir o estimar el parámetro de interés, esto puede deberse a los cambios en las tendencias globales debido al golpe de opinión que Hernández dio en redes y en su campaña en general; y con el candidato Fajardo todas estuvieron bastante cerca.

En conclusión se puede afirmar que el estudio hecho por la firma Invamer es el estudio más preciso y más aferrado a los resultados del día 29 de mayo de 2022, esto puede deberse a que fue la última encuesta realizada: menor tiempo entre la toma de datos y el día de las elecciones. En este sentido se recomienda tomar con pinzas la información que se exhibe en las encuestas de tipo electoral en Colombia.