Instrucciones

Un conglomerado de empresas dedicadas a la realización de actividades de mercadotecnia y publicidad, desea informar a un cliente la relación que existe entre el número de anuncios pagados a una cadena de televisión local, y los ingresos generados como consecuencia durante los últimos meses. El análisis de la información es fundamental para la elaboración del presupuesto de gastos publicitarios de los próximos meses.

Anuncios e Ingresos
Anuncios e Ingresos

De acuerdo con lo anterior:

  • Elabora un diagrama de dispersión al tomar en cuenta las variables \(x\) y también \(y\).

  • Una vez elaborado el diagrama responde si la relación que existe entre las variables es directa, inversa o nula.

  • Confirma cuál es la variable independiente y cuál es la dependiente.

  • Calcula el coeficiente o intercepto a, también conocido como \(\beta_0\) por algunos autores.

  • Calcula el coeficiente de regresión b, también conocido como \(\beta_1\) por algunos autores.

  • Presenta la ecuación de regresión.

  • Estima el nivel de ingresos que podrían generarse si la empresa comprara 400 anuncios.

  • Calcula y presenta el coeficiente de determinación \(r^2\).

  • Una vez obtenidos los datos anteriores y para concluir, explica si la variable independiente explica el comportamiento de la variable dependiente.

Procedimiento

Datos

Como primer paso debemos declarar nuestras variables \(x\) y \(y\).

library(readxl)
datos <- read_excel("~/Downloads/base9.xlsx")
datos
x<-datos$Anuncios
y<-datos$Ingresos
mes<-datos$Mes

Diagrama de dispersión

Usando la función plot podremos crear el gráfico de dispersión con respecto de las variables.

coloa<-rainbow(12)
with(datos, plot(Anuncios, Ingresos, col= coloa, xlab="Anuncios", ylab="Ingresos"))

Tras presentar el gráfico podemos decir que la relación que existe entre las variables es Directa pues cuando los Anuncios aumentan, los Ingresos se elevan.

Con lo anterior podemos confirmar que como la variable \(x=ANUNCIOS\) es la variable independiente y la variable \(y=Ingreos\) es la dependiente pero esto lo veremos una vez que tengamos nuestro modelo de regresión lineal. <>

Obteniendo \(\beta_0\) y \(\beta_1\)

Para llegar a calcular \(\beta_0\) utilizaremos el método de mínimos cuadrados primero debemos realizar el cálculo de \(\beta_1\) con el siguiente desarrollo: \[\beta_1=\frac{\sum{(x_i-\bar{x})(y_i-\bar{y})}}{\sum{(x_i-\bar{x})^2}}\] \[\beta_0=\bar{y}-\beta_1(x)\]

Entonces, de nuestra tabla, añadiremos las filas y columnas de los cálculos que se requieren. <>

Ahora con los datos, procedemos a obtener los valores:

\[ \beta_1=\frac{942343.75}{110794.9167}=8.505 \]

Por lo tanto, el siguiente valor: \[\beta_0=2331.25-8.505(2309)=694.689\]

Ecuación de la recta

Gracias a que sabemos los valores de las betas, ahora podemos hacer predicciones para darnos una idea de los Ingresos si aumentamos los Anuncios, estas predicciones tiene el nombre de estimaciones, por lo que nuestro modelo lineal pasa a ser un modelo de estimación para los Ingresos. \[\hat{y}=a+bx=b_o+b_1x\]

Lo que implica \[\hat{y}=694.689+8.505x\] <>

Estimando los ingresos

Si queremos conocer cuales serán los ingresos si se compran 400 anuncios, entonces debemos de sustituir este valor en \(x\) y calcular \(\hat{y}\):

\[\hat{y}=694.689+8.505(400)\] \[\hat{y}=4096.689\]

y<-694.689+(8.505*400)
y
## [1] 4096.689

Los ingresos estimados por 400 anuncios sería $4,096.7 <>

Cálculo de \(R^2\)

Para poder dar el resultado del Coeficiente de Determinación (\(r^2\)), es necesario antes realizar algunas sumas. <>

Suma de cuadrados debido al error

Esta la diferencia que existe en la observación \(i\), entre el valor observado de la variable dependiente \(y_i\), y el valor estimado de la variable \(\hat{y_i}\), denotada por: \[SCE=\sum{(y_i-\hat{y_i})}\] <>

Suma de cuadrados debido a la regresión

Permite medir la desviación de los valores \(\bar{y}\) de la recta de regresión, con la siguiente sucesión: \[SCR=\sum{(\hat{y_i}-\bar{y})^2}\] <>

Suma total de cuadrados

Siendo la medida del error al usar \(\bar{y}\) para estimaciones de valores dependiente y se denota: \[STC=\sum{(y_i-\bar{y})^2}=SCR+SCE\]

Procedemos a realizar estas sumatorias para poder obtener el coeficiente:

Ahora podremos calcular \(r^2\), por lo tanto: \[r^2=\frac{SCR}{STC}\] \[r^2=\frac{8014914.13}{8678906.25}=0.923\]

r2<-scr/stc
r2
## [1] 0.9234936

Este valor nos dice que las variables se ajustan al modelo de regresión lineal elaborado. <>

Conclusión

La variable independiente en este caso “Anuncios”, explica la variable dependiente “Ingresos”. Podemos afirmar, tras haber realizado el modelo que entre más Anuncios se hagan, mayores serán los Ingresos, por lo que la empresa debería invertir en los anuncios si desean aumentar sus ganancias. <>