Una regresion lineal se entiende como una técnica estadística que se utiliza para encontrar una relación matemática simple entre una variable independiente (causa) y una variable dependiente (efecto). En términos simples, se trata de trazar una línea recta en un gráfico que mejor se ajuste a los datos, de modo que puedas predecir el valor de la variable dependiente en función de la variable independiente. Esta línea se llama “línea de regresión” y se utiliza para hacer predicciones o entender cómo cambia una variable en respuesta a cambios en la otra.
La ecuación de la regresión lineal simple es:
\[y = b_0 + b_1x\]
Donde:
- \(y\) es la variable dependiente que estamos tratando de predecir.
- \(x\) es la variable independiente que utilizamos para hacer la predicción.
- \(b_0\) es el intercepto (el valor de \(y\) cuando \(x\) es igual a cero).
Se realizo una encuesta en la que se determinaba la preferencia de los usuarios dada una situacion de contexto que es la siguiente: “Suponga que se aproxima una nueva pandemia con las mismas características que la anterior, y que solo usted tiene conocimiento del hecho, por lo cual debe abastecerse para los próximos 6 meses de PAPEL HIGIENICO (4 rollos por pack, doble hoja marca Suave Gold x 34 metros), recuerde que usted vive solo por lo cual es el único en consumir el producto y no existe posibilidad de revender el mismo.
Con el anterior contexto, responda las siguientes preguntas. ”
Con la encuesta obtuvimos los resultados representados en el informe, procesados con el lenguaje de programacion de R, en las siguientes lineas podra ver el codigo usado
papel=read.csv("https://docs.google.com/spreadsheets/d/e/2PACX-1vQ9_hAMLLKzXxxIywjnUmPV5unRtASPaxgZqjncq3AgER0nbFOYG3VDwTD4H1E2gREZ1dr-4sCy-rFh/pub?output=csv")
names(papel)
colnames(papel)=c("fecha","sexo","edad","8000","10000","12000","15000","18000","20000","25000","30000")
library(tidyverse)
df= papel %>% gather("Precio", "Cantidades", c(4:10))
attach(df)
names(df)
df$Precio= as.numeric(df$Precio)
attach(df)
regresion=lm(Cantidades~Precio, data=df)
regresion
predict(regresion)
####interpretación del beta
-0.000268*12000
-0.000268*22000
### predicción
datos.nuevos=data.frame(Precio=c(16000,17500,23500))
predict(regresion,datos.nuevos )
### Elasticidad
abs(-0.0002226*(mean(Precio)/mean(Cantidades)))
### Correlación de pearson -1< corr<1
cor(Cantidades,Precio)
Con el mismo obtuvimos un B1=-0.0002226 lo que representa el cambio que tendran las cantidades con cada variacion de precio, parecido a la elasticidad o el indice de correlacion de pearson.
El índice de correlación de Pearson, también conocido como coeficiente de correlación de Pearson o simplemente coeficiente de correlación, es una medida estadística que evalúa la relación lineal entre dos variables continuas. En el contexto de la economía, se utiliza para analizar la relación entre dos variables económicas, como el PIB y el consumo, el desempleo y la inflación, etc. El coeficiente de correlación de Pearson proporciona información sobre la fuerza y la dirección de la relación entre estas variables.
La fórmula del coeficiente de correlación de Pearson se expresa en LaTeX de la siguiente manera:
\[ r = \frac{\sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum_{i=1}^{n} (x_i - \bar{x})^2}\sqrt{\sum_{i=1}^{n} (y_i - \bar{y})^2}} \]
Donde:
- \(r\) es el coeficiente de correlación de Pearson.
- \(n\) es el número de observaciones.
- \(x_i\) y \(y_i\) son los valores de las dos variables en la i-ésima observación.
El coeficiente de correlación de Pearson varía en el rango de -1 a 1. Un valor de 1 indica una correlación positiva perfecta, -1 indica una correlación negativa perfecta, y 0 indica que no hay correlación lineal entre las dos variables.
Es importante recordar que el coeficiente de correlación de Pearson solo mide la relación lineal entre las variables y puede no capturar relaciones no lineales. También es vulnerable a valores atípicos en los datos. Por lo tanto, siempre es importante realizar un análisis completo de los datos antes de interpretar los resultados del coeficiente de correlación de Pearson en el contexto económico.