La regresión lineal es un modelo matemático utilizado para describir la relación entre una variable dependiente 𝑌 Y y una o más variables independientes 𝑋 X. Su objetivo es ajustar una ecuación lineal que minimice la suma de los errores cuadráticos entre los valores observados y los valores predichos por el modelo. La forma general de una regresión lineal.
library(readxl)
EDIT_X_2019_2020 <- read_excel("C:/Users/zahid andres/Desktop/EDIT_X_2019_2020.xltx")
str(EDIT_X_2019_2020$I1R1C1N)#independiente variable
## num [1:6798] 2 2 2 2 2 2 2 2 2 2 ...
str(EDIT_X_2019_2020$I1R3C1N)# variable dependiente
## num [1:6798] 2 2 2 2 2 2 2 2 2 2 ...
str(EDIT_X_2019_2020$I1R2C1N)# independiente variable
## num [1:6798] 2 2 2 2 2 2 2 2 2 2 ...
EDIT_X_2019_2020$I1R1C1N <- as.numeric(EDIT_X_2019_2020$I1R1C1N)
#Indica si una empresa ha desarrollado bienes o servicios nuevos que son únicos para la empresa, pero ya existían en el mercado #nacional e internacional.
EDIT_X_2019_2020$I1R3C1N <- as.numeric(EDIT_X_2019_2020$I1R3C1N)#Bienes o servicios nuevos en el mercado internacional. Si=1,No=2
#Número total de bienes o servicios nuevos únicamente para la empresa durante el período 2019-2020.
EDIT_X_2019_2020$I1R2C1N <- as.numeric(EDIT_X_2019_2020$I1R2C1N)
#Indica si la empresa desarrolló bienes o servicios nuevos que eran novedosos en el mercado nacional pero ya existían en el #mercado internacional.
plot(EDIT_X_2019_2020$I1R3C1N,EDIT_X_2019_2020$I1R2C1N,col="darkblue",main="desarrolla la empresa a nivel internacional y nacional ",xlab="Bienes o servicios nuevos en el mercado", ylab="Bienes o servicios nuevos en el mercado nacional",pch=20)
#como tal este grafico se aprecia que no tiene un atismo de logica, pero apra eso existe la misma regresion lineal con la cual podemos saber si existe una relacion entre variables, sin la necesidad de la interpretacion grafica.
#acontinuacion haremos mostraremos un ejemplo frente a la regresion lineal, la cual, no necesita explicacion grafica
cor.test(EDIT_X_2019_2020$I1R3C1N,EDIT_X_2019_2020$I1R2C1N)
##
## Pearson's product-moment correlation
##
## data: EDIT_X_2019_2020$I1R3C1N and EDIT_X_2019_2020$I1R2C1N
## t = 29.097, df = 6796, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.3115227 0.3538032
## sample estimates:
## cor
## 0.3328302
modelo1=lm(EDIT_X_2019_2020$I1R3C1N ~ EDIT_X_2019_2020$I1R2C1N + EDIT_X_2019_2020$I1R1C1N)
summary(modelo1)
##
## Call:
## lm(formula = EDIT_X_2019_2020$I1R3C1N ~ EDIT_X_2019_2020$I1R2C1N +
## EDIT_X_2019_2020$I1R1C1N)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.00014 -0.00014 -0.00014 -0.00014 0.15814
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.683588 0.010745 156.682 < 2e-16 ***
## EDIT_X_2019_2020$I1R2C1N 0.153238 0.005400 28.375 < 2e-16 ***
## EDIT_X_2019_2020$I1R1C1N 0.005036 0.001304 3.861 0.000114 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.03022 on 6795 degrees of freedom
## Multiple R-squared: 0.1127, Adjusted R-squared: 0.1125
## F-statistic: 431.6 on 2 and 6795 DF, p-value: < 2.2e-16
modelo1$coefficients
## (Intercept) EDIT_X_2019_2020$I1R2C1N EDIT_X_2019_2020$I1R1C1N
## 1.683588015 0.153238102 0.005035552