library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc", "readr", "knitr", "DT", "scales", "tidyverse", "gridExtra", "modeest", "fdth")
Importamos los datos.
Datos sobre el nivel de aumento de software en mexico.
library(readr)
datosMex <- read_csv("C:\\Users\\progr\\OneDrive\\Documentos\\Probabilidad y Estadistica\\DatosRelacionSoftwareEconomiaMexico.csv",
col_types = cols(Software = col_number(),
Economia = col_number()))
names(datosMex)
## [1] "Software" "Economia"
Visualizamos los datos.
Analisis de correlación
Matriz de diagramas de dispercion
## Matriz de correlación ### A continuacion se hara una cuantificacion del grado de relacion lineal, por medio de la matriz de coeficientes de correlacion
## Software Economia
## Software 1.0000000 0.8822256
## Economia 0.8822256 1.0000000
Recta de minimos cuadrados
##
## Call:
## lm(formula = datosMex, data = datosMex)
##
## Residuals:
## Min 1Q Median 3Q Max
## -18.1193 -4.1260 -0.3152 4.1105 20.7861
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 25.13278 1.23560 20.34 <2e-16 ***
## Economia 0.70946 0.02353 30.16 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 6.656 on 259 degrees of freedom
## Multiple R-squared: 0.7783, Adjusted R-squared: 0.7775
## F-statistic: 909.4 on 1 and 259 DF, p-value: < 2.2e-16
Obtenemos la ecuacions de los minimos cuadrados
\[y=25.13278+ 0.70946x\]
Graficas de la recta de minimos cuadrados
Confianza de nuestro modelo
## 2.5 % 97.5 %
## (Intercept) 22.6996688 27.5658838
## Economia 0.6631317 0.7557873
Calculo de y predicciones de nuestro modelo
## 1 2 3 4 5 6 7 8
## 46.41656 47.12602 47.83548 48.54494 49.25440 49.96386 50.67332 51.38278
## 9 10 11 12 13 14 15 16
## 52.09224 52.80170 53.51116 54.22062 54.93008 55.63954 56.34900 57.05845
## 17 18 19 20 21
## 57.76791 58.47737 59.18683 59.89629 60.60575
Representaremos los intervalos de confianza en la tabla
plot(datosMex$Economia, datosMex$Software, xlab = "Economia", ylab="Software")
abline(reg)
intervaloConfianza <- predict(reg,newLevel, interval= "confidence")
lines(newLevel$Economia, intervaloConfianza[, 2], lty=2, col="red")
lines(newLevel$Economia, intervaloConfianza[, 3], lty=2, col="red")
intervaloConfianza <- predict(reg,newLevel, interval= "prediction")
lines(newLevel$Economia, intervaloConfianza[, 2], lty=2, col="blue")
lines(newLevel$Economia, intervaloConfianza[, 3], lty=2, col="blue")
Conclusión
Podemos observar como los datos están no un poco relaciónanos si no muy relacionados, esto se debe a el enorme crecimiento de México en cuanto a economía por la vía del software y ciudades como, México df, Guadalajara, Monterrey y Querétaro son las más avanzadas en cuanto a economía y desarrollo tecnológico hablamos. así que se puede concluir que gracias a la tecnología estas ciudades antes mencionadas han crecido tanto y por ende México también lo hace