U1A8

HéctorZapata

25/9/2020

library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc", "readr", "knitr", "DT", "scales", "tidyverse", "gridExtra", "modeest", "fdth")

Importamos los datos.

Datos sobre el nivel de aumento de software en mexico.

library(readr)

datosMex <- read_csv("C:\\Users\\progr\\OneDrive\\Documentos\\Probabilidad y Estadistica\\DatosRelacionSoftwareEconomiaMexico.csv", 
    col_types = cols(Software = col_number(), 
        Economia = col_number()))
names(datosMex)
## [1] "Software" "Economia"
datatable(datosMex)

Visualizamos los datos.

Visualizacion del incremento en busquedad e implementacion de software en mexico.

head(datosMex)
## # A tibble: 6 x 2
##   Software Economia
##      <dbl>    <dbl>
## 1       95       71
## 2       90       69
## 3       82       66
## 4       76       60
## 5       70       51
## 6       70       56

Analisis de correlación

Matriz de diagramas de dispercion

pairs(datosMex)

## Matriz de correlación ### A continuacion se hara una cuantificacion del grado de relacion lineal, por medio de la matriz de coeficientes de correlacion

cor(datosMex)
##           Software  Economia
## Software 1.0000000 0.8822256
## Economia 0.8822256 1.0000000

Recta de minimos cuadrados

reg <- lm(formula = datosMex,data = datosMex)
summary(reg)
## 
## Call:
## lm(formula = datosMex, data = datosMex)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -18.1193  -4.1260  -0.3152   4.1105  20.7861 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 25.13278    1.23560   20.34   <2e-16 ***
## Economia     0.70946    0.02353   30.16   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 6.656 on 259 degrees of freedom
## Multiple R-squared:  0.7783, Adjusted R-squared:  0.7775 
## F-statistic: 909.4 on 1 and 259 DF,  p-value: < 2.2e-16

Obtenemos la ecuacions de los minimos cuadrados

\[y=25.13278+ 0.70946x\]

Graficas de la recta de minimos cuadrados

plot(datosMex$Economia, datosMex$Software, xlab = "Economia", ylab="Software")
abline(reg)

Confianza de nuestro modelo

confint(reg)
##                  2.5 %     97.5 %
## (Intercept) 22.6996688 27.5658838
## Economia     0.6631317  0.7557873

Calculo de y predicciones de nuestro modelo

newLevel <- data.frame(Economia=seq(30,50))
predict(reg,newLevel)
##        1        2        3        4        5        6        7        8 
## 46.41656 47.12602 47.83548 48.54494 49.25440 49.96386 50.67332 51.38278 
##        9       10       11       12       13       14       15       16 
## 52.09224 52.80170 53.51116 54.22062 54.93008 55.63954 56.34900 57.05845 
##       17       18       19       20       21 
## 57.76791 58.47737 59.18683 59.89629 60.60575

Representaremos los intervalos de confianza en la tabla

plot(datosMex$Economia, datosMex$Software, xlab = "Economia", ylab="Software")
abline(reg)

intervaloConfianza <- predict(reg,newLevel, interval= "confidence")
lines(newLevel$Economia, intervaloConfianza[, 2], lty=2, col="red")
lines(newLevel$Economia, intervaloConfianza[, 3], lty=2, col="red")

intervaloConfianza <- predict(reg,newLevel, interval= "prediction")
lines(newLevel$Economia, intervaloConfianza[, 2], lty=2, col="blue")
lines(newLevel$Economia, intervaloConfianza[, 3], lty=2, col="blue")

Conclusión

Podemos observar como los datos están no un poco relaciónanos si no muy relacionados, esto se debe a el enorme crecimiento de México en cuanto a economía por la vía del software y ciudades como, México df, Guadalajara, Monterrey y Querétaro son las más avanzadas en cuanto a economía y desarrollo tecnológico hablamos. así que se puede concluir que gracias a la tecnología estas ciudades antes mencionadas han crecido tanto y por ende México también lo hace