Dentro de este trabajo se realizar? un acercamiento al efecto del PIB para Singapure bajo un el modelo lineal donde trataremos de explicar el crecimiento porcentual del PIB de Singapur respecto al crecimiento porcentual del PIB de sus socios comerciales. Por tanto es necesario antes que nada, realizar una serie de procedimientos visperos a proponer el modelo lineal que explique el PIB de singapure en funci?n de sus socios comerciales, con el fin de demostrar la sustracci?n de datos. Luego, propondremos el modelo lineal que probaremos con el fin de tratar de explicar el efecto de los principales socios comerciales al PIB de Singapur, dentro de este fragmento del trabajo, dividiremos en dos partes la relaci?n del PIB de Singapur con respecto al PIB de los socios comerciales.
La primera parte, contendr? los datos de los principales socios comerciales de consumo de bienes y servicios de Singapur (con sus respectiva variaci?n de PIB?s), es decir, los clientes y compradores principales de Singapure. La segunda parte, tratar? de explicar el efecto o crecimeinto de la variaci?n del PIB de Singapur con respecto de sus proveedores principales o con los origenes principales de bienes y servicios. Despues de este an?lisis se pretende dar recomencaciones basadas en los resultados preliminares del efecto en el PIB de Singapure y daremos un concepto en el que se denotar? el efecto de usar clientes socios comerciales o proveedores socios comerciales.
Antes que nada los datos se sustragen de los datos del Observatorio de Complejidad Econ?mica, OEC (The Observatory of Economic Complexity) por sus siglas en ingl?s. Dentro de dicho observatorio se encuentra una herramienta de observaci?n econ?mica que precisa el p?rfil por pa?s, dentro de ?sta herramiento se encuentra la participaci?n comercial de un pa?s con sus principales socios, productos de exportaci?n, productos de importaci?n y balanza comercial. ?nicamente por ahora buscaremos la participaci?n de los principales Origenes de las Importaciones de Singapur y los principales destinos de la Exportaciones. Se observ? que los principales origenes de las importaciones de Singapur son:
# Importamos el data frame desde el OEC y revisamos los primeros seis paises con m?s pocentaje de importaciones a Singapur. Tanto para principales destinos como principales origenes.
Data frame de principales Origenes de importaci?n:
# Importamos la base descargada en .csv y la le?mos en R.
library(readxl)
library(readr)
Origen_singapure_OEC <- read_excel("C:/Users/samorapa/OneDrive/Estudios/universidad/Economía Internacional/Proyecto de Aula 2/Anexos y Consolidados/Anexos OEC/data tratada/Origen_singapure_OEC.xlsx", sheet = "Origen_singapure_OEC")
names(Origen_singapure_OEC)
## [1] "year" "country_origin_id"
## [3] "country_destination_id" "hs92_product_id"
## [5] "import_val" "import_val_pct"
## [7] "X__1" "X__2"
## [9] "X__3" "X__4"
origenes <- Origen_singapure_OEC$import_val_pct
head(origenes)
## [1] 0.160 0.110 0.110 0.078 0.067 0.062
Dentro de la lista de paises que tienen son origenes de importaciones a Singapur, tenemos que China, Japon, Corea del Sur y Malaysia son los paises con mayor relaci?n de socios importadores comerciales.
Data frame de principales Destinos de Exportaci?n:
#Importamos la base de datos de socios comerciales de la OEC, ordenamos y elegimos los 4 con mayor relaci?n de destino de exportaciones.
library(readxl)
library(readr)
Destinos_singapure_OEC <- read_excel("C:/Users/samorapa/OneDrive/Estudios/universidad/Economía Internacional/Proyecto de Aula 2/Anexos y Consolidados/Anexos OEC/data tratada/Destinos_singapure_OEC.xlsx", sheet = "Destinos_singapure_OEC")
names(Destinos_singapure_OEC)
## [1] "year" "country_origin_id"
## [3] "country_destination_id" "hs92_product_id"
## [5] "export_val" "export_val_pct"
## [7] "X__1" "X__2"
## [9] "X__3" "X__4"
head(Destinos_singapure_OEC$export_val_pct)
## [1] 0.140 0.120 0.110 0.089 0.066 0.033
Tenemos entonces que los principales socios comerciales que m?s compran o son clientes de Singapur para sus bienes y servicios son: Hong Kong, China, Indonesia y Malaysia. Podemos entonces sustraer la informaci?n sobre los PIB de cada uno de los socios comerciales, tanto los clientes (destinos de exportaci?n) o los proveedores (origenes de importaciones).
Para el paso a seguir, fue necesario sustraer la informaci?n del Banco Mundial. Se conto cada uno de los PIB en valores porcentuales que representan el crecimiento del pa?s. Despues, se organizaron y transpusieron los datos del PIB de cada pa?s de forma que se pudiese comparar entre si (como priomera instancia), luego, como factores que explican los comportamientos o tendencias de la variaci?n porcentual del PIB. En los datos adjuntos se encuentran todas las bases de datos para ilustrar con mayor veracidad los procesos realizados. Estos procesos son guardados en el data frame “GDP_dara_R”.
Data frame, variaci?n de Clientes y principales socios comerciales.
#Exportamos el data frame "GDP_data" realizado en excel.
#Principales socios comerciales con destinos de exportaci?n.
library(readxl)
GDP_data_R <- read_excel("C:/Users/samorapa/OneDrive/Estudios/universidad/Economía Internacional/Proyecto de Aula 2/Anexos y Consolidados/Consolidados Fianles/GDP_data_R.xlsx", sheet = "data_costumers_Rdata")
View(GDP_data_R)
names(GDP_data_R)
## [1] "Country Code" "SGP" "CHN" "HKG"
## [5] "IDN" "MYS"
De esta forma tenemos que:
#Exportamos el data frame "GDP_data" realizado en excel.
#Principales socios comerciales con origen de importaci?n.
library(readxl)
GDP_data_R <- read_excel("C:/Users/samorapa/OneDrive/Estudios/universidad/Economía Internacional/Proyecto de Aula 2/Anexos y Consolidados/Consolidados Fianles/GDP_data_R.xlsx",
sheet = "data_suppliers_Rdata")
View(GDP_data_R)
names(GDP_data_R)
## [1] "Country Code" "SGP" "CHN" "JPN"
## [5] "KOR" "MYS"
Es decir, que para los principales socios comerciales con origen de importaci?n tenemos que son los mencionados, a continuaci?n se en?meran:
#Encabezado del GDP_data
head(GDP_data_R)
## # A tibble: 6 x 6
## `Country Code` SGP CHN JPN KOR MYS
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1961 8.137625 -27.27 12.043536 6.882402 7.597994
## 2 1962 7.121763 -5.58 8.908973 3.838921 6.421030
## 3 1963 9.984911 10.30 8.473642 9.190387 7.338804
## 4 1964 -3.680475 18.18 11.676708 9.459346 5.358963
## 5 1965 7.597241 16.95 5.819708 7.183699 7.684863
## 6 1966 10.871902 10.65 10.638562 11.983530 7.816711
Y ahora, tenemos la siguiente vista de las primeras columnas del Data frame. Con el fin de ilustrar el orden y desarrollo de los datos antes de proponer el modelo lineal en funci?n de la variaci?n porcentual del PIB de cada pa?s.
Para el desarrollo metodologico se propone un m?delo lineal de forma y=mx+b. Dentro del cual podemos enmarcar las variables en funci?n de las variables porcentuales del PIB de cada pais, es decir, tenedr?mos entonces dos m?delos lineales. El primer modelo, estar? en funci?n de la variaci?n porcentual del PIB de Singapur, dependiente de las variaciones porcentuales del PIB de los principales socios comerciales con destinos de exportaci?n. El segundo modelo, cumple con el mismo objetivo pero enmarcado en los principales socios comerciales con origen de importaciones, es decir, un modelo en el que se proponga explicar la variaci?n porcentual del PIB de Singapure en funci?n de sus principales proveedores. ?Que tratamos de explicar con estos modelos? Bien, si logramos generar una relaci?n lineal entre el crecimiento de la variaci?n porcentual del PIB de Singapur y el de sus principales clientes probaremos que a medida que su demanda como consumo de sus clientes, incrementar? gradualmente el PIB de singapur y por complemento podremos probar si se comprueba una relaci?n lineal entre Singapur y sus principales socios proveedores, de forma tal que comprobaremos que al aumentar el PIB de los paises o socios comerciales en calidad de proveedores se incrementar? el PIB de singapur.
No obstante cabe resaltar que ?nicamente se esta an?lizando la variable de crecimiento porcentual del PIB de cada pa?s, raz?n por la cual se podr? hacer oisi?n de algunos aspctos a los cuales tenemos conocimiento previ? que ser?an necesario para optimizar el modelo, sin embargo debido a la magnitud del trabajo y las sugerencias del profesor se omiten dichas variables y ?nicamente se proponen dos modelos con base en lo especificado con anterioridad.
Dentro de las sugerencias realizadas en clase se denota que al trabajar con las variaciones porcentuales del crecimiento del PIB de los paises seleccionados para el proceso de modelamiento, se aconsejo trabajar con el logaritmo de las variaciones porcentuales de los PIB. En resumen podemos apreciar los dos modelos lineales a trabajar de la siguiente manera:
Modelo Lineal 1:
Modelo Variaci?n Logaritmica del PIB de Singapur con paises clientes:
Log(SGP) = B0 + B1 * log(CHN) + B2 * log(HKN) + B3 * log(IND) + B4 * log(MYS)
por tanto tenemos un modelo log - log, Donde:
No obstante, despues de condensar los modelos y las relaciones lineales, ahora, trataremos de aplicar el Logar?tmo a los datos y linelizando los valores de la variaci?n porcentual del PIB y las variables que se encuentr?n involucradas en el proceso de funci?n lineal, acotando las sugerencias dadas en clase.
A continuaci?n es necesario realizar una limpieza de datos ya que al linealizar los datos pueden existir incongruencias con relaciones negativas. Raz?n por la cual se omitir?n las filas en donde no se teni?n datos o la existencia de los mismos era negativa. es decir que reducimos la muestra de crecimiento del PIB de los paises. A pesar de esto, a?n se puede considerar una muestra macroeconomica considerable para continuar.
Tratamiento de datos y linealizaci?n del PIB de Socios comerciales principales socios destino de exportaci?n
#Sustrayendo del dataframe las variables como vectores para linealizarlos.
#donde "GDP_data_R" es el dataframe editado con anterioridad.
library(readxl)
logdata <- read_excel("C:/Users/samorapa/OneDrive/Estudios/universidad/Economía Internacional/Proyecto de Aula 2/Anexos y Consolidados/Consolidados Fianles/GDP_data_R.xlsx",
sheet = "data")
Linealizaci?n de los Datos.
#Limpiando datos - valores perdidos en objetos y vectores del dataframe
na.omit(logdata)
## # A tibble: 56 x 8
## `Country Code` SGP CHN JPN KOR MYS HKG
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1961 8.137625 -27.27 12.043536 6.882402 7.597994 0.000000
## 2 1962 7.121763 -5.58 8.908973 3.838921 6.421030 14.290861
## 3 1963 9.984911 10.30 8.473642 9.190387 7.338804 15.764115
## 4 1964 -3.680475 18.18 11.676708 9.459346 5.358963 8.627597
## 5 1965 7.597241 16.95 5.819708 7.183699 7.684863 14.642164
## 6 1966 10.871902 10.65 10.638562 11.983530 7.816711 1.794772
## 7 1967 12.283537 -5.77 11.082142 9.116893 3.857146 1.603569
## 8 1968 13.618120 -4.10 12.882468 13.188629 7.977995 3.397519
## 9 1969 13.724676 16.94 12.477895 14.541235 4.888534 11.343735
## 10 1970 13.885640 19.30 -1.019913 9.997407 5.986539 9.206426
## # ... with 46 more rows, and 1 more variables: IDN <dbl>
Limpiando Datos pedidos.
# Limpiando datos perdidos o NaNs.
na.omit(logdata)
## # A tibble: 56 x 8
## `Country Code` SGP CHN JPN KOR MYS HKG
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1961 8.137625 -27.27 12.043536 6.882402 7.597994 0.000000
## 2 1962 7.121763 -5.58 8.908973 3.838921 6.421030 14.290861
## 3 1963 9.984911 10.30 8.473642 9.190387 7.338804 15.764115
## 4 1964 -3.680475 18.18 11.676708 9.459346 5.358963 8.627597
## 5 1965 7.597241 16.95 5.819708 7.183699 7.684863 14.642164
## 6 1966 10.871902 10.65 10.638562 11.983530 7.816711 1.794772
## 7 1967 12.283537 -5.77 11.082142 9.116893 3.857146 1.603569
## 8 1968 13.618120 -4.10 12.882468 13.188629 7.977995 3.397519
## 9 1969 13.724676 16.94 12.477895 14.541235 4.888534 11.343735
## 10 1970 13.885640 19.30 -1.019913 9.997407 5.986539 9.206426
## # ... with 46 more rows, and 1 more variables: IDN <dbl>
Resumen estadistico de cada variable.
# Resumen Estadistico de Singapur.
summary(logdata$SGP)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -3.680 4.903 7.867 7.428 10.308 15.240
# Resumen Estadistico de China.
summary(logdata$CHN)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -27.270 7.502 9.181 8.251 11.275 19.300
# Resumen Estadistico de Hong Kong.
summary(logdata$JPN)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -5.417 1.057 3.076 3.759 5.506 12.882
# Resumen Estadistico de Indonesia.
summary(logdata$KOR)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -5.471 4.806 7.672 7.504 10.376 14.828
# Resumen Estadistico de Malaysia.
summary(logdata$MYS)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -7.359 5.352 6.718 6.314 8.865 11.714
Ahora finalmente hemos limpiado los datos que vamos a evaluar, este proceso era necesario de realizar dado que no podemos permitir tener datos perdidos dentro del dataframe final del cual realizaremos la regresi?n en el modelo lineal. Iniciaremos con una matriz de diagramas de dispersi?n con la cual observaremos y podremos inferir la posibilidad de una relaci?n lineal. As? tambi?n observar los datos atipicos en los datos.
Matriz de diagrama de dispersi?n
#para realizar la matriz de diagramas de dispersi?n es necesario eliminar la columna de a?os. No obstante al estar vectorizados los datos, estos mantendran su relaci?n por filas.
logdata$`Country Code`=NULL #donde "Country Code" es el a?o de crecimiento del PIB.
pairs(logdata) #Matriz de diagramas de dispersi?n.
Con esta matriz podemos observar la relaci?n existente entre todos los PIB de los paises que se encuentran dentro del modelo sugerido, no obstante ser?a interesante ampliar la relaci?n entre el PIB de Singapur y el PIB uno a uno de los paises que la explican, esto acompa?ado por la matriz de coeficientes de relaci?n para cuantificar el grado de relaci?n lineal entre los logaritmos del PIB de los paises. Tenemos entonces, las siguientes 4 relaciones.
Matriz de Coeficiente de Correlaci?n y Varianza Covarianza.
cov(logdata)
## SGP CHN JPN KOR MYS HKG
## SGP 18.436948 -2.3905546 6.5687004 8.462205 9.519009 9.343018
## CHN -2.390555 48.9053549 -9.4497224 1.116451 -1.740452 6.038933
## JPN 6.568700 -9.4497224 15.4394988 8.161878 3.909364 6.402249
## KOR 8.462205 1.1164510 8.1618780 16.575837 7.018152 8.747695
## MYS 9.519009 -1.7404521 3.9093645 7.018152 11.792001 8.405402
## HKG 9.343018 6.0389333 6.4022485 8.747695 8.405402 22.230169
## IDN 6.205865 -0.6482148 0.9450561 5.160945 7.184880 4.333189
## IDN
## SGP 6.2058647
## CHN -0.6482148
## JPN 0.9450561
## KOR 5.1609453
## MYS 7.1848798
## HKG 4.3331894
## IDN 11.6949702
cor(logdata)
## SGP CHN JPN KOR MYS HKG
## SGP 1.00000000 -0.07961153 0.38933042 0.48406234 0.64558505 0.4614995
## CHN -0.07961153 1.00000000 -0.34389372 0.03921243 -0.07247532 0.1831516
## JPN 0.38933042 -0.34389372 1.00000000 0.51019448 0.28973156 0.3455768
## KOR 0.48406234 0.03921243 0.51019448 1.00000000 0.50198562 0.4557058
## MYS 0.64558505 -0.07247532 0.28973156 0.50198562 1.00000000 0.5191506
## HKG 0.46149954 0.18315157 0.34557678 0.45570577 0.51915062 1.0000000
## IDN 0.42262796 -0.02710449 0.07033013 0.37067385 0.61182355 0.2687427
## IDN
## SGP 0.42262796
## CHN -0.02710449
## JPN 0.07033013
## KOR 0.37067385
## MYS 0.61182355
## HKG 0.26874273
## IDN 1.00000000
Ahora podemos observar a su vez la matriz del coeficiente de correlaci?n para ver la metrica entre la relaci?n lineal que existente. Despues realizaremo finalmente el modelo de regresi?n multiple para comprobar finalmente la variaci?n y efecto entre el PIB de Singapure con respecto de los otros paises y socios comerciales.
Regresi?n Multiple, principales socios destino de exportaci?n
regresion_1 <- lm(SGP~CHN+HKG+IDN+MYS, data=logdata)
summary(regresion_1)
##
## Call:
## lm(formula = SGP ~ CHN + HKG + IDN + MYS, data = logdata)
##
## Residuals:
## Min 1Q Median 3Q Max
## -10.3740 -2.0129 -0.1927 1.6896 7.3037
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.38356 1.12702 2.115 0.03934 *
## CHN -0.04829 0.06646 -0.727 0.47075
## HKG 0.18294 0.11531 1.587 0.11879
## IDN 0.07790 0.16595 0.469 0.64077
## MYS 0.62224 0.18945 3.284 0.00185 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.318 on 51 degrees of freedom
## Multiple R-squared: 0.4465, Adjusted R-squared: 0.403
## F-statistic: 10.28 on 4 and 51 DF, p-value: 3.493e-06
Podemos apreciar que los coeficientes determinados bajo este modelo no son realmente significativos dentro de la relaci?n lineal que existe entre alguno de los PIB evaliados. No obstante podemos inferir que el modelo tiene 3 interceptos que no estructuran de forma eficiente el gr?fico, los coeficientes o betas de China, Hong Kong e Indonesia no aportan al modelo de forma significativa ya que a pesar de tener un R cuadrado cercano al 50% los estadisticos t de estos betas son valores demasiados bajos y con una significancia de 0.95 tendr?amos un alfa medios que no dejar?a aprobar las pruebas de hipotesis para estos betas, no obstante esto es secundado por la probabilidad del coeficiente es demasiado alta, llegando al 66% para china, 17% para Hong Kong y 70% para Indonesia. Incluyendo ademas que el estadistico F tiene un p-valor muy cercano a cero.
Es por tanto que se puede proponer dos situaciones, la primera en la que se realice la regresi?n con el logaritmo de Malaysia (ya que es el ?nico que pasa las pruebas de hipotesis) o replantear el modelo con un Nivel - nivel . Este ?ltimo implica el desarrollo nuevamnete de todos los procesos pero ser?a necesario de llevarlo a cabo en caso de que el modelo ?nicamente con Malaysia no tenga un R cuadrado alto y el coeficiente o beta de esta variable pase las pruebas de hipotesis.
Modelo ?nicamente con Malaysia
Primero disminuiremos las varibales del dataframe eliminando los PIB de China, Hong Kong e Indonesia. De esta forma, podremos ver la relaci?n entre Singapur y Malaysia.
logdata$CHN=NULL #Donde "CHN" es la exclusi?n del PIB de China.
logdata$HKG=NULL #Donde "HKG" es la exclusi?n del PIB de Hong Kong.
logdata$IDN=NULL #Donde "IDN" es la exclusi?n del PIB de Indonesia.
logdata$JPN=NULL #Donde "JPN" es la exclusi?n del PIB de Jap?n.
logdata$KOR=NULL #Donde "KOR" es la exclusi?n del PIB de Cor?a del Sur.
pairs(logdata) #Matriz de diagramas de dispersi?n.
library(ggplot2)
ggplot(logdata, aes(x=MYS, y=SGP))+geom_point(color="darkorange")+ggtitle("Relaci?n Lineal entre Singapure y Malaysia")+xlab("Malaysia")+ylab("Singapur")+geom_abline(color="darkblue")
Matrices de Varianza, Covarianza y Correlaci?n
cov(logdata) #Es la matriz de coeficiente de Correlaci?n entre el PIB de los dos paises.
## SGP MYS
## SGP 18.436948 9.519009
## MYS 9.519009 11.792001
cor(logdata) #Matriz de Correlaci?n entre Malaysia y Singapur.
## SGP MYS
## SGP 1.000000 0.645585
## MYS 0.645585 1.000000
var(logdata) #Matriz de varianza, Covarianza.
## SGP MYS
## SGP 18.436948 9.519009
## MYS 9.519009 11.792001
Podemos observar que existe una correlaci?n de 0.62% entre Malaysia y Singapur bajo el metodo de covarianza, sin embargo estos dos PIB tienen una Correlaci?n del 70% y una varianza-covarianza de 0.62% Con esto podemos evidenciar empiricamente la relaci?n lineal entre los PIB de los dos paises.
Regresi?n Lineal del PIB de Singapur en funci?n del PIB de MAlaysia
regresion_1.1 <- lm(SGP~MYS, data=logdata) #regresi?n del PIB de Singapur, dependiente del PIB de Malaysia
summary(regresion_1.1) #resultados de la regresi?n
##
## Call:
## lm(formula = SGP ~ MYS, data = logdata)
##
## Residuals:
## Min 1Q Median 3Q Max
## -10.3372 -2.4294 -0.3531 1.6450 7.4477
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.3308 0.9321 2.501 0.0155 *
## MYS 0.8072 0.1299 6.212 7.78e-08 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.309 on 54 degrees of freedom
## Multiple R-squared: 0.4168, Adjusted R-squared: 0.406
## F-statistic: 38.59 on 1 and 54 DF, p-value: 7.78e-08
Tenemos que el modelo basado en Malaysia con forma:
log(SGP) = B0 + B1 log(MYS)*
Es decir,
Log(SGP) = 0.1462 + 0.8507 log(MYS)*
Tiene una relevancia muy baja dado que existe ?nicamente un comportamiento explicado del 41,6%. No obstante se infiere que los coeficientes calculados en esta regresi?n son de mejor “calidad” dado que su estadistico t es mucho mayor al de la regresi?n anterior y su probabilidad se acerca a cero (para el beta de Malaysia). Sin embargo al verificar estas observaciones ser?a interesante observar el modelo de forma nivel - nivel para poder entender a cabalidad cual de los modelos hasta el momento propuestos genera una alta explicaci?n al comportamiento del Producto Interno Bruto de Singapur. Ya que si bien hemos alcanzado un R cuadrado de 49% los coeficientes para este modelo no se ajustaban a una realidad rigurosamente estadistica. Ahora podemos explicar menos pero los coeficientes son de gran calidad y confiabilidad ya que despues de realizar las pruebas de hipotesis respectivas dichos coeficientes son muy bajos de probabilidad menor a 0.1 para el intercepto y menor al 0.001 para el beta que representa la relaci?n de Malaysia. El estadistico F de la regresi?n tiene un P-valor cercano a cero ya es menor a 0.001.
Ahora si intentaramos interpretar los resultados obtenidos dentro de la regresi?n podemos interpretar que el crecimiento del PIB de singapur tiene un beta cero de 0.14% valor que ser?a explicado como el aumento del PIB de singapur en momentos en los que Malaysia no auemnte su PIB. As? mismo, por cada aumento porcentual del PIB de Malaysia el PIB de Singapure aumenta en 0.85%
Ahora realizaremos el modelo nivel - nivel para ver si el R cuadrado aumenta de forma considerable dentro de las apreciaciones del modelo.
Modelo Lineal 1 (nuevo planteamiento):
Modelo Variaci?n Logaritmica del PIB de Singapur con paises principales socios destino de exportaci?n:
SGP = B0 + B1 * CHN + B2 * HKN + B3 * IND + B4 * MYS
por tanto tenemos un modelo Nivel - Nivel, Donde:
Limpiando datos perdidos y resumiendo variables
#donde "GDP_data_R" es el dataframe editado con anterioridad.
library(readxl)
GDP_data_R <- read_excel("C:/Users/samorapa/OneDrive/Estudios/universidad/Economía Internacional/Proyecto de Aula 2/Anexos y Consolidados/Consolidados Fianles/GDP_data_R.xlsx",
sheet = "data_costumers_Rdata", col_types = c("text","numeric", "numeric", "numeric","numeric", "numeric"), na = "0")
#Limpiando datos - valores perdidos en objetos y vectores del dataframe
na.omit(GDP_data_R)
## # A tibble: 55 x 6
## X__1 SGP CHN HKG IDN MYS
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1962 7.121763 -5.58 14.290861 1.841978 6.421030
## 2 1963 9.984911 10.30 15.764115 -2.237030 7.338804
## 3 1964 -3.680475 18.18 8.627597 3.529698 5.358963
## 4 1965 7.597241 16.95 14.642164 1.081589 7.684863
## 5 1966 10.871902 10.65 1.794772 2.791347 7.816711
## 6 1967 12.283537 -5.77 1.603569 1.380403 3.857146
## 7 1968 13.618120 -4.10 3.397519 10.915179 7.977995
## 8 1969 13.724676 16.94 11.343735 6.822298 4.888534
## 9 1970 13.885640 19.30 9.206426 7.554635 5.986539
## 10 1971 12.081237 7.06 7.293158 7.023997 5.753435
## # ... with 45 more rows
# Resumen Estadistico de Singapur.
summary(GDP_data_R$SGP)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -3.680 4.903 7.867 7.428 10.308 15.240
# Resumen Estadistico de China.
summary(GDP_data_R$CHN)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -27.270 7.502 9.181 8.251 11.275 19.300
# Resumen Estadistico de Hong Kong.
summary(GDP_data_R$HKG)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## -5.883 2.405 6.036 6.143 9.234 16.164 1
# Resumen Estadistico de Indonesia.
summary(GDP_data_R$IDN)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -13.127 4.682 5.828 5.262 7.027 10.915
# Resumen Estadistico de Malaysia.
summary(GDP_data_R$MYS)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -7.359 5.352 6.718 6.314 8.865 11.714
Se aprecia ahora que la mediana de crecimiento para singapur es de 2,14%. China 2,22% de crecimiento. 1,5% para Hong Kong. 1,7% para Indonesia y finalmente pero ya sabemos que no menos importante 1,9% para el crecimiento de Indonesia.
Matriz de Dispersi?n
Ya con un previ? resumen y teniendo en cuenta los valores contenidos podemos aprecia dentro de la estadistica descriptiba que los valores han permanecido relativamente cercanos. Al graficar la matrizde.
GDP_data_R$X__1=NULL #donde "X__1" es el a?o de crecimiento del PIB.
pairs(GDP_data_R)
Ahora realizaremos la matriz del coeficiente de correlaci?n para ver las metricas de la regresi?n lineal.
Matrices de Varianza, Covarianza y Correlaci?n
cov(GDP_data_R) #matriz de Varianza Covarianza.
## SGP CHN HKG IDN MYS
## SGP 18.436948 -2.3905546 NA 6.2058647 9.519009
## CHN -2.390555 48.9053549 NA -0.6482148 -1.740452
## HKG NA NA NA NA NA
## IDN 6.205865 -0.6482148 NA 11.6949702 7.184880
## MYS 9.519009 -1.7404521 NA 7.1848798 11.792001
cor(GDP_data_R) #matriz de Coeficiente de Correlaci?n.
## SGP CHN HKG IDN MYS
## SGP 1.00000000 -0.07961153 NA 0.42262796 0.64558505
## CHN -0.07961153 1.00000000 NA -0.02710449 -0.07247532
## HKG NA NA 1 NA NA
## IDN 0.42262796 -0.02710449 NA 1.00000000 0.61182355
## MYS 0.64558505 -0.07247532 NA 0.61182355 1.00000000
Podemos apreciar que la matriz que se muestra forma los mismo datos a los tenidos en cuanta dentro del modelo lineal Nivel - Nivel. Es por ?sta raz?n que realizaremos la regresi?n pero en caso de no detectar una evoluci?n en la variable R cuadrado, se tomar? el modelo que mejor estadisticos posea con mejor R cuadrado.
Regresion_2 <- lm(SGP~CHN+HKG+IDN+MYS, data=GDP_data_R) #regresi?n multiple
summary(Regresion_2) #resumen de la regresi?n.
##
## Call:
## lm(formula = SGP ~ CHN + HKG + IDN + MYS, data = GDP_data_R)
##
## Residuals:
## Min 1Q Median 3Q Max
## -10.205 -2.004 -0.048 1.728 7.323
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.56780 1.28418 2.000 0.05100 .
## CHN -0.06697 0.09031 -0.742 0.46181
## HKG 0.18004 0.11672 1.542 0.12928
## IDN 0.07755 0.16745 0.463 0.64529
## MYS 0.62464 0.19132 3.265 0.00198 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.347 on 50 degrees of freedom
## (1 observation deleted due to missingness)
## Multiple R-squared: 0.4472, Adjusted R-squared: 0.403
## F-statistic: 10.11 on 4 and 50 DF, p-value: 4.459e-06
como se observo, con estos resultados no se mejor? el modelo dado que a pesar de todo el valor de las probabilidades de los Betas no alzcanzando a pasar las pruebas de hipotesis. Es decir que el beta de China tiene una probabilidad de 46.1% el beta de Hong Kong tiene una probabilidad de 12.9% el beta de Indonesia es de 64% y a pesar de todo el beta de Malaysia continua siendo el mas acertado en el momento de realizar los coefientes ya que tiene una probabilidad con significancia > 0.01;ahora, si observamos los estadisticos t inferimos que bajo un intervalo de confianza de 1.96 (significancia de 5%) ?nicamente el beta de Malaysia es qui?n pasar?a la prueba de hipotesis dado que: 3.265 > 1.96 sin embargo los demas estadisticos t < 1.96 seran como aceptados por sus hipotesis y rechazados por la alternativa de tener significancia.
Para ilustrar podemos observar en el siguiente gr?fico el efecto de los paises con relaci?n a la dispersi?n del PIB de Singapur.
ggplot(GDP_data_R, aes(x=CHN, y=SGP, color="China"))+geom_point()+geom_point(aes(x=GDP_data_R$IDN, y=SGP, color="Indonesia"))+geom_point(aes(x=HKG, y=SGP, color="Hong Kong"))+geom_point(aes(x=MYS, y=SGP, color="Malaysia"))+ggtitle("Relaci?n Lineal entre PIB de SGP en funci?n del PIB de CHN, HKG, IDN, MYS")+xlab("PIB de CHN, HKG, IDN, MYS")+ylab("PIB de SGP")+geom_abline()
## Warning: Removed 1 rows containing missing values (geom_point).
Se puede observar que el PIB de Malaysia es el que mas relaci?n lineal tiene con el PIG de Sigapur, a pesar de ser un poco dispersa se puede apreciar que tiene mayor concentraci?n a trav?s de la recta promedio. Para poder concluir con este modelo podemos indicar que el modelo que m?s se acerca es el modelo lineal que representa la relaci?n entre Malaysia y Singapur con forma:
log(SGP) = B0 + B1 log(MYS)*
Es decir,
Log(SGP) = 0.1462 + 0.8507 log(MYS)*
Ya que este modelo es que m?s explica con un menor rango de error dentro de las medidas realizadas y por ende es el elegido para realizar las predicci?nes futuras en caso de ser necesarias para el tercer corte. Tambien cabe denotar que dentro de este ejercicio se uso un amplio conocimiento en el uso de Software de modelaci?n estadistica por el cual logramos obtener los resultados recien presentados.
Modelo Lineal 2:
Modelo Variaci?n PIB de Singapur con paises principales socios comerciales de origen de importaciones:
Log(SGP) = B0 + B1 * log(CHN) + B2 * log(JPN) + B3 * log(KOR) + B4log * (MYS)
por tanto tenemos un modelo log - log, Donde:
Sustracci?n del dataframe
#Sustrayendo del dataframe las variables como vectores para linealizarlos.
#donde "logdata" es el dataframe editado con anterioridad.
logdata <- read_excel("C:/Users/samorapa/OneDrive/Estudios/universidad/Economía Internacional/Proyecto de Aula 2/Anexos y Consolidados/Consolidados Fianles/GDP_data_R.xlsx",
sheet = "data", col_types = c("text", "numeric", "numeric", "numeric", "numeric", "numeric","numeric", "numeric"))
Limpiando Datos pedidos.
# Limpiando datos perdidos o NaNs.
na.omit(logdata)
## # A tibble: 56 x 8
## `Country Code` SGP CHN JPN KOR MYS HKG
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1961 8.137625 -27.27 12.043536 6.882402 7.597994 0.000000
## 2 1962 7.121763 -5.58 8.908973 3.838921 6.421030 14.290861
## 3 1963 9.984911 10.30 8.473642 9.190387 7.338804 15.764115
## 4 1964 -3.680475 18.18 11.676708 9.459346 5.358963 8.627597
## 5 1965 7.597241 16.95 5.819708 7.183699 7.684863 14.642164
## 6 1966 10.871902 10.65 10.638562 11.983530 7.816711 1.794772
## 7 1967 12.283537 -5.77 11.082142 9.116893 3.857146 1.603569
## 8 1968 13.618120 -4.10 12.882468 13.188629 7.977995 3.397519
## 9 1969 13.724676 16.94 12.477895 14.541235 4.888534 11.343735
## 10 1970 13.885640 19.30 -1.019913 9.997407 5.986539 9.206426
## # ... with 46 more rows, and 1 more variables: IDN <dbl>
Matriz de diagrama de dispersi?n
logdata$`Country Code`=NULL #anulamos la columna de a?os para poder realizar la matriz de dispersi?n.
pairs(logdata)
An?lisis de Varianza Covarianza y Coeficiente re Correlci?n
cov(logdata)
## SGP CHN JPN KOR MYS HKG
## SGP 18.436948 -2.3905546 6.5687004 8.462205 9.519009 9.343018
## CHN -2.390555 48.9053549 -9.4497224 1.116451 -1.740452 6.038933
## JPN 6.568700 -9.4497224 15.4394988 8.161878 3.909364 6.402249
## KOR 8.462205 1.1164510 8.1618780 16.575837 7.018152 8.747695
## MYS 9.519009 -1.7404521 3.9093645 7.018152 11.792001 8.405402
## HKG 9.343018 6.0389333 6.4022485 8.747695 8.405402 22.230169
## IDN 6.205865 -0.6482148 0.9450561 5.160945 7.184880 4.333189
## IDN
## SGP 6.2058647
## CHN -0.6482148
## JPN 0.9450561
## KOR 5.1609453
## MYS 7.1848798
## HKG 4.3331894
## IDN 11.6949702
cor(logdata)
## SGP CHN JPN KOR MYS HKG
## SGP 1.00000000 -0.07961153 0.38933042 0.48406234 0.64558505 0.4614995
## CHN -0.07961153 1.00000000 -0.34389372 0.03921243 -0.07247532 0.1831516
## JPN 0.38933042 -0.34389372 1.00000000 0.51019448 0.28973156 0.3455768
## KOR 0.48406234 0.03921243 0.51019448 1.00000000 0.50198562 0.4557058
## MYS 0.64558505 -0.07247532 0.28973156 0.50198562 1.00000000 0.5191506
## HKG 0.46149954 0.18315157 0.34557678 0.45570577 0.51915062 1.0000000
## IDN 0.42262796 -0.02710449 0.07033013 0.37067385 0.61182355 0.2687427
## IDN
## SGP 0.42262796
## CHN -0.02710449
## JPN 0.07033013
## KOR 0.37067385
## MYS 0.61182355
## HKG 0.26874273
## IDN 1.00000000
Regresi?n Lineal principales socios comerciales de origen de importaciones
regresion_3 <- lm(SGP~CHN+JPN+KOR+MYS, data=logdata)
summary(regresion_3)
##
## Call:
## lm(formula = SGP ~ CHN + JPN + KOR + MYS, data = logdata)
##
## Residuals:
## Min 1Q Median 3Q Max
## -12.3383 -1.7315 -0.0149 1.9210 7.3998
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.429833 1.179770 1.212 0.231
## CHN 0.008752 0.069334 0.126 0.900
## JPN 0.191551 0.142694 1.342 0.185
## KOR 0.133906 0.143972 0.930 0.357
## MYS 0.665335 0.147937 4.497 3.99e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.24 on 51 degrees of freedom
## Multiple R-squared: 0.4721, Adjusted R-squared: 0.4307
## F-statistic: 11.4 on 4 and 51 DF, p-value: 1.098e-06
Tenemos entonces que bajo el modelo la recta por minimos cuadrados es:
PIB(SGP) = -0.233 + 0.086 PIB(CHN) + 0.04 * PIB(JPN) + 0.43 * PIB(KOR) + 0.74 * PIB(MYS)*
Dentro de esta estimaci?n es necesario resaltar que los estadisticos t para China y Jap?n no pasan la prueba de hipotesis con un intervalo de confianza del 95% y una significancia del 5% (1.96 dentro de los datos normalizados). A su vez estos 2 betas tienen una probabilidad m?s alta que la significancia del 5% puesto que china tiene una de 51.0% y Jap?n de 41.6%.
No obstante los betas de Core? del Sur y de Malaysia logran pasar la prueba de hipotesis con un intervalo de confianza del 99% para el estadistico t y una significancia de menor al 1%. Por el momento la regresi?n por minimos cuadrados realizada corresponde al 63.0% de la explicaci?n del comportamiento del PIB de Singapur, ahora realizaremos el modelo ?nicamente con Corea del Sur y Malaysia con el fin de aumentar el R cuadrado de la regresi?n por minimos cuadrados y explicar en mejor medida y con mayor calidad en los estimadores.
Modelo Lineal 2 (nuevo modelo):
Modelo Variaci?n PIB de Singapur con paises principales socios comerciales de origen de importaciones:
Log(SGP) = B0 + B1 * log(KOR) + B2 * log(MYS)
por tanto tenemos un modelo log - log, Donde:
Sustracci?n del dataframe
#Sustrayendo del dataframe las variables como vectores para linealizarlos.
#donde "logdata" es el dataframe editado con anterioridad.
logdata <- read_excel("C:/Users/samorapa/OneDrive/Estudios/universidad/Economía Internacional/Proyecto de Aula 2/Anexos y Consolidados/Consolidados Fianles/GDP_data_R.xlsx",
sheet = "data", col_types = c("text", "numeric", "numeric", "numeric", "numeric", "numeric","numeric", "numeric"))
Limpiando Datos pedidos.
# Limpiando datos perdidos o NaNs.
na.omit(logdata)
## # A tibble: 56 x 8
## `Country Code` SGP CHN JPN KOR MYS HKG
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1961 8.137625 -27.27 12.043536 6.882402 7.597994 0.000000
## 2 1962 7.121763 -5.58 8.908973 3.838921 6.421030 14.290861
## 3 1963 9.984911 10.30 8.473642 9.190387 7.338804 15.764115
## 4 1964 -3.680475 18.18 11.676708 9.459346 5.358963 8.627597
## 5 1965 7.597241 16.95 5.819708 7.183699 7.684863 14.642164
## 6 1966 10.871902 10.65 10.638562 11.983530 7.816711 1.794772
## 7 1967 12.283537 -5.77 11.082142 9.116893 3.857146 1.603569
## 8 1968 13.618120 -4.10 12.882468 13.188629 7.977995 3.397519
## 9 1969 13.724676 16.94 12.477895 14.541235 4.888534 11.343735
## 10 1970 13.885640 19.30 -1.019913 9.997407 5.986539 9.206426
## # ... with 46 more rows, and 1 more variables: IDN <dbl>
Matriz de diagrama de dispersi?n
logdata$`Country Code`=NULL #anulamos la columna de a?os para poder realizar la matriz de dispersi?n.
logdata$CHN=NULL #anulamos la columna correspondiente a China para no incluirla la la matriz de dispersi?n.
logdata$JPN=NULL #anulamos la columna correspondiente a J?pon para no incluirla la la matriz de dispersi?n.
logdata$HKG=NULL #anulamos la columna correspondiente a Hong Kong para no incluirla la la matriz de dispersi?n.
logdata$IDN=NULL #anulamos la columna correspondiente a Indonesia para no incluirla la la matriz de dispersi?n.
pairs(logdata)
ggplot(logdata, aes(x=SGP, y=KOR), color="Darkblue")+geom_point()+geom_point(aes(x=SGP, y=MYS), color="Darkorange")+ggtitle("Relaci?n Lineal de PIB?s entre el Singapur en funci?n de Core? del Sur y Malaysia")+xlab("PIB de Cor?a del Sur y Malaysia")+ylab("PIB de Singapur")+geom_abline()
An?lisis de Varianza Covarianza y Coeficiente re Correlci?n
cov(logdata)
## SGP KOR MYS
## SGP 18.436948 8.462205 9.519009
## KOR 8.462205 16.575837 7.018152
## MYS 9.519009 7.018152 11.792001
cor(logdata)
## SGP KOR MYS
## SGP 1.0000000 0.4840623 0.6455850
## KOR 0.4840623 1.0000000 0.5019856
## MYS 0.6455850 0.5019856 1.0000000
Regresi?n Lineal principales socios comerciales de origen de importaciones
regresion_3.1 <- lm(SGP~KOR+MYS, data=logdata)
summary(regresion_3.1)
##
## Call:
## lm(formula = SGP ~ KOR + MYS, data = logdata)
##
## Residuals:
## Min 1Q Median 3Q Max
## -10.9066 -2.1538 -0.0764 1.6093 7.5909
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.4858 1.0244 1.450 0.1528
## KOR 0.2256 0.1241 1.818 0.0748 .
## MYS 0.6730 0.1471 4.574 2.92e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.241 on 53 degrees of freedom
## Multiple R-squared: 0.451, Adjusted R-squared: 0.4303
## F-statistic: 21.77 on 2 and 53 DF, p-value: 1.255e-07
Tenemos entonces que bajo el modelo la recta por minimos cuadrados es:
PIB(SGP) = -0.153 + 0.465 PIB(KOR) + 0.73 * PIB(MYS)*
Entendemos de esta manera que el modelo lineal que mejor explica el comportamiento del PIB de Singapur son los PIB de Cor?a del Sur y Malaysia dado que sus estadisticos t son de un tama?o comparable para pasar la prueba de hipotesis con un indice de confianza del 99% y sus probabilidades son menores al nivel de significancia requerido, 1%, para ser considerados los betas como coeficientes y estimadores de calidad. Tenemos que este modelo explica un 62.3% del comportamiento del PIB de Singapur.
Podemos concluir de esta forma que a pesar de que se intento agregar estimadores y un n?mero considerable de variables dentro de cada uno de los modelos inicialmente planteados dichas variables llegaban a no aportar una significancia estadistica a la relaci?n lineal entre las variables del modelo. Es necesario tener presente que dentro del trabajo y el acercamiento realizado se acogieron algunos consejos acad?micos del profesor simplificando la magnitud del trabajo, no obstante, con el nivel de varibles y procedimientos necesarios se realizo lo suficiente para poder tener dos estimaciones y dos relaciones lineales al modelo que explican de forma alguna el movimiento del PIB de Singapur, este como objetivo final del trabajo se logr? de manera contundente a pesar de esto, este primer avance genera un abre bocas a las posibilidades de generar nuesvos modelos que ayuden a entender la dinamica internacional de componentes macroeconomicos como se ha visto en clase hata el momento. Adjunto se encuentran las Bases de Datos descargadas del Banco mundial y el tratamiento previo de los datos (ya que sbre este tema no se enfatizo mucho en el trabajo, ya que no es un objetivo dentro del mismo), No obstante en caso de requerir una revisi?n del procesamiento de datos, se puede recurir a estos.