Análisis Exploratorio de Datos.

  1. Realice un análisis exploratorio previo de los datos disponible, haciendo énfasis en la estructura de correlación entre las variables de productividad económica.

Se llevó a cabo un análisis detallado del PIB per cápita a nivel departamental en Colombia, considerando 13 variables económicas que incluyen las principales actividades productivas y los impuestos. Todas las cifras monetarias se encuentran expresadas en miles de millones de pesos. Con el fin de facilitar la interpretación visual de los resultados, se establecieron las siguientes convenciones para representar las distintas actividades económicas:

1. Convenciones usadas en los gráficos para los nombres de las actividades económicas.

Convención Actividad Económica
Agro y ganadería Agricultura, ganadería, caza, silvicultura y pesca
Minas Explotación de minas y canteras
Industria Industrias manufactureras
Elect, agua y residuos Suministro de electricidad, gas, vapor y aire acondicionado; distribución de agua; evacuación y tratamiento de aguas residuales, gestión de desechos y actividades de saneamiento ambiental
Construcción Construcción
Comercio, transp, aliment Comercio al por mayor y al por menor; reparación de vehículos automotores y motocicletas; transporte y almacenamiento; alojamiento y servicios de comida
Info y comunicación Información y comunicaciones
Finanzas y seguros Actividades financieras y de seguros
Inmobiliaria Actividades inmobiliarias
Prof y serv adm Actividades profesionales, científicas y técnicas; actividades de servicios administrativos y de apoyo
Admon púb, edu y salud Administración pública y defensa; planes de seguridad social de afiliación obligatoria; educación; actividades de atención de la salud humana y de servicios sociales
Arte y ocio Actividades artísticas, de entretenimiento y recreación y otras actividades de servicios; actividades de los hogares individuales en calidad de empleadores; actividades no diferenciadas de los hogares individuales como productores de bienes y servicios para uso propio
Impuestos Impuestos

La tabla 2 presenta un resumen estadístico de 13 sectores económicos. Cada sector económico tiene asociado un promedio y una desviación estándar.Al comparar los promedios de diferentes sectores, se pudo identificar aquellos que tuvieron un valor más alto “Comercio al por mayor y al por menor; reparación de vehículos automotores y motocicletas; transporte y almacenamiento; alojamiento y servicios de comida” y “Administración pública y defensa; planes de seguridad social de afiliación obligatoria; educación; actividades de atención de la salud humana y de servicios sociales”. A diferencia de “Arte y ocio” e “Información y comunicaciones”que registraron los ingresos más bajos.

Tabla 2.Promedio y desviación de cada rama de actividad económica e impuestos en Colombia para 2018
Agro y ganadería Minas Industria Elect, agua y residuos Construcción Comercio, transp y aliment Info y comunicación Finanzas y seguros Inmobiliaria Prof y serv adm Admon púb, edu y salud Arte y ocio Impuestos
Promedio 0.0013469 0.0015945 0.0011713 0.0003580 0.0009957 0.0025949 0.0002703 0.0003996 0.0008818 0.0006272 0.0024325 0.0002373 0.0009852
Desviación 0.0008834 0.0035367 0.0012374 0.0002938 0.0004403 0.0022128 0.0002503 0.0004475 0.0007583 0.0006044 0.0004701 0.0002120 0.0009070

Al analizar la distribución del PIB per cápita por sectores en Colombia durante 2018 mediante diagramas de caja (Figura 1), se evidenciaron diferencias entre los sectores. El sector de Minas presentó la mayor cantidad de valores atípicos, con seis departamentos destacando: César, La Guajira, Meta, Arauca, Casanare y Putumayo. Por otro lado, el sector de Comercio, transporte y alimentación presentó tres valores atípicos, concentrados en Bogotá, Casanare y San Andrés

Otros sectores con un número considerable de valores atípicos incluyen Construcción (Boyacá y Santander), Información y comunicación (Bogotá), Profesionales y servicios administrativos (Bogotá), Finanzas y seguros (Antioquia y Bogotá), Inmobiliario (Bogotá y Valle del Cauca), Administración pública, educación y salud (Bogotá y San Andrés), y Impuestos (Bogotá y Santander). Estos hallazgos resaltan la importancia de analizar de manera más detallada las características particulares de cada región y sector para comprender las causas subyacentes de estas disparidades.

## [[1]]
## [[1]]$stats
##              [,1]
## [1,] 0.0000017651
## [2,] 0.0007834526
## [3,] 0.0012259332
## [4,] 0.0019234639
## [5,] 0.0032969458
## 
## [[1]]$n
## [1] 33
## 
## [[1]]$conf
##              [,1]
## [1,] 0.0009123814
## [2,] 0.0015394850
## 
## [[1]]$out
## [1] 0.003666048
## 
## [[1]]$group
## [1] 1
## 
## [[1]]$names
## [1] "Agro y ganadería"
## 
## 
## [[2]]
## [[2]]$stats
##              [,1]
## [1,] 0.0000147256
## [2,] 0.0000416027
## [3,] 0.0001453865
## [4,] 0.0007584899
## [5,] 0.0014533347
## 
## [[2]]$n
## [1] 33
## 
## [[2]]$conf
##               [,1]
## [1,] -5.178809e-05
## [2,]  3.425611e-04
## 
## [[2]]$out
## [1] 0.005066300 0.003765644 0.013433047 0.005758367 0.014689725 0.003152308
## 
## [[2]]$group
## [1] 1 1 1 1 1 1
## 
## [[2]]$names
## [1] "Minas"
## 
## 
## [[3]]
## [[3]]$stats
##              [,1]
## [1,] 0.0000098234
## [2,] 0.0002221225
## [3,] 0.0006364525
## [4,] 0.0019744641
## [5,] 0.0045157631
## 
## [[3]]$n
## [1] 33
## 
## [[3]]$conf
##              [,1]
## [1,] 0.0001544837
## [2,] 0.0011184213
## 
## [[3]]$out
## numeric(0)
## 
## [[3]]$group
## numeric(0)
## 
## [[3]]$names
## [1] "Industria"
## 
## 
## [[4]]
## [[4]]$stats
##              [,1]
## [1,] 0.0000142744
## [2,] 0.0001256419
## [3,] 0.0002925538
## [4,] 0.0005256133
## [5,] 0.0010801120
## 
## [[4]]$n
## [1] 33
## 
## [[4]]$conf
##              [,1]
## [1,] 0.0001825446
## [2,] 0.0004025630
## 
## [[4]]$out
## numeric(0)
## 
## [[4]]$group
## numeric(0)
## 
## [[4]]$names
## [1] "Elect, agua y residuos"
## 
## 
## [[5]]
## [[5]]$stats
##              [,1]
## [1,] 0.0003409184
## [2,] 0.0006911470
## [3,] 0.0009486054
## [4,] 0.0011514308
## [5,] 0.0016201181
## 
## [[5]]$n
## [1] 33
## 
## [[5]]$conf
##              [,1]
## [1,] 0.0008220077
## [2,] 0.0010752031
## 
## [[5]]$out
## [1] 0.002120891 0.002254678
## 
## [[5]]$group
## [1] 1 1
## 
## [[5]]$names
## [1] "Construcción"
## 
## 
## [[6]]
## [[6]]$stats
##              [,1]
## [1,] 0.0005394066
## [2,] 0.0014976081
## [3,] 0.0021030158
## [4,] 0.0029135101
## [5,] 0.0034254262
## 
## [[6]]$n
## [1] 33
## 
## [[6]]$conf
##             [,1]
## [1,] 0.001713582
## [2,] 0.002492449
## 
## [[6]]$out
## [1] 0.005765305 0.005508334 0.013094263
## 
## [[6]]$group
## [1] 1 1 1
## 
## [[6]]$names
## [1] "Comercio, transp y aliment"
## 
## 
## [[7]]
## [[7]]$stats
##              [,1]
## [1,] 0.0000054203
## [2,] 0.0001191128
## [3,] 0.0002068047
## [4,] 0.0003552118
## [5,] 0.0006654954
## 
## [[7]]$n
## [1] 33
## 
## [[7]]$conf
##              [,1]
## [1,] 0.0001418674
## [2,] 0.0002717420
## 
## [[7]]$out
## [1] 0.001321444
## 
## [[7]]$group
## [1] 1
## 
## [[7]]$names
## [1] "Info y comunicación"
## 
## 
## [[8]]
## [[8]]$stats
##              [,1]
## [1,] 0.0000647886
## [2,] 0.0001842099
## [3,] 0.0002381115
## [4,] 0.0004321295
## [5,] 0.0007210548
## 
## [[8]]$n
## [1] 33
## 
## [[8]]$conf
##             [,1]
## [1,] 0.000169923
## [2,] 0.000306300
## 
## [[8]]$out
## [1] 0.0009697706 0.0026159909
## 
## [[8]]$group
## [1] 1 1
## 
## [[8]]$names
## [1] "Finanzas y seguros"
## 
## 
## [[9]]
## [[9]]$stats
##              [,1]
## [1,] 0.0001378162
## [2,] 0.0004306560
## [3,] 0.0007258326
## [4,] 0.0010444960
## [5,] 0.0019387810
## 
## [[9]]$n
## [1] 33
## 
## [[9]]$conf
##              [,1]
## [1,] 0.0005570004
## [2,] 0.0008946648
## 
## [[9]]$out
## [1] 0.004023524 0.002423239
## 
## [[9]]$group
## [1] 1 1
## 
## [[9]]$names
## [1] "Inmobiliaria"
## 
## 
## [[10]]
## [[10]]$stats
##              [,1]
## [1,] 0.0000066204
## [2,] 0.0001383614
## [3,] 0.0005452353
## [4,] 0.0009782647
## [5,] 0.0017403809
## 
## [[10]]$n
## [1] 33
## 
## [[10]]$conf
##              [,1]
## [1,] 0.0003142260
## [2,] 0.0007762446
## 
## [[10]]$out
## [1] 0.002641694
## 
## [[10]]$group
## [1] 1
## 
## [[10]]$names
## [1] "Prof y serv adm"
## 
## 
## [[11]]
## [[11]]$stats
##             [,1]
## [1,] 0.001792587
## [2,] 0.002152163
## [3,] 0.002331543
## [4,] 0.002546605
## [5,] 0.003116327
## 
## [[11]]$n
## [1] 33
## 
## [[11]]$conf
##             [,1]
## [1,] 0.002223054
## [2,] 0.002440031
## 
## [[11]]$out
## [1] 0.004481686 0.003160621
## 
## [[11]]$group
## [1] 1 1
## 
## [[11]]$names
## [1] "Admon púb, edu y salud"
## 
## 
## [[12]]
## [[12]]$stats
##              [,1]
## [1,] 0.0000428233
## [2,] 0.0001209356
## [3,] 0.0001880561
## [4,] 0.0003111150
## [5,] 0.0004650461
## 
## [[12]]$n
## [1] 33
## 
## [[12]]$conf
##              [,1]
## [1,] 0.0001357486
## [2,] 0.0002403636
## 
## [[12]]$out
## [1] 0.001218857
## 
## [[12]]$group
## [1] 1
## 
## [[12]]$names
## [1] "Arte y ocio"
## 
## 
## [[13]]
## [[13]]$stats
##              [,1]
## [1,] 0.0001377523
## [2,] 0.0003961793
## [3,] 0.0006899259
## [4,] 0.0013203308
## [5,] 0.0018295074
## 
## [[13]]$n
## [1] 33
## 
## [[13]]$conf
##              [,1]
## [1,] 0.0004357448
## [2,] 0.0009441070
## 
## [[13]]$out
## [1] 0.003058367 0.004443086
## 
## [[13]]$group
## [1] 1 1
## 
## [[13]]$names
## [1] "Impuestos"

Figura 1. Diagrama de cajas del Producto interno bruto per capita (PIBpc) según sector o actividad y económica de Colombia para el año 2018.

Análisis Bivariado de la Correlación.

En la figura 2 se observa un pair plot (o gráfico de pares) que permite analizar relaciones bivariadas y distribuciones univariadas entre las variables, en este caso sectores económicos. observar patrones o correlaciones entre múltiples variables numéricas.

##                            Agro y ganadería   Minas Industria
## Agro y ganadería                      1.000  0.6160     0.050
## Minas                                 0.616  1.0000    -0.160
## Industria                             0.050 -0.1600     1.000
## Elect, agua y residuos                0.089  0.0083     0.746
## Construcción                          0.202  0.0735     0.743
## Comercio, transp y aliment           -0.066  0.1351     0.175
## Info y comunicación                  -0.123 -0.1016     0.708
## Finanzas y seguros                   -0.238 -0.0472     0.475
## Inmobiliaria                         -0.139 -0.0632     0.640
## Prof y serv adm                      -0.196 -0.1476     0.778
## Admon púb, edu y salud               -0.261 -0.0716     0.042
## Arte y ocio                          -0.291 -0.1874     0.520
## Impuestos                             0.013 -0.0217     0.849
##                            Elect, agua y residuos Construcción
## Agro y ganadería                           0.0887        0.202
## Minas                                      0.0083        0.074
## Industria                                  0.7457        0.743
## Elect, agua y residuos                     1.0000        0.623
## Construcción                               0.6229        1.000
## Comercio, transp y aliment                 0.3234        0.172
## Info y comunicación                        0.5593        0.578
## Finanzas y seguros                         0.3969        0.408
## Inmobiliaria                               0.4691        0.541
## Prof y serv adm                            0.6393        0.552
## Admon púb, edu y salud                    -0.0407        0.144
## Arte y ocio                                0.4138        0.418
## Impuestos                                  0.5779        0.741
##                            Comercio, transp y aliment Info y comunicación
## Agro y ganadería                               -0.066               -0.12
## Minas                                           0.135               -0.10
## Industria                                       0.175                0.71
## Elect, agua y residuos                          0.323                0.56
## Construcción                                    0.172                0.58
## Comercio, transp y aliment                      1.000                0.40
## Info y comunicación                             0.397                1.00
## Finanzas y seguros                              0.462                0.92
## Inmobiliaria                                    0.432                0.93
## Prof y serv adm                                 0.402                0.92
## Admon púb, edu y salud                          0.486                0.53
## Arte y ocio                                     0.258                0.92
## Impuestos                                       0.480                0.81
##                            Finanzas y seguros Inmobiliaria Prof y serv adm
## Agro y ganadería                       -0.238       -0.139           -0.20
## Minas                                  -0.047       -0.063           -0.15
## Industria                               0.475        0.640            0.78
## Elect, agua y residuos                  0.397        0.469            0.64
## Construcción                            0.408        0.541            0.55
## Comercio, transp y aliment              0.462        0.432            0.40
## Info y comunicación                     0.923        0.930            0.92
## Finanzas y seguros                      1.000        0.926            0.85
## Inmobiliaria                            0.926        1.000            0.89
## Prof y serv adm                         0.846        0.894            1.00
## Admon púb, edu y salud                  0.708        0.573            0.38
## Arte y ocio                             0.936        0.902            0.86
## Impuestos                               0.655        0.776            0.76
##                            Admon púb, edu y salud Arte y ocio Impuestos
## Agro y ganadería                           -0.261       -0.29     0.013
## Minas                                      -0.072       -0.19    -0.022
## Industria                                   0.042        0.52     0.849
## Elect, agua y residuos                     -0.041        0.41     0.578
## Construcción                                0.144        0.42     0.741
## Comercio, transp y aliment                  0.486        0.26     0.480
## Info y comunicación                         0.527        0.92     0.811
## Finanzas y seguros                          0.708        0.94     0.655
## Inmobiliaria                                0.573        0.90     0.776
## Prof y serv adm                             0.383        0.86     0.756
## Admon púb, edu y salud                      1.000        0.55     0.349
## Arte y ocio                                 0.554        1.00     0.599
## Impuestos                                   0.349        0.60     1.000
##                            Agro y ganadería     Minas Industria
## Agro y ganadería                  0.0000000 0.0001353 7.812e-01
## Minas                             0.0001353 0.0000000 3.737e-01
## Industria                         0.7811500 0.3736882 0.000e+00
## Elect, agua y residuos            0.6236246 0.9632316 6.355e-07
## Construcción                      0.2604244 0.6843734 7.191e-07
## Comercio, transp y aliment        0.7146739 0.4533752 3.308e-01
## Info y comunicación               0.4941231 0.5736426 4.104e-06
## Finanzas y seguros                0.1823453 0.7943217 5.209e-03
## Inmobiliaria                      0.4405647 0.7266624 6.108e-05
## Prof y serv adm                   0.2736935 0.4125066 9.849e-08
## Admon púb, edu y salud            0.1426348 0.6921206 8.161e-01
## Arte y ocio                       0.1002207 0.2963759 1.902e-03
## Impuestos                         0.9413917 0.9044553 4.084e-10
##                            Elect, agua y residuos Construcción
## Agro y ganadería                        6.236e-01    2.604e-01
## Minas                                   9.632e-01    6.844e-01
## Industria                               6.355e-07    7.191e-07
## Elect, agua y residuos                  0.000e+00    1.081e-04
## Construcción                            1.081e-04    0.000e+00
## Comercio, transp y aliment              6.634e-02    3.375e-01
## Info y comunicación                     7.145e-04    4.318e-04
## Finanzas y seguros                      2.219e-02    1.844e-02
## Inmobiliaria                            5.887e-03    1.152e-03
## Prof y serv adm                         6.206e-05    8.629e-04
## Admon púb, edu y salud                  8.221e-01    4.225e-01
## Arte y ocio                             1.667e-02    1.560e-02
## Impuestos                               4.281e-04    8.007e-07
##                            Comercio, transp y aliment Info y comunicación
## Agro y ganadería                             0.714674           4.941e-01
## Minas                                        0.453375           5.736e-01
## Industria                                    0.330807           4.104e-06
## Elect, agua y residuos                       0.066343           7.145e-04
## Construcción                                 0.337505           4.318e-04
## Comercio, transp y aliment                   0.000000           2.204e-02
## Info y comunicación                          0.022042           0.000e+00
## Finanzas y seguros                           0.006781           2.057e-14
## Inmobiliaria                                 0.011969           5.251e-15
## Prof y serv adm                              0.020501           2.606e-14
## Admon púb, edu y salud                       0.004134           1.636e-03
## Arte y ocio                                  0.147192           2.756e-14
## Impuestos                                    0.004699           1.038e-08
##                            Finanzas y seguros Inmobiliaria Prof y serv adm
## Agro y ganadería                    1.823e-01    4.406e-01       2.737e-01
## Minas                               7.943e-01    7.267e-01       4.125e-01
## Industria                           5.209e-03    6.108e-05       9.849e-08
## Elect, agua y residuos              2.219e-02    5.887e-03       6.206e-05
## Construcción                        1.844e-02    1.152e-03       8.629e-04
## Comercio, transp y aliment          6.781e-03    1.197e-02       2.050e-02
## Info y comunicación                 2.057e-14    5.251e-15       2.606e-14
## Finanzas y seguros                  0.000e+00    1.245e-14       5.768e-10
## Inmobiliaria                        1.245e-14    0.000e+00       2.343e-12
## Prof y serv adm                     5.768e-10    2.343e-12       0.000e+00
## Admon púb, edu y salud              4.097e-06    4.865e-04       2.801e-02
## Arte y ocio                         1.275e-15    7.891e-13       1.249e-10
## Impuestos                           3.562e-05    1.125e-07       3.644e-07
##                            Admon púb, edu y salud Arte y ocio Impuestos
## Agro y ganadería                        1.426e-01   1.002e-01 9.414e-01
## Minas                                   6.921e-01   2.964e-01 9.045e-01
## Industria                               8.161e-01   1.902e-03 4.084e-10
## Elect, agua y residuos                  8.221e-01   1.667e-02 4.281e-04
## Construcción                            4.225e-01   1.560e-02 8.007e-07
## Comercio, transp y aliment              4.134e-03   1.472e-01 4.699e-03
## Info y comunicación                     1.636e-03   2.756e-14 1.038e-08
## Finanzas y seguros                      4.097e-06   1.275e-15 3.562e-05
## Inmobiliaria                            4.865e-04   7.891e-13 1.125e-07
## Prof y serv adm                         2.801e-02   1.249e-10 3.644e-07
## Admon púb, edu y salud                  0.000e+00   8.186e-04 4.628e-02
## Arte y ocio                             8.186e-04   0.000e+00 2.329e-04
## Impuestos                               4.628e-02   2.329e-04 0.000e+00

Analisis de componentes principales

Matriz importancia de componentes

## Standard deviations (1, .., p=13):
##  [1] 2.66273762 1.43913734 1.21195204 0.90490311 0.74149451 0.57624991
##  [7] 0.55082742 0.39876427 0.30376928 0.25296351 0.15268248 0.13986045
## [13] 0.08714151
## 
## Rotation (n x k) = (13 x 13):
##                                    PC1         PC2         PC3          PC4
## Agro y ganadería            0.05554967 -0.52832854 -0.35179529 -0.259560932
## Minas                       0.04055371 -0.35472403 -0.61160378 -0.184679257
## Industria                  -0.29269527 -0.29428372  0.30942996  0.054837314
## Elect, agua y residuos     -0.24253072 -0.33288716  0.19117043  0.295084888
## Construcción               -0.25138909 -0.35703352  0.09587434 -0.027389595
## Comercio, transp y aliment -0.18177818  0.06466189 -0.40861002  0.765618361
## Info y comunicación        -0.36378772  0.04009907 -0.01922609 -0.158519001
## Finanzas y seguros         -0.33913091  0.20391471 -0.17460971 -0.175457833
## Inmobiliaria               -0.35481446  0.08020088 -0.08762795 -0.163663476
## Prof y serv adm            -0.35448620  0.01031513  0.09346450 -0.040159932
## Admon púb, edu y salud     -0.19909265  0.38232150 -0.38218590  0.008425199
## Arte y ocio                -0.33043707  0.19964771  0.01588751 -0.329880832
## Impuestos                  -0.32681277 -0.17381684  0.01195317  0.168265212
##                                    PC5         PC6           PC7          PC8
## Agro y ganadería            0.10508941  0.48680186 -0.5013227147  0.106750007
## Minas                      -0.27353275 -0.33724906  0.4554741618 -0.224571397
## Industria                   0.11022329  0.22020219  0.1310490754 -0.440587468
## Elect, agua y residuos     -0.43500018 -0.36150108 -0.4595301291 -0.246902144
## Construcción                0.50520081 -0.53823049 -0.0214413251  0.464276262
## Comercio, transp y aliment -0.08737628  0.16797526  0.0000181701  0.321738155
## Info y comunicación        -0.06767464  0.12967782 -0.0239017569  0.022931798
## Finanzas y seguros         -0.13133459 -0.05829269 -0.0481403382  0.020183885
## Inmobiliaria               -0.03104625  0.13936581  0.0910266339  0.182653485
## Prof y serv adm            -0.26707254  0.12894287  0.0843203459  0.009856459
## Admon púb, edu y salud      0.44016385 -0.20073693 -0.3643752809 -0.491661535
## Arte y ocio                -0.20765738 -0.05015186 -0.0742599463  0.243096522
## Impuestos                   0.34483794  0.23050648  0.3947769665 -0.169724967
##                                    PC9         PC10        PC11        PC12
## Agro y ganadería            0.01787632  0.025511683  0.01001430 -0.05999963
## Minas                       0.04345869  0.030578530  0.09093878  0.04866072
## Industria                   0.25072914  0.033200373  0.27628970 -0.31707947
## Elect, agua y residuos     -0.22077230 -0.194189158 -0.04433745  0.09327133
## Construcción                0.15504138  0.093405401 -0.04488869 -0.02696341
## Comercio, transp y aliment  0.06503147  0.090115935  0.15498196 -0.08075143
## Info y comunicación        -0.31917064  0.416721501 -0.27467877  0.50477075
## Finanzas y seguros         -0.13409705  0.037729647 -0.47851975 -0.71432577
## Inmobiliaria                0.14158854 -0.819351550 -0.06294682  0.22110488
## Prof y serv adm             0.65861945  0.280434648 -0.15406156  0.17907973
## Admon púb, edu y salud      0.15852881  0.006363935  0.10879944  0.13793496
## Arte y ocio                -0.21352167  0.124378999  0.73663048 -0.10362119
## Impuestos                  -0.46207971 -0.046748659 -0.02655206  0.04207471
##                                   PC13
## Agro y ganadería           -0.10602298
## Minas                       0.06673145
## Industria                   0.46497359
## Elect, agua y residuos     -0.13263398
## Construcción                0.05433231
## Comercio, transp y aliment  0.16548714
## Info y comunicación         0.46075008
## Finanzas y seguros          0.01073855
## Inmobiliaria                0.16413815
## Prof y serv adm            -0.44776772
## Admon púb, edu y salud     -0.05899280
## Arte y ocio                -0.13117794
## Impuestos                  -0.50955355
## Importance of components:
##                           PC1    PC2    PC3     PC4     PC5     PC6     PC7
## Standard deviation     2.6627 1.4391 1.2120 0.90490 0.74149 0.57625 0.55083
## Proportion of Variance 0.5454 0.1593 0.1130 0.06299 0.04229 0.02554 0.02334
## Cumulative Proportion  0.5454 0.7047 0.8177 0.88069 0.92298 0.94853 0.97187
##                            PC8    PC9    PC10    PC11   PC12    PC13
## Standard deviation     0.39876 0.3038 0.25296 0.15268 0.1399 0.08714
## Proportion of Variance 0.01223 0.0071 0.00492 0.00179 0.0015 0.00058
## Cumulative Proportion  0.98410 0.9912 0.99612 0.99791 0.9994 1.00000

Podemos usar la pirámide Maslow para identificar el comportamiento de las distintas actividades económicas. El primer componente podría estar explicando las actividades económicas más productivas en Colombia y el segundo componente las actividades económicas que cubren las necesidades básicas primarias de los colombianos como acceso al agua y vivienda y secundarias como acceso a servicios educativos, salud y la seguridad.

El primer componente lo llamaremos “Sector primario” debido a que la mineria y las actividades agropecuarias, son actividades que obtienen recursos o materia prima del medio natural. Por otro lado, el segundo sector lo llamaremos “Servicios”.

##  [1] 2.66273762 1.43913734 1.21195204 0.90490311 0.74149451 0.57624991
##  [7] 0.55082742 0.39876427 0.30376928 0.25296351 0.15268248 0.13986045
## [13] 0.08714151
##  [1]  54.53978  70.47145  81.77012  88.06896  92.29830  94.85264  97.18657
##  [8]  98.40975  99.11956  99.61180  99.79112  99.94159 100.00000

Productividad de los departamentos en el espacio de las componentes principales

Se generó un ranking de los departamentos en función de su capacidad productiva en cada una de las componentes.

departamentos_interes <- c("Anti",  "Bogo","Casa","Choc","Arau","Vall", "San",
                          "Vaup")


indices_interes <- which(departamentos %in% departamentos_interes)
# Filtrar los valores de las componentes principales
Primario_interes <- Primario[indices_interes]
Secundario_interes <- Secundario[indices_interes]



plot(Primario_interes, Secundario_interes, 
     pch=19, xlab="PC1 : Sector Primario", ylab="PC2 : Sector Terciario",
     col="blue", cex=0.9,xlim=c(-12, 3), ylim=c(-4, 5))  # Puntos de los departamentos de interés en azul
abline(h=0, v=0, lty=2, col="red")

# Añadir etiquetas de los departamentos de interés
text(Primario_interes, Secundario_interes, 
     labels=departamentos_interes, cex=0.9, col="blue", pos=3)  # Etiquetas en azul

Bogota: su PIB se compone principalmente del sector Servicios, siendo este el que más aporta en esta categoría, pues no aporta en la generación de bienes y servicios.

Antioquia: este departamento tiene una productividad menor en ambos sectores.

Choco: el sector primario y terciario no constituyen la base de su PIB.

San Andres: su PIB se compone en gran parte por el sector terciario, esto podría obedecer a que es un departamento altamente turístico.

Valle: ni el sector primario ni terciario componen principalmente su PIB, por ende tiene rendimientos menores en ambos.

Arauca: ni el sector primario ni terciario componen principalmente su PIB, por ende tiene rendimientos menores en ambos.

Vaupes: Su PIB se compone por ambos sectores.

Casanare: Su PIB se compone por ambos sectores.

Clustering

En este caso optaremos por agrupar basado en las puntuaciones de las componentes principales, en lugar de agrupar basado en las 13 variables o sectores económicos.

## K-means clustering with 3 clusters of sizes 1, 15, 17
## 
## Cluster means:
##          PC1        PC2
## 1 -10.152211  3.8248286
## 2  -1.409312 -0.8885232
## 3   1.840699  0.5590011
## 
## Clustering vector:
##                                               Antioquia 
##                                                       2 
##                                               Atlantico 
##                                                       2 
##                                             Bogota D.C. 
##                                                       1 
##                                                 Bolivar 
##                                                       2 
##                                                  Boyaca 
##                                                       2 
##                                                  Caldas 
##                                                       2 
##                                                 Caqueta 
##                                                       3 
##                                                   Cauca 
##                                                       3 
##                                                   Cesar 
##                                                       3 
##                                                 Cordoba 
##                                                       3 
##                                            Cundinamarca 
##                                                       2 
##                                                   Choco 
##                                                       3 
##                                                   Huila 
##                                                       2 
##                                              La Guajira 
##                                                       3 
##                                               Magdalena 
##                                                       3 
##                                                    Meta 
##                                                       2 
##                                                  Nariño 
##                                                       3 
##                                      Norte de Santander 
##                                                       3 
##                                                 Quindio 
##                                                       2 
##                                               Risaralda 
##                                                       2 
##                                               Santander 
##                                                       2 
##                                                   Sucre 
##                                                       3 
##                                                  Tolima 
##                                                       2 
##                                         Valle del Cauca 
##                                                       2 
##                                                  Arauca 
##                                                       3 
##                                                Casanare 
##                                                       2 
##                                                Putumayo 
##                                                       3 
## San Andrés, Providencia y Santa Catalina (Archipiélago) 
##                                                       2 
##                                                Amazonas 
##                                                       3 
##                                                 Guainía 
##                                                       3 
##                                                Guaviare 
##                                                       3 
##                                                  Vaupés 
##                                                       3 
##                                                 Vichada 
##                                                       3 
## 
## Within cluster sum of squares by cluster:
## [1]  0.00000 59.12078 11.79807
##  (between_SS / total_SS =  75.8 %)
## 
## Available components:
## 
## [1] "cluster"      "centers"      "totss"        "withinss"     "tot.withinss"
## [6] "betweenss"    "size"         "iter"         "ifault"

Evaluación del número adecuado de cluster

Se seleccionaron 4 grupos para representar los departamentos con sectores productivos similares:

## K-means clustering with 4 clusters of sizes 5, 16, 1, 11
## 
## Cluster means:
##           PC1        PC2
## 1  -2.9608097 -1.7160963
## 2   1.9036655  0.6170348
## 3 -10.1522112  3.8248286
## 4  -0.5002171 -0.4651731
## 
## Clustering vector:
##                                               Antioquia 
##                                                       1 
##                                               Atlantico 
##                                                       4 
##                                             Bogota D.C. 
##                                                       3 
##                                                 Bolivar 
##                                                       4 
##                                                  Boyaca 
##                                                       1 
##                                                  Caldas 
##                                                       4 
##                                                 Caqueta 
##                                                       2 
##                                                   Cauca 
##                                                       4 
##                                                   Cesar 
##                                                       2 
##                                                 Cordoba 
##                                                       2 
##                                            Cundinamarca 
##                                                       1 
##                                                   Choco 
##                                                       2 
##                                                   Huila 
##                                                       4 
##                                              La Guajira 
##                                                       2 
##                                               Magdalena 
##                                                       2 
##                                                    Meta 
##                                                       4 
##                                                  Nariño 
##                                                       2 
##                                      Norte de Santander 
##                                                       2 
##                                                 Quindio 
##                                                       4 
##                                               Risaralda 
##                                                       4 
##                                               Santander 
##                                                       1 
##                                                   Sucre 
##                                                       2 
##                                                  Tolima 
##                                                       4 
##                                         Valle del Cauca 
##                                                       1 
##                                                  Arauca 
##                                                       2 
##                                                Casanare 
##                                                       4 
##                                                Putumayo 
##                                                       2 
## San Andrés, Providencia y Santa Catalina (Archipiélago) 
##                                                       4 
##                                                Amazonas 
##                                                       2 
##                                                 Guainía 
##                                                       2 
##                                                Guaviare 
##                                                       2 
##                                                  Vaupés 
##                                                       2 
##                                                 Vichada 
##                                                       2 
## 
## Within cluster sum of squares by cluster:
## [1] 12.593043  9.803594  0.000000 25.303545
##  (between_SS / total_SS =  83.7 %)
## 
## Available components:
## 
## [1] "cluster"      "centers"      "totss"        "withinss"     "tot.withinss"
## [6] "betweenss"    "size"         "iter"         "ifault"

## [[1]]
## [[1]]$stats
##             [,1]         [,2]       [,3]         [,4]
## [1,] 0.001017989 0.0004369059 1.7651e-06 0.0001587348
## [2,] 0.001055678 0.0007001408 1.7651e-06 0.0007763212
## [3,] 0.001965317 0.0011070754 1.7651e-06 0.0012837407
## [4,] 0.002058881 0.0013086979 1.7651e-06 0.0020908338
## [5,] 0.002527117 0.0017684415 1.7651e-06 0.0036660482
## 
## [[1]]$n
## [1]  5 16  1 11
## 
## [[1]]$conf
##             [,1]         [,2]       [,3]         [,4]
## [1,] 0.001256457 0.0008666954 1.7651e-06 0.0006575227
## [2,] 0.002674178 0.0013474554 1.7651e-06 0.0019099587
## 
## [[1]]$out
## [1] 0.003296946
## 
## [[1]]$group
## [1] 2
## 
## [[1]]$names
## [1] "1" "2" "3" "4"
## 
## 
## [[2]]
## [[2]]$stats
##              [,1]         [,2]        [,3]         [,4]
## [1,] 0.0000295760 0.0000147256 4.49097e-05 1.945840e-05
## [2,] 0.0001453865 0.0000283993 4.49097e-05 4.696965e-05
## [3,] 0.0003448425 0.0001026766 4.49097e-05 1.655389e-04
## [4,] 0.0010730172 0.0018894577 4.49097e-05 6.035508e-04
## [5,] 0.0014533347 0.0037656439 4.49097e-05 7.584899e-04
## 
## [[2]]$n
## [1]  5 16  1 11
## 
## [[2]]$conf
##              [,1]          [,2]        [,3]          [,4]
## [1,] -0.000310619 -0.0006324415 4.49097e-05 -9.960964e-05
## [2,]  0.001000304  0.0008377947 4.49097e-05  4.306874e-04
## 
## [[2]]$out
## [1] 0.005066300 0.005758367 0.013433047 0.014689725
## 
## [[2]]$group
## [1] 2 2 4 4
## 
## [[2]]$names
## [1] "1" "2" "3" "4"
## 
## 
## [[3]]
## [[3]]$stats
##             [,1]         [,2]        [,3]         [,4]
## [1,] 0.002374154 0.0000098234 0.002612382 0.0002744015
## [2,] 0.003103624 0.0000748890 0.002612382 0.0006539806
## [3,] 0.003165354 0.0001959915 0.002612382 0.0014314046
## [4,] 0.003771651 0.0004923631 0.002612382 0.0018934940
## [5,] 0.004515763 0.0008254999 0.002612382 0.0023646072
## 
## [[3]]$n
## [1]  5 16  1 11
## 
## [[3]]$conf
##             [,1]         [,2]        [,3]         [,4]
## [1,] 0.002693328 0.0000310892 0.002612382 0.0008409154
## [2,] 0.003637380 0.0003608937 0.002612382 0.0020218938
## 
## [[3]]$out
## numeric(0)
## 
## [[3]]$group
## numeric(0)
## 
## [[3]]$names
## [1] "1" "2" "3" "4"
## 
## 
## [[4]]
## [[4]]$stats
##              [,1]         [,2]        [,3]         [,4]
## [1,] 0.0005291822 1.427440e-05 0.000564048 0.0002780758
## [2,] 0.0005853217 5.128995e-05 0.000564048 0.0003035381
## [3,] 0.0008256467 1.116324e-04 0.000564048 0.0003884197
## [4,] 0.0009544590 2.162211e-04 0.000564048 0.0005183672
## [5,] 0.0010801120 3.079799e-04 0.000564048 0.0006974271
## 
## [[4]]$n
## [1]  5 16  1 11
## 
## [[4]]$conf
##              [,1]         [,2]        [,3]         [,4]
## [1,] 0.0005648152 4.648453e-05 0.000564048 0.0002860777
## [2,] 0.0010864782 1.767802e-04 0.000564048 0.0004907617
## 
## [[4]]$out
## [1] 0.0004640391 0.0009695925
## 
## [[4]]$group
## [1] 2 4
## 
## [[4]]$names
## [1] "1" "2" "3" "4"
## 
## 
## [[5]]
## [[5]]$stats
##              [,1]         [,2]       [,3]         [,4]
## [1,] 0.0008743343 0.0003409184 0.00147689 0.0009169784
## [2,] 0.0013147662 0.0005734986 0.00147689 0.0009618630
## [3,] 0.0016201181 0.0006970594 0.00147689 0.0010662084
## [4,] 0.0021208911 0.0007788269 0.00147689 0.0011615633
## [5,] 0.0022546777 0.0010390417 0.00147689 0.0011716958
## 
## [[5]]$n
## [1]  5 16  1 11
## 
## [[5]]$conf
##             [,1]         [,2]       [,3]         [,4]
## [1,] 0.001050512 0.0006159547 0.00147689 0.0009710736
## [2,] 0.002189724 0.0007781641 0.00147689 0.0011613432
## 
## [[5]]$out
## [1] 0.0015355502 0.0014632115 0.0006229105
## 
## [[5]]$group
## [1] 4 4 4
## 
## [[5]]$names
## [1] "1" "2" "3" "4"
## 
## 
## [[6]]
## [[6]]$stats
##             [,1]         [,2]        [,3]        [,4]
## [1,] 0.003156181 0.0009317065 0.005765305 0.001288219
## [2,] 0.003156181 0.0012952134 0.005765305 0.002339952
## [3,] 0.003181194 0.0014977405 0.005765305 0.002581354
## [4,] 0.003301312 0.0016266731 0.005765305 0.003108218
## [5,] 0.003425426 0.0017978929 0.005765305 0.003302927
## 
## [[6]]$n
## [1]  5 16  1 11
## 
## [[6]]$conf
##             [,1]        [,2]        [,3]        [,4]
## [1,] 0.003078645 0.001366814 0.005765305 0.002215361
## [2,] 0.003283743 0.001628667 0.005765305 0.002947347
## 
## [[6]]$out
## [1] 0.0025686285 0.0025108749 0.0005394066 0.0055083340 0.0130942635
## 
## [[6]]$group
## [1] 1 2 2 4 4
## 
## [[6]]$names
## [1] "1" "2" "3" "4"
## 
## 
## [[7]]
## [[7]]$stats
##              [,1]         [,2]        [,3]         [,4]
## [1,] 0.0003022044 5.420300e-06 0.001321444 0.0001721613
## [2,] 0.0004231014 4.724025e-05 0.001321444 0.0002827177
## [3,] 0.0004906455 1.084111e-04 0.001321444 0.0003135592
## [4,] 0.0005615286 1.733501e-04 0.001321444 0.0003768327
## [5,] 0.0006654954 2.484711e-04 0.001321444 0.0004220813
## 
## [[7]]$n
## [1]  5 16  1 11
## 
## [[7]]$conf
##              [,1]         [,2]        [,3]         [,4]
## [1,] 0.0003928332 5.859773e-05 0.001321444 0.0002687240
## [2,] 0.0005884578 1.582245e-04 0.001321444 0.0003583944
## 
## [[7]]$out
## [1] 0.0001256398
## 
## [[7]]$group
## [1] 4
## 
## [[7]]$names
## [1] "1" "2" "3" "4"
## 
## 
## [[8]]
## [[8]]$stats
##              [,1]         [,2]        [,3]         [,4]
## [1,] 0.0002232528 0.0000647886 0.002615991 0.0003477704
## [2,] 0.0003675448 0.0001488418 0.002615991 0.0003674697
## [3,] 0.0006205723 0.0001893020 0.002615991 0.0004232748
## [4,] 0.0007210548 0.0002294213 0.002615991 0.0004868717
## [5,] 0.0009697706 0.0002756488 0.002615991 0.0006483660
## 
## [[8]]$n
## [1]  5 16  1 11
## 
## [[8]]$conf
##              [,1]         [,2]        [,3]         [,4]
## [1,] 0.0003707830 0.0001574731 0.002615991 0.0003663931
## [2,] 0.0008703616 0.0002211309 0.002615991 0.0004801565
## 
## [[8]]$out
## [1] 0.0001842099
## 
## [[8]]$group
## [1] 4
## 
## [[8]]$names
## [1] "1" "2" "3" "4"
## 
## 
## [[9]]
## [[9]]$stats
##              [,1]         [,2]        [,3]         [,4]
## [1,] 0.0007906986 0.0001378162 0.004023524 0.0007258326
## [2,] 0.0010666527 0.0002624626 0.004023524 0.0008390393
## [3,] 0.0016996095 0.0004246098 0.004023524 0.0008912031
## [4,] 0.0019387810 0.0006188094 0.004023524 0.0010448367
## [5,] 0.0024232393 0.0008416749 0.004023524 0.0010613234
## 
## [[9]]$n
## [1]  5 16  1 11
## 
## [[9]]$conf
##             [,1]         [,2]        [,3]         [,4]
## [1,] 0.001083366 0.0002838528 0.004023524 0.0007931637
## [2,] 0.002315853 0.0005653668 0.004023524 0.0009892425
## 
## [[9]]$out
## [1] 0.000502185 0.001393256
## 
## [[9]]$group
## [1] 4 4
## 
## [[9]]$names
## [1] "1" "2" "3" "4"
## 
## 
## [[10]]
## [[10]]$stats
##              [,1]         [,2]        [,3]         [,4]
## [1,] 0.0008266909 6.620400e-06 0.002641694 0.0003513972
## [2,] 0.0009782647 2.806905e-05 0.002641694 0.0006663979
## [3,] 0.0010616515 1.074390e-04 0.002641694 0.0007705283
## [4,] 0.0017258895 2.902980e-04 0.002641694 0.0010166430
## [5,] 0.0017403809 5.917360e-04 0.002641694 0.0012953447
## 
## [[10]]$n
## [1]  5 16  1 11
## 
## [[10]]$conf
##              [,1]         [,2]        [,3]         [,4]
## [1,] 0.0005333817 3.858495e-06 0.002641694 0.0006036758
## [2,] 0.0015899213 2.110194e-04 0.002641694 0.0009373808
## 
## [[10]]$out
## numeric(0)
## 
## [[10]]$group
## numeric(0)
## 
## [[10]]$names
## [1] "1" "2" "3" "4"
## 
## 
## [[11]]
## [[11]]$stats
##             [,1]        [,2]        [,3]        [,4]
## [1,] 0.002000415 0.001792587 0.004481686 0.002058540
## [2,] 0.002204370 0.002129502 0.004481686 0.002240037
## [3,] 0.002364667 0.002363969 0.004481686 0.002318769
## [4,] 0.002460502 0.002631065 0.004481686 0.002378473
## [5,] 0.002470960 0.003116327 0.004481686 0.002546605
## 
## [[11]]$n
## [1]  5 16  1 11
## 
## [[11]]$conf
##             [,1]        [,2]        [,3]        [,4]
## [1,] 0.002183685 0.002165852 0.004481686 0.002252820
## [2,] 0.002545650 0.002562086 0.004481686 0.002384718
## 
## [[11]]$out
## [1] 0.003160621
## 
## [[11]]$group
## [1] 4
## 
## [[11]]$names
## [1] "1" "2" "3" "4"
## 
## 
## [[12]]
## [[12]]$stats
##              [,1]         [,2]        [,3]         [,4]
## [1,] 0.0001921759 4.282330e-05 0.001218857 0.0001127464
## [2,] 0.0002092252 7.326185e-05 0.001218857 0.0001660164
## [3,] 0.0003189568 1.374640e-04 0.001218857 0.0002744565
## [4,] 0.0004234658 1.768615e-04 0.001218857 0.0003317625
## [5,] 0.0004650461 3.147982e-04 0.001218857 0.0004530472
## 
## [[12]]$n
## [1]  5 16  1 11
## 
## [[12]]$conf
##              [,1]         [,2]        [,3]        [,4]
## [1,] 0.0001675749 9.654214e-05 0.001218857 0.000195497
## [2,] 0.0004703387 1.783859e-04 0.001218857 0.000353416
## 
## [[12]]$out
## numeric(0)
## 
## [[12]]$group
## numeric(0)
## 
## [[12]]$names
## [1] "1" "2" "3" "4"
## 
## 
## [[13]]
## [[13]]$stats
##             [,1]         [,2]        [,3]         [,4]
## [1,] 0.001732143 0.0001377523 0.003058367 0.0006899259
## [2,] 0.001732143 0.0002564427 0.003058367 0.0009346009
## [3,] 0.001783853 0.0003959930 0.003058367 0.0010865236
## [4,] 0.001829507 0.0004349106 0.003058367 0.0013512018
## [5,] 0.001829507 0.0005111300 0.003058367 0.0017146914
## 
## [[13]]$n
## [1]  5 16  1 11
## 
## [[13]]$conf
##             [,1]         [,2]        [,3]        [,4]
## [1,] 0.001715055 0.0003254981 0.003058367 0.000888060
## [2,] 0.001852651 0.0004664878 0.003058367 0.001284987
## 
## [[13]]$out
## [1] 0.001320331 0.004443086
## 
## [[13]]$group
## [1] 1 1
## 
## [[13]]$names
## [1] "1" "2" "3" "4"
## Too few points to calculate an ellipse