Datos Depurados

library(tidyverse)
load("creditosFinal.Rdata")
head(creditos2)

Conteos

  • Los conteos se pueden graficar con las funciones geom_bar() o geom_col()
  • La función geom_bar() calcula internamente la frecuencia (conteo).
  • La función geom_col() recibe un número para graficar la columna o barra, es decir, que no calcula internamente lo que va a graficar.

geom_bar() Individual

  • ¿Cuántos créditos fueron concedidos por tipo de productor?
ggplot(data = creditos2,
       mapping = aes(x = productor)) +
  geom_bar() +
  labs(x = "Tipo de productor", y = "Frecuencia",
       title = "Frecuencia absoluta por tipo de productor")

  • Los gráficos se pueden obtener a través del operador de tubería (%>%):
creditos2 %>% 
  ggplot(mapping = aes(x = productor)) +
  geom_bar() +
  labs(x = "Tipo de productor", y = "Frecuencia",
       title = "Frecuencia absoluta por tipo de productor")

Colores

  • En R podemos conocer el nombre de los colores a través de la función colors():
colors()
##   [1] "white"                "aliceblue"            "antiquewhite"        
##   [4] "antiquewhite1"        "antiquewhite2"        "antiquewhite3"       
##   [7] "antiquewhite4"        "aquamarine"           "aquamarine1"         
##  [10] "aquamarine2"          "aquamarine3"          "aquamarine4"         
##  [13] "azure"                "azure1"               "azure2"              
##  [16] "azure3"               "azure4"               "beige"               
##  [19] "bisque"               "bisque1"              "bisque2"             
##  [22] "bisque3"              "bisque4"              "black"               
##  [25] "blanchedalmond"       "blue"                 "blue1"               
##  [28] "blue2"                "blue3"                "blue4"               
##  [31] "blueviolet"           "brown"                "brown1"              
##  [34] "brown2"               "brown3"               "brown4"              
##  [37] "burlywood"            "burlywood1"           "burlywood2"          
##  [40] "burlywood3"           "burlywood4"           "cadetblue"           
##  [43] "cadetblue1"           "cadetblue2"           "cadetblue3"          
##  [46] "cadetblue4"           "chartreuse"           "chartreuse1"         
##  [49] "chartreuse2"          "chartreuse3"          "chartreuse4"         
##  [52] "chocolate"            "chocolate1"           "chocolate2"          
##  [55] "chocolate3"           "chocolate4"           "coral"               
##  [58] "coral1"               "coral2"               "coral3"              
##  [61] "coral4"               "cornflowerblue"       "cornsilk"            
##  [64] "cornsilk1"            "cornsilk2"            "cornsilk3"           
##  [67] "cornsilk4"            "cyan"                 "cyan1"               
##  [70] "cyan2"                "cyan3"                "cyan4"               
##  [73] "darkblue"             "darkcyan"             "darkgoldenrod"       
##  [76] "darkgoldenrod1"       "darkgoldenrod2"       "darkgoldenrod3"      
##  [79] "darkgoldenrod4"       "darkgray"             "darkgreen"           
##  [82] "darkgrey"             "darkkhaki"            "darkmagenta"         
##  [85] "darkolivegreen"       "darkolivegreen1"      "darkolivegreen2"     
##  [88] "darkolivegreen3"      "darkolivegreen4"      "darkorange"          
##  [91] "darkorange1"          "darkorange2"          "darkorange3"         
##  [94] "darkorange4"          "darkorchid"           "darkorchid1"         
##  [97] "darkorchid2"          "darkorchid3"          "darkorchid4"         
## [100] "darkred"              "darksalmon"           "darkseagreen"        
## [103] "darkseagreen1"        "darkseagreen2"        "darkseagreen3"       
## [106] "darkseagreen4"        "darkslateblue"        "darkslategray"       
## [109] "darkslategray1"       "darkslategray2"       "darkslategray3"      
## [112] "darkslategray4"       "darkslategrey"        "darkturquoise"       
## [115] "darkviolet"           "deeppink"             "deeppink1"           
## [118] "deeppink2"            "deeppink3"            "deeppink4"           
## [121] "deepskyblue"          "deepskyblue1"         "deepskyblue2"        
## [124] "deepskyblue3"         "deepskyblue4"         "dimgray"             
## [127] "dimgrey"              "dodgerblue"           "dodgerblue1"         
## [130] "dodgerblue2"          "dodgerblue3"          "dodgerblue4"         
## [133] "firebrick"            "firebrick1"           "firebrick2"          
## [136] "firebrick3"           "firebrick4"           "floralwhite"         
## [139] "forestgreen"          "gainsboro"            "ghostwhite"          
## [142] "gold"                 "gold1"                "gold2"               
## [145] "gold3"                "gold4"                "goldenrod"           
## [148] "goldenrod1"           "goldenrod2"           "goldenrod3"          
## [151] "goldenrod4"           "gray"                 "gray0"               
## [154] "gray1"                "gray2"                "gray3"               
## [157] "gray4"                "gray5"                "gray6"               
## [160] "gray7"                "gray8"                "gray9"               
## [163] "gray10"               "gray11"               "gray12"              
## [166] "gray13"               "gray14"               "gray15"              
## [169] "gray16"               "gray17"               "gray18"              
## [172] "gray19"               "gray20"               "gray21"              
## [175] "gray22"               "gray23"               "gray24"              
## [178] "gray25"               "gray26"               "gray27"              
## [181] "gray28"               "gray29"               "gray30"              
## [184] "gray31"               "gray32"               "gray33"              
## [187] "gray34"               "gray35"               "gray36"              
## [190] "gray37"               "gray38"               "gray39"              
## [193] "gray40"               "gray41"               "gray42"              
## [196] "gray43"               "gray44"               "gray45"              
## [199] "gray46"               "gray47"               "gray48"              
## [202] "gray49"               "gray50"               "gray51"              
## [205] "gray52"               "gray53"               "gray54"              
## [208] "gray55"               "gray56"               "gray57"              
## [211] "gray58"               "gray59"               "gray60"              
## [214] "gray61"               "gray62"               "gray63"              
## [217] "gray64"               "gray65"               "gray66"              
## [220] "gray67"               "gray68"               "gray69"              
## [223] "gray70"               "gray71"               "gray72"              
## [226] "gray73"               "gray74"               "gray75"              
## [229] "gray76"               "gray77"               "gray78"              
## [232] "gray79"               "gray80"               "gray81"              
## [235] "gray82"               "gray83"               "gray84"              
## [238] "gray85"               "gray86"               "gray87"              
## [241] "gray88"               "gray89"               "gray90"              
## [244] "gray91"               "gray92"               "gray93"              
## [247] "gray94"               "gray95"               "gray96"              
## [250] "gray97"               "gray98"               "gray99"              
## [253] "gray100"              "green"                "green1"              
## [256] "green2"               "green3"               "green4"              
## [259] "greenyellow"          "grey"                 "grey0"               
## [262] "grey1"                "grey2"                "grey3"               
## [265] "grey4"                "grey5"                "grey6"               
## [268] "grey7"                "grey8"                "grey9"               
## [271] "grey10"               "grey11"               "grey12"              
## [274] "grey13"               "grey14"               "grey15"              
## [277] "grey16"               "grey17"               "grey18"              
## [280] "grey19"               "grey20"               "grey21"              
## [283] "grey22"               "grey23"               "grey24"              
## [286] "grey25"               "grey26"               "grey27"              
## [289] "grey28"               "grey29"               "grey30"              
## [292] "grey31"               "grey32"               "grey33"              
## [295] "grey34"               "grey35"               "grey36"              
## [298] "grey37"               "grey38"               "grey39"              
## [301] "grey40"               "grey41"               "grey42"              
## [304] "grey43"               "grey44"               "grey45"              
## [307] "grey46"               "grey47"               "grey48"              
## [310] "grey49"               "grey50"               "grey51"              
## [313] "grey52"               "grey53"               "grey54"              
## [316] "grey55"               "grey56"               "grey57"              
## [319] "grey58"               "grey59"               "grey60"              
## [322] "grey61"               "grey62"               "grey63"              
## [325] "grey64"               "grey65"               "grey66"              
## [328] "grey67"               "grey68"               "grey69"              
## [331] "grey70"               "grey71"               "grey72"              
## [334] "grey73"               "grey74"               "grey75"              
## [337] "grey76"               "grey77"               "grey78"              
## [340] "grey79"               "grey80"               "grey81"              
## [343] "grey82"               "grey83"               "grey84"              
## [346] "grey85"               "grey86"               "grey87"              
## [349] "grey88"               "grey89"               "grey90"              
## [352] "grey91"               "grey92"               "grey93"              
## [355] "grey94"               "grey95"               "grey96"              
## [358] "grey97"               "grey98"               "grey99"              
## [361] "grey100"              "honeydew"             "honeydew1"           
## [364] "honeydew2"            "honeydew3"            "honeydew4"           
## [367] "hotpink"              "hotpink1"             "hotpink2"            
## [370] "hotpink3"             "hotpink4"             "indianred"           
## [373] "indianred1"           "indianred2"           "indianred3"          
## [376] "indianred4"           "ivory"                "ivory1"              
## [379] "ivory2"               "ivory3"               "ivory4"              
## [382] "khaki"                "khaki1"               "khaki2"              
## [385] "khaki3"               "khaki4"               "lavender"            
## [388] "lavenderblush"        "lavenderblush1"       "lavenderblush2"      
## [391] "lavenderblush3"       "lavenderblush4"       "lawngreen"           
## [394] "lemonchiffon"         "lemonchiffon1"        "lemonchiffon2"       
## [397] "lemonchiffon3"        "lemonchiffon4"        "lightblue"           
## [400] "lightblue1"           "lightblue2"           "lightblue3"          
## [403] "lightblue4"           "lightcoral"           "lightcyan"           
## [406] "lightcyan1"           "lightcyan2"           "lightcyan3"          
## [409] "lightcyan4"           "lightgoldenrod"       "lightgoldenrod1"     
## [412] "lightgoldenrod2"      "lightgoldenrod3"      "lightgoldenrod4"     
## [415] "lightgoldenrodyellow" "lightgray"            "lightgreen"          
## [418] "lightgrey"            "lightpink"            "lightpink1"          
## [421] "lightpink2"           "lightpink3"           "lightpink4"          
## [424] "lightsalmon"          "lightsalmon1"         "lightsalmon2"        
## [427] "lightsalmon3"         "lightsalmon4"         "lightseagreen"       
## [430] "lightskyblue"         "lightskyblue1"        "lightskyblue2"       
## [433] "lightskyblue3"        "lightskyblue4"        "lightslateblue"      
## [436] "lightslategray"       "lightslategrey"       "lightsteelblue"      
## [439] "lightsteelblue1"      "lightsteelblue2"      "lightsteelblue3"     
## [442] "lightsteelblue4"      "lightyellow"          "lightyellow1"        
## [445] "lightyellow2"         "lightyellow3"         "lightyellow4"        
## [448] "limegreen"            "linen"                "magenta"             
## [451] "magenta1"             "magenta2"             "magenta3"            
## [454] "magenta4"             "maroon"               "maroon1"             
## [457] "maroon2"              "maroon3"              "maroon4"             
## [460] "mediumaquamarine"     "mediumblue"           "mediumorchid"        
## [463] "mediumorchid1"        "mediumorchid2"        "mediumorchid3"       
## [466] "mediumorchid4"        "mediumpurple"         "mediumpurple1"       
## [469] "mediumpurple2"        "mediumpurple3"        "mediumpurple4"       
## [472] "mediumseagreen"       "mediumslateblue"      "mediumspringgreen"   
## [475] "mediumturquoise"      "mediumvioletred"      "midnightblue"        
## [478] "mintcream"            "mistyrose"            "mistyrose1"          
## [481] "mistyrose2"           "mistyrose3"           "mistyrose4"          
## [484] "moccasin"             "navajowhite"          "navajowhite1"        
## [487] "navajowhite2"         "navajowhite3"         "navajowhite4"        
## [490] "navy"                 "navyblue"             "oldlace"             
## [493] "olivedrab"            "olivedrab1"           "olivedrab2"          
## [496] "olivedrab3"           "olivedrab4"           "orange"              
## [499] "orange1"              "orange2"              "orange3"             
## [502] "orange4"              "orangered"            "orangered1"          
## [505] "orangered2"           "orangered3"           "orangered4"          
## [508] "orchid"               "orchid1"              "orchid2"             
## [511] "orchid3"              "orchid4"              "palegoldenrod"       
## [514] "palegreen"            "palegreen1"           "palegreen2"          
## [517] "palegreen3"           "palegreen4"           "paleturquoise"       
## [520] "paleturquoise1"       "paleturquoise2"       "paleturquoise3"      
## [523] "paleturquoise4"       "palevioletred"        "palevioletred1"      
## [526] "palevioletred2"       "palevioletred3"       "palevioletred4"      
## [529] "papayawhip"           "peachpuff"            "peachpuff1"          
## [532] "peachpuff2"           "peachpuff3"           "peachpuff4"          
## [535] "peru"                 "pink"                 "pink1"               
## [538] "pink2"                "pink3"                "pink4"               
## [541] "plum"                 "plum1"                "plum2"               
## [544] "plum3"                "plum4"                "powderblue"          
## [547] "purple"               "purple1"              "purple2"             
## [550] "purple3"              "purple4"              "red"                 
## [553] "red1"                 "red2"                 "red3"                
## [556] "red4"                 "rosybrown"            "rosybrown1"          
## [559] "rosybrown2"           "rosybrown3"           "rosybrown4"          
## [562] "royalblue"            "royalblue1"           "royalblue2"          
## [565] "royalblue3"           "royalblue4"           "saddlebrown"         
## [568] "salmon"               "salmon1"              "salmon2"             
## [571] "salmon3"              "salmon4"              "sandybrown"          
## [574] "seagreen"             "seagreen1"            "seagreen2"           
## [577] "seagreen3"            "seagreen4"            "seashell"            
## [580] "seashell1"            "seashell2"            "seashell3"           
## [583] "seashell4"            "sienna"               "sienna1"             
## [586] "sienna2"              "sienna3"              "sienna4"             
## [589] "skyblue"              "skyblue1"             "skyblue2"            
## [592] "skyblue3"             "skyblue4"             "slateblue"           
## [595] "slateblue1"           "slateblue2"           "slateblue3"          
## [598] "slateblue4"           "slategray"            "slategray1"          
## [601] "slategray2"           "slategray3"           "slategray4"          
## [604] "slategrey"            "snow"                 "snow1"               
## [607] "snow2"                "snow3"                "snow4"               
## [610] "springgreen"          "springgreen1"         "springgreen2"        
## [613] "springgreen3"         "springgreen4"         "steelblue"           
## [616] "steelblue1"           "steelblue2"           "steelblue3"          
## [619] "steelblue4"           "tan"                  "tan1"                
## [622] "tan2"                 "tan3"                 "tan4"                
## [625] "thistle"              "thistle1"             "thistle2"            
## [628] "thistle3"             "thistle4"             "tomato"              
## [631] "tomato1"              "tomato2"              "tomato3"             
## [634] "tomato4"              "turquoise"            "turquoise1"          
## [637] "turquoise2"           "turquoise3"           "turquoise4"          
## [640] "violet"               "violetred"            "violetred1"          
## [643] "violetred2"           "violetred3"           "violetred4"          
## [646] "wheat"                "wheat1"               "wheat2"              
## [649] "wheat3"               "wheat4"               "whitesmoke"          
## [652] "yellow"               "yellow1"              "yellow2"             
## [655] "yellow3"              "yellow4"              "yellowgreen"
  • El mismo gráfico anterior controlando el color de los bordes y el relleno de las barras. El color se puede editar con el argumento color y el relleno con el argumento fill: (Colores hexadecimales)
creditos2 %>% 
  ggplot(mapping = aes(x = productor)) +
  geom_bar(color = "black", fill = "#503e5e") +
  labs(x = "Tipo de productor", y = "Frecuencia",
       title = "Frecuencia absoluta por tipo de productor")

geom_col()

  • Tendremos previamente que obtener el número a graficar (y). Esto lo podemos hacer combinando group_by() con count():
creditos2 %>% 
  group_by(productor) %>% 
  count(name = "total") %>% 
  ggplot(mapping = aes(x = productor, y = total)) +
  geom_col(color = "black", fill = "#503e5e") +
  labs(x = "Tipo de productor", y = "Frecuencia",
       title = "Frecuencia absoluta por tipo de productor")

  • ¿Cuál es el total de colocación (rubro) de crédito por productor? Nota: podemos cambiar el tema a través de las funciones que empiezan por theme_. Consultar biblioteca ggthemes
creditos2 %>% 
  group_by(productor) %>% 
  summarise(total_dinero = sum(colocacion) / 1000000) %>% 
  ggplot(mapping = aes(x = productor, y = total_dinero)) +
  geom_col(color = "black", fill = "#503e5e") +
  labs(x = "Tipo de productor", y = "Rubro (Millones)",
       title = "Total de rubro por tipo de productor") +
  theme_minimal()

Conteos agrupados geom_bar()

  • ¿Cuál es el total de créditos por tipo de productor y género (sólo hombres y mujeres)?
creditos2 %>% 
  filter(genero %in% c("Hombre", "Mujer")) %>% 
  ggplot(mapping = aes(x = productor, fill = genero)) +
  geom_bar()

  • Por defecto la función geom_bar() apila (stack) las barras en función del fill o color que indiquemos en el mapeo estético. Podemos alterar el argumento position para obtener una visualización diferente:
creditos2 %>% 
  filter(genero %in% c("Hombre", "Mujer")) %>% 
  ggplot(mapping = aes(x = productor, fill = genero)) +
  geom_bar(position = "dodge") +
  xlab("Productor") +
  ylab("Frecuencia") +
  ggtitle("Frecuencia absoluta por tipo de productor y género")

  • Editando colores del relleo manualmente (scale_fill_manual()), etiqueta (labs()) y posición de la leyenda (theme(legend.position = “top”)):
creditos2 %>% 
  filter(genero %in% c("Hombre", "Mujer")) %>% 
  ggplot(mapping = aes(x = productor, fill = genero)) +
  geom_bar(position = "dodge") +
  scale_fill_manual(values = c("lightsalmon3", "orangered1")) +
  labs(x = "Tipo de productor", y = "Frecuencia",
       title = "Frecuencia absoluta por tipo de productor y género",
       fill = "Género") +
  theme(legend.position = "top")

  • ¿Cuántos créditos fueron concedidos por departamento?
creditos2 %>% 
  group_by(depto) %>% 
  count(name = "total") %>% 
  ggplot(mapping = aes(x = reorder(depto, total), y = total)) +
  geom_col(width = 0.5) +
  coord_flip() +
  labs(x = "Departamento", y = "Frecuencia",
       title = "Frecuencia absoluta por departamento")

  • El mismo gráfico lo podemos obtener con geom_point():
creditos2 %>% 
  group_by(depto) %>% 
  count(name = "total") %>% 
  ggplot(mapping = aes(x = reorder(depto, total), y = total)) +
  geom_point(size = 2, color = "blue") +
  coord_flip() +
  labs(x = "Departamento", y = "Frecuencia",
       title = "Frecuencia absoluta por departamento")

Proporciones

geom_bar()

  • ¿Cuál fue la proporción de créditos por género de acuerdo al tipo de productor?
creditos2 %>% 
  filter(genero %in% c("Hombre", "Mujer")) %>% 
  ggplot(mapping = aes(x = productor, fill = genero)) +
  geom_bar(position = "fill") +
  scale_fill_manual(values = c("lightsalmon3", "orangered1")) +
  labs(x = "Tipo de productor", y = "Frecuencia",
       title = "Propoción por tipo de productor y género",
       fill = "Género") +
  theme(legend.position = "top") +
  coord_flip()

creditos2 %>% 
  filter(genero %in% c("Hombre", "Mujer")) %>% 
  ggplot(mapping = aes(x = genero, fill = productor)) +
  geom_bar(position = "fill") +
  scale_fill_manual(values = c("lightsalmon3", "orangered1", "forestgreen")) +
  labs(x = "Género", y = "Frecuencia",
       title = "Proporción por tipo de productor y género",
       fill = "Productor") +
  theme(legend.position = "top") +
  coord_flip()

geom_col()

  • ¿Cómo es la distribución del total del rubro (proporción) por tipo de productor en cada departamento?

  • Colores de RColorBrewer. Para ver las paletas disponibles en esta biblioteca podemos usar las funciones display.brewer.all(), display.brewer.pal() y brewer.pal()

library(RColorBrewer)
creditos2 %>% 
  group_by(depto, productor) %>% 
  summarise(total_rubro = sum(colocacion)) %>% 
  ggplot(mapping = aes(x = reorder(depto, total_rubro), y = total_rubro, fill = productor)) +
  geom_col(position = "fill") +
  coord_flip() +
  scale_fill_brewer(palette = "Set1")

Distribuciones (numéricas)

  • Para variables numéricas (cuantitativas) se pueden obtener histogramas y densidades con la finalidad de conocer la distribución de dichas variables.
  • Ayudan a detectar atipicidades en la información (valores muy altos o muy bajos)
  • Permiten determinar grados de simetría

Histogramas

  • Podemos construir histogramas con la función geom_histogram(). El mapeo estético requiere de un x o un y. Lo más común es añadir en el mapeo estético a x como la variable de la cual se desea conocer la distribución.
creditos2 %>% 
  ggplot(mapping = aes(x = colocacion)) +
  geom_histogram()

  • Para mejorar el gráfico podríamos aplicar una transformación logarítmica. Una manera de hacerlo es declarar el logaritmo en el mapeo estético:
creditos2 %>% 
  ggplot(mapping = aes(x = log10(colocacion))) +
  geom_histogram()

  • Una mejor opción para aplicar la transformación al construir el histograma es utilizar la función scale_x_log10:
library(ggthemes)
creditos2 %>% 
  ggplot(mapping = aes(x = colocacion)) +
  geom_histogram() +
  scale_x_log10() +
  labs(x = "Colocación ($)",
       y = "Frecuencia",
       title = "Distribución de colocación de crédito") +
  theme_tufte()

  • Podemos personalizar el histograma editando argumentos como el color, fill, alpha, bins y binwidth:
creditos2 %>% 
  ggplot(mapping = aes(x = colocacion)) +
  geom_histogram(color = "firebrick", fill = "firebrick", alpha = 0.5,
                 bins = 50) +
  scale_x_log10() +
  labs(x = "Colocación ($)",
       y = "Frecuencia",
       title = "Distribución de colocación de crédito")

  • Para cambiar la notación de la variable del eje x podemos utilizar la biblioteca scales:
library(scales)
creditos2 %>% 
  ggplot(mapping = aes(x = colocacion)) +
  geom_histogram(color = "firebrick", fill = "firebrick", alpha = 0.5,
                 bins = 50) +
  scale_x_continuous(labels = comma_format(big.mark = ".", decimal.mark = ","),
                     trans = log10_trans()) +
  scale_y_continuous(labels = comma_format(big.mark = ".", decimal.mark = ",")) +
  labs(x = "Colocación ($)",
       y = "Frecuencia",
       title = "Distribución de colocación de crédito")

  • Podemos incorporar una variable categórica al histograma:
creditos2 %>% 
  ggplot(mapping = aes(x = colocacion, fill = productor, color = productor)) +
  geom_histogram(alpha = 0.8) +
  scale_x_continuous(labels = comma_format(big.mark = ".", decimal.mark = ","),
                     trans = log10_trans())

  • Podemos obtener una ventana (panel) de graficación para cada nivel de la variable categórica haciendo uso de la función facet_wrap():
creditos2 %>% 
  ggplot(mapping = aes(x = colocacion)) +
  facet_wrap(facets = ~productor, scales = "free") + 
  geom_histogram(color = "darkblue") +
  scale_x_log10()

  • Podemos cambiar el número de valores que aparecen en el eje x a través de la función scale_x_continous:
creditos2 %>% 
  ggplot(mapping = aes(x = colocacion)) +
  geom_histogram(color = "black") +
  scale_x_continuous(trans = log10_trans(), n.breaks = 10)

Densidades

  • Distribución de colocación de crédito por tipo de productor:
creditos2 %>% 
  ggplot(mapping = aes(x = colocacion, fill = productor)) +
  geom_density(alpha = 0.5) +
  scale_x_log10()

  • Distribución del monto de créditos por tipo de productor y departamento:
creditos2 %>% 
  ggplot(mapping = aes(x = colocacion, fill = productor)) +
  facet_wrap(facets = ~depto, ncol = 4, scales = "free") +
  geom_density(alpha = 0.5) +
  scale_x_log10() +
  theme(legend.position = "top")

Boxplots

  • Distribución de colocación de créditos por tipo de productor:
creditos2 %>% 
  ggplot(mapping = aes(y = colocacion, x = productor)) +
  geom_boxplot() +
  scale_y_log10()

  • Distribución de colocación de créditos por departamento y tipo de productor:
creditos2 %>% 
  ggplot(mapping = aes(y = colocacion, x = productor)) +
  facet_wrap(facets = ~depto, ncol = 4, scales = "free") +
  geom_boxplot() +
  scale_y_log10()

Violines

  • Distribución de colocación de créditos por tipo de productor:
creditos2 %>% 
  ggplot(mapping = aes(y = colocacion, x = productor)) +
  geom_violin() +
  scale_y_log10()

  • Boxtplot + Violín:
creditos2 %>% 
  ggplot(mapping = aes(y = colocacion, x = productor)) +
  geom_violin() +
  geom_boxplot(width = 0.2) +
  scale_y_log10()

Relaciones X vs Y

  • Una primera aproximación para graficar x vs y es a través del diagrama de dispersión, sin embargo, cuando tenemos un número de observaciones elevado no es eficiente computacionalmente.

geom_point()

  • ¿Cuál es la correlación entre colocación de crédito y plazo? Uso del método de Pearson (coeficiente de correlación paramétrico)
cor(x = log10(creditos2$colocacion), y = creditos2$plazo, method = "pearson")
## [1] 0.2936585
  • Coeficiente de correlación no paramétrico (Spearman):
cor(x = log10(creditos2$colocacion), y = creditos2$plazo, method = "spearman")
## [1] 0.395243
creditos2 %>% 
  ggplot(mapping = aes(x = colocacion, y = plazo)) +
  geom_point(alpha = 0.01) +
  geom_smooth(method = "lm") +
  scale_x_log10()

  • Vamos a resumir por departamento y productor el número de créditos, la suma total del rubro, la mediana del rubro y el promedio del plazo. Con estos datos heremos un gráfico de dispersión.
data_resumida <- creditos2 %>% 
  group_by(depto, productor) %>% 
  summarise(total_creditos = n(),
            total_rubro = sum(colocacion),
            mediana_rubro = median(colocacion),
            promedio_plazo = mean(plazo)) %>% 
  ungroup()
data_resumida
  • Con los datos anteriores vamos a construir un diagrama de dispersión de total_rubro vs promedio_plazo:
data_resumida %>% 
  ggplot(mapping = aes(x = total_rubro, y = promedio_plazo)) +
  geom_point() +
  scale_x_log10() +
  scale_y_log10() +
  geom_smooth(method = "lm", se = FALSE)

  • mediana_rubro vs promedio_plazo: (gráfico con información errada)
data_resumida %>% 
  ggplot(mapping = aes(x = mediana_rubro, y = promedio_plazo)) +
  geom_point() +
  scale_x_log10() +
  scale_y_log10() +
  geom_smooth(method = "lm", se = FALSE)

  • mediana_rubro vs promedio_plazo por tipo de productor:
data_resumida %>% 
  ggplot(mapping = aes(x = mediana_rubro, y = promedio_plazo, color = productor)) +
  geom_point() +
  scale_x_log10() +
  scale_y_log10() +
  geom_smooth(method = "lm", se = FALSE)

  • Una forma de ver el gráfico anterior de manera interactiva es a través de la función ggplotly() de la biblioteca plotly:
library(plotly)
ggplotly(
  data_resumida %>% 
  ggplot(mapping = aes(x = mediana_rubro, y = promedio_plazo, color = productor)) +
  geom_point() +
  scale_x_log10() +
  scale_y_log10() +
  geom_smooth(method = "lm", se = FALSE)
)
  • Podemos incoporar una tercera variable al gráfico de dispersión a través del argumento size en el mapeo estético:
data_resumida %>% 
  ggplot(mapping = aes(x = mediana_rubro, y = promedio_plazo, color = productor,
                       size = total_creditos)) +
  geom_point(alpha = 0.5) +
  scale_x_log10() +
  scale_y_log10() +
  geom_smooth(method = "lm", se = FALSE, show.legend = FALSE) +
  scale_size_continuous(breaks = c(1000, 5000, 10000, 20000, 30000))

geom_bin2d()

  • Cuando el número de observaciones es elevado una mejor manera de visualizar la relación de x vs y es a través de densidades 2D.
creditos2 %>% 
  ggplot(mapping = aes(x = colocacion, y = plazo)) +
  geom_bin2d() +
  scale_x_log10() +
  geom_smooth(method = "lm", color = "red")

geom_density2d()

creditos2 %>% 
  ggplot(mapping = aes(x = colocacion, y = plazo)) +
  geom_density2d() +
  scale_x_log10() +
  geom_smooth(method = "lm", color = "red")

geom_density_2d_filled()

creditos2 %>% 
  ggplot(mapping = aes(x = colocacion, y = plazo)) +
  geom_density_2d_filled() +
  scale_x_log10() +
  geom_smooth(method = "lm", color = "red")

Bibliotecas

  • Instalar las siguientes bibliotecas:
    • scales
    • RColorBrewer
    • grid
    • gridExtra
    • ggpubr
    • raster
    • sf
    • ggmap
    • ggridges
    • jcolors