PRIMERA PARTE

Grafico 1 sin ordenar

  • se le mejoraron al grafico algunos datos, que se mostraran acontinuacion

organizo base de datos Y la importo a R

library(tidyverse)
library(readxl)
library(janitor)
library(Hmisc)

grafico_ordenado <- read_excel(path = "Datos_estadisticos_ordenadas.xlsx") %>% 
  clean_names() %>% 
  rename(Año = anos, Pais = pais, Total = total) %>% 
  unite(Año, Pais, col = "Pais2")

grafico_ordenado

Gráfica 1 ordenado

grafico_ordenado %>% 
  
  
  ggplot(mapping = aes(x = reorder(Pais2, Total), y = Total)) +
  geom_col(fill = "aquamarine2") +
  geom_label(aes(label= Total)) +
  
  
  
  labs(x = "Año",
       y = "Pais",
       title = "Aumento de la deuda externa en los ultimos 10 años") +
  
  
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Gráfico 2 sin corregir

Datos organizados e importados a R

  grafico_correcto <- read_excel(path = "Grafico_correcto.xlsx")
  
  grafico_correcto 

Gráfico corregido

grafico_correcto %>% 
 ggplot(mapping = aes(x = Año, y = Datos)) +
  facet_wrap(facets = ~PIB, scales = "free") +
 
  geom_point(color = "red") +
   geom_line(color = "blueviolet") +
  
  labs(x = "Año", 
       y = "Datos", 
       title = "PIB global y de German en USD actuales",
       subtitle = "PIB")

SEGUNDA PARTE

Hurto de cabezas de ganado 2019 - Colombia

# Datos  hurtos de Ganado 2019
library(janitor)
library(tidyverse)
library(Hmisc)
data_hurtos <- read_csv(
  file = "HURTO_A_CABEZAS_DE_GANADO_PER_ODO_DEL_01_DE_ENERO__AL_31_DE_DICIEMBRE_A_O_2019.csv"
) %>% 
  clean_names() %>% 
  filter(cantidad == 1) %>% 
  mutate_if(is.character, tolower) %>% 
  mutate_if(is.character, capitalize) %>% 
  mutate_if(is.character, as.factor) %>% 
  mutate(dia = factor(dia,
                      levels = c("Lunes", "Martes", "Miércoles", "Jueves",
                                 "Viernes", "Sábado", "Domingo"))) %>% 
  select(-codigo_dane)
head(data_hurtos)

Gráfico 1

data_hurtos %>% 
  group_by(dia, zona) %>% 
  summarise(total_hurtos_dia = n(), dia = dia) %>% 
  ggplot(mapping = aes(x = dia, y = total_hurtos_dia, group = zona, color = zona)) +
  geom_point(size = 4) +
  geom_line(size = 1) +
  scale_y_continuous(limits = c(0, 350)) +
  labs(x = "Día",
       y = "Total",
       title = "Hurtos por día de la semana y zona")

Gráfico 2

data_hurtos %>% 
  group_by(departamento, dia, zona) %>% 
  summarise(total_hurtos_dia = n(), dia = dia) %>% 
  
  ggplot(mapping = aes(x = dia, y = total_hurtos_dia, group = zona, color = zona)) +
  facet_wrap(facets = ~departamento, scales = "free", ncol = 4) +
  geom_line() +
  geom_point() +
  theme(axis.text.x = element_text(angle = 45, size = 8, vjust = 1.2, hjust = 1.2)) +
  
  
  
  labs(x = "Día",
       y = "Total",
       title = "Hurtos por día de la semana y zona",
       subtitle = "Comportamiento departamental") +
  
   
  
  theme(legend.position = "top") 

Gráfico 3

data_hurtos %>% 
  group_by(clase_de_empleado, zona) %>% 
  summarise(total_hurtos_dia = n()) %>%  
  ggplot(mapping = aes(x = reorder(clase_de_empleado, total_hurtos_dia), y = total_hurtos_dia)) +
  theme(axis.title.y = element_blank()) +
  facet_wrap(facets = ~zona, scales = "free", ncol = 4) +
  
  coord_flip() +
  geom_point() +
  
  labs(y = "Total",
       title = "Hurtos por clase de empleados",
       subtitle = "Comportamiento por zonas")

Gráfico 4

data_hurtos %>% 
  group_by(departamento, dia) %>% 
  summarise(total_hurtos_dia = n()) %>% 
  ggplot(mapping = aes(x = total_hurtos_dia)) +
  geom_density(alpha = 0.5) +
  facet_wrap(facets = ~departamento, scales = "free", ncol = 4) +
  
   labs(x = "Total", y = "Densidad",
       title = "Distribuccion de hurtos por departamento",
       subtitle = "Comportamiento semanal")

Accidentalidad con motocicletas en Medellín 2015-2019

library(janitor)
library(tidyverse)
library(Hmisc)
data_motos <- read_csv("Accidentalidad_con_motos_municipio_de_Medell_n_actualizado_a_julio_2020.csv") %>% 
  clean_names() %>% 
  mutate(fecha_accidente = as.Date(fecha_accidente, format = "%m/%d/%Y")) %>% 
  mutate_if(is.character, tolower) %>% 
  mutate_if(is.character, capitalize) %>% 
  mutate_if(is.character, as.factor) 
head(data_motos)

Gráfico 1

  • Consulta: ¿En cuál de las comunas (16 en total) de Medellín se presenta mayor número de accidentes?
data_motos %>% 
  group_by(zona) %>% 
  filter(zona %in% c("Comuna 1", "Comuna 2", "Comuna 3", "Comuna 4", "Comuna 5", "Comuna 6", "Comuna 7", "Comuna 8", "Comuna 9", "Comuna 10", "Comuna 11", "Comuna 12", "Comuna 13", "Comuna 14", "Comuna 15", "Comuna 16")) %>% 
  count(name = "total") %>% 
  ggplot(mapping = aes(x = reorder(zona, total), y = total)) +
  coord_flip() +
  geom_col() +
  scale_y_continuous(breaks = c(seq (0, 15000, 5000))) +
  labs(x = "Comuna",
       y = "Total",
       title = "Número de accidentes en motocicletas por comunas",
       subtitle = "Medellin, Colombia (2015-2019)")

Gráfico 2

  • Consulta: ¿En qué hora del día se maximizan los accidentes en Medellín?
data_motos %>% 
  group_by(hora_accidente) %>% 
   
  count(name = "total") %>% 
  ggplot(mapping = aes(x = hora_accidente, y = total)) +
  scale_x_time(breaks = seq(min(data_motos$hora_accidente, na.rm = TRUE),
                            max(data_motos$hora_accidente, na.rm = TRUE),
                            length.out = 10)) +
  geom_smooth(se = FALSE) +
  labs(x = "Hora",
       y = "Total",
       title = "Accidentes en motocicleta vs hora del dia",
       subtitle = "Medellin, Colombia (2015-2019)")

Gráfico 3

  • Consulta: ¿El patrón de comportamiento observado en el gráfico anterior es el mismo para todas las comunas?
data_motos %>% 
  group_by(hora_accidente, zona) %>%  
  filter(zona %in% c("Comuna 1", "Comuna 2", "Comuna 3", "Comuna 4", "Comuna 5", "Comuna 6", "Comuna 7", "Comuna 8", "Comuna 9", "Comuna 10", "Comuna 11", "Comuna 12", "Comuna 13", "Comuna 14", "Comuna 15", "Comuna 16")) %>%
  count(name = "total") %>% 
  ggplot(mapping = aes(x = hora_accidente, y = total)) +
  geom_smooth(se = FALSE) +
  facet_wrap(facets = ~zona, scales = "free", ncol = 3) +
  scale_x_time(breaks = seq(min(data_motos$hora_accidente, na.rm = TRUE),
                            max(data_motos$hora_accidente, na.rm = TRUE),
                            length.out = 10))

  theme(axis.text.x = element_text(size = 7)) +
  labs(x = "Hora",
       y = "Total",
       title = "Accidentes en motocicleta vs hora del dia por comuna",
       subtitle = "Medellin, Colombia (2015-2019)")
## List of 5
##  $ axis.text.x:List of 11
##   ..$ family       : NULL
##   ..$ face         : NULL
##   ..$ colour       : NULL
##   ..$ size         : num 7
##   ..$ hjust        : NULL
##   ..$ vjust        : NULL
##   ..$ angle        : NULL
##   ..$ lineheight   : NULL
##   ..$ margin       : NULL
##   ..$ debug        : NULL
##   ..$ inherit.blank: logi FALSE
##   ..- attr(*, "class")= chr [1:2] "element_text" "element"
##  $ x          : chr "Hora"
##  $ y          : chr "Total"
##  $ title      : chr "Accidentes en motocicleta vs hora del dia por comuna"
##  $ subtitle   : chr "Medellin, Colombia (2015-2019)"
##  - attr(*, "class")= chr [1:2] "theme" "gg"
##  - attr(*, "complete")= logi FALSE
##  - attr(*, "validate")= logi TRUE

Datos nutricionales (kaggle)

data_nutri <- read_excel("datos_kaggle_nutrition_corregido.xlsx") %>% 
 clean_names () %>%   
  select(-1, -3 ) %>%
  
  pivot_longer(
    cols = -c(grupo),
    names_to = "tipo",
    values_to = "total") %>% 
   
  mutate(grupo = capitalize(tolower(grupo)),
         tipo = capitalize(tolower(tipo)),
         total = as.numeric(total)) %>%
  
  rename(Grupos = grupo, Tipo = tipo, Total = total)
  
data_nutri

Gráfico

library(ggsci)
data_nutri %>% 
  group_by(Grupos) %>%  
  
  ggplot(mapping = aes(x = Total, fill = Grupos)) +
  geom_density(alpha = 0.5) +
  facet_wrap(facets = ~Tipo, scales = "free", ncol = 3) +
  scale_fill_ucscgb() +
  scale_x_log10()

  data_nutri