PRIMERA PARTE

Grafico 1 sin ordenar

se le mejoraron al grafico algunos datos, que se mostraran acontinuacion

organizo base de datos Y la importo a R

library(tidyverse)
library(readxl)
library(janitor)
library(Hmisc)

grafico_ordenado <- read_excel(path = "Datos_estadisticos_ordenadas.xlsx") %>% 
  clean_names() %>% 
  rename(Año = anos, Pais = pais, Total = total) %>% 
  unite(Año, Pais, col = "Pais2")

grafico_ordenado

Gráfica 1 ordenado

grafico_ordenado %>% 
  
  
  ggplot(mapping = aes(x = reorder(Pais2, Total), y = Total)) +
  geom_col(fill = "aquamarine2") +
  geom_label(aes(label= Total)) +
  
  
  
  labs(x = "Año",
       y = "Pais",
       title = "Aumento de la deuda externa en los ultimos 10 años") +
  
  
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Gráfico 2 sin corregir

Datos organizados e importados a R

  grafico_correcto <- read_excel(path = "Grafico_correcto.xlsx")
  
  grafico_correcto

Gráfico corregido

grafico_correcto %>% 
 ggplot(mapping = aes(x = Año, y = Datos)) +
  facet_wrap(facets = ~PIB, scales = "free") +
 
  geom_point(color = "red") +
   geom_line(color = "blueviolet") +
  
  labs(x = "Año", 
       y = "Datos", 
       title = "PIB global y de German en USD actuales",
       subtitle = "PIB")

SEGUNDA PARTE

Hurto de cabezas de ganado 2019 - Colombia

# Datos  hurtos de Ganado 2019
library(janitor)
library(tidyverse)
library(Hmisc)
data_hurtos <- read_csv(
  file = "HURTO_A_CABEZAS_DE_GANADO_PER_ODO_DEL_01_DE_ENERO__AL_31_DE_DICIEMBRE_A_O_2019.csv"
) %>% 
  clean_names() %>% 
  filter(cantidad == 1) %>% 
  mutate_if(is.character, tolower) %>% 
  mutate_if(is.character, capitalize) %>% 
  mutate_if(is.character, as.factor) %>% 
  mutate(dia = factor(dia,
                      levels = c("Lunes", "Martes", "Miércoles", "Jueves",
                                 "Viernes", "Sábado", "Domingo"))) %>% 
  select(-codigo_dane)
head(data_hurtos)

Gráfico 1

data_hurtos %>% 
  group_by(dia, zona) %>% 
  summarise(total_hurtos_dia = n(), dia = dia) %>% 
  ggplot(mapping = aes(x = dia, y = total_hurtos_dia, group = zona, color = zona)) +
  geom_point(size = 4) +
  geom_line(size = 1) +
  scale_y_continuous(limits = c(0, 350)) +
  labs(x = "Día",
       y = "Total",
       title = "Hurtos por día de la semana y zona")

Gráfico 2

data_hurtos %>% 
  group_by(departamento, dia, zona) %>% 
  summarise(total_hurtos_dia = n(), dia = dia) %>% 
  
  ggplot(mapping = aes(x = dia, y = total_hurtos_dia, group = zona, color = zona)) +
  facet_wrap(facets = ~departamento, scales = "free", ncol = 4) +
  geom_line() +
  geom_point() +
  theme(axis.text.x = element_text(angle = 45, size = 8, vjust = 1.2, hjust = 1.2)) +
  
  
  
  labs(x = "Día",
       y = "Total",
       title = "Hurtos por día de la semana y zona",
       subtitle = "Comportamiento departamental") +
  
   
  
  theme(legend.position = "top")

Gráfico 3

data_hurtos %>% 
  group_by(clase_de_empleado, zona) %>% 
  summarise(total_hurtos_dia = n()) %>%  
  ggplot(mapping = aes(x = reorder(clase_de_empleado, total_hurtos_dia), y = total_hurtos_dia)) +
  theme(axis.title.y = element_blank()) +
  facet_wrap(facets = ~zona, scales = "free", ncol = 4) +
  
  coord_flip() +
  geom_point() +
  
  labs(y = "Total",
       title = "Hurtos por clase de empleados",
       subtitle = "Comportamiento por zonas")

Gráfico 4

data_hurtos %>% 
  group_by(departamento, dia) %>% 
  summarise(total_hurtos_dia = n()) %>% 
  ggplot(mapping = aes(x = total_hurtos_dia)) +
  geom_density(alpha = 0.5) +
  facet_wrap(facets = ~departamento, scales = "free", ncol = 4) +
  
   labs(x = "Total", y = "Densidad",
       title = "Distribuccion de hurtos por departamento",
       subtitle = "Comportamiento semanal")

Accidentalidad con motocicletas en Medellín 2015-2019

library(janitor)
library(tidyverse)
library(Hmisc)
data_motos <- read_csv("Accidentalidad_con_motos_municipio_de_Medell_n_actualizado_a_julio_2020.csv") %>% 
  clean_names() %>% 
  mutate(fecha_accidente = as.Date(fecha_accidente, format = "%m/%d/%Y")) %>% 
  mutate_if(is.character, tolower) %>% 
  mutate_if(is.character, capitalize) %>% 
  mutate_if(is.character, as.factor) 
head(data_motos)

Gráfico 1

Consulta: ¿En cuál de las comunas (16 en total) de Medellín se presenta mayor número de accidentes?

data_motos %>% 
  group_by(zona) %>% 
  filter(zona %in% c("Comuna 1", "Comuna 2", "Comuna 3", "Comuna 4", "Comuna 5", "Comuna 6", "Comuna 7", "Comuna 8", "Comuna 9", "Comuna 10", "Comuna 11", "Comuna 12", "Comuna 13", "Comuna 14", "Comuna 15", "Comuna 16")) %>% 
  count(name = "total") %>% 
  ggplot(mapping = aes(x = reorder(zona, total), y = total)) +
  coord_flip() +
  geom_col() +
  scale_y_continuous(breaks = c(seq (0, 15000, 5000))) +
  labs(x = "Comuna",
       y = "Total",
       title = "Número de accidentes en motocicletas por comunas",
       subtitle = "Medellin, Colombia (2015-2019)")

Gráfico 2

Consulta: ¿En qué hora del día se maximizan los accidentes en Medellín?

data_motos %>% 
  group_by(hora_accidente) %>% 
   
  count(name = "total") %>% 
  ggplot(mapping = aes(x = hora_accidente, y = total)) +
  scale_x_time(breaks = seq(min(data_motos$hora_accidente, na.rm = TRUE),
                            max(data_motos$hora_accidente, na.rm = TRUE),
                            length.out = 10)) +
  geom_smooth(se = FALSE) +
  labs(x = "Hora",
       y = "Total",
       title = "Accidentes en motocicleta vs hora del dia",
       subtitle = "Medellin, Colombia (2015-2019)")

Gráfico 3

Consulta: ¿El patrón de comportamiento observado en el gráfico anterior es el mismo para todas las comunas?

data_motos %>% 
  group_by(hora_accidente, zona) %>%  
  filter(zona %in% c("Comuna 1", "Comuna 2", "Comuna 3", "Comuna 4", "Comuna 5", "Comuna 6", "Comuna 7", "Comuna 8", "Comuna 9", "Comuna 10", "Comuna 11", "Comuna 12", "Comuna 13", "Comuna 14", "Comuna 15", "Comuna 16")) %>%
  count(name = "total") %>% 
  ggplot(mapping = aes(x = hora_accidente, y = total)) +
  geom_smooth(se = FALSE) +
  facet_wrap(facets = ~zona, scales = "free", ncol = 3) +
  scale_x_time(breaks = seq(min(data_motos$hora_accidente, na.rm = TRUE),
                            max(data_motos$hora_accidente, na.rm = TRUE),
                            length.out = 10))

  theme(axis.text.x = element_text(size = 7)) +
  labs(x = "Hora",
       y = "Total",
       title = "Accidentes en motocicleta vs hora del dia por comuna",
       subtitle = "Medellin, Colombia (2015-2019)")

## List of 5
##  $ axis.text.x:List of 11
##   ..$ family       : NULL
##   ..$ face         : NULL
##   ..$ colour       : NULL
##   ..$ size         : num 7
##   ..$ hjust        : NULL
##   ..$ vjust        : NULL
##   ..$ angle        : NULL
##   ..$ lineheight   : NULL
##   ..$ margin       : NULL
##   ..$ debug        : NULL
##   ..$ inherit.blank: logi FALSE
##   ..- attr(*, "class")= chr [1:2] "element_text" "element"
##  $ x          : chr "Hora"
##  $ y          : chr "Total"
##  $ title      : chr "Accidentes en motocicleta vs hora del dia por comuna"
##  $ subtitle   : chr "Medellin, Colombia (2015-2019)"
##  - attr(*, "class")= chr [1:2] "theme" "gg"
##  - attr(*, "complete")= logi FALSE
##  - attr(*, "validate")= logi TRUE

Datos nutricionales (kaggle)

data_nutri <- read_excel("datos_kaggle_nutrition_corregido.xlsx") %>% 
 clean_names () %>%   
  select(-1, -3 ) %>%
  
  pivot_longer(
    cols = -c(grupo),
    names_to = "tipo",
    values_to = "total") %>% 
   
  mutate(grupo = capitalize(tolower(grupo)),
         tipo = capitalize(tolower(tipo)),
         total = as.numeric(total)) %>%
  
  rename(Grupos = grupo, Tipo = tipo, Total = total)
  
data_nutri

Gráfico

library(ggsci)
data_nutri %>% 
  group_by(Grupos) %>%  
  
  ggplot(mapping = aes(x = Total, fill = Grupos)) +
  geom_density(alpha = 0.5) +
  facet_wrap(facets = ~Tipo, scales = "free", ncol = 3) +
  scale_fill_ucscgb() +
  scale_x_log10()

  data_nutri

Ejercicio de graficas estadísticas ordenadas

Arledis Madera Lopez

17/12/2020

PRIMERA PARTE

Grafico 1 sin ordenar

organizo base de datos Y la importo a R

Gráfica 1 ordenado

Gráfico 2 sin corregir

Datos organizados e importados a R

Gráfico corregido

SEGUNDA PARTE

Hurto de cabezas de ganado 2019 - Colombia

Gráfico 1

Gráfico 2

Gráfico 3

Gráfico 4

Accidentalidad con motocicletas en Medellín 2015-2019

Gráfico 1

Gráfico 2

Gráfico 3

Datos nutricionales (kaggle)

Gráfico