Grafica mal planteada
Grafica engañosa PIB
- propuesta
Hurto de ganado
por dia por zona
Hurtos por clase de empleado
2 hurtos por departamento
4 comportamiento semanal
Accidentalidad con motocicletas en Medellín 2015-2019
kaggle
- grupos
grafica

Grafica mal planteada

## Propuesta

library(tidyverse)
library(readxl)

grafica_error <- read_excel("graficamala1.xlsx") %>% 
  ggplot( aes(x = Año , y = Amapolas_erradicadas)) +
  geom_point()+ 
  geom_line()

grafica_error

Grafica engañosa PIB

propuesta

-Global

library(readxl)
library(janitor)
library(tidyverse)
library(Hmisc)
Global_pib <- read_excel("pib_global.xlsx") %>% 
   ggplot( aes(x = Año , y = PIB, color = PIB)) +
  geom_line()+
  geom_point()

Global_pib

Alemania

library(readxl)
Alemania_pib <- read_excel("pib_alemania.xlsx") %>% 
   ggplot( aes(x = Año , y = PIB, color = PIB)) +
  geom_line()+
  geom_point()

Alemania_pib

Hurto de ganado

library(janitor)
library(tidyverse)
library(Hmisc)
data_hurtos <- read_csv(
  file = "HURTO_A_CABEZAS_DE_GANADO_PER_ODO_DEL_01_DE_ENERO__AL_31_DE_DICIEMBRE_A_O_2019.csv"
) %>% 
  clean_names() %>% 
  filter(cantidad == 1) %>% 
  mutate_if(is.character, tolower) %>% 
  mutate_if(is.character, capitalize) %>% 
  mutate_if(is.character, as.factor) %>% 
  mutate(dia = factor(dia,
                      levels = c("Lunes", "Martes", "Miércoles", "Jueves",
                                 "Viernes", "Sábado", "Domingo"))) %>% 
  select(-codigo_dane)
head(data_hurtos)

por dia por zona

library(ggplot2)
library(dplyr)

data_hurtos %>% 
  group_by(dia,zona) %>%
  summarise(cantidad = n()) %>% 
  ggplot( aes(x = dia , y = cantidad, color = zona, group = zona)) +
  geom_point() +
  geom_line()

Hurtos por clase de empleado

data_hurtos %>% 
    group_by(clase_de_empleado, zona) %>% 
  summarise(total = sum(cantidad)) %>% 
  ggplot(mapping = aes( x = reorder(clase_de_empleado, total) , y = total)) +
  facet_wrap(facets = ~zona, scales = "free" , ncol = 2) +
  geom_point()+
  coord_flip()

2 hurtos por departamento

data_hurtos %>% 
  group_by(dia,zona, departamento) %>%
  summarise(cantidad = n()) %>% 
  ggplot(mapping = aes(x = dia, y = cantidad, color = zona, group = zona )) +
  geom_line ()+
  geom_point()+
facet_wrap(facets = ~departamento, scales = "free", ncol = 4)+
  theme(legend.position = "top", axis.text.x = element_text(angle = 45, hjust = 1))

4 comportamiento semanal

data_hurtos %>% 
  group_by( dia, departamento) %>% 
 summarise(total = sum(cantidad)) %>% 
  ggplot(mapping = aes( x = total)) +
  facet_wrap(facets = ~departamento, scales = "free" , ncol = 4) +
  geom_density()

Accidentalidad con motocicletas en Medellín 2015-2019

# Accidentalidad Motos Medellín 2015-2020
library(janitor)
library(tidyverse)
library(Hmisc)
data_motos <- read_csv("Accidentalidad_con_motos_municipio_de_Medell_n_actualizado_a_julio_2020.csv") %>% 
  clean_names() %>% 
  mutate(fecha_accidente = as.Date(fecha_accidente, format = "%m/%d/%Y")) %>% 
  mutate_if(is.character, tolower) %>% 
  mutate_if(is.character, capitalize) %>% 
  mutate_if(is.character, as.factor) 
head(data_motos)

¿En cuál de las comunas (16 en total) de Medellín se presenta mayor número de accidentes?

data_motos %>% 
   filter(zona %in% c("Comuna 1", "Comuna 2", "Comuna 3", "Comuna 4", "Comuna 5", 
                      "Comuna 6", "Comuna 7", "Comuna 8", "Comuna 9",
                      "Comuna 10", "Comuna 11", "Comuna 12", "Comuna 13", 
                      "Comuna 14", "Comuna 15", "Comuna 16")) %>% 
  group_by(zona) %>% 
  count(name = "total") %>% 
  ggplot(mapping = aes(x = reorder(zona,total), y = total)) +
  geom_col(fill = "red3") +
  coord_flip() +
  labs(x = "comuna",
       y = "total",
       title = "accidentes en moto por comuna")

¿En qué hora del día se maximizan los accidentes en Medellín?

data_motos %>% 
 group_by( hora_accidente) %>% 
  count(name = "total") %>% 
  ggplot(mapping = aes(x = hora_accidente, y = total)) +
  geom_smooth(se = FALSE) +
  labs(x = "total",
       y = "hora",
       title = "accidentes en moto hora")

-¿El patrón de comportamiento observado en el gráfico anterior es el mismo para todas las comunas?

data_motos %>%
   filter(zona %in% c("Comuna 1", "Comuna 2", "Comuna 3", "Comuna 4", 
                      "Comuna 5", "Comuna 6", "Comuna 7", "Comuna 8", 
                      "Comuna 9", "Comuna 10", "Comuna 11", "Comuna 12"
                      , "Comuna 13", "Comuna 14", "Comuna 15", "Comuna 16")) %>% 
 group_by( hora_accidente,zona) %>% 
  count(name = "total") %>% 
  ggplot(mapping = aes(x = hora_accidente, y = total)) +
  geom_smooth(se = FALSE) +
  facet_wrap(facets = ~zona, scales = "free" , ncol = 4)

  labs(x = "total",
       y = "hora",
       title = "accidentes en moto hora")

## $x
## [1] "total"
## 
## $y
## [1] "hora"
## 
## $title
## [1] "accidentes en moto hora"
## 
## attr(,"class")
## [1] "labels"

kaggle

library(tidyverse)
data_nutri <- read_csv("datos_kaggle_nutrition.csv")
data_nutri

grupos

library(readxl)
data_grupos <- read_excel("datos_kaggel_grupos_definitivo.xlsx")
data_grupos  %>% 
  clean_names()

library(tidyverse)

data_grupos1 <- data_grupos %>% 
   mutate(grupo = as.factor(grupo),
         name = as.factor(name)) %>%   
  clean_names() %>% 
  mutate(calories_kcal = as.numeric(calories_kcal),
         manganese_mg = as.numeric(manganese_mg),
         phosphorus_g = as.numeric(phosphorus_g),
         potassium_g = as.numeric(potassium_g),
         sodium_g = as.numeric(sodium_g),
         vitamin_a_iu = as.numeric(vitamin_a_iu),
         magnesium_mg = as.numeric( magnesium_mg),
         protein_g = as.numeric(protein_g),
         total_fat_g = as.numeric(total_fat_g),
         total_fiber_g = as.numeric(total_fiber_g),
         cholesterol_mg = as.numeric(cholesterol_mg),
         vitamin_c_mg = as.numeric(vitamin_c_mg),
         vitamin_d_iu = as.numeric(vitamin_d_iu),
         vitamin_k_ug = as.numeric(vitamin_k_ug),
         folate_ug = as.numeric(folate_ug),
         calcium_g= as.numeric(calcium_g),
         choline_mg = as.numeric(choline_mg),
         iron_mg = as.numeric(iron_mg),
        selenium_ug = as.numeric(selenium_ug),
        carbohydrates_g = as.numeric(carbohydrates_g))

data_grupos1

grafica

data_grupos1 %>% 
  select(grupo,calories_kcal:zinc_mg) %>% 
  pivot_longer(cols = -grupo, names_to= "variable", values_to= "valores") %>% 
  ggplot(mapping = aes(x=valores, color = grupo, fill = grupo ))+
  facet_wrap(facets = ~variable, scales = "free", ncol = 4)+
  geom_density(alpha = 0.5)+
  scale_x_log10()

Actividad4

Angélica Restrepo

03/01/2021

Grafica mal planteada

Grafica engañosa PIB

propuesta

Hurto de ganado

por dia por zona

Hurtos por clase de empleado

2 hurtos por departamento

4 comportamiento semanal

Accidentalidad con motocicletas en Medellín 2015-2019

kaggle

grupos

grafica