Tarea_4_desarrollo

#lectura de librerias
# Cargar librerías necesarias
library(ggplot2)
library(dplyr)

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

library(readr)

## Warning: package 'readr' was built under R version 4.2.3

#john es donde esta mi data frame
df <- read_csv("master.csv")

## Rows: 27820 Columns: 12
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (5): country, sex, age, country-year, generation
## dbl (6): year, suicides_no, population, suicides/100k pop, HDI for year, gdp...
## num (1): gdp_for_year ($)
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

master <- df

#Para el uso de operadpr pipe
suppressWarnings(require(magrittr)) #Cargamos el paquete

## Loading required package: magrittr

##1.Edite y explore reglas para verificar que la base de datos no contenga posibles registros erróneos.

#Renomabramos HDI for year a IDH_ano; suicides/100k a sui_x_100; gdp_for year a PIB_x_ano; gdp_per_capita ($) a PIB_X_CAPITA
#john <- john %>%
  #rename( IDH_ano =`HDI for year`)

#john <- john %>%
  #rename( sui_x_100 =`suicides/100k pop`)

#john <- john %>%
  #rename( PIB_x_ano =`gdp_for_year ($)`)

#john <- john %>%
  #rename( PIB_x_capita =`gdp_per_capita ($)`)

master %>% names  #ver nombres de las variables

##  [1] "country"            "year"               "sex"               
##  [4] "age"                "suicides_no"        "population"        
##  [7] "suicides/100k pop"  "country-year"       "HDI for year"      
## [10] "gdp_for_year ($)"   "gdp_per_capita ($)" "generation"

head(master)

## # A tibble: 6 × 12
##   country  year sex    age         suicides_no population `suicides/100k pop`
##   <chr>   <dbl> <chr>  <chr>             <dbl>      <dbl>               <dbl>
## 1 Albania  1987 male   15-24 years          21     312900                6.71
## 2 Albania  1987 male   35-54 years          16     308000                5.19
## 3 Albania  1987 female 15-24 years          14     289700                4.83
## 4 Albania  1987 male   75+ years             1      21800                4.59
## 5 Albania  1987 male   25-34 years           9     274300                3.28
## 6 Albania  1987 female 75+ years             1      35600                2.81
## # ℹ 5 more variables: `country-year` <chr>, `HDI for year` <dbl>,
## #   `gdp_for_year ($)` <dbl>, `gdp_per_capita ($)` <dbl>, generation <chr>

#identificacion de los NaN 
# Contar valores faltantes por columna
colSums(is.na(master))

##            country               year                sex                age 
##                  0                  0                  0                  0 
##        suicides_no         population  suicides/100k pop       country-year 
##                  0                  0                  0                  0 
##       HDI for year   gdp_for_year ($) gdp_per_capita ($)         generation 
##              19456                  0                  0                  0

# Mostrar filas que contienen NAs
master[!complete.cases(master), ]

## # A tibble: 19,456 × 12
##    country  year sex    age         suicides_no population `suicides/100k pop`
##    <chr>   <dbl> <chr>  <chr>             <dbl>      <dbl>               <dbl>
##  1 Albania  1987 male   15-24 years          21     312900                6.71
##  2 Albania  1987 male   35-54 years          16     308000                5.19
##  3 Albania  1987 female 15-24 years          14     289700                4.83
##  4 Albania  1987 male   75+ years             1      21800                4.59
##  5 Albania  1987 male   25-34 years           9     274300                3.28
##  6 Albania  1987 female 75+ years             1      35600                2.81
##  7 Albania  1987 female 35-54 years           6     278800                2.15
##  8 Albania  1987 female 25-34 years           4     257200                1.56
##  9 Albania  1987 male   55-74 years           1     137500                0.73
## 10 Albania  1987 female 5-14 years            0     311000                0   
## # ℹ 19,446 more rows
## # ℹ 5 more variables: `country-year` <chr>, `HDI for year` <dbl>,
## #   `gdp_for_year ($)` <dbl>, `gdp_per_capita ($)` <dbl>, generation <chr>

renom <- master %>% names
 master %<>% rename(pais=renom[1], ano=renom[2],
 sexo=renom[3], edad=renom[4],
 num_suic=renom[5], poblacion=renom[6],
 suic_x_100k=renom[7], pais_anio=renom[8],
 IDH_anio=renom[9], PIB_anio=renom[10],
 PIB_xcap=renom[11], generacion=renom[12]
 )
 
#Este código obtiene los nombres actuales de las columnas del data frame `master` y luego renombra cada columna usando estos nombres en un orden específico. Primero, guarda los nombres de las columnas en la variable `renom`, y luego usa estos nombres para asignar nuevos nombres más descriptivos a las columnas del data frame `master`, facilitando así la comprensión y el manejo de los datos.

master %<>% mutate(pib_anio_mill=PIB_anio/1000000)
master %<>% mutate_if(is.character, as.factor)
master %>% glimpse

## Rows: 27,820
## Columns: 13
## $ pais          <fct> Albania, Albania, Albania, Albania, Albania, Albania, Al…
## $ ano           <dbl> 1987, 1987, 1987, 1987, 1987, 1987, 1987, 1987, 1987, 19…
## $ sexo          <fct> male, male, female, male, male, female, female, female, …
## $ edad          <fct> 15-24 years, 35-54 years, 15-24 years, 75+ years, 25-34 …
## $ num_suic      <dbl> 21, 16, 14, 1, 9, 1, 6, 4, 1, 0, 0, 0, 2, 17, 1, 14, 4, …
## $ poblacion     <dbl> 312900, 308000, 289700, 21800, 274300, 35600, 278800, 25…
## $ suic_x_100k   <dbl> 6.71, 5.19, 4.83, 4.59, 3.28, 2.81, 2.15, 1.56, 0.73, 0.…
## $ pais_anio     <fct> Albania1987, Albania1987, Albania1987, Albania1987, Alba…
## $ IDH_anio      <dbl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, …
## $ PIB_anio      <dbl> 2156624900, 2156624900, 2156624900, 2156624900, 21566249…
## $ PIB_xcap      <dbl> 796, 796, 796, 796, 796, 796, 796, 796, 796, 796, 796, 7…
## $ generacion    <fct> Generation X, Silent, Generation X, G.I. Generation, Boo…
## $ pib_anio_mill <dbl> 2156.625, 2156.625, 2156.625, 2156.625, 2156.625, 2156.6…

#Este código agrega una nueva columna `pib_anio_mill` al data frame `master`, que representa el PIB en millones en lugar de unidades. Además, convierte todas las columnas de texto en factores para una mejor preparación de los datos para el análisis. Finalmente, utiliza `glimpse()` para mostrar una vista rápida de la estructura del data frame y verificar los cambios realizados.

master$edad %>%levels

## [1] "15-24 years" "25-34 years" "35-54 years" "5-14 years"  "55-74 years"
## [6] "75+ years"

# El código muestra los niveles únicos de la columna `edad` si es un factor.

master$generacion %>%levels

## [1] "Boomers"         "G.I. Generation" "Generation X"    "Generation Z"   
## [5] "Millenials"      "Silent"

# El código  muestra los niveles únicos de la columna `generacion` si esta columna es un factor.

master$edad %<>%factor(levels=c("5-14years","15-24years",
 "25-34years","35-54years","55-74years","75+years"))
#Este código convierte la columna `edad` en un factor con niveles específicos: `"5-14years"`, `"15-24years"`, `"25-34years"`, `"35-54years"`, `"55-74years"`, y `"75+years"`. Esto asegura que la columna `edad` tenga una representación categórica con estos niveles definidos.

master$generacion %<>%factor(levels=c('G.I.Generation','Silent',
 'Boomers','GenerationX',
 'Millenials','GenerationZ'))
#Este código convierte la columna `generacion` en un factor con los niveles especificados: `'G.I.Generation'`, `'Silent'`, `'Boomers'`, `'GenerationX'`, `'Millenials'`, y `'GenerationZ'`. Esto organiza la columna `generacion` en categorías definidas para un análisis más estructurado.

###2 Filtre los datos de Colombia y los de EEUU, generando dos bases de datos, llamadas master_col y master_eu.

#Filtramos para Colombia
master_col <- subset(master,subset=(pais=="Colombia"))
 master_col %<>% droplevels
 master_col %>% glimpse

## Rows: 372
## Columns: 13
## $ pais          <fct> Colombia, Colombia, Colombia, Colombia, Colombia, Colomb…
## $ ano           <dbl> 1985, 1985, 1985, 1985, 1985, 1985, 1985, 1985, 1985, 19…
## $ sexo          <fct> male, male, male, male, male, female, female, female, fe…
## $ edad          <fct> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, …
## $ num_suic      <dbl> 21, 113, 193, 256, 188, 117, 45, 3, 31, 12, 12, 10, 13, …
## $ poblacion     <dbl> 123400, 1015200, 2323700, 3190200, 2451100, 3140700, 227…
## $ suic_x_100k   <dbl> 17.02, 11.13, 8.31, 8.02, 7.67, 3.73, 1.98, 1.72, 1.29, …
## $ pais_anio     <fct> Colombia1985, Colombia1985, Colombia1985, Colombia1985, …
## $ IDH_anio      <dbl> 0.573, 0.573, 0.573, 0.573, 0.573, 0.573, 0.573, 0.573, …
## $ PIB_anio      <dbl> 34894411352, 34894411352, 34894411352, 34894411352, 3489…
## $ PIB_xcap      <dbl> 1393, 1393, 1393, 1393, 1393, 1393, 1393, 1393, 1393, 13…
## $ generacion    <fct> NA, NA, Boomers, NA, Silent, NA, Boomers, NA, Silent, NA…
## $ pib_anio_mill <dbl> 34894.41, 34894.41, 34894.41, 34894.41, 34894.41, 34894.…

 #Este código filtra el data frame master para conservar solo las filas donde la columna pais es igual a "Colombia", y guarda el resultado en master_col. Luego, droplevels elimina niveles de factores que ya no están presentes en el data frame después del filtrado. Finalmente, glimpse() muestra una vista rápida de la estructura de master_col.

#Filtramos para Estados Unidos
master_eu <- subset(master,subset=(pais=="United States"))
 master_eu %<>% droplevels
 master_eu %>% glimpse

## Rows: 372
## Columns: 13
## $ pais          <fct> United States, United States, United States, United Stat…
## $ ano           <dbl> 1985, 1985, 1985, 1985, 1985, 1985, 1985, 1985, 1985, 19…
## $ sexo          <fct> male, male, male, male, male, female, female, female, fe…
## $ edad          <fct> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, …
## $ num_suic      <dbl> 2177, 5302, 5134, 6053, 4267, 2105, 1568, 466, 1242, 854…
## $ poblacion     <dbl> 4064000, 17971000, 20986000, 26589000, 19962000, 2776300…
## $ suic_x_100k   <dbl> 53.57, 29.50, 24.46, 22.77, 21.38, 7.58, 7.34, 6.24, 5.9…
## $ pais_anio     <fct> United States1985, United States1985, United States1985,…
## $ IDH_anio      <dbl> 0.841, 0.841, 0.841, 0.841, 0.841, 0.841, 0.841, 0.841, …
## $ PIB_anio      <dbl> 4.346734e+12, 4.346734e+12, 4.346734e+12, 4.346734e+12, …
## $ PIB_xcap      <dbl> 19693, 19693, 19693, 19693, 19693, 19693, 19693, 19693, …
## $ generacion    <fct> NA, NA, Boomers, Silent, NA, Silent, NA, NA, Boomers, NA…
## $ pib_anio_mill <dbl> 4346734, 4346734, 4346734, 4346734, 4346734, 4346734, 43…

#resumen colombia
resum_col<-master_col %>%group_by(ano) %>%
 summarise(pib_anio_mill=mean(pib_anio_mill),
 suic_x_100k  =mean(suic_x_100k  ),
 IDH_anio = mean(IDH_anio))
 resum_col %<>%select(ano,pib_anio_mill,suic_x_100k,IDH_anio)
 resum_col

## # A tibble: 31 × 4
##      ano pib_anio_mill suic_x_100k IDH_anio
##    <dbl>         <dbl>       <dbl>    <dbl>
##  1  1985        34894.        5.21    0.573
##  2  1986        34942.        4.18   NA    
##  3  1987        36373.        3.76   NA    
##  4  1988        39213.        4.22   NA    
##  5  1989        39540.        3.47   NA    
##  6  1990        40274.        3.62    0.596
##  7  1991        41240.        3.63   NA    
##  8  1992        49280.        4.12   NA    
##  9  1993        55803.        4.10   NA    
## 10  1994        81704.        4.66   NA    
## # ℹ 21 more rows

#Este código agrupa el data frame `master_col` por `anio` y calcula el promedio de `pib_anio_mill` y `suic_x100k` para cada año. Luego, selecciona y muestra solo las columnas `anio`, `pib_anio_mill` y `suic_x100k` en el data frame `resum_col_1`.

#Resumen Estados Unidos
resum_eu<-master_eu %>%group_by(ano) %>%
 summarise(pib_anio_mill=mean(pib_anio_mill),
 suic_x_100k  =mean(suic_x_100k  ),
 IDH_anio = mean(IDH_anio))
 resum_eu %<>%select(ano,pib_anio_mill,suic_x_100k, IDH_anio  )
 resum_eu

## # A tibble: 31 × 4
##      ano pib_anio_mill suic_x_100k IDH_anio
##    <dbl>         <dbl>       <dbl>    <dbl>
##  1  1985       4346734        15.4    0.841
##  2  1986       4590155        16.0   NA    
##  3  1987       4870217        16.0   NA    
##  4  1988       5252629        15.6   NA    
##  5  1989       5657693        15.2   NA    
##  6  1990       5979589        15.6    0.859
##  7  1991       6174043        15.3   NA    
##  8  1992       6539299        14.8   NA    
##  9  1993       6878718        14.9   NA    
## 10  1994       7308755        14.7   NA    
## # ℹ 21 more rows

###3 Realice un análisis de la evolución de los suicidios por cada 100.000 habitantes, del PIB per cápita y del IDH, a lo largo de los años en ambos países.

#suicidios por cada 100.000 habitantes

#intalamos libreria y la llamamos, creamos 
library(ggplot2)
fig_1 <- ggplot(resum_col,aes(ano,suic_x_100k))+
 geom_line(col="red")+
  labs(title = "Evolución de la Tasa de Suicidios por 100.000 Habitantes en Colombia")

library(ggplot2)
fig_2 <- ggplot(resum_eu,aes(ano,suic_x_100k))+
 geom_line(col="blue")+
  labs(title = "Evolución de la Tasa de Suicidios por 100.000 Habitantes en EE.UU")

require(ggpubr)

## Loading required package: ggpubr

## Warning: package 'ggpubr' was built under R version 4.2.3

ggarrange(fig_1,fig_2, labels= c("A","B"),
 ncol=2,nrow=2)

####Podemos observar para ambos graficos que en los ultimos años han aumentado los casos de suicidio. tambien se puede observar que en el año los suicidios en colombia aumentaron significativamente mientras que en ese mismo año par EE UU disminuyeron.

#PIB

#Colombia
fig_3 <- ggplot(resum_col,aes(ano,pib_anio_mill))+
 geom_line(col="red") +
  labs(title = "Evolución de la Tasa de Suicidios por 100.000 Habitantes en Colombia")

#Estados Unidos
fig_4 <- ggplot(resum_eu,aes(ano,pib_anio_mill))+
 geom_line(col="blue") +
  labs(title = "Evolución de la Tasa de Suicidios por 100.000 Habitantes en EE UU")

require(ggpubr)
ggarrange(fig_3,fig_4,labels= c("A","B"),
 ncol=2,nrow=2)

####Vemos que ambas grafican muestran una tendencia creciente, pero para colombia en los ultimos años comienza a disminuir el valor de PIB.

#IDH

#Colombia
fig_5 <- ggplot(resum_col,aes(ano,IDH_anio))+
 geom_line(col="red") +
  labs(title = "Evolución de la Tasa de Suicidios por 100.000 Habitantes en Colombia")

#Estados Unidos
fig_6 <- ggplot(resum_eu,aes(ano,IDH_anio))+
 geom_line(col="blue") +
  labs(title = "Evolución de la Tasa de Suicidios por 100.000 Habitantes en EE UU")

require(ggpubr)
ggarrange(fig_5,fig_6,labels= c("A","B"),
 ncol=2,nrow=2)

## Warning: Removed 1 row containing missing values (`geom_line()`).
## Removed 1 row containing missing values (`geom_line()`).

####Vemos en los graficos q probablemente por el metodo de imputacion implementado no podemos observar una tendencia clara.

###Realice un análisis de la evolución de los suicidios por cada 100.000 habitantes, del PIB per cápita y del IDH, a lo largo de los años en ambos países por género.

#Colombia
resum_col_1<-master_col %>%group_by(ano,sexo) %>%
 summarise(pib_anio_mill=mean(pib_anio_mill),
 suic_x_100k=mean(suic_x_100k),
 IDH_anio=mean(IDH_anio))

## `summarise()` has grouped output by 'ano'. You can override using the `.groups`
## argument.

#Este código agrupa el data frame `master_col` por `anio` y `sexo`, y calcula el promedio de `pib_anio_mill` y `suic_x100k` para cada combinación de año y sexo. El resultado se guarda en el data frame `resum_col_2`.


#Estados Unidos
resum_eu_1<-master_eu %>%group_by(ano,sexo) %>%
 summarise(pib_anio_mill=mean(pib_anio_mill),
 suic_x_100k=mean(suic_x_100k),
 IDH_anio=mean(IDH_anio))

## `summarise()` has grouped output by 'ano'. You can override using the `.groups`
## argument.

#Colombia
resum_col_1 %<>%select(sexo,ano,pib_anio_mill,
 suic_x_100k, IDH_anio)
 resum_col_1

## # A tibble: 62 × 5
## # Groups:   ano [31]
##    sexo     ano pib_anio_mill suic_x_100k IDH_anio
##    <fct>  <dbl>         <dbl>       <dbl>    <dbl>
##  1 female  1985        34894.        1.68    0.573
##  2 male    1985        34894.        8.75    0.573
##  3 female  1986        34942.        1.38   NA    
##  4 male    1986        34942.        6.97   NA    
##  5 female  1987        36373.        1.22   NA    
##  6 male    1987        36373.        6.31   NA    
##  7 female  1988        39213.        1.27   NA    
##  8 male    1988        39213.        7.17   NA    
##  9 female  1989        39540.        1.18   NA    
## 10 male    1989        39540.        5.77   NA    
## # ℹ 52 more rows

 #EEUU
 resum_eu_1 %<>%select(sexo,ano,pib_anio_mill,
 suic_x_100k, IDH_anio)
 resum_eu_1

## # A tibble: 62 × 5
## # Groups:   ano [31]
##    sexo     ano pib_anio_mill suic_x_100k IDH_anio
##    <fct>  <dbl>         <dbl>       <dbl>    <dbl>
##  1 female  1985       4346734        5.31    0.841
##  2 male    1985       4346734       25.5     0.841
##  3 female  1986       4590155        5.56   NA    
##  4 male    1986       4590155       26.4    NA    
##  5 female  1987       4870217        5.35   NA    
##  6 male    1987       4870217       26.6    NA    
##  7 female  1988       5252629        5.18   NA    
##  8 male    1988       5252629       26.1    NA    
##  9 female  1989       5657693        4.95   NA    
## 10 male    1989       5657693       25.5    NA    
## # ℹ 52 more rows

#Graficamos suicidios
ggplot(resum_col_1, aes(x = ano, y = suic_x_100k, color = sexo)) +
  geom_line(cex = 1) +
  labs(
    title = "Evolución de la Tasa de Suicidios por 100.000 Habitantes en Colombia según Género",
    x = "Año",
    y = "Tasa de Suicidios por 100.000 Habitantes",
    color = "Género"
  )

## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.

#Suicidios
ggplot(resum_eu_1, aes(x = ano, y = suic_x_100k, color = sexo)) +
  geom_line(cex = 1) +
  labs(
    title = "Evolución de la Tasa de Suicidios por 100.000 Habitantes en EE UU según Género",
    x = "Año",
    y = "Tasa de Suicidios por 100.000 Habitantes",
    color = "Género"
  )

#PIB Colombia
ggplot(resum_col_1, aes(x = ano, y = pib_anio_mill, color = sexo)) +
  geom_line(cex = 1) +
  labs(
    title = "Evolución de la Tasa de Suicidios por 100.000 Habitantes en Colombia según Género",
    x = "Año",
    y = "Tasa de Suicidios por 100.000 Habitantes",
    color = "Género"
  )

#PIB EEUU
#PIB Colombia
ggplot(resum_eu_1, aes(x = ano, y = pib_anio_mill, color = sexo)) +
  geom_line(cex = 1) +
  labs(
    title = "Evolución de la Tasa de Suicidios por 100.000 Habitantes en EE UU según Género",
    x = "Año",
    y = "Tasa de Suicidios por 100.000 Habitantes",
    color = "Género"
  )

#IDH Colombia
ggplot(resum_col_1, aes(x = ano, y = IDH_anio, color = sexo)) +
  geom_line(cex = 1) +
  labs(
    title = "Evolución de la Tasa de Suicidios por 100.000 Habitantes en Colombia según Género",
    x = "Año",
    y = "Tasa de Suicidios por 100.000 Habitantes",
    color = "Género"
  )

## Warning: Removed 2 rows containing missing values (`geom_line()`).

#IDH EE UU
ggplot(resum_eu_1, aes(x = ano, y = IDH_anio, color = sexo)) +
  geom_line(cex = 1) +
  labs(
    title = "Evolución de la Tasa de Suicidios por 100.000 Habitantes en EE UU según Género",
    x = "Año",
    y = "Tasa de Suicidios por 100.000 Habitantes",
    color = "Género"
  )

## Warning: Removed 2 rows containing missing values (`geom_line()`).

###5. Realice un análisis de la evolución de los suicidios por cada 100.000 habitantes, del PIB per cápita y del IDH, a lo largo de los años en ambos países por grupo de edad.

#Colombia
resum_col_2<-master_col %>%group_by(generacion,sexo) %>%
 summarise(pib_anio_mill=sum(pib_anio_mill),
 suic_x_100k=sum(suic_x_100k),
 IDH_anio=sum(IDH_anio))

## `summarise()` has grouped output by 'generacion'. You can override using the
## `.groups` argument.

#EE UU
resum_eu_2<-master_eu %>%group_by(generacion,sexo) %>%
 summarise(pib_anio_mill=sum(pib_anio_mill),
 suic_x_100k=sum(suic_x_100k),
 IDH_anio=sum(IDH_anio))

## `summarise()` has grouped output by 'generacion'. You can override using the
## `.groups` argument.

#Colombia
resum_col_2 %<>%select(generacion,sexo,pib_anio_mill,
 suic_x_100k, IDH_anio)
 resum_col_2

## # A tibble: 8 × 5
## # Groups:   generacion [4]
##   generacion sexo   pib_anio_mill suic_x_100k IDH_anio
##   <fct>      <fct>          <dbl>       <dbl>    <dbl>
## 1 Silent     female      6167671.        44.3       NA
## 2 Silent     male        6167671.       517.        NA
## 3 Boomers    female      4419386.        52.2       NA
## 4 Boomers    male        4419386.       284.        NA
## 5 Millenials female      6725177.        99.2       NA
## 6 Millenials male        6725177.       241.        NA
## 7 <NA>       female      9558041.       137         NA
## 8 <NA>       male        9558041.       635.        NA

#Este código selecciona las columnas `generacion`, `sexo` y `num_suic` del data frame `resum_col_3`, asegurando que solo estas columnas estén presentes en el resultado final.
 
 #EE UU
 resum_eu_2 %<>%select(generacion,sexo,pib_anio_mill,
 suic_x_100k, IDH_anio)
 resum_eu_2

## # A tibble: 8 × 5
## # Groups:   generacion [4]
##   generacion sexo   pib_anio_mill suic_x_100k IDH_anio
##   <fct>      <fct>          <dbl>       <dbl>    <dbl>
## 1 Silent     female     456745956       213.        NA
## 2 Silent     male       456745956      1185.        NA
## 3 Boomers    female     337768521       229.        NA
## 4 Boomers    male       337768521       842.        NA
## 5 Millenials female     451382632        93.2       NA
## 6 Millenials male       451382632       389.        NA
## 7 <NA>       female     709095359       334.        NA
## 8 <NA>       male       709095359      1855.        NA

#Suicidios
#Colombia
ggplot(resum_col_2, aes(x = generacion, y = suic_x_100k, fill = sexo)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = suic_x_100k), 
            position = position_stack(vjust = 0.5), 
            color = "white") +
  labs(
    title = "Número de Suicidios por Generación y Género en Colombia",
    x = "Generación",
    y = "suic_x_100k",
    fill = "Género"
  )

#EE UU
ggplot(resum_eu_2, aes(x = generacion, y = suic_x_100k, fill = sexo)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = suic_x_100k), 
            position = position_stack(vjust = 0.5), 
            color = "white") +
  labs(
    title = "Número de Suicidios por Generación y Género en EE UU",
    x = "Generación",
    y = "suic_x_100k",
    fill = "Género"
  )

#Pib
#Colombia
ggplot(resum_col_2, aes(x = generacion, y = pib_anio_mill, fill = sexo)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = pib_anio_mill), 
            position = position_stack(vjust = 0.5), 
            color = "white") +
  labs(
    title = "Número de Suicidios por Generación y Género en Colombia",
    x = "Generación",
    y = "pib_anio_mill",
    fill = "Género"
  )

#EE UU
ggplot(resum_eu_2, aes(x = generacion, y = pib_anio_mill, fill = sexo)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = pib_anio_mill), 
            position = position_stack(vjust = 0.5), 
            color = "white") +
  labs(
    title = "Número de Suicidios por Generación y Género en EE UU",
    x = "Generación",
    y = "pib_anio_mill",
    fill = "Género"
  )

#IDH
#Colombia
ggplot(resum_col_2, aes(x = generacion, y = IDH_anio, fill = sexo)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = IDH_anio), 
            position = position_stack(vjust = 0.5), 
            color = "white") +
  labs(
    title = "Número de Suicidios por Generación y Género en Colombia",
    x = "Generación",
    y = "IDH_anio",
    fill = "Género"
  )

## Warning: Removed 8 rows containing missing values (`position_stack()`).
## Removed 8 rows containing missing values (`position_stack()`).

#EE UU
ggplot(resum_eu_2, aes(x = generacion, y = IDH_anio, fill = sexo)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = IDH_anio), 
            position = position_stack(vjust = 0.5), 
            color = "white") +
  labs(
    title = "Número de Suicidios por Generación y Género en EE UU",
    x = "Generación",
    y = "IDH_anio",
    fill = "Género"
  )

## Warning: Removed 8 rows containing missing values (`position_stack()`).
## Removed 8 rows containing missing values (`position_stack()`).

Tarea_4_desarrollo

John Gutiérrez ;

2024-09-09