###Pregunta 1 Cargue las librerias data.table, readxl, ggplot2, chilemapas,sf,sp,leaflet. Cargue, además la base de datos ENE.csv con el nombre ENE y la base de comunas.xls con el nombre comunas el este debe tener la clase de data.table y realice un merge con estas dos bases, ENE la variable es r_c_p .

rm(list=ls())
library(data.table)
library(readxl)
library(ggplot2)
library(chilemapas)
library(sf)
library(sp)
library(leaflet)
library(chilemapas)


ENE <- fread("C:/Users/franc/Desktop/7° Semestre/Data science/Control 2/ENE.csv")
comunas <- fread("C:/Users/franc/Desktop/7° Semestre/Data science/Control 2/comunas.csv")

Merge <- merge(comunas,ENE,by.x="codigo_comuna",by.y="r_p_c")

###Pregunta 2 ¿Cuántas personas fueron encuestadas y a cuántas personas representa esta encuesta? Tenga en cuenta lo que hablamos del factor de expansión en clases y ayudantía, la variable de factor expansión es fact_cal

Merge[,sum(fact_cal)]
## [1] 15853046

###Pregunta 3 Grafíque el número de personas por región, utilice la función ggplot.

Personas_x_Region <- Merge[,.N, by="region1"]
ggplot(Personas_x_Region,aes(x=region1, y=N)) +
  geom_col(stat = "identity")

###Pregunta 4 Aguegue título, subtítulo y fuente al gráfico anterior, además arregle el eje x para que sea legible.

ggplot(Personas_x_Region,aes(x=reorder(region1,N),y=N)) +
  geom_bar(stat='identity') +
  labs(title = 'Personas por Región', subtitle = 'Gráfico de análisis',
       caption = 'Base de Datos Control 2',
       x = 'Región',y = "Cantidad de personas") +
  coord_flip()

###Pregunta 5 Escoja una región al azar. Cree un objeto que se llame Desempleo que contenga el número de personas por situación ocupacional y comuna de la región que eligió. Cree una nueva variable que se llame Tdesempleo utilizando la siguiente fórmula:

Tdesempleo=Cesantes/(Ocupados+Cesantes)

Hint: Después de crear el objeto, cree una columna que sea la suma de ocupados por comuna, otra que sea la suma de cesantes por comuna, para después crear la tasa de desempleo que sea la suma de cesantes por comuna dividido por la suma de ocupados por comuna más la suma de cesantes por comuna.

RegionRios <- Merge[region==14]

Desempleo1 <- RegionRios[,.(situacion_ocupacional ,codigo_comuna, nombre_comuna)]


Desempleo1[situacion_ocupacional=="OCUPADO", Ocupado := 1]
Desempleo1[situacion_ocupacional=="INACTIVO", Inactivo := 0]
Desempleo1[situacion_ocupacional=="CESANTE", Cesante := 2]

Ocupados1 <- Desempleo1[Ocupado==1, by="nombre_comuna",.N]
Inactivos1 <- Desempleo1[Inactivo==0, by="nombre_comuna",.N]
Cesantes1 <- Desempleo1[Cesante==2, by="nombre_comuna",.N]

Desempleo2 <- merge(x=Ocupados1 , y= Inactivos1, by="nombre_comuna")
Desempleo <- merge(x=Desempleo2, y=Cesantes1, by="nombre_comuna")


Desempleo[,TDesempleo:= N/(N.x + N)]
# N.x= ocupados     N= Cesantes

#    nombre_comuna     N.x   N.y    N codigo_comuna   TDesempleo
# 1:        Corral      53    75    3         14102   0.05357143
# 2:       Futrono      43    66    5         14202   0.10416667
# 3:     La Unión     126   138   18         14201   0.12500000
# 4:    Lago Ranco      45    26    3         14203   0.06250000
# 5:         Lanco      73   100    8         14103   0.09876543
# 6:     Los Lagos     106   160   17         14104   0.13821138
# 7:     Mariquina      65    70   11         14106   0.14473684
# 8:        Máfil      39    66    4         14105   0.09302326
# 9:      Paillaco      58    57    4         14107   0.06451613
#10:   Panguipulli     130   179   17         14108   0.11564626
#11:    Río Bueno      98    78   13            NA   0.11711712
#12:      Valdivia     715   684   87         14101   0.10847880

###Pregunta 7 Haga un gráfico de barras con las comunas en el eje y, y la tasa de desempleo en el eje x.Bonus: Agreguele título, subtítulo, fuente y color al gráfico.

ggplot(Desempleo,aes(x=TDesempleo, y=nombre_comuna)) +
  geom_col(stat = "identity") +
  labs(title = 'Tasa desempleo Región de los Rios', subtitle = 'Por Comuna',
       caption = 'Adolfo Ibañez inc',
       x = "Comuna",y = "Tasa desempleo") +
     geom_col(color = "blue")

###Pregunta 8 Cree un mapa con la tasa de desempleo comunal, utilizando el paquete chilemapas. Para esto, cree un objeto llamado mapa con el merge entre la geografía y la información de las comunas. (Con el paquete leaflet)

Hint: Después de realizar el merge, elimine los duplicados de las comunas del objeto mapa y seleccione solo las variables nombre_comuna, geometry, T_desempleo

mapa <- mapa_comunas %>% filter(codigo_region == “14”)

c_leaf <- Desempleo[,.(total=.N),by=.(codigo_comuna)] c_leaf[,codigo_comuna:=as.character(codigo_comuna)]

mapa <- merge(mapa,c_leaf,by.x = “codigo_comuna”,by.y=“codigo_comuna”,all.y=T) mapa <- st_as_sf(mapa) mapa <- st_transform(mapa,crs = “+proj=longlat +datum=WGS84”)

pal <- colorBin(“YlOrRd”, domain = c(mapa$total))