#Importar datos y generar estadisticas diarias #Es siempre para titulo ## es siempre para subtitulo ### en siempre para sub sub titulo # Pagina Web para ver codigos y su estructurs https://www.rstudio.com/resources/cheatsheets/
Datos son tomados de Organización Mundial de la salud
#dentro del codigo el numeral es solo un comentario, mientras que afuera de los corchetes de R si respeta la sintaxis mencionada
#Importar el dataset
CovidData <- read.csv("~/R/COVID/COVID/WHO-COVID-19-global-data.csv", stringsAsFactors=TRUE)# una vez corro este codigo el me genera mi dataframe. antes de correr este codigo se llamada dataset
str(CovidData) #las 4 primeras columnas son factores o categorias y las ultimas son numericas.
## 'data.frame': 210930 obs. of 8 variables:
## $ Date_reported : Factor w/ 890 levels "2020-01-03","2020-01-04",..: 1 2 3 4 5 6 7 8 9 10 ...
## $ Country_code : Factor w/ 236 levels " ","AD","AE",..: 4 4 4 4 4 4 4 4 4 4 ...
## $ Country : Factor w/ 237 levels "Afghanistan",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ WHO_region : Factor w/ 7 levels "AFRO","AMRO",..: 3 3 3 3 3 3 3 3 3 3 ...
## $ New_cases : int 0 0 0 0 0 0 0 0 0 0 ...
## $ Cumulative_cases : int 0 0 0 0 0 0 0 0 0 0 ...
## $ New_deaths : int 0 0 0 0 0 0 0 0 0 0 ...
## $ Cumulative_deaths: int 0 0 0 0 0 0 0 0 0 0 ...
CovidData$Date_reported<-as.Date(CovidData$Date_reported)#permite convertir los datos a tipo fecha
str(CovidData) #permite ver la estructura de los datos
## 'data.frame': 210930 obs. of 8 variables:
## $ Date_reported : Date, format: "2020-01-03" "2020-01-04" ...
## $ Country_code : Factor w/ 236 levels " ","AD","AE",..: 4 4 4 4 4 4 4 4 4 4 ...
## $ Country : Factor w/ 237 levels "Afghanistan",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ WHO_region : Factor w/ 7 levels "AFRO","AMRO",..: 3 3 3 3 3 3 3 3 3 3 ...
## $ New_cases : int 0 0 0 0 0 0 0 0 0 0 ...
## $ Cumulative_cases : int 0 0 0 0 0 0 0 0 0 0 ...
## $ New_deaths : int 0 0 0 0 0 0 0 0 0 0 ...
## $ Cumulative_deaths: int 0 0 0 0 0 0 0 0 0 0 ...
library(ggplot2) #permite cargar la liberia
library(ggThemeAssist) #permite darle formato a las graficas, poniendole titulos, subtitulos y etiquetas
#Casos diarios
grafica<-ggplot(CovidData)#permite crear el lienzo para iniciar a graficar
grafica
grafica<-grafica + aes(x=Date_reported,y=New_cases)#permite construir las coordenadas X,Y donde en x iran los dias y en Y los casos
grafica
grafica<-grafica + geom_col() #permite generar el grafico de barras en columnas
grafica
grafica<-grafica+ geom_line()
#grafica<-grafica+geom_path()
grafica
#para poder correr correr la siguiente linea debo seleccionar todo el codigo desde que empiezo a crear el lienzo, luego clic en addins y luego en ggplot theme assistant y sale el codigo de abajo que comienza por labs
grafica <- grafica+labs(title = "Covid 10 Reporte Global Junio 2022",
x = "Fecha", y = "Nuevos Casos", caption = "Datos tomados de la Organizacion Mundial de la Salud", subtitle = "Nuevos de contagio ")
grafica <- grafica + scale_x_date(date_breaks = "16 weeks") # esto me permite mostrar los datos cada 16 semanas, mostrandome las fechas.
grafica
#Muertes diarias
grafica<-ggplot(CovidData) #permite crear el lienzo para iniciar a graficar
grafica<-grafica + aes(x=Date_reported,y=New_deaths) #permite construir las coordenadas X,Y donde en x iran los dias y en Y los casos
grafica<-grafica + geom_col() #permite generar el grafico de barras en columnas
grafica<-grafica+ geom_line()
#grafica<-grafica+geom_path()
grafica+labs(title = "Covid 10 Reporte Global Junio 2022",
x = "Fecha", y = "Nuevas Muertes", caption = "Datos tomados de la Organizacion Mundial de la Salud", subtitle= "Nuevos muertes diarias")
grafica <- grafica + scale_x_date(date_breaks = "16 weeks")
grafica
##Por zonas del mundo
#despues de la r puedo poner ecko igual falso
#Casos diarios por zonas
grafica<-ggplot(CovidData) #permite crear el lienzo para iniciar a graficar
grafica<-grafica + aes(x=Date_reported,y=New_cases, fill=WHO_region) #permite construir las coordenadas X,Y donde en x iran los dias y en Y los casos, adicionalmente fill me permite ponerle color al relleno a cada una de las regiones. si uso la palabra color me le pone a la silueta
grafica<-grafica + geom_col() #permite generar el grafico de barras en columnas
grafica<-grafica+ geom_line()
#grafica<-grafica+geom_path()
grafica <- grafica+labs(title= "Covid 10 Reporte Global Junio 2022",
x = "Fecha", y = "Nuevos Casos", caption = "Datos tomados de la Organizacion Mundial de la Salud")
grafica <- grafica + scale_x_date(date_breaks = "16 weeks")
grafica
#Casos diarios por zonas discriminadas
grafica<-ggplot(CovidData) #permite crear el lienzo para iniciar a graficar
grafica<-grafica + aes(x=Date_reported,y=New_cases, fill=WHO_region) #permite construir las coordenadas X,Y donde en x iran los dias y en Y los casos, adicionalmente fill me permite ponerle color al relleno a cada una de las regiones. si uso la palabra color me le pone a la silueta
grafica<-grafica + geom_col() #permite generar el grafico de barras en columnas
grafica<-grafica+ geom_line()
#grafica<-grafica+geom_path()
grafica+labs(title = "Covid 10 Reporte Global Junio 2022",
x = "Fecha", y = "Nuevos Casos", caption = "Datos tomados de la Organizacion Mundial de la Salud")
grafica <- grafica + scale_x_date(date_breaks = "16 weeks")
grafica<-grafica + facet_wrap(CovidData$WHO_region) # facet me permite mostrar la grafica seccionada, por tanto a la funcion facetas me toca decirle que lo organice por region.
grafica
grafica<-grafica + theme(axis.text.x = element_text(angle = 90, size=7))#en el estilo de la grafica le digo que el texto del eje x me lo ponga a 90 grados y eso me da la orientacion
#Grafica de barras
CovidTable<-read.csv("~/R/COVID/COVID/WHO-COVID-19-global-table-data.csv", stringsAsFactors=TRUE)
#str(CovidTable)
library(dplyr) # no tengo que guardar resultados en variable para despues volverlos a procesar. libreria para preparar datos, limpieza.
regiones <- CovidTable %>% group_by(Name) %>% summarize(Total=sum(WHO.Region))#me permite realizar sumatoria por cada grupo, el simbolo %>% es un paip y permite empezar aplicar funciones. todo lo de africa lo pone en un grupo, todo lo de america en un grupo y despues de agrupar se le debe hacer una sumatoria. %>% es un paip y me dice que la varible regiones las agrupe por nombre (este es una columa del dataset) despues de agrupar, en una variable llamada total, hagamae una suma de la columna WHO.Region
regiones<- regiones [-1,] #me elimina la primera fila para que no salga ese total
grafica<- ggplot(regiones) + aes(y=reorder(Name,Total), x=Total, fill=Name) + geom_col()+ labs(title="Regiones Covid") #reorder me me permite organizar las barras por total de mayor a menor. primero pongo la funcion reoder, el primer argumento es el nombre y el segundo la categorica.
grafica
#Bulgaria
bulgaria <- filter(CovidData, Country=="Bulgaria") #esta variable me guarda un subset, es decir, busca en country todos los datos que sean iguales a bulgaria y los one en mi dataset
grafica<-ggplot(bulgaria) #permite crear el lienzo para iniciar a graficar
grafica<-grafica + aes(x=Date_reported,y=New_cases) #permite construir las coordenadas X,Y donde en x iran los dias y en Y los casos, adicionalmente fill me permite ponerle color al relleno a cada una de las regiones. si uso la palabra color me le pone a la silueta
grafica<-grafica + geom_col(aes(alpha=0.3)) #permite generar el grafico de barras en columnas. alpha es el valor de transparencia
grafica<-grafica + geom_smooth(span=0.02)#span permite que la curva sea mas cenida. la gemotria smooth lo que hace es tomar todos los puntos y tratar de crear una curva que conecte todos los puntos.
grafica<-grafica+ geom_line()
#grafica<-grafica+geom_path()
grafica <- grafica+labs(title = "Covid 10 Reporte Bulgaria Junio 2022",
x = "Fecha", y = "Nuevos Casos", caption = "Datos tomados de la Organizacion Mundial de la Salud")
grafica <- grafica + scale_x_date(date_breaks = "16 weeks")
grafica