Análisis comparativo de datos de Salud Y COVID-19 en Durnago-Nayarit

chihuahua-coahuila-sinaloa-durango-mapa-de-nayarit-mexico-ilustracion-k0trry

setwd("~/PYE1112ITSON")

IMPORTAR

Importar paquetes

library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc", "readr", "knitr", "DT", "tidyverse", "scales","gridExtra", "modeest", "fdth"  )

Importar datos

Se importan desde un archivo local .csv los datos diarios de casos confirmados de COVID-19 para todo México desde la URL oficial: https://coronavirus.gob.mx/datos/#DownZCSV

datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200913 (1).csv")

TRANSFORMAR

Se realiza primeramente una extracción de los datos desde el data frame para sonora y sinaloa para juntarlos en un data frame junto con un vector de Fecha

#DATOS DIARIOS CONFIRMADOS PARA SONORA 
durango <- t(datos[datos$nombre == "DURANGO" ,])
durango <- as.vector(durango)
durango <- durango[4:248]
durango <- as.numeric(durango)
durango <- as.vector(durango) #datos absolutos diarios
adurango <- cumsum(durango) #datos acumulados

#DATOS DIARIOS CONFIRMADOS PARA NAYARIT
nayarit <- t(datos[datos$nombre == "NAYARIT" ,])
nayarit <- as.vector(nayarit)
nayarit<- nayarit[4:248]
nayarit <- as.numeric(nayarit)
nayarit <- as.vector(nayarit) #datos absolutos diarios
anayarit<- cumsum(nayarit) #datos acumulados


Fecha <- seq(from = as.Date("2020-01-12"), to = as.Date("2020-09-12"), by = "day" )

#Estructurar los datos en un marco de datos (data frame)

duna <- data.frame(Fecha, durango, nayarit )
aduna <- data.frame(Fecha, adurango, anayarit )

VISUALIZAR

Visualizar datos en forma de tabla interactiva

# Tabla de datos absolutos
datatable(duna)
#Tabla de datos acumulados
datatable(aduna)

Descripción

En esta clase repasamos varios temas como los de U1a3 que fue la actividad de las graficas de COVID-19 pero en vez de hcaer graficas comparamos los resultados en las tabla, en la primera tabla podemos obervar que son los daatos por dia sin acumularse y en la segunda son los datos acumulados dia tras dia de Nayarit, Sinaloa y Durango.¿Comó lo hicimos? pues primero descargamos los datos libres, despuess leimos el archivo csv y extraimos su contenido, luego hicimos un flitrado borrando los datos que no nos sirven, los convertimos a vectores y como los tomaba como letras los convertimos a un vecotr numero despues de estos los volvimos a guardar y hicimos una variable que acumulaba día con día, el siguiente paso fue crear un data frame de los estados juntos el “normal” por asi decilo y el acomulado, despues procedimos a hacer la tabla para poder comparar. y se le dio un formato al documento con prettydoc.

visualizar los datos con gráficas usando ggplot2

  • Gradica de datos absolutos (datos abiertos de casos confirmados del 12-01-2020 al 12-09-2020 )
ggplot(data=duna)+
  geom_line(aes(Fecha,durango, colour = "Durango"))+
  geom_line(aes(Fecha,nayarit, colour = "Nayarit"))+
  xlab("Fecha")+
  ylab("casos diarios absolutos")+
  labs (colour = "Estados")+
  ggtitle("Casos diarios confirmados de COVID-19 en durango-nayarit")+
  scale_y_continuous(labels = comma)

* Gradica de datos acumulados(datos abiertos de casos confirmados del 12-01-2020 al 12-09-2020 )

ggplot(data=aduna)+
  geom_line(aes(Fecha,adurango, colour = "Durango"))+
  geom_line(aes(Fecha,anayarit, colour = "Nayarit"))+
  xlab("Fecha")+
  ylab("casos diarios acumulados")+
  labs (colour = "Estados")+
  ggtitle("Casos diarios confirmados de COVID-19 en durango-nayarit")+
  scale_y_continuous(labels = comma)

  • Gráfica combinada
durango1 <- data.frame(Fecha,durango,adurango)

g2 <- ggplot(data=durango1) +
  geom_col(aes(Fecha,adurango)) +
  xlab("Fecha") +
  ylab("Casos acumulados") +
  ggtitle("A) Confirmados de COVID-19 en Durango (Acumulados)"   ) +
  scale_y_continuous(labels=comma)

g3 <- ggplot(data=durango1) +
  geom_line(aes(Fecha,durango)) +
  xlab("Fecha") +
  ylab("Casos diarios") +
  ggtitle("B) Confirmados de COVID-19 en Durango (Absolutos)"   ) +
  scale_y_continuous(labels=comma)

grid.arrange(g2,g3)

Descripción

En esta actividad fue muy facil decargar,instalar y activar las librerias gracias a una nuevo comando que utlizamos, en esta actividad comparamos los casos de COVID-19 que hay en los estasdos de la republica hicimos las tablas de dos estados vecinos ya que estos por ende se comportan casi igual, tambien aprendimos como asignarle las escalas a las graficas y hacer las tablas de comparación, todo esto fue gracias a que convertimos los datos y los filtramos, como se explico en el taller del sabado.

Medidas de posición central

*Cálculo individual de las medidas

mean(durango)##media aritmetica(promedio)
## [1] 31.52245
median(durango) #mediana
## [1] 8
mfv(durango) #moda
## [1] 0

Resumen estadístico

summary(durango)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00    8.00   31.52   66.00  144.00

Gráfico de caja y bigote

boxplot(durango)

## Medidas de dispersión

  • Varianza
var(durango) # suma de todas las distancias 
## [1] 1636.759
  • Desviacion estandar
sd(durango)
## [1] 40.45687
plot(durango)

### Tabla de distribuciones De durango

dist <- fdt(durango,breaks="Sturges")
dist
##     Class limits   f   rf rf(%)  cf  cf(%)
##        [0,16.16) 137 0.56 55.92 137  55.92
##    [16.16,32.32)  27 0.11 11.02 164  66.94
##    [32.32,48.48)   9 0.04  3.67 173  70.61
##    [48.48,64.64)  10 0.04  4.08 183  74.69
##     [64.64,80.8)  17 0.07  6.94 200  81.63
##     [80.8,96.96)  16 0.07  6.53 216  88.16
##   [96.96,113.12)  19 0.08  7.76 235  95.92
##  [113.12,129.28)   7 0.03  2.86 242  98.78
##  [129.28,145.44)   3 0.01  1.22 245 100.00
#Histogramde frecuencias absolutas
plot(dist, type = "fh")

#Poligono frecuencias absolutas
plot(dist, type = "fp")

#----------------------------------------------

#Histogramde frecuencias acumuladas 
plot(dist, type = "cfh")

#Polignono frecuencias acumuladas 
plot(dist, type = "cfp")

#---------------------------------------------

#Histogramde frecuencias relativas  
plot(dist, type = "rfh")

#poligono frecuencias relativas  
plot(dist, type = "rfp")

#__________________________________________

Descripcion

El día de hoy vimos las medidas de pocicion central, media,mediana, moda, distribuciones y varianza, vimos que los datos fueron similare ya que estos estados estan muy cerca, personalmente entendi mucho sobre la mediana,media y moda, tambien sobre la varianza y la desviacion que es la raiz cuadrada de la varianza la desviación por asi decirlo es lo separado que estan loda datos de uno al otro como lo podemos ver en la grafica de puntos del principio, tambien retomamos temas de los ejercicios del principio con la tabla de distribuciones,histogramas y poligonos de frecuencia.