Análisis comparativo de datos de Salud Y COVID-19 en Durnago-Nayarit
chihuahua-coahuila-sinaloa-durango-mapa-de-nayarit-mexico-ilustracion-k0trry
- Folder de trabajo
IMPORTAR
Importar paquetes
Importar datos
Se importan desde un archivo local .csv los datos diarios de casos confirmados de COVID-19 para todo México desde la URL oficial: https://coronavirus.gob.mx/datos/#DownZCSV
TRANSFORMAR
Se realiza primeramente una extracción de los datos desde el data frame para sonora y sinaloa para juntarlos en un data frame junto con un vector de Fecha
#DATOS DIARIOS CONFIRMADOS PARA SONORA
durango <- t(datos[datos$nombre == "DURANGO" ,])
durango <- as.vector(durango)
durango <- durango[4:248]
durango <- as.numeric(durango)
durango <- as.vector(durango) #datos absolutos diarios
adurango <- cumsum(durango) #datos acumulados
#DATOS DIARIOS CONFIRMADOS PARA NAYARIT
nayarit <- t(datos[datos$nombre == "NAYARIT" ,])
nayarit <- as.vector(nayarit)
nayarit<- nayarit[4:248]
nayarit <- as.numeric(nayarit)
nayarit <- as.vector(nayarit) #datos absolutos diarios
anayarit<- cumsum(nayarit) #datos acumulados
Fecha <- seq(from = as.Date("2020-01-12"), to = as.Date("2020-09-12"), by = "day" )
#Estructurar los datos en un marco de datos (data frame)
duna <- data.frame(Fecha, durango, nayarit )
aduna <- data.frame(Fecha, adurango, anayarit )VISUALIZAR
Descripción
En esta clase repasamos varios temas como los de U1a3 que fue la actividad de las graficas de COVID-19 pero en vez de hcaer graficas comparamos los resultados en las tabla, en la primera tabla podemos obervar que son los daatos por dia sin acumularse y en la segunda son los datos acumulados dia tras dia de Nayarit, Sinaloa y Durango.¿Comó lo hicimos? pues primero descargamos los datos libres, despuess leimos el archivo csv y extraimos su contenido, luego hicimos un flitrado borrando los datos que no nos sirven, los convertimos a vectores y como los tomaba como letras los convertimos a un vecotr numero despues de estos los volvimos a guardar y hicimos una variable que acumulaba día con día, el siguiente paso fue crear un data frame de los estados juntos el “normal” por asi decilo y el acomulado, despues procedimos a hacer la tabla para poder comparar. y se le dio un formato al documento con prettydoc.
visualizar los datos con gráficas usando ggplot2
- Gradica de datos absolutos (datos abiertos de casos confirmados del 12-01-2020 al 12-09-2020 )
ggplot(data=duna)+
geom_line(aes(Fecha,durango, colour = "Durango"))+
geom_line(aes(Fecha,nayarit, colour = "Nayarit"))+
xlab("Fecha")+
ylab("casos diarios absolutos")+
labs (colour = "Estados")+
ggtitle("Casos diarios confirmados de COVID-19 en durango-nayarit")+
scale_y_continuous(labels = comma) * Gradica de datos acumulados(datos abiertos de casos confirmados del 12-01-2020 al 12-09-2020 )
ggplot(data=aduna)+
geom_line(aes(Fecha,adurango, colour = "Durango"))+
geom_line(aes(Fecha,anayarit, colour = "Nayarit"))+
xlab("Fecha")+
ylab("casos diarios acumulados")+
labs (colour = "Estados")+
ggtitle("Casos diarios confirmados de COVID-19 en durango-nayarit")+
scale_y_continuous(labels = comma)- Gráfica combinada
durango1 <- data.frame(Fecha,durango,adurango)
g2 <- ggplot(data=durango1) +
geom_col(aes(Fecha,adurango)) +
xlab("Fecha") +
ylab("Casos acumulados") +
ggtitle("A) Confirmados de COVID-19 en Durango (Acumulados)" ) +
scale_y_continuous(labels=comma)
g3 <- ggplot(data=durango1) +
geom_line(aes(Fecha,durango)) +
xlab("Fecha") +
ylab("Casos diarios") +
ggtitle("B) Confirmados de COVID-19 en Durango (Absolutos)" ) +
scale_y_continuous(labels=comma)
grid.arrange(g2,g3)Descripción
En esta actividad fue muy facil decargar,instalar y activar las librerias gracias a una nuevo comando que utlizamos, en esta actividad comparamos los casos de COVID-19 que hay en los estasdos de la republica hicimos las tablas de dos estados vecinos ya que estos por ende se comportan casi igual, tambien aprendimos como asignarle las escalas a las graficas y hacer las tablas de comparación, todo esto fue gracias a que convertimos los datos y los filtramos, como se explico en el taller del sabado.
Medidas de posición central
*Cálculo individual de las medidas
## [1] 31.52245
## [1] 8
## [1] 0
Resumen estadístico
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 0.00 8.00 31.52 66.00 144.00
Gráfico de caja y bigote
## Medidas de dispersión
- Varianza
## [1] 1636.759
- Desviacion estandar
## [1] 40.45687
### Tabla de distribuciones De durango
## Class limits f rf rf(%) cf cf(%)
## [0,16.16) 137 0.56 55.92 137 55.92
## [16.16,32.32) 27 0.11 11.02 164 66.94
## [32.32,48.48) 9 0.04 3.67 173 70.61
## [48.48,64.64) 10 0.04 4.08 183 74.69
## [64.64,80.8) 17 0.07 6.94 200 81.63
## [80.8,96.96) 16 0.07 6.53 216 88.16
## [96.96,113.12) 19 0.08 7.76 235 95.92
## [113.12,129.28) 7 0.03 2.86 242 98.78
## [129.28,145.44) 3 0.01 1.22 245 100.00
#----------------------------------------------
#Histogramde frecuencias acumuladas
plot(dist, type = "cfh")#---------------------------------------------
#Histogramde frecuencias relativas
plot(dist, type = "rfh")Descripcion
El día de hoy vimos las medidas de pocicion central, media,mediana, moda, distribuciones y varianza, vimos que los datos fueron similare ya que estos estados estan muy cerca, personalmente entendi mucho sobre la mediana,media y moda, tambien sobre la varianza y la desviacion que es la raiz cuadrada de la varianza la desviación por asi decirlo es lo separado que estan loda datos de uno al otro como lo podemos ver en la grafica de puntos del principio, tambien retomamos temas de los ejercicios del principio con la tabla de distribuciones,histogramas y poligonos de frecuencia.