xfun::embed_file("Casos_Diarios_Estado_Nacional_Confirmados_20211015.csv")
Download Casos_Diarios_Estado_Nacional_Confirmados_20211015.csv
#Establecemos una variable para acceder a los datos
datos <- read_csv("Casos_Diarios_Estado_Nacional_Confirmados_20211015.csv")
## Rows: 33 Columns: 609
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (2): cve_ent, nombre
## dbl (607): poblacion, 18-02-2020, 19-02-2020, 20-02-2020, 21-02-2020, 22-02-...
##
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
#Filtramos el estado del que queremos tomar la informacion
#Extraemos los datos de Puebla y los transformamos a un vector
puebla <- t(datos[datos$nombre == "PUEBLA" ,])# t = transpuesta
puebla <- as.vector(puebla)
puebla <- puebla
puebla <- puebla[4:609]
puebla <- as.numeric(puebla)
puebla<- as.vector(puebla)
apuebla <- cumsum(puebla)
#Extraemos los datos de Guerrero y los tranfromamos en un vector
guerrero <- t(datos[datos$nombre == "GUERRERO" ,])# t = transpuesta
guerrero <- as.vector(guerrero)
guerrero <- guerrero
guerrero <- guerrero[4:609]
guerrero <- as.numeric(guerrero)
guerrero <- as.vector(guerrero)
aguerrero <- cumsum(guerrero) #aALGO significa acumulado de algo
# Estructuración de los datos en un marco de datos ( Data frame)
Fecha <- seq(from= as.Date("2020-02-18"), to = as.Date("2021-10-15"), by = "day" ) #Vector de fechas desde el 2 de febrero del 2020 al 15 de Octubre del 2021
#Data frame de datos absolutos
puegue <- data.frame(Fecha,puebla,guerrero)
#Data frame de datos acumulados
apuegue <- data.frame(Fecha,apuebla,aguerrero)
Para este ejercicio usaremos datos de los casos confirmados de covid-19 en puebla y guerrero desde el 18 de Febrero del 2020 hasta hasta el 15 de Octubre del 2021
Grafiquemos los datos
Ahora transformaremos este vector numerico a un objeto de serie de tiempo
puegue.ts <- ts(puegue[, 2:3])#, start = c(2020,2), frequency = 300)
datos: (puegue[, 2]) empieza la serie de tiempo (start): Febrero de 2020 cada aƱo se compone de un ciclo de 365 dĆas: frequency = 365
ahora vemos los datos que ya son una serie de tiempo
print(puegue.ts)
## Time Series:
## Start = 1
## End = 606
## Frequency = 1
## puebla guerrero
## 1 0 0
## 2 0 0
## 3 0 0
## 4 0 0
## 5 0 0
## 6 0 0
## 7 0 0
## 8 0 0
## 9 0 0
## 10 0 0
## 11 0 0
## 12 0 0
## 13 0 0
## 14 0 0
## 15 0 0
## 16 0 0
## 17 0 0
## 18 0 0
## 19 0 0
## 20 0 0
## 21 0 0
## 22 0 0
## 23 1 0
## 24 2 0
## 25 4 2
## 26 3 0
## 27 3 0
## 28 4 2
## 29 5 5
## 30 6 1
## 31 7 0
## 32 5 0
## 33 4 1
## 34 2 1
## 35 8 1
## 36 16 0
## 37 6 3
## 38 16 4
## 39 11 3
## 40 14 3
## 41 6 1
## 42 18 2
## 43 27 5
## 44 20 3
## 45 23 1
## 46 15 1
## 47 11 2
## 48 11 3
## 49 27 8
## 50 14 11
## 51 26 7
## 52 17 7
## 53 8 5
## 54 15 5
## 55 6 12
## 56 25 17
## 57 18 8
## 58 29 5
## 59 22 12
## 60 31 13
## 61 24 9
## 62 20 6
## 63 32 17
## 64 24 6
## 65 27 13
## 66 32 19
## 67 45 25
## 68 44 13
## 69 25 18
## 70 37 26
## 71 46 28
## 72 52 32
## 73 49 19
## 74 43 15
## 75 43 41
## 76 39 30
## 77 48 55
## 78 37 38
## 79 52 52
## 80 67 43
## 81 56 41
## 82 52 41
## 83 38 34
## 84 79 52
## 85 75 66
## 86 93 55
## 87 109 79
## 88 108 66
## 89 81 55
## 90 69 44
## 91 133 133
## 92 131 121
## 93 121 148
## 94 150 139
## 95 176 131
## 96 150 66
## 97 84 75
## 98 173 131
## 99 162 115
## 100 188 126
## 101 164 118
## 102 159 104
## 103 121 63
## 104 65 90
## 105 201 159
## 106 178 115
## 107 201 118
## 108 215 131
## 109 214 122
## 110 128 99
## 111 100 72
## 112 312 153
## 113 248 121
## 114 252 147
## 115 302 153
## 116 325 156
## 117 189 86
## 118 150 100
## 119 443 144
## 120 417 153
## 121 425 113
## 122 522 113
## 123 430 135
## 124 222 53
## 125 173 76
## 126 500 185
## 127 420 120
## 128 374 95
## 129 475 135
## 130 377 125
## 131 207 146
## 132 144 177
## 133 369 251
## 134 367 254
## 135 354 261
## 136 292 299
## 137 286 272
## 138 194 192
## 139 143 158
## 140 344 155
## 141 361 154
## 142 360 116
## 143 363 141
## 144 335 138
## 145 193 41
## 146 175 129
## 147 444 170
## 148 439 166
## 149 433 136
## 150 414 171
## 151 412 123
## 152 207 115
## 153 181 129
## 154 497 241
## 155 378 146
## 156 389 150
## 157 374 222
## 158 349 199
## 159 247 101
## 160 125 92
## 161 451 201
## 162 345 184
## 163 348 142
## 164 360 197
## 165 259 169
## 166 152 130
## 167 110 65
## 168 317 186
## 169 299 223
## 170 308 222
## 171 331 162
## 172 268 141
## 173 177 65
## 174 104 43
## 175 297 180
## 176 294 134
## 177 266 107
## 178 249 151
## 179 233 114
## 180 135 81
## 181 86 47
## 182 256 140
## 183 229 125
## 184 215 141
## 185 191 106
## 186 194 90
## 187 141 65
## 188 81 61
## 189 266 124
## 190 223 145
## 191 213 101
## 192 200 122
## 193 206 132
## 194 88 42
## 195 99 41
## 196 206 147
## 197 194 158
## 198 178 174
## 199 176 154
## 200 167 165
## 201 112 62
## 202 71 81
## 203 178 230
## 204 156 181
## 205 178 162
## 206 173 159
## 207 126 184
## 208 73 88
## 209 51 77
## 210 181 205
## 211 121 193
## 212 75 69
## 213 174 190
## 214 138 158
## 215 82 88
## 216 56 49
## 217 183 191
## 218 173 196
## 219 126 209
## 220 122 156
## 221 148 125
## 222 83 64
## 223 65 63
## 224 157 176
## 225 98 194
## 226 111 167
## 227 128 115
## 228 147 117
## 229 48 57
## 230 55 55
## 231 147 176
## 232 126 133
## 233 137 151
## 234 106 126
## 235 127 102
## 236 71 51
## 237 45 38
## 238 171 134
## 239 126 108
## 240 138 137
## 241 158 113
## 242 144 79
## 243 79 27
## 244 56 26
## 245 190 117
## 246 157 94
## 247 143 88
## 248 147 94
## 249 173 60
## 250 96 30
## 251 70 36
## 252 166 89
## 253 152 62
## 254 144 47
## 255 169 71
## 256 148 59
## 257 73 30
## 258 46 19
## 259 115 30
## 260 180 87
## 261 145 56
## 262 141 68
## 263 159 48
## 264 92 31
## 265 50 22
## 266 187 80
## 267 158 62
## 268 202 71
## 269 197 68
## 270 162 45
## 271 109 25
## 272 73 16
## 273 81 34
## 274 241 68
## 275 186 64
## 276 220 49
## 277 166 62
## 278 113 31
## 279 71 22
## 280 217 113
## 281 228 87
## 282 215 63
## 283 210 66
## 284 233 111
## 285 160 26
## 286 73 24
## 287 242 78
## 288 270 83
## 289 284 70
## 290 262 70
## 291 249 54
## 292 174 48
## 293 84 39
## 294 284 110
## 295 241 87
## 296 318 80
## 297 267 94
## 298 292 82
## 299 189 56
## 300 106 52
## 301 314 149
## 302 325 112
## 303 385 103
## 304 306 115
## 305 324 93
## 306 220 23
## 307 166 32
## 308 436 107
## 309 394 90
## 310 351 90
## 311 343 85
## 312 114 20
## 313 237 44
## 314 198 31
## 315 488 197
## 316 459 152
## 317 484 116
## 318 350 114
## 319 177 39
## 320 341 45
## 321 236 58
## 322 566 181
## 323 595 187
## 324 658 188
## 325 572 186
## 326 680 203
## 327 478 98
## 328 346 85
## 329 694 361
## 330 733 324
## 331 610 231
## 332 628 258
## 333 585 248
## 334 442 91
## 335 261 85
## 336 696 297
## 337 648 311
## 338 533 292
## 339 571 262
## 340 563 207
## 341 389 88
## 342 271 73
## 343 581 317
## 344 570 227
## 345 515 234
## 346 442 264
## 347 431 228
## 348 331 69
## 349 215 86
## 350 244 76
## 351 442 269
## 352 427 168
## 353 372 229
## 354 359 178
## 355 253 64
## 356 152 42
## 357 449 178
## 358 321 135
## 359 303 126
## 360 350 152
## 361 309 118
## 362 167 32
## 363 157 40
## 364 369 140
## 365 301 134
## 366 258 97
## 367 282 97
## 368 267 89
## 369 183 40
## 370 147 35
## 371 331 129
## 372 343 101
## 373 261 96
## 374 301 100
## 375 293 102
## 376 203 35
## 377 146 39
## 378 357 127
## 379 257 117
## 380 279 107
## 381 279 105
## 382 230 94
## 383 163 44
## 384 117 40
## 385 297 124
## 386 258 104
## 387 217 70
## 388 236 83
## 389 260 87
## 390 170 37
## 391 104 27
## 392 138 43
## 393 267 85
## 394 212 95
## 395 235 93
## 396 209 85
## 397 144 28
## 398 123 35
## 399 243 90
## 400 204 90
## 401 185 94
## 402 176 69
## 403 182 57
## 404 123 24
## 405 91 31
## 406 214 93
## 407 190 92
## 408 144 74
## 409 128 49
## 410 99 59
## 411 98 30
## 412 97 25
## 413 202 108
## 414 159 93
## 415 163 61
## 416 172 89
## 417 166 103
## 418 102 31
## 419 77 24
## 420 184 112
## 421 150 104
## 422 146 76
## 423 147 79
## 424 115 76
## 425 84 18
## 426 65 34
## 427 143 75
## 428 123 75
## 429 132 58
## 430 113 80
## 431 104 70
## 432 67 31
## 433 56 18
## 434 127 82
## 435 100 67
## 436 98 71
## 437 87 76
## 438 102 58
## 439 43 33
## 440 40 21
## 441 129 85
## 442 97 84
## 443 79 72
## 444 75 98
## 445 43 55
## 446 54 33
## 447 35 20
## 448 37 60
## 449 66 93
## 450 55 77
## 451 62 40
## 452 60 45
## 453 33 17
## 454 20 12
## 455 63 39
## 456 72 45
## 457 51 61
## 458 53 48
## 459 42 54
## 460 34 6
## 461 19 13
## 462 48 57
## 463 58 49
## 464 41 45
## 465 46 46
## 466 40 31
## 467 30 5
## 468 18 6
## 469 44 37
## 470 37 33
## 471 47 27
## 472 31 18
## 473 44 16
## 474 21 16
## 475 15 15
## 476 36 29
## 477 44 31
## 478 32 21
## 479 24 23
## 480 42 25
## 481 25 14
## 482 22 9
## 483 30 25
## 484 28 18
## 485 42 23
## 486 37 25
## 487 31 15
## 488 21 5
## 489 18 7
## 490 42 40
## 491 43 32
## 492 36 33
## 493 43 39
## 494 38 43
## 495 29 17
## 496 21 25
## 497 48 67
## 498 39 68
## 499 39 70
## 500 61 75
## 501 47 89
## 502 29 37
## 503 29 73
## 504 95 238
## 505 61 221
## 506 87 292
## 507 121 333
## 508 125 317
## 509 87 227
## 510 61 147
## 511 144 496
## 512 138 481
## 513 173 473
## 514 153 595
## 515 139 590
## 516 114 246
## 517 83 278
## 518 237 877
## 519 240 895
## 520 239 861
## 521 254 962
## 522 274 686
## 523 211 243
## 524 178 418
## 525 372 865
## 526 367 885
## 527 323 817
## 528 398 974
## 529 394 883
## 530 250 366
## 531 224 399
## 532 503 883
## 533 485 981
## 534 527 732
## 535 604 930
## 536 554 853
## 537 334 238
## 538 286 415
## 539 686 871
## 540 652 738
## 541 689 699
## 542 654 651
## 543 712 617
## 544 447 274
## 545 378 206
## 546 690 694
## 547 790 569
## 548 754 478
## 549 725 482
## 550 669 437
## 551 281 171
## 552 249 115
## 553 726 461
## 554 663 387
## 555 644 361
## 556 656 375
## 557 609 205
## 558 312 110
## 559 261 108
## 560 567 246
## 561 611 235
## 562 549 297
## 563 521 248
## 564 578 241
## 565 265 86
## 566 186 77
## 567 658 261
## 568 574 189
## 569 522 155
## 570 564 154
## 571 465 179
## 572 247 85
## 573 167 62
## 574 510 143
## 575 451 131
## 576 278 105
## 577 249 55
## 578 419 83
## 579 210 44
## 580 188 33
## 581 454 110
## 582 424 42
## 583 429 62
## 584 372 75
## 585 386 60
## 586 186 22
## 587 182 25
## 588 368 78
## 589 320 64
## 590 274 42
## 591 251 40
## 592 220 40
## 593 131 32
## 594 99 28
## 595 234 61
## 596 280 44
## 597 208 49
## 598 178 30
## 599 158 34
## 600 110 16
## 601 96 23
## 602 156 39
## 603 116 34
## 604 124 25
## 605 56 10
## 606 0 0
Ahora grafiquemos con respecto al tiempo
plot(puegue.ts)
Ahora para hacer una comparacion entre los meses de dĆa aƱo todos los dĆas primeros por ejemplo seran una poblacion
esto lo haremos a traves de un grafico de caja y bigote
boxplot(puegue.ts[,1] ~ cycle(puegue.ts[,1]), main = "Puebla")
boxplot(puegue.ts[,2] ~ cycle(puegue.ts[,2]), main = "Guerrero")
http://verso.mat.uam.es/~joser.berrendero/datos/jj.dat
analizamos una serie de tiempo desde sus componentes estructurales
En este modelo, la serie observada es el resultado de sumar una tendencia que representa el comportamiento a largo plazo de la serie, un efecto estacional que describe sus fluctuaciones periódicas y un componente residual que describe las variaciones a corto plazo, normalmente impredecibles.
Con R es muy sencillo obtener una descomposición estructural de este tipo. Se usa el comando decompose:
\[ serie observada = Tendencia + efecto estacional + residuos \]
Esta descomposición se basa en métodos elementales:
la tendencia se calcula con una media móvil,
el efecto estacional se calcula promediando los valores de cada unidad de tiempo para todos los periodos (por ejemplo, todos los meses de enero si la serie es mensual) y luego centrando el resultado. Finalmente,
los residuos se obtienen restando a la serie observada las dos componentes anteriores.
La descomposicion solo es totalmente adecuada si se dispone de un nĆŗmero completo de periodos (por ejemplo, un mĆŗltiplo de 12 si la serie es mensual).
En el grĆ”fico de dMuertos.ts se observa que la serie no es estacionaria. La serie presenta una tendencia aparentemente lineal en decenso y una estacionalidad muy marcada (las busquedas aumentan por Octubre a pesar de no ser el dĆa que se busca). AdemĆ”s, la amplitud de las fluctuaciones decae con el tiempo por lo que la variabilidad tampoco es constante. Sin embargo, muchos modelos importantes de series temporales corresponden a series estacionarias (es decir, sin tendencia ni estacionalidad y con variabilidad constante). Antes de ajustar un modelo estacionario tenemos que transformar la serie original.
Estabilización de la varianza: Para estabilizar la variabilidad se suelen tomar logaritmos. Esta transformación funcionarÔ bien cuando la variabilidad sea aproximadamente proporcional al nivel de la serie. Representamos la serie transformada mediante
#plot(log(gas.ts))
plot(log(puegue.ts))
Eliminacion de la tendencia: Una forma sencilla de eliminar una tendencia aproximadamente lineal es diferenciar la serie, es decir, considerar la serie de diferencias entre una observación y la anterior en lugar de la serie original. Si xt es una serie contenida en x, para calcular:
\[ \nabla x_t = x_t -x_{t-1} \]
x <- log(puegue.ts)
dif1.x <- diff(x)
plot(dif1.x)
Eliminación de estacionalidad: Para eliminar la estacionalidad de una serie mensual se pueden tomar diferencias estacionales de orden 12. Si xt es la serie que queremos desestacionalizar, se trata de calcular:
\[ \nabla_{12} x_t = x_t - x_{t-12} \]
dif12.dif1.x <- diff(dif1.x, lag=12)
plot(dif12.dif1.x)
en las graficas se pueden observar picos de contagio o de propagacion del coronavirus, se debe a que en mexico las personas no les importa mucho el contagio y se juntan o hacen fiestas, ademas en fechas como el dia de la independencia o el dia de las madres o cualquier otro dia festivo poco tiempo despues se muestran los picos de contagio por esatas fiestas.