Crear un nuevo dataframe que sea un subconjunto del dataframe original de dfFires. El subconjunto debe contener todos los incendios del Estado de Idaho y las columnas deben ser limitadas para que sólo estén presentes las columnas YEAR_, CAUSE y TOTALACRES. Cambie el nombre de las columnas. Agrupe los datos por CAUSE y YEAR_ y luego resuma por el total de acres quemados. Trazar los resultados.
library(readr)
dfFires <- read_csv("StudyArea.csv", col_types = list(UNIT = col_character()), col_names = TRUE)
knitr::kable(head(dfFires, 5))
| FID | ORGANIZATI | UNIT | SUBUNIT | SUBUNIT2 | FIRENAME | CAUSE | YEAR_ | STARTDATED | CONTRDATED | OUTDATED | STATE | STATE_FIPS | TOTALACRES |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | FWS | 81682 | USCADBR | San Diego Bay National Wildlife Refuge | PUMP HOUSE | Human | 2001 | 1/1/01 0:00 | 1/1/01 0:00 | NA | California | 6 | 0.1 |
| 1 | FWS | 81682 | USCADBR | San Diego Bay National Wildlife Refuge | I5 | Human | 2002 | 5/3/02 0:00 | 5/3/02 0:00 | NA | California | 6 | 3.0 |
| 2 | FWS | 81682 | USCADBR | San Diego Bay National Wildlife Refuge | SOUTHBAY | Human | 2002 | 6/1/02 0:00 | 6/1/02 0:00 | NA | California | 6 | 0.5 |
| 3 | FWS | 81682 | USCADBR | San Diego Bay National Wildlife Refuge | MARINA | Human | 2001 | 7/12/01 0:00 | 7/12/01 0:00 | NA | California | 6 | 0.1 |
| 4 | FWS | 81682 | USCADBR | San Diego Bay National Wildlife Refuge | HILL | Human | 1994 | 9/13/94 0:00 | 9/13/94 0:00 | NA | California | 6 | 1.0 |
Llamamos a la libreria correspondiente para leer el archivo StudyArea.csv, dandonos como resultado una tabla con los primeros 5 items con su respectiva información.
library(dplyr)
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
dfFires_subset<-dfFires %>%
filter(STATE == 'Idaho') %>%
select("Año" = "YEAR_", "Causa" = "CAUSE","Acres" = "TOTALACRES")
knitr::kable(head(dfFires_subset, 5))
| Año | Causa | Acres |
|---|---|---|
| 1987 | Human | 5 |
| 1991 | Natural | 150 |
| 1991 | Human | 800 |
| 1990 | Natural | 2 |
| 1985 | Human | 38 |
En este item, llamamos a la libreria, filtramos la información que nos piden que en este caso es el estado de Idaho, y le pedimos que nos grafique una tabla con la información del año, la causa y el total de acres presente en ese año.
dfFires_summary<-dfFires_subset %>%
group_by(Causa,Año) %>%
summarise(Total_Acres_Quemados=sum(Acres))
## `summarise()` has grouped output by 'Causa'. You can override using the
## `.groups` argument.
knitr::kable(head(dfFires_summary, 5))
| Causa | Año | Total_Acres_Quemados |
|---|---|---|
| Human | 1980 | 71974.7 |
| Human | 1981 | 219362.4 |
| Human | 1982 | 34016.2 |
| Human | 1983 | 48242.5 |
| Human | 1984 | 36837.8 |
En esta última tabla agrupamos la causa y el año y calculamos la cantidad de acres quemados que hubo en ese año, también se nombra la causa de lo ocurrido.
##install.packages("ggplot2")
library(ggplot2)
ggplot(dfFires_summary, aes(x = Año, y = Total_Acres_Quemados, color = Causa)) +
geom_line() +
theme_minimal() +
labs(title = 'Total acres quemados por causa y año en Idaho',
x = 'Año',
y = 'Total acres quemados') +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
En esta gráfica se puede observar la cantidad de acres que d¿fueron quemados y la causa, podemos notar que en el caso de causa natural el pico mas alto fue entre los 2000 y 2010, en el caso de la causa por humanos su pico mas alto fue antes de 1990, podemos observar que se presenta una linea de color azul y de color gris, de la cual en la linea del color gris son datos atipicos y en el caso de la linea de color azul no se encontró información.