Ejercicio #1

Crear un nuevo dataframe que sea un subconjunto del dataframe original de dfFires. El subconjunto debe contener todos los incendios del Estado de Idaho y las columnas deben ser limitadas para que sólo estén presentes las columnas YEAR_, CAUSE y TOTALACRES. Cambie el nombre de las columnas. Agrupe los datos por CAUSE y YEAR_ y luego resuma por el total de acres quemados. Trazar los resultados.

Tabla con información completa.

library(readr)
dfFires <- read_csv("StudyArea.csv", col_types = list(UNIT = col_character()), col_names = TRUE)
knitr::kable(head(dfFires, 5))
FID ORGANIZATI UNIT SUBUNIT SUBUNIT2 FIRENAME CAUSE YEAR_ STARTDATED CONTRDATED OUTDATED STATE STATE_FIPS TOTALACRES
0 FWS 81682 USCADBR San Diego Bay National Wildlife Refuge PUMP HOUSE Human 2001 1/1/01 0:00 1/1/01 0:00 NA California 6 0.1
1 FWS 81682 USCADBR San Diego Bay National Wildlife Refuge I5 Human 2002 5/3/02 0:00 5/3/02 0:00 NA California 6 3.0
2 FWS 81682 USCADBR San Diego Bay National Wildlife Refuge SOUTHBAY Human 2002 6/1/02 0:00 6/1/02 0:00 NA California 6 0.5
3 FWS 81682 USCADBR San Diego Bay National Wildlife Refuge MARINA Human 2001 7/12/01 0:00 7/12/01 0:00 NA California 6 0.1
4 FWS 81682 USCADBR San Diego Bay National Wildlife Refuge HILL Human 1994 9/13/94 0:00 9/13/94 0:00 NA California 6 1.0

Llamamos a la libreria correspondiente para leer el archivo StudyArea.csv, dandonos como resultado una tabla con los primeros 5 items con su respectiva información.

Tabla con información de año, la causa y la cantidad de acres.

library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
dfFires_subset<-dfFires %>% 
  filter(STATE == 'Idaho') %>% 
  select("Año" = "YEAR_", "Causa"  = "CAUSE","Acres" = "TOTALACRES")
knitr::kable(head(dfFires_subset, 5))
Año Causa Acres
1987 Human 5
1991 Natural 150
1991 Human 800
1990 Natural 2
1985 Human 38

En este item, llamamos a la libreria, filtramos la información que nos piden que en este caso es el estado de Idaho, y le pedimos que nos grafique una tabla con la información del año, la causa y el total de acres presente en ese año.

Tabla con la información del año, la causa y el total de acres quemados.

dfFires_summary<-dfFires_subset %>% 
  group_by(Causa,Año) %>% 
  summarise(Total_Acres_Quemados=sum(Acres))
## `summarise()` has grouped output by 'Causa'. You can override using the
## `.groups` argument.
knitr::kable(head(dfFires_summary, 5))
Causa Año Total_Acres_Quemados
Human 1980 71974.7
Human 1981 219362.4
Human 1982 34016.2
Human 1983 48242.5
Human 1984 36837.8

En esta última tabla agrupamos la causa y el año y calculamos la cantidad de acres quemados que hubo en ese año, también se nombra la causa de lo ocurrido.

Gráfica con los datos de la cantidad de acres quemados.

##install.packages("ggplot2")
library(ggplot2)

ggplot(dfFires_summary, aes(x = Año, y = Total_Acres_Quemados, color = Causa)) +
  geom_line() +
  theme_minimal() +
  labs(title = 'Total acres quemados por causa y año en Idaho',
       x = 'Año',
       y = 'Total acres quemados') +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

En esta gráfica se puede observar la cantidad de acres que d¿fueron quemados y la causa, podemos notar que en el caso de causa natural el pico mas alto fue entre los 2000 y 2010, en el caso de la causa por humanos su pico mas alto fue antes de 1990, podemos observar que se presenta una linea de color azul y de color gris, de la cual en la linea del color gris son datos atipicos y en el caso de la linea de color azul no se encontró información.