Instrucciones

Ejercicios

1- Cargue el archivo unemploymentClaims.csv proveido por el profesor en el siguiente link(Debe hacerlo directamente desde la función read.csv:

https://raw.githubusercontent.com/DFJL/Datasets/master/unemploymentClaims.csv

2- Copie y pegue el siguiente código para resumir el dataframe:

library(dplyr)
library(lubridate)

#Previanmente he cargado el archivo con el nombre de claims

claims$date <- as.Date(claims$Filed.week.ended, format = '%m/%d/%Y')

claims2 <- claims %>%
  filter(month(date)==4) %>%
  mutate(year= year(date)) %>%
  group_by(State,year) %>%
  summarise(claims= sum(Continued.Claims)) %>%
  ungroup()

3- Indique mediante la utilización de una función, si alguna de las variables tiene valores nulos.

4- Indique mediante la utilización de una función, si alguna de las variables tiene valores negativos.

5- Obtenga un nuevo data frame con los datos solamente del 2020.

Para los datos filtrados según el ejercicio anterior:

6- Diagnostique la variable claims, mediante la función utilizada en clase.Analice los resultados

7- Obtenga la distribución de frecuencias de la variable claims

8- Obtenga el histograma de la variable claims.Analicelo los resultados.

Bonus Explique que hace el código del chunk adjuntado en este documento.