Instrucciones

Ejercicios

1- Cargue el archivo mobility.csv.csv proveido por el profesor en el siguiente link(Debe hacerlo directamente desde la función read.csv:

https://raw.githubusercontent.com/DFJL/Datasets/master/mobility.csv

Este archivo de datos contiene data por país y por día sobre la movilidad promedio ( en cambios porcentuales) con respecto a una línea base del año 2019 en las siguientes localidades:

Puede ver los detalles e información sobre como interpretar en el siguiente link:

https://www.google.com/covid19/mobility/data_documentation.html?hl=en#about-this-data

Es requerido leer esta documentación para el correcto análisis de datos del presente reporte.

2- Copie y pegue el siguiente código para resumir el dataframe:

library(lubridate)
library(dplyr)

#Previanmente he cargado el archivo con el nombre de mobility

mobility$date <- as.Date(mobility$date, format = '%Y-%m-%d')

mobility2 <- mobility %>% 
  mutate(month= month(x = date),
         year= year(x= date))

3- Seleccione un país centroamericano y filtre los datos mediante el campo country_region_code.Guarde el resultado en nuevo dataframe.

4- Obtenga un resumen de los datos del dataframe obtenido en ejercicio anterior que indique la cantidad de observaciones, columnas y tipos de datos de las variables.

5- Obtenga para todas las variables cuantitativas(numericas), las medidas de tendencia central (min,Q1,mean,median,Q3,max) estudiadas en clase mediante alguna función estudiada en clase

Según los resultados del ejercicio anterior responda:

6- Utilizando una función(puede ser la utilizada en ejercicio anterior) cual variable tuvo más días( observaciones ) con valores negativos?

7- Obtenga un nuevo dataframe que realice lo siguiente:

8- Obtenga la distribución de frecuencias de la variable anterior para el mes de abril. - ( para lo anterior cree un nuevo df filtrando por el mes de abril) - ( debe utilizar el dataframe creado en ejercicio 3, debido a que el anterior esta agregado) - Utilice la opción “pretty” y nbins=10

9- Cree el histograma de la distribución de frecuencias anterior

10- Interprete la categoría con mayor frecuencia en el histograma, tanto en términos absolutos como relativos.

Bonus Genere el box plot de los datos del ejercicio 8 y 9.