Limpieza de datos en Dplyr

Este es un documento que toma los datos de la temperatura de Colombia de la página web: https://www.datos.gov.co/resource/ccvq-rp9s.csv.

##   codigoestacion codigosensor        fechaobservacion valorobservado
## 1       35185010           69 2010-01-12T17:01:00.000           34.3
## 2       48015040           69 2011-04-11T04:00:00.000           23.3
## 3       35035100           69 2015-08-16T18:01:00.000           24.1
## 4       26155250           69 2016-08-15T02:54:00.000            4.1
## 5       35035100           69 2017-11-02T14:54:00.000           33.4
## 6       52015050           69 2018-12-09T19:00:00.000           20.4
##             nombreestacion departamento     municipio    zonahidrografica
## 1        LA PALOMERA - AUT         META  PUERTO LÓPEZ                META
## 2               PTO NARIÑO     AMAZONAS PUERTO NARIÑO AMAZONAS - DIRECTOS
## 3 ICA VILLAVICENCIO  - AUT         META VILLAVICENCIO                META
## 4  PARAMO CONEJERAS  - AUT       CALDAS    VILLAMARIA               CAUCA
## 5 ICA VILLAVICENCIO  - AUT         META VILLAVICENCIO                META
## 6             BALBOA - AUT        CAUCA        BALBOA               PATÍA
##     latitud  longitud descripcionsensor unidadmedida
## 1  4.260361 -72.56447 Temp Max Aire 2 m           °C
## 2 -3.780000 -70.36300 Temp Max Aire 2 m           °C
## 3  4.137389 -73.62500 Temp Max Aire 2 m           °C
## 4  4.829806 -75.37583 Temp Max Aire 2 m           °C
## 5  4.137389 -73.62500 Temp Max Aire 2 m           °C
## 6  2.032778 -77.22167 Temp Max Aire 2 m           °C

1.Filtro por columna:

Se filtró la información para obtener únicamente el valor de la temperatura en grados centigrados, el departamento, la fecha de observación y el municipio.

##   valorobservado departamento        fechaobservacion     municipio
## 1           34.3         META 2010-01-12T17:01:00.000  PUERTO LÓPEZ
## 2           23.3     AMAZONAS 2011-04-11T04:00:00.000 PUERTO NARIÑO
## 3           24.1         META 2015-08-16T18:01:00.000 VILLAVICENCIO
## 4            4.1       CALDAS 2016-08-15T02:54:00.000    VILLAMARIA
## 5           33.4         META 2017-11-02T14:54:00.000 VILLAVICENCIO
## 6           20.4        CAUCA 2018-12-09T19:00:00.000        BALBOA

2.Filtro por fila:

Sumado al anterior filtro, se tomará únicamente la información para el departamento de Boyacá.

##   valorobservado departamento        fechaobservacion   municipio
## 1           19.6       BOYACÁ 2013-11-21T22:50:00.000 SANTA MARÍA
## 2           19.1       BOYACÁ 2008-08-28T22:00:00.000 SANTA MARÍA
## 3           22.1       BOYACÁ 2015-05-18T16:29:00.000  LA CAPILLA
## 4           11.3       BOYACÁ 2016-12-30T04:08:00.000       SOCHA
## 5            4.9       BOYACÁ 2014-06-06T11:00:00.000      GUICÁN
## 6           22.0       BOYACÁ 2017-11-26T15:21:00.000   CHINAVITA

3.Función mutate:

Aquí pasamos la temperatura de grados centigrados (°C) a grados kelvin (°K).

##   valorobservado departamento        fechaobservacion   municipio      k
## 1           19.6       BOYACÁ 2013-11-21T22:50:00.000 SANTA MARÍA 292.75
## 2           19.1       BOYACÁ 2008-08-28T22:00:00.000 SANTA MARÍA 292.25
## 3           22.1       BOYACÁ 2015-05-18T16:29:00.000  LA CAPILLA 295.25
## 4           11.3       BOYACÁ 2016-12-30T04:08:00.000       SOCHA 284.45
## 5            4.9       BOYACÁ 2014-06-06T11:00:00.000      GUICÁN 278.05
## 6           22.0       BOYACÁ 2017-11-26T15:21:00.000   CHINAVITA 295.15

4.Función group_by:

Por último, se agruparon los datos por departamento, para así hallar la temperatura promedio de estos en grados Centígrados.

## # A tibble: 6 × 2
##   departamento promedio
##   <chr>           <dbl>
## 1 AMAZONAS        25.8 
## 2 ANTIOQUIA       20.2 
## 3 ARAUCA           5.70
## 4 ATLANTICO       27.7 
## 5 ATLÁNTICO       27.0 
## 6 BOGOTA          12.1