UNIVERSIDAD CENTRAL DEL ECUADOR

FACULTAD DE CIENCIAS ECONÓMICAS

CARRERA DE ESTADÍSTICA



PRIMERAS PRACTICAS EN R 7

Manual

En el siguiente texto podremos encontrar una serie de códigos elaborados en el programa Rstudio que darán solución a un determinado ejercicio enfocados principalmente en la manupulacion de las bases de datos.

Utilizando la base de datos interna mtcars, resolver los siguientes enunciados:

Ejercicio 1

Seleccionamos las 3 primeras columnas del dataset mtcars y mostramos la cabecera.

  1. Comenzaremos por cargar la librería “tidyverse”, la llamamos y visualisamos la base de datos mtcars.
install.packages("tidyverse")
library(tidyverse)
view(mtcars)
  1. Cargamos la librería “dplyr”, la llamamos y visualisamos la base de datos mtcars.
install.packages("dplyr")
library(dplyr)
  1. Procedemos a ejecutar el codigo que requiere el ejercicio.
head() —> Nos muestra los primeros casos del archivo
select() —> Nos permite seleccionar una parte de la base de datos de acuerdo a condicciones
head(select(mtcars, 1:3))

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 1

#Seleccionamos las 3 primeras columnas del dataset mtcars y mostramos la cabecera.

#INSTALACIÓN 

library(tidyverse)
view(mtcars)

#INSTALACIÓN

library(dplyr)

#Primeras filas de la base de datos
head(select(mtcars, 1:3))
RESULTADO FINAL
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.2 ──
## ✔ ggplot2 3.3.6     ✔ purrr   0.3.4
## ✔ tibble  3.1.7     ✔ dplyr   1.0.9
## ✔ tidyr   1.2.0     ✔ stringr 1.4.0
## ✔ readr   2.1.2     ✔ forcats 0.5.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
##                    mpg cyl disp
## Mazda RX4         21.0   6  160
## Mazda RX4 Wag     21.0   6  160
## Datsun 710        22.8   4  108
## Hornet 4 Drive    21.4   6  258
## Hornet Sportabout 18.7   8  360
## Valiant           18.1   6  225

Ejercicio 2

Utiliza la ayuda ?select_helpers para que observes el resultado.

?select_helpers

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 2

#Utiliza la ayuda ?select_helpers para que observes el resultado.

?select_helpers
RESULTADO FINAL
## starting httpd help server ... done

Ejercicio 3

Seleccionar las columnas que empiezan por d.

  1. Para esto utilizamos la funcion starts_with() que junto a las otras funciones, nos selecciona las columnas cuyo nombre comienzan con la letra que coloquemos en el argumento.
head() —> Nos muestra los primeros casos del archivo
select() —> Nos permite seleccionar una parte de la base de datos de acuerdo a condicciones
head(select(mtcars, starts_with("d")))

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 3

#Seleccionar las columnas que empiezan por d.

#BASE DE DATOS
head(mtcars)

#EJECUCIÓN
head(select(mtcars, starts_with("d")))
RESULTADO FINAL
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
##                   disp drat
## Mazda RX4          160 3.90
## Mazda RX4 Wag      160 3.90
## Datsun 710         108 3.85
## Hornet 4 Drive     258 3.08
## Hornet Sportabout  360 3.15
## Valiant            225 2.76

Ejercicio 4

Seleccionar las columnas que terminan por p.

  1. Para esto utilizamos la funcion ends_with() que junto a las otras funciones, nos selecciona las columnas cuyo nombre comienzan con la letra que coloquemos en el argumento.
head() —> Nos muestra los primeros casos del archivo
select() —> Nos permite seleccionar una parte de la base de datos de acuerdo a condicciones
head(select(mtcars, ends_with("p")))

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 4

#Seleccionar las columnas que terminan por p.

#BASE DE DATOS
head(mtcars)

#EJECUCIÓN
head(select(mtcars, ends_with("p")))
RESULTADO FINAL
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
##                   disp  hp
## Mazda RX4          160 110
## Mazda RX4 Wag      160 110
## Datsun 710         108  93
## Hornet 4 Drive     258 110
## Hornet Sportabout  360 175
## Valiant            225 105

Ejercicio 5

head(select( mtcars, -drat, -am )) Explica que resultado obtienes.

  1. Copiamos el codigo en la consola y lo corremos.

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 5

#Explica que resultado obtienes.

#BASE DE DATOS
head(mtcars)

#EJECUCIÓN
head(select( mtcars, -drat, -am ))
RESULTADO FINAL
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
##                    mpg cyl disp  hp    wt  qsec vs gear carb
## Mazda RX4         21.0   6  160 110 2.620 16.46  0    4    4
## Mazda RX4 Wag     21.0   6  160 110 2.875 17.02  0    4    4
## Datsun 710        22.8   4  108  93 2.320 18.61  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.215 19.44  1    3    1
## Hornet Sportabout 18.7   8  360 175 3.440 17.02  0    3    2
## Valiant           18.1   6  225 105 3.460 20.22  1    3    1
Al ejecutar el codigo, observamos que se eliminan las columnas drat y am de la base de datos.

Ejercicio 6

head(select( mtcars, contains( “a” ) )) Explica que resultado obtienes.

  1. Copiamos el codigo en la consola y lo corremos.

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 6

#Explica que resultado obtienes.

#BASE DE DATOS
head(mtcars)

#EJECUCIÓN
head(select( mtcars, contains( "a" ) ))
RESULTADO FINAL
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
##                   drat am gear carb
## Mazda RX4         3.90  1    4    4
## Mazda RX4 Wag     3.90  1    4    4
## Datsun 710        3.85  1    4    1
## Hornet 4 Drive    3.08  0    3    1
## Hornet Sportabout 3.15  0    3    2
## Valiant           2.76  0    3    1
Al ejecutar el codigo, observamos que se seleccionan las columnas, de la base de datos, que contienen la letra a.

Ejercicio 7

head(filter( mtcars, mpg > 20, gear == 4)) Explica que resultado obtienes.

  1. Copiamos el codigo en la consola y lo corremos.

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 7

#Explica que resultado obtienes.

#BASE DE DATOS
head(mtcars)

#EJECUCIÓN
head(filter( mtcars, mpg > 20, gear == 4))
RESULTADO FINAL
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
##                mpg cyl  disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4     21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag 21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710    22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
## Merc 240D     24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
## Merc 230      22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
## Fiat 128      32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
Al ejecutar el codigo, observamos que se seleccionan aquellos datos que cumplen con mpg mayor a 20 siempre y cuando gear sea igual a 4.

Ejercicio 8

Seleccionar los sujetos con tipo de transmisión (am) 1 que, además, tienen 6 cilindros o menos.

  1. Para esto utilizamos la funcion filter que junto a las otras funciones, nos selecciona los datos en base a las condiciones de los argumentos.
head() —> Nos muestra los primeros casos del archivo
filter() —> Nos permite filtrar los datoa en base a condiciones
head(filter( mtcars, cyl <= 6 , am == 1))

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 8

#Seleccionar los sujetos con tipo de transmisión (am) 1 que, además, tienen 6 cilindros o menos.

#BASE DE DATOS
head(mtcars)

#EJECUCIÓN
head(filter( mtcars, cyl <= 6 , am == 1))
RESULTADO FINAL
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
##                 mpg cyl  disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4      21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag  21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710     22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
## Fiat 128       32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
## Honda Civic    30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
## Toyota Corolla 33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1

Ejercicio 9

Seleccionar los sujetos que bien consumen menos de 21 mpg o bien tienen menos de 3 carburantes (carb) y menos de 4 engranajes (gear).

  1. Para esto utilizamos la funcion filter que junto a las otras funciones, nos selecciona los datos en base a las condiciones de los argumentos.
head() —> Nos muestra los primeros casos del archivo
filter() —> Nos permite filtrar los datoa en base a condiciones
head(filter( mtcars, (mpg < 21 | carb < 3) , gear < 4))

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 9

#Seleccionar los sujetos que bien consumen menos de 21 mpg o bien tienen menos de 3 carburantes (carb) y menos de 4 engranajes (gear).

#BASE DE DATOS
head(mtcars)

#EJECUCIÓN
head(filter( mtcars, (mpg < 21 | carb < 3) , gear < 4))
RESULTADO FINAL
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
##                    mpg cyl  disp  hp drat    wt  qsec vs am gear carb
## Hornet 4 Drive    21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1
## Duster 360        14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4
## Merc 450SE        16.4   8 275.8 180 3.07 4.070 17.40  0  0    3    3
## Merc 450SL        17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3

Ejercicio 10

Ordena por cilindrada (cyl) y por desplazamiento (disp).

  1. Para esto utilizamos la funcion arrange que nos ayuda a ordenar los datos en función de una de las columnas.
arrange(mtcars, cyl)
arrange(mtcars, disp)

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 10

#Ordena por cilindrada (cyl) y por desplazamiento (disp).

#BASE DE DATOS
head(mtcars)

#EJECUCIÓN
arrange(mtcars, cyl)
arrange(mtcars, disp)
RESULTADO FINAL
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
##                      mpg cyl  disp  hp drat    wt  qsec vs am gear carb
## Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
## Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
## Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
## Fiat 128            32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
## Honda Civic         30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
## Toyota Corolla      33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1
## Toyota Corona       21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1
## Fiat X1-9           27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
## Porsche 914-2       26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2
## Lotus Europa        30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
## Volvo 142E          21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2
## Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
## Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
## Valiant             18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1
## Merc 280            19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
## Merc 280C           17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4
## Ferrari Dino        19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
## Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
## Duster 360          14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4
## Merc 450SE          16.4   8 275.8 180 3.07 4.070 17.40  0  0    3    3
## Merc 450SL          17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3
## Merc 450SLC         15.2   8 275.8 180 3.07 3.780 18.00  0  0    3    3
## Cadillac Fleetwood  10.4   8 472.0 205 2.93 5.250 17.98  0  0    3    4
## Lincoln Continental 10.4   8 460.0 215 3.00 5.424 17.82  0  0    3    4
## Chrysler Imperial   14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4
## Dodge Challenger    15.5   8 318.0 150 2.76 3.520 16.87  0  0    3    2
## AMC Javelin         15.2   8 304.0 150 3.15 3.435 17.30  0  0    3    2
## Camaro Z28          13.3   8 350.0 245 3.73 3.840 15.41  0  0    3    4
## Pontiac Firebird    19.2   8 400.0 175 3.08 3.845 17.05  0  0    3    2
## Ford Pantera L      15.8   8 351.0 264 4.22 3.170 14.50  0  1    5    4
## Maserati Bora       15.0   8 301.0 335 3.54 3.570 14.60  0  1    5    8
##                      mpg cyl  disp  hp drat    wt  qsec vs am gear carb
## Toyota Corolla      33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1
## Honda Civic         30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
## Fiat 128            32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
## Fiat X1-9           27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
## Lotus Europa        30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
## Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
## Toyota Corona       21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1
## Porsche 914-2       26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2
## Volvo 142E          21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2
## Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
## Ferrari Dino        19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
## Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
## Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
## Merc 280            19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
## Merc 280C           17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4
## Valiant             18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1
## Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
## Merc 450SE          16.4   8 275.8 180 3.07 4.070 17.40  0  0    3    3
## Merc 450SL          17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3
## Merc 450SLC         15.2   8 275.8 180 3.07 3.780 18.00  0  0    3    3
## Maserati Bora       15.0   8 301.0 335 3.54 3.570 14.60  0  1    5    8
## AMC Javelin         15.2   8 304.0 150 3.15 3.435 17.30  0  0    3    2
## Dodge Challenger    15.5   8 318.0 150 2.76 3.520 16.87  0  0    3    2
## Camaro Z28          13.3   8 350.0 245 3.73 3.840 15.41  0  0    3    4
## Ford Pantera L      15.8   8 351.0 264 4.22 3.170 14.50  0  1    5    4
## Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
## Duster 360          14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4
## Pontiac Firebird    19.2   8 400.0 175 3.08 3.845 17.05  0  0    3    2
## Chrysler Imperial   14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4
## Lincoln Continental 10.4   8 460.0 215 3.00 5.424 17.82  0  0    3    4
## Cadillac Fleetwood  10.4   8 472.0 205 2.93 5.250 17.98  0  0    3    4

Ejercicio 11

Crea una nueva columna que indique los kilogramos que pesa el coche, sabiendo que 1 libra = 0.45 kg. La variable wt indica el peso en libras.

  1. Asignamos una variables en la que guardaremos los datos de la columna que vamos a separamos, de datos.
wt<-mtcars[,7]
wt
  1. Asignamos otra variables donde guardaremos los datos modificados.
wtKg<-wt*0.45
wtKg
  1. Asignamos una última variable, donde agregamos la columna de datos modificada a las base de datos.
mtcars_mod<-cbind(mtcars,wt_Kg)
head(mtcars_mod)
head() —> Nos muestra los primeros casos del archivo

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 11

#Crea una nueva columna que indique los kilogramos que pesa el coche, sabiendo que 1 libra = 0.45 kg. La variable wt indica el peso en libras.

wt<-mtcars[,7]
wt
wtKg<-wt*0.45
wtKg
mtcars_mod<-cbind(mtcars,wtKg)
head(mtcars_mod)
RESULTADO FINAL
##  [1] 16.46 17.02 18.61 19.44 17.02 20.22 15.84 20.00 22.90 18.30 18.90 17.40
## [13] 17.60 18.00 17.98 17.82 17.42 19.47 18.52 19.90 20.01 16.87 17.30 15.41
## [25] 17.05 18.90 16.70 16.90 14.50 15.50 14.60 18.60
##  [1]  7.4070  7.6590  8.3745  8.7480  7.6590  9.0990  7.1280  9.0000 10.3050
## [10]  8.2350  8.5050  7.8300  7.9200  8.1000  8.0910  8.0190  7.8390  8.7615
## [19]  8.3340  8.9550  9.0045  7.5915  7.7850  6.9345  7.6725  8.5050  7.5150
## [28]  7.6050  6.5250  6.9750  6.5700  8.3700
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb   wtKg
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4 7.4070
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4 7.6590
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1 8.3745
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1 8.7480
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2 7.6590
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1 9.0990

Ejercicio 12

La función summarise() agrupa los valores en una tabla de acuerdo a la función que indiquemos. Calcula la media de disp usando la función summarise.

  1. Asignamos una variable y utilizamos la fuinción summarise para calcular un estadistico especifico.
med<-summarise(mtcars, mean(disp))

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 12

#La función summarise() agrupa los valores en una tabla de acuerdo a la función que indiquemos. Calcula la media de disp usando la función summarise.

med<-summarise(mtcars, mean(disp))
med
RESULTADO FINAL
##   mean(disp)
## 1   230.7219

Ejercicio 13

summarise(group_by(mtcars, cyl), max = max(disp)) Explica que resultado obtienes.

  1. Copiamos el codigo en la consola y lo corremos.

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 13

#Explica que resultado obtienes.

#BASE DE DATOS
head(mtcars)

#EJECUCIÓN
summarise(group_by(mtcars, cyl), max = max(disp))
RESULTADO FINAL
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
## # A tibble: 3 × 2
##     cyl   max
##   <dbl> <dbl>
## 1     4  147.
## 2     6  258 
## 3     8  472

Ejercicio 14

mtcars %>% select( mpg:disp )%>% head Explica que resultado obtienes.

  1. Copiamos el codigo en la consola y lo corremos.

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 14

#Explica que resultado obtienes.

#BASE DE DATOS
head(mtcars)

#EJECUCIÓN
mtcars %>%
  select( mpg:disp )%>%
  head
RESULTADO FINAL
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
##                    mpg cyl disp
## Mazda RX4         21.0   6  160
## Mazda RX4 Wag     21.0   6  160
## Datsun 710        22.8   4  108
## Hornet 4 Drive    21.4   6  258
## Hornet Sportabout 18.7   8  360
## Valiant           18.1   6  225
Al ejecutar el codigo, observamos que se seleccionan las columans desde la 1 a la 3.

Ejercicio 15

head(select(select(mtcars, contains(“a”)), -drat, -am)) Explica que resultado obtienes.

  1. Copiamos el codigo en la consola y lo corremos.

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 15

#Explica que resultado obtienes.

#BASE DE DATOS
head(mtcars)

#EJECUCIÓN
head(select(select(mtcars, contains("a")), -drat, -am))
RESULTADO FINAL
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
##                   gear carb
## Mazda RX4            4    4
## Mazda RX4 Wag        4    4
## Datsun 710           4    1
## Hornet 4 Drive       3    1
## Hornet Sportabout    3    2
## Valiant              3    1
Al ejecutar el codigo, observamos que se seleccionan las columans que contengan la letra "a" y de ellas elimina las columnas "drat" y "am".

Ejercicio 16

Utilizando pipes ejecuta el ejercicio 15.

  1. Utilizamos los mismo comandos que en el ejercicio 15.

Utilizamos al inicio %>% para señalar que esa sera la base de datos que usaremos en todo el comando.

mtcars%>% 
 select(contains("a"))%>%
 select(-drat,-am)%>%
 head

Cerramos con %>% todas las condiciones. Al final la funcion head no necesita parentecis o cerrar con %>%.


Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 16

#Utilizando pipes ejecuta el ejercicio 15.

#BASE DE DATOS
head(mtcars)

#EJECUCIÓN
mtcars%>% 
  select(contains("a"))%>%
  select(-drat,-am)%>%
  head
RESULTADO FINAL
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
##                   gear carb
## Mazda RX4            4    4
## Mazda RX4 Wag        4    4
## Datsun 710           4    1
## Hornet 4 Drive       3    1
## Hornet Sportabout    3    2
## Valiant              3    1

Ejercicio 17

mtcars_filtered = filter(mtcars, wt > 1.5),mtcars_grouped = group_by(mtcars_filtered, cyl),summarise(mtcars_grouped, mn = mean(mpg), sd = sd(mpg)), Explica que resultado obtienes.

  1. Copiamos el codigo en la consola y lo corremos.

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 17

#Explica que resultado obtienes.

#BASE DE DATOS
head(mtcars)

#EJECUCIÓN
mtcars_filtered = filter(mtcars, wt > 1.5)
mtcars_grouped = group_by(mtcars_filtered, cyl)
summarise(mtcars_grouped, mn = mean(mpg), sd = sd(mpg))
RESULTADO FINAL
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
## # A tibble: 3 × 3
##     cyl    mn    sd
##   <dbl> <dbl> <dbl>
## 1     4  26.7  4.51
## 2     6  19.7  1.45
## 3     8  15.1  2.56
Al ejecutar el codigo, observamos que:
CÓDIGO 1: Filtra los datos y toma todos los que cumplen con la condiciÓn de wt<1.5
CÓDIGO 2: Agrupo estos datos en funcion de la variable antes creada.
CÓDIGO 3: Agrupa los datos en funciÓn del cilindraje y calcula la media y la desviaciÓn estandar de esos grupos de datos.

Ejercicio 18

Utilizando pipes ejecuta el ejercicio 17.

  1. Utilizamos los mismo comandos que en el ejercicio 17.

Utilizamos al inicio %>% para señalar que esa sera la base de datos que usaremos en todo el comando.

mtcars%>%
 filter(wt>1.5)%>%
 group_by(cyl) %>%
 summarise(mn = mean(mpg), sd = sd(mpg)) %>%
 head

Cerramos con %>% todas las condiciones. Al final la función head no necesita parentecis o cerrar con %>%.


Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 18

#Utilizando pipes ejecuta el ejercicio 17.

#BASE DE DATOS
head(mtcars)

#EJECUCIÓN
mtcars%>%
  filter(wt>1.5)%>%
  group_by(cyl) %>%
  summarise(mn = mean(mpg), sd = sd(mpg)) %>%
  head
RESULTADO FINAL
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
## # A tibble: 3 × 3
##     cyl    mn    sd
##   <dbl> <dbl> <dbl>
## 1     4  26.7  4.51
## 2     6  19.7  1.45
## 3     8  15.1  2.56

Ejercicio 19

Es obligatorio utilizar las funciones del paquete dplyr y recomendable utilizar pipes %>% para los siguientes ejercicios.

  1. Cargamos la libreria
library(dplyr)

Ejercicio 20

Descarga el fichero de datos vuelos.csv situado en http://gauss.inf.um.es/datos/; en local o localiza la url donde se encuentra.

  1. Utilizamos la función read.csv para leer y descargar el archivo.
head(read.csv(file = "C:\\Users\\hp\\Downloads\\vuelos.csv",header = T,sep = ","))
head() —> Nos muestra los primeros casos del archivo

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 20

#Descarga el fichero de datos **vuelos.csv** situado en **http://gauss.inf.um.es/datos/**; en local o localiza la url donde se encuentra.

head(read.csv(file = "C:\\Users\\hp\\Downloads\\vuelos.csv",header = T,sep = ","))
RESULTADO FINAL
##         date hour minute  dep  arr dep_delay arr_delay carrier flight dest
## 1 2011-01-01   14      0 1400 1500         0       -10      AA    428  DFW
## 2 2011-01-02   14      1 1401 1501         1        -9      AA    428  DFW
## 3 2011-01-03   13     52 1352 1502        -8        -8      AA    428  DFW
## 4 2011-01-04   14      3 1403 1513         3         3      AA    428  DFW
## 5 2011-01-05   14      5 1405 1507         5        -3      AA    428  DFW
## 6 2011-01-06   13     59 1359 1503        -1        -7      AA    428  DFW
##    plane cancelled time dist
## 1 N576AA         0   40  224
## 2 N557AA         0   45  224
## 3 N541AA         0   48  224
## 4 N403AA         0   39  224
## 5 N492AA         0   44  224
## 6 N262AA         0   45  224

Ejercicio 21

Descarga el archivo y Guarda los datos en una variable llamada vuelos**.

  1. Asignamos una variable, vuelos, donde almacenaremos los datos del archivo descargado.
vuelos<-read.csv(file = "C:\\Users\\hp\\Downloads\\vuelos.csv",header = T,sep = ",")
head(vuelos)
head() —> Nos muestra los primeros casos del archivo

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 21

#Descarga el archivo y Guarda los datos en una variable llamada vuelos**.

vuelos<-read.csv(file = "C:\\Users\\hp\\Downloads\\vuelos.csv",header = T,sep = ",")
head(vuelos)
RESULTADO FINAL
##         date hour minute  dep  arr dep_delay arr_delay carrier flight dest
## 1 2011-01-01   14      0 1400 1500         0       -10      AA    428  DFW
## 2 2011-01-02   14      1 1401 1501         1        -9      AA    428  DFW
## 3 2011-01-03   13     52 1352 1502        -8        -8      AA    428  DFW
## 4 2011-01-04   14      3 1403 1513         3         3      AA    428  DFW
## 5 2011-01-05   14      5 1405 1507         5        -3      AA    428  DFW
## 6 2011-01-06   13     59 1359 1503        -1        -7      AA    428  DFW
##    plane cancelled time dist
## 1 N576AA         0   40  224
## 2 N557AA         0   45  224
## 3 N541AA         0   48  224
## 4 N403AA         0   39  224
## 5 N492AA         0   44  224
## 6 N262AA         0   45  224

Ejercicio 22

Selecciona los vuelos con destino SFO u OAK utilizando las funciones del paquete dplyr. ¿Con cuantos vuelos nos quedamos?

  1. Para esto utilizamos la funcion filter que junto a las otras funciones, nos selecciona los datos en base a las condiciones de los argumentos.
head() —> Nos muestra los primeros casos del archivo
filter() —> Nos permite filtrar los datoa en base a condiciones
head(filter(vuelos,(dest=="SFO"|dest=="OAK")))

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 22

#Selecciona los vuelos con destino SFO u OAK utilizando las funciones del paquete dplyr. ¿Con cuantos vuelos nos quedamos?

#BASE DE DATOS
head(vuelos)

#EJECUCIÓN
head(filter(vuelos,(dest=="SFO"|dest=="OAK")))
RESULTADO FINAL
##         date hour minute  dep  arr dep_delay arr_delay carrier flight dest
## 1 2011-01-01   14      0 1400 1500         0       -10      AA    428  DFW
## 2 2011-01-02   14      1 1401 1501         1        -9      AA    428  DFW
## 3 2011-01-03   13     52 1352 1502        -8        -8      AA    428  DFW
## 4 2011-01-04   14      3 1403 1513         3         3      AA    428  DFW
## 5 2011-01-05   14      5 1405 1507         5        -3      AA    428  DFW
## 6 2011-01-06   13     59 1359 1503        -1        -7      AA    428  DFW
##    plane cancelled time dist
## 1 N576AA         0   40  224
## 2 N557AA         0   45  224
## 3 N541AA         0   48  224
## 4 N403AA         0   39  224
## 5 N492AA         0   44  224
## 6 N262AA         0   45  224
##           date hour minute  dep  arr dep_delay arr_delay carrier flight dest
## 373 2011-01-31    8     51  851 1052         1       -27      CO    170  SFO
## 389 2011-01-31   11     29 1129 1351         4         1      CO    270  SFO
## 402 2011-01-31   14     32 1432 1656         7         5      CO    370  SFO
## 436 2011-01-31   17     48 1748 2001         3        -4      CO    570  SFO
## 467 2011-01-31   21     43 2143 2338        50        24      CO    770  SFO
## 468 2011-01-31    7     29  729 1002        -1         2      CO    771  SFO
##      plane cancelled time dist
## 373 N35407         0  225 1635
## 389 N37420         0  228 1635
## 402 N27213         0  229 1635
## 436 N75436         0  236 1635
## 467 N37281         0  224 1635
## 468 N26226         0  237 1635

Ejercicio 23

Selecciona los vuelos que se han retrasado más de una hora. ¿Cuál es el destino que más se retrasa en proporción al número de vuelos?

  1. Para esto utilizamos la función filter que junto a las otras funciones, nos selecciona los datos en base a las condiciones de los argumentos.

  2. Asignamos una variable donde almacenaremos los datos filtrados.

head() —> Nos muestra los primeros casos del archivo
filter() —> Nos permite filtrar los datoa en base a condiciones
head(vuelos)
retraso<-filter(vuelos,dep_delay>60)
  1. Utilizamos summary para obtener estadisticas y encontrar el máximo.
summary(retraso)
  1. Para esto utilizamos la función filter que junto a las otras funciones, nos selecciona los datos en base a las condiciones de los argumentos.

  2. Asignamos una nueva variable donde almacenaremos los nuevos datos filtrados.

maxretraso<-filter(retraso,dep_delay==780)
  1. Visualizamos la columna que requerimos.
head(select(maxretraso, dest))
head() —> Nos muestra los primeros casos del archivo
select() —> Nos permite seleccionar una parte de la base de datos de acuerdo a condicciones

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 23

#Selecciona los vuelos que se han retrasado más de una hora. ¿Cuál es el destino que más se retrasa en proporción al número de vuelos?

#BASE DE DATOS
head(vuelos)

#EJECUCIÓN
retraso<-filter(vuelos,dep_delay>60)

summary(retraso)

maxretraso<-filter(retraso,dep_delay==780)

head(select(maxretraso, dest))
RESULTADO FINAL
##         date hour minute  dep  arr dep_delay arr_delay carrier flight dest
## 1 2011-01-01   14      0 1400 1500         0       -10      AA    428  DFW
## 2 2011-01-02   14      1 1401 1501         1        -9      AA    428  DFW
## 3 2011-01-03   13     52 1352 1502        -8        -8      AA    428  DFW
## 4 2011-01-04   14      3 1403 1513         3         3      AA    428  DFW
## 5 2011-01-05   14      5 1405 1507         5        -3      AA    428  DFW
## 6 2011-01-06   13     59 1359 1503        -1        -7      AA    428  DFW
##    plane cancelled time dist
## 1 N576AA         0   40  224
## 2 N557AA         0   45  224
## 3 N541AA         0   48  224
## 4 N403AA         0   39  224
## 5 N492AA         0   44  224
## 6 N262AA         0   45  224
##      date                hour           minute           dep      
##  Length:3227        Min.   : 0.00   Min.   : 0.00   Min.   :   4  
##  Class :character   1st Qu.:14.00   1st Qu.:14.00   1st Qu.:1416  
##  Mode  :character   Median :17.00   Median :30.00   Median :1746  
##                     Mean   :16.55   Mean   :29.48   Mean   :1684  
##                     3rd Qu.:20.00   3rd Qu.:44.00   3rd Qu.:2028  
##                     Max.   :23.00   Max.   :59.00   Max.   :2357  
##                                                                   
##       arr         dep_delay       arr_delay       carrier         
##  Min.   :   1   Min.   : 61.0   Min.   : 26.0   Length:3227       
##  1st Qu.:1434   1st Qu.: 73.0   1st Qu.: 70.0   Class :character  
##  Median :1842   Median : 93.0   Median : 92.0   Mode  :character  
##  Mean   :1657   Mean   :109.3   Mean   :107.4                     
##  3rd Qu.:2135   3rd Qu.:128.0   3rd Qu.:128.0                     
##  Max.   :2400   Max.   :780.0   Max.   :775.0                     
##  NA's   :17                     NA's   :29                        
##      flight         dest              plane             cancelled       
##  Min.   :   1   Length:3227        Length:3227        Min.   :0.000000  
##  1st Qu.: 587   Class :character   Class :character   1st Qu.:0.000000  
##  Median :1711   Mode  :character   Mode  :character   Median :0.000000  
##  Mean   :1826                                         Mean   :0.002479  
##  3rd Qu.:2705                                         3rd Qu.:0.000000  
##  Max.   :7037                                         Max.   :1.000000  
##                                                                         
##       time             dist       
##  Min.   : 25.00   Min.   : 127.0  
##  1st Qu.: 59.25   1st Qu.: 395.0  
##  Median :103.50   Median : 788.0  
##  Mean   :108.62   Mean   : 794.7  
##  3rd Qu.:139.00   3rd Qu.:1042.0  
##  Max.   :502.00   Max.   :3904.0  
##  NA's   :29
##      dest
## 2503  DEN

Ejercicio 24

Encuentra 4 maneras diferentes de utilizar la función select para seleccionar las variables relacionadas con los retrasos (delay).

head(select(vuelos, dep_delay))

head(select(vuelos, dep_delay, arr_delay))

head(select(vuelos, contains("delay")))

vuelos %>%
 select(dep_delay) %>%
 head
head() —> Nos muestra los primeros casos del archivo
select() —> Nos permite seleccionar una parte de la base de datos de acuerdo a condicciones

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 24

#Encuentra 4 maneras diferentes de utilizar la función select para seleccionar las variables relacionadas con los retrasos (delay).

#BASE DE DATOS
head(vuelos)

#EJECUCIÓN
head(select(vuelos, dep_delay))

head(select(vuelos, dep_delay, arr_delay))

head(select(vuelos, contains("delay")))

vuelos %>%
  select(dep_delay) %>%
  head
RESULTADO FINAL
##         date hour minute  dep  arr dep_delay arr_delay carrier flight dest
## 1 2011-01-01   14      0 1400 1500         0       -10      AA    428  DFW
## 2 2011-01-02   14      1 1401 1501         1        -9      AA    428  DFW
## 3 2011-01-03   13     52 1352 1502        -8        -8      AA    428  DFW
## 4 2011-01-04   14      3 1403 1513         3         3      AA    428  DFW
## 5 2011-01-05   14      5 1405 1507         5        -3      AA    428  DFW
## 6 2011-01-06   13     59 1359 1503        -1        -7      AA    428  DFW
##    plane cancelled time dist
## 1 N576AA         0   40  224
## 2 N557AA         0   45  224
## 3 N541AA         0   48  224
## 4 N403AA         0   39  224
## 5 N492AA         0   44  224
## 6 N262AA         0   45  224
##   dep_delay
## 1         0
## 2         1
## 3        -8
## 4         3
## 5         5
## 6        -1
##   dep_delay arr_delay
## 1         0       -10
## 2         1        -9
## 3        -8        -8
## 4         3         3
## 5         5        -3
## 6        -1        -7
##   dep_delay arr_delay
## 1         0       -10
## 2         1        -9
## 3        -8        -8
## 4         3         3
## 5         5        -3
## 6        -1        -7
##   dep_delay
## 1         0
## 2         1
## 3        -8
## 4         3
## 5         5
## 6        -1

Ejercicio 25

Agrupa los vuelos por fecha y calcula: media, mediana y cuartil 75 de los retrasos en los vuelos por hora.

  1. Asignamos una variable para almacenar los datos agrupados.
agrupados<-group_by(vuelos, date)
  1. Instalamos y llamamos a la libreria “tidyr”.
install.packages("tidyr")
library(tidyr)
  1. Realizamos un summarise con la nueva variable para obtener la media y la mediana,
summarise(agrupados, mean(hour, na.rm = T), median(hour, na.rm = T)
  1. Utilizamos la funcion quantile vara visualisar el cuartil 75.
quantile(agrupados$hour,0.75,na.rm = T))

Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 25

#Agrupa los vuelos por fecha y calcula: media, mediana y cuartil 75 de los retrasos en los vuelos por hora.

#BASE DE DATOS
head(vuelos)

#EJECUCIÓN
agrupados<-group_by(vuelos, date)
agrupados

install.packages("tidyr")
library(tidyr)

summarise(agrupados, mean(hour, na.rm = T), median(hour, na.rm = T), quantile(agrupados$hour,0.75,na.rm = T))
RESULTADO FINAL
##         date hour minute  dep  arr dep_delay arr_delay carrier flight dest
## 1 2011-01-01   14      0 1400 1500         0       -10      AA    428  DFW
## 2 2011-01-02   14      1 1401 1501         1        -9      AA    428  DFW
## 3 2011-01-03   13     52 1352 1502        -8        -8      AA    428  DFW
## 4 2011-01-04   14      3 1403 1513         3         3      AA    428  DFW
## 5 2011-01-05   14      5 1405 1507         5        -3      AA    428  DFW
## 6 2011-01-06   13     59 1359 1503        -1        -7      AA    428  DFW
##    plane cancelled time dist
## 1 N576AA         0   40  224
## 2 N557AA         0   45  224
## 3 N541AA         0   48  224
## 4 N403AA         0   39  224
## 5 N492AA         0   44  224
## 6 N262AA         0   45  224
## # A tibble: 74,101 × 14
## # Groups:   date [120]
##    date       hour minute   dep   arr dep_d…¹ arr_d…² carrier flight dest  plane
##    <chr>     <int>  <int> <int> <int>   <int>   <int> <chr>    <int> <chr> <chr>
##  1 2011-01-…    14      0  1400  1500       0     -10 AA         428 DFW   N576…
##  2 2011-01-…    14      1  1401  1501       1      -9 AA         428 DFW   N557…
##  3 2011-01-…    13     52  1352  1502      -8      -8 AA         428 DFW   N541…
##  4 2011-01-…    14      3  1403  1513       3       3 AA         428 DFW   N403…
##  5 2011-01-…    14      5  1405  1507       5      -3 AA         428 DFW   N492…
##  6 2011-01-…    13     59  1359  1503      -1      -7 AA         428 DFW   N262…
##  7 2011-01-…    13     59  1359  1509      -1      -1 AA         428 DFW   N493…
##  8 2011-01-…    13     55  1355  1454      -5     -16 AA         428 DFW   N477…
##  9 2011-01-…    14     43  1443  1554      43      44 AA         428 DFW   N476…
## 10 2011-01-…    14     43  1443  1553      43      43 AA         428 DFW   N504…
## # … with 74,091 more rows, 3 more variables: cancelled <int>, time <int>,
## #   dist <int>, and abbreviated variable names ¹​dep_delay, ²​arr_delay
## # ℹ Use `print(n = ...)` to see more rows, and `colnames()` to see all variable names
## Warning: package 'tidyr' is in use and will not be installed
## # A tibble: 120 × 4
##    date       `mean(hour, na.rm = T)` `median(hour, na.rm = T)` quantile(agrup…¹
##    <chr>                        <dbl>                     <dbl>            <dbl>
##  1 2011-01-01                    13.9                        14               18
##  2 2011-01-02                    14.0                        14               18
##  3 2011-01-03                    13.7                        13               18
##  4 2011-01-04                    13.8                        14               18
##  5 2011-01-05                    13.8                        14               18
##  6 2011-01-06                    13.5                        13               18
##  7 2011-01-07                    13.5                        13               18
##  8 2011-01-08                    13.3                        13               18
##  9 2011-01-09                    14.3                        14               18
## 10 2011-01-10                    13.6                        14               18
## # … with 110 more rows, and abbreviated variable name
## #   ¹​`quantile(agrupados$hour, 0.75, na.rm = T)`
## # ℹ Use `print(n = ...)` to see more rows

Ejercicio 26

Utilizando pipes calcula la media de retraso en los vuelos por día y hora, la cantidad de vuelos por día y hora y luego muestra solo los casos para los cuales haya más de 10.


Ejecución del código en R

SINTAXIS COMPLETA
##EJERCICIO 26

#Utilizando pipes calcula la media de retraso en los vuelos por día y hora, la cantidad de vuelos por día y hora y luego muestra solo los casos para los cuales haya más de 10.

vuelos%>%
  select(dep_delay, date, hour, fligth)%>%
  filter(flight>10)%>%
  group_by(date)%>%
  summarise(medr=mean(dep_delay, na.rm=T)),vuelosxd=n_distinct(flight)
COLABORADOR: Phd.Francisco Valverde Alulema.