UNIVERSIDAD CENTRAL DEL ECUADOR

FACULTAD CIENCIAS ECONÓMICAS

CARRERA DE ESTADÍSTICA

 

INTEGRANTES:

TALLER-APE 10: TIDYVERSE

-Utilizando la base de datos interna mtcars, resolver los siguientes enunciados: -Descargamos el paquete dpyrs para su libreria y visulizamos la DataFrame mtcars

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
head(mtcars)
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1

EJERCICIO 1: Seleccionamos las 3 primeras columnas del dataset mtcars y mostramos la cabecera

mtcars1<-select(mtcars,  1:3)
mtcars1
##                      mpg cyl  disp
## Mazda RX4           21.0   6 160.0
## Mazda RX4 Wag       21.0   6 160.0
## Datsun 710          22.8   4 108.0
## Hornet 4 Drive      21.4   6 258.0
## Hornet Sportabout   18.7   8 360.0
## Valiant             18.1   6 225.0
## Duster 360          14.3   8 360.0
## Merc 240D           24.4   4 146.7
## Merc 230            22.8   4 140.8
## Merc 280            19.2   6 167.6
## Merc 280C           17.8   6 167.6
## Merc 450SE          16.4   8 275.8
## Merc 450SL          17.3   8 275.8
## Merc 450SLC         15.2   8 275.8
## Cadillac Fleetwood  10.4   8 472.0
## Lincoln Continental 10.4   8 460.0
## Chrysler Imperial   14.7   8 440.0
## Fiat 128            32.4   4  78.7
## Honda Civic         30.4   4  75.7
## Toyota Corolla      33.9   4  71.1
## Toyota Corona       21.5   4 120.1
## Dodge Challenger    15.5   8 318.0
## AMC Javelin         15.2   8 304.0
## Camaro Z28          13.3   8 350.0
## Pontiac Firebird    19.2   8 400.0
## Fiat X1-9           27.3   4  79.0
## Porsche 914-2       26.0   4 120.3
## Lotus Europa        30.4   4  95.1
## Ford Pantera L      15.8   8 351.0
## Ferrari Dino        19.7   6 145.0
## Maserati Bora       15.0   8 301.0
## Volvo 142E          21.4   4 121.0

EJERCICIO 2: Utiliza la ayuda ?select_helpers para que observes el resultado

?select_helpers
## Help on topic 'select_helpers' was found in the following packages:
## 
##   Package               Library
##   dplyr                 /Library/Frameworks/R.framework/Versions/4.3-x86_64/Resources/library
##   tidyselect            /Library/Frameworks/R.framework/Versions/4.3-x86_64/Resources/library
## 
## 
## Using the first match ...

EJERCICIO 3: Seleccionar las columnas que empiezan por d

head(select(mtcars,starts_with("d")))
##                   disp drat
## Mazda RX4          160 3.90
## Mazda RX4 Wag      160 3.90
## Datsun 710         108 3.85
## Hornet 4 Drive     258 3.08
## Hornet Sportabout  360 3.15
## Valiant            225 2.76

EJERCICIO 4: Seleccionar las columnas que terminan por p

head(select(mtcars, ends_with("p")))
##                   disp  hp
## Mazda RX4          160 110
## Mazda RX4 Wag      160 110
## Datsun 710         108  93
## Hornet 4 Drive     258 110
## Hornet Sportabout  360 175
## Valiant            225 105

EJERCICIO 5: head(select( mtcars, -drat, -am )) Explica queresultado obtienes? -Ejecutamos el código

head(select(mtcars, -drat, -am))
##                    mpg cyl disp  hp    wt  qsec vs gear carb
## Mazda RX4         21.0   6  160 110 2.620 16.46  0    4    4
## Mazda RX4 Wag     21.0   6  160 110 2.875 17.02  0    4    4
## Datsun 710        22.8   4  108  93 2.320 18.61  1    4    1
## Hornet 4 Drive    21.4   6  258 110 3.215 19.44  1    3    1
## Hornet Sportabout 18.7   8  360 175 3.440 17.02  0    3    2
## Valiant           18.1   6  225 105 3.460 20.22  1    3    1

Explicación: Esta función descarta las columnas -drat y -am por el signo (-)

EJERCICIO 6: head(select( mtcars, contains( “a” ) )) Explica que resultado obtienes ? -Ejecutamos el código

head(select( mtcars, contains( "a" ) ))
##                   drat am gear carb
## Mazda RX4         3.90  1    4    4
## Mazda RX4 Wag     3.90  1    4    4
## Datsun 710        3.85  1    4    1
## Hornet 4 Drive    3.08  0    3    1
## Hornet Sportabout 3.15  0    3    2
## Valiant           2.76  0    3    1

Explicación: La función contains,nos muestra las columnas que en su nombre contengan una letra “a”

EJERCICIO 7: head(filter( mtcars, mpg > 20, gear == 4)) Explica que resultado obtienes ?

-Ejecutamos el código

head(filter( mtcars, mpg > 20, gear == 4))
##                mpg cyl  disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4     21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag 21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710    22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
## Merc 240D     24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
## Merc 230      22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
## Fiat 128      32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1

Explicación: Muestra las columnas de mtcars que cumplan las dos condiciones que MPG mayores a 20 y Gear igual a 4 o

EJERCICIO 8: Seleccionar los sujetos con tipo de transmisión (am) 1 que, además, tienen 6 cilindros o menos

filter(mtcars, am == 1 & cyl <= 6)
##                 mpg cyl  disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4      21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag  21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710     22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
## Fiat 128       32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
## Honda Civic    30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
## Toyota Corolla 33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1
## Fiat X1-9      27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
## Porsche 914-2  26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2
## Lotus Europa   30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
## Ferrari Dino   19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
## Volvo 142E     21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2

EJERCICIO 9: Seleccionar los sujetos que bien consumen menos de 21 mpg o bien tienen menos de 3 carburantes (carb) y menos de 4 engranajes (gear)

filter(mtcars, mpg < 21 | carb < 3 & gear < 4)
##                      mpg cyl  disp  hp drat    wt  qsec vs am gear carb
## Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
## Valiant             18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1
## Duster 360          14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4
## Merc 280            19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
## Merc 280C           17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4
## Merc 450SE          16.4   8 275.8 180 3.07 4.070 17.40  0  0    3    3
## Merc 450SL          17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3
## Merc 450SLC         15.2   8 275.8 180 3.07 3.780 18.00  0  0    3    3
## Cadillac Fleetwood  10.4   8 472.0 205 2.93 5.250 17.98  0  0    3    4
## Lincoln Continental 10.4   8 460.0 215 3.00 5.424 17.82  0  0    3    4
## Chrysler Imperial   14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4
## Toyota Corona       21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1
## Dodge Challenger    15.5   8 318.0 150 2.76 3.520 16.87  0  0    3    2
## AMC Javelin         15.2   8 304.0 150 3.15 3.435 17.30  0  0    3    2
## Camaro Z28          13.3   8 350.0 245 3.73 3.840 15.41  0  0    3    4
## Pontiac Firebird    19.2   8 400.0 175 3.08 3.845 17.05  0  0    3    2
## Ford Pantera L      15.8   8 351.0 264 4.22 3.170 14.50  0  1    5    4
## Ferrari Dino        19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
## Maserati Bora       15.0   8 301.0 335 3.54 3.570 14.60  0  1    5    8

EJERCICIO 10: Ordena por cilindrada (cyl) y por desplazamiento (disp)

arrange(mtcars, cyl, disp)
##                      mpg cyl  disp  hp drat    wt  qsec vs am gear carb
## Toyota Corolla      33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1
## Honda Civic         30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
## Fiat 128            32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
## Fiat X1-9           27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
## Lotus Europa        30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
## Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
## Toyota Corona       21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1
## Porsche 914-2       26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2
## Volvo 142E          21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2
## Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
## Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
## Ferrari Dino        19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
## Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
## Merc 280            19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
## Merc 280C           17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4
## Valiant             18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1
## Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
## Merc 450SE          16.4   8 275.8 180 3.07 4.070 17.40  0  0    3    3
## Merc 450SL          17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3
## Merc 450SLC         15.2   8 275.8 180 3.07 3.780 18.00  0  0    3    3
## Maserati Bora       15.0   8 301.0 335 3.54 3.570 14.60  0  1    5    8
## AMC Javelin         15.2   8 304.0 150 3.15 3.435 17.30  0  0    3    2
## Dodge Challenger    15.5   8 318.0 150 2.76 3.520 16.87  0  0    3    2
## Camaro Z28          13.3   8 350.0 245 3.73 3.840 15.41  0  0    3    4
## Ford Pantera L      15.8   8 351.0 264 4.22 3.170 14.50  0  1    5    4
## Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
## Duster 360          14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4
## Pontiac Firebird    19.2   8 400.0 175 3.08 3.845 17.05  0  0    3    2
## Chrysler Imperial   14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4
## Lincoln Continental 10.4   8 460.0 215 3.00 5.424 17.82  0  0    3    4
## Cadillac Fleetwood  10.4   8 472.0 205 2.93 5.250 17.98  0  0    3    4

EJERCICIO 11: Crea una nueva columna que indique los kilogramos que pesa el coche, sabiendo que 1 libra = 0.45 kg. La variable wt indica el peso en libras.

mtcars$kilogramos<-mtcars$wt*0.45
mtcars
##                      mpg cyl  disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
## Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
## Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
## Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
## Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
## Valiant             18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1
## Duster 360          14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4
## Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
## Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
## Merc 280            19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
## Merc 280C           17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4
## Merc 450SE          16.4   8 275.8 180 3.07 4.070 17.40  0  0    3    3
## Merc 450SL          17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3
## Merc 450SLC         15.2   8 275.8 180 3.07 3.780 18.00  0  0    3    3
## Cadillac Fleetwood  10.4   8 472.0 205 2.93 5.250 17.98  0  0    3    4
## Lincoln Continental 10.4   8 460.0 215 3.00 5.424 17.82  0  0    3    4
## Chrysler Imperial   14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4
## Fiat 128            32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
## Honda Civic         30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
## Toyota Corolla      33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1
## Toyota Corona       21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1
## Dodge Challenger    15.5   8 318.0 150 2.76 3.520 16.87  0  0    3    2
## AMC Javelin         15.2   8 304.0 150 3.15 3.435 17.30  0  0    3    2
## Camaro Z28          13.3   8 350.0 245 3.73 3.840 15.41  0  0    3    4
## Pontiac Firebird    19.2   8 400.0 175 3.08 3.845 17.05  0  0    3    2
## Fiat X1-9           27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
## Porsche 914-2       26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2
## Lotus Europa        30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
## Ford Pantera L      15.8   8 351.0 264 4.22 3.170 14.50  0  1    5    4
## Ferrari Dino        19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
## Maserati Bora       15.0   8 301.0 335 3.54 3.570 14.60  0  1    5    8
## Volvo 142E          21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2
##                     kilogramos
## Mazda RX4              1.17900
## Mazda RX4 Wag          1.29375
## Datsun 710             1.04400
## Hornet 4 Drive         1.44675
## Hornet Sportabout      1.54800
## Valiant                1.55700
## Duster 360             1.60650
## Merc 240D              1.43550
## Merc 230               1.41750
## Merc 280               1.54800
## Merc 280C              1.54800
## Merc 450SE             1.83150
## Merc 450SL             1.67850
## Merc 450SLC            1.70100
## Cadillac Fleetwood     2.36250
## Lincoln Continental    2.44080
## Chrysler Imperial      2.40525
## Fiat 128               0.99000
## Honda Civic            0.72675
## Toyota Corolla         0.82575
## Toyota Corona          1.10925
## Dodge Challenger       1.58400
## AMC Javelin            1.54575
## Camaro Z28             1.72800
## Pontiac Firebird       1.73025
## Fiat X1-9              0.87075
## Porsche 914-2          0.96300
## Lotus Europa           0.68085
## Ford Pantera L         1.42650
## Ferrari Dino           1.24650
## Maserati Bora          1.60650
## Volvo 142E             1.25100

EJERCICIO 12: La función summarise() agrupa los valores en una tabla de acuerdo a la función que indiquemos. Calcula la media de disp usando la función summarise:

grupo_disp <- group_by(mtcars, disp)
grupo_disp
## # A tibble: 32 × 12
## # Groups:   disp [27]
##      mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb kilogramos
##    <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>      <dbl>
##  1  21       6  160    110  3.9   2.62  16.5     0     1     4     4       1.18
##  2  21       6  160    110  3.9   2.88  17.0     0     1     4     4       1.29
##  3  22.8     4  108     93  3.85  2.32  18.6     1     1     4     1       1.04
##  4  21.4     6  258    110  3.08  3.22  19.4     1     0     3     1       1.45
##  5  18.7     8  360    175  3.15  3.44  17.0     0     0     3     2       1.55
##  6  18.1     6  225    105  2.76  3.46  20.2     1     0     3     1       1.56
##  7  14.3     8  360    245  3.21  3.57  15.8     0     0     3     4       1.61
##  8  24.4     4  147.    62  3.69  3.19  20       1     0     4     2       1.44
##  9  22.8     4  141.    95  3.92  3.15  22.9     1     0     4     2       1.42
## 10  19.2     6  168.   123  3.92  3.44  18.3     1     0     4     4       1.55
## # ℹ 22 more rows

EJERCICIO 13: summarise(group_by(mtcars, cyl), max = max(disp)) Explica que resultado obtienes ? -Ejecutamos el código

 summarise(group_by(mtcars, cyl), max = max(disp)) 
## # A tibble: 3 × 2
##     cyl   max
##   <dbl> <dbl>
## 1     4  147.
## 2     6  258 
## 3     8  472

Explicación: Agrupa los datos del cilindraje y nos muestra el valor máximo de esos datos.

EJERCICIO 14: mtcars %>% select( mpg:disp )%>% head. Explica queresultado obtienes ? -Ejecutamos el código

mtcars %>% select( mpg:disp )%>%  head 
##                    mpg cyl disp
## Mazda RX4         21.0   6  160
## Mazda RX4 Wag     21.0   6  160
## Datsun 710        22.8   4  108
## Hornet 4 Drive    21.4   6  258
## Hornet Sportabout 18.7   8  360
## Valiant           18.1   6  225

Explicación: Selecciona las columnas desde mpg hasta disP y nos indicalos 6 primeros valores

EJERCICIO 15: head(select(select(mtcars, contains(“a”)), -drat, -am)) Explica que resultado obtienes ?

head(select(select(mtcars, contains("a")), -drat, -am))
##                   gear carb kilogramos
## Mazda RX4            4    4    1.17900
## Mazda RX4 Wag        4    4    1.29375
## Datsun 710           4    1    1.04400
## Hornet 4 Drive       3    1    1.44675
## Hornet Sportabout    3    2    1.54800
## Valiant              3    1    1.55700

*Explicación:**Nos muestra las columnas que contengan una letra a en su encabezado y descartia drat y am.*

EJERCICIO 16: Utilizando pipes ejecuta el ejercicio 15

 mtcars %>%
     select((contains("a")), -drat, -am)
##                     gear carb kilogramos
## Mazda RX4              4    4    1.17900
## Mazda RX4 Wag          4    4    1.29375
## Datsun 710             4    1    1.04400
## Hornet 4 Drive         3    1    1.44675
## Hornet Sportabout      3    2    1.54800
## Valiant                3    1    1.55700
## Duster 360             3    4    1.60650
## Merc 240D              4    2    1.43550
## Merc 230               4    2    1.41750
## Merc 280               4    4    1.54800
## Merc 280C              4    4    1.54800
## Merc 450SE             3    3    1.83150
## Merc 450SL             3    3    1.67850
## Merc 450SLC            3    3    1.70100
## Cadillac Fleetwood     3    4    2.36250
## Lincoln Continental    3    4    2.44080
## Chrysler Imperial      3    4    2.40525
## Fiat 128               4    1    0.99000
## Honda Civic            4    2    0.72675
## Toyota Corolla         4    1    0.82575
## Toyota Corona          3    1    1.10925
## Dodge Challenger       3    2    1.58400
## AMC Javelin            3    2    1.54575
## Camaro Z28             3    4    1.72800
## Pontiac Firebird       3    2    1.73025
## Fiat X1-9              4    1    0.87075
## Porsche 914-2          5    2    0.96300
## Lotus Europa           5    2    0.68085
## Ford Pantera L         5    4    1.42650
## Ferrari Dino           5    6    1.24650
## Maserati Bora          5    8    1.60650
## Volvo 142E             4    2    1.25100

EJERCICIO 17: mtcars_filtered = filter(mtcars, wt > 1.5) mtcars_grouped = group_by(mtcars_filtered, cyl) summarise(mtcars_grouped, mn = mean(mpg), sd = sd(mpg)) Explica que resultado obtienes ?

-Ejecutamos el código

mtcars_filtered = filter(mtcars, wt > 1.5)
mtcars_grouped = group_by(mtcars_filtered, cyl)
summarise(mtcars_grouped, mn = mean(mpg), sd = sd(mpg))
## # A tibble: 3 × 3
##     cyl    mn    sd
##   <dbl> <dbl> <dbl>
## 1     4  26.7  4.51
## 2     6  19.7  1.45
## 3     8  15.1  2.56

Explicación: Se obtiene la media y la desviación estándar de la columna mpg,agrupadas según su cilindraje y cuando su wt sea mayor a1.5.

EJERCICIO 18: Utilizando pipes ejecuta el ejercicio 17

   mtcars%>%
     filter(wt>1.5)%>%
     group_by(cyl)%>%
     summarise(mn=mean(mpg),sd=sd(mpg))
## # A tibble: 3 × 3
##     cyl    mn    sd
##   <dbl> <dbl> <dbl>
## 1     4  26.7  4.51
## 2     6  19.7  1.45
## 3     8  15.1  2.56

EJERCICIO 19: Es obligatorio utilizar las funciones del paquete dplyry recomendable utilizar pipes %>% para los siguientes ejercicios

library(dplyr)

EJERCICIO 20: Descarga el fichero de datos vuelos.csv situado en http://gauss.inf.um.es/datos/; en local o localiza la url donde seencuentra.

url <- "http://gauss.inf.um.es/datos/vuelos.csv"
url
## [1] "http://gauss.inf.um.es/datos/vuelos.csv"

EJERCICIO 21: Descarga el archivo y Guarda los datos en una variable llamada “vuelos”

vuelos <- read.csv("vuelos.csv")

head(vuelos)
##         date hour minute  dep  arr dep_delay arr_delay carrier flight dest
## 1 2011-01-01   14      0 1400 1500         0       -10      AA    428  DFW
## 2 2011-01-02   14      1 1401 1501         1        -9      AA    428  DFW
## 3 2011-01-03   13     52 1352 1502        -8        -8      AA    428  DFW
## 4 2011-01-04   14      3 1403 1513         3         3      AA    428  DFW
## 5 2011-01-05   14      5 1405 1507         5        -3      AA    428  DFW
## 6 2011-01-06   13     59 1359 1503        -1        -7      AA    428  DFW
##    plane cancelled time dist
## 1 N576AA         0   40  224
## 2 N557AA         0   45  224
## 3 N541AA         0   48  224
## 4 N403AA         0   39  224
## 5 N492AA         0   44  224
## 6 N262AA         0   45  224

EJERCICIO 22: Selecciona los vuelos con destino SFO u OAK utilizando las funciones del paquete dplyr

destino <- filter(vuelos, dest== "SFO" | dest=="OAK")
head(destino)
##           date hour minute  dep  arr dep_delay arr_delay carrier flight dest
## 373 2011-01-31    8     51  851 1052         1       -27      CO    170  SFO
## 389 2011-01-31   11     29 1129 1351         4         1      CO    270  SFO
## 402 2011-01-31   14     32 1432 1656         7         5      CO    370  SFO
## 436 2011-01-31   17     48 1748 2001         3        -4      CO    570  SFO
## 467 2011-01-31   21     43 2143 2338        50        24      CO    770  SFO
## 468 2011-01-31    7     29  729 1002        -1         2      CO    771  SFO
##      plane cancelled time dist
## 373 N35407         0  225 1635
## 389 N37420         0  228 1635
## 402 N27213         0  229 1635
## 436 N75436         0  236 1635
## 467 N37281         0  224 1635
## 468 N26226         0  237 1635
nrow (destino)
## [1] 512

EJERCICIO 23: Selecciona los vuelos que se han retrasado más de una hora. ¿Cuál es el destino que más se retrasa en proporción al número de vuelos?

vuelos  %>%
select(arr_delay,dest) %>%
filter(arr_delay>60 ) %>% head
##     arr_delay dest
## 17         84  DFW
## 20         72  DFW
## 74         69  DFW
## 97        126  DFW
## 99         70  DFW
## 129        80  MIA

EJERCICIO 24: Encuentra 4 maneras diferentes de utilizar la función select para seleccionar las variables relacionadas con los retrasos (delay)

retrasos <- select(vuelos, dep_delay, arr_delay)
head(retrasos)
##   dep_delay arr_delay
## 1         0       -10
## 2         1        -9
## 3        -8        -8
## 4         3         3
## 5         5        -3
## 6        -1        -7
head( select(vuelos, matches(".d.")))
##   dep_delay arr_delay
## 1         0       -10
## 2         1        -9
## 3        -8        -8
## 4         3         3
## 5         5        -3
## 6        -1        -7
retrasos2 <- select(vuelos, 6:7)
head(retrasos2)
##   dep_delay arr_delay
## 1         0       -10
## 2         1        -9
## 3        -8        -8
## 4         3         3
## 5         5        -3
## 6        -1        -7
head(select(vuelos,-c(date,hour,minute,arr,carrier,flight,dest,plane,cancelled,time,dist)))
##    dep dep_delay arr_delay
## 1 1400         0       -10
## 2 1401         1        -9
## 3 1352        -8        -8
## 4 1403         3         3
## 5 1405         5        -3
## 6 1359        -1        -7

EJERCICIO 25: Agrupa los vuelos por fecha y calcula: media, mediana y cuartil 75 de los retrasos en los vuelos por hora

vuelos %>% filter(arr_delay > 60)%>% 
  group_by(date) %>%
  summarise(mn = mean(arr_delay), md = median(arr_delay), qu75=quantile(arr_delay)) %>%  head
## Warning: Returning more (or less) than 1 row per `summarise()` group was deprecated in
## dplyr 1.1.0.
## ℹ Please use `reframe()` instead.
## ℹ When switching from `summarise()` to `reframe()`, remember that `reframe()`
##   always returns an ungrouped data frame and adjust accordingly.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## `summarise()` has grouped output by 'date'. You can override using the
## `.groups` argument.
## # A tibble: 6 × 4
## # Groups:   date [2]
##   date          mn    md  qu75
##   <chr>      <dbl> <dbl> <dbl>
## 1 2011-01-01  83.5    71    61
## 2 2011-01-01  83.5    71    64
## 3 2011-01-01  83.5    71    71
## 4 2011-01-01  83.5    71   107
## 5 2011-01-01  83.5    71   137
## 6 2011-01-02 114.    101    62

EJERCICIO 26: Utilizando pipes calcula la media de retraso en los vuelos por día y hora, la cantidad de vuelos por día y hora y luego muestra solo los casos para los cuales haya más de 10

vuelos %>% select(arr_delay,date,hour,flight)%>% 
  filter(flight > 10) %>% 
  group_by(date) %>%
  summarise(mn = mean(arr_delay, na.rm=T), 
            cantidad = n_distinct(flight)) %>% head
## # A tibble: 6 × 3
##   date          mn cantidad
##   <chr>      <dbl>    <int>
## 1 2011-01-01  9.97      531
## 2 2011-01-02 10.5       649
## 3 2011-01-03  6.18      668
## 4 2011-01-04  8.07      554
## 5 2011-01-05  4.23      561
## 6 2011-01-06  6.17      629

EJERCICIO 27: Importar la base de datos realizada en MYSQL a R (Consultarlo como hacerlo)*

-Instalar y cargar los paquetes

#install.packages("DBI")
#install.packages("RMySQL")
#library(DBI)
#library(RMySQL)

-Reemplaza los valores con tus propias credenciales y detalles de conexión

-con <- dbConnect(RMySQL::MySQL(), - user = “tu_usuario”, - password = “tu_contraseña”, - dbname = “tu_base_de_datos”, - host = “tu_host”) - Reemplaza “nombre_de_tabla” con el nombre de la tabla que deseas importar - datos <- dbReadTable(con, “nombre_de_tabla”) - Cerrar la conexión cuando hayas terminado - dbDisconnect(con)