EJERCICIOS DE EXPORTACIÓN E IMPORTACIÓN DE ARCHIVOS EN R

En el presente informe se hará uso de la importación de archivos desde el ordenador hasta de internet.

Ejercicio 1

Lee el fichero paro.csv (ARCHIVO ADJUNTO) usando la función read.table. Comprueba que está correctamente importado usando head, tail, nrow, summary, etc. Para leer la tabla necesitarás leer con cierto detenimiento ?read.table.

Paso 1: Usamos la funcion read.table y ponemos el nombre del archivo a utilizar.

datos <- read.table("C:\\Users\\hp\\documents\\paro.csv",sep = "\t", header = TRUE)
datos

Paso 2: Para comprobar si la tabla esta correctamente importado, usaremos las funciones a continuación.

datos <- read.table("C:\\Users\\USUARIO\\Downloads\\paro.csv",sep = "\t", header = TRUE)
head(datos)
##    Gender           Provinces Periodo Situation value
## 1   Males         02 Albacete  2014Q4    active 103.9
## 2 Females         02 Albacete  2014Q4    active  83.5
## 3   Males 03 Alicante/Alacant  2014Q4    active 490.5
## 4 Females 03 Alicante/Alacant  2014Q4    active 398.7
## 5   Males          04 Almería  2014Q4    active 198.5
## 6 Females          04 Almería  2014Q4    active 155.8
tail(datos)
##       Gender   Provinces Periodo Situation value
## 8315   Males 50 Zaragoza  2011Q1  inactive 134.3
## 8316 Females 50 Zaragoza  2011Q1  inactive 199.4
## 8317   Males    51 Ceuta  2011Q1  inactive  10.7
## 8318 Females    51 Ceuta  2011Q1  inactive  16.5
## 8319   Males  52 Melilla  2011Q1  inactive   9.1
## 8320 Females  52 Melilla  2011Q1  inactive  15.3
nrow(datos)
## [1] 8320
summary(datos)
##     Gender           Provinces           Periodo           Situation        
##  Length:8320        Length:8320        Length:8320        Length:8320       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##      value       
##  Min.   :   0.0  
##  1st Qu.:  14.4  
##  Median :  61.9  
##  Mean   : 120.1  
##  3rd Qu.: 144.7  
##  Max.   :1828.9  
##  NA's   :1

Ejercicio 2

Repite el ejercicio anterior eliminando la opción header = TRUE. Examina el resultado y comprueba que, efectivamente, los datos no se han cargado correctamente.

Paso 1: Usamos nuevamente read.table para llamar a la tabla que debemos utilizar pero con header=FALSE para que la primera fila no le cuente como nombres de las columnas.

datos1 <- read.table("C:\\Users\\USUARIO\\Downloads\\paro.csv",sep = "\t", header = FALSE)

Paso 2: Usamos las funciones head, tail, nrow, summary para comprobar si los datos no se han cargado correctamente.

datos1 <- read.table("C:\\Users\\USUARIO\\Downloads\\paro.csv",sep = "\t", header = FALSE)
head(datos1)
##        V1                  V2      V3        V4    V5
## 1  Gender           Provinces Periodo Situation value
## 2   Males         02 Albacete  2014Q4    active 103.9
## 3 Females         02 Albacete  2014Q4    active  83.5
## 4   Males 03 Alicante/Alacant  2014Q4    active 490.5
## 5 Females 03 Alicante/Alacant  2014Q4    active 398.7
## 6   Males          04 Almería  2014Q4    active 198.5
tail(datos1)
##           V1          V2     V3       V4    V5
## 8316   Males 50 Zaragoza 2011Q1 inactive 134.3
## 8317 Females 50 Zaragoza 2011Q1 inactive 199.4
## 8318   Males    51 Ceuta 2011Q1 inactive  10.7
## 8319 Females    51 Ceuta 2011Q1 inactive  16.5
## 8320   Males  52 Melilla 2011Q1 inactive   9.1
## 8321 Females  52 Melilla 2011Q1 inactive  15.3
nrow(datos1)
## [1] 8321
summary(datos1)
##       V1                 V2                 V3                 V4           
##  Length:8321        Length:8321        Length:8321        Length:8321       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##       V5           
##  Length:8321       
##  Class :character  
##  Mode  :character

Ejercicio 3

Lee algún fichero de datos de tu interés y repite el ejercicio anterior.

Paso 1: Descargamos un archivo, en este caso se trata de un registro de ventas.

Paso 2: Importamos la base de datos descargada anteriormente a R y la asignamos a una variable.

#file.choose()
Registro_Ventas <- readxl::read_xlsx("C:\\Users\\USUARIO\\Downloads\\PROGRAMACIÓN\\Registro Ventas.xlsx")
Registro_Ventas
## # A tibble: 29 × 5
##    Fecha               Vendedor       Tienda   Producto    Importe
##    <dttm>              <chr>          <chr>    <chr>         <dbl>
##  1 2017-03-17 00:00:00 Carlos Vasquez Tienda A Laptop         1000
##  2 2017-03-20 00:00:00 Juan Carlos    Tienda B Impresora       200
##  3 2017-03-22 00:00:00 Pedro Noriega  Tienda B Laptop         3500
##  4 2017-04-20 00:00:00 José Almanares Tienda C Impresora       100
##  5 2017-04-17 00:00:00 Carlos Vasquez Tienda A Pantalla 42     100
##  6 2017-05-22 00:00:00 Juan Carlos    Tienda C Teclado          20
##  7 2017-05-22 00:00:00 Pedro Noriega  Tienda C Mouse            10
##  8 2017-05-24 00:00:00 José Almanares Tienda A Teclado          20
##  9 2017-05-17 00:00:00 José Almanares Tienda D Laptop         4000
## 10 2017-05-20 00:00:00 Carlos Vasquez Tienda C Laptop         4000
## # … with 19 more rows

Paso 3: Comprobamos que se importó correctamente aplicando head, tail, nrow y summary.

head(Registro_Ventas)
## # A tibble: 6 × 5
##   Fecha               Vendedor       Tienda   Producto    Importe
##   <dttm>              <chr>          <chr>    <chr>         <dbl>
## 1 2017-03-17 00:00:00 Carlos Vasquez Tienda A Laptop         1000
## 2 2017-03-20 00:00:00 Juan Carlos    Tienda B Impresora       200
## 3 2017-03-22 00:00:00 Pedro Noriega  Tienda B Laptop         3500
## 4 2017-04-20 00:00:00 José Almanares Tienda C Impresora       100
## 5 2017-04-17 00:00:00 Carlos Vasquez Tienda A Pantalla 42     100
## 6 2017-05-22 00:00:00 Juan Carlos    Tienda C Teclado          20
tail(Registro_Ventas)
## # A tibble: 6 × 5
##   Fecha               Vendedor       Tienda   Producto    Importe
##   <dttm>              <chr>          <chr>    <chr>         <dbl>
## 1 2018-08-07 00:00:00 Pedro Noriega  Tienda A Laptop i7      4000
## 2 2018-09-01 00:00:00 José Almanares Tienda A Pantalla 42     100
## 3 2018-09-04 00:00:00 Carlos Vasquez Tienda B Impresora       100
## 4 2019-09-05 00:00:00 Juan Carlos    Tienda A Laptop i3      1000
## 5 2019-09-08 00:00:00 Pedro Noriega  Tienda D Laptop i5      3500
## 6 2019-09-20 00:00:00 José Almanares Tienda B USB 3.0.1        15
nrow(Registro_Ventas)
## [1] 29
summary(Registro_Ventas)
##      Fecha                          Vendedor            Tienda         
##  Min.   :2017-03-17 00:00:00.00   Length:29          Length:29         
##  1st Qu.:2017-05-20 00:00:00.00   Class :character   Class :character  
##  Median :2018-06-16 00:00:00.00   Mode  :character   Mode  :character  
##  Mean   :2018-02-10 20:41:22.75                                        
##  3rd Qu.:2018-08-04 00:00:00.00                                        
##  Max.   :2019-09-20 00:00:00.00                                        
##    Producto            Importe      
##  Length:29          Min.   :  10.0  
##  Class :character   1st Qu.:  20.0  
##  Mode  :character   Median : 100.0  
##                     Mean   : 942.9  
##                     3rd Qu.:1000.0  
##                     Max.   :4000.0

Ejercicio 4

En read.table y sus derivados puedes indicar, además de ficheros disponibles en el disco duro, la URL de uno disponible en internet. Prueba a leer directamente el fichero disponible en https://datanalytics.com/uploads/datos_treemap.txt. Nota: es un fichero de texto separado por tabuladores y con nombres de columna.

Paso 1: Me dirigo al link y me descargo los datos de la web de la siguiente manera:

web1<- "https://datanalytics.com/uploads/datos_treemap.txt"
download.file(web1, "datos_treemap.txt")

Ejercicio 5

**Alternativamente, si quieres leer un fichero remoto, puedes descargarlo directamente desde R. Consulta la ayuda de download.file para bajarte al disco duro el fichero del ejercicio anterior (EJERCICIO 5) y leerlo después.

Paso 1: Utilizamos la función “read.table” para poder importar los datos de la web y a la vez se reflejen.

Web<- read.table(web1)
Web
##       V1    V2    V3
## 1  valor   cap   div
## 2    ABE  7793 12.04
## 3    ABG  1473  1.23
## 4    ACS  7930  8.13
## 5    ACX  2217  5.06
## 6    AMS  5910  2.27
## 7    ANA  3760  5.24
## 8   BBVA 24819  8.34
## 9    BKT  1646  5.85
## 10   BME  1589 10.38
## 11  CABK 11644  6.48
## 12   ELE 17215  3.08
## 13   ENG  3092  6.47
## 14   EVA  1971   6.7
## 15   FCC  2026  8.99
## 16   FER  5780  5.33
## 17   GAM   838   0.2
## 18   GAS 11022  7.24
## 19   GRF  2978  <NA>
## 20   IBE 25989  7.51
## 21  ICAG  3193  <NA>
## 22   IDR  1904  5.86
## 23   ITX 36571  2.39
## 24   MAP  6446  7.17
## 25   MTS 20577  1.82
## 26   OHL  1721  2.84
## 27   POP  4392  5.58
## 28   REE  4239  5.98
## 29   REP 22885   5.6
## 30   SAB  3433  5.67
## 31   SAN 44430 11.38
## 32   SYV  1823  2.32
## 33   TEF 57917 11.03
## 34   TL5  1652  8.62
## 35   TRE  1336  5.61