En el presente informe se hará uso de la importación de archivos desde el ordenador hasta de internet.
Paso 1: Usamos la funcion read.table y ponemos el nombre del archivo a utilizar.
datos <- read.table("C:\\Users\\hp\\documents\\paro.csv",sep = "\t", header = TRUE)
datos
Paso 2: Para comprobar si la tabla esta correctamente importado, usaremos las funciones a continuación.
datos <- read.table("C:\\Users\\USUARIO\\Downloads\\paro.csv",sep = "\t", header = TRUE)
head(datos)
## Gender Provinces Periodo Situation value
## 1 Males 02 Albacete 2014Q4 active 103.9
## 2 Females 02 Albacete 2014Q4 active 83.5
## 3 Males 03 Alicante/Alacant 2014Q4 active 490.5
## 4 Females 03 Alicante/Alacant 2014Q4 active 398.7
## 5 Males 04 Almería 2014Q4 active 198.5
## 6 Females 04 Almería 2014Q4 active 155.8
tail(datos)
## Gender Provinces Periodo Situation value
## 8315 Males 50 Zaragoza 2011Q1 inactive 134.3
## 8316 Females 50 Zaragoza 2011Q1 inactive 199.4
## 8317 Males 51 Ceuta 2011Q1 inactive 10.7
## 8318 Females 51 Ceuta 2011Q1 inactive 16.5
## 8319 Males 52 Melilla 2011Q1 inactive 9.1
## 8320 Females 52 Melilla 2011Q1 inactive 15.3
nrow(datos)
## [1] 8320
summary(datos)
## Gender Provinces Periodo Situation
## Length:8320 Length:8320 Length:8320 Length:8320
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## value
## Min. : 0.0
## 1st Qu.: 14.4
## Median : 61.9
## Mean : 120.1
## 3rd Qu.: 144.7
## Max. :1828.9
## NA's :1
Paso 1: Usamos nuevamente read.table para llamar a la tabla que debemos utilizar pero con header=FALSE para que la primera fila no le cuente como nombres de las columnas.
datos1 <- read.table("C:\\Users\\USUARIO\\Downloads\\paro.csv",sep = "\t", header = FALSE)
Paso 2: Usamos las funciones head, tail, nrow, summary para comprobar si los datos no se han cargado correctamente.
datos1 <- read.table("C:\\Users\\USUARIO\\Downloads\\paro.csv",sep = "\t", header = FALSE)
head(datos1)
## V1 V2 V3 V4 V5
## 1 Gender Provinces Periodo Situation value
## 2 Males 02 Albacete 2014Q4 active 103.9
## 3 Females 02 Albacete 2014Q4 active 83.5
## 4 Males 03 Alicante/Alacant 2014Q4 active 490.5
## 5 Females 03 Alicante/Alacant 2014Q4 active 398.7
## 6 Males 04 Almería 2014Q4 active 198.5
tail(datos1)
## V1 V2 V3 V4 V5
## 8316 Males 50 Zaragoza 2011Q1 inactive 134.3
## 8317 Females 50 Zaragoza 2011Q1 inactive 199.4
## 8318 Males 51 Ceuta 2011Q1 inactive 10.7
## 8319 Females 51 Ceuta 2011Q1 inactive 16.5
## 8320 Males 52 Melilla 2011Q1 inactive 9.1
## 8321 Females 52 Melilla 2011Q1 inactive 15.3
nrow(datos1)
## [1] 8321
summary(datos1)
## V1 V2 V3 V4
## Length:8321 Length:8321 Length:8321 Length:8321
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
## V5
## Length:8321
## Class :character
## Mode :character
Paso 1: Descargamos un archivo, en este caso se trata de un registro de ventas.
Paso 2: Importamos la base de datos descargada anteriormente a R y la asignamos a una variable.
#file.choose()
Registro_Ventas <- readxl::read_xlsx("C:\\Users\\USUARIO\\Downloads\\PROGRAMACIÓN\\Registro Ventas.xlsx")
Registro_Ventas
## # A tibble: 29 × 5
## Fecha Vendedor Tienda Producto Importe
## <dttm> <chr> <chr> <chr> <dbl>
## 1 2017-03-17 00:00:00 Carlos Vasquez Tienda A Laptop 1000
## 2 2017-03-20 00:00:00 Juan Carlos Tienda B Impresora 200
## 3 2017-03-22 00:00:00 Pedro Noriega Tienda B Laptop 3500
## 4 2017-04-20 00:00:00 José Almanares Tienda C Impresora 100
## 5 2017-04-17 00:00:00 Carlos Vasquez Tienda A Pantalla 42 100
## 6 2017-05-22 00:00:00 Juan Carlos Tienda C Teclado 20
## 7 2017-05-22 00:00:00 Pedro Noriega Tienda C Mouse 10
## 8 2017-05-24 00:00:00 José Almanares Tienda A Teclado 20
## 9 2017-05-17 00:00:00 José Almanares Tienda D Laptop 4000
## 10 2017-05-20 00:00:00 Carlos Vasquez Tienda C Laptop 4000
## # … with 19 more rows
Paso 3: Comprobamos que se importó correctamente aplicando head, tail, nrow y summary.
head(Registro_Ventas)
## # A tibble: 6 × 5
## Fecha Vendedor Tienda Producto Importe
## <dttm> <chr> <chr> <chr> <dbl>
## 1 2017-03-17 00:00:00 Carlos Vasquez Tienda A Laptop 1000
## 2 2017-03-20 00:00:00 Juan Carlos Tienda B Impresora 200
## 3 2017-03-22 00:00:00 Pedro Noriega Tienda B Laptop 3500
## 4 2017-04-20 00:00:00 José Almanares Tienda C Impresora 100
## 5 2017-04-17 00:00:00 Carlos Vasquez Tienda A Pantalla 42 100
## 6 2017-05-22 00:00:00 Juan Carlos Tienda C Teclado 20
tail(Registro_Ventas)
## # A tibble: 6 × 5
## Fecha Vendedor Tienda Producto Importe
## <dttm> <chr> <chr> <chr> <dbl>
## 1 2018-08-07 00:00:00 Pedro Noriega Tienda A Laptop i7 4000
## 2 2018-09-01 00:00:00 José Almanares Tienda A Pantalla 42 100
## 3 2018-09-04 00:00:00 Carlos Vasquez Tienda B Impresora 100
## 4 2019-09-05 00:00:00 Juan Carlos Tienda A Laptop i3 1000
## 5 2019-09-08 00:00:00 Pedro Noriega Tienda D Laptop i5 3500
## 6 2019-09-20 00:00:00 José Almanares Tienda B USB 3.0.1 15
nrow(Registro_Ventas)
## [1] 29
summary(Registro_Ventas)
## Fecha Vendedor Tienda
## Min. :2017-03-17 00:00:00.00 Length:29 Length:29
## 1st Qu.:2017-05-20 00:00:00.00 Class :character Class :character
## Median :2018-06-16 00:00:00.00 Mode :character Mode :character
## Mean :2018-02-10 20:41:22.75
## 3rd Qu.:2018-08-04 00:00:00.00
## Max. :2019-09-20 00:00:00.00
## Producto Importe
## Length:29 Min. : 10.0
## Class :character 1st Qu.: 20.0
## Mode :character Median : 100.0
## Mean : 942.9
## 3rd Qu.:1000.0
## Max. :4000.0
Paso 1: Me dirigo al link y me descargo los datos de la web de la siguiente manera:
web1<- "https://datanalytics.com/uploads/datos_treemap.txt"
download.file(web1, "datos_treemap.txt")
Paso 1: Utilizamos la función “read.table” para poder importar los datos de la web y a la vez se reflejen.
Web<- read.table(web1)
Web
## V1 V2 V3
## 1 valor cap div
## 2 ABE 7793 12.04
## 3 ABG 1473 1.23
## 4 ACS 7930 8.13
## 5 ACX 2217 5.06
## 6 AMS 5910 2.27
## 7 ANA 3760 5.24
## 8 BBVA 24819 8.34
## 9 BKT 1646 5.85
## 10 BME 1589 10.38
## 11 CABK 11644 6.48
## 12 ELE 17215 3.08
## 13 ENG 3092 6.47
## 14 EVA 1971 6.7
## 15 FCC 2026 8.99
## 16 FER 5780 5.33
## 17 GAM 838 0.2
## 18 GAS 11022 7.24
## 19 GRF 2978 <NA>
## 20 IBE 25989 7.51
## 21 ICAG 3193 <NA>
## 22 IDR 1904 5.86
## 23 ITX 36571 2.39
## 24 MAP 6446 7.17
## 25 MTS 20577 1.82
## 26 OHL 1721 2.84
## 27 POP 4392 5.58
## 28 REE 4239 5.98
## 29 REP 22885 5.6
## 30 SAB 3433 5.67
## 31 SAN 44430 11.38
## 32 SYV 1823 2.32
## 33 TEF 57917 11.03
## 34 TL5 1652 8.62
## 35 TRE 1336 5.61