UNIVERSIDAD CENTRAL DEL ECUADOR
FACULTAD DE CIENCIAS ECONOMICAS
CARRERA DE ESTADISTICA
PROGRAMACION

INTEGRANTES
- Pamela Pilataxi
- Fatima Toaquiza
- Carlos Salazar
- Jonathan Simbaña
EJERCICIOS DE EXPORTACIÓN E IMPORTACIÓN DE ARCHVIOS EN R
REALIZAR LOS SIGUIENTES EJERCICIOS
PRIMER EJERCICIO
Lee el fichero paro.csv (ARCHIVO ADJUNTO) usando la función read.table. Comprueba que está correctamente importado usando head, tail, nrow, summary, etc. Para leer la tabla necesitarás leer con cierto detenimiento ?read.table.
PARO <-read.table("c:/DATOS/paro.csv", header=T, sep= "\t", dec=".")
head(PARO)
## Gender Provinces Periodo Situation value
## 1 Males 02 Albacete 2014Q4 active 103.9
## 2 Females 02 Albacete 2014Q4 active 83.5
## 3 Males 03 Alicante/Alacant 2014Q4 active 490.5
## 4 Females 03 Alicante/Alacant 2014Q4 active 398.7
## 5 Males 04 AlmerÃa 2014Q4 active 198.5
## 6 Females 04 AlmerÃa 2014Q4 active 155.8
tail(PARO)
## Gender Provinces Periodo Situation value
## 8315 Males 50 Zaragoza 2011Q1 inactive 134.3
## 8316 Females 50 Zaragoza 2011Q1 inactive 199.4
## 8317 Males 51 Ceuta 2011Q1 inactive 10.7
## 8318 Females 51 Ceuta 2011Q1 inactive 16.5
## 8319 Males 52 Melilla 2011Q1 inactive 9.1
## 8320 Females 52 Melilla 2011Q1 inactive 15.3
nrow(PARO)
## [1] 8320
summary(PARO)
## Gender Provinces Periodo Situation
## Length:8320 Length:8320 Length:8320 Length:8320
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## value
## Min. : 0.0
## 1st Qu.: 14.4
## Median : 61.9
## Mean : 120.1
## 3rd Qu.: 144.7
## Max. :1828.9
## NA's :1
SEGUNDO EJERCICIO
Repite el ejercicio anterior eliminando la opción header = TRUE. Examina el resultado y comprueba que, efectivamente, los datos no se han cargado correctamente.
PARO2 <-read.table("c:/DATOS/paro.csv", header=F)
head(PARO2)
## V1 V2 V3 V4 V5
## 1 Gender Provinces Periodo Situation value
## 2 Males 02 Albacete 2014Q4 active 103.9
## 3 Females 02 Albacete 2014Q4 active 83.5
## 4 Males 03 Alicante/Alacant 2014Q4 active 490.5
## 5 Females 03 Alicante/Alacant 2014Q4 active 398.7
## 6 Males 04 AlmerÃa 2014Q4 active 198.5
tail(PARO2)
## V1 V2 V3 V4 V5
## 8316 Males 50 Zaragoza 2011Q1 inactive 134.3
## 8317 Females 50 Zaragoza 2011Q1 inactive 199.4
## 8318 Males 51 Ceuta 2011Q1 inactive 10.7
## 8319 Females 51 Ceuta 2011Q1 inactive 16.5
## 8320 Males 52 Melilla 2011Q1 inactive 9.1
## 8321 Females 52 Melilla 2011Q1 inactive 15.3
nrow(PARO2)
## [1] 8321
summary(PARO2)
## V1 V2 V3 V4
## Length:8321 Length:8321 Length:8321 Length:8321
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
## V5
## Length:8321
## Class :character
## Mode :character
TERCER EJERCICIO
Lee algún fichero de datos de tu interés y repite el ejercicio anterior (CADA GRUPO USARÁ SU ARCHIVO DE PREFERENCIA Y LO EXPLICARÁ EN LA EXPOSICIÓN).
DATOS<-read.csv("C:/DATOS/PELIKA.txt",header=T, sep= "\t", dec=";")
head(DATOS)
## Cliente cliente2 Cod_tipo_cliente Cantidad_productos Ventas.netas
## 1 1 Regular 1 1 39,5
## 2 2 Promoción 2 1 102,4
## 3 3 Regular 1 1 22,5
## 4 4 Promoción 2 5 100,4
## 5 5 Regular 1 2 54
## 6 6 Regular 1 1 44,5
## pago Cod_forma_de_pago sexo Cod_sexo Cod_estado_civil Edad
## 1 Discover 2 Masculino 1 1 32
## 2 National Clothing 4 Femenino 2 1 36
## 3 National Clothing 4 Femenino 2 1 32
## 4 National Clothing 4 Femenino 2 1 28
## 5 MasterCard 3 Femenino 2 1 34
## 6 MasterCard 3 Femenino 2 1 44
tail(DATOS)
## Cliente cliente2 Cod_tipo_cliente Cantidad_productos Ventas.netas
## 95 95 Regular 1 3 66
## 96 96 Regular 1 1 39,5
## 97 97 Promoción 2 9 253
## 98 98 Promoción 2 10 287,59
## 99 99 Promoción 2 2 47,6
## 100 100 Promoción 2 1 28,44
## pago Cod_forma_de_pago sexo Cod_sexo Cod_estado_civil Edad
## 95 American Express 1 Femenino 2 1 46
## 96 MasterCard 3 Femenino 2 1 44
## 97 National Clothing 4 Femenino 2 1 30
## 98 National Clothing 4 Femenino 2 1 52
## 99 National Clothing 4 Femenino 2 1 30
## 100 National Clothing 4 Femenino 2 1 44
nrow(DATOS)
## [1] 100
summary(DATOS)
## Cliente cliente2 Cod_tipo_cliente Cantidad_productos
## Min. : 1.00 Length:100 Min. :1.0 Min. : 1.00
## 1st Qu.: 25.75 Class :character 1st Qu.:1.0 1st Qu.: 1.00
## Median : 50.50 Mode :character Median :2.0 Median : 2.00
## Mean : 50.50 Mean :1.7 Mean : 3.22
## 3rd Qu.: 75.25 3rd Qu.:2.0 3rd Qu.: 4.00
## Max. :100.00 Max. :2.0 Max. :17.00
## Ventas.netas pago Cod_forma_de_pago sexo
## Length:100 Length:100 Min. :1.00 Length:100
## Class :character Class :character 1st Qu.:4.00 Class :character
## Mode :character Mode :character Median :4.00 Mode :character
## Mean :3.82
## 3rd Qu.:4.00
## Max. :5.00
## Cod_sexo Cod_estado_civil Edad
## Min. :1.00 Min. :1.00 Min. :20.00
## 1st Qu.:2.00 1st Qu.:1.00 1st Qu.:32.00
## Median :2.00 Median :1.00 Median :42.00
## Mean :1.93 Mean :1.16 Mean :43.08
## 3rd Qu.:2.00 3rd Qu.:1.00 3rd Qu.:50.00
## Max. :2.00 Max. :2.00 Max. :78.00
CUARTO EJERCICIO
En read.table y sus derivados puedes indicar, además de ficheros disponibles en el disco duro, la URL de uno disponible en internet. Prueba a leer directamente el fichero disponible en https://datanalytics.com/uploads/datos_treemap.txt. Nota: es un fichero de texto separado por tabuladores y con nombres de columna.
Tabla_web<- read.table("https://datanalytics.com/uploads/datos_treemap.txt", header = T)
Tabla_web
## valor cap div
## 1 ABE 7793 12.04
## 2 ABG 1473 1.23
## 3 ACS 7930 8.13
## 4 ACX 2217 5.06
## 5 AMS 5910 2.27
## 6 ANA 3760 5.24
## 7 BBVA 24819 8.34
## 8 BKT 1646 5.85
## 9 BME 1589 10.38
## 10 CABK 11644 6.48
## 11 ELE 17215 3.08
## 12 ENG 3092 6.47
## 13 EVA 1971 6.70
## 14 FCC 2026 8.99
## 15 FER 5780 5.33
## 16 GAM 838 0.20
## 17 GAS 11022 7.24
## 18 GRF 2978 NA
## 19 IBE 25989 7.51
## 20 ICAG 3193 NA
## 21 IDR 1904 5.86
## 22 ITX 36571 2.39
## 23 MAP 6446 7.17
## 24 MTS 20577 1.82
## 25 OHL 1721 2.84
## 26 POP 4392 5.58
## 27 REE 4239 5.98
## 28 REP 22885 5.60
## 29 SAB 3433 5.67
## 30 SAN 44430 11.38
## 31 SYV 1823 2.32
## 32 TEF 57917 11.03
## 33 TL5 1652 8.62
## 34 TRE 1336 5.61
QUINTO EJERCICIO
Alternativamente, si quieres leer un fichero remoto, puedes descargarlo directamente desde R. Consulta la ayuda de download.file para bajarte al disco duro el fichero del ejercicio anterior (EJERCICIO 5) y leerlo después.
download.file(url="https://datanalytics.com/uploads/datos_treemap.txt", destfile = "Datos_2")
read.table("C:/Users/Pame Pilataxi/Downloads/Datos_2", header=T, sep= "\t", dec=".")
## valor cap div
## 1 ABE 7793 12.04
## 2 ABG 1473 1.23
## 3 ACS 7930 8.13
## 4 ACX 2217 5.06
## 5 AMS 5910 2.27
## 6 ANA 3760 5.24
## 7 BBVA 24819 8.34
## 8 BKT 1646 5.85
## 9 BME 1589 10.38
## 10 CABK 11644 6.48
## 11 ELE 17215 3.08
## 12 ENG 3092 6.47
## 13 EVA 1971 6.70
## 14 FCC 2026 8.99
## 15 FER 5780 5.33
## 16 GAM 838 0.20
## 17 GAS 11022 7.24
## 18 GRF 2978 NA
## 19 IBE 25989 7.51
## 20 ICAG 3193 NA
## 21 IDR 1904 5.86
## 22 ITX 36571 2.39
## 23 MAP 6446 7.17
## 24 MTS 20577 1.82
## 25 OHL 1721 2.84
## 26 POP 4392 5.58
## 27 REE 4239 5.98
## 28 REP 22885 5.60
## 29 SAB 3433 5.67
## 30 SAN 44430 11.38
## 31 SYV 1823 2.32
## 32 TEF 57917 11.03
## 33 TL5 1652 8.62
## 34 TRE 1336 5.61