Integrantes:

Pedro Hinojosa

Alisson Mendez

Jhostin Nenger

Natasha Piedra

Nicole Yar.

EJERCICIO 1

Lee el fichero paro.csv (ARCHIVO ADJUNTO) usando la función read.table. Comprueba que está correctamente importado usando head, tail, nrow, summary, etc. Para leer la tabla necesitarás leer con cierto detenimiento read.table.

#Buscamos en que directorio esta guardando la información
getwd()

## [1] "C:/Users/Acer/Documents"

#Cambiamos el directorio
setwd("C:/Users/Acer/Downloads")
#Asignamos a una variable el documento de paro
datos <- read.table(file= "paro.csv",header = F, sep = " ")

#Observamos las 6 primeras filas
head(datos)

##                                                          V1
## 1      Gender\t"Provinces"\t"Periodo"\t"Situation"\t"value"
## 2           Males\t"02 Albacete"\t"2014Q4"\t"active"\t103.9
## 3          Females\t"02 Albacete"\t"2014Q4"\t"active"\t83.5
## 4   Males\t"03 Alicante/Alacant"\t"2014Q4"\t"active"\t490.5
## 5 Females\t"03 Alicante/Alacant"\t"2014Q4"\t"active"\t398.7
## 6            Males\t"04 Almería"\t"2014Q4"\t"active"\t198.5

#Observamos las 6 últimas filas
tail(datos)

##                                                       V1
## 8316   Males\t"50 Zaragoza"\t"2011Q1"\t"inactive"\t134.3
## 8317 Females\t"50 Zaragoza"\t"2011Q1"\t"inactive"\t199.4
## 8318       Males\t"51 Ceuta"\t"2011Q1"\t"inactive"\t10.7
## 8319     Females\t"51 Ceuta"\t"2011Q1"\t"inactive"\t16.5
## 8320      Males\t"52 Melilla"\t"2011Q1"\t"inactive"\t9.1
## 8321   Females\t"52 Melilla"\t"2011Q1"\t"inactive"\t15.3

#el núemro de filas
nrow(datos)

## [1] 8321

#un resumen estadístico
summary(datos)

##       V1           
##  Length:8321       
##  Class :character  
##  Mode  :character

EJERCICIO 2

Repite el ejercicio anterior eliminando la opción header = TRUE. Examina el resultado y comprueba que, efectivamente, los datos no se han cargado correctamente.

Cargamos y leemos el archivo paro.csv, sin la función header

getwd()

## [1] "C:/Users/Acer/Documents"

setwd("C:/Users/Acer/Downloads")
paro<- read.table(file="paro.csv", header= T, sep = " ")

Observamos que el archivo se cargo, pero la cabecera esta tomadacomo una fila mas de las variables

Usamos la función HEAD

head(paro)

##            Gender..Provinces...Periodo...Situation...value.
## 1           Males\t"02 Albacete"\t"2014Q4"\t"active"\t103.9
## 2          Females\t"02 Albacete"\t"2014Q4"\t"active"\t83.5
## 3   Males\t"03 Alicante/Alacant"\t"2014Q4"\t"active"\t490.5
## 4 Females\t"03 Alicante/Alacant"\t"2014Q4"\t"active"\t398.7
## 5            Males\t"04 Almería"\t"2014Q4"\t"active"\t198.5
## 6          Females\t"04 Almería"\t"2014Q4"\t"active"\t155.8

Usamos la función TAIL

tail(paro)

##         Gender..Provinces...Periodo...Situation...value.
## 8315   Males\t"50 Zaragoza"\t"2011Q1"\t"inactive"\t134.3
## 8316 Females\t"50 Zaragoza"\t"2011Q1"\t"inactive"\t199.4
## 8317       Males\t"51 Ceuta"\t"2011Q1"\t"inactive"\t10.7
## 8318     Females\t"51 Ceuta"\t"2011Q1"\t"inactive"\t16.5
## 8319      Males\t"52 Melilla"\t"2011Q1"\t"inactive"\t9.1
## 8320   Females\t"52 Melilla"\t"2011Q1"\t"inactive"\t15.3

Usamos la función NROW

nrow(paro)

## [1] 8320

Usamos la función SUMMARY

summary(paro)

##  Gender..Provinces...Periodo...Situation...value.
##  Length:8320                                     
##  Class :character                                
##  Mode  :character

EJERCICIO 3

Lee algún fichero de datos de tu interés y repite el ejercicio anterior (CADA GRUPO USARÁ SU ARCHIVO DE PREFERENCIA Y LO EXPLICARÁ EN LA EXPOSICIÓN).

getwd()

## [1] "C:/Users/Acer/Documents"

setwd("C:/Users/Acer/Downloads")
#creamos el archivo FFRUTERIA en excel con datos de una fruteria, separando los elementos como en 
#el archivo de "Paro", para así utilizar en nuevo archivo sin problemas
fruteria<- read.table(file="FFRUTERIA.csv", header= T, sep = " ")
fruteria

##    Frutas.Precio..Cantidad..Total.
## 1           Manzana"0,25""1""0,25"
## 2               Pera"0,25""2""0,5"
## 3                  Papaya"1""3""3"
## 4              Mora"0,12""4""0,48"
## 5           Frutilla"0,12""5""0,6"
## 6             Naraja"0,25""6""1,5"
## 7         Mandarina"0,25""7""1,75"
## 8             Limon"0,12""8""0,96"
## 9            Aguacate"0,5""1""0,5"
## 10              Arandanos"1""2""2"
## 11         Maracuya"0,25""34""8,5"
## 12           Sandia"1,5""23""34,5"
## 13        Guayaba"0,25""45""11,25"
## 14              Pi\xf1a"1""12""12"
## 15              Platano"1""34""34"
## 16         Durazno"0,12""56""6,72"
## 17                    Uva"1""3""3"
## 18              Frambuesa"1""5""5"
## 19              Kiwi"0,25""2""0,5"

head(fruteria)

##   Frutas.Precio..Cantidad..Total.
## 1          Manzana"0,25""1""0,25"
## 2              Pera"0,25""2""0,5"
## 3                 Papaya"1""3""3"
## 4             Mora"0,12""4""0,48"
## 5          Frutilla"0,12""5""0,6"
## 6            Naraja"0,25""6""1,5"

tail(fruteria)

##    Frutas.Precio..Cantidad..Total.
## 14              Pi\xf1a"1""12""12"
## 15              Platano"1""34""34"
## 16         Durazno"0,12""56""6,72"
## 17                    Uva"1""3""3"
## 18              Frambuesa"1""5""5"
## 19              Kiwi"0,25""2""0,5"

nrow(fruteria)

## [1] 19

summary(fruteria)

##  Frutas.Precio..Cantidad..Total.
##  Length:19                      
##  Class :character               
##  Mode  :character

EJERCICIO 4

En read.table y sus derivados puedes indicar, además de ficheros disponibles en el disco duro, la URL de uno disponible en internet. Prueba a leer directamente el fichero disponible en https://datanalytics.com/uploads/datos_treemap.txt. Nota: es un fichero de texto separado por tabuladores y con nombres de columna.

url1<-"https://datanalytics.com/uploads/datos_treemap.txt"
download.file(url1,"datos_descarga")

EJERCICIO 5

Alternativamente, si quieres leer un fichero remoto, puedes descargarlo directamente desde R. Consulta la ayuda de download.file para bajarte al disco duro el fichero del ejercicio anterior (EJERCICIO 5) y leerlo después.

download.file(url = "https://datanalytics.com/uploads/datos_treemap.txt",
              destfile = "Datos")

Luego corremos el link descargado en donde lo guardamos

read.table("Datos")

##       V1    V2    V3
## 1  valor   cap   div
## 2    ABE  7793 12.04
## 3    ABG  1473  1.23
## 4    ACS  7930  8.13
## 5    ACX  2217  5.06
## 6    AMS  5910  2.27
## 7    ANA  3760  5.24
## 8   BBVA 24819  8.34
## 9    BKT  1646  5.85
## 10   BME  1589 10.38
## 11  CABK 11644  6.48
## 12   ELE 17215  3.08
## 13   ENG  3092  6.47
## 14   EVA  1971   6.7
## 15   FCC  2026  8.99
## 16   FER  5780  5.33
## 17   GAM   838   0.2
## 18   GAS 11022  7.24
## 19   GRF  2978  <NA>
## 20   IBE 25989  7.51
## 21  ICAG  3193  <NA>
## 22   IDR  1904  5.86
## 23   ITX 36571  2.39
## 24   MAP  6446  7.17
## 25   MTS 20577  1.82
## 26   OHL  1721  2.84
## 27   POP  4392  5.58
## 28   REE  4239  5.98
## 29   REP 22885   5.6
## 30   SAB  3433  5.67
## 31   SAN 44430 11.38
## 32   SYV  1823  2.32
## 33   TEF 57917 11.03
## 34   TL5  1652  8.62
## 35   TRE  1336  5.61

Taller 9

Grupo 5

2024-01-08