Pasos para importar un dataset en RStudio

A continuación veremos el paso a paso de como descargar de la web e importar un dataset en nuestro RMarkdown, en este caso trabajaremos con el dataset del valor de 2018 de los Terrenos en Venta publicado por BA Data en el siguiente link: https://data.buenosaires.gob.ar/dataset/terrenos-valor-oferta

¿Cómo descargo los datos a mi computadora?

Paso 1

Existen muchos portales de donde nos podemos descargar datos para analizar. Siempre recomiendo investigar primero si hay un portal de datos abiertos de la Ciudad que queremos analizar y en caso de no encontrar, recurrir a otras fuentes alternativas. En nuestro caso vamos a trabajar con datos abiertos publicados por GCBA. Por lo tanto el primer paso es ingresar a la web de BA Data donde nos encontraremos con una pantalla como la siguiente, en la cual podremos escribir en el buscador los datos que necesitamos descargar (en nuestro caso: “terrenos en venta”):

Paso 2

Si todo va bien, una vez que hicimos click en la lupita, deberíamos encontrarnos con la siguiente página, y hacer click sobre la descripción de los datos que necesitamos.

Paso 3

La siguiente página con la que nos encontramos es una lista de los dataset que hay en relación al dato que estamos buscando, en nuestro caso, hay datos de venta de terrenos en CABA desde 2001 hasta 2018, y no solo eso, sino que cada dataset está en diferentes formatos: shapefile y csv. Descarguemos el csv de 2018:

Paso 4

Una vez descargado, seleccionemos la flechita del costado y “Mostrar en carpeta” para poder encontrar el archivo dentro de mi computadora:

Paso 5

Se nos abre la carpeta “Descargas” y encontramos ahí nuestro csv, pero recomiendo como una buena práctica no trabajarlo desde esa carpeta genérica y moverlo a una carpeta dentro del Proyecto de R en el cual querramos trabajar. Para eso hacemos click botón derecho sobre el archivo, y seleccionamos “Cortar”:

Paso 6

Y vamos a la carpeta del proyecto donde queremos guardarlo y hacemos click botón derecho y seleccionamos “Pegar”. Si todo va bien, movimos el archivo a nuestro proyecto:

¿Cómo importo la data en mi RMarkdown?

Paso 1

Listo la descarga de datos! Ya tenemos todo lo que necesitamos para trabajar. Ahora debemos importar la data en nuestro RMarkdown de la siguiente forma: Import Dataset/From Text(base)

Paso 2

Seleccionemos el csv que queremos cargar y hagamos click en Open:

Paso 3

Aparecerá una ventana que nos permitirá realizar algunos ajustes como por ejemplo, elegir el nombre con el que queremos llamar al dataframe, en este caso voy a ponerle terrenos_2018.

En “Input File” se ve el archivo que queremos abrir y en “Data Frame” aparece una vista previa de como estamos cargando el dataset. Luego de seleccionar todas las opciones, damos click en Import.

Paso 4

Listo, ya cargamos nuestro primer dataset! Se va a abrir y deberíamos también ver en el Enviroment (parte superior derecha de la pantalla) el nombre que pusimos en el paso anterior.

Pero acá lo importante es la ruta que aparece en la Console (parte inferior izquierda). Esa línea de código es la que nos permite abrir el csv, por lo tanto, la primera vez lo vamos a hacer manual pero una vez que ya la tengamos, alcanza con copiarla y pegarla en el RMarkdown, para que las próximas veces que abramos el archivo, solo tengamos que ejecutar ese chunk.

Paso 5

Lo pegamos y listo! Ya nos queda la línea de código que carga nuestro dataset en el RMarkdown.

Y se ve así:

terrenos_2018 <- read.csv("E:/03-OTROS/SCA-CURSOS-2020/importar-dataset/dataset/precio-de-terrenos-2018.csv")