1. Presentación

Objetivo

El objetivo principal del laboratorio es desarrollar habilidades de pre procesamiento de datos, es decir se dotará al estudiante de herramientas para la lectura, limpieza, formateo e integración de datos, utilizando el programa R y su entorno R Studio.

Jefes de práctica

  • Wendy Adrianzén, Politóloga

  • Alexander Benites, Politólogo

  • Gabriel Ramos, Politólogo

Calificaciones

Se tomarán 3 prácticas calificadas (PC), que corresponden al 30% de la nota final del curso (10% cada una). Cada PC tiene una fecha establecida desde el inicio del curso y tendrá una duración de 24 horas.

Adicionalmente, se realizarán ejercicios no obligatorios, pero que permitirán al alumno/a recibir bonificaciones (puntos extra) para sus PC. Por un lado, se dejarán ejercicios individuales en función de lo realizado en la sesión, y por otro se realizarán ejercicios grupales bajo el nombre de “datatón”, que consistirá en resolver problemas reales en el ámbito de la ciencia política de manera colaborativa. Las “datatones” pueden implicar hacer uso de herramientas aprendidas en las sesiones teóricas, como estrategia para repasar tanto lo teórico y práctico del curso.

Dinámica de las sesiones

Las sesiones se realizarán durante 2 horas, teniendo a la mitad del curso un receso de 10 minutos. El material de la sesión estará disponible todos los miércoles de las semanas. Se requiere puntualidad del alumno/a, así como respeto y responsabilidad en las actividades.

Desde la primera sesión los estudiantes deberán formar grupos para las actividades grupales (datatones), estos pueden o no coincidir con los grupos formados para el trabajo final del curso.

Los alumnos/as podrán solicitar asesorías grupales, previa coordinación con el jefe de práctica.

Distribución de las sesiones

Semana Contenido
1 Introducción al laboratorio
2 Lectura de datos (I)
3 Lectura de datos (II)
4 Repaso | Datatón | Práctica Calificada 1 (18.09.21)
5 Limpieza de datos (I)
6 Limpieza de datos (II)
7 Repaso | Datatón | Práctica Calificada 2 (09.10.21)
8 No hay clases por examen parcial
9 Formateo de datos (I)
10 Formateo de datos (II)
11 Formateo de datos (III)
12 Repaso | Datatón
13 Integración de datos (I)
14 Integración de datos (II)
15 Repaso | Datatón | Práctica Calificada 3 (04.12.21)
16 No hay clases por examen final

2. Requisitos

2.1. Instalación del programa

Luego de haber llevado el curso de Estadística, todos deben tener instalado el programa, pero por si las dudas, les dejamos nuevamente los instaladores.

  • Primero debe instalar R. Podrán encontrar los instaladores para distintos sistemas operativos en la siguiente dirección: https://cran.r-project.org/

  • Luego R Studio. Una vez instalado el programa, podemos instalar su entorno de desarrollo integrado: R studio. Podrán encontrar los instaladores para distintos sistemas operativos en la siguiente dirección: https://rstudio.com/products/rstudio/download/#download

2.2. Configuración de directorio de trabajo

Recuerden que antes de comenzar a hacer operaciones con R necesitamos definir nuestro lugar de trabajo. Para esto tenemos dos alternativas.

Opción 1. Fijar directorio

Para ver nuestro lugar de trabajo actual escribimos el siguiente comando:

getwd() 
## [1] "D:/Cursos/Cursos GR/Finalizados/2021-2 Curso Estadistica 2 PUCP/Clase practica 1"

Para una mejor experiencia, pueden crear una carpeta en la cual trabajá a lo largo del curso. La ruta a través del menú es: Session > Set Working Directory > Choose Directory. Esto abrirá una ventana emergente, donde buscaremos la carpeta en la cual vamos a trabajar, la seleccionamos y apretamos “Open”.

Si queremos verificar el cambio, volvemos a digitar la función “getwd()” en la consola.

Opción 2. Proyecto de R

Otra opción en crear un proyecto. Al crearlo todos los ficheros quedan vinculados directamente al proyecto. Para crear un proyecto seleccione la ruta: File > New project… Se abrirá la siguiente ventana:

Para crear un proyecto en un nuevo directorio, hacemos clic en el botón New Directory. Seguidamente, seleccionamos el tipo de proyecto, en nuestro caso Empty Project. Ahora, asignamos un nombre al directorio (carpeta) que se va a crear y que al mismo tiempo será el nombre del proyecto de R. Para terminar, hacemos clic en el botón Create Project. Al seguir este proceso se habrá creado una carpeta en Documentos y un fichero nombre_carpeta.Rproj.

Para crear un proyecto en una carpeta que ya existe, hacemos clic en el botón Existing Directory y después seleccionamos la carpeta ayudándonos del Browse.. si fuera necesario. Una vez elegida la carpeta, clicamos en Create Project.

Para abrir un proyecto hacemos doble clic sobre el archivo con extensión .Rproj o lo abrimos desde el menú de RStudio: File > Open Project…

Ventaja de los proyectos: cualquier fichero que creemos (script de R, documento de Rmarkdown, etc.) y guardemos se guardará en la carpeta del proyecto.

2.3. Github

Vamos a requerir que se creen una cuenta en GitHub. GitHub permite alojar proyectos utilizando el sistema de control de versiones Git. Se utiliza principalmente para la creación de código fuente de programas de ordenador. Para fines de este curso, vamos a utilizar Github como repositorio para cargar nuestras bases de datos, administrar nuestros archivos etc.

Créese una cuenta en Github:

Ingrese a esta dirección: https://github.com/

Si quiere saber más de GitHub visite:

https://www.youtube.com/watch?v=Uw8SIaAK-vw&t=134s

Github como repositorio

  • En la parte superior derecha seleccione “+”, seleccione “New repository” y siga los pasos precisando el nombre del respositorio, descripción (opcional),elija la visibilidad del repositorio (publico o privado), y ¡cree su repositorio!

  • Cargue archivos seleccionando Add file > Upload files > Choose your files > Commit changes

Si quiere profundizar más sobre el GitHub como repositorio:

https://www.youtube.com/watch?v=JN6rzv4zSJ4s

2.4. Knit en R Studio

Vamos a trabajar en archivos R markdown (Rmd), pero para presentarlos de una manera amigable, podemos exportarlos en formato PDF, Html o en una página web.

Para una mejor experiencia, antes de exportar a PDF, deberá instalar lo siguiente desde su consola:

install.packages(‘tinytex’)

tinytex::install_tinytex()

Asimismo, para un Knit a una página web, utilizaremos Rpubs, por lo que deberán crearse una cuenta: https://rpubs.com/users/new

Recomendación: Cuando creen sus archivos Rmd, que estos no contengan en su nombre caracteres como tildes, símbolos, etc, eso no les permitirá hacer un knit en la web.

2.5. Ayuda en R

Finalmente, en muchas ocasiones necesitamos ayuda sobre cómo funciona una determinada función, cuáles son sus argumentos, etc.

help(mean)
## starting httpd help server ... done
?mean
mean    # y pulsamos la tecla F1
## function (x, ...) 
## UseMethod("mean")
## <bytecode: 0x00000000155e3610>
## <environment: namespace:base>

Tambien pueden consultar algunas webs que ofrecen ayuda: