El objetivo principal del laboratorio es desarrollar habilidades de pre procesamiento de datos, es decir se dotará al estudiante de herramientas para la lectura, limpieza, formateo e integración de datos, utilizando el programa R y su entorno R Studio.
Wendy Adrianzén, Politóloga
Alexander Benites, Politólogo
Gabriel Ramos, Politólogo
Se tomarán 3 prácticas calificadas (PC), que corresponden al 30% de la nota final del curso (10% cada una). Cada PC tiene una fecha establecida desde el inicio del curso y tendrá una duración de 24 horas.
Adicionalmente, se realizarán ejercicios no obligatorios, pero que permitirán al alumno/a recibir bonificaciones (puntos extra) para sus PC. Por un lado, se dejarán ejercicios individuales en función de lo realizado en la sesión, y por otro se realizarán ejercicios grupales bajo el nombre de “datatón”, que consistirá en resolver problemas reales en el ámbito de la ciencia política de manera colaborativa. Las “datatones” pueden implicar hacer uso de herramientas aprendidas en las sesiones teóricas, como estrategia para repasar tanto lo teórico y práctico del curso.
Las sesiones se realizarán durante 2 horas, teniendo a la mitad del curso un receso de 10 minutos. El material de la sesión estará disponible todos los miércoles de las semanas. Se requiere puntualidad del alumno/a, así como respeto y responsabilidad en las actividades.
Desde la primera sesión los estudiantes deberán formar grupos para las actividades grupales (datatones), estos pueden o no coincidir con los grupos formados para el trabajo final del curso.
Los alumnos/as podrán solicitar asesorías grupales, previa coordinación con el jefe de práctica.
| Semana | Contenido |
|---|---|
| 1 | Introducción al laboratorio |
| 2 | Lectura de datos (I) |
| 3 | Lectura de datos (II) |
| 4 | Repaso | Datatón | Práctica Calificada 1 (18.09.21) |
| 5 | Limpieza de datos (I) |
| 6 | Limpieza de datos (II) |
| 7 | Repaso | Datatón | Práctica Calificada 2 (09.10.21) |
| 8 | No hay clases por examen parcial |
| 9 | Formateo de datos (I) |
| 10 | Formateo de datos (II) |
| 11 | Formateo de datos (III) |
| 12 | Repaso | Datatón |
| 13 | Integración de datos (I) |
| 14 | Integración de datos (II) |
| 15 | Repaso | Datatón | Práctica Calificada 3 (04.12.21) |
| 16 | No hay clases por examen final |
Luego de haber llevado el curso de Estadística, todos deben tener instalado el programa, pero por si las dudas, les dejamos nuevamente los instaladores.
Primero debe instalar R. Podrán encontrar los instaladores para distintos sistemas operativos en la siguiente dirección: https://cran.r-project.org/
Luego R Studio. Una vez instalado el programa, podemos instalar su entorno de desarrollo integrado: R studio. Podrán encontrar los instaladores para distintos sistemas operativos en la siguiente dirección: https://rstudio.com/products/rstudio/download/#download
Recuerden que antes de comenzar a hacer operaciones con R necesitamos definir nuestro lugar de trabajo. Para esto tenemos dos alternativas.
Para ver nuestro lugar de trabajo actual escribimos el siguiente comando:
getwd()
## [1] "D:/Cursos/Cursos GR/Finalizados/2021-2 Curso Estadistica 2 PUCP/Clase practica 1"
Para una mejor experiencia, pueden crear una carpeta en la cual trabajá a lo largo del curso. La ruta a través del menú es: Session > Set Working Directory > Choose Directory. Esto abrirá una ventana emergente, donde buscaremos la carpeta en la cual vamos a trabajar, la seleccionamos y apretamos “Open”.
Si queremos verificar el cambio, volvemos a digitar la función “getwd()” en la consola.
Otra opción en crear un proyecto. Al crearlo todos los ficheros quedan vinculados directamente al proyecto. Para crear un proyecto seleccione la ruta: File > New project… Se abrirá la siguiente ventana:
Para crear un proyecto en un nuevo directorio, hacemos clic en el botón New Directory. Seguidamente, seleccionamos el tipo de proyecto, en nuestro caso Empty Project. Ahora, asignamos un nombre al directorio (carpeta) que se va a crear y que al mismo tiempo será el nombre del proyecto de R. Para terminar, hacemos clic en el botón Create Project. Al seguir este proceso se habrá creado una carpeta en Documentos y un fichero nombre_carpeta.Rproj.
Para crear un proyecto en una carpeta que ya existe, hacemos clic en el botón Existing Directory y después seleccionamos la carpeta ayudándonos del Browse.. si fuera necesario. Una vez elegida la carpeta, clicamos en Create Project.
Para abrir un proyecto hacemos doble clic sobre el archivo con extensión .Rproj o lo abrimos desde el menú de RStudio: File > Open Project…
Ventaja de los proyectos: cualquier fichero que creemos (script de R, documento de Rmarkdown, etc.) y guardemos se guardará en la carpeta del proyecto.
Vamos a requerir que se creen una cuenta en GitHub. GitHub permite alojar proyectos utilizando el sistema de control de versiones Git. Se utiliza principalmente para la creación de código fuente de programas de ordenador. Para fines de este curso, vamos a utilizar Github como repositorio para cargar nuestras bases de datos, administrar nuestros archivos etc.
Créese una cuenta en Github:
Ingrese a esta dirección: https://github.com/
Si quiere saber más de GitHub visite:
https://www.youtube.com/watch?v=Uw8SIaAK-vw&t=134s
Github como repositorio
En la parte superior derecha seleccione “+”, seleccione “New repository” y siga los pasos precisando el nombre del respositorio, descripción (opcional),elija la visibilidad del repositorio (publico o privado), y ¡cree su repositorio!
Cargue archivos seleccionando Add file > Upload files > Choose your files > Commit changes
Si quiere profundizar más sobre el GitHub como repositorio:
Vamos a trabajar en archivos R markdown (Rmd), pero para presentarlos de una manera amigable, podemos exportarlos en formato PDF, Html o en una página web.
Para una mejor experiencia, antes de exportar a PDF, deberá instalar lo siguiente desde su consola:
install.packages(‘tinytex’)
tinytex::install_tinytex()
Asimismo, para un Knit a una página web, utilizaremos Rpubs, por lo que deberán crearse una cuenta: https://rpubs.com/users/new
Recomendación: Cuando creen sus archivos Rmd, que estos no contengan en su nombre caracteres como tildes, símbolos, etc, eso no les permitirá hacer un knit en la web.
Finalmente, en muchas ocasiones necesitamos ayuda sobre cómo funciona una determinada función, cuáles son sus argumentos, etc.
help(mean)
## starting httpd help server ... done
?mean
mean # y pulsamos la tecla F1
## function (x, ...)
## UseMethod("mean")
## <bytecode: 0x00000000155e3610>
## <environment: namespace:base>
Tambien pueden consultar algunas webs que ofrecen ayuda: