Introducción
Dentro de esta unidad lo que buscamos es conocer algunos fundamentos para el manejo de R y facilitar su eso al evitar errores comunes. R sigue una sintaxis que se debe respetar, es decir, un orden o reglas para escribir las instrucciones que permiten la correcta ejecución de tareas. En esta unidad aprenderemos las funciones básicas de R; como asignar objetos, asignación de nombres y funciones. Conoceremos su entorno general y aprenderemos la importancia del uso de scripts para dar orden y facilitar la programación.
Interfaz de R
Una vez que hemos instalado R y antes de comenzar a realizar análisis y generar gráficas, es necesario que conozcamos la interfaz del software, cómo podemos personalizar la apariencia para sentirnos más cómodos mientras trabajamos y algunos consejos para ser eficientes con el uso de R.
Al abrir R lo primero que veremos es una ventana con cuatro cuadrantes, la cual luce mas o menos así:
• Editor de scripts: El cuadrante superior izquierdo es el editor de scripts, un script es un fichero de instrucciones, aquí podemos escribir todos los comandos que necesitemos para realizar nuestro análisis. La recomendación que te hacemos es que siempre trabajes con un script, si bien en algunas ocasiones podemos ejecutar algunas tareas directamente en la consola, es recomendable trabajar con un script. El código contenido en ellos se puede guardar, asegurando que el trabajo que desarrolles estará disponible para después.
• Entorno / historial: En este panel está compuesto por el entorno, donde se irán guardando los objetos con los que trabajemos y por el historial, en donde se registrarán todas las instrucciones ejecutadas.
• Consola de comandos / resultados: En la consola podemos escribir las instrucciones que deseamos realizan y el software las ejecutará inmediatamente, los resultados de las instrucciones que se ejecuten aparecen también en esta sección. El código que desarrolles en la consola no estará presente una vez que cierras R.
• Gráficas / ayuda / librerías: En el último cuadrante se encuentra un panel con diferentes opciones: explorador de archivos, gráficas, librerías y la ayuda.
Sí la primera vez que efectuaste R no observas los cuatro cuadrantes, no te preocupes. Del menú Archivo (o File si tu configuración es en inglés) selecciona Nuevo Archivo/R Script. Este generará el script, donde puedes empezar a escribir tu código.
2.1 Consejos En medida de lo posible, para cada tarea que deseas realizar usando R te recomendamos usar un script, para que el uso de los scripts sea eficiente y no te pierdas entre tanto código te damos algunos consejos:
• Al guardar un script, se claro con los nombres, ser demasiado vago con los nombres o muy especifico puede ser una desventaja, por ejemplo, para este curso puedes hacer una script por capítulo, incluye en el nombre de archivo el número del capítulo, así si deseas regresar a un ejercicio en específico puedas encontrar rápidamente en que capítulo se encuentra. Igualmente, trata de no incluir espacios en los nombres de los scripts, puedes usar en su lugar _. R es un lenguaje construido originalmente en inglés, por lo que la recomendación incluye no escribir acentos en los nombres de los scripts, con el fin de evitar complicaciones.
• Se recomienda siembre establecer un directorio de trabajo, esto lo puedes hacer directamente en la pestaña “session”, “set working directory”, se recomienda elegir una carpeta donde estén las bases de datos que utilizaras en tu análisis, esto te permitirá evitar escribir toda la dirección del archivo. La primera vez que usemos esta opción dentro del curso, te enseñaremos a detalle como hacerlo. Esta indicación tambien se puede ejecutar usando la función setwd(), más adelante te daremos mas detalles de su uso.
• Trata de incluir una descripción de lo que estas haciendo dentro del script, así si después de un tiempo retomas algún proyecto puedas recordar fácilmente lo que hacías, también es útil mientras vamos aprendiendo a usar nuevas funciones. Además, si compartes o utilizas un script de alguien más es más fácil entender su funcionamiento. Para escribir texto en el script utiliza el símbolo # al iniciar una línea, así R entenderá que es una línea de texto y no una instrucción.
2.2 Ejecutar un script
Para echar andar nuestro análisis, podemos decirle a R que ejecute todo el script o solo una parte al seleccionar las líneas que deseamos ejecutar y utilizar el atajo “ctrl + r”. Este atajo dependerá del sistema operativo de ti computadora, y habrá diferencias entre si usas iOS o Windows. Si el atajo no funciona, usa la flecha verde (Run) en la parte superior del panel donde está el script. Los resultados del proceso de ejecución de un script se podrán observar ya sea en la consola, en el entorno o en el panel de resultados, dependiendo del proceso que se ejecute.
Si existe algún error de sintaxis en nuestro código, R nos dará una advertencia, colocando una cruz roja al inicio de la línea donde encontró el error, esto facilita la depuración del código
** Manejo de objetos con R**
Para entender el funcionamiento básico de R, en este apartado vamos a desarrollar una serie de actividades sencillas que permiten familiarizarnos con la estructura de la sintaxis. En este caso y debido a que el código no es complejo, puedes escribirlo directamente en la consola o si lo prefieres, puedes crear tu primer script. Si decides crear el script no olvides las recomendaciones efectuadas y ejecutar el script para poder ver el resultado.
#1
#2
#3
Puedes crear objetos usando el operador asignación “<-”. Las entidades que utiliza R se llaman objetos, una entidad puede ser un valor, un número, una lista, un vector, una matriz, etc. Por ejemplo, en el capítulo anterior usamos el objeto enoe, el cual consistía en una base de datos contenida en un data frame.
En este ejemplo, el objeto “x” es el resultado de la operación 3*4:
Nota que al escribir únicamente el objeto x, R regresa el valor contenido. Todas las instrucciones para crear objetos requieren asignar un argumento, la sintaxis es la siguiente:
nombre_objeto <- valor
De esta forma el objeto nombre_objeto es igual a valor. A lo largo de este curso se utilizará mucho el operador asignación, puedes usar el atajo “Alt -” para ahorrar algo de tiempo al escribirlo. Nota que al usar el atajo “Alt -” para escribir el operador asignación, el software agrega de manera automática un espacio antes y después del operador, se aconseja utilizar estos espacios, pues facilitan la lectura del código.
Una vez creado un objeto, podemos manipular su valor o contenido según nuestras necesidades, esto evita generar nuevos objetos. Además, también podemos reemplazar su valor utilizando otros objetos como lo muestra el siguiente ejemplo:
#sobre escribir un objeto
#operaciones entre objetos
Lo que observamos es la construcción de una primera variable de nombre y la cual guarda el valor de tres veces pi. Esa variable y ha sido modificada reemplazando nuevamente su valor por lo contenido, más lo que vale x. Finalmente en un objeto de nombre z, hemos almacenado la suma de x con y. Si en algún momento sientes que has creado demasiados objetos, puedes inspeccionar los objetos almacenados ejecutando la siguiente instrucción en la consola:
objects() te dará una lista de los objetos que están disponibles. Para eliminar un objeto utilizamos la instrucción remove():
Puedes asegurarte que los objetos han sido eliminados, usando nuevamente objects().
Nombres
Los nombres de objetos pueden ser alfanuméricos, pero no comenzar con un número. Se recomienda que los nombres den una descripción breve de su contenido, puedes utilizar “_” para separar palabras y facilitar la lectura, por ejemplo:
Para inspeccionar el valor de un objeto, una vez creado, basta con escribir su nombre en la consola:
Los nombres importan, R es susceptible a mayúsculas y minúsculas y ortografía, es decir, los errores tipográficos son importantes. Debemos ser consistentes en los nombres que se asignen a los objetos.
Por ejemplo, si generamos un objeto y le asignamos la etiqueta nombre y mas tarde nos referimos a el, como Nombre, R nos mostrará un mensaje como el siguiente:
Funciones
R utiliza varias funciones que se construyen con la siguiente sintaxis:
Esta sintaxis indica que para usar este tipo de funciones es necesario escribir el nombre de la función y entre paréntesis los argumentos u objetos que requiere de entrada. En un ejemplo anterior utilizamos la función remove(), que utiliza este tipo de sintaxis
Probemos con otro ejemplo, la función seq(), la cual sirve para generar una secuencia de números.En la consola escribe se seguido de la tecla “Tab”, la herramienta de auto-completar nos ofrece varias opciones, puedes añadir una “q” o utilizar las fechas de navegación para buscar la función. Observa que al buscar pasar sobre la lista de funciones aparece una descripción emergente que provee de información sobre la misma. R auto-completa también uso de paréntesis, comillas y otros signos.
Utiliza la función seq(), para generar una secuencia de números de 1 a 10, con incrementos de uno en 1:
Utiliza la función seq(), para generar una secuencia de números de 1 a 10, con incrementos de uno en 1:
Al ejecutar esta instrucción notaras que en la consola aparece un signo “+”, el cual indica que la instrucción esta incompleta y R espera que la termines. Puede ser por falta de una comilla o un paréntesis, en nuestro ejemplo, se debe a la falta de una comilla. Podemos añadir el elemento faltante y se terminará de ejecutar la instrucción o su en caso presionar “Esc” para cancelar la instrucción.
Directorios y Proyectos de RStudio
Hemos dicho que es importante siempre escribir nuestro código en un script, pues nos permitirá regresar a el más tarde. La pregunta que surge es ¿dónde se guarda mi script? La respuesta a ello es que tus scripts estarán en el directorio que hayas fijado con el uso de setwd(), también ahí se encontrarán todos los archivos de datos que exportes. Una vez que has fijado un directorio, con la indicación setwd().
Observarás en el encabezado de la consola, una ruta que indica que el directorio ha sido establecido.
Al fijar el directorio es necesario incluir una trayectoria completa y en este caso existen dos diferencias fundamentales, dependiendo del sistema operativo que se utilice. Por ejemplo; Mac y Linux usan / para definir las trayectorias, mientras que Windows usa ****. En lo que te familiarizas con la forma en tu equipo requiere indiques la trayectoria hacía un directorio, puedes usar Fijar directorio en el menú session. En el siguiente capítulo haremos uso de esta indicación para comenzar a trabajar con nuestra primer base de datos.
Si en algún momento tienes duda sobre cual es el directorio de trabajo, sobre el cual se esta guardando la información, puedes usar el comando:
Cada vez que cierres completamente R, este te preguntará si deseas guardar el workspace, esto guardara todos los objetos creados que se encuentren en el enviroment. La recomendación es que nunca guardes tu workspace, ya que el objetivo de toda buena estructura de programación es que las ejecuciones se puedan replicar usando únicamente el código, el cual debe estar contenido completamente en tu script.
Actividad
Genera los objetos necesarios para que W sea el resultado del área de un triangulo.
Sí la base es 5 y la altura 10, ¿cuál es el valor del área del triangulo?
3.Genera una secuencia de números que tomen valores de 0.5 en 0.5 comenzando en 1 y terminando en 100.
#1
#2
#3