Curso de procesamiento de datos en R

Ejercicio 2

Este ejercicio acompaña a la guía de la sesión 2 sobre funciones, busca avanzar en el uso de funciones built-in comunes en R y desarrollar funciones propias.

El objetivo del ejercicio 2 es separar el dataset del ejercicio 1 en dos grupos en función de sus puntajes en narcisismo y comparar sus características. La

Completar las siguientes tareas:

Previo: abrir el script “ejercicio1”, cargar los datos del ejercicio 1 con la función load y decirle a R en qué directorio estamos trabajando [Session > Set Working Directory> To Source File Location] (ver instrucciones en ejercicio 1)

Parte A: Funciones Built-in

Ordenar los datos de datosLimpios en orden decreciente de narcisismo usando la función order. Almacenar la salida en una variable llamada “datosLimpiosOrdenados”. Para esto hay que seguir 3 pasos:

aplicar la función order sobre la columna de puntajes de narcisismo del data frame “datosLimpios” usando el argumento decreasing, y almacenar la salida de la función en una variable. Mirar la variable. Entenderla. [psst: es el índice de las filas originales de datosLimpios ordenado en función del puntaje en narcisismo].
usar la salida de la función anterior como índice de filas para reordenar el data frame “datosLimpios”, y almacenar el data frame reordenado bajo el nombre “datosLimpiosOrdenados”
corroborar que el data frame “datosLimpiosOrdenados” efectivamente quedó ordenado en función del narcisismo. Usar la función plot para visualizarlo, copiar este comando: plot(datosLimpiosOrdenados$NPI16TOTAL). Mirar la pestaña PLOTS.

Encontrar una función de R que devuelva las primeras 30 filas de un data frame. Encontrar una función de R que devuelva las últimas 30 filas de un data frame. Aplicarlas al data frame “DatosLimpiosOrdendos”" y almacenar la salida en una variable para cada una. Comparar los dos grupos con la función summary para cada variable. ¿En qué variables hay diferencias entre los grupos? ¿Esas diferencias son significativas? Tip: usar función t.test.

Parte B: Funciones definidas por usuario

En el punto 3 del ejercicio 1 encontramos outliers para una determinada columna del data frame “datosLimpios”. Si quisieramos hacer lo mismo para el resto de las columnas, ¿podemos convertir esta serie de comandos en una función definida por el usuario?

En este link se pueden encontrar las soluciones

Curso de procesamiento de datos en R - ejercicio 2

Camila Zugarramurdi

19 October 2016

Ejercicio 2

Parte A: Funciones Built-in

Parte B: Funciones definidas por usuario