una carpeta Ejercicio_1
el material relativo a Clase 1. Atención que los archivos .Rmd no se bajan, sino se abren y se necesita copiar y pegar el contenido en un archivo de texto, con extensión .Rmd.
en la carpeta cliqueando sobre este archivo Ejercicios_1.Rmd mismo.
Para leer un archivo de tipo .ods se necesita el paquete readODS, los cuales ya fueron instalados:
Una vez instalado en el menu Help a la derecha buscar readODS, leer la Overview propuesta, luego abrir readODS::readODS-package y cliquear sobre el index al fundo.
La función read_ods() sirve para leer una hoja de un archivo con formato .ods o .fods y devolver su contenido como un data frame en R.
Parámetros principales de read_ods() . path: ruta o nombre del archivo que se desea leer. . sheet: nombre o número de la hoja que se quiere importar. . col_names: indica si la primera fila contiene los nombres de las columnas. col_types: permite definir el tipo de dato de cada columna. na: especifica qué valores deben considerarse como datos faltantes (NA). skip: número de filas que se omiten antes de empezar la lectura. range: permite leer solo un rango específico de celdas. row_names: indica si la primera columna debe usarse como nombres de filas. trim_ws: elimina espacios en blanco al inicio y al final de los textos. n_max: define el número máximo de filas que se van a leer.
head(), str(), rownames() y colnames(), anotando aquí brievemente su empleo.
escribendo aquí un resumen de la hoja Metadata donde se explican los datos.
These data report nesting and breeding characters of 96 Great Britain’s ## De Eggsorg.ods colgar la hoja Data colocar su contenido en eggs y mostrar su estructura (comando str).
Nóte-se que conviene tener los datos como data.frame, mientras que read_ods() proporciona un tibble (que no tiene etiquetas de las filas), una estructura un poco diferente, así que se necesita la opción as_tibble=FALSE en la función read_ods.
as_tibble=FALSE y la lista de las variables, con el comando colnames().
Nóte-se que Eggs y Hatch son indicados as veces como intervalo, mientras Nesting ground es múltiple y se puede borrar en seguida.
para extraer los dos valores del intervalo, tirando el “-” los dos valores (o uno se es solo) deberían estar en una lista compuesta de una lista de uno o dos valores). Comentar al comando.
Aquí se necesita tirar “-” y por cada observación hay un vector con mínimo y máximo en una lista.
para transformar con la función as.numeric() los valores de la lista conseguida: se puede aplicar lapply a la función strsplit mesma: lapply(strsplit(…),…) Comentar al comando.
Aqui la función tiene que ser as.numeric()
a Eggs y Hatch y construir nuevas M_Eggs y M_Hatch eligendo el máximo con max() por cada observación de las listas (max() tira el máximo de cada vector de la lista de observaciones: aquí se necesita emplear for (i in 1:n) max(lista[[i]]).
incluir en egg en lugar de Eggs y Hatch y tirar Nesting ground, formando new_eggs. No olvidar los nombres de las filas!
Del archivo Eggsorg.ods, colgar la hoja “Orders” en un data.frame.
que asocia a cada familia en new_eggs la misma familia en orders y luego emplearlo tomando el order correspondiente en orders, así construyendo la nueva variable new_eggs$Order y guardar todo en Eggs.ods:
y escribir aquí los metadatos, tirados de la hoja misma o sino de la clase. Luego colocar los datos en el data.frame SudAmerica, empleando read_ods() con las opciones necesarias.
Hacer la regresión indicada en la clase:
considerando como criterio la variable WinningPerc, Porcentaje de gano y como regresor BattingAvg, Promedio de bateo.
Escribir antes el contenido de los metadatos, correr la regresión, los gráficos y comentar los resultados de manera análoga al caso precedente.
Empleando los datos Eggs correr una regresión múltiple intentando de explicar el peso de los huevos con las demás variables numéricas. Nóten que en la fórmula de lm() los regresores se “suman” colocando el “+” entre ellos.
Incluir los metadatos y intentar de comentar los resultados.
con el comando knitr, guardar los archivos .Rmd y .html y enviar-los a sergio@camiz.it dentro del 4 de Abril a las 23:59.