Manipulación de datos

Cree un archivo rmarkdown con salida tipo html_document, con el objetivo de que al final su taller resuelto sea publicado en RPubs. Siga los siguientes pasos en orden, en cada respuesta debe mostrar el código que utiliza para obtener el resultado.


Ejercicio 1.

  1. Cargue a RStudio el conjunto de datos “pinguinos” del paquete datos. pinguinos incluye medidas de especies de pingüinos de las islas del Archipiélago de Palmer, incluye tamaño (largo de aleta, masa corporal, dimensiones de pico) y sexo de los pinguinos. Muestre la siguiente tabla donde se visualicen las 5 primeras observaciones del conjunto de datos.
Tabla 1. Conjunto de datos Pinguinos
especie isla largo_pico_mm alto_pico_mm largo_aleta_mm masa_corporal_g sexo anio
Adelia Torgersen 39.1 18.7 181 3750 macho 2007
Adelia Torgersen 39.5 17.4 186 3800 hembra 2007
Adelia Torgersen 40.3 18.0 195 3250 hembra 2007
Adelia Torgersen NA NA NA NA NA 2007
Adelia Torgersen 36.7 19.3 193 3450 hembra 2007

Ejercicio 2.

  1. Revise la estructura del conjunto de datos pinguinos.
## tibble [344 × 8] (S3: tbl_df/tbl/data.frame)
##  $ especie        : Factor w/ 3 levels "Adelia","Barbijo",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ isla           : Factor w/ 3 levels "Biscoe","Dream",..: 3 3 3 3 3 3 3 3 3 3 ...
##  $ largo_pico_mm  : num [1:344] 39.1 39.5 40.3 NA 36.7 39.3 38.9 39.2 34.1 42 ...
##  $ alto_pico_mm   : num [1:344] 18.7 17.4 18 NA 19.3 20.6 17.8 19.6 18.1 20.2 ...
##  $ largo_aleta_mm : int [1:344] 181 186 195 NA 193 190 181 195 193 190 ...
##  $ masa_corporal_g: int [1:344] 3750 3800 3250 NA 3450 3650 3625 4675 3475 4250 ...
##  $ sexo           : Factor w/ 2 levels "hembra","macho": 2 1 1 NA 1 2 1 2 NA NA ...
##  $ anio           : int [1:344] 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 ...

Ejercicio 3.

  1. Identifique las especies de pinguinos, las islas y los años de la información que contiene “pinguinos”.
## [1] Adelia  Papúa   Barbijo
## Levels: Adelia Barbijo Papúa
## [1] Torgersen Biscoe    Dream    
## Levels: Biscoe Dream Torgersen
## [1] 2007 2008 2009

Ejercicio 4.

  1. Hoy aprenderás un nuevo paquete para generar un resumen estadístico de tus datos. Instala la librería modelsummary) y con la función datasummary_skim() genera el siguiente resumen de datos y responde a las siguientes preguntas:
Unique (#) Missing (%) Mean SD Min Median Max
largo_pico_mm 165 1 43.9 5.5 32.1 44.5 59.6
alto_pico_mm 81 1 17.2 2.0 13.1 17.3 21.5
largo_aleta_mm 56 1 200.9 14.1 172.0 197.0 231.0
masa_corporal_g 95 1 4201.8 802.0 2700.0 4050.0 6300.0
anio 3 0 2008.0 0.8 2007.0 2008.0 2009.0
  1. ¿Cuánto miden en promedio el largo y alto de los picos de los pinguinos de la muestra?
  2. ¿Cuál es el peso corporal máximo de los pinguinos de la muestra?

Ejercicio 5.

  1. Recree el código en R para generar la siguiente tabla que muestra el mínimo, el máximo y la media aritmética de las medidas del largo de las aletas de los pinguinos, clasificada por especie.
Tabla 2. Medidas de las aletas de los pinguinos de la muestra por especie
especie mínimo máximo media
Adelia 172 210 189.95
Barbijo 178 212 195.82
Papúa 203 231 217.19

Ejercicio 6.

  1. Con el paquete modelsummary puede generar tablas con más información que la anterior y con una mejor estructura. Utilice la función datasummary() del paquete modelsummary y recree el código para generar la siguiente tabla. No se olvide consultar la ayuda para conocer los argumentos y parámetros que contiene la función.
Adelia
Barbijo
Papúa
Mean SD Mean SD Mean SD
Largo aleta (mm) 189.95 6.54 195.82 7.13 217.19 6.48
Largo pico (mm) 38.79 2.66 48.83 3.34 47.50 3.08
Alto pico (mm) 18.35 1.22 18.42 1.14 14.98 0.98
Masa corporal (g) 3700.66 458.57 3733.09 384.34 5076.02 504.12

Visualización de datos

Ejercicio 1.

  1. Recree el código R para generar la siguiente gráfica que muestra la distribución de los datos sobre la longitud de las aletas de los pinguinos de la muestra clasificado por especie y por isla, puede modificar la estética a su gusto.

Ejercicio 2.

  1. Si usted desea visualizar la relación que existe entre el largo del pico y el largo de la aleta de los pinguinos por especie. ¿Qué gráficos utilizaría?. Genere el gráfico que usted considere pertinente para cumplir con su objetivo, agregue el tema, colores y estética necesaria.

Enviar únicamente el link de RPubs de la resolución publicada al correo lindaj.cabrera@gmail.com hasta el miércoles 10 de abril de 2024.

Nota: Este documento fue elaborado con el tema leonids del paquete prettydoc.