Taller: Módulo de Softwares para el manejo de
datosPrograma Internacional de Estadística aplicada
a la Investigación Científica 2da EdiciónInstructora: Linda Cabrera OrellanaAbril, 2023
Cree un archivo rmarkdown con salida tipo
html_document, con el objetivo de que al final su taller
resuelto sea publicado en RPubs. Siga los siguientes pasos
en orden, en cada respuesta debe mostrar el código que utiliza para
obtener el resultado.
Ejercicio 1.
Cargue a RStudio el conjunto de datos “pinguinos” del paquete
datos. pinguinos incluye medidas de especies de
pingüinos de las islas del Archipiélago de Palmer, incluye tamaño (largo
de aleta, masa corporal, dimensiones de pico) y sexo de los pinguinos.
Muestre la siguiente tabla donde se visualicen las 5 primeras
observaciones del conjunto de datos.
Tabla 1. Conjunto de datos Pinguinos
especie
isla
largo_pico_mm
alto_pico_mm
largo_aleta_mm
masa_corporal_g
sexo
anio
Adelia
Torgersen
39.1
18.7
181
3750
macho
2007
Adelia
Torgersen
39.5
17.4
186
3800
hembra
2007
Adelia
Torgersen
40.3
18.0
195
3250
hembra
2007
Adelia
Torgersen
NA
NA
NA
NA
NA
2007
Adelia
Torgersen
36.7
19.3
193
3450
hembra
2007
Ejercicio 2.
Revise la estructura del conjunto de datos pinguinos.
Hoy aprenderás un nuevo paquete para generar un resumen estadístico
de tus datos. Instala la librería modelsummary) y con la
función datasummary_skim() genera el siguiente resumen de
datos y responde a las siguientes preguntas:
Unique (#)
Missing (%)
Mean
SD
Min
Median
Max
largo_pico_mm
165
1
43.9
5.5
32.1
44.5
59.6
alto_pico_mm
81
1
17.2
2.0
13.1
17.3
21.5
largo_aleta_mm
56
1
200.9
14.1
172.0
197.0
231.0
masa_corporal_g
95
1
4201.8
802.0
2700.0
4050.0
6300.0
anio
3
0
2008.0
0.8
2007.0
2008.0
2009.0
¿Cuánto miden en promedio el largo y alto de los picos de los
pinguinos de la muestra?
¿Cuál es el peso corporal máximo de los pinguinos de la
muestra?
Ejercicio 5.
Recree el código en R para generar la siguiente tabla que muestra el
mínimo, el máximo y la media aritmética de las medidas del largo de las
aletas de los pinguinos, clasificada por especie.
Tabla 2. Medidas de las aletas de los pinguinos de la muestra por
especie
especie
mínimo
máximo
media
Adelia
172
210
189.95
Barbijo
178
212
195.82
Papúa
203
231
217.19
Ejercicio 6.
Con el paquete modelsummary puede generar tablas con
más información que la anterior y con una mejor estructura. Utilice la
función datasummary() del paquete modelsummary
y recree el código para generar la siguiente tabla. No se olvide
consultar la ayuda para conocer los argumentos y parámetros que contiene
la función.
Adelia
Barbijo
Papúa
Mean
SD
Mean
SD
Mean
SD
Largo aleta (mm)
189.95
6.54
195.82
7.13
217.19
6.48
Largo pico (mm)
38.79
2.66
48.83
3.34
47.50
3.08
Alto pico (mm)
18.35
1.22
18.42
1.14
14.98
0.98
Masa corporal (g)
3700.66
458.57
3733.09
384.34
5076.02
504.12
Visualización de datos
Ejercicio 1.
Recree el código R para generar la siguiente gráfica que muestra la
distribución de los datos sobre la longitud de las aletas de los
pinguinos de la muestra clasificado por especie y por isla, puede
modificar la estética a su gusto.
Ejercicio 2.
Si usted desea visualizar la relación que existe entre el largo del
pico y el largo de la aleta de los pinguinos por especie. ¿Qué gráficos
utilizaría?. Genere el gráfico que usted considere pertinente para
cumplir con su objetivo, agregue el tema, colores y estética
necesaria.
Enviar únicamente el link de RPubs de la resolución publicada
al correo lindaj.cabrera@gmail.com hasta el domingo 7 de
mayo de 2023.
Nota: Este documento fue elaborado con el tema
leonids del paquete prettydoc.