EJERCICIO 1
Utilizando las funciones citadas en este Laboratorio, comprobad qué
paquetes tenéis instalados en vuestra versión de
RStudio e instalad el paquete MASS y el
paquete Survival y comprobad la información
que contienen.
Buscad información sobre el paquete Rcmdr (R Commander) desde la
consola.
EJERCICIO 2
1. Importad un archivo de texto y buscad un summary() de
tres variables que escojáis.
2. Importad un archivo “.csv” y buscad un fivenum() de dos
variables que os parezcan relevantes para el estudio.
EJERCICIO 3
A partir del conjunto de datos anorexia del paquete MASS,
que corresponden a los datos de cambio de peso de pacientes jóvenes con
anorexia, mostrad los tipos de datos que contiene y comprobad si existen
valores NA y NULL. Para la variable Treat, transformad los valores
«CBT», «Cont» y «FT» en «Cogn Beh
Tr», «Contr» y «Fam Tr», respectivamente.
EJERCICIO 4
1. Exportad los datos biopsy del paquete MASS a un
archivo «.csv.».
2. Exportad los datos melanoma del paquete
MASS a archivos de tres diferentes formatos y comprobad que se
han creado los diferentes archivos en los formatos y las rutas
especificados. Podéis generar una captura de pantalla de su ubicación en
la carpeta.
3. Generad un resumen (summary) de la variable
age de melanoma y guardad la salida que os aparece en un
documento .doc
EJERCICIO 5
En el siguiente ejemplo veremos cómo utilizar diferentes operadores
sobre el conjunto de datos birthwt, así como también algunas funciones
que nos permiten obtener más información de las variables:
1. ¿Cuál es la edad máxima de las madres del conjunto de datos?
2. ¿Cuál es la edad mínima de las madres del conjunto de datos?
3. ¿Cuál es el rango de edad de las madres?
4. ¿Fumaba la madre cuyo recién nacido era el de menor peso?
5. ¿Cuánto pesó el recién nacido cuya madre tenía la edad
máxima?
6. Listad los pesos de los recién nacidos, cuyas madres visitarán
menos de dos veces al médico durante el primer trimestre.
EJERCICIO 6
A partir del conjunto de datos anorexia trabajado en
apartados anteriores, cread una matriz que tenga como columnas los
valores de Prewt y Postwt, y cada fila sean los valores correspondientes
para cada posición.
EJERCICIO 7
Copia el código siguiente en tu consola para generar un data frame
con veinticinco registros y seis variables, y responde a los siguientes
apartados:
1. Seleccionad los registros con edad > 22.
2. Seleccionad el elemento 3 de la columna 4 del conjunto de datos
(contando el identificador).
3. Usad el comando subset() para seleccionar todas las
filas que tienen una edad menor que 27 años y sin incluir la columna
Alt.
EJERCICIO 8
Incorporad el dataset ChickWeight que
contiene información sobre el peso de 578 pollitos en gramos
(weight), el tiempo desde la medición al nacer (Time),
una variable identificadora de cada pollito (Chick) a partir
del rango de peso y una variable factor con el tipo de dieta
experimental que cada pollito recibió (Diet).
1. Incorporad el conjunto de datos
ChickWeight del paquete
datasets a vuestro entorno de trabajo.
2. Generad un gráfico de dispersión de la variable
weight.
3. Cread un diagrama de caja con la variable Time.
EJERCICIO 9
A partir del conjunto de datos anorexia del paquete
MASS, cread otro data frame que se llame
anorexia_treat_df formado por Treat y por un vector
nuevo calculado a partir de la diferencia Prewt-Postwt. De esta
manera, nos quedará un data frame que contenga el tipo de tratamiento y
el valor del peso ganado o perdido después de haber realizado el
tratamiento. Seleccionad aquellos individuos que han ganado peso después
del tratamiento y cread un nuevo conjunto llamado
anorexia_treat_C_df que contenga solo los datos de
aquellos que han seguido el tratamiento «Cont» y que han ganado peso
después del tratamiento.
EJERCICIO 10
Entrad en RPubs y registraros. Crearos un perfil y subid un
documento R Markdown. Los prerequisitos son tener instalado R y RStudio
(v0.96.230 o más), y el paquete knitr (v0.5 o más).
Para conocer la versión de Rstudio que tengo
instalada, uso los siguientes comandos, pero programo de manera que solo
se pueda ver en el archivo final el código y no el resultado (ya que al
conocer las características de knitr salen demasiadas líneas y harían un
documento muy largo):
# Para conocer la versión de R
sessionInfo()
# Para conocer la versión de Rstudio
#RStudio.Version()
# Oculto esta función porque me da errores al hacer knit, pero al hacerla en el entorno de Rstudio, no tengo problemas y obtengo que la versión es: ‘2025.9.2.418’.
# Para conocer la versión del paquete
packageDescription("knitr")
Con esto, compruebo que tengo versiones más recientes del programa y
del paquete, al haber hecho en el chunk FALSE, no se ve el resultado del
mismo, por tanto, dejo por aquí las versiones: R 4.5.2
(2025-10-31 ucrt); Rstudio ’2025.9.2.418’y
knitr 1.50.
Pasos que tenéis que seguir para publicar vuestro documento:
1. En RStudio, cread un documento R
Markdown.
2. Generad el documento con Knit.
Aprovechando la lectura y escritura de los enunciados, uso este
documento R Markdown para publicarlo.
3. En la ventana de previsualización, clicad el botón de
publicar.
Como solución de vuestro ejercicio, copiad el enlace de vuestra
página de prueba de RPubs.
CASO PRÁCTICO
Resolved los siguientes apartados:
1. Cread un conjunto de datos inventado con R. Debe contener treinta
observaciones (quince para hombres y quince para mujeres) para seis
variables con estas características:
2. Buscad información de vuestro conjunto de datos y de vuestras
variables.
3. Cread una nueva variable a partir de alguna de las que tengamos.
Por ejemplo, podéis calcular el IMC (IMC = peso (kg)/ [estatura
(m)]^2 e incluid la nueva variable en el conjunto de
datos.
4. Cread dos data frames diferenciados para hombres y mujeres con
dos nombres diferentes: Df_Hombres y
Df_Mujeres.
5. Combinad de nuevo los dos ficheros anteriores y cread el primero
de nuevo con el comando rbind().