Modelos Estadísticos. Grado Biotecnología

Introducción

Cargamos la librerías y los datos que vamos a utilizar

library(tidyverse)
library(stringr)
library(forcats)
library(lubridate)
library(magrittr)
library(broom)
library(datasets)

airquality

Para este conjunto de datos debes realizar las siguientes operaciones de procesado original:

airquality
dim(airquality) 
View(airquality)
str(airquality)

Recodifica la variable Month para que en lugar del número del mes aparezca su nombre.

# Aseguramos en primer lugar que la varaible es factor
airquality$Month <- as.factor(airquality$Month)
# Recodificamos el factor
airquality <- mutate(airquality,      
                     Month = fct_recode(Month, "Mayo" = "5", 
                                          "Junio" = "6", 
                                          "Julio" = "7", 
                                          "Agosto" = "8", 
                                          "Septiembre" = "9"))

Ordena el conjunto total de datos por la variable que mide la radiación solar (en orden descendente).

arrange(airquality, desc(Solar.R))

Selecciona las observaciones correspondientes al mes de junio en indica cuantas observaciones has seleccionado.

bd <- filter(airquality, Month == "Junio")
dim(bd)

Ordena el conjunto de datos seleccionado por la variable que mide la radiación solar (en orden descendente).

arrange(airquality, desc(Solar.R))

Crea una nueva variable (en el banco de datos global) que mide el ratio entre la radiación solar y la temperatura.

airquality <- mutate(airquality, ratio = Solar.R/Temp)
airquality

Ordena el banco de datos por esa nueva variable (en orden descendente).

arrange(airquality, desc(ratio))

Crea un nuevo banco de datos seleccionando todas las variables que no hacen referencia a la escala temporal de mediciones.

airqualitynew <- select(airquality, Ozone,Solar.R,Wind,Temp,ratio)
str(airqualitynew)

LSADATA

Este banco de datos no contiene en cada fila la información de un sujeto sino la información de cuatro sujetos (uno por cada grupo en el que se encuentra asignado cada sujeto). Para este conjunto de datos realiza las siguientes operaciones de procesado original:

lsadata = read_csv("https://goo.gl/FwMcTu", col_types = "idddd")
dim(lsadata)
View(lsadata)
str(lsadata)

Reorganiza los datos para que en la base de datos aparezca una variable identificando el tratamiento y otra con el nivel de suero de cada sujeto. Recuerda que cada fila del banco de datos debe hacer referencia a la información de un único sujeto. Obtén el número de observaciones en el nuevo banco de datos.

lsadatanew <- gather(lsadata,`A`,`B`,`C`,`D`, key = "Tratamiento", value = nivel)
str(lsadatanew)
dim(lsadatanew)

Del nuevo conjunto de datos selecciona la información de los sujetos correspondientes a los grupos A y B. Obtén el número de observaciones en el nuevo banco de datos.

lsadatanew2 <- filter(lsadatanew, Tratamiento == "A" | Tratamiento == "B")
dim(lsadatanew2)

Creación, Transformación y Selección de variables y sujetos

Introducción

airquality

LSADATA

Bibliografía