Modelos Estadísticos. Grado Biotecnología



Introducción


En esta práctica vamos a poner en práctica lo aprendido en el correspondiente tema teórico. Para ejemplificar los diferentes procesos vamos a utilizar los bancos de datos airquality (Chambers et al. 1983) y LSADATA (Daniel 2005) (pag. 403) que vienen descritos en el tema de introducción de la materia. Para realizar esta práctica debes utilizar los conjunto de sentencias presentados en la sesión teórica de este tema. Copia dichas sentencias en tu propio script y modifícalas a conveniencia en función del ejercicio solicitado.

Cargamos la librerías y los datos que vamos a utilizar

library(tidyverse)
library(stringr)
library(forcats)
library(lubridate)
library(magrittr)
library(broom)
library(datasets)
airquality
dim(airquality) 
View(airquality)
lsadata = read_csv("https://goo.gl/FwMcTu", col_types = "idddd")
dim(lsadata)
View(lsadata)

airquality


Para este conjunto de datos debes realizar las siguientes operaciones de procesado original:

  1. Recodifica la variable Month para que en lugar del número del mes aparezca su nombre.
  2. Ordena el conjunto total de datos por la variable que mide la radiación solar (en orden descendente).
  3. Selecciona las observaciones correspondientes al mes de junio en indica cuantas observaciones has seleccionado.
  4. Ordena el conjunto de datos seleccionado por la variable que mide la radiación solar (en orden descendente).
  5. Crea una nueva variable (en el banco de datos global) que mide el ratio entre la radiación solar y la temperatura.
  6. Ordena el banco de datos por esa nueva variable (en orden descendente).
  7. Crea un nuevo banco de datos seleccionando todas las variables que no hacen referencia a la escala temporal de mediciones.

LSADATA


Este banco de datos no contiene en cada fila la información de un sujeto sino la información de cuatro sujetos (uno por cada grupo en el que se encuentra asignado cada sujeto). Para este conjunto de datos realiza las siguientes operaciones de procesado original:

  1. Reorganiza los datos para que en la base de datos aparezca una variable identificando el tratamiento y otra con el nivel de suero de cada sujeto. Recuerda que cada fila del banco de datos debe hacer referencia a la información de un único sujeto. Obtén el número de observaciones en el nuevo banco de datos.
  2. Del nuevo conjunto de datos selecciona la información de los sujetos correspondientes a los grupos A y B. Obtén el número de observaciones en el nuevo banco de datos.

Bibliografía


Chambers, J. M., W. S. Cleveland, B. Kleiner, and P. A. Tukey. 1983. Graphical Methods for Data Analysis. Wadsworth.

Daniel, Wayne W. 2005. Biostatistics. Eighth Edition. Wiley.


Copyright © 2018 Javier Morales. Universidad Miguel Hernández de Elche.