Tarea 1

Descripción estadística de un conjunto de datos

La base de datos cytomegalovirus que está dentro de la librería medicaldata es el resultado de la medición en un estudio de Cohorte retrospectivo para identificar los efectos del genotipo KIR del donante en la reactivación del citomegalovirus (CMV) después del trasplante alogénico mieloablativo de células madre hematopoyéticas.

(para mayor información ver en la ayuda del Rstudio la información del estudio y de las variables)

  1. Escriba el objetivo de los investigadores.

  2. Escriba una breve introducción (marco teórico) que ilustre clínicamente el fenómeno estudiado.

  3. Construya el cuadro operacional de variables.

  4. Teniendo en cuenta el objetivo de los investigadores, describa las características sociodemográficas y clínicas de los pacientes según la variable desenlace cmv. Para esto construya tablas y gráficos adecuados y analice estos a la luz del problema de investigción. Luego calcule los estadísticos de resumen para las variables medidas y construya una tabla resumen, como la tabla 1 de un artículo.

  5. Escriba un reporte de los resultados interpretando los estadísticos que considere más relevantes.

No olvide agregar la bibliografía que use para documentar el problema investigado.

Para llevar a cabo este taller en Rmarkdown visite https://bookdown.org/gboccardo/manual-ED-UCH/introduccion-al-uso-de-rmarkdown-para-la-compilacion-de-resultados-de-rstudio-en-diferentes-formatos.html

o https://rpubs.com/tereboca/informe_rmakrdown

Los pasos que sugiero sigan para llevar a cabo este ejercicio son:

  1. Cargar paquetes necesarios. Si no los tiene instalados vaya a Packages y seleccione de la lista con el nombre e instale.
library(haven)  # Import and Export 'SPSS', 'Stata' and 'SAS' Files
library(readxl) #Import datos Excel
library(labelled)
library(summarytools)
library(ggplot2)
library(kableExtra)  # Tablas
## Warning in !is.null(rmarkdown::metadata$output) && rmarkdown::metadata$output
## %in% : 'length(x) = 2 > 1' in coercion to 'logical(1)'
library(tableone) # Tablas
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following object is masked from 'package:kableExtra':
## 
##     group_rows
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggpubr)
library(medicaldata)

Abrir base de datos o cargar datos si están en R

Indique el directorio de trabajo, por ejemplo:

setwd(“C:/Users/Gilma/Documents/Taller_1”) Para esto vaya al menú de la barra superior y busque Session, allí Set working Directory y luegoTo Source file location ……así el R identifica donde está trabajando y le guardará sus archivos HTML cuando compile en este lugar.

carga de datos desde R: Cargue la librería donde están los datos. para este ejemplo la librería es medicaldata

data("cytomegalovirus")
str(cytomegalovirus)
## 'data.frame':    64 obs. of  26 variables:
##  $ ID                : num  1 2 3 4 5 6 7 8 9 10 ...
##  $ age               : num  61 62 63 33 54 55 67 51 44 59 ...
##  $ sex               : num  1 1 0 0 0 1 1 1 0 1 ...
##  $ race              : num  0 1 1 1 1 1 1 1 0 1 ...
##  $ diagnosis         : chr  "acute myeloid leukemia" "non-Hodgkin lymphoma" "non-Hodgkin lymphoma" "Hodgkin lymphoma" ...
##  $ diagnosis.type    : num  1 0 0 0 0 1 1 1 0 0 ...
##  $ time.to.transplant: num  5.16 79.05 35.58 33.02 11.4 ...
##  $ prior.radiation   : num  0 1 0 1 0 0 0 0 1 0 ...
##  $ prior.chemo       : num  2 3 4 4 5 0 2 0 3 2 ...
##  $ prior.transplant  : num  0 0 0 0 0 0 0 1 1 0 ...
##  $ recipient.cmv     : num  1 0 1 1 1 1 1 1 1 0 ...
##  $ donor.cmv         : num  0 0 1 0 1 1 1 1 1 0 ...
##  $ donor.sex         : num  0 1 0 1 0 1 1 0 1 0 ...
##  $ TNC.dose          : num  18.31 4.26 8.09 21.02 14.7 ...
##  $ CD34.dose         : num  2.29 2.04 6.97 6.09 2.36 6.91 3.66 3.9 7 2.52 ...
##  $ CD3.dose          : num  3.21 NA 2.19 4.87 6.55 2.53 3.66 7.27 2.59 2.52 ...
##  $ CD8.dose          : num  0.95 NA 0.59 2.32 2.4 0.86 0.17 1.95 NA 1.22 ...
##  $ TBI.dose          : num  200 200 200 200 400 200 400 400 200 400 ...
##  $ C1/C2             : num  0 1 0 0 0 0 0 0 1 1 ...
##  $ aKIRs             : num  1 5 3 2 6 2 1 2 2 4 ...
##  $ cmv               : num  1 0 0 0 0 1 0 0 1 0 ...
##  $ time.to.cmv       : num  3.91 65.12 3.75 48.49 4.37 ...
##  $ agvhd             : num  1 0 0 1 1 1 0 0 1 0 ...
##  $ time.to.agvhd     : num  3.55 65.12 3.75 28.55 2.79 ...
##  $ cgvhd             : num  0 0 0 1 0 0 0 0 1 1 ...
##  $ time.to.cgvhd     : num  6.28 65.12 3.75 10.45 4.37 ...

A partir de este momento usted debe procesar estadísticamente los datos para producir las tablas, gráficos y estadísticos adecuados.