Introduccion

Mi funcion recibe tres parametros: El parametro tiempo (columna de tiempo: años, dias, horas, etc), el parametro de fallo/censura (columna de ceros o unos) y la muestra (cantidad de individuos que vamos a observar). Una vez recibidos estos datos, la funcion busca dar como resultado una grafica donde se muestre, en este caso, quienes de los 10 individuos para cada una de las 3 bases de datos distintas (HR_comma_sep.csv, genfan, psych) han presentado fallo o censura, asignando un triangulo azul o una bola roja respectivamente. Es importante señalar que se necesita que la columna de fallo/censura sea una columna dicotomica-binaria, es decir, que solamente este compuesta por ceros y unos, donde 1 representa que hubo fallo y 0 que hubo censura. Tambien, como solo tomamos una muestra de 10, cada que hagamos una simulacion esta tomara 10 individuos de manera aleatoria, por lo que se utilizara el comando set.seed(123) donde se establecera la semilla 123, y con esto se podran realizar los ejemplos que se nos pidieron.

Funcion:

mifuncion <- function(tiempo, fallo, n){
  m <- data.frame(tiempo,fallo) %>%
    select(tiempo, fallo) %>%
    sample_n(n)
  
  ggplot(m) +
    geom_point(aes(y = m$tiempo,
                   x = 1:n,
                   shape = m$fallo %>% as.factor(),
                   colour = m$fallo %>% as.factor()),
               size = 3) +
    geom_linerange(aes(x = 1:n,
                       ymin = 0,
                       ymax = m$tiempo),
                   linetype = "dashed") +
    labs(x = "Observaciones",
         y = "Tiempo",
         shape = "Ocurrencia del evento",
         colour = "Ocurrencia del evento") +
    coord_flip()
}

Base de Datos “HR_comma_sep.csv”

setwd("/Users/HP/Desktop/MS&ST/Practica3")
a <- read.csv("HR_comma_sep.csv") 
z <- Surv(a$time_spend_company, a$left)
set.seed(123)
mifuncion(a$time_spend_company, a$left, 10)

Ejemplos

1.- Solo hubieron 2 individuos que presentaron la falla, el individuo 5 en t=6 y el individuo 7 en t=5.

2.- No hay censurados por la derecha tipo I.

3.- El resto de los que conforman la muestra presentan censura y como no hay informacion suficiente para decir que hubieron falsos positivos, diremos que hubo censura aleatoria.

Base de Datos “genfan”

data("genfan")
b <- genfan # %>% View()
y <- Surv(genfan$hours, genfan$status) 
set.seed(123)
mifuncion(b$hours, b$status, 10)

Ejemplos

1.- Solo el individuo 9 presento censura.

2.- El individuo 4 presenta censura por la derecha tipo I.

3.- El resto de los individuos en la muestra presentan censura y como no hay informacion suficiente para decir que hubieron falsos positivos, diremos que hubo censura aleatoria.

Base de Datos “psych”

data("psych")
c <- psych  # %>% View()
x <- Surv(psych$time, psych$death) 
set.seed(123)
mifuncion(c$time, c$death, 10)

Ejemplos

1.- La mitad de los individuos en la muestra presentan la falla.

2.- No se presento ningun caso con censura por la derecha tipo I.

3.- El primer individuo en presentar el fallo fue el individuo 4 en t perteneciente al intervalo (0,10).