Usando los datos y el script como guía haga un breve análisis de los tiempos de reincidencia criminal. Replique los resultados adjuntos e interprete. Importamos librerias
library(tidyverse)
Registered S3 methods overwritten by 'dbplyr':
method from
print.tbl_lazy
print.tbl_sql
-- Attaching packages ---------------------------------------------------- tidyverse 1.3.1 --
v ggplot2 3.3.5 v purrr 0.3.4
v tibble 3.1.4 v dplyr 1.0.7
v tidyr 1.1.4 v stringr 1.4.0
v readr 2.0.2 v forcats 0.5.1
-- Conflicts ------------------------------------------------------- tidyverse_conflicts() --
x dplyr::filter() masks stats::filter()
x dplyr::lag() masks stats::lag()
library(survival)
library(survminer)
Loading required package: ggpubr
Registered S3 method overwritten by 'data.table':
method from
print.data.table
Attaching package: 㤼㸱survminer㤼㸲
The following object is masked from 㤼㸱package:survival㤼㸲:
myeloma
library(flexsurv)
library(dplyr)
library(ggplot2)
Evento ser rearestado despues de prision
El seguimiento duro tres años
Importamos datos
henning <- read.csv("C:/Users/doria/OneDrive/Escritorio/Cuestionario_2/PRACTICA DE SUPERVIVENCIA/data/Henning.txt", sep="")
Encabezados
head(henning)
id ientificacion del preso
months cuantos meses tarda la persona en ser rearrestada
censor indica si se censuro o no la persona ,1 obserbaste y no ocurrio el evento, 0 si ocurrio el evento
naturaleza del registro criminal
personal, 1 ,antecednetes criminales con respecto a personas
propeti, 1, antecednetes criminales con respecto hacia una propiedad
cage, edad centrada, diferencia entre edad y edad promedio
Explicar evento respecto a edad
Evento de interes ser arrestado
Creamos la variable event (evento)
henning <- henning %>%
mutate(event = case_when(
censor == 0 ~ 1,
TRUE ~ 0
))
Agrupamos
henning %>%
group_by(event) %>% # agrupamos por evento
summarise(avg_months = mean(months), # tiempo promedio de censura
avg_personal = mean(personal),# tiempo promedio incidente persona
avg_property = mean(property),# tiempo promedioincidente propiedad
avg_cage = mean(cage))# proemdio edad centrada
NA
Funcion intro_surv grafica si la variable es censurada o no
intro_surv
intro_surv<- function(data=NULL,n=NULL){
muestra=sample_n(data,n) # seleccionamos una muestra de n
muestra$id=seq(1,n)# renombramos los id
time=muestra$months
event=muestra$event
ggplot(muestra)+
geom_point(aes(x =id, y = time, shape= as.factor(event)))+
geom_linerange(aes(x =id, ymin = 0, ymax = time), linetype = "dotdash")+
theme_classic()+
labs(title ='Survival times plot',
shape = 'Event',
x = 'sample',
y='Times')+
coord_flip()
}
llamamos la funcion, n=10
intro_surv(data=henning,n=10)

Objeto de sobrevivencia
Regresion entre el logaritmo de la supervivencia y los tiempos
sfit <- survfit(Surv(months, event) ~ 1, data = henning)
Graficacion simple
plot(sfit)

Graficando con ggsurplot
Probabilidad sobrevivencia S(t)
ggsurvplot(sfit, data = henning)


Riesgo acumulada de hazard H(t)
ggsurvplot(sfit, data = henning, fun = "cumhaz")


Estimadores de la Función de Riesgo Acumulada
Regresion entre el logaritmo de la supervivencia y los tiempos
diagnos_surv <- function(times= NULL, surv=NULL) {
data.frame(times = times, surv = surv) %>%
ggplot()+
geom_point(aes(x = log(surv), y = times))+
geom_smooth(aes(x = log(surv), y = times), method = "lm")+
theme_classic()
}
llamamos la funcion
diagnos_surv(times=sfit$time,surv=sfit$surv)

Aproximacion con lineas exponencial Exponencial diagnostico
Seguimiento, relacionado con personas
0 Aquellos que no cometen crimenes en contra de personas 1 Aquellos que cometen crimenes en contra de personas
sfit_personal <- survfit(Surv(months, event) ~ personal, data = henning)
ggsurvplot(sfit_personal, data = henning)


Seguimiento, relacionado con propiedad
0 Aquellos que no cometen crimenes en contra de propiedades 1 Aquellos que cometen crimenes en contra de propiedades
sfit_property <- survfit(Surv(months, event) ~ property, data = henning)
ggsurvplot(sfit_property, data = henning)


Calculamos la distancia entre las curvas
Las curvas con discretas
max_distancia <- function(sfitp = NULL,p=NULL) {
# Strata primeros valores
f1 <- sfitp$strata[1]
# strata valor final
f2 <- length(sfitp$surv)
#obtenemos tiempo y supervivencia de los 2 conjuntos
t1<-sfitp$time[1:f1]# tiempo pesonal
s1<-sfitp$surv[1:f1]# sobrevivencia 1
t2<-sfitp$time[(f1+1):f2]# tiempo 2
s2<-sfitp$surv[(f1+1):f2]# sobrevivencia 2
#suavizamos ambas funciones de supervivencia y las evaluamos sobre el mismo conjunto
s1aprox <- approxfun(s1,t1)
s2aprox <- approxfun(s2,t2)
df1<-data.frame(s=s2,ta1=s1aprox(s2), ta2=s2aprox(s2))
# diferencia entre los tiempos para las funciones suavizadas
df1$distancia<-abs(df1$ta1-df1$ta2)
# Eliminamos NAs
df1 <- df1[!is.na(df1$distancia),]
# Conservamos las S(t)>p
df<-df1[df1$s>p,]
# Obtenemos la mayor de las distancias entre las gráficas
maxima<-max(df1$distancia)
# Seleccionamos el renglon que corresponda a la distancia maxima
d<-df1[df1$distancia==maxima,]
max<-as.character(round(maxima,6))
max
grafica<-ggplot()+
geom_step(aes(t1,s1, color="1"),size=0.5)+# personal=0
geom_step(aes(t2,s2, color="0"),size=0.5)+# persoaml=1
labs(title=paste("Máxima Distancia entre","personal=0","y","personal=1", sep = " "),
x="Tiempo", y="St")+
theme_classic()+ # graficamos puntos maximo
geom_hline(yintercept = d$s, linetype="dashed", color = "gray50", size=0.7)+
labs(color = "blue") +
geom_vline(xintercept = d$ta1, linetype="dashed", color = "gray50", size=0.7)+
geom_vline(xintercept = d$ta2, linetype="dashed", color = "gray50", size=0.7)+
annotate("text", x =min(d$ta1,d$ta2), y = d$s+0.02, label = paste("Distancia=",max,sep =""))
return(grafica)
}
Con respecto a personas
max_distancia(sfitp =sfit_personal,p=0.5)
collapsing to unique 'x' valuescollapsing to unique 'x' values

Con respecto a propiedad
max_distancia(sfitp =sfit_property,p=0)
collapsing to unique 'x' valuescollapsing to unique 'x' values

