Usando los datos y el script como guía haga un breve análisis de los tiempos de reincidencia criminal. Replique los resultados adjuntos e interprete. Importamos librerias
library(tidyverse)
Registered S3 methods overwritten by 'dbplyr':
method from
print.tbl_lazy
print.tbl_sql
-- Attaching packages ---------------------------------------------------- tidyverse 1.3.1 --
v ggplot2 3.3.5 v purrr 0.3.4
v tibble 3.1.4 v dplyr 1.0.7
v tidyr 1.1.4 v stringr 1.4.0
v readr 2.0.2 v forcats 0.5.1
-- Conflicts ------------------------------------------------------- tidyverse_conflicts() --
x dplyr::filter() masks stats::filter()
x dplyr::lag() masks stats::lag()
library(survival)
library(survminer)
Loading required package: ggpubr
Registered S3 method overwritten by 'data.table':
method from
print.data.table
Attaching package: 㤼㸱survminer㤼㸲
The following object is masked from 㤼㸱package:survival㤼㸲:
myeloma
library(flexsurv)
library(dplyr)
library(ggplot2)
Evento ser rearestado despues de prision
El seguimiento duro tres años
Importamos datos
henning <- read.csv("C:/Users/doria/OneDrive/Escritorio/Cuestionario_2/PRACTICA DE SUPERVIVENCIA/data/Henning.txt", sep="")
Encabezados
head(henning)
id ientificacion del preso
months cuantos meses tarda la persona en ser rearrestada
censor indica si se censuro o no la persona ,1 obserbaste y no ocurrio el evento, 0 si ocurrio el evento
naturaleza del registro criminal
personal, 1 ,antecednetes criminales con respecto a personas
propeti, 1, antecednetes criminales con respecto hacia una propiedad
cage, edad centrada, diferencia entre edad y edad promedio
Explicar evento respecto a edad
Evento de interes ser arrestado
Creamos la variable event (evento)
henning <- henning %>%
mutate(event = case_when(
censor == 0 ~ 1,
TRUE ~ 0
))
Agrupamos
henning %>%
group_by(event) %>% # agrupamos por evento
summarise(avg_months = mean(months), # tiempo promedio de censura
avg_personal = mean(personal),# tiempo promedio incidente persona
avg_property = mean(property),# tiempo promedioincidente propiedad
avg_cage = mean(cage))# proemdio edad centrada
NA
Funcion intro_surv grafica si la variable es censurada o no
intro_surv
intro_surv<- function(data=NULL,n=NULL){
muestra=sample_n(data,n) # seleccionamos una muestra de n
muestra$id=seq(1,n)# renombramos los id
time=muestra$months
event=muestra$event
ggplot(muestra)+
geom_point(aes(x =id, y = time, shape= as.factor(event)))+
geom_linerange(aes(x =id, ymin = 0, ymax = time), linetype = "dotdash")+
theme_classic()+
labs(title ='Survival times plot',
shape = 'Event',
x = 'sample',
y='Times')+
coord_flip()
}
llamamos la funcion, n=10
intro_surv(data=henning,n=10)

Objeto de sobrevivencia
Regresion entre el logaritmo de la supervivencia y los tiempos
sfit <- survfit(Surv(months, event) ~ 1, data = henning)
Graficacion simple
plot(sfit)

Graficando con ggsurplot
Probabilidad sobrevivencia S(t)
ggsurvplot(sfit, data = henning)


Riesgo acumulada de hazard H(t)
ggsurvplot(sfit, data = henning, fun = "cumhaz")


Estimadores de la Función de Riesgo Acumulada
Regresion entre el logaritmo de la supervivencia y los tiempos
diagnos_surv <- function(times= NULL, surv=NULL) {
data.frame(times = times, surv = surv) %>%
ggplot()+
geom_point(aes(x = log(surv), y = times))+
geom_smooth(aes(x = log(surv), y = times), method = "lm")+
theme_classic()
}
llamamos la funcion
diagnos_surv(times=sfit$time,surv=sfit$surv)

Aproximacion con lineas exponencial Exponencial diagnostico
Seguimiento, relacionado con personas
0 Aquellos que no cometen crimenes en contra de personas 1 Aquellos que cometen crimenes en contra de personas
sfit_personal <- survfit(Surv(months, event) ~ personal, data = henning)
ggsurvplot(sfit_personal, data = henning)


Seguimiento, relacionado con propiedad
0 Aquellos que no cometen crimenes en contra de propiedades 1 Aquellos que cometen crimenes en contra de propiedades
sfit_property <- survfit(Surv(months, event) ~ property, data = henning)
ggsurvplot(sfit_property, data = henning)


Calculamos la distancia entre las curvas
Las curvas con discretas
max_distancia <- function(sfitp = NULL,p=NULL) {
# Strata primeros valores
f1 <- sfitp$strata[1]
# strata valor final
f2 <- length(sfitp$surv)
#obtenemos tiempo y supervivencia de los 2 conjuntos
t1<-sfitp$time[1:f1]# tiempo pesonal
s1<-sfitp$surv[1:f1]# sobrevivencia 1
t2<-sfitp$time[(f1+1):f2]# tiempo 2
s2<-sfitp$surv[(f1+1):f2]# sobrevivencia 2
#suavizamos ambas funciones de supervivencia y las evaluamos sobre el mismo conjunto
s1aprox <- approxfun(s1,t1)
s2aprox <- approxfun(s2,t2)
df1<-data.frame(s=s2,ta1=s1aprox(s2), ta2=s2aprox(s2))
# diferencia entre los tiempos para las funciones suavizadas
df1$distancia<-abs(df1$ta1-df1$ta2)
# Eliminamos NAs
df1 <- df1[!is.na(df1$distancia),]
# Conservamos las S(t)>p
df<-df1[df1$s>p,]
# Obtenemos la mayor de las distancias entre las gráficas
maxima<-max(df1$distancia)
# Seleccionamos el renglon que corresponda a la distancia maxima
d<-df1[df1$distancia==maxima,]
max<-as.character(round(maxima,6))
max
grafica<-ggplot()+
geom_step(aes(t1,s1, color="1"),size=0.5)+# personal=0
geom_step(aes(t2,s2, color="0"),size=0.5)+# persoaml=1
labs(title=paste("Máxima Distancia entre","personal=0","y","personal=1", sep = " "),
x="Tiempo", y="St")+
theme_classic()+ # graficamos puntos maximo
geom_hline(yintercept = d$s, linetype="dashed", color = "gray50", size=0.7)+
labs(color = "blue") +
geom_vline(xintercept = d$ta1, linetype="dashed", color = "gray50", size=0.7)+
geom_vline(xintercept = d$ta2, linetype="dashed", color = "gray50", size=0.7)+
annotate("text", x =min(d$ta1,d$ta2), y = d$s+0.02, label = paste("Distancia=",max,sep =""))
return(grafica)
}
Con respecto a personas
max_distancia(sfitp =sfit_personal,p=0.5)
collapsing to unique 'x' valuescollapsing to unique 'x' values

Con respecto a propiedad
max_distancia(sfitp =sfit_property,p=0)
collapsing to unique 'x' valuescollapsing to unique 'x' values

---
title: "PRACTICA DE SUPERVIVENCIA"
author: "Cruz Mateo David"
date: ""
output:
  html_notebook:
    toc: yes
    toc_float: yes
  html_document:
    toc: yes
    toc_float: yes
---
Usando los datos y el script como guía haga un breve análisis de los tiempos de reincidencia criminal.
Replique los resultados adjuntos e interprete.
Importamos librerias
```{r}
library(tidyverse)
library(survival)
library(survminer)
library(flexsurv)
library(dplyr)
library(ggplot2)

```

Evento ser rearestado despues de prision

El seguimiento duro tres años

# Importamos datos
```{r}
henning <- read.csv("C:/Users/doria/OneDrive/Escritorio/Cuestionario_2/PRACTICA DE SUPERVIVENCIA/data/Henning.txt", sep="")
```

## Encabezados
```{r}
head(henning)
```


__id__  ientificacion del preso

__months__ cuantos meses tarda la persona en ser rearrestada

__censor__ indica si se censuro o no la persona ,1 obserbaste y no ocurrio el evento, 0 si ocurrio el evento

naturaleza del registro criminal

__personal__, 1 ,antecednetes criminales con respecto a personas

__propeti__, 1, antecednetes criminales con respecto hacia una propiedad

__cage__, edad centrada, diferencia entre edad y edad promedio

Explicar evento respecto a edad

Evento de interes ser arrestado

Creamos la variable  event  (evento)
```{r}
henning <- henning %>% 
  mutate(event = case_when(
    censor == 0 ~ 1,
    TRUE ~ 0
  ))
```

Agrupamos
```{r}
henning %>% 
  group_by(event) %>% # agrupamos por evento
  summarise(avg_months = mean(months), # tiempo promedio de censura
            avg_personal = mean(personal),# tiempo promedio incidente persona
            avg_property = mean(property),# tiempo promedioincidente propiedad
            avg_cage = mean(cage))# proemdio edad centrada

```


# Funcion intro_surv grafica si la variable es censurada o no
## intro_surv
```{r}
intro_surv<- function(data=NULL,n=NULL){
    muestra=sample_n(data,n) # seleccionamos una muestra de n
    muestra$id=seq(1,n)# renombramos los id
    time=muestra$months
    event=muestra$event
    ggplot(muestra)+
    geom_point(aes(x =id, y = time,  shape= as.factor(event)))+
    geom_linerange(aes(x =id, ymin = 0, ymax = time), linetype = "dotdash")+
    theme_classic()+
    labs(title ='Survival times plot',
         shape = 'Event',
         x = 'sample',
         y='Times')+
    coord_flip()
}
```

## llamamos la funcion, n=10
```{r}
intro_surv(data=henning,n=10)
```

# Objeto de sobrevivencia

## Regresion entre el logaritmo de la supervivencia y los tiempos
```{r}
sfit <- survfit(Surv(months, event) ~ 1, data = henning)
```

## Graficacion simple
```{r}
plot(sfit)
```

## Graficando con ggsurplot

### Probabilidad sobrevivencia S(t)

```{r}
ggsurvplot(sfit, data = henning)
```

### Riesgo acumulada de hazard H(t)
```{r}
ggsurvplot(sfit, data = henning, fun = "cumhaz")
```

# Estimadores de la Función de Riesgo Acumulada

## Regresion entre el logaritmo de la supervivencia y los tiempos
```{r}
diagnos_surv <- function(times= NULL, surv=NULL) {
  data.frame(times = times, surv = surv) %>% 
    ggplot()+
    geom_point(aes(x = log(surv), y = times))+
    geom_smooth(aes(x = log(surv), y = times), method = "lm")+
    theme_classic()
}
```

## llamamos la funcion
```{r}
diagnos_surv(times=sfit$time,surv=sfit$surv)
```
Aproximacion con lineas exponencial 
Exponencial diagnostico

## Seguimiento, relacionado con personas
 0 Aquellos que no cometen crimenes en contra de personas 
 1 Aquellos que cometen crimenes en contra de personas 
```{r}
sfit_personal <- survfit(Surv(months, event) ~ personal, data = henning)
ggsurvplot(sfit_personal, data = henning)
```

## Seguimiento, relacionado con propiedad
 0 Aquellos que no cometen crimenes en contra de propiedades
 1 Aquellos que cometen crimenes en contra de  propiedades
```{r}
sfit_property <- survfit(Surv(months, event) ~ property, data = henning)
ggsurvplot(sfit_property, data = henning)
```
 
# Calculamos la distancia entre las curvas
 Las curvas con discretas
```{r}
max_distancia <- function(sfitp = NULL,p=NULL) {
  # Strata primeros valores
  f1 <- sfitp$strata[1]
  # strata valor final
  f2 <- length(sfitp$surv)
  #obtenemos tiempo y supervivencia de los 2 conjuntos
  t1<-sfitp$time[1:f1]# tiempo pesonal
  s1<-sfitp$surv[1:f1]# sobrevivencia 1
  t2<-sfitp$time[(f1+1):f2]# tiempo 2
  s2<-sfitp$surv[(f1+1):f2]# sobrevivencia 2
  
  #suavizamos ambas funciones de supervivencia y las evaluamos sobre el mismo conjunto
  s1aprox <- approxfun(s1,t1)
  s2aprox <- approxfun(s2,t2)
  df1<-data.frame(s=s2,ta1=s1aprox(s2), ta2=s2aprox(s2))
  # diferencia entre los tiempos para las funciones suavizadas
  df1$distancia<-abs(df1$ta1-df1$ta2)
  # Eliminamos NAs 
  df1 <- df1[!is.na(df1$distancia),]
  # Conservamos las S(t)>p
  df<-df1[df1$s>p,]
  # Obtenemos la mayor de las distancias entre las gráficas
  maxima<-max(df1$distancia)
  # Seleccionamos el renglon que corresponda a la distancia maxima
  d<-df1[df1$distancia==maxima,]
  max<-as.character(round(maxima,6))
  max
  grafica<-ggplot()+ 
    geom_step(aes(t1,s1, color="1"),size=0.5)+# personal=0
    geom_step(aes(t2,s2, color="0"),size=0.5)+# persoaml=1
    labs(title=paste("Máxima Distancia entre","personal=0","y","personal=1", sep = " "), 
         x="Tiempo", y="St")+
    theme_classic()+ # graficamos puntos maximo
    geom_hline(yintercept = d$s, linetype="dashed", color = "gray50", size=0.7)+
    labs(color = "blue") +
    geom_vline(xintercept = d$ta1, linetype="dashed", color = "gray50", size=0.7)+
    geom_vline(xintercept = d$ta2, linetype="dashed", color = "gray50", size=0.7)+ 
    annotate("text", x =min(d$ta1,d$ta2), y = d$s+0.02, label = paste("Distancia=",max,sep =""))
  return(grafica)
}

```

### Con respecto a personas
```{r}
max_distancia(sfitp =sfit_personal,p=0.5)
```

### Con respecto a propiedad
```{r}
max_distancia(sfitp =sfit_property,p=0)
```

