En las siguientes lineas se muestra la funcion y los valores para poder calcular las distancias entre dos curva de supervivencia, en este caso las variable de fragmentación fueron las de género.
surv <- surv_fit(Surv(tenure, Churn) ~ gender, data = datos)
hombre<-approxfun(surv[1]$surv,surv[1]$time)
mujer<-approxfun(surv[2]$surv, surv[2]$time)
v1<-hombre(seq(0,1,length.out = 1000))
v2<-mujer(seq(0,1,length.out = 1000))
v3<-seq(0,1,length.out = 1000)
v4<-abs(hombre(seq(0,1,length.out = 1000))-mujer(seq(0,1,length.out = 1000)))
k=0;
for (i in seq(0,1,0.05)){
if(is.na(mujer(i))==TRUE & is.na(hombre(i))==FALSE |
is.na(mujer(i))==FALSE & is.na(hombre(i))==TRUE |
is.na(mujer(i))==TRUE & is.na(hombre(i))==TRUE){
vector[k]=0
}
else vector[k]<-abs(mujer(i)-hombre(i))
k=k+1
}
posicion<-which.max(vector)
vector[posicion]
posicion
pos<-v4[which.max(v4)]
proba<-which.max(v4)/1000
proba
Cabe destacar que el estimador utilizado para la funcion de supervivencia fue el de Kaplan Meier. A continuación se muestra el código para la gráfica de las funciones de supervivencia y el valor de la probabilidad donde la distancia es la mayor.
##GRAFICAS
cx<-seq(0,80,length.out = 1000)
cy<-rep(proba,1000)
plot(v1,v3,type='l',col="red", xlab="Tiempo", ylab="Sobrevivencia", main="Sobrevivencia por Genero")
lines(v2,v3, type="l")
lines(cx,cy, col="blue" ,type="l")
legend(0.3,0.4,c("Hombre", "Mujer","Proba dif. mayor 0.72"), cex=0.7, fill=c("red","black","blue"))