Máxima Segregación
Análisis de supervivencia y series de tiempo. Grupo 9240 FC UNAM
Sofia Villers Gomez
Vásquez Guerra Carlos Fernando
11/2020
El objetivo de esta práctica es poner a prueba tus habilidades para resolver e interpretar el conocimiento que haz adquirido hasta el momento sobre el análisis de supervivencia, el cual abarca los capítulos 1-8 del libro digital Modelos de Supervivencia. Considera los siguientes puntos para la entrega de tu trabajo:
- Se puede entregar en cualquiera de los siguientes formatos:
- Archivo HTML. En este caso se debe entregar un enlace de Rpubs donde este publicado tu trabajo.
- Archivo tipo Shiny. En este caso, eres libre de enviar tu trabajo mediante un archivo comprimido o mediante un enlace que redirija hacia una publicación en ShinyApps.
- Un integrante del equipo debe hacer entrega de la tarea y los demás miembros deben asegurarse de que el estatus de su tarea de classroom sea “Tarea entregada”. En caso de que alguno de los integrantes no lo haga a tiempo será penalizado y en caso de que no siga estas instrucciones no se le contará para la evaluación.
- Es necesario que se tenga explícito el código en el trabajo aunque se agradece si deseas hacer alguna acción para ocultarlo y facilitar la lectura del desarrollo de tu problema.
- Los códigos deben estar comentados y el planteamiento de la solución se debe explicar de la manera más clara posible tanto como para un lector experimentado como para un lector que conozca poco acerca de estadística en general sin tener que explicar la parte teórica de manera exhaustiva.
- El trabajo deber llevar los datos del equipo.
- En caso de tener archivos extra, scripts, paquetes propios, archivos de estilo css, etc; favor de mencionarlos cuando se utilice alguna función, objecto o característica de estos y si se considera pertinente agregarlos como parte de la entrega.
- De acuerdo a tu número de equipo, es el problema que te fue asignado. Si deseas aumentar tus habilidades haciendo algún inciso extra estás en completa libertad de hacerlo y obviamente será tomado en cuenta.
Para realizar este trabajo se dejan en la siguiente liga 8 conjuntos de datos simulados que corresponden a uno de los siguientes escenarios.
Datos correspondientes al tiempo de vida en meses de cuatro especies de ratas.
Datos correspondientes al tiempo de vida, en días, en diferentes cohortes de pacientes después haberse sometido a un trasplante de riñón
Datos correspondientes al tiempo de vida en meses para 4 grupos de ratones que fueron expuestos a diferentes dosis de radiación.
Datos correspondientes al tiempo de vida, en horas, de bombillas eléctricas de diferentes marcas.
Datos correspondientes al tiempo recaída, en meses, para pacientes con diferentes tratamientos contra el cancer de pulmón.
Datos correspondientes al tiempo, en días, en desarrollar un tumor en ratas expuestas a diferentes cancerígenos.
Datos correspondientes al tiempo de vida de diferentes baterías de marcapasos, en años.
Datos correspondientes al tiempo de vida, en días, en diferentes pacientes después trasplante autólogo de médula ósea en diferentes hospitales.
Tu trabajo será realizar un análisis de supervivencia con el conocimiento que ya se ha adquirido. Al menos, se deben hacer los siguientes puntos
- Estimar la función de supervivencia mediante el método K-M.
- Graficar la función anterior agregando anotaciones o marcas en puntos críticos.
- Se deben agregar intervalos de confianza a la anterior gráfica.
- Se deben obtener resúmenes estadísticos (parámetro poblacionales, funciones de riesgo, etc.)
- Se tienen distintas segmentaciones en los datos, por lo que habría que ver el comportamiento anterior por cada estrato.
Además de lo anterior, se pide lo siguiente:
- Crear una función que, de acuerdo a diferentes curvas de supervivencia, mínimo 2, se obtenga la diferencia de tiempo más grande. Aquí un ejemplo (Sí, la imagen que proviene de esta solución personal es animada)
- Mostrar graficamente las curvas con mayor separación y dar conclusiones.
Recomendaciones:
- Todos los datos fueron generados de alguna distribución (exponencial, weibull, log-logistico, log-normal, gamma o gompertz), por lo que sería adecuado ajustar un modelo y utilizar algunas técnicas gráficas que ayuden a proponer un cierto comportamiento paramétrico.
- Se pueden utilizar distintas estadísticas de ajuste como BIC y AIC.
- Siempre es ideal hacer una limpieza de datos.
- Las distribuciones especiales que se utilizaron fueron:
actuar::*llogis(), actuar::pareto() y flexsurv::*gompertz()
- Aquí se deja un link.
- Hacer un ajuste a las curvas de supervivencia para hacer la compación entre tiempos.
Un trabajo de Carlos Vásquez
carlosfvasquez@ciencias.unam.mx