Tarea 5

Análisis de supervivencia y series de tiempo. Grupo 9245 FC UNAM

Sofia Villers Gomez

Vásquez Guerra Carlos Fernando

05/2024

El objetivo de esta práctica es poner a prueba tus habilidades para resolver e interpretar el conocimiento que haz adquirido hasta el momento sobre el análisis de supervivencia, el cual abarca los capítulos 1-5 del libro digital Modelos de Supervivencia y comenzar con los primeros pasos de tu proyecto, por lo que esta tarea estará dividida en 2 partes.

Parte 1

Ya que algunos integrantes del curso realizan su trabajo de manera individual, se dejarán diferentes problemas a elegir y estos deberán ser mencionados en la sección de comentarios de la publicación en Google Classroom. Consideren lo siguiente:

  1. Tiempo de espera en servicios de telecomunicaciones. Es decir, los datos indican el tiempo (minutos) que los usuarios esperan para establecer una conexión (ya sea entre una llamada telefónica, conexión a internet, etc).
  1. Tiempo de espera en un semáforo: Datos sobre el tiempo (minutos) que un conductor espera en un semáforo antes de que cambie de color.
  1. Duración de proyectos de construcción: Los tiempos (meses) indican la duración de proyectos de una construcción, teniendo en cuenta diferentes factores como recursos disponibles y condiciones ambientales.
  1. Precios de activos financieros: Los siguientes datos modelan los precios (pesos) de activos financieros de alguna materia prima.
  1. Tiempo hasta la falla de equipos: Datos para modelar el tiempo (horas) hasta la falla de ciertos equipos y componentes mecánicos utilizados en una consultora de ingeniería.
  1. Tiempo de servicio en sistemas de atención médica: Los siguientes datos modelan el tiempo (minutos) que los pacientes pasan en la sala de espera de un hospital antes de ser atendidos por un médico.
  1. Tasas de crecimiento de población: Estos datos modelan las tasas de crecimiento de una población en una ciudad.
  1. Tiempo de supervivencia de pacientes en estudios médicos: En un estudio clínico del departamento de epidemiología se registraron estos tiempos (meses) de supervivencia de pacientes en los estudios clínicos.

  2. Distribución de ingresos: Estos datos modelan la distribución de ingresos (pesos) en una población, donde los ingresos más altos son menos probables a medida que aumentan.

  3. Tamaño de ciudades: Una consultora de geografía urbana tiene los siguientes datos para modelar el tamaño de las ciudades (habitantes), donde pocas ciudades grandes dominan el paisaje urbano.

  4. Tiempo de vida de productos: Los siguientes datos modelan el tiempo (años) de vida de baterías en una empresa de ingeniería donde se realiza un estudio de confiabilidad.

  5. Tiempo de degradación de productos perecederos: Una empresa de logística modeló el tiempo (días) que tardan algunos productos perecederos en degradarse.

  6. Tiempo entre llegadas de clientes: Se esta utilizando teoría de colas para modelar el tiempo (minutos) entre llegadas sucesivas de clientes a un sistema de servicio.

  7. Tiempo de espera en una cola: Estamos modelando el tiempo (minutos) que un cliente espera en una cola antes de ser atendido en un centro de atención al cliente.

  8. Tiempos de reacción en psicología: Un departamento de psicología experimental registró los tiempos (segundos) de reacción de los participantes en diferentes tareas.

  9. Velocidades del viento: El departamento de meteorología registró las velocidades (m/s) del viento en ciertas áreas geográficas de interés.

  10. Frecuencia de palabras en lenguaje natural: Los siguientes datos buscan modelar la frecuencia de palabras de un idioma, donde unas pocas palabras son extremadamente comunes y la mayoría son raras.

  11. Tasas de mortalidad: Los estudiantes de biología desean modelar las tasas de mortalidad de ciertos organismos a medida que envejecen.

  12. Ingresos familiares: El departamento de estudios socioeconómicos registró los ingresos (pesos) familiares en una población.

  13. Distribución de riqueza: Se busca modelar la riqueza (pesos) en una población, donde una pequeña cantidad de personas posee la mayoría de los recursos.

  14. Tasas de deserción en marketing: El departamento de análisis cuantitativo de una empresa de marketing obtuvo los siguientes datos para modelar la tasa de deserción de clientes a medida que pasa el tiempo.

Tu trabajo será realizar un análisis de supervivencia con el conocimiento que ya se ha adquirido. Es decir que al menos, se deben hacer los siguientes puntos

En cada uno de los conjuntos de datos se tiene una variable llamada Type, la cual segrega la información de acuerdo a diferentes variables uniformes y hace que la distribución de probabilidad cambie un poco en sus parámetros, por lo que después de identificar la distribución base de tu conjunto de datos, ajusta nuevamente tu información pero ahora segregada por dicha variable (por lo que tendrías 4 funciones de distribución del mismo tipo pero con diferentes parámetros). En este punto no necesitas hacer todo el análisis de identificación, solo una línea de código para cada estrato.

Ya con tus funciones de distribucion identificadas realiza lo siguiente:

Crear una función que, de acuerdo a diferentes curvas de supervivencia, mínimo 2, se obtenga la diferencia de tiempo más grande. Aquí un ejemplo:

Recomendaciones:

Parte 2

Como parte de cualquier análisis de datos, se te solicita realizar un análisis descriptivo de los datos exhaustivo y una limpieza de la información inicial, esto significa que deberás entender tu información, su contexto, las variables, investigar si es necesario por fuentes externas, tratar valores extremos, valores perdidos, describir y hacer relaciones entre tus variables mediante gráficas, etc. Al igual que en el la parte 1, se te fue asignado un conjunto de datos para tu proyecto final.

Este ejercicio te ayudará a prepararte para la siguiente parte de tu trabajo en esta clase. Recuerda que un análisis descriptivo y la limpieza de datos puede ser parte de un proceso en tu análisis, por lo que, de acuerdo a tu proceso posterior pueden cambiar tus resultados, así que en la entrega final de tu proyecto puedes tener otras conclusiones y tratamientos.

Consideraciones finales

Toma en cuenta los siguientes puntos para la entrega de tu trabajo:

knitr::opts_chunk$set(
      #echo = FALSE, #Podemos evitar que se muestre el código en general
      fig.pos = 'H', #Posicionamos todas las gráficas en el lugar donde se calculan
      fig.align = 'center', #Posicionamos todas las gráficas en el lugar en el centro del documento
      message = FALSE, #Evitamos los mensajes
      warning = FALSE, #Evitamos los warnings
      comment = NA #Evitamos los comentarios
)
 

A work by Carlos Vásquez

carlosfvasquez@ciencias.unam.mx