Información General del Proyecto

Column

Información de los Datos

Conjunto de datos a trabajar: Blood Donor Dataset

Fuente: https://www.kaggle.com/datasets/sumedh1507/blood-donor-dataset

Tamaño de la muestra: 10,000 datos

Número de variables: 5


Variables:

Nombre.de.la.variable Tipo.de.variable Escala Unidad.de.medida
Ciudad Cualitativa Nominal No aplica
Grupo sanguíneo Cualitativa Nominal No aplica
Disponibilidad Cualitativa Nominal No aplica
Meses desde la última donación Cuantitativa discreta Razón Meses
Número de donaciones Cuantitativa discreta Razón No aplica


Objetivo del análisis:

Analizar el comportamiento del conjunto de datos sobre donaciones de sangre para:

  • Identificar patrones de donación por ciudad y grupo sanguíneo
  • Evaluar la relación entre el tiempo desde la última donación y el número total de donaciones
  • Caracterizar la disponibilidad de los donantes
  • Comprender mejor el comportamiento de los donantes

Column

Foto de Portada del Proyecto


Integrantes del grupo:

  • Juan David Rojas Umaña
  • Isabella Garzón Salazar

Análisis Descriptivos

Column

Summary - Resumen Estadístico

    Ciudad          Grupo.Sanguineo    Dispoibilidad     
 Length:10000       Length:10000       Length:10000      
 Class :character   Class :character   Class :character  
 Mode  :character   Mode  :character   Mode  :character  
                                                         
                                                         
                                                         
 Meses.Desde.la.Ultima.Donacion Numero.de.Donaciones
 Min.   :  0.00                 Min.   : 0.00       
 1st Qu.: 30.00                 1st Qu.:12.00       
 Median : 60.00                 Median :26.00       
 Mean   : 59.95                 Mean   :25.13       
 3rd Qu.: 90.00                 3rd Qu.:38.00       
 Max.   :120.00                 Max.   :50.00       

### Medidas Adicionales

VARIANZAS:
Meses desde la última donación: 1218.804 
Número de donaciones: 214.7454 
DESVIACIÓN ESTÁNDAR:
Meses desde la última donación: 34.91138 
Número de donaciones: 14.6542 
COEFICIENTES DE VARIACIÓN:
Meses desde la última donación: 0.5823115 
Número de donaciones: 0.5831773 

Column

Gráficos Univariados - Histogramas

Gráfico de Barras - Distribución por Tipo de Sangre

Interpretación

La distribución del número de donaciones muestra un patrón prácticamente uniforme a lo largo de todo el rango (1 a 50 donaciones). Los meses desde la última donación presentan una distribución más uniforme. Todos los grupos sanguíneos están representados de manera balanceada.

Análisis Univariados

Column

Diagrama de Cajas - Número de Donaciones

Diagrama de Cajas - Meses desde Última Donación

Column

Comparación de Variables

Análisis de Datos Atípicos

DATOS ATÍPICOS:
Número de donaciones:
  Cantidad de outliers: 0
  Porcentaje: 0 %
Meses desde última donación:
  Cantidad de outliers: 0
  Porcentaje: 0 %

Interpretación

No se identificaron datos atípicos en ninguna de las variables cuantitativas. Todos los valores se encuentran dentro de los rangos esperados, lo que indica que los datos son consistentes y no hay casos excepcionales que requieran atención especial.

Análisis Bivariados 1

Column

Correlación de Pearson

CORRELACIÓN DE PEARSON: 0.0104 

Interpretación - Correlación

No hay evidencia de una relación lineal entre los meses desde la última donación y el número total de donaciones. Es decir, el tiempo que ha pasado desde la última donación no influye en la cantidad de veces que una persona ha donado.

Nota: Como el dataset solo tiene 2 variables cuantitativas (Meses desde última donación y Número de donaciones), la matriz de correlación completa sería 2x2 con valores 1.00 en la diagonal y 0.01 en las otras posiciones. Por simplicidad, se muestra solo el coeficiente de correlación relevante entre ambas variables.

Modelo Lineal Simple


Call:
lm(formula = Numero.de.Donaciones ~ Meses.Desde.la.Ultima.Donacion, 
    data = BaseDeDatosPyE)

Residuals:
     Min       1Q   Median       3Q      Max 
-25.3824 -12.9444   0.6176  12.7402  25.1256 

Coefficients:
                                Estimate Std. Error t value Pr(>|t|)    
(Intercept)                    24.865601   0.291223  85.383   <2e-16 ***
Meses.Desde.la.Ultima.Donacion  0.004380   0.004198   1.043    0.297    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 14.65 on 9998 degrees of freedom
Multiple R-squared:  0.0001089, Adjusted R-squared:  8.877e-06 
F-statistic: 1.089 on 1 and 9998 DF,  p-value: 0.2968

Interpretación del Modelo

El intercepto (24.86) representa el número estimado de donaciones cuando el tiempo desde la última donación es cero meses, mientras que la pendiente (0.00438) indica un aumento mínimo e insignificante del número de donaciones por cada mes adicional.

Con un R² de 0.0001 y un p-valor de 0.297, se concluye que no hay evidencia estadística de una relación lineal entre las variables.

Column

Diagrama de Dispersión

Interpretación - Dispersión

La dispersión de los puntos muestra que no existe una relación clara entre las variables. La línea de regresión es prácticamente horizontal, confirmando la ausencia de correlación.

Diagrama de Cajas por Grupos - Ciudad

Interpretación - Cajas por Ciudad

El diagrama de cajas muestra la distribución del número de donaciones en cada ciudad. En general, se puede ver que todas las ciudades tienen una cantidad de donaciones bastante similar. La mediana está cerca de 25 donaciones en la mayoría de las ciudades.

Análisis Bivariados 2

Column

Diagrama de Cajas por Grupos - Grupo Sanguíneo

Interpretación - Grupo Sanguíneo

No se observan diferencias significativas en el número de donaciones entre los diferentes grupos sanguíneos. Todas las distribuciones son similares.

Diagrama de Cajas - Disponibilidad

Interpretación - Disponibilidad

No se observan grandes diferencias entre donantes disponibles y no disponibles en cuanto al tiempo transcurrido desde su última donación.

Column

Diagrama de Barras Apiladas

Interpretación - Diagrama de Barras Apiladas

La gráfica muestra la relación entre el tiempo transcurrido desde la última donación y el número total de donaciones realizadas. En general, se observa que la cantidad de donaciones se mantiene bastante estable en todos los rangos de meses, sin variaciones significativas. La mayoría de los donantes se concentra en los rangos de pocas donaciones (entre 0 y 10), lo que indica que la mayoría ha donado solo unas cuantas veces. Además, no se evidencia una relación clara entre el tiempo desde la última donación y la cantidad total de donaciones, ya que la frecuencia se mantiene relativamente constante en todos los periodos analizados.

Tabla Cruzada

Interpretación - Tabla Cruzada

La mayoría de los donantes ha hecho pocas donaciones y no ha pasado tanto tiempo desde la última. En cambio, los donantes con muchas donaciones o que llevan mucho tiempo sin donar son menos frecuentes.

Conclusiones Finales

Column

Conclusiones

En general, el análisis permitió conocer mejor el comportamiento del conjunto de datos sobre donaciones de sangre. A partir de los resultados obtenidos, se puede decir que:

  1. Comportamiento general:
    • La mayoría de los donantes mantiene una frecuencia moderada de participación, sin grandes diferencias entre ciudades ni variaciones extremas en el número de donaciones
    • Esto refleja una tendencia estable en los hábitos de donación dentro del grupo analizado
  2. Relación entre variables:
    • El tiempo transcurrido desde la última donación no influye de manera significativa en la cantidad total de donaciones realizadas
    • Esto sugiere que las decisiones de donar dependen más de factores personales o externos que del paso del tiempo
    • La correlación de Pearson (0.0104) confirma la ausencia de relación lineal
  3. Técnicas utilizadas:
    • El uso de técnicas estadísticas como la correlación de Pearson, los diagramas de cajas, las tablas cruzadas permitió obtener una visión más completa del comportamiento de los donantes
    • Los análisis bivariados mostraron que no existen diferencias significativas entre grupos
  4. Calidad de los datos:
    • No se identificaron datos atípicos en ninguna de las variables cuantitativas
    • Todos los valores se encuentran dentro de rangos esperados y consistentes

Column

Recomendaciones

Con base en los resultados del análisis, se proponen las siguientes recomendaciones:

Para programas de donación:

  1. Estrategias de motivación:
    • Dado que el tiempo no es un factor determinante, enfocar esfuerzos en motivación intrínseca
    • Implementar programas de reconocimiento para donantes frecuentes
    • Desarrollar campañas de concientización continuas
  2. Seguimiento personalizado:
    • Crear sistemas de seguimiento para donantes que reportan disponibilidad
    • Mantener contacto con personas que han dejado de donar
    • Identificar y captar nuevos donantes potenciales
  3. Análisis complementarios:
    • Investigar factores cualitativos que influyen en la decisión de donar
    • Estudiar barreras percibidas para la donación
    • Evaluar la efectividad de diferentes estrategias de comunicación