Conjunto de datos a trabajar: Blood Donor Dataset
Fuente: https://www.kaggle.com/datasets/sumedh1507/blood-donor-dataset
Tamaño de la muestra: 10,000 datos
Número de variables: 5
Variables:
| Nombre.de.la.variable | Tipo.de.variable | Escala | Unidad.de.medida |
|---|---|---|---|
| Ciudad | Cualitativa | Nominal | No aplica |
| Grupo sanguíneo | Cualitativa | Nominal | No aplica |
| Disponibilidad | Cualitativa | Nominal | No aplica |
| Meses desde la última donación | Cuantitativa discreta | Razón | Meses |
| Número de donaciones | Cuantitativa discreta | Razón | No aplica |
Objetivo del análisis:
Analizar el comportamiento del conjunto de datos sobre donaciones de sangre para:
Integrantes del grupo:
Ciudad Grupo.Sanguineo Dispoibilidad
Length:10000 Length:10000 Length:10000
Class :character Class :character Class :character
Mode :character Mode :character Mode :character
Meses.Desde.la.Ultima.Donacion Numero.de.Donaciones
Min. : 0.00 Min. : 0.00
1st Qu.: 30.00 1st Qu.:12.00
Median : 60.00 Median :26.00
Mean : 59.95 Mean :25.13
3rd Qu.: 90.00 3rd Qu.:38.00
Max. :120.00 Max. :50.00
###
Medidas Adicionales
VARIANZAS:
Meses desde la última donación: 1218.804
Número de donaciones: 214.7454
DESVIACIÓN ESTÁNDAR:
Meses desde la última donación: 34.91138
Número de donaciones: 14.6542
COEFICIENTES DE VARIACIÓN:
Meses desde la última donación: 0.5823115
Número de donaciones: 0.5831773
La distribución del número de donaciones muestra un patrón prácticamente uniforme a lo largo de todo el rango (1 a 50 donaciones). Los meses desde la última donación presentan una distribución más uniforme. Todos los grupos sanguíneos están representados de manera balanceada.
DATOS ATÍPICOS:
Número de donaciones:
Cantidad de outliers: 0
Porcentaje: 0 %
Meses desde última donación:
Cantidad de outliers: 0
Porcentaje: 0 %
No se identificaron datos atípicos en ninguna de las variables cuantitativas. Todos los valores se encuentran dentro de los rangos esperados, lo que indica que los datos son consistentes y no hay casos excepcionales que requieran atención especial.
CORRELACIÓN DE PEARSON: 0.0104
No hay evidencia de una relación lineal entre los meses desde la última donación y el número total de donaciones. Es decir, el tiempo que ha pasado desde la última donación no influye en la cantidad de veces que una persona ha donado.
Nota: Como el dataset solo tiene 2 variables cuantitativas (Meses desde última donación y Número de donaciones), la matriz de correlación completa sería 2x2 con valores 1.00 en la diagonal y 0.01 en las otras posiciones. Por simplicidad, se muestra solo el coeficiente de correlación relevante entre ambas variables.
Call:
lm(formula = Numero.de.Donaciones ~ Meses.Desde.la.Ultima.Donacion,
data = BaseDeDatosPyE)
Residuals:
Min 1Q Median 3Q Max
-25.3824 -12.9444 0.6176 12.7402 25.1256
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 24.865601 0.291223 85.383 <2e-16 ***
Meses.Desde.la.Ultima.Donacion 0.004380 0.004198 1.043 0.297
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 14.65 on 9998 degrees of freedom
Multiple R-squared: 0.0001089, Adjusted R-squared: 8.877e-06
F-statistic: 1.089 on 1 and 9998 DF, p-value: 0.2968
El intercepto (24.86) representa el número estimado de donaciones cuando el tiempo desde la última donación es cero meses, mientras que la pendiente (0.00438) indica un aumento mínimo e insignificante del número de donaciones por cada mes adicional.
Con un R² de 0.0001 y un p-valor de 0.297, se concluye que no hay evidencia estadística de una relación lineal entre las variables.
La dispersión de los puntos muestra que no existe una relación clara entre las variables. La línea de regresión es prácticamente horizontal, confirmando la ausencia de correlación.
El diagrama de cajas muestra la distribución del número de donaciones en cada ciudad. En general, se puede ver que todas las ciudades tienen una cantidad de donaciones bastante similar. La mediana está cerca de 25 donaciones en la mayoría de las ciudades.
No se observan diferencias significativas en el número de donaciones entre los diferentes grupos sanguíneos. Todas las distribuciones son similares.
No se observan grandes diferencias entre donantes disponibles y no disponibles en cuanto al tiempo transcurrido desde su última donación.
La gráfica muestra la relación entre el tiempo transcurrido desde la última donación y el número total de donaciones realizadas. En general, se observa que la cantidad de donaciones se mantiene bastante estable en todos los rangos de meses, sin variaciones significativas. La mayoría de los donantes se concentra en los rangos de pocas donaciones (entre 0 y 10), lo que indica que la mayoría ha donado solo unas cuantas veces. Además, no se evidencia una relación clara entre el tiempo desde la última donación y la cantidad total de donaciones, ya que la frecuencia se mantiene relativamente constante en todos los periodos analizados.
La mayoría de los donantes ha hecho pocas donaciones y no ha pasado tanto tiempo desde la última. En cambio, los donantes con muchas donaciones o que llevan mucho tiempo sin donar son menos frecuentes.
En general, el análisis permitió conocer mejor el comportamiento del conjunto de datos sobre donaciones de sangre. A partir de los resultados obtenidos, se puede decir que:
Con base en los resultados del análisis, se proponen las siguientes recomendaciones:
Para programas de donación: