Se ha suministrado los registros de un grupo de 1338 usuarios premium de un programa de medicina de Coomeva, en los que se encuentran variables que permiten caracterizar cada cliente segun: el costo anual por atención que representa para Coomeva, la edad en años, el Indice de Masa Corporal (IMC), el numero de hijos, si tiene el habito de fumar y su ubicación geografica por regiones (Bogotá, Medellín, Cali o Caribe). A continuación se resumen y se describen los clientes en cuestion.
## Edad sexo IMC Hijos
## Min. :18.00 Length:1338 Min. :15.96 Min. :0.000
## 1st Qu.:27.00 Class :character 1st Qu.:26.30 1st Qu.:0.000
## Median :39.00 Mode :character Median :30.40 Median :1.000
## Mean :39.21 Mean :30.66 Mean :1.095
## 3rd Qu.:51.00 3rd Qu.:34.69 3rd Qu.:2.000
## Max. :64.00 Max. :53.13 Max. :5.000
## Fumador region Costo paciente
## Length:1338 Length:1338 Min. : 3926559
## Class :character Class :character 1st Qu.: 16591005
## Mode :character Mode :character Median : 32837116
## Mean : 46446478
## 3rd Qu.: 58239694
## Max. :223196498
Respecto a la descripcion inicial del conjunto de datos, se evidencia que el costo de atención oscila entre $3926.558 y $223’196.498 con un costo promedio de $46’446.477. Los clientes tienen una edad promedio de 39 años, un Indice de Masa Muscular promedio de 30,66; y tienen entre 1 y 5 hijos.
Adicionalmente, como se evidencia en la siguiente tabla, los clientes se encuentran distribuidos mas o menos homogeneamente en terminos geograficos y de sexo. Geograficamente Medellín cuenta con 364 clientes, Bogotá con 325, Cali con 325 y Caribe con 324. En cuanto a la distribución por sexo, el sexo masculino es mayoria por muy poca diferencia, con 676 clientes, mientras el sexo femenino cuenta con 662 clientes.
Finalmente, en cuanto al habito de fumar, la mayoria (1064) reportan no ser fumadores, mientras 274 reportan si tener el habito de fumar.
## bogota cali caribe medellin
##
## femenino no 135 141 132 139
## si 29 21 29 36
## masculino no 132 126 125 134
## si 29 37 38 55
Como el ejercicio solicita la identificación y evaluación de los factores que mayor y mas significativa incidencia en el costo anual por atencion a paciente, se plantea un modelo de regresión lineal por el método de Mínimos Cuadrados ordinarios con el cual se busca medir el efecto de cada una de las variables brindadas en el costo anual de atencion a los clientes. Dicho modelo se resume a continuación.
##
## Call:
## lm(formula = costo ~ edad + sexo + imc + hijos + fumador + region)
##
## Residuals:
## Min 1Q Median 3Q Max
## -39567173 -9968330 -3437472 4878722 104974675
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -43020259 3458686 -12.438 < 2e-16 ***
## edad 898997 41646 21.587 < 2e-16 ***
## sexomasculino -459600 1165309 -0.394 0.693348
## imc 1187177 100098 11.860 < 2e-16 ***
## hijos 1664252 482314 3.451 0.000577 ***
## fumadorsi 83469871 1446037 57.723 < 2e-16 ***
## regioncali -2124805 1670214 -1.272 0.203533
## regioncaribe 1235374 1666965 0.741 0.458769
## regionmedellin -2387204 1676357 -1.424 0.154669
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 21220000 on 1329 degrees of freedom
## Multiple R-squared: 0.7509, Adjusted R-squared: 0.7494
## F-statistic: 500.8 on 8 and 1329 DF, p-value: < 2.2e-16
El modelo de regresión lineal planteado muestra que las variables que mayor significancia tienen para explicar el costo de atención a clientes son: la edad, el Indice de Masa Corporal, el numero de hijos y si la persona tiene habitos de fumador, de la siguiente forma.
Ante un aumento de un año en la edad, el costo de atención experimenta un incremento de casi $900.000, manteniendo todo lo demas constante.Adicionalmente, si se da un aumento unitario en el Indice de Masa Corporal, el costo de atención experimenta un incremento de mas de un millon de pesos, manteniendo todo lo demas constante.
En cuanto al numero de hijos, el nacimiento de un hijo adicional, tiene un efecto positivo en el costo de atención, pues este aumenta en mas de $1’600.000, manteniendo todo lo demas constante. Finalmente, respecto al ser fumador, el hecho de ser fumador genera un sobrecosto de mas 83 millones de pesos respecto a las personas que no fuman, manteniendo todo lo demas constante.
Cabe resaltar que las interpretaciones realizadas, se dan con una confianza de mas del 99%. Ademas, el modelo en su conjunto explica cerca de 75% de los cambios en el costo de atencion a clientes y tiene es estadisticamente significativo en su conjunto.
Estos resultados deben ser interpretados con cautela pues la especificación del modelo está sujeta a mejoras, por omision de variables y por la evidente no normalidad en los residuales, lo que hace que los coeficientes esten sesgados y que su significancia estadistica este sobreestimada. Sin embargo, al corregir heterocedasticidad por el método robusto de white, evidenciamos que las relaciones descritas anteriormente, se mantienen en el mismo sentido, la misma significancia y casi que en la misma magnitud, pero que igualmente el modelo esta sujeto a refinamientos en terminos de inclusión de variables importantes como: nivel de ingreso, estrato socioeconomico, o sector de la economia en que está empleado
##
## t test of coefficients:
##
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -43020259 3581691 -12.0112 < 2.2e-16 ***
## edad 898997 41535 21.6442 < 2.2e-16 ***
## sexomasculino -459600 1163524 -0.3950 0.6929010
## imc 1187177 110573 10.7366 < 2.2e-16 ***
## hijos 1664252 454486 3.6618 0.0002602 ***
## fumadorsi 83469871 2005558 41.6193 < 2.2e-16 ***
## regioncali -2124805 1591878 -1.3348 0.1821774
## regioncaribe 1235374 1690528 0.7308 0.4650533
## regionmedellin -2387204 1742788 -1.3698 0.1709929
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Finalmente, respecto al calculo del costo de la prima anual que garantiza una rentabilidad del 20%, es importante tener en cuenta que siendo R la rentabilidad y teniendo en cuenta que Rentabilidad (R) es igual a resta entre el el Ingreso Total (IT) y Costo Total (CT), se puede plantear la siguiente ecuacion:
\[\ Rentabilidad= IngresoTotal-CostoTotal\]
Planteando el caso en que no hay rentabilidad el costo y el ingreso seria iguales a cero. Es decir que:
\[\ IT-CT=0 ; CT=IT\] Entonces la condición para garantizar rentabilidad del 20% es de la forma
\[\ 1,20*CT-CT= 20\% \] Es decir que si usamos el costo promedio de atencion que es igual a $46’446.477, se debe cobrar una prima de $55’735.772 para obtener una rentabilidad de 9’289.295 equivalente al 20%. Cabe resaltar que este calculo corresponde al costo promedio, pero que es segmentable por nivel de ingresos, estrato socioeconomico, o condiciones de morbilidad, de tal manera que la prima que paguen los diferente afiliados este asociada a su estilo de vida y no necesariamente al comportamiento promedio de los afiliados. Esto es importante pues al usar el promedio como criterio, hay que tener en cuenta que esta medida es sensible a valores extremos, entonces se puede presentar el caso en que una persona pague una prima muy inferior al costo que puede representar para el sistema o que una persona pague una prima muy alta respecto al costo que puede llegar a representar. Esta situación tendría efectos en los incentivos que pueden tener los clientes para renovarse en el segmento premium o en la atraccion de nuevos clientes.