Se ha suministrado los registros de un grupo de 1338 usuarios premium de un programa de medicina de Coomeva, en los que se encuentran variables que permiten caracterizar cada cliente segun: el costo anual por atención que representa para Coomeva, la edad en años, el Indice de Masa Corporal (IMC), el numero de hijos, si tiene el habito de fumar y su ubicación geografica por regiones (Bogotá, Medellín, Cali o Caribe). A continuación se resumen y se describen los clientes en cuestion.

##       Edad           sexo                IMC            Hijos      
##  Min.   :18.00   Length:1338        Min.   :15.96   Min.   :0.000  
##  1st Qu.:27.00   Class :character   1st Qu.:26.30   1st Qu.:0.000  
##  Median :39.00   Mode  :character   Median :30.40   Median :1.000  
##  Mean   :39.21                      Mean   :30.66   Mean   :1.095  
##  3rd Qu.:51.00                      3rd Qu.:34.69   3rd Qu.:2.000  
##  Max.   :64.00                      Max.   :53.13   Max.   :5.000  
##    Fumador             region          Costo paciente     
##  Length:1338        Length:1338        Min.   :  3926559  
##  Class :character   Class :character   1st Qu.: 16591005  
##  Mode  :character   Mode  :character   Median : 32837116  
##                                        Mean   : 46446478  
##                                        3rd Qu.: 58239694  
##                                        Max.   :223196498

Respecto a la descripcion inicial del conjunto de datos, se evidencia que el costo de atención oscila entre $3926.558 y $223’196.498 con un costo promedio de $46’446.477. Los clientes tienen una edad promedio de 39 años, un Indice de Masa Muscular promedio de 30,66; y tienen entre 1 y 5 hijos.

Adicionalmente, como se evidencia en la siguiente tabla, los clientes se encuentran distribuidos mas o menos homogeneamente en terminos geograficos y de sexo. Geograficamente Medellín cuenta con 364 clientes, Bogotá con 325, Cali con 325 y Caribe con 324. En cuanto a la distribución por sexo, el sexo masculino es mayoria por muy poca diferencia, con 676 clientes, mientras el sexo femenino cuenta con 662 clientes.

Finalmente, en cuanto al habito de fumar, la mayoria (1064) reportan no ser fumadores, mientras 274 reportan si tener el habito de fumar.

##               bogota cali caribe medellin
##                                          
## femenino  no     135  141    132      139
##           si      29   21     29       36
## masculino no     132  126    125      134
##           si      29   37     38       55

Como el ejercicio solicita la identificación y evaluación de los factores que mayor y mas significativa incidencia en el costo anual por atencion a paciente, se plantea un modelo de regresión lineal por el método de Mínimos Cuadrados ordinarios con el cual se busca medir el efecto de cada una de las variables brindadas en el costo anual de atencion a los clientes. Dicho modelo se resume a continuación.

## 
## Call:
## lm(formula = costo ~ edad + sexo + imc + hijos + fumador + region)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -39567173  -9968330  -3437472   4878722 104974675 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    -43020259    3458686 -12.438  < 2e-16 ***
## edad              898997      41646  21.587  < 2e-16 ***
## sexomasculino    -459600    1165309  -0.394 0.693348    
## imc              1187177     100098  11.860  < 2e-16 ***
## hijos            1664252     482314   3.451 0.000577 ***
## fumadorsi       83469871    1446037  57.723  < 2e-16 ***
## regioncali      -2124805    1670214  -1.272 0.203533    
## regioncaribe     1235374    1666965   0.741 0.458769    
## regionmedellin  -2387204    1676357  -1.424 0.154669    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 21220000 on 1329 degrees of freedom
## Multiple R-squared:  0.7509, Adjusted R-squared:  0.7494 
## F-statistic: 500.8 on 8 and 1329 DF,  p-value: < 2.2e-16

El modelo de regresión lineal planteado muestra que las variables que mayor significancia tienen para explicar el costo de atención a clientes son: la edad, el Indice de Masa Corporal, el numero de hijos y si la persona tiene habitos de fumador, de la siguiente forma.

Ante un aumento de un año en la edad, el costo de atención experimenta un incremento de casi $900.000, manteniendo todo lo demas constante.Adicionalmente, si se da un aumento unitario en el Indice de Masa Corporal, el costo de atención experimenta un incremento de mas de un millon de pesos, manteniendo todo lo demas constante.

En cuanto al numero de hijos, el nacimiento de un hijo adicional, tiene un efecto positivo en el costo de atención, pues este aumenta en mas de $1’600.000, manteniendo todo lo demas constante. Finalmente, respecto al ser fumador, el hecho de ser fumador genera un sobrecosto de mas 83 millones de pesos respecto a las personas que no fuman, manteniendo todo lo demas constante.

Cabe resaltar que las interpretaciones realizadas, se dan con una confianza de mas del 99%. Ademas, el modelo en su conjunto explica cerca de 75% de los cambios en el costo de atencion a clientes y tiene es estadisticamente significativo en su conjunto.

Estos resultados deben ser interpretados con cautela pues la especificación del modelo está sujeta a mejoras, por omision de variables y por la evidente no normalidad en los residuales, lo que hace que los coeficientes esten sesgados y que su significancia estadistica este sobreestimada. Sin embargo, al corregir heterocedasticidad por el método robusto de white, evidenciamos que las relaciones descritas anteriormente, se mantienen en el mismo sentido, la misma significancia y casi que en la misma magnitud, pero que igualmente el modelo esta sujeto a refinamientos en terminos de inclusión de variables importantes como: nivel de ingreso, estrato socioeconomico, o sector de la economia en que está empleado

## 
## t test of coefficients:
## 
##                 Estimate Std. Error  t value  Pr(>|t|)    
## (Intercept)    -43020259    3581691 -12.0112 < 2.2e-16 ***
## edad              898997      41535  21.6442 < 2.2e-16 ***
## sexomasculino    -459600    1163524  -0.3950 0.6929010    
## imc              1187177     110573  10.7366 < 2.2e-16 ***
## hijos            1664252     454486   3.6618 0.0002602 ***
## fumadorsi       83469871    2005558  41.6193 < 2.2e-16 ***
## regioncali      -2124805    1591878  -1.3348 0.1821774    
## regioncaribe     1235374    1690528   0.7308 0.4650533    
## regionmedellin  -2387204    1742788  -1.3698 0.1709929    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Finalmente, respecto al calculo del costo de la prima anual que garantiza una rentabilidad del 20%, es importante tener en cuenta que siendo R la rentabilidad y teniendo en cuenta que Rentabilidad (R) es igual a resta entre el el Ingreso Total (IT) y Costo Total (CT), se puede plantear la siguiente ecuacion:

\[\ Rentabilidad= IngresoTotal-CostoTotal\]

Planteando el caso en que no hay rentabilidad el costo y el ingreso seria iguales a cero. Es decir que:

\[\ IT-CT=0 ; CT=IT\] Entonces la condición para garantizar rentabilidad del 20% es de la forma

\[\ 1,20*CT-CT= 20\% \] Es decir que si usamos el costo promedio de atencion que es igual a $46’446.477, se debe cobrar una prima de $55’735.772 para obtener una rentabilidad de 9’289.295 equivalente al 20%. Cabe resaltar que este calculo corresponde al costo promedio, pero que es segmentable por nivel de ingresos, estrato socioeconomico, o condiciones de morbilidad, de tal manera que la prima que paguen los diferente afiliados este asociada a su estilo de vida y no necesariamente al comportamiento promedio de los afiliados. Esto es importante pues al usar el promedio como criterio, hay que tener en cuenta que esta medida es sensible a valores extremos, entonces se puede presentar el caso en que una persona pague una prima muy inferior al costo que puede representar para el sistema o que una persona pague una prima muy alta respecto al costo que puede llegar a representar. Esta situación tendría efectos en los incentivos que pueden tener los clientes para renovarse en el segmento premium o en la atraccion de nuevos clientes.