Para empezar a responder la pregunta planteada notemos lo siguiente:

Dados los montos de primas actuales solo estamos cubriendo cerca del 1.13% de los montos reclamados, por lo que es bastante claro que el valor de las primas no es el correcto.

Para el modelo que usaremos transformaremos las variables, considerado entonces la proporción de cobertura del monto de reclamo de la póliza dada la prima de esta, es decir, el cociente de la prima entre reclamo.

Consideraremos toda proporción mayor a 2.5% como buena y menor como mala. Aplicaremos un modelo logístico para encontrar las variables significativas que afectan la probabilidad de que una prima tenga mayor cobertura del monto de reclamo.

Tras aplicar el modelo obtenemos lo siguiente:

El otro acercamiento al problema fue considerar el monto esperado de las reclamaciones y con este tomar los reclamos que superaban este monto y los que no.

Aplicaremos un modelo logístico para encontrar las variables significativas que afectan la probabilidad que un monto de reclamo sea mayor a $65,000

Tras aplicar el modelo obtenemos lo siguiente:

Se intentó con distintos modelos, pero no se obtenían variables significativas, los dos modelos anteriores fueron los únicos que sí las obtuvieron.