0. Introducción

Contenidos de guia docente:

  1. Función de pérdida

  2. Modelos de distribución de pérdida

  3. Medidas coherentes para la administración del riesgo

  4. Aplicaciones a Finanzas y Actuariales

Contexto de aplicación

  • El negocio del seguro consiste en la transferencia de riesgo, provocado por una pérdida incierta o contingencia, de una entidad a otra, a cambio de un pago.

  • Un asegurador es una empresa que vende seguros. El asegurado es la persona/entidad que compra el seguro.

  • El asegurado paga una cantidad fija y relativamente pequeña (PRIMA) al asegurador a cambio de la promesa del asegurador de compensarle en caso de una pérdida personal.

  • Ambos, asegurado y asegurador, firman un contrato, denominado póliza de seguros, que detalla las condiciones y circunstancias que obligan al asegurador a compensar financieramente al asegurado.

  • Ciencias actuariales: Disciplina que aplica los métodos matemáticos y estadísticos a evaluar riesgos en seguros, finanzas y otros campos de la economía.

  • Riesgo aleatorio: Es una variable aleatoria no negativa que evalúa el tamaño aleatorio de la reclamación o perdida asociado a una póliza de seguros.

Objetivos

  1. ¿Cómo modelar el riesgo asociado a la póliza de un contrato de seguros?

    Sesión 1 (19/03): Distribución nº de siniestros

    Sesión 2 (20/03): Distribución cuantia de siniestros

    Sesión 3 (26/03): Distribuciones compuestas. Aplicación practica 1

  2. ¿Cómo fijar la prima?

    Sesión 4 (2/4): Calculo de primas

    Sesión 5 (3/4): Calculo de primas. Aplicación practica 2

  3. ¿Cómo medir o evaluar el riesgo?

    Sesión 6 (9/4): Medidas de riesgo

    Sesión 7 (10/4): Medidas de riesgo. Aplicación practica 3

    Sesión 8: (11/04) Cuestionario

Evaluación

  • 10% Asistencia y realización ejercicios clase.
  • 20% Practica sobre distribuciones.
  • 20% Practica sobre calculo de prima.
  • 20% Practica sobre medidas de riesgo.
  • 30% Cuestionario. Sesión 8 (11/4)

1. Función de perdida

Conceptos previos

  • Se entienda por perdida (o daño economico) la cantidad sufrida por el asegurado.

  • Denominamos siniestro para indicar la indemnización cuando ocurre un evento asegurado, por lo tanto, la cantidad que paga el asegurador.

  • Aunque algunos textos utilizan pérdida y siniestro indistintamente, hacemos aquí una distinción para remarcar como las disposiciones contractuales de los seguros, tales como las deducciones y los límites, afectan a la cuantía de la reclamación derivada de una pérdida.

  • La frecuencia representa el número de veces con la que ocurre un evento asegurado, normalmente dentro de un contrato de póliza. Aquí nos centramos en las variables aleatorias DISCRETAS que representan el número de siniestros.

  • La cuantía indica la cantidad, o tamaño, de cada pago de un evento asegurado. Aquí nos centramos en las variables aleatorias CONTINUAS que representan la cantidad indemnizada.

  • Un riesgo es un suceso que podría ocurrir o no y de cuya ocurrencia se derivan ciertas consecuencias financieras adversas.

  • Los riesgos se definen en ambientes de incertidumbre, por lo que se modelan usando Teoría de la Probabilidad.

En términos matemáticos, un riesgo es una variable aleatoria \(X\) con:

  • Función de densidad: \(f_X\) siempre que \(F_X\) tenga derivada.
  • Función de distribución: \(F_X\)
  • Función de cola (o función de supervivencia): \[\overline{F}_X=Pr(X>t)\]
  • Función de distribución inversa generalizada (función cuantil): indica el valor de la variable aleatoria para el cual la probabilidad de que esa variable aleatoria sea menor o igual a dicho valor sea la probabilidad dada. \[F^{-1}_X(u)=\inf\{x:F_X(x)\geq u\}, \forall u \in (0,1)\]

2. Modelos de distribución de perdidas

2.1 Número de reclamaciones

Distribución de Poisson

Decimos que la v.a. \(X\) sigue una distribución de Poisson de parámetro \(\lambda\), cuando su función de cuantí­a viene dada por:

\[P(X=k)=\frac{e^{-\lambda}\lambda^k}{k!}\]

Propiedades:

  • \(F(x)=0\) si \(x<0\)

  • Media y varianza iguales: \(E(X)=VAR(X)=\lambda\)

Comandos en R:

  • Función de Probabilidad: dpois(x,lambda)

  • Función de distribución: ppois(x,lambda)

  • Función cuantil: qpois(x,lambda)

  • Generar muestra aleatoria de tamaño n: rpois(n,lambda)

Ejercicio: Siendo \(X\) el número de reclamaciones por incendio en un edificio de cuatro viviendas, una v.a. Poisson de media 0.04. Calcula los primeros valores de su función de cuantía: \(P(X = 0), P(X = 1), P(X = 2), P(X = 3)\) y \(P(X\geq 4)\)

media=0.04 
lambda=media 
p0=dpois(0,lambda) 
p1=dpois(1,lambda) 
p2=dpois(2,lambda) 
p3=dpois(3,lambda) 
p4=1-ppois(3,lambda)
p0
## [1] 0.9607894
p1
## [1] 0.03843158
p2
## [1] 0.0007686316
p3
## [1] 1.024842e-05
p4
## [1] 1.033096e-07

Nota: ejercicio adaptado a partir de @garin2017modelos.

Distribución de Poisson truncada

La más habitual en el calculo actuarial es la distribución poisson truncada en cero que nos sirven para modelizar la variable número de siniestros suponiendo que toma valores superiores al cero. En ese caso:

\[ P(X=k)=\frac{P(X=k \bigcap X>0)}{P(X>0)}=\frac{e^{-\lambda}\lambda^k}{k!(1-e^{-\lambda})} \]

Propiedades:

\(E(X)=\frac{\lambda}{1-e^{-\lambda}}\)

\(var(X)=\frac{\lambda}{1-e^{-\lambda}}-\frac{\lambda^2e^{-\lambda}}{(1-e^{-\lambda})^2}\)

PRÁCTICA: Una empresa aseguradora de vehículos sabe que de cada 200 automóviles asegurados, la probabilidad de que se de un accidente es de 0.03. Además conoce de acuerdo a su historial de siniestros que siempre ocurre al menos un accidente de tránsito que involucra a uno de sus vehiculos asegurados, y todo valor accidentado hace uso de su seguro contratado. La empresa desea saber cuál será la probabilidad de que se reclamen 10 seguros por accidentes sabiendo que sigue una distribución de poisson truncada.

Distribución geométrica

La distribución geométrica representa el número de fracasos antes del primer éxito. Su función de cuantia viene dada por:

\[ P(X=k)=p(1-p)^k \]

Propiedades:

  • \(E(X)=\frac{1-p}{p}\)

  • \(var(X)=\frac{1-p}{p^2}\)

Comandos en R:

  • Función de Probabilidad: dgeom(x,p)

  • Función de distribución: pgeom(x,p)

  • Función cuantil: qgeom(x,p)

  • Generar muestra aleatoria de tamaño n: rgeom(n,p)

Ejemplo

Noticia sobre probabilidad de accidente de avion

A la vista de esta gráfica ¿qué podemos concluir en relación con la noticia? Cuanto mayor sea p, menor será el número esperado de ensayos hasta que se obtenga el primer éxito.

x<-0:50

plot(dgeom(x,0.2), ylim=c(0,1), type="s", lwd=2,
     main="Función de probabilidad",
     ylab="P(X=x)", xlab="Numero de eventos")
lines(dgeom(x,0.5), ylim=c(0,1), type="s", lwd=2,
     col = "red")
lines(dgeom(x,0.8), ylim=c(0,1), type="s", lwd=2,
     col = "blue")
legend (x="topright", legend=c("Geom(x,0.2)", "Geom(x,0.5)","Geom(x,0.8)"), fill=c("1", "2", "4"))

Distribución binomial negativa

Se trata de una generalizacion de la distribución geométrica. Se realizan ensayos independientes tipo Bernouilli con probabilidad de éxito por ensayo igual a \(p\), de manera que representa el número de fracasos antes del éxito \(m\). Su función de cuantia viene dada por:

\[ P(X=k)=\left( \begin{array}{c}m+k-1\\k\\ \end{array}\right)p^m(1-p)^k \]

Propiedades:

  • \(E(X)=\frac{m(1-p)}{p}\)

  • \(var(X)=\frac{m(1-p)}{p^2}\)

Comandos en R:

  • Función de Probabilidad: dnbinom(x,m,p)

  • Función de distribución: pnbinom(x,m, p)

  • Función cuantil: qnbinom(x,m, p)

  • Generar muestra aleatoria de tamaño n: rnbinom(n,m,p)

Ejercicio: Sea \(X\) el número de reclamaciones por incendio en un edificio de cuatro viviendas, una v.a. con Binomial negativa de media, \(E(X) = 0.04\) y varianza \(var(X) = 0.0504\). Calcula los primeros valores de su Función de cuantía (\(P(X = 0)\), \(P(X = 1)\), \(P(X = 2)\), \(P(X = 3)\), y \(P(X\geq 4)\)

media=0.04
varianza=0.0504
p=media/varianza
m=(p*media)/(1-p)
p0=dnbinom(0,m,p)
p1=dnbinom(1,m,p)
p2=dnbinom(2,m,p)
p3=dnbinom(3,m,p)
p4=1-pnbinom(3,m, p)

Nota: ejercicio adaptado a partir de @garin2017modelos.

Distribución de Polya-Eggenberger

En todos las distribuciones anteriores se supone la independencia entre las sucesivas repeticiones del experimento aleatorio. La probabilidad de ocurrencia de cada posible resultado permanece constante a lo largo de la serie de repeticiones.

Consideramos una urna con \(N\) bolas de las cuales \(a\) son blancas y \(b\) son negras. Cada vez que se extrae una bola se mira su color y se introduce de nuevo a la urna junto con \(c\) bolas del mismo color.

  • Si \(c=0\) estamos ante una extracción con reemplazamiento en la que se mantiene la hipótesis de indepedencia. La distribución de la v.a. será la binomial de parámetros \(n\) y \(p\).
  • Si \(c=-1\) estamos ante un caso de extracción sin reemplazamiento.
  • Para el caso en que \(c\neq 0\), se puede calcular la siguiente Función de probabilidad:

\[ P(X=r)=\frac{ \left(\begin{array}{c}\frac{a}{c}+r-1\\r\\\end{array}\right) \left(\begin{array}{c}\frac{b}{c}+s-1\\s\\\end{array}\right)}{ \left(\begin{array}{c}\frac{N}{c}+n-1\\n\\\end{array}\right)} \]

A partir del teorema de intersección considerando la probabilidad de obtener \(r\) bolas blancas en las \(r\) primeras extracciones y obtener \(s\) bolas negras en las \(s\) siguientes extracciones, siendo \(n=r+s\) el número total de extracciones y el número de formas en que se pueden colocar las \(r\) bolas blancas y las \(s\) bolas negras \(\left( \begin{array}{c}n\\r\\\end{array}\right)=\left(\begin{array}{c} n\\s\\ \end{array}\right)\)

Dicha Función de probabilidad se puede reescribir renombrando los parámetros:

  • \(p=\frac{a}{N}\), se considera la probabilidad inicial de siniestro

  • \(q=\frac{b}{N}\), es el complementario de la probabilidad anterior

  • \(\delta=\frac{c}{N}\), se considera la probabilidad de contagio

  • \(s=n-k\), siendo \(k\) el soporte de valores de la variable en el conjunto de enteros positivos

    {\(0,1,2,...,n\)}.

obteniendo:

\[ P(X=k)=\frac{ \left(\begin{array}{c}\frac{p}{\delta}+k-1\\r\\\end{array}\right) \left(\begin{array}{c}\frac{q}{\delta}+s-1\\s\\\end{array}\right)}{ \left(\begin{array}{c}\frac{1}{\delta}+n-1\\n\\\end{array}\right)} \]

Propiedades

  • \(E(X)=np\)

  • \(var(X)=npq\frac{1+n\delta}{1+\delta}\)

  • Notese que la media es similar a la de la distribución binomial en la que el contagio es nulo (se supone igual probabilidad en las distintas repeticiones), sin embargo la varianza aumenta a medida que aumenta la probabilidad de contagio.

  • Este tipo de distribuciones se usa para estudios estadísticos sobre contagios de enfermedades, nosotros la podemos usar para modelizar la propagación de siniestros en contratos de seguros de incendios, por ejemplo.

Comandos en R

dpolya<-function(x,p,delta,n){
s=n-x
a=(p/delta)+x-1
b=((1-p)/delta)+s-1
c=(1/delta)+n-1
z=choose(a,x)
y=choose(b,s)
w=choose(c,n)
print(z*y/w)}

** Ejercicio: [Sea X el número de reclamaciones por incendio en un edificio, una v.a. con distribución de Polya de parámetros. \(p=0.01\),\(\delta= 0.1\), y \(n = 4\), lo cual modeliza que el edificio en cuestión tiene 4 viviendas. Calcula los primeros valores de su Función de cuantía (\(P(X = 0)\), \(P(X = 1)\),\(P(X = 2)\), \(P(X = 3)\)) y \(P(X\geq 4)\).**

p0<-dpolya(0,0.01,0.1,4)
## [1] 0.9653417
p1<-dpolya(1,0.01,0.1,4)
## [1] 0.02993308
p2<-dpolya(2,0.01,0.1,4)
## [1] 0.004150385
p3<-dpolya(3,0.01,0.1,4)
## [1] 0.0005330769
p4<-1-(p0+p1+p2+p3)

PRÁCTICA: Se propone analizar el comportamiento de la varianza en el ejemplo anterior, suponiendo que se modeliza como una distribución binomial o como una distribución de poyla-Levenberg, variando la probabilidad de contagio de 0.01 a 0.1. Nota: ejercicio adaptado a partir de @garin2017modelos.

Estimación de los parámetros

El método de máxima verosimilitud permite estimar los parámetros de la distribución de probabilidad de una variable aleatoria \(X\) a partir de la información aportada por una muestra aleatoria simple de la misma. Si \(\theta\) es el vector de parámetros que caracteriza a una distribución y \(f(x)\) es su función de densidad, el estimador de máxima verosimilitud dada la muestra \({x_1,x_2,…,x_n}\) es el valor que maximiza la función de verosimilitud

En R usaremos la función “fitdist” del paquete “fitdistrplus”.

La sintaxis básica es la siguiente:

fitdist(data, distr)

Por defecto, utiliza el método de máxima verosimilitud mediante el algortimo BFGS (Broyden–Fletcher–Goldfarb–Shanno) que es un algoritmo de optimización iterativa utilizado para resolver problemas de optimización no lineales.

Pruebas de ajuste: Test Chi-Cuadrado (nº reclamaciones)

  • Se trata de un test no paramétrico que se usa en distribuciones discretas y continuas.

  • En distribuciones continuas, los datos se agrupan en \(k\) intervalos, en las discretas se analiza para cada valor posible de la v.a.

  • La hipótesis nula: H\(_0\): Los datos proceden de una distribución F\(_0\)

  • Se parte de la muestra \((x_1, x_2, ...,x_n)\) cuyas observaciones pueden clasificarse en \(k\) clases mutuamente excluyentes \((A_1, A_2,...,A_K)\), siendo \(n_i\) el numero de elementos en la clase \(A_i\) (tambien se le llama frecuencias observadas) tal que \(n=n_1+n_2+...+n_k\). Se rechaza H\(_0\) si: \[ \chi^2=\sum_{i=1}^{k} \frac{(n_i-n\hat{p}_i)^2}{n\hat{p}_i}>\chi^2(1-\alpha)_{k-1-r} \]

donde \(r\) es el numero de parámetros a estimar para especificar completamente la distribución.

Aplicación práctica:

Usando el archivo de reclamaciones se observa que tenemos el número de asegurados para un número de reclamaciones en una cartera de seguros de automovil en Alemania en 1960. Esta cartera aparece en los trabajos de @Willmot1987, @GomezSarabia2008 y @garin2017modelos.

Se observa que hay un total de 23589 asegurados. Denotaremos por X a la variable aleatoria que representa el número de reclamaciones.

  1. Usa la función fisdist para estimar los parámetros de una distribución poisson y una distribución geométrica y presenta el histograma de los datos:
library(readxl)
library(fitdistrplus)
library(summarytools)
muestra<-read_excel("Reclamaciones.xlsx")
reclamaciones<-as.integer(muestra$r)
ajuste_poisson<-fitdist(reclamaciones, "pois")
ajuste_geom<-fitdist(reclamaciones, "geom")
tabla<-freq(reclamaciones)
tabla
## Frequencies  
## reclamaciones  
## Type: Integer  
## 
##                Freq    % Valid   % Valid Cum.    % Total   % Total Cum.
## ----------- ------- ---------- -------------- ---------- --------------
##           0   20592    87.2949        87.2949    87.2949        87.2949
##           1    2651    11.2383        98.5332    11.2383        98.5332
##           2     297     1.2591        99.7923     1.2591        99.7923
##           3      41     0.1738        99.9661     0.1738        99.9661
##           4       7     0.0297        99.9958     0.0297        99.9958
##           6       1     0.0042       100.0000     0.0042       100.0000
##        <NA>       0                               0.0000       100.0000
##       Total   23589   100.0000       100.0000   100.0000       100.0000
hist(reclamaciones, freq = FALSE, main = "Histograma y densidad",
     ylab = "Densidad")

plot(ajuste_poisson)

plot(ajuste_geom)

  1. Bajo la hipotesis de que \(X\) sigue uns distribución de Poisson \(P( \lambda)\), estima (sin la función fitdist) el parámetro \(\lambda\), obten la tabla de ferecuencias estimadas y realiza una prueba de ajuste \(\chi^2\) para contrastar la hipótesis planteada. Para estimar el valor de \(\lambda\), se calcula la media de la distribución anterior:
A1=0
A2=1
A3=2
A4=3
A5=4
A6=5
A7=6
n1=20592
n2=2651
n3=297
n4=41
n5=7
n6=0
n7=1
n=n1+n2+n3+n4+n5+n6+n7
media=((A1*n1)+(A2*n2)+(A3*n3)+(A4*n4)+(A5*n5)+(A6*n6)+(A7*n7))/n
p1=dpois(0,media)
E1=n*p1
p2=dpois(1,media)
E2=n*p2
p3=dpois(2,media)
E3=n*p3
p4=dpois(3,media)
E4=n*p4
p5=dpois(4,media)
E5=n*p5
p6=dpois(5,media)
E6=n*p6
p7=1-ppois(6,media)
E7=n*p7
Q=((n1-E1)^2+(n2-E2)^2+(n3-E3)^2+(n4-E4)^2+(n5-E5)^2+(n6-E6)^2+(n7-E7)^2)/(E1+E2+E3+E4+E5+E6+E7)
gl=7-1-1
q95=qchisq(0.95,gl) 
if(Q>q95){
"Rechazo Ho"
} else {
    "No se puede rechazar Ho"
  }
## [1] "No se puede rechazar Ho"
  1. Bajo la hipótesis de que \(X\) sigue una distribución geométrica estima los parámetros (sin usar la función fitdist), obtén la tabla de frecuencias y realiza una prueba de ajuste \(\chi^2\) para contrastar la hipótesis planteada.
A1=0
A2=1
A3=2
A4=3
A5=4
A6=5
A7=6
n1=20592
n2=2651
n3=297
n4=41
n5=7
n6=0
n7=1
n=n1+n2+n3+n4+n5+n6+n7
media=((A1*n1)+(A2*n2)+(A3*n3)+(A4*n4)+(A5*n5)+(A6*n6)+(A7*n7))/n
p=1/(media+1)
p1=dgeom(0,p)
E1=n*p1
p2=dgeom(1,p)
E2=n*p2
p3=dgeom(2,p)
E3=n*p3
p4=dgeom(3,p)
E4=n*p4
p5=dgeom(4,p)
E5=n*p5
p6=dgeom(5,p)
E6=n*p6
p7=dgeom(6,p)
E7=n*p7
Q=((n1-E1)^2+(n2-E2)^2+(n3-E3)^2+(n4-E4)^2+(n5-E5)^2+(n6-E6)^2+(n7-E7)^2)/(E1+E2+E3+E4+E5+E6+E7)
gl=7-1-1
q95=qchisq(0.95,gl) 
if(Q>q95){
"Rechazo Ho"
} else {
    "No se puede rechazar Ho"
  }
## [1] "No se puede rechazar Ho"
x<-0:20
lambda<-media
plot(ppois(x,lambda), type="s", lwd=2,
     main="Función de probabilidad",
     ylab="P(X=x)", xlab="Numero de eventos")
lines(pgeom(x,p), type="s", lwd=2,
     col = 2)

Referencias

Klugman, S. A., Panjer, H. H. and Willmot, G. E. (2012). Loss models: from data to decisions (Vol. 715). John Wiley and Sons.

Apuntes de Miguel Ángel Sordo. MACE, Curso 2020-2021.

Garín-Martín, A. y González-Morgado, MA. Modelos Estocásticos de Estadística Actuarial. Universidad del País Vasco.