1 Pendahuluan

Kontrak reasuransi adalah perjanjian di mana satu pihak (reasuransi) setuju untuk mengganti kerugian kepada pihak lain (yang direasuransikan, perusahaan asuransi lini pertama atau juga perusahaan penyalur, cedent) untuk bagian tertentu dari risiko asuransi yang ditanggungnya.Cedent menggantikan sebagian kerugian yang tidak pasti dimasa datang dengan premi yang dibayarkan pada pihak reasuransi. Ada banyak alasan mengapa pengalihan risiko dari perusahaan asuransi kepada reasuransi dapat diinginkan oleh kedua belah pihak, serta untuk ekonomi secara umum.

2 Distribusi Ekstrem univariat

Misalkan \(X_1,X_2,...\) adalah variabel acak yang saling bebas dan memiliki distribusi identik \(F\). Kita tertarik untuk memodelkan distribusi ekor dari \(X\). Berikut ini beberapa model yang sering digunakan:

  1. Metode Block maxima: memodelkan distribusi ekor berdasarkan variabel acak

\[M_n=\max\{X_1,X_2,...,X_n\}\]

untuk \(n\) yang besar.

Berikut ini data 2,167 besar klaim kerugian akibat kebakaran (dalam millions of Danish Krone) yang dikumpulkan oleh Copenhagen Reinsurance dari tahun 1980 sampai 1990.

##         Date     Loss
## 1 1980-01-03 1.683748
## 2 1980-01-04 2.093704
## 3 1980-01-05 1.732581
## 4 1980-01-07 1.779754
## 5 1980-01-07 4.612006
## 6 1980-01-10 8.725274

Kita hitung maksimum besar klaim untuk setiap tahunnya dan kita peroleh hasil seperti yang ditampilkan pada plot berikut:

  1. Metode yang berdasarkan distribusi ekor dari variabel acak

\[X|\{X>u\},\]

untuk pilihan batas \(u\) yang sesuai.

Kita akan mempelajari kedua model di atas.

2.1 Metode Block Maxima

Distribusi \(M_n\) diberikan sebagai berikut:

\[P(M_n\leq x)=P(X_1<x)P(X_2<x)...P(X_n<x)=P(X<x)^n=F(x)^n ,\]

disini kita telah menggunakan asumsi kebebasan \(X_i\), \(i=1,2,...\), dan keidentikkan distribusi dari variabel acak \(X_i\) tersebut.

Definisikan \[x_F=\sup \{x \ | \ F(x)< 1\}\] Maka untuk \(x<x_F\), kita memiliki prilaku \[P(M_n\leq x)=F(x)^n\to 0, \ n\to \infty.\] Sedangkan untuk \(x>x_F\), \[P(M_n\leq x)=F(x)^n\to 1,\ n\to \infty.\]

Kedua prilaku ini memberikan \[ M_n\to x_F \text{ dalam peluang }\] Terlihat \(M_n\) memiliki distribusi yang degenerate di \(x_F\). Hal ini memberikan informasi yang sangat terbatas dalam menganalisa distribusi \(M_n\). Apakah ada cara lain untuk memperoleh informasi lebih kaya dari distribusi \(M_n\) ?

Kita dapat menggunakan ide central limit theory yang menggunakkan pengskalaan untuk menghasilkan suatu distribusi untuk \(n\to \infty\). Kita dapat menggunakan penskalaan berikut: \[P\left(\frac{M_n-b_n}{a_n}\leq x\right)=P\left(M_n\leq a_nx+b_n\right)=\left(F\left(a_nx+b_n\right)\right)^n\]

Pertanyaan:

Apakah terdapat barisan \(a_n\) dan \(b_n\) sehingga

\[\frac{M_n-b_n}{a_n}\to G, \ n\to \infty\] dengan \(G\) suatu distribusi non-degenerate.

Untuk menjawab pertanyaan di atas berikut contoh-contoh yang memotivasi eksistensi \(a_n\) dan \(b_n\):

Contoh 1: Untuk \(F(x)=1-x^{-\alpha}\) kita memiliki \[P\left(\frac{M_n-b_n}{a_n}\leq x\right)=\left(1-\left(a_nx+b_n\right)^{-\alpha}\right)^n.\] Dengan memilih \(a_n=n^{1/\alpha}\) dan \(b_n=0\) kita peroleh \[P\left(\frac{M_n-b_n}{a_n}\leq x\right)=\left(1-\left(\frac{1}{nx^{\alpha}}\right)\right)^n\to e^{-x^{-\alpha}}.\] Contoh 2: Untuk \(F(x)=x, \ 0<x<1\) kita memiliki \[P\left(\frac{M_n-b_n}{a_n}\leq x\right)=\left(a_nx+b_n\right)^n.\] Dengan memilih \(a_n=\frac{1}{n}\) dan \(b_n=1\) kita peroleh \[P\left(\frac{M_n-b_n}{a_n}\leq x\right)=\left(1+\frac{x}{n}\right)^n\to e^{x}.\] Terlihat dari kedua contoh di atas bahwa penskalaan \(M_n\) dapat memberikan distribusi-distribusi yang tidak degenerate.

2.1.1 Lema Aproksimasi Poisson

Untuk \(\tau\in[0,\infty]\) dan suatu barisan bilangan real \((u_n)\) pernyataan berikut adalah setara:

  • \(n\overline{F}(u_n)\to \tau\)
  • \(P(M_n\leq u_n)\to e^{-\tau}\)

Bukti:

Jika \(n\overline{F}(u_n)\to \tau\), maka \[\overline{F}(u_n)=\frac{\tau}{n}+o\left(\frac{1}{n}\right)\]

Sehingga \(P(M_n\leq u_n)=(F(u_n))^n=(1-\overline{F}_n(u_n))^n=\left(1-\frac{\tau}{n}+o\left(\frac{1}{n}\right)\right)^n=e^{-\tau}\) untuk \(n\to \infty\).

Sebaliknya jika \(P(M_n\leq u_n)\to e^{-\tau}\), maka \(\overline{F}_n(u_n)\to 0\) seiring \(n\to \infty\). Hal ini dapat ditunjukkan dengan kontradiksi sebagai berikut. Jika \(\overline{F}_n(u_n)\to c\neq 0\), maka terdapat sub barisan \(u_{n_k}\) dengan \(\overline{F}(u_{n_k})>0\) seiring \(k\to \infty\). Hal ini memberikan \((1-\overline{F}(u_{n_k}))^{n_k}\to 0\) seiring \(k\to \infty\). Sehingga \(P(M_n\leq u_n)\to 0\), kontradiksi dengan kondisi yang kita miliki.

Dengan kondisi \(P(M_n\leq u_n)\to e^{\tau}\) dan \(\overline{F}(u_n)\to 0\), kita peroleh

\[(1-\overline{F}(u_n))^n\to e^{-\tau}\] Aplikasikan logaritma dikedua ruas, kita peroleh

\[-n\log(1-\overline{F}(u_n))\to \tau\] Karena \(-\ln(1-x)\sim x\) untuk \(x\to 0\), kita peroleh \[n\overline{F}(u_n)=\tau+o(1).\] Mengapa kita menyebut hasil di atas dengan aproksimasi Poisson? Hal ini dikarenakan bukti di atas mengikuti teori limit Poisson berikut:

Misalkan \(B_n=\sum_{i=1}^n I_{\{X_i>u_n\}}\). Maka \(B_n\sim Binomial(n,\overline{F}(u_n))\). Maka

\(E[B_n]=n\overline{F}(u_n)\to \tau\) jika dan hanya jika \(B_n\to Poisson(\tau)\). Hal ini memberikan \(P(M_n\leq u_n)=P(B_n=0)\to e^{-\tau}\).

2.2 Eksistensi \(a_n\) dan \(b_n\)

Untuk mengkonstruksi barisan \(a_n\) dan \(b_n\), kita definisikan perumuman invers dari fungsi \(f\) sebagai berikut: \[f^{-1}(x):=\inf \{y \ | \ f(y)>x \}.\] Lemma 1 Jika \(f_n(x)\to g(x)\) untuk fungsi-fungsi \(f_n\) yang tidak turun, maka untuk setiap titik kekontinuan \(x\) kita memiliki \[f^{-1}_n(x)\to g^{-1}(x).\]

Kita ingin menentukkan \(a_n\) dan \(b_n\) sehingga \(\lim_{n\to \infty} P(M_n\leq a_nx+b_n)=\lim_{n\to \infty} (F(a_nx+b_n))^n=G(x)\). Aplikasikan logaritma dikedua ruas, kita peroleh \[\lim_{n\to \infty} n\log(F(a_nx+b_n))=\log(G(x))\] Dengan menggunakan aproksimasi Poisson, kita peroleh \[\log(F(a_nx+b_n))=\frac{\log(G(x))}{n}+o\left(\frac{1}{n}\right).\] Sehingga \[\lim_{n\to \infty} F(a_nx+b_n)=\lim_{n\to \infty}e^{\frac{\log(G(x))}{n}+o(1/n)}=1\] Dengan menggunakan hubungan \(\log(x)\approx x-1\) untuk \(x\to 1\), kita peroleh \[\lim_{n\to \infty} n\log(F(a_nx+b_n))=\lim_{n\to \infty} n(1-F(a_nx+b_n))=-\log(G(x)).\] atau

\[\lim_{n\to \infty}\frac{1}{ n(1-F(a_nx+b_n))}=\frac{1}{-\log(G(x))}.\]

Misalkan \(U(x)=\inf\left\{y\ | \ \frac{1}{1-F(y)}\geq x \right\}\). Perhatikan \(U(x)=y\) memiliki arti peluang \(X\) melebihi \(y\) adalah \(1/x\) atau \(1-F(y)=\frac{1}{x}\). Dengan menggunakan definisi \(U(x)\), untuk \(n\in N\), kita peroleh \[U(nx)=\inf \left\{y\ | \ \frac{1}{1-F(y)}>nx\right\}=\inf \left\{y\ | \ \frac{1}{n(1-F(y))}>x\right\}.\] Dari definisi di atas kita memperoleh hubungan berikut: \[\frac{U(nx)-b_n}{a_n}=\inf \left\{\frac{y-b_n}{a_n}\ | \ \frac{1}{n(1-F(y))}>x\right\}.\] Kita definisikan \(z=\frac{y-b_n}{a_n}\) dalam persamaan di atas, mengakibatkan \[\frac{U(nx)-b_n}{a_n}=\inf \left\{z\ | \ \frac{1}{n(1-F(a_nz+b_n))}>x\right\}.\] Dari hasil sebelumnya kita memiliki \(\lim_{n\to \infty} n(1-F(a_nx+b_n))=-\log(G(x))\) yang memberikan \[\lim_{n\to \infty}\frac{U(nx)-b_n}{a_n}=\inf \left\{z\ | \ \frac{1}{-\log(G(z))}>x\right\}=\inf \left\{z\ | \ \log(G(z))>-\frac{1}{x}\right\}=\inf \left\{z\ | \ G(z)>e^{-\frac{1}{x}}\right\}=G^{-1}(e^{-1/x}).\]

2.2.1 Teorema Fisher-Tippett

Untuk \(G\) yang tidak generate terdapat \(a>0\) dan \(b\in R\) yang memenuhi \(G(ax+b)=G_\xi(x),\) dengan \[G_\xi(x)=e^{-(1+\xi x)^{-1/\xi}},\quad 1+\xi x>0, \ \xi\neq 0.\] Distribusi \(G_\xi(x)\) ini dikenal sebagai Generalized Extreme Value (GEV) dengan \(\xi\) dikenal sebagai indeks nilai ekstrem.

  • Untuk \(\xi<0\) distribusi \(G\) memiliki short tailed.
  • Untuk \(\xi=0\) distribusi \(G\) dikenal sebagai Gumbel baku yang memiliki light tailed.
  • Untuk \(\xi>0\) distribusi \(G\) memiliki heavy tailed.

2.3 Metode distribusi \(X|\{X>u\}\)

Seperti sebelumnya kita tertarik pada prilaku ekor dari distribusi variabel acak \(X\). Misalkan \(u\) adalah suatu batas yang kita tentukan untuk memisahkan daerah ekstrem (X>u) dan bukan. Kita tertarik untuk menentukan distribusi limit dari \[\frac{X-u}{a(u)} \left| \right.\{X>u\} \to H, \ u\to x_+\] dengan \(a(.)\) suatu fungsi bernilai positif dan \(x_+=\sup\{x \ | \ F(x)<1\}\).

2.3.1 Teorema Pickands-Balkema-de Haan

Untuk \(H\) yang tidak degenerate terdapat \(a>0\) yang memberikan \(H(ax)=H_\xi(x)\), dengan

\[H_\xi(x)=1-(1+\xi x)^{-1/\xi}, \ 1+\xi x>0,\]

\(\xi\neq 0\).

Distribusi \(H_\xi(x)\) ini dikenal sebagai Generalized Pareto distribution (GPD). Perhatikan untuk \(\xi\to 0\) kita akan memiliki distribusi eksponensial.

2.4 Hubungan GEV dan GPD

\[1-H_\xi(x)=-\log(G_\xi(x)).\] Kita dapat melihat hubungan kedua distribusi ini sebagai berikut:

\(P(M_n<u+x)=(F(u+x))^n\) memberikan \(n\log(P(M_n<u+x))=n\log(F(u+x))\). Untuk \(u\to \infty\) kita memiliki \(F(u+x)\to 1\), sehingga, untuk \(u\) yang besar,

\[n\log(F(u+x))\to n(F(u+x)-1)=-n(1-F(x+u))\] Dengan cara yang sama kita peroleh hubungan, untuk \(u\) yang besar, \[n\log(F(u))\to -n(1-F(u)).\] Kedua hasil ini memberikan, untuk \(u\) yang besar, \[P(X-u>x | X>u)=\frac{P(X>u+x)}{P(X>u)}=\frac{1-F(x+u)}{1-F(u)}=\frac{n\log(F(u+x))}{n\log(F(u))}=\frac{\log(P(M_n<u+x))}{\log(P(M_n<u))}\] Kita memiliki, untuk \(n\) yang besar, \(\log(P(M_n<u+x))\approx -(1+\xi\frac{u+x-\mu}{\sigma})\) dan \(\log(P(M_n<u))\approx -(1+\xi\frac{u-\mu}{\sigma})\). Sehingga

\[P(X-u>x | X>u)\approx \left(\frac{1+\xi \frac{u+x-\mu}{\sigma}}{1+\xi\frac{u-\mu}{\sigma}}\right)^{-1/\xi}\approx (1+\xi\frac{x}{\tau})^{-1/\xi} \] dengan \(\tau=\sigma+\xi(u-\mu)\).

2.5 Visualisasi Ekor distribusi ekstrem

Untuk distribusi Pareto baku kita mempunyai \[P(Y>x | Y>u)\approx \left( \frac{x}{u}\right)^{-\alpha},\quad x>u.\] Dari hubunag di atas kita peroleh

\[\log((Y>x | Y>u))\approx -\alpha \log\left( \frac{x}{u}\right)=\alpha (\log(u)-\log(x)),\quad x>u.\]

Diberikan data \(x_1, x_2, ...,x_{n_u}\) data yang melebihi batas \(u\). Kita urutkan data ini sehingga \(x_{(1)}\leq x_{(2)}\leq ...\leq x_{(n_u)}\). Dengan menggunakan data terurut ini kita dapat menuliskan distribusi empirik dari \(P(Y>x |Y>u)\) sebagai berikut: \[P(Y>x_{(i)}|Y>u)\approx \frac{n_u-i}{n_u},\ i=1,2,...,n_u-1.\] Sehingga kita memiliki hubungan \[\log\left(\frac{n_u-i}{n_u}\right)\approx \alpha (\log(u)-\log(x_{(i)})),\quad i=1,2,...,n_u-1.\]

2.5.1 Visualisasi ekor distribusi Pareto baku

Kita aplikasikan teori di atas pada data yang kita miliki. Untuk batas \(u\) kita pilih 10. Denga batas \(u=10\) ini terdapat \(n_{10}=109\) data di atas batas ini.

Kemiringan dari plot di atas dapat diperoleh dengan metode kuadrat terkecil dari persamaan

\[\log\left(\frac{n_{10}-i}{n_{10}}\right)\approx \alpha (\log(10)-\log(x_{(i)})),\quad i=1,2,...,108.\] Diperoleh \(\alpha=1.582581\). Kita tampilkan garis regresinya sebagai berikut:

Kita tampilkan juga distribusi kumulatifnya sebagai berikut:

2.6 Estimasi parameter-parameter Distribusi GEV

Misalkan \(y_i=\max\{x_{1i},x_{2i},...,x_{ki}\}\) adalah blok maksima ke-\(i\) dari data runtun waktu \(x_1,x_2,...\) yang terobservasi. Fungsi loglikelihood GEV untuk \(y=(y_1,...,y_n)\) dengan \(\xi\neq 0\) diberikan sebagai berikut: \[l(\mu,\sigma,\xi | z)=-n\log(\sigma)-(1+\frac{1}{\xi})\sum_{i=1}^n \log\left(1+\xi\frac{y_i-\mu}{\sigma}\right)-\sum_{i=1}^n \left(1+\xi\frac{y_i-\mu}{\sigma}\right)^{-1/\xi}\] dengan \(1+\xi(y_i-\mu)/\sigma>0\) untuk \(i=1,2,...,n\).

Fungsi likelihood GEV untuk \(y\) dengan \(\xi=0\) diberikan oleh \[l(\mu,\sigma |z)=-n\log(\sigma)-\sum_{i=1}^n\frac{y_i-\mu}{\sigma}-\sum_{i=1}^n e^{-\frac{y_i-\mu}{\sigma}}.\] Untuk data yang kita miliki diperoleh estimasi MLE sebagai berikut:

## $minimum
## [1] 380.1346
## 
## $estimate
## [1] 13.5763140  4.3104102  0.8113314
## 
## $gradient
## [1] -6.083646e-06  8.677357e-05  1.697913e-04
## 
## $hessian
##           [,1]      [,2]      [,3]
## [1,]  25.48560 -19.14002  35.10645
## [2,] -19.14002  17.40055 -27.13130
## [3,]  35.10645 -27.13130 101.23166
## 
## $code
## [1] 1
## 
## $iterations
## [1] 42
## mu= 13.57631 , sigma= 4.31041 , xi= 0.8113314

2.7 Estimasi parameter-parameter Distribusi Generalized Pareto

Misalkan \(x_1,x_2,...,x_m\) dengan \(x_i>u\). kita definisikan \(y_i=x_i-u\). Fungsi log likelihood untuk GPD ini sebagai berikut: Untuk \(\xi\neq 0\) \[l(\tau,\xi |y)=-m\log(\tau)-\left(1+\frac{1}{\xi}\right)\sum_{i=1}^m \log\left(1+\xi \frac{y_i}{\tau}\right)\] Untuk \(xi=0\) \[l(\tau,\xi |y)=-m\log(\tau)-\sum_{i=1}^m \frac{y_i}{\tau}\] Misalkan kita aplikasikan MLE ini untuk data yang kita punyai:

## $minimum
## [1] 374.893
## 
## $estimate
## [1] 6.9754658 0.4969865
## 
## $gradient
## [1] 4.775343e-06 7.958079e-05
## 
## $hessian
##          [,1]      [,2]
## [1,] 1.138184  5.021902
## [2,] 5.021902 75.965988
## 
## $code
## [1] 1
## 
## $iterations
## [1] 21
## tau= 6.975466 , xi= 0.4969865

2.7.1 Loss caused by storm

Normalized Hurricane Damages in the United States: 1900-2005 used in Pielke et al. (2008). Originally, the data are stored in an Excel file with 4 worksheets. Damages are normalized according two approaches :

  1. the methodology used by Pielke and Landsea (1998), adjusting for inflation, wealth, and population updated to 2005, called PL05; and
  2. the methodology used by Collins and Lowe (2001), adjusting for inflation, wealth, and housing units updated to 2005, called CL05