Kontrak reasuransi adalah perjanjian di mana satu pihak (reasuransi) setuju untuk mengganti kerugian kepada pihak lain (yang direasuransikan, perusahaan asuransi lini pertama atau juga perusahaan penyalur, cedent) untuk bagian tertentu dari risiko asuransi yang ditanggungnya.Cedent menggantikan sebagian kerugian yang tidak pasti dimasa datang dengan premi yang dibayarkan pada pihak reasuransi. Ada banyak alasan mengapa pengalihan risiko dari perusahaan asuransi kepada reasuransi dapat diinginkan oleh kedua belah pihak, serta untuk ekonomi secara umum.
Misalkan \(X_1,X_2,...\) adalah variabel acak yang saling bebas dan memiliki distribusi identik \(F\). Kita tertarik untuk memodelkan distribusi ekor dari \(X\). Berikut ini beberapa model yang sering digunakan:
\[M_n=\max\{X_1,X_2,...,X_n\}\]
untuk \(n\) yang besar.
Berikut ini data 2,167 besar klaim kerugian akibat kebakaran (dalam millions of Danish Krone) yang dikumpulkan oleh Copenhagen Reinsurance dari tahun 1980 sampai 1990.
## Date Loss
## 1 1980-01-03 1.683748
## 2 1980-01-04 2.093704
## 3 1980-01-05 1.732581
## 4 1980-01-07 1.779754
## 5 1980-01-07 4.612006
## 6 1980-01-10 8.725274
Kita hitung maksimum besar klaim untuk setiap tahunnya dan kita peroleh hasil seperti yang ditampilkan pada plot berikut:
\[X|\{X>u\},\]
untuk pilihan batas \(u\) yang sesuai.
Kita akan mempelajari kedua model di atas.
Distribusi \(M_n\) diberikan sebagai berikut:
\[P(M_n\leq x)=P(X_1<x)P(X_2<x)...P(X_n<x)=P(X<x)^n=F(x)^n ,\]
disini kita telah menggunakan asumsi kebebasan \(X_i\), \(i=1,2,...\), dan keidentikkan distribusi dari variabel acak \(X_i\) tersebut.
Definisikan \[x_F=\sup \{x \ | \ F(x)< 1\}\] Maka untuk \(x<x_F\), kita memiliki prilaku \[P(M_n\leq x)=F(x)^n\to 0, \ n\to \infty.\] Sedangkan untuk \(x>x_F\), \[P(M_n\leq x)=F(x)^n\to 1,\ n\to \infty.\]
Kedua prilaku ini memberikan \[ M_n\to x_F \text{ dalam peluang }\] Terlihat \(M_n\) memiliki distribusi yang degenerate di \(x_F\). Hal ini memberikan informasi yang sangat terbatas dalam menganalisa distribusi \(M_n\). Apakah ada cara lain untuk memperoleh informasi lebih kaya dari distribusi \(M_n\) ?
Kita dapat menggunakan ide central limit theory yang menggunakkan pengskalaan untuk menghasilkan suatu distribusi untuk \(n\to \infty\). Kita dapat menggunakan penskalaan berikut: \[P\left(\frac{M_n-b_n}{a_n}\leq x\right)=P\left(M_n\leq a_nx+b_n\right)=\left(F\left(a_nx+b_n\right)\right)^n\]
Pertanyaan:
Apakah terdapat barisan \(a_n\) dan \(b_n\) sehingga
\[\frac{M_n-b_n}{a_n}\to G, \ n\to \infty\] dengan \(G\) suatu distribusi non-degenerate.
Untuk menjawab pertanyaan di atas berikut contoh-contoh yang memotivasi eksistensi \(a_n\) dan \(b_n\):
Contoh 1: Untuk \(F(x)=1-x^{-\alpha}\) kita memiliki \[P\left(\frac{M_n-b_n}{a_n}\leq x\right)=\left(1-\left(a_nx+b_n\right)^{-\alpha}\right)^n.\] Dengan memilih \(a_n=n^{1/\alpha}\) dan \(b_n=0\) kita peroleh \[P\left(\frac{M_n-b_n}{a_n}\leq x\right)=\left(1-\left(\frac{1}{nx^{\alpha}}\right)\right)^n\to e^{-x^{-\alpha}}.\] Contoh 2: Untuk \(F(x)=x, \ 0<x<1\) kita memiliki \[P\left(\frac{M_n-b_n}{a_n}\leq x\right)=\left(a_nx+b_n\right)^n.\] Dengan memilih \(a_n=\frac{1}{n}\) dan \(b_n=1\) kita peroleh \[P\left(\frac{M_n-b_n}{a_n}\leq x\right)=\left(1+\frac{x}{n}\right)^n\to e^{x}.\] Terlihat dari kedua contoh di atas bahwa penskalaan \(M_n\) dapat memberikan distribusi-distribusi yang tidak degenerate.
Untuk \(\tau\in[0,\infty]\) dan suatu barisan bilangan real \((u_n)\) pernyataan berikut adalah setara:
Bukti:
Jika \(n\overline{F}(u_n)\to \tau\), maka \[\overline{F}(u_n)=\frac{\tau}{n}+o\left(\frac{1}{n}\right)\]
Sehingga \(P(M_n\leq u_n)=(F(u_n))^n=(1-\overline{F}_n(u_n))^n=\left(1-\frac{\tau}{n}+o\left(\frac{1}{n}\right)\right)^n=e^{-\tau}\) untuk \(n\to \infty\).
Sebaliknya jika \(P(M_n\leq u_n)\to e^{-\tau}\), maka \(\overline{F}_n(u_n)\to 0\) seiring \(n\to \infty\). Hal ini dapat ditunjukkan dengan kontradiksi sebagai berikut. Jika \(\overline{F}_n(u_n)\to c\neq 0\), maka terdapat sub barisan \(u_{n_k}\) dengan \(\overline{F}(u_{n_k})>0\) seiring \(k\to \infty\). Hal ini memberikan \((1-\overline{F}(u_{n_k}))^{n_k}\to 0\) seiring \(k\to \infty\). Sehingga \(P(M_n\leq u_n)\to 0\), kontradiksi dengan kondisi yang kita miliki.
Dengan kondisi \(P(M_n\leq u_n)\to e^{\tau}\) dan \(\overline{F}(u_n)\to 0\), kita peroleh
\[(1-\overline{F}(u_n))^n\to e^{-\tau}\] Aplikasikan logaritma dikedua ruas, kita peroleh
\[-n\log(1-\overline{F}(u_n))\to \tau\] Karena \(-\ln(1-x)\sim x\) untuk \(x\to 0\), kita peroleh \[n\overline{F}(u_n)=\tau+o(1).\] Mengapa kita menyebut hasil di atas dengan aproksimasi Poisson? Hal ini dikarenakan bukti di atas mengikuti teori limit Poisson berikut:
Misalkan \(B_n=\sum_{i=1}^n I_{\{X_i>u_n\}}\). Maka \(B_n\sim Binomial(n,\overline{F}(u_n))\). Maka
\(E[B_n]=n\overline{F}(u_n)\to \tau\) jika dan hanya jika \(B_n\to Poisson(\tau)\). Hal ini memberikan \(P(M_n\leq u_n)=P(B_n=0)\to e^{-\tau}\).
Untuk mengkonstruksi barisan \(a_n\) dan \(b_n\), kita definisikan perumuman invers dari fungsi \(f\) sebagai berikut: \[f^{-1}(x):=\inf \{y \ | \ f(y)>x \}.\] Lemma 1 Jika \(f_n(x)\to g(x)\) untuk fungsi-fungsi \(f_n\) yang tidak turun, maka untuk setiap titik kekontinuan \(x\) kita memiliki \[f^{-1}_n(x)\to g^{-1}(x).\]
Kita ingin menentukkan \(a_n\) dan \(b_n\) sehingga \(\lim_{n\to \infty} P(M_n\leq a_nx+b_n)=\lim_{n\to \infty} (F(a_nx+b_n))^n=G(x)\). Aplikasikan logaritma dikedua ruas, kita peroleh \[\lim_{n\to \infty} n\log(F(a_nx+b_n))=\log(G(x))\] Dengan menggunakan aproksimasi Poisson, kita peroleh \[\log(F(a_nx+b_n))=\frac{\log(G(x))}{n}+o\left(\frac{1}{n}\right).\] Sehingga \[\lim_{n\to \infty} F(a_nx+b_n)=\lim_{n\to \infty}e^{\frac{\log(G(x))}{n}+o(1/n)}=1\] Dengan menggunakan hubungan \(\log(x)\approx x-1\) untuk \(x\to 1\), kita peroleh \[\lim_{n\to \infty} n\log(F(a_nx+b_n))=\lim_{n\to \infty} n(1-F(a_nx+b_n))=-\log(G(x)).\] atau
\[\lim_{n\to \infty}\frac{1}{ n(1-F(a_nx+b_n))}=\frac{1}{-\log(G(x))}.\]
Misalkan \(U(x)=\inf\left\{y\ | \ \frac{1}{1-F(y)}\geq x \right\}\). Perhatikan \(U(x)=y\) memiliki arti peluang \(X\) melebihi \(y\) adalah \(1/x\) atau \(1-F(y)=\frac{1}{x}\). Dengan menggunakan definisi \(U(x)\), untuk \(n\in N\), kita peroleh \[U(nx)=\inf \left\{y\ | \ \frac{1}{1-F(y)}>nx\right\}=\inf \left\{y\ | \ \frac{1}{n(1-F(y))}>x\right\}.\] Dari definisi di atas kita memperoleh hubungan berikut: \[\frac{U(nx)-b_n}{a_n}=\inf \left\{\frac{y-b_n}{a_n}\ | \ \frac{1}{n(1-F(y))}>x\right\}.\] Kita definisikan \(z=\frac{y-b_n}{a_n}\) dalam persamaan di atas, mengakibatkan \[\frac{U(nx)-b_n}{a_n}=\inf \left\{z\ | \ \frac{1}{n(1-F(a_nz+b_n))}>x\right\}.\] Dari hasil sebelumnya kita memiliki \(\lim_{n\to \infty} n(1-F(a_nx+b_n))=-\log(G(x))\) yang memberikan \[\lim_{n\to \infty}\frac{U(nx)-b_n}{a_n}=\inf \left\{z\ | \ \frac{1}{-\log(G(z))}>x\right\}=\inf \left\{z\ | \ \log(G(z))>-\frac{1}{x}\right\}=\inf \left\{z\ | \ G(z)>e^{-\frac{1}{x}}\right\}=G^{-1}(e^{-1/x}).\]
Untuk \(G\) yang tidak generate terdapat \(a>0\) dan \(b\in R\) yang memenuhi \(G(ax+b)=G_\xi(x),\) dengan \[G_\xi(x)=e^{-(1+\xi x)^{-1/\xi}},\quad 1+\xi x>0, \ \xi\neq 0.\] Distribusi \(G_\xi(x)\) ini dikenal sebagai Generalized Extreme Value (GEV) dengan \(\xi\) dikenal sebagai indeks nilai ekstrem.
Seperti sebelumnya kita tertarik pada prilaku ekor dari distribusi variabel acak \(X\). Misalkan \(u\) adalah suatu batas yang kita tentukan untuk memisahkan daerah ekstrem (X>u) dan bukan. Kita tertarik untuk menentukan distribusi limit dari \[\frac{X-u}{a(u)} \left| \right.\{X>u\} \to H, \ u\to x_+\] dengan \(a(.)\) suatu fungsi bernilai positif dan \(x_+=\sup\{x \ | \ F(x)<1\}\).
Untuk \(H\) yang tidak degenerate terdapat \(a>0\) yang memberikan \(H(ax)=H_\xi(x)\), dengan
\[H_\xi(x)=1-(1+\xi x)^{-1/\xi}, \ 1+\xi x>0,\]
\(\xi\neq 0\).
Distribusi \(H_\xi(x)\) ini dikenal sebagai Generalized Pareto distribution (GPD). Perhatikan untuk \(\xi\to 0\) kita akan memiliki distribusi eksponensial.
\[1-H_\xi(x)=-\log(G_\xi(x)).\] Kita dapat melihat hubungan kedua distribusi ini sebagai berikut:
\(P(M_n<u+x)=(F(u+x))^n\) memberikan \(n\log(P(M_n<u+x))=n\log(F(u+x))\). Untuk \(u\to \infty\) kita memiliki \(F(u+x)\to 1\), sehingga, untuk \(u\) yang besar,
\[n\log(F(u+x))\to n(F(u+x)-1)=-n(1-F(x+u))\] Dengan cara yang sama kita peroleh hubungan, untuk \(u\) yang besar, \[n\log(F(u))\to -n(1-F(u)).\] Kedua hasil ini memberikan, untuk \(u\) yang besar, \[P(X-u>x | X>u)=\frac{P(X>u+x)}{P(X>u)}=\frac{1-F(x+u)}{1-F(u)}=\frac{n\log(F(u+x))}{n\log(F(u))}=\frac{\log(P(M_n<u+x))}{\log(P(M_n<u))}\] Kita memiliki, untuk \(n\) yang besar, \(\log(P(M_n<u+x))\approx -(1+\xi\frac{u+x-\mu}{\sigma})\) dan \(\log(P(M_n<u))\approx -(1+\xi\frac{u-\mu}{\sigma})\). Sehingga
\[P(X-u>x | X>u)\approx \left(\frac{1+\xi \frac{u+x-\mu}{\sigma}}{1+\xi\frac{u-\mu}{\sigma}}\right)^{-1/\xi}\approx (1+\xi\frac{x}{\tau})^{-1/\xi} \] dengan \(\tau=\sigma+\xi(u-\mu)\).
Untuk distribusi Pareto baku kita mempunyai \[P(Y>x | Y>u)\approx \left( \frac{x}{u}\right)^{-\alpha},\quad x>u.\] Dari hubunag di atas kita peroleh
\[\log((Y>x | Y>u))\approx -\alpha \log\left( \frac{x}{u}\right)=\alpha (\log(u)-\log(x)),\quad x>u.\]
Diberikan data \(x_1, x_2, ...,x_{n_u}\) data yang melebihi batas \(u\). Kita urutkan data ini sehingga \(x_{(1)}\leq x_{(2)}\leq ...\leq x_{(n_u)}\). Dengan menggunakan data terurut ini kita dapat menuliskan distribusi empirik dari \(P(Y>x |Y>u)\) sebagai berikut: \[P(Y>x_{(i)}|Y>u)\approx \frac{n_u-i}{n_u},\ i=1,2,...,n_u-1.\] Sehingga kita memiliki hubungan \[\log\left(\frac{n_u-i}{n_u}\right)\approx \alpha (\log(u)-\log(x_{(i)})),\quad i=1,2,...,n_u-1.\]
Kita aplikasikan teori di atas pada data yang kita miliki. Untuk batas \(u\) kita pilih 10. Denga batas \(u=10\) ini terdapat \(n_{10}=109\) data di atas batas ini.
Kemiringan dari plot di atas dapat diperoleh dengan metode kuadrat terkecil dari persamaan
\[\log\left(\frac{n_{10}-i}{n_{10}}\right)\approx \alpha (\log(10)-\log(x_{(i)})),\quad i=1,2,...,108.\] Diperoleh \(\alpha=1.582581\). Kita tampilkan garis regresinya sebagai berikut:
Kita tampilkan juga distribusi kumulatifnya sebagai berikut:
Misalkan \(y_i=\max\{x_{1i},x_{2i},...,x_{ki}\}\) adalah blok maksima ke-\(i\) dari data runtun waktu \(x_1,x_2,...\) yang terobservasi. Fungsi loglikelihood GEV untuk \(y=(y_1,...,y_n)\) dengan \(\xi\neq 0\) diberikan sebagai berikut: \[l(\mu,\sigma,\xi | z)=-n\log(\sigma)-(1+\frac{1}{\xi})\sum_{i=1}^n \log\left(1+\xi\frac{y_i-\mu}{\sigma}\right)-\sum_{i=1}^n \left(1+\xi\frac{y_i-\mu}{\sigma}\right)^{-1/\xi}\] dengan \(1+\xi(y_i-\mu)/\sigma>0\) untuk \(i=1,2,...,n\).
Fungsi likelihood GEV untuk \(y\) dengan \(\xi=0\) diberikan oleh \[l(\mu,\sigma |z)=-n\log(\sigma)-\sum_{i=1}^n\frac{y_i-\mu}{\sigma}-\sum_{i=1}^n e^{-\frac{y_i-\mu}{\sigma}}.\] Untuk data yang kita miliki diperoleh estimasi MLE sebagai berikut:
## $minimum
## [1] 380.1346
##
## $estimate
## [1] 13.5763140 4.3104102 0.8113314
##
## $gradient
## [1] -6.083646e-06 8.677357e-05 1.697913e-04
##
## $hessian
## [,1] [,2] [,3]
## [1,] 25.48560 -19.14002 35.10645
## [2,] -19.14002 17.40055 -27.13130
## [3,] 35.10645 -27.13130 101.23166
##
## $code
## [1] 1
##
## $iterations
## [1] 42
## mu= 13.57631 , sigma= 4.31041 , xi= 0.8113314
Misalkan \(x_1,x_2,...,x_m\) dengan \(x_i>u\). kita definisikan \(y_i=x_i-u\). Fungsi log likelihood untuk GPD ini sebagai berikut: Untuk \(\xi\neq 0\) \[l(\tau,\xi |y)=-m\log(\tau)-\left(1+\frac{1}{\xi}\right)\sum_{i=1}^m \log\left(1+\xi \frac{y_i}{\tau}\right)\] Untuk \(xi=0\) \[l(\tau,\xi |y)=-m\log(\tau)-\sum_{i=1}^m \frac{y_i}{\tau}\] Misalkan kita aplikasikan MLE ini untuk data yang kita punyai:
## $minimum
## [1] 374.893
##
## $estimate
## [1] 6.9754658 0.4969865
##
## $gradient
## [1] 4.775343e-06 7.958079e-05
##
## $hessian
## [,1] [,2]
## [1,] 1.138184 5.021902
## [2,] 5.021902 75.965988
##
## $code
## [1] 1
##
## $iterations
## [1] 21
## tau= 6.975466 , xi= 0.4969865
Normalized Hurricane Damages in the United States: 1900-2005 used in Pielke et al. (2008). Originally, the data are stored in an Excel file with 4 worksheets. Damages are normalized according two approaches :