概述
(教材参考:中国精算师协会考试教材A6)
非寿险精算中的统计方法
- 损失分布的拟合方法
1.1 理论分布
非寿险的损失可以理解为被保险人的损失/被保险人向保险人提出的索赔额/保险人的损失,决定损失大小的两个因素是损失次数和损失金额
- 常用的损失次数理论分布:泊松分布、二项分布、负二项分布
- 常用的损失额理论分布:一般具有非负、右偏、长尾的特点,如对数正态分布、帕累托分布、伽马分布(其他一些右偏斜的连续型分布有对数伽马分布、韦伯分布以及卡方分布)
1.2 参数估计与假设检验
- 点估计、极大似然估计、分位数估计、最小二乘估计、区间估计
1.3 分布拟合
先根据观测得到的损失数据编制损失经验分布,并根据损失经验分布的形态特点选择与之最相似的理论分布族,然后估计参数,确定理论分布
- 经验分布函数可以采用将观测值分组的方式,用累积频率表示各组上限的左极限,绘制频率和累积频率分布表
- 组距对频率的影响可以用频率密度=频率/组距来消除
- 数据分布均匀可以采用线性插值方法
- 利用频率密度直方图/曲线图的形态:连续/离散、单峰/多峰、正态/偏态、左偏/右偏
1.4 拟合优度检验
拟合优度检验是最常见的一种非参数假设检验,一般选用卡方检验
- 原假设:损失数据符合某个理论分布
- 为了检验原假设,先把观测数据分成n组,选用检验统计量
,其中是第i组观测的实际频数,是根据假设的理论分布计算出来的理论频数
- 在假设
成立的前提下,统计量服从自由度为n-k-1的分布,k为理论分布中用参数估计法得到的参数的个数
在精算实务中,需要对部分保险数据损失分布进行拟合,即由于免赔额、最高赔偿限额或者比例赔偿的设定,导致事故造成的损失只能获得部分赔偿
- 实质上是实际损失额随机变量X的分布函数的一种截断,例如赔款额
,d为免赔额,就是分布函数的一个下(左)截尾
- 部分保险损失分布的拟合问题就是要求精算师使用Y的观测值推断出未知参数的估计值,获得X的分布
2. 损失后验分布的推断方法(类似于机器学习)
由于缺少足够的样本信息,新成立的保险公司或新险种无法进行损失分布的拟合,需要在获得新的数据后不断修正原有的推断,损失后验分布的推断通常使用贝叶斯统计法
- 根据过往经验选择参数
的先验分布和密度函数
- 对实际获得的数据
进行试验,在已知的情况下,确定观测值的条件联合密度函数
- 根据条件概率的贝叶斯公式求出
的后验分布,
- 选取损失函数(平方损失或绝对误差损失),求最小值点得到参数
的贝叶斯估计值
3.损失分布的随机模拟方法
随机模拟方法也就是Monte-Carlo模拟法,在非寿险精算中主要用于对损失随机变量的模拟
- 处理随机数可以用反函数法
4. 信度理论与方法
4.1 信度理论
信度理论是研究如何通过加权方法正确处理先验信息和后验信息的理论
- 例如在二项分布的贝叶斯估计中,参数p在平方损失函数下的估计实际上是先验信息和后验信息的加权:
- 其中,
是p的先验分布的数学期望,是p的极大似然估计
- 常把
记为Z,称为信度因子,表示观测值的可信程度,n充分大时Z接近1,说明观测数据已经提供了足够的信息
4.2 有限扰动信度理论(Limited Fluctutation Credibility Theory)
有限扰动信度理论假设观测值对于X的扰动(即误差)纯粹是由随机因素引起的
- 也就是说,观测值是来自总体X的独立同分布的样本
完全可信性(Full Credibility)理论是基于有限扰动信度理论的理论,认为完全依据观测值数据所提供的信息来厘定费率,即要求
- 完全可信性条件:设
和为预先给定的比较小的正数,若n满足不等式,则称n满足完全可信性条件
- 实质就是满足完全可信性的n,能使
与的相对误差比较小的概率比较大
如果n不满足完全可信性条件,就无法只根据观测值来估计
- 用M表示根据其他信息得到的损失平均值,那么损失随机变量X的数学期望的估计值为
- 部分可信性理论表示
,根据中心极限定理,可以得到的平方根法则,即
-
表示完全可信性条件中观测值个数n的下限,当时,完全可信性条件成立,可取Z为1
- 部分可信性理论取信度因子Z为
,在推出一个新险种或没有损失随机变量的观测值时,只能参考其他类似险种或者其他公司数据,此时
4.3 风险的异质性(Heterogeneity)及其假设检验
风险的异质性表明历史经验数据误差并不纯粹是由随机性引起的,还可能与别的因素有关,例如车险的风险还与车的品牌款式有关
- 风险异质在统计学上的体现是风险具有不同的分布
- 当X表示索赔次数时,可以用
来处理风险异质
4.4 最精确信度理论(Great Accuracy Credibility Theory)
贝叶斯估计法需要提前知道参数的先验分布密度和条件密度,在非寿险精算中并不实用,Buhlmann提出用观测值的线性函数作为损失随机变量X或者其参数的可信性估计,并由此推算保费的信度模型
- 假设随机变量X的分布参数
也是随机变量,把参数的不同取值理解为异质风险的不同风险水平
-
和表示在参数为,即风险水平固定时的X的条件期望和内在差异
-
和分别表示和在不同风险参数下的均值,即
-
表示了不同风险水平下条件期望之间的差异
-
和为结构参数,为Buhlmann模型估计可信性的条件
最后
以上就是唠叨野狼为你收集整理的非参数统计吴喜之_非寿险精算——统计方法的全部内容,希望文章能够帮你解决非参数统计吴喜之_非寿险精算——统计方法所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复