当前位置：文档之家› 非寿险费率厘定的索赔频率预测模型及其应用

非寿险费率厘定的索赔频率预测模型及其应用

１４
孟生旺，徐昕：非寿险费率厘定的索赔频率预测模型及其应用
的随机变量，其密度函数为ｕ（θ），通常称作结构函数，那么Ｙ的边际分布就是一个混合泊松分布，均值为λ［５］１３５－１４４。采用不同的结构函数将生成不同的混合泊松分布，因此混合泊松分布的尾部特征与结构函数密切相关，结构函数的尾部越厚，混合泊松分布的尾部将会越长。在混合泊松分布中，最常见的结构函数是伽玛分布和逆高斯分布，相应的混合泊松分布就是负二项分布和泊松－逆高斯分布。当然，还可以考虑其他结构函数，如对数正态分布、广义逆高斯分布和平移伽马分布，它们分别对应泊松－对数正态分布、Ｓｉｃｈｅｌ分布和Ｄｅｌａｐｏｒｔｅ布。
过离散程度的索赔次数数据。虽然可以证明广义泊
松分布和混合负二项分布也属于混合泊松分布，但
由于其结构函数比较复杂，因此目前还难以与前述
三个模型的过离散特征进行直接比较。
（一）负二项回归模型
负二项分布有两种常见类型，分别称之为负二
第２７卷第９期Ｖｏｌ．２７Ｎｏ．９
【统计理论与方法】
统计与信息论坛Ｓｔａｔｉｓｔｉｃｓ＆ＩｎｆｏｒｍａｔｉｏｎＦｏｒｕｍ
２０１２年９月Ｓｅｐ．，２０１２
非寿险费率厘定的索赔频率预测模型及其应用
孟生旺１，徐昕２
（１．中国人民大学应用统计研究中心，北京１００８７２；２．首都经济贸易大学金融学院，北京１０００７０）
关键词：非寿险；费率厘定；索赔频率；过离散中图分类号：Ｏ２１２文献标志码：Ａ文章编号：１００７－３１１６（２０１２）０９－００１４－０６
一、引言
在非寿险分类费率厘定中，通常需要建立索赔频率的预测模型，并通过该模型对被保险人的期望索赔频率进行预测，从而作为费率厘定的基础。在传统的线性回归模型中，假设因变量服从正态分布、且具有相同的方差，但索赔频率是严格非负的离散型随机变量，其方差的大小往往与均值有关，通常遇到的情况是均值越大，方差也会越大，故传统的线性回归模型很难满足建立索赔频率预测模型的需要。
摘要：在非寿险分类费率厘定中，泊松回归模型是最常使用的索赔频率预测模型，但实际的索赔频率数据往往存在过离散特征，使泊松回归模型的结果缺乏可靠性。因此，讨论处理过离散问题的各种回归模型，包括负二项回归模型、泊松－逆高斯回归模型、泊松－对数正态回归模型、广义泊松回归模型、双泊松回归模型、混合负二项回归模型、混合二项回归模型、Ｄｅｌａｐｏｒｔｅ回归模型和Ｓｉｃｈｅｌ回归模型，并对其进行系统比较研究认为：这些模型都可以看做是对泊松回归模型的推广，可以用于处理各种不同过离散程度的索赔频率数据，从而改善费率厘定的效果；同时应用一组实际的汽车保险数据，讨论这些模型的具体应用。
二项 Ⅰ 型的过离散程度越严重；当ａ → ∞ 时，负二项 Ⅰ 型退化为泊松分布。令λｉ＝ｗｉｅｘｐ（ｘｉＴβ），即得到负二项 Ⅰ 型回归模型。
负二项 Ⅰ 型的概率函数可以表示为：Ｐｒ（Ｙｉ＝ｙｉ）＝Γ（λｉ／σ）ΓΓ（（λ１ｉ／＋σｙ＋ｉｙ）（ｉ１）σ＋ｙｉσ）ｙｉ＋λｉ／σ
（ｙｉ＝０，１，…）负二项 Ⅰ 型的均值和方差分别为：Ｅ（Ｙｉ）＝λｉＶａｒ（Ｙｉ）＝λｉ（１＋σ）可以看出：σ越大，负二项 Ⅱ 型的过离散程度越严重；当σ→０时，负二项 Ⅱ 型退化为泊松分布。令λｉ＝ｗｉｅｘｐ（ｘｉＴβ），即得到负二项 Ⅱ 型回归模型。（二）泊松－逆高斯回归模型
广义线性模型是对传统线性回归模型的推广，在因变量服从指数分布族的情况下，可以建立相应的广义线性模型，并采用迭代加权最小二乘法对模型参数进行估计。指数分布族包括一些很常见的分布类型，如二项分布、泊松分布、正态分布、逆高斯分布等。可以证明，在广义线性模型中，迭代加权最小二乘法的估计结果等价于极大似然估计。［１］８１－８９广义线性模型在非寿险费率厘定中的应用十分广泛［２］［３］３６［４］８１－１２７，在索赔频率的预测模型中，最常见
当实际观察数据存在过离散特征时，可将泊松回归模型进行推广。由于混合泊松分布的方差总是大于均值，因此一种自然的想法就是建立混合泊松回归模型。生成混合泊松分布的基本思想是：假设在θ给定的条件下，损失次数随机变量Ｙ服从泊松分布，即Ｙ｜θ＝Ｐｏｉｓｓｏｎ（λθ），而θ是一个均值等于１
在处理过离散数据时，可以考虑的另外几个分布模型包括广义泊松分布、双泊松分布、混合二项分布和混合负二项分布。可以证明，广义泊松分布和混合负二项分布也可以表示为混合泊松分布，只不过其结构函数较为复杂［６－７］）。虽然还不能证明前面提到的其他过离散分布是否也可以表示为混合泊松分布，但由于其具有方差大于均值的性质，因此也可用于建立过离散索赔频率的预测模型。
二、泊松回归模型与混合泊松回归模型
假设共有ｐ个分类变量，将所有保单分为ｎ个
风险类别，其中第ｉ个风险类别在ｐ个分类变量上的取值用ｘｉ＝（ｘｉ１，…，ｘｉｐ）Ｔ表示，并用ｗｉ表示第ｉ个风险类别包含的风险单位数（如汽车保险中的车年
数）。
令Ｙｉ表示第ｉ个风险类别的索赔次数随机变量，ｉ＝１，２，…，ｎ。若Ｙｉ服从泊松分布，则其概率函数为：
泊松－逆高斯分布的概率函数有不同的表达式，其中以均值为参数之一的表达式如下：
∞
∫ Ｐｒ（Ｙｉ＝ｙｉ）＝
ｅｘｐ（－θλｉ）（θλｉ）ｙｉｙｉ！
０
ｅｘｐ［－（θ－１）２／（２τθ）］ｄθ
槡２πτθ３
（ｙｉ＝０，１，…）
１５
收稿日期：２０１２－０４－２３；修复日期：２０１２－０７－０３基金项目：教育部重点研究基地重大项目《随机效应模型及其在非寿险风险管理中的应用》（１２ＪＪＤ７９００２５）；国家自然科学
基金项目《考虑风险相依的非寿险精算模型研究》（７１１７１１９３）；中国人民大学科学研究基金项目（中央高校基本科研业务费专项资金资助）《非寿险定价的精算统计模型及其应用研究》（１０ＸＮＩ００１）作者简介：孟生旺，男，甘肃秦安人，教授，博士生导师，研究方向：风险管理与保险精算；徐昕，男，河南郑州人，讲师，研究方向：风险管理与保险精算。
项 Ⅰ 型和负二项 Ⅱ 型。
负二项 Ⅰ 型的概率函数可以表示为：
Ｐｒ（Ｙｉ＝ｙｉ）
（）（）
＝
Γ（ａ＋ｙｉ） Γ（ａ）Γ（１＋ｙｉ）ａ
ａ＋λｉ
ａ λｉａ＋λｉ
ｙｉ
（ｙｉ＝０，１，…）
负二项 Ⅰ 型的均值和方差分别为：
Ｅ（Ｙｉ）＝λｉＶａｒ（Ｙｉ）＝λｉ＋λｉ２／ａ
从上述均值和方差的关系可以看出：ａ越小，负
Ｐｒ（Ｙｉ
＝
ｙｉ）＝
ｅｘｐ（－λｉ）λｉｙｉｙｉ！
（ｙｉ＝０，１，…）
泊松分布的均值与方差相等，即Ｅ（Ｙｉ）＝Ｖａｒ（Ｙｉ）＝λｉ。若令λｉ＝ｗｉｅｘｐ（ｘｉＴβ），其中β是ｐ × １阶的参数向量，将其代入概率函数，即可得到求解
泊松回归模型的似然函数。
由于混合泊松分布的方差总是大于均值，因此
的广义线性模型是泊松回归模型，即在索赔次数服从泊松分布的假设基础上建立的回归模型。
泊松分布的特点之一是方差等于均值，而实际上的索赔次数数据往往具有过离散特征，即方差大于均值。导致过离散的原因可能多种多样，如由于保险公司和保单持有人增强了风险防范意识，大多数保单不会发生保险事故；或因为保险公司应用了免赔额或无赔款折扣等条款，许多被保险人在发生轻微事故时不会提出索赔；或个别被保险人的风险太大，其索赔频率远远高于总体的平均水平，在这些情况下若仍使用泊松回归模型，可能会低估参数的标准误和高估其显著性水平，从而在模型中保留多余的解释变量，最终导致不稳定的费率厘定结果。

e商务文档

非寿险费率厘定的索赔频率预测模型及其应用

相关文档推荐：