当前位置:文档之家› 非寿险费率厘定的索赔频率预测模型及其应用

非寿险费率厘定的索赔频率预测模型及其应用


14
孟 生 旺 ,徐 昕 :非 寿 险 费 率 厘 定 的 索 赔 频 率 预 测 模 型 及 其 应 用
的随机变量,其 密 度 函 数 为 u(θ),通 常 称 作 结 构 函 数,那么Y 的边际分布就是一个混合泊松分布,均值 为λ[5]135-144。采用不同 的 结 构 函 数 将 生 成 不 同 的 混 合泊松分布,因此混 合 泊 松 分 布 的 尾 部 特 征 与 结 构 函 数 密 切 相 关 ,结 构 函 数 的 尾 部 越 厚 ,混 合 泊 松 分 布 的尾部将会越长。 在 混 合 泊 松 分 布 中,最 常 见 的 结 构函数是伽玛分布 和 逆 高 斯 分 布,相 应 的 混 合 泊 松 分布就是负二项分布和泊松-逆高斯分布。当然, 还 可 以 考 虑 其 他 结 构 函 数 ,如 对 数 正 态 分 布 、广 义 逆 高斯分布和平移伽 马 分 布,它 们 分 别 对 应 泊 松 - 对 数正态分布、Sichel分布和 Delaporte布。
过离散程度的索赔次 数 数 据。虽 然 可 以 证 明 广 义 泊
松分布和混合负二项 分 布 也 属 于 混 合 泊 松 分 布,但
由于其结构函数比较 复 杂,因 此 目 前 还 难 以 与 前 述
三个模型的过离散特征进行直接比较。
(一 )负 二 项 回 归 模 型
负二项 分 布 有 两 种 常 见 类 型,分 别 称 之 为 负 二
第 27 卷 第 9 期 Vol.27 No.9
【统 计 理 论 与 方 法 】
统计与信息论坛 Statistics & Information Forum
2012 年 9 月 Sep.,2012
非寿险费率厘定的索赔频率预测模型及其应用
孟 生 旺1,徐 昕2
(1.中国人民大学 应用统计研究中心,北京 100872;2.首都经济贸易大学 金融学院,北京 100070)
关 键 词 :非 寿 险 ;费 率 厘 定 ;索 赔 频 率 ;过 离 散 中 图 分 类 号 :O212 文 献 标 志 码 :A 文 章 编 号 :1007-3116(2012)09-0014-06
一、引 言
在 非 寿 险 分 类 费 率 厘 定 中,通 常 需 要 建 立 索 赔 频率的预测模型,并 通 过 该 模 型 对 被 保 险 人 的 期 望 索赔频率进行预 测,从 而 作 为 费 率 厘 定 的 基 础。 在 传 统 的 线 性 回 归 模 型 中 ,假 设 因 变 量 服 从 正 态 分 布 、 且具有相同的方差,但 索 赔 频 率 是 严 格 非 负 的 离 散 型 随 机 变 量 ,其 方 差 的 大 小 往 往 与 均 值 有 关 ,通 常 遇 到 的 情 况 是 均 值 越 大 ,方 差 也 会 越 大 ,故 传 统 的 线 性 回归模型很难满足建立索赔频率预测模型的需要。
摘要:在非寿险分类费率厘定中,泊 松 回 归 模 型 是 最 常 使 用 的 索 赔 频 率 预 测 模 型 ,但 实 际 的 索 赔 频 率 数 据往往存在过离散特征,使泊松回 归 模 型 的 结 果 缺 乏 可 靠 性。 因 此,讨 论 处 理 过 离 散 问 题 的 各 种 回 归 模 型, 包括负二项回归模型、泊 松 - 逆 高 斯 回 归 模 型、泊 松 - 对 数 正 态 回 归 模 型 、广 义 泊 松 回 归 模 型 、双 泊 松 回 归 模 型、混合负二项回归模型、混合二项回归模型、Delaporte回归模型和 Sichel回 归 模 型,并 对 其 进 行 系 统 比 较 研 究认为:这些模型都可以看 做 是 对 泊 松 回 归 模 型 的 推 广,可 以 用 于 处 理 各 种 不 同 过 离 散 程 度 的 索 赔 频 率 数 据 ,从 而 改 善 费 率 厘 定 的 效 果 ;同 时 应 用 一 组 实 际 的 汽 车 保 险 数 据 ,讨 论 这 些 模 型 的 具 体 应 用 。
二项 Ⅰ 型的过离散程度越严重;当a → ∞ 时,负二 项 Ⅰ 型退化为泊松分布。令λi = wiexp(xiTβ),即得 到负二项 Ⅰ 型回归模型。
负二项 Ⅰ 型的概率函数可以表示为: Pr(Yi =yi)=Γ(λi/σ)ΓΓ((λ1i/+σy+iy)(i1)σ+yiσ)yi+λi/σ
(yi =0,1,…) 负二项 Ⅰ 型的均值和方差分别为: E(Yi)=λi Var(Yi)=λi(1+σ) 可以看出:σ越大,负 二 项 Ⅱ 型 的 过 离 散 程 度 越 严 重;当σ→0时,负二项 Ⅱ 型退化为泊 松 分 布。令λi = wiexp(xiTβ),即得到负二项 Ⅱ 型回归模型。 (二)泊松 - 逆高斯回归模型
广义线性模型是对传统线性回归模型的推广, 在因变量服从指数 分 布 族 的 情 况 下,可 以 建 立 相 应 的广义线性模型,并 采 用 迭 代 加 权 最 小 二 乘 法 对 模 型参数进行估计。指数分布族包括一些很常见的分 布 类 型 ,如 二 项 分 布 、泊 松 分 布 、正 态 分 布 、逆 高 斯 分 布 等 。 可 以 证 明 ,在 广 义 线 性 模 型 中 ,迭 代 加 权 最 小 二乘法的估计结 果 等 价 于 极 大 似 然 估 计 。 [1]81-89 广 义线性 模 型 在 非 寿 险 费 率 厘 定 中 的 应 用 十 分 广 泛[2][3]36[4]81-127,在 索 赔 频 率 的 预 测 模 型 中 ,最 常 见
当实 际 观 察 数 据 存 在 过 离 散 特 征 时,可 将 泊 松 回归模型进行推广。由于混合泊松分布的方差总是 大于均值,因此一种 自 然 的 想 法 就 是 建 立 混 合 泊 松 回归模型。生成混合泊松分布 的 基 本 思 想 是:假 设 在θ给定的条件下,损 失 次 数 随 机 变 量Y 服 从 泊 松 分 布,即Y|θ=Poisson(λθ),而θ是一个均值等于1
在 处 理 过 离 散 数 据 时,可 以 考 虑 的 另 外 几 个 分 布 模 型 包 括 广 义 泊 松 分 布 、双 泊 松 分 布 、混 合 二 项 分 布和混合负二项 分 布。 可 以 证 明,广 义 泊 松 分 布 和 混合负二项分布也 可 以 表 示 为 混 合 泊 松 分 布,只 不 过其结构 函 数 较 为 复 杂[6-7])。 虽 然 还 不 能 证 明 前 面提到的其他过离散分布是否也可以表示为混合泊 松 分 布 ,但 由 于 其 具 有 方 差 大 于 均 值 的 性 质 ,因 此 也 可用于建立过离散索赔频率的预测模型。
二、泊松回归模型与混合泊松回归模型
假设共有 p 个分类变量,将所有保单 分 为n 个
风 险类别,其中第i个风险类别在p 个分类变量上的 取 值用xi = (xi1,…,xip )T 表示,并用wi 表示第i个 风险类别包含的风 险 单 位 数 (如 汽 车 保 险 中 的 车 年
数)。
令Yi 表 示 第i 个 风 险 类 别 的 索 赔 次 数 随 机 变 量,i=1,2,…,n。若Yi 服从泊松 分 布,则 其 概 率 函 数为:
泊松 - 逆高斯分布的概率函数有不同的表达 式 ,其 中 以 均 值 为 参 数 之 一 的 表 达 式 如 下 :

∫ Pr(Yi =yi)=
exp(-θλi)(θλi)yi yi!

exp[- (θ-1)2/(2τθ)]dθ
槡2πτθ3
(yi =0,1,…)
15
收 稿 日 期 :2012-04-23;修 复 日 期 :2012-07-03 基 金 项 目 :教 育 部 重 点 研 究 基 地 重 大 项 目 《随 机 效 应 模 型 及 其 在 非 寿 险 风 险 管 理 中 的 应 用 》(12JJD790025);国 家 自 然 科 学
基 金 项 目 《考 虑 风 险 相 依 的 非 寿 险 精 算 模 型 研 究 》(71171193);中 国 人 民 大 学 科 学 研 究 基 金 项 目 (中 央 高 校 基 本 科 研 业 务 费 专 项 资 金 资 助 )《非 寿 险 定 价 的 精 算 统 计 模 型 及 其 应 用 研 究 》(10XNI001) 作 者 简 介 :孟 生 旺 ,男 ,甘 肃 秦 安 人 ,教 授 ,博 士 生 导 师 ,研 究 方 向 :风 险 管 理 与 保 险 精 算 ; 徐 昕 ,男 ,河 南 郑 州 人 ,讲 师 ,研 究 方 向 :风 险 管 理 与 保 险 精 算 。
项 Ⅰ 型和负二项 Ⅱ 型。
负二项 Ⅰ 型的概率函数可以表示为:
Pr(Yi =yi)
( )( )

Γ(a+yi) Γ(a)Γ(1+yi)a
a +λi
a λi a +λi
yi
(yi =0,1,…)
负二项 Ⅰ 型的均值和方差分别为:
E(Yi)=λi Var(Yi)=λi +λi2/a
从上述均值和方差的关 系 可 以 看 出:a 越 小,负
Pr(Yi

yi)=
exp(-λi)λiyi yi!
(yi =0,1,…)
泊 松 分 布 的 均 值 与 方 差 相 等,即 E(Yi)= Var(Yi)=λi。若令λi = wiexp(xiTβ),其中β是p × 1阶的参数向量,将其代入概率函 数,即 可 得 到 求 解
泊松回归模型的似然函数。
由于混 合 泊 松 分 布 的 方 差 总 是 大 于 均 值,因 此
的广义线性模型是 泊 松 回 归 模 型,即 在 索 赔 次 数 服 从泊松分布的假设基础上建立的回归模型。
泊松 分 布 的 特 点 之 一 是 方 差 等 于 均 值,而 实 际 上的索赔次数数据 往 往 具 有 过 离 散 特 征,即 方 差 大 于均值。导致过离 散 的 原 因 可 能 多 种 多 样,如 由 于 保险公司和保单持 有 人 增 强 了 风 险 防 范 意 识,大 多 数保单不会发生保 险 事 故;或 因 为 保 险 公 司 应 用 了 免赔额或无赔款折 扣 等 条 款,许 多 被 保 险 人 在 发 生 轻微事故时不会提 出 索 赔;或 个 别 被 保 险 人 的 风 险 太 大 ,其 索 赔 频 率 远 远 高 于 总 体 的 平 均 水 平 ,在 这 些 情况下若仍使用泊 松 回 归 模 型,可 能 会 低 估 参 数 的 标准误和高估其显 著 性 水 平,从 而 在 模 型 中 保 留 多 余 的 解 释 变 量 ,最 终 导 致 不 稳 定 的 费 率 厘 定 结 果 。
相关主题