离散选择模型在市场研究中的应用黄晓兰沈浩北京广播学院, 北京100024摘要:离散选择模型是一种复杂、非线性的多元统计分析方法和市场研究技术,主要基于消费者对产品/服务的选择来模拟消费者的购买行为。
本文通过手机话费价格研究介绍了离散选择模型的基本原理和操作步骤,以及采用M ultinomial Logit Model计算属性效用值、选择概率和模拟市场占有率,获得价格弹性曲线的方法。
关键词:属性;水平;正交实验设计、选择集、效用值、选择概率、M ultinomial Logit Model离散选择模型(Discrete Choice Model),也叫做基于选择的结合分析模型(Choice-Based Conjoint Analysis),是一种非常有效且实用的市场研究技术。
该模型是在实验设计的基础上,通过模拟所要研究产品/服务的市场竞争环境,来测量消费者的购买行为,从而获知消费者如何在不同产品/服务属性水平和价格条件下进行选择。
这种技术可广泛应用于新产品开发、市场占有率分析、品牌竞争分析、市场细分和价格策略等市场营销领域。
同时离散选择模型也是一种处理离散的、非线性的定性数据的复杂高级多元统计分析技术,它采用Multinomial Logit Model进行数据统计分析。
目前,国内在采用该模型进行市场研究方面还是一项空白,本文主要介绍了离散选择模型的基本原理,选择集实验设计、问卷设计、数据收集和处理、模型分析和结果解释等主要操作步骤,并给出了一个手机市场价格研究的应用案例。
1离散选择模型的基本概念和原理离散选择模型主要用于测量消费者在实际或模拟的市场竞争环境下如何在不同产品/服务中进行选择。
通常是在正交实验设计的基础上,构造一定数量的产品/服务选择集(Choice Set),每个选择集包括多个产品/服务的轮廓(Profile),每一个轮廓是由能够描述产品/服务重要特征的属性(Attributes)以及赋予每一个属性的不同水平(Level)组合构成。
例如消费者购买手机的重要属性和水平可能包括:品牌(A,B,C)、价格(1500元,1750万元,2000元)、功能(短信,短信语音,图片短信)等,离散选择模型是测量消费者在给出不同的产品价格、功能条件下是选择购买品牌A,还是品牌B或者品牌C,还是什么都不选择。
离散选择模型的一个重要的假定是:消费者是根据构成产品/服务的多个属性来进行理解和作选择判断;另一个基本假定是:消费者的选择行为要比偏好行为更接近现实情况。
它与传统的全轮廓结合分析(Full Profiles Conjoint Analysis)都是在全轮廓的基础上采用分解的方法测量消费者对某一轮廓(产品)的选择与偏好,对构成该轮廓的多个属性和水平的选择与偏好,用效用值(Utilities)来描述。
但是,它与传统的结合分析的最大区别在于:离散选择模型不是测量消费者的偏好,而是获知消费者如何在不同竞争产品选择集中进行选择。
因此,离散选择模型在价格研究中是一种更为实际、更有效、也更复杂的技术。
具体表现在:●将消费者的选择置于模拟的竞争市场环境,“选择”更接近消费者的实际购买行为;消费者的选择行为要比偏好态度更能反映产品不同属性和水平的价值,也更具有针对性;●消费者只需做出“买”或“不买”的回答,数据获得更容易,也更准确;●消费者可以做出“任何产品都不购买”的决策,这与现实是一致的;●实验设计可以排除不合理的产品组合,同时可以分析产品属性水平存在交互作用的情况;● 离散选择集能够较好地处理产品属性水平个数(大于4)较多的情况; ● 统计分析模型和数据结构更为复杂,但可以模拟更广泛的市场竞争环境; ● 模型分析是在消费者群体层面,而非个体层面。
离散选择模型主要采用离散的、非线性的Multinomial Logit 统计分析技术,其因变量是消费者在多个可选产品中,选择购买哪一种产品;而自变量是构成选择集的不同产品属性。
例如,一项简单的手机市场研究中,假定产品包括3个属性,每个属性有2个水平,属性水平分别是:网络类型(GSM ,CDMA )、增值服务(语音和基本数据,语音和高端数据)、手机类型(低辐射环保,普通非环保),共有2×2×2=23种可能的产品组合,构成一个选择集。
调查了10位消费者,要求每一位消费者在给出的8种可能产品组合中选择他们最可能购买的一种手机产品。
Multinomial Logit Model 假定每个消费者是从包含m 个可选产品的选择集C 中选择一个产品i c ,其选择概率等于:∑∑====mj ji mj ji i xx cU c U C c P 11))exp()exp())(exp()(exp()(ββ其中:i x 是被选中产品的属性向量,β是未知参数向量。
βi i x c U =)(是选择i c 产品的效用值,它是该产品属性的线性函数;因此,消费者选择某个产品的概率等于该产品效用值的指数函数除以所有产品效用值的指数函数的和。
在这个例子中,消费者是从m=8个候选产品的选择集C 中选择一个,共有8个产品属性向量,记作:x=(GSM/CDMA ,语音和基本数据/语音和高端数据,低辐射环保/普通非环保),其中:网络=(GSM=1,CDMA=0),话费价格=(语音和基本数据=1,语音和高端数据=0),手机类型=(低辐射环保=1, 普通非环保=0);则8个属性向量分别是:x 1=(0 0 0)(CDMA ,语音和高端数据,普通非环保) x 2=(0 0 1)(CDMA ,语音和高端数据,低辐射环保) x 3=(0 1 0)(CDMA ,语音和基本数据,普通非环保) x 4=(0 1 1)(CDMA ,语音和基本数据,低辐射环保) x 5=(1 0 0)( GSM ,语音和高端数据,普通非环保) x 6=(1 0 1)( GSM ,语音和高端数据,低辐射环保) x 7=(1 1 0)( GSM ,语音和基本数据,普通非环保) x 8=(1 1 1)( GSM ,语音和基本数据,低辐射环保)Multinomial Logit Model 采用极大似然函数估计未知参数向量β,似然函数为:∑∑==∧=mj Nj mj j jk C x x f L 11))exp(())exp(()(βββ其中: N=消费者人数,m=选择集中可选产品个数,⎩⎨⎧=01jk f 如果第k 个消费者选择了第j 个产品,则1=jk f ,否则0=jk f假定例子中10个消费者分别选择了x 5,x 6,x 7,x 5,x 2,x 6,x 2,x 6,x 6,x 6产品。
那么,在8种产品中:x2被选择了2次,x5被选择了2次,x6被选择了5次,x7被选择了1次。
则极大似然函数为:10817652811081))exp((())522exp(())exp(())exp(()(∑∑∑===∧+++==j j j j j j jk C x x x x x x x f L ββββ最后Multinomial Logit 模型估计得到未知参数向量估计值)85.020.239.1('-=β,表明GSM 的属性水平效用值为1.39,语音和基本数据的属性水平效用值为-2.20,低辐射环保的属性水平效用值为0.85。
由此可以计算8种产品的选择概率,计算结果如下:表1 选择概率计算属性向量效用值βi i x c U =)(指数函数))(exp(i c U选择概率∑==mj ji i cU c U C c P 1)))(exp()(exp()(排名x 1=(0 0 0) 0 1 5.4% 5 x 2=(0 0 1) 0.85 2.339647 12.6% 3 x 3=(0 1 0) -2.20 0.110803 0.6% 8 x 4=(0 1 1) -1.35 0.25924 1.4% 7 x 5=(1 0 0) 1.39 4.01485 21.6% 2 x 6=(1 0 1) 2.24 9.393331 50.5% 1 x 7=(1 1 0) -0.81 0.444858 2.4% 6 x 8=(1 1 1)0.041.0408115.6%4β’=(1.39 –2.20 0.85)合计=18.60354100%从表中我们可以看出,被调查消费者最喜欢购买低辐射环保、语音和高端数据增值服务的GSM 手机,选择概率为50.5%。
表中个别产品组合的效用值为负值或零,但其选择概率却不为零。
所以,选择概率是效用值的非线性的递增函数。
图1给出了效用值指数函数与选择概率的关系图。
图1表明,效用值的指数函数取值从)2ex p(-到)5ex p(,选择概率在[0 1]。
效用值在最小值-2处概率取值接近零,随着效用值的增加,概率随之增长,当效用值等于2时,选择概率开始快速增长。
-2 -1 0 1 2 3 4 50.70.60.50.40.30.20.10.0效用值与选择概率曲线效用值概率图1 效用值指数函数与选择概率分析离散选择模型采用Multinomial Logit Model 估计未知参数β是一个比较复杂的统计分析过程。
目前统计分析软件主要有SAS/STAT 统计过程和SAS Market 模块,二者均采用SAS/STAT Proc PHREG 过程—比例风险回归(Proportional Hazards Regression )分析。
另外,Sawtooth 软件公司开发了专用的CBC 市场研究分析软件(Choice-Based Conjoint Analysis ),该软件集成了从选择集实验设计、问卷生成、数据收集到统计分析,市场模拟等离散选择模型的市场研究全过程。
2 离散选择模型的主要步骤任何一项采用离散选择模型进行的市场研究,都包括从确定研究目的、实验设计、数据收集、数据整理、分析和计算、检验与应用、模拟市场、撰写研究报告等全过程,必须借助专用的分析软件来实现。
采用离散选择模型的主要步骤如下:2.1 属性和水平的确定离散选择模型最重要的一步就是决定能描述产品/服务特征的重要属性。
针对不同的研究目的,影响消费者选择购买或使用产品/服务的因素都要考虑。
当属性决定之后,还要选择每个属性的水平,各属性水平范围可以比实际范围低一些或高一些,但不能设定得太离谱,以免脱离消费者对现实市场环境的真实理解。
由于离散选择模型数据的复杂性和占用大量的空间,属性和水平的个数不能太多,一般限制属性要少于6个,每个属性水平在8个以内最好,尤其是考虑不同属性水平之间存在交互作用时,这一点尤为重要。
2.2 选择集实验设计当产品/服务的属性和水平数目不太多时可以将所有的产品/服务组合展现给消费者,即采用全因子实验设计(Full-Factorial Design ),这种设计可以估计属性间的主效应(Main Effect ),以及估计交互作用。