足球比赛结果预测模型摘要本文建立了一个关于足球比赛结果预测和确定如何下注获利最大化模型。
第一问,对于确定X场比赛主队胜平负以及如何下注问题,我们将给定的大量数据(各球员进球、助攻、射门、射正和扑救等数量)进行整合,运用Excel 进行统计分析并算出X场比赛主队和其客队的进球能力、进攻能力和防守能力,从而确定主队和其客队的进球期望值,然后运用泊松分布的方法计算出X球队胜平负的概率,确定如何下注。
第二问中,预测X场总进球数的概率分布,确定如何下注,根据第一问结论并利用数学软件MATLAB预测出所有可能的X场总进球数的概率分布,选择概率最大的,结合实际历史数据和主客观影响因素确定如何下注。
对于第三问,要求预测四场比赛的进球情况,并确定在这四场中如何下注获利最大,首先球队在积分榜上的排名可以较为客观的代表这支球队的实力强弱,其中进球数直接影响球队积分,因此本问通过球队积分排行榜和进球率的相关性预测四场比赛进球情况,利用Excel画出球队进球率与排名散点图和相关性分析确定下注比例。
最后一问,要求通过分析赔率对于博彩公司收益的影响并针对问题三,设计合理赔率方案。
本文论证严密,运用大量可靠数据对模型进行验证,并对模型优缺点进行了分析。
关键词足球预测泊松分布MATLAB 进球期望值赔率相关性分析一、问题的重述与分析1.问题的重述博彩业发展繁荣,创造了不少富翁,其中福利彩票的中奖号码可以认为是纯粹的随机数,难以预测。
而体彩中一些结果可以人为预测,并根据预测结果下注。
结果预测准确与否,关系到金钱的盈亏。
足球赔率是博彩公司在其十几年乃至数十年所积累的丰富的、海量的与足球比赛相关数据的基础上,利用科学的数学理论模型,计算得出的对于一场足球比赛所产生某种结果的概率,并使这组数据加以转换得到的一组常人可以看得懂的数据。
赔率与足球比赛的结果间存在着必然的联系。
博彩公司就是靠预测结果,调整赔率,吸引大家下注来赚取收益的。
如果我们比博彩公司预测得更加准确,或者押中冷门,就有可能在其中赚取巨大收益。
现在我们所关心的问题就是:1)根据所给的数据,如何确定各球队胜负平的概率,并确定如何下注。
2)根据比赛的总进球数的概率分布,如何确定下注的分配比率。
3)根据球队历史排名与进球率,如何预测球队未来进球情况,并在下注时获利最大。
4)通过分析赔率对博彩公司收益的影响,如何给出合理的赔率设计方案,在吸引尽可能多的客户的同时,获得最大利润。
2.问题的分析对于一场球赛,结果有胜、平、负三种结果。
而比赛结果往往由球队实力高低,主客场,裁判判决公正与否甚至是天气好坏等一些要素相关,导致胜负平的概率不会是1/3;这就要求模型能综合比赛各项因素得出合理的赛果预测。
本问题即是一个在历史数据的基础上,通过对数据的整合,如何制定预测模型,确定下注比例并获得最大利润。
二、模型的基本假设1.假设在一个赛季内, 一名球员的单位进球、进攻、防守能力变化不大。
2.比赛主要影响因素是实力和主客场,其结果不受天气等环境影响。
3.球队实力由球队近期战绩决定。
4.比赛结果符合泊松分布。
5.裁判判决公正无黑哨。
6.确定现实中已有伤病球员不上场,所选球员无伤病情绪稳定、发挥正常。
三、符号说明1.α:代表球员单场进球能力。
2.β:代表球员单场进攻能力。
3.γ:代表球员单场防守能力。
4.d1:代表球员单场助攻数。
5.d2:代表球员单场射门数。
6.d3:代表球员单场射正数。
7.d4:代表球员单场扑救数。
8.T:代表球员出场时间。
9.λ:代表球队进球期望值。
10.P:代表球队单场获胜概率。
11.Wt:代表某支球队的进球率.12.Y i:代表这支球队在第i场比赛的进球数四、模型建立4.1:问题一及其求解根据题意,要预测X场比赛中主队的胜平负的概率(即猜胜负平),而球队的胜负平取决于球员的进球以及进攻防守能力,所以应根据附表1计算出主队和客队的综合进球、进攻和防守能力,从而分别得出主队和客队的进球期望值,经过比较确定主队的胜负平的概率,并确定如何下注。
(一)、主队进球能力、进攻能力和防守能力的计算根据附表1,用Excel 数据处理器对其数据进行整合及计算,分别得出主队和客队的进球能力、进攻能力和防守能力,以球员阿格利亚尔迪为例:将他的单场助攻数d1、单场射门数d2和单场射正数d3相加再除以出场时间T ,即可得到单位进攻能力β1。
再将单场扑救数d4除以出场时间T ,就得到单位防守能力γ1。
经过计算得到本场所有球员的单场进球能力α,所有球员的单场进攻能力β以及所有球员的单场防守能力γ,然后将α,β,γ三个数进行算术平均,从而得出单场球队进球期望值λ。
具体计算如下:利用公式TT d T d d d T i *3/3/)321(/3∑∑∑≡≡++++±±αγβαλ公式一0.0196289=(注:上式中代入的数据,如0.01962892等参照附录中的表一) (二)、球队胜负平概率的计算 为了更为充分合理地说明问题,我们对球队胜负平概率的计算采用泊松分布[5]进行计算,具体计算如下:设在主队进球数为y1的概率为P{goal=y1}=(e^(-λ1)*λ1^y1)/y1! 其中y1取[0,7]内整数 客队进球数为y2的概率为P{goal=y2}=(e^(-λ2)*λ2^y2)/y2! 其中y2取[0,7]内整数则两队比分为y1,y2的概率为P(y1:y2)=(e^(-λ1)*λ1^y1*e^(-λ2)*λ2^y2)/y1!*y2! 其中y1,y2取[0,7]内整数, 如果y1>y2,则主队胜客队 y1=y2,则两队战平 y1<y2,则客队战胜主队易知,当0<=y<=7比赛结果有49种, 则主队胜的概率为P(y1>y2)=∑(e^(-λ1)*λ1^y1*e^(-λ2)*λ2^y2)/y1!*y2! 其中y1,y2取[0,7]内整数 平局的概率为P(y1=y2)=∑(e^(-λ1)*λ1^y1*e^(-λ2)*λ2^y2)/y1!*y2! 其中y1,y2取[0,7]内整数 客队胜的概率为P(y1<y2)=∑(e^(-λ1)*λ1^y1*e^(-λ2)*λ2^y2)/y1!*y2! 其中y1,y2取[0,7]内整数以2014至2015年度意甲联赛中,维罗纳和尤文图斯的数据带入,运用泊松分布模型预测两队交锋时赛果的概率。
如附录1所示,将数据带入公式由数学软件matlab 计算可得主队胜的概率 P1=0.5801 两队平的概率 P2=0.2167主队负的概率 P3=0.2022综上所述,由泊松分布得出主队胜平负的概率,经过比较可知,主队胜出的可能性最大,因此人们应该选择买主队胜利的彩票。
4.2:问题2的求解问题2为预测X 场比赛总进球数的概率分布并确定如何下注,首先由附表1的数据和问题1的结论出发,经分析可以清楚地知道这两题思路相同,即在第1题matlab 程序代码基础上增加一条输出语句后,我们能够直接清晰地得到X 场比赛中主队和客队每种可能比分情况以及它们所对应的概率:p1 =0.09451:0p1 =0.09282:0 p1 =0.09932:1p1 =0.06073:0 p1 =0.06503:1p1 =0.03483:2 p1 =0.02984:0p1 =0.03194;1 p1 =0.01714:2p1 =0.00614:3 p1 =0.01175:0p1 =0.01255:1 p1 =0.00675:2p1 =0.00245:3p1 =6.3953e-0045:4p1 =0.00386:0 p1 =0.00416:1p1 =0.00226:2p1 =7.8189e-0046:3p1 =2.0922e-0046:4 p1 =4.4788e-0056:5p1 =0.00117:0 p1 =0.00117:1p1 =6.1453e-0047:2p1 =2.1925e-0047:3p1 =5.8668e-0057:4 p1 =1.2559e-0057:5p1 =2.2404e-0067:6经过比较,当主队维罗纳获胜时,二者比分为2:1概率最大的,此时 P1(y1,y2)= ∑(e^(-λ1)* λ1^y1*e^(-λ2) *λ2^y2)/y1!*y2! =0.0993.所以,应选择下注总进球数为3。
4.3:问题3的解决预测X 、Y 、Z 、W 四场比赛的进球情况,确定在“4场进球”中如何下注能获利最大。
进球率对于比赛结果有着直接的影响效果,进球率的高低是否能够真实反映一支球队实力的强弱。
其中球队在积分榜上的排名可以客观代表这支球队实力的强弱。
进球率的计算公式[1]如下:nY ni ∑==1iWt其中,Wt 表示某支球队的进球率,Yi 表示这支球队在第i 场比赛的进球数,i=1,2,3,…n,n 为总的比赛场次。
对一支球队来说,在整个赛季中它的进球率是相对稳定的。
然而漫长的一个赛季中,因为诸多不可预测因素的影响,一支球队不可能永远保持一个同样的竞技状态。
而球队近期竞技状态的好坏将直接影响球队的进球率以及胜率,竞技状态好的时候,胜率就高;竞技状态差的时候,胜率就低。
所以从整体来看,进球率确实反映了球队的实力,但是却不能反映球队当前所处的竞技状态对比赛的影响,因此我们有必要对进球率的计算公式进行一些合理的调整,将球队近期的状态考虑进去,也就是将球队近期比赛的进球数与原有的进球率结合起来。
将球队最近4场比赛的进球数纳入调整后的进球率,得到如下计算[1]公式:4Yi 31W ++∑∑=-==n Yinn i n i t其中,Wt 表示调整后的某支球队进球率,表示这支球队在第i 场比赛中的进球”中应选择单式投注,方能获利最大。
4.4:问题4的解决博彩公司事前所设定的赔付率不会随意变动,而变动的是赔率和胜负平概率,跟随其变动的则是凯利指数。
由于凯利指数是“变量中的变量”总是随市场赔率和平均概率(平均概率又是随着各家概率高低变动的)不断变动的,就是说凯利指数是能够反映博彩公司的数据的真实趋势和投注资金流量运动。
凯利指数首要的作用就是反应将一场球赛做为经济市场各家公司赢利和赔付风险差异的做用,一般来说,认同程度越高的选项,打出可能越大,博彩公司存在的赔付风险越大。
而差异越大的选项,则打出可能越小,为博彩公司盈利安全点。
有问题3可知,通过分析对阵双方的各种资讯,诸如出场阵容,以往交手战绩,主队主场战绩,客队客场战绩,在联赛中的成绩排位,球队最近的状态斗志,俱乐部的运作情况等等方面因素之后,估算出这场赛事胜,平,负三种结果的概率。
根据所得概率确定对应赔率,一般概率高的情况赔率相对较低,而概率低的情况赔率相对较高。
假设D=A(1-10%)其中:A:代表博彩公司根据各个球队以往十年历史赔率数据的算术平均数;D:代表根据计算最后得到的赔率。