小飞侠2009 发表于 2014-3-31 13:13

有关埃罗模型(ELO model) 的研究

关键字:埃罗模型(ELOmodel) ,RateForm, TR(Team Rating) , 泊松分布(Poisson distributing)

RateForm的概念,最早由Professor Elo在「The Rating of Chessplayers」一书中提出,用以从比赛结果中公平地分析强者与弱者的真正实力差距,其后在「The Punter's Revenge」一书中被Tony Drapkin和Richard Forsyth引用来预测足球赛果,并广泛沿用至今。其基本运作如下:
  1. 每队在季初均获的一相同的固定底分 (e.g. 1000)  
  2. 主队及客队各投入其底分的某个百分比进「彩池」内,主队投入的百分比较高以反映「主场之利」 (e.g. 主队7% vs 客队5%)  
  3. 胜方获得「彩池」内的全部分数  
  4. 打和时双方平分「彩池」内的分数  

研究ELO模型已经有一年多的时间, 期间曾经在网上找过很多有关ELO系统的资料,绝大部分是英文资料, 中文的资料好像只有本版的几篇文章有介绍. 不过发现在手头上有的资料当中,都并没有对埃罗模型在预测足球比赛方面进行深挖和拓展. 「The Punter's Revenge」一书是86年出版的(以下简称书), 20年时间其中的elo模型似乎没有什么发展, 甚至连书中所阐述的几点原理都没有人做过解释.现在就我建立ELO模型的思路作一个说明, 算是给国内研究ELO模型的朋友一点参考.

   elo模型是一个相对封闭的系统 ,它最基本的特点是公平原则.

      elo模型在季初对于每队球队都赋予相同的等级分(一般是1000), 就是说在赛季初每支球队的起步线是相同的, 球队通过比赛才能体现出自身的实力. 换一个角度,我们把球队看作拳击手,每场比赛比赛看作是拳手之间的比赛. 赛前双方均要下一定数额的筹码, 根据比赛结果, 重新分配财富. 通过一系列的比赛,财富越多的拳击手, 则实力越高.

       1.投入分配系数,等效得失球数,Poisson函数

      前面说过两支球队在交锋之前必须要投入一定的筹码,应该怎样分配投入比例才公平呢?比赛有主客场之分, 主队拥有场地,球迷,心理等等的优势, 因此需要下注的数额比例一般情况下要高.在统计过世界范围内50000多场足球比赛数据后发现, 主队的进球数与失球数之比约等于7:5, 净胜球约为0.38球.   具体到英超联赛,根据统计威廉,立博对英超比赛开盘的平均等价让球约为0.34左右. 就是说当两支等级分为1000的球队比赛,主队的主场优势为0.34球.这里不得不提到净胜球和等级让球的区别,在我印象中B版曾经谈过类似的话题,但可以很容易理解得到,球队面对不同的对手净胜球的能力是不同的,所以净胜球≠ 等价让球。 这里我要提出一个观点, 书中所说的投入比例7:5是基于总体平均入球数与失球数之比得出, 把所有主场球队和所有客场球队分别看作两个独立整体,则它们之间的平均实力差≈0.38。 但真实的情况是比赛双方球队的实力差往往不等于0.38,因此它们下注的比例不可能总是7:5。 既然双方赛前投入的比例与得失球数有关,那么在我的设计理念中就得引入等效得失球数这个概念。

      说到等效得失球数必须提到poisson函数的应用,下图是等效得失球数与主客得失球数的关系。


      等效得失球是poisson函数的衍生产物,其决定因素分别有主队主场进球数,主队主场失球数,客队客场进球数,客队客场失球数,主客实力差,中值和平局率等等。 其中最关键的是主客实力差,因为它主宰着比赛概率的分布。在我设计的模型中两队投入的分配系数就是等效得(失)球数占总体的百分比。

      4.“财富”的分配方法

   「The Punter's Revenge」中提到有关赛后分配的方法是“胜方获得「彩池」内的全部分数 , 打和时双方平分「彩池」内的分数”。在这个基础上我对分配方法进行细分,虽然比赛结果只有三个(胜平负),但比分却有很多个,例如主胜有1:0,2:0,2:1等等。不同的比分有不同的概率,净胜球数越高的比分概率越小,从客队获得的财富也越多。比分的概率可以通过Poisson函数表得出,从而可以计算出在该比分下主队可以从客队身上取走多少财富。

   5.球队实力的连贯性

      elo模型设定了从每季开始的时候各队的原始等级分都是一样(e.g 1000) , 但实际上每支球队的实力是不同的, 因此在财富投入和分配的时候需要加上往季的实力因素.

hunter9527 发表于 2014-4-6 16:55

多谢楼主的分享了

许影 发表于 2016-8-2 17:39

路过,看看,支持楼主
页: [1]
查看完整版本: 有关埃罗模型(ELO model) 的研究