奥莱涅斯塔德

首页 » 常识 » 问答 » 高阶数据告诉你,谁是本赛季最牛的门将肆
TUhjnbcbe - 2024/3/29 19:06:00
白癜风的最佳治疗方法 http://www.jk100f.com/m/
在《数据没法用来评定金球奖,但能看出哪个前锋是真牛》一文中,我们曾介绍了“预期进球数”这个数据,并试图用它来初步量化前锋的射门能力;那么,能不能用预期进球数来量化门将的扑救能力呢?很遗憾,如此做恐怕会产生极大的误差。原因在于——由于只有射正,门将的扑救才有意义,因而,一大半的射门和门将都没什么关系。以本赛季的英超为例:20支球队38轮下来,一共射门次,其中射正的不过次,占比仅34.36%。用总射门数的预期进球去衡量门将的扑救水准,显然会引入一大堆干扰项。然而,欧美的数据先行者们早就做好了筛选工作,Wyscout在统计门将数据时,将所有命中目标的射门全部筛选了出来,重新计算每次射门的进球概率。这套系统被称为“预期失球数”(ExpectedConcededGoals),简称“XCG”。最为关键的是:XCG和我们熟知的“预期进球数”的计算方法有着很大不同:它考虑了射门所追求的角度是否刁钻——一般而言,一脚冲着球门正面去的射门,肯定不如直指传说中“十分角”的射门有威胁;而传统的“预期进球数”则只考虑了射门球员所处的位置,以及射门时角度是否开阔。这不仅导致XCG和“预期进球数”的数字不一样,更重要的是,对两脚射门进球概率的量化,可能会产生反差。来看下面的例子:斯特林的近距离射门,被扑出萨拉赫的远射,进球上面两次射门情况迥异,门将都是凯帕。对前锋来说,哪一脚射门更难?很显然是萨拉赫的那一脚远射,预期进球数系统认为这脚远射的进球概率只有4%,而斯特林的那一脚,却达到了25%;然而,很明显萨拉赫打的角度要刁钻得多。所以对凯帕来说,实际上萨拉赫这脚高质量远射更难处理——XCG据此计算的结果是:斯特林近距离推射的进球概率是48%;而萨拉赫的那一脚,却达到了59%。于是,我们现在有了结合射门位置、角度及其所瞄准球门区域量化所有中目标射门数学期望的高阶数据——XCG,再结合门将的实际失球数,我们就可以量化出门将扑救对方射门的能力。这里我们引入一个“限制对手射正得分率”的概念,用以量化对手每次射正,门将能够在多大程度上,降低其射门转化为得分的概率。公式是:限制对手射正得分率=(XCG-实际失球数)/对手射正数*%我们以最近两个赛季为样本,选取几个门将,主要通过这个数据来考量一下门将1勤勤恳恳一整年,一夜回到解放前——埃德森埃德森的传控能力早已毋庸赘述,而一年下来,他的扑救水准在联赛层面进步也十分巨大,上赛季实际失球数比XCG高出3.94个,-4.75%的限制对手射门得分率其实是不合格的水准;然而本赛季却将该项数据打成正数,已经是超过平均水准不少的优秀门将了。此处尤其值得注意的是:曼城对手的射门质量是在不断提高的。17-18赛季,曼城在攻防两端都建立强大统治力,对手每次射正的XCG只有0.;而18-19赛季,埃德森所面对的每次射正,XCG达到了0.,很显然,较少次数的高质量射门,比累积次数更多的低质量射门,对门将威胁要更大。考虑到这一层,埃德森在联赛中的进步还是相当可观的。要知道,曼城本赛季对手的反击进攻占比高达11.11%,为英超最高。埃德森扑出的射门,有相当一部分是这样的快攻:以及一些不大能用数据量化的、出击破坏对手快攻的画面:但是,在欧冠层面,埃德森就比较尴尬了:两个赛季下来,他的限制对手射门得分率都是严重不合格的,尤其这个赛季,甚至还“百尺竿尾更退一步”。-8.10%的限制对手射门得分率是我们这次选取的所有样本里最差的。为什么说他说“一夜回到解放前”?因为其中两场的影响,实在太大了。来看一下埃德森欧冠10场比赛XCG与实际失球数的差值变化图:呃,第5场合第10场的差值尤其尴尬,全部超过了-1,这表明这两场比赛中,埃德森原本应当多扑出对手一些射门的。这其中,第5场是小组赛2-2战平里昂,第10场,则是被热刺淘汰的那一场。其实这两场埃德森也谈不上什么低级失误,问题在于,对手有两脚射门打的其实都很正,完全是从其防守覆盖范围内打进球门的:对阵里昂,埃德森被对手穿小门对阵热刺,孙兴慜的射门从埃德森腿上弹入球门这两球从射门机会而言其实非常好,尤其第一球还是直面门将的单刀。问题是射门所追求的的角度都比较正——这也正是非常能体现XCG数据特点的地方:它默认的是如果对手射门机会不错,但射门本身过正导致质量一般,那么门将是应该扑出来的。2断崖式跌落神坛——德赫亚“前场美如画,后场德赫亚”,在本赛季之前,这绝非是一句空谈。为什么说在本赛季之前?因为从去年的世界杯开始,德赫亚,突然崩了。德赫亚在17-18赛季的扑救能力有多么恐怖?其在联赛和欧冠两个赛场上限制对手射门得分率都达到了惊人8%以上,要知道,曼联在穆里尼奥治下从来都不是一支进攻强队,上赛季能够保住前四,仅多于曼城的失球数才是根源所在。然而两队整体防守质量实际上根本不可同日而语:曼城能够把对手的预期进球压缩在英超最少的24.21个;曼联呢?他们对手的预期进球数高达42.99,严格来说只是英超中上水平,能够做到失球数仅比德比对手多一个,足见德赫亚的重要意义所在。然而,一场世界杯彻底将德赫亚从红红火火变成了恍恍惚惚,在国家队懵逼归来的西班牙门神,在过去一个赛季里突然之间跌落神坛坠入凡间,联赛中0.12%的限制对手射门得分率只能说是普通门将水准而已——这还是赛季中期一度爆发打回来的数据,就稳定性而言,这赛季的德赫亚简直算得上把自己多年开挂积攒的排面败得一干二净,来看其联赛中XCG与实际丢球差值的变化趋势:不是黑德赫亚,这个趋势波动也太大了吧?赛季中期好的几场,他能高接抵挡把这项数据打到+2,但差的几场,又直接奔着-1.5去了……这几场发生了什么?德赫亚对一些远射表现的有些无能为力了:当然,你可以说德赫亚视线被阻,对手射门球速太快来不及反应,但至少在XCG的算法中,这两项是没有列入考虑的。但话又说回来,在本赛季之前,德赫亚遇到的这类射门何曾少过?那时候他可是能屡屡贡献神扑的。XCG认为他状态下滑,也确实算有据可依。另外需要注意的是,德赫亚身处本赛季问题不断的曼联,整季38场联赛被对手射正的次数高达次,遥遥领先于我们选取的其他门将。尽管这并不能说明对手的每一次射门质量有多高,但却导致了另一个问题:如果我们假定门将都有一定概率碰到一些倒霉的意外状况,那么,很显然被射正次数更多的德赫亚,遇到这些意外的可能性会更大。比如这样:沙奇里射门,反弹变线后德赫亚无力阻止当然,德赫亚恐怖的反应速度还在,这类门将“抽风”起来,仍旧能在某些比赛中贡献让人绝望的表现,尤其是面对对方的近距离射门,德赫亚有些时候的反应速度简直令人匪夷所思,这也是让我们相信他并非永久性下滑,状态终会回升的原因所在。比如这样:3联赛层面最第一门神——阿利松是的你没看错,时不时被批评“不甘寂寞、门线玩火”的阿利松,实际上才是近两年来联赛层面最稳一环,利物浦本赛季防守长足进步,所仰仗的绝不仅仅是范迪克,阿利松甚至可能功劳更大。要知道范迪克去年年初便已加盟,而阿利松却是夏季的针对性进补。这笔引援对利物浦的影响到底有多大?我们可以先来看看阿利松的两位前任卡里乌斯和米利奥莱的表现。17-18赛季,克洛普几乎是为门将问题操碎了心,米尼奥莱和卡里乌斯联赛出场时间完全对半开。结果两人在联赛中的限制对手射门得分率都是尴尬的负数:米尼奥莱-4.98%,卡里乌斯则只是看上去稍好一点的-3.34%——为什么说只是“看上去稍好一点”?因为卡里乌斯所面对的射门质量其实要比前者低很多,在对方每次射正的XCG从0.降低到0.的前提下,限制对手射门得分率的改善幅度如此有限,也确实谈不上什么太大的进步。而且,这还只是相对较好的联赛,欧冠里卡里乌斯担当主力,结果如何呢?他打满了13场比赛,限制对手射门得分率,是耸人听闻的-9.68%……这是什么概念?嗯,16-17赛季,有一个名叫布拉沃的“射正王”,把瓜迪奥拉坑的不要不要的,此人的限制对手射门得分率,也不过是-7.98%而已……那么阿利松呢?罗马并非什么顶级防守强队,17-18赛季,阿利松在37场意甲中被对手射正了次之多,XCG高达43.3,然而此人硬是凭借一大堆高接抵挡,把丢球数压缩到28个,限制对手射门得分率,居然是恐怖的10.27%!这甚至比当赛季的德赫亚还高!凭借超快的反应和下地速度,阿利松经常能做到封堵射向两个底角的射门,而这正是XCG所默认得分率较高的射门方式:尤其当罗马遇到一些喜欢搞渗透的技术流球队而又陷入被动时,阿利松的近距离扑救有时候会起到力挽狂澜的效果,比如当季意甲4-2客胜那不勒斯,阿利松竟然让对方疯狂的16次射正只进2球。其中不乏这样的精彩连扑:利物浦将这样一个门神罗致麾下,可谓是一本万利的买卖。本赛季阿利松继续贡献出色表现,8.72%的限制对手射门得分率遥遥领先其他所有英超门将。尽管利物浦的防守不可能像罗马一样留给阿利松太多表现机会,但作为一支酷爱上抢的球队,漏给对手快攻也是不可避免的事(对手反击比重英超第3),此时就需要阿利松站出来拯救球队了:此处需要注意的是,像利物浦这种被射正频率并不高的球队,一旦以欧冠为考量对象,把比赛样本进一步缩小,那么这套“限制对手射门得分率”的数据,是有可能出现比较严重的失真情况的。最大的问题是:它在考虑射门所追求角度的同时,忽视了射门的客观情况——如果你距离球门很近甚至已经面对空门,那么往正面推一下,其实是比打死角更稳妥的选择;然而这种冲着球门正面的射门,会被XCG系统错误的默认为进球概率较低。阿利松的欧冠数据,就吃了这个亏:因西涅这脚射门其实和必进球相差不远,但却因为他选择了打球门正中间,XCG只有0.稳定续航第一人——特尔施特根扶正特尔施特根,可能是近几年大手大脚而又略显盲目的巴萨,所做的最为正确的决策之一。两个赛季以来,巴萨始终不是什么顶级防守强队,中场拦截能力的孱弱更是屡屡在欧冠遭受制裁,联赛始终维持低失球数,特尔施特根可谓厥功甚伟。此人最大的特质是稳——在我们选取的几名门将中,特尔施特根是仅有的两个赛季联赛、欧冠的限制对手射门得分率都是正数的人之一(另一人等下再说)。对于巴萨球迷而言,特尔施特根有多重要其实是一个根本不用强调的事,一定程度上,说他是仅次于梅西的巴萨第二号人物都不过分。这里真正有趣的地方是:特尔施特根两个赛季下来欧冠方面的波动比较大:17-18赛季此人在欧冠领域堪称仅次于德赫亚的存在;而18-19赛季却略有滑坡。而之所以出现这个情况,和欧冠的赛程有很大关系。欧冠的一大特点是赛程相对集中。要知道,球员在漫长的一个赛季中,状态起伏是很正常的事。倘若状态飘红之时适逢欧冠赛事集中期,那么他就很容易在欧冠打出漂亮数据;反之,倘若欧冠比赛期间刚好倒霉催的状态低迷,数据下降不说,保不齐还会导致球队直接被淘汰,连补救余地都没有。我们来看看两个赛季特尔施特根在联赛中的限制对手射门得分率,就明白为什么他在欧冠上的表现存在反差了:注意红色圆圈圈住的区域,这大概是欧冠比赛相对比较集中的时段,特尔施特根两个赛季中,在这两个时段状态反差很大,18-19赛季的好状态几乎刚好集中在了这一段时间里,欧冠上打出6.73%的限制对手射门得分率,也就不足为怪了。此外还有一点值得注意:我们计算限制对手射门得分率的公式中,分母是对手射正数,这导致我在计算特尔施特根数据时,连着两个赛季都出现了无效值——因为有的比赛中,巴萨的对手全场0射正……这也是这次涉及到的其他门将都没能做到的事。巴萨无论欧冠出局多么耻辱,联赛上的统治力,该肯定还是要肯定的。如果要给出特尔施特根这赛季的代表性扑救……对不起惨痛的皇马,国王杯特尔施特根一共就对上皇马上了两场,结果给足了老对手面子,一通神扑直接把靠着维尼修斯延续希望的皇马球迷,给扑绝望了……5本赛季头号门神,遗憾欧冠血崩——奥布拉克奥布拉克这赛季有多夸张?相信不少西甲非马竞球迷体会过被他支配的恐惧。除了阿利松在17-18赛季逆天的联赛表现之外,奥布拉克8.87%的的限制对手射门得分率,是我们所选取的样本当中最高的。此外,奥布拉克还仰仗身高,在经常送给对手定位球的马竞,打出了一个他人难以企及的数据:整个赛季他61次出击摘球,而其他人最高不过50次。事实上,奥布拉克目前很可能已经是马竞第一球星,其对于球队的重要意义,或许还在格里兹曼之上。要知道,马竞本赛季实际上已经退出顶级防守强队行列,其对手41.57个预期进球只是西甲第3少的(一年前这一数据还是35.71,西甲最佳)。若无奥布拉克在去年基础上百尺竿头更进一步,马竞这赛季的联赛第二恐怕也没那么稳。此球看似简单,但实际上XCG高达0.69上面追求实际上射门球员所追求的角度非常刁钻,之所以看起来简单,很大程度上是因为奥布拉克利用体型优势可以很轻松的覆盖皮球运行线路。类似的情况巴萨也经历过,比如下面这球,当库蒂尼奥试图用弹地球绕过门将时,反而被人高马大的奥布拉克轻松接住了:库蒂尼奥的头球,XCG为0.61按道理来说,有这个体型和意识打底,奥布拉克在欧冠赛场上也应该一如既往的稳定才对。然而这里我们之前提到的一个理论在此“作祟”——奥布拉克的状态一样存在起伏,不巧的是,在他状态相对较差的时候,马竞正在打欧冠小组赛;等到他状态回暖,马竞已经被尤文淘汰出局了。来看看奥布拉克联赛的限制对手射门得分率变化趋势图:最惨的一段时间,刚好就是欧冠小组赛阶段,其中奥布拉克连着两场,被XCG只有0.2上下的远射制裁:此球XCG为0.21此球XCG为0.19当然,你可以说这两个进球,一个是奥布拉克视线被挡,另一个是世界波球速太快。但是,这两个因素也确实是目前不大容易量化的,尤其第一条,在可以预见的范围内甚至根本没有量化可能。这里还是要回到那个命题:样本越小,数据失真的可能性就越大。对于门将的评价,联赛的参考价值应该还是高于欧冠的。6懵逼的皇马——纳瓦斯确实有被高估之嫌,问题是库尔图瓦更差无论怎么看,纳瓦斯的数据都是全面碾压库尔图瓦的存在,当然,纳瓦斯本赛季无论是联赛还是欧冠,样本都有些太小了,欧冠甚至只有3场比赛,参考价值几乎可以忽略不计。但问题是,即便只看样本更大的联赛,即便只看库尔图瓦拿到国际足联最佳门将的上赛季,纳瓦斯一样比他强的太多……17-18赛季,纳瓦斯在联赛中打出了6.47%的限制对手射门得分率,相比表现神勇的特尔施特根其实不遑多让。的确,皇马在各项防守数据与巴萨相差不大的情况下,失球数比对手多出了15个,门将上确实差了一大截,但这不是纳瓦斯的责任——纳瓦斯受困于伤病,整季只打了27场,皇马的门将问题,更多是在卡西利亚和卢卡-齐达内打的11场里集中爆发的。当然,这里并不排除纳瓦斯在欧冠当中的表现被极大高估了,2.56%的限制对手射门得分率只能说还算不错,距离“纳爹”这样称爹道娘的表现还差不少。体面的数据其实更多是靠对阵拜仁的那一场比赛撑起来的,综合来看纳瓦斯在欧冠的表现,远远不如他在联赛中那么稳:当然,在杯赛赛制上,夸大一场比赛表现的重要意义,也并非全无道理,毕竟纳瓦斯之前和之后不怎么好的表现并未酿成什么恶果,那一场球确实实打实的把皇马从死亡线上捞了回来。这里我们暂且不谈评价标准的问题。核心争议在于:你用来顶替纳瓦斯的库尔图瓦,无论怎么看都是更差的一个。要知道当季库尔图瓦在切尔西打了8场欧冠,限制对手射门得分率是耸人听闻的-10.75%!即便欧冠样本不大,这个数据也太离谱了吧?尤其是小组赛两战罗马,库尔图瓦几乎是被对面的阿利松抢尽了风头,几个丢球甚至让人觉得,此人是不是反应速度有问题,怎么会一遇到球速快的爆射,无论对手打那个角度,他都会让球从指间溜过去……比如这样:此球射门很正,XCG为0.16同样,射门很正,XCG为0.12远距离打近脚,XCG仅为0.08……倘若库尔图瓦能够在联赛中拿出令人信服的表现也就算了,但其在17-18赛季英超0.72%的限制对手射门得分率,充其量也就是中规中矩,比之纳瓦斯实在相去有些太远了。尽管坊间对纳瓦斯的吹嘘缺乏高阶数据的支持,动辄从道德角度抨击库尔图瓦,于技术分析而言也毫无意义。但问题是,你把高阶数据搬出来,库尔图瓦的表现也不怎么样啊……结语上面我们利用XCG数据做了一些简单的处理,筛选了几个门将进行了初步量化,也谈到了这种量化方式的局限。利用数据量化门将水准,和量化其他位置的球员以及球队、解析比赛等等事情都一样,是一条科学而又永无止境的道路。数据永远做不到完全真实的反映比赛内容,但进阶程度越高,所体现的内容就越趋近于客观真实。在大数据加持下,目前用于量化门将扑救水平的高阶数据远不止XCG一家,比如OPTA的XGot数据,甚至还会把射门时最后一传的情况考虑在内,比如角球传中形成的射正,相比运动战传中的进球数学期望就会更高。足球当然可以是娱乐,可以是审美,甚至可以是苏醒式的情绪宣泄。但足球也可以是科学。####(文:唯心)
1
查看完整版本: 高阶数据告诉你,谁是本赛季最牛的门将肆