大数据入侵人类运动:从卡塔尔世界杯看球员表现数据的来源与应用

文章转载自微信公众号协同感知与知识服务,原创:张苗苗,版权归原作者及发布媒体所有。

卡塔尔世界杯期间,球员们有了更多基于大数据的方式来证明和争取首发时间。每场比赛终场哨响后几分钟内,赛事组织者将向每位球员发送详细的表现数据。前锋将能够展示他们的无球跑动,创造机会却被队友忽视。防守队员将获得有关他们在受到对方球员压迫时成功传球的次数的数据。这是数字化对人类运动的最新入侵。如今,数据分析有助于指导一切,无论是球员转会还是训练强度,基于大数据的人工智能甚至可以为球员在场上推荐最佳站位决策。

这些详细的对抗数据从何而来?可穿戴背心可以感知球员的运动,GPS可以跟踪位置,特殊的鞋子可以计算每只脚的射门次数。此外,球场上多个角度的摄像机可以捕捉到从头球到球员控球的更多时间。为了理解这些数据,大多数职业足球队都会聘请数据分析师,其中包括从顶级公司和实验室(例如计算巨头微软和欧洲核子研究中心(瑞士日内瓦附近的欧洲粒子物理实验室))挑选的数学家和数据科学家。和物理学家。

顶级数据分析师的加入正在改变比赛的方式:前锋远距离射门的频率降低,边锋传球给队友而不是传中,教练们痴迷于在球场上赢得控球权。教练直觉的有力支持。德国科隆体育大学的一位体育科学家表示:“大数据开创了足球的新时代。” “它改变了球队的理念和行为、他们分析对手的方式以及他们培养人才和寻找潜在球员的方式。”

大数据改变体育运动的最著名的例子之一来自另一种游戏。 2002 年,奥克兰运动队经理比利·比恩 (Billy Beane) 依靠球员统计数据在有限的预算下组建了一支获胜的棒球队。比恩根据球员表现的详细数据来招募球员,其中包括以前被低估的指标,例如击球手上垒的频率。然而,足球领域的数据分析要困难得多。棒球是一种自然而然的走走停停的比赛,一次只有一支球队试图得分。棒球统计数据会定期收集并进行大规模研究。相比之下,足球是一种流动性低的“入侵”游戏(领土经常被占领和放弃),并且很难跟踪谁做了什么以及它如何影响结果。几十年来,足球统计学家往往只关注进球数和失球数,并寻找一种方法对其进行建模以进行预测

这种方法的变体至今仍被用来预测比赛结果。英国牛津大学的流行病学家开发了一个数学模型,假设进球数和失球数分布在平均值附近。该模型正确预测意大利将在 2020 年欧洲杯国际锦标赛中击败英格兰。它还正确预测了欧洲杯四分之一决赛的六支球队。牛津大学博士生佩恩开发了 2020 年欧洲杯模型,他认为统计比赛预测比许多人意识到的更准确。 “你想要赋予每支球队进攻和防守的优势,你可以根据每支球队的总进球数和对手的相对难度来做到这一点,最后你会得到一大组方程式来解决这两组问题优势,然后预测每场比赛就变得很容易。”佩恩的模型表明,比利时最有可能举起这一享有声望的奖杯,其次是巴西(过早地打了他们的脸)。

考虑到每支球队的进攻和防守实力的统计“双泊松分布”模型认为比利时最有可能赢得世界杯,而巴西在国际足联排名中名列前茅。

模型预测排名

夺冠概率(%)

国际足联排名位置

1. 比利时

13.88

1.巴西

2.巴西

13.51

2. 比利时

3.法国

12.11

3. 阿根廷

4. 阿根廷

11.52

4.法国

5.荷兰

9.65

5.英格兰

6、德国

7.24

6.意大利 †

7. 西班牙

6.37

7. 西班牙

8.瑞士

5.29

8. 荷兰

9. 葡萄牙

3.78

9. 葡萄牙

10.乌拉圭

3.36

10.丹麦

11.丹麦

3.17

11.德国

12.英格兰

2.56

12.克罗地亚

13.波兰*

2.33

13.墨西哥

14.克罗地亚

1.46

14.乌拉圭

15.墨西哥

0.67

15.瑞士

*国际足联排名第26位;

教练更感兴趣的是球场上发生的事情以及球员对这些变化的影响。足球分析师长期以来一直在记录此类信息。最成功的是一位名叫查尔斯·雷普 ( Reep) 的会计师,他花了 20 世纪 50 年代的大部分时间在英格兰观看比赛,并对传球的位置和顺序等因素进行了基本观察。里普甚至使用他的数据来分析团队绩效并提出战略和战术建议。在英超狼队,他帮助引进了一种直接、敏锐、不接受侧传的踢球风格,并在五年内赢得了三个联赛冠军。

现代技术使此类数据的获取和分析变得更加容易,以至于大多数顶级俱乐部和许多国家队十多年前就开始雇用数据分析师。许多分析师将布伦特福德足球俱乐部最近的成功部分归功于内部算法,该算法对不同联赛的球员进行评分,并帮助球队招募被低估的球星。利物浦足球俱乐部的数据团队包括来自欧洲核子研究中心和英国剑桥大学的前物理学家,他们建立了一个模型,可以评估球员在球场上的行为是否使他们更有可能进球。去年,葡萄牙里斯本大学的体育科学家与西班牙豪门巴塞罗那足球俱乐部合作,发表了一份关于比赛中不同类型传球机会持续时间的分析报告。

数据分析师会在比赛前准备一份报告,提供对方球队球员的属性,然后创建一些图表来显示他们的比赛方式以及他们的控球表现。然后提出一些战术建议或改变。在最近的一场比赛之前,牛津城的分析师注意到对方左​​后卫的头球数据不佳。大前锋被建议留在球场右侧,最终赢得了比赛。这也是经验丰富的球员或教练可以通过肉眼轻松获得的洞察力,但数据是客观且没有偏见的。

大量的球员运动信息是由商业公司提供的,它们记录了大约3000个主要比赛事件,包括运球、传球和抢断。最初,此类数据是手动记录的,但现在通常使用基于计算机视觉的人工智能 (AI) 来完成。这些数据带有摘要统计数据,例如每个球员的传球完成百分比。

足球预测准确比赛软件_足球预测_如何准确预测足球比赛

电视摄像机捕捉到了 2019 年女足世界杯期间挪威与英格兰之间的比赛。照片来源:艾维尔/国际足联/盖蒂

今年早些时候,英国华威大学数学本科生乔安娜·马克斯与宾夕法尼亚大学合作开发了一个模型,利用这些原始数据来评估所有牛津联队球员的传球能力——那种详细的分析通常在公司中通过对所提供的原始数据进行深入挖掘而获得。

“你需要考虑他们正在尝试什么样的传球。你不能只考虑完成率,因为有些传球要困难得多,这种模型有助于球队做好准备,因为如果你知道对手在球场的某个部分如果区域传球非常好,那么你就知道你需要专注于那个区域,”拉维说。他在 2012 年转投美国职业足球大联盟之前曾担任数据分析师。该俱乐部的华盛顿西雅图海湾人队也担任类似的工作。他的首要任务之一是利用 GPS 数据了解球员跑了多远,以优化他们的训练和准备。在训练期间收集这些数据可以帮助球员确定他们的训练是否过多或过少,以防止受伤。

这些方法真的有效吗?这种不确定性给所有关于数据在运动成功中的作用的主张带来了一个问题:没有对照实验来检查功效。尽管如此,拉米尼尼表示西雅图教练对他的分析持开放态度如何准确预测足球比赛,无论是在实践中还是在以后判断球员的优势时。

分析师现在越来越关注当球员无球(无球跑动)时会发生什么。这更加困难和昂贵,因为它需要专用摄像机,不仅跟踪主要动作,还密切关注不直接参与的玩家,并每秒大约 25 次标记他们的位置。提供此类数据的公司往往与国家联盟签订排他性协议,使得外部人员很难获取这些数据。如果你正在为美国职业足球大联盟寻找一位来自南美或欧洲的国际球员,那么很难获得他们的无球数据。人工智能的出现逐渐改变了这种状况。使用人工智能来预测拍摄过程中球员的动作,即使他们不是直接被摄像机捕捉到的(球员不在电视画面中)。这意味着数据公司可以使用不受限制的比赛转播片段为世界各地的球员提供全面的场内和场外分析。这种预测模型是由总部位于伦敦的谷歌旗下人工智能公司的研究人员与利物浦足球俱乐部数据团队合作开发的。通过这种应用程序,您可以提出有关策略或反事实的问题。对于游戏中的特定事件,该模型可以对可能发生的情况产生数千种不同的模拟。所以,你可以开始谈论那场比赛的进攻有多好。

动画将足球比赛中球员的真实动作(进攻,深蓝色;防守,深红色)与预测镜头外球员路径的模型的预测进行比较。灰色阴影区域是电视摄像机的视野 (FOV),它跟随球(黑线)。对于视场之外的玩家,模型预测攻击者(绿色)和防御者(橙色;实际的镜头外位置分别为浅蓝色和粉色)的位置。通过这种预测方法,可以获得球员在场上的位置。无球状态下的实时位置和移动。图片来源:

俱乐部数据团队通常不会分享他们正在做什么或工作效果如何的详细信息,而这是俱乐部的王牌。利物浦拥有足球界最大、最发达的分析部门之一,并且恰好需要构建深度学习模型所需的资源。足球是一项变化很大的运动,球队经常在不该输的时候输,在不该赢的时候赢,这带来了相当大的不确定性。计算机科学家 Karl Tuyls 表示,镜头外建模工作是创建人工智能驱动的虚拟助理教练的第一步,助理教练使用实时数据来指导足球和其他运动的决策。你可以想象人工智能会查看上半场的表现并建议改变阵型,这样可能会做得更好。这种方法在球场之外也很有用,例如在繁忙的城市街道上模拟自动驾驶汽车和行人的轨迹等任务。

人工智能也在改变其他体育运动,萨拉·拉德 (Sarah Rudd) 是前微软数据科学家如何准确预测足球比赛,在伦敦俱乐部从事分析工作近十年后,去年离开了阿森纳足球俱乐部。提高他们的表现。她非常专注于一级方程式赛车,如果能有这样水平的数据那就太好了,足球界有很多东西还没有被测量过,或者正在被测量,但科学家们还没有弄清楚如何获得更多的知识和从中得到洞察。下一个进步可能是显示玩家方向的数据如何准确预测足球比赛,甚至是如何转移他或她的体重。跟踪数据可能仍然不如人们所希望的那么精细,而且您还无法捕获球员为使防守队员失去平衡、绊倒防守队员或让守门员暂停片刻而做出的小步或体重转移。

由于对球员位置的了解不完整,即使利物浦的人工智能驱动的分析也可能做出错误的决定。该模型可能会说该球员做了一件坏事,因为他应该在此时开始跑步,但他没有,但这可能是因为他刚刚被绊倒并躺在球场上。现代足球充斥着数据,数字如何改变了比赛?招聘可能是获得最大收益的地方,另一个领域是定位球策略。然而,数据分析的一个明显教训是,球员不应该在距离球门太远时射门。如果你看看世界上的任何一个联赛,十年前球员们会从更远的地方投篮,而这一切都改变了,因为数据分析师开始建议,为什么要从那里投篮?远射的几率只有2%!现在许多球队也不鼓励球员尝试长传到禁区,因为统计数据显示大多数传中毫无意义。随着产生的数据量不断增长,数据分析的就业机会将不断增加。人工智能和数据分析将遍及足球运动的整个过程,为俱乐部、球员和观众提供更高水平的技术对抗体验。

(改编自新闻文章)

推荐阅读

专业讲座 |武汉大学测绘学院副院长李艳:航天测绘科技新发展,时空信息新发展

不再有限制游戏!虚拟现实融合千行百业,进入爆发期!

2022年最新版地理学/生态/环境科学领域优质科技期刊分级目录

《天地智慧》警告

“回天地”公众号聚焦国内外时空信息技术前沿、行业发展趋势、跨界融合趋势,发现企业核心竞争力,传播测绘地理信息文化,为时空信息相关专业的学生提供日常学习、考研、就业的一站式服务。服务,打造政、产、学、研、资、管精准对接平台。


上一条:安徽足球职业化大旗重树,旋风足球队征战全国乙级联赛

下一条:中超夺冠球队次数排名:广州足球俱乐部夺冠次数最多

友情链接