对于五大联赛中哪一个级别较高、哪一个级别较低,一直以来众说纷坛,并没有最终的定论。 有人通过欧战积分来评价(),但这种方法也有其局限性。 每个联赛中实际参加欧冠和欧联杯的球队都是联赛中的顶级球队,并不能覆盖联赛的大部分。 一些欧洲赛区中下游球队无法参加。 而如果一种比较方法不能覆盖联盟中的大多数球队西甲联赛球队标志,那么这种比较方法就很难公平。
() 是一个对球员在主要足球比赛(包括五个主要联赛)中的表现进行评级、排名和提供数据分析的网站。 尽管它的评级存在争议,但基于相同算法的统计数据足够客观。 对比中,我以西甲为基准,统计了西甲与英超、德甲、意甲、法甲之间相互转会球员的数据。我假设不同联赛的球员水平没有变化在转会前后的两个赛季中,然后我计算了球员评分与赛季平均分标准差之间的关系,然后根据前后两个不同联赛的不同结果,我们可以判断英超的水平联赛、德甲、意甲和法甲相对于西甲。
以2010-2011赛季从西甲转战英超的大卫·席尔瓦为例。 有大卫在10/10赛季西甲联赛和10/11赛季英超联赛的评分。 我首先计算了2009/10赛季西甲主力球员的平均评分(出场总次数大于联赛平均出场次数的球员西甲联赛球队标志,下同)的平均评分和标准差10/11赛季英超主力球员分别为6.88和0.30。 用2009/10赛季西甲主力平均评分6.88减去大卫·席尔瓦2009/10赛季西甲评分7.34,再除以标准差0.33。 结果是大卫·席尔瓦2009/10赛季的评分比平均评分高出1.40个标准差。 。 然后用同样的方法,用10/11英超主力球员的平均评分6.88减去大卫·席尔瓦的10/11英超评分7.15,然后除以标准差0.30,得到大卫·席尔瓦的10/11赛季高于英超平均水平。 分数高出 0.90 个标准差。 减去两个标准差(西甲的标准差减去英超的标准差)。 如果结果为阳性,则意味着英超联赛的水平高于西甲联赛。 如果为负数,则说明西甲联赛的水平较高。 以大卫·席尔瓦为例,0.5的结果表明他在英超的水平并不如西甲其他球员那么出色。 因此,假设球员水平没有变化,那么我们可以推断英超球员的平均水平高于西甲。 如果转会球员的样本足够大,那么取平均值就足够准确。
具体实施过程:
首先,我需要获取2009/10上赛季到16/17赛季五个大联盟主要球员的评分(总出场次数大于联赛平均出场次数的球员)。 由于该机制的原因,我无法使用类似的库进行网页抓取。 我转而模拟键盘操作,将每个网页的内容保存到txt文件中。 代码如下所示:
#
:= ".txt"
页数:= 29
*空间::
文件 := (, "w")
循环,30
发送^a
睡眠,500
发送^c
睡眠,500
文件.Write()
发送{点击}
睡眠,5000
文件.关闭
然后,读取这些 txt 文件并使用正则表达式捕获玩家评分并将其写入多个 csv 文件。
接下来,使用csv文件中的球员评分来计算每个赛季每个联赛的平均得分和标准差。
最后,基于上述原理,通过excel表格对09/10~16/17赛季从五大联盟转会的球员进行了数据分析。 我以西甲(La Liga)为基准,对从西甲转会到其他联赛(或从其他联赛转会到西甲)的球员进行数据分析。
代码、csv文件和分析的excel文件请参阅附件。
综上所述:
从两张图可以看出,多年来西甲联赛一直是当之无愧的第一名西甲联赛球队标志,紧随其后的是德甲联赛(外滩)、英超联赛(EPL)、法甲联赛(Ligue 1)、意甲联赛(Serie A)。 A)。
左:第2行至第8行分别代表该赛季西甲联赛与其他四大联赛的水平差距(正数表示水平高于西甲,负数表示反之)。 从底行可以看出,这四大联赛的平均水平分别比西甲低0.12、0.13、0.20和0.34个标准差。 右图的意思是,以西甲为基准,分数线以下的联赛并没有当赛季的西甲那么高。 对于积分高于底线的联赛,情况恰恰相反。
我的统计结果与欧战积分不同( )
欧洲战点。 西甲仍然是第一,但意甲和法甲与我的统计数据有很大不同。
出现差异的原因可能是12/13赛季法甲和西甲之间只有两次转会,2016/17赛季德甲和西甲之间也只有两次转会。 因此,在线统计图上观察到的12/13和2016/17赛季的极值并不能证明德甲和法甲的真实水平。