您的位置:首頁 >足球情報 >

切爾西球迷公認為大水貨數據本身并不是復雜的運動

時間:2022-04-07 14:05:21 來源:網絡整理

????

若日尼奧在薩里的體系中扮演著舉足輕重的角色,但他被切爾西球迷視為一個大平行線

數據本身并不是足球的一切

足球是一項復雜的運動。多年來,一種流行的觀點認為,足球是一項過于復雜的運動,無法用枯燥、乏味、毫無生氣的數字來描述。近年來,這樣的話題已經有所消退——人們開始談論更高級別的統計數據,例如比賽日的預期進球 (xG)。利物浦最近的出色表現也部分歸功于他們招募的頂級數據分析人才。

當然,先進數據的出現并沒有改變足球本身,它仍然是一項復雜的運動。到目前為止,數據本身僅用于表達意見或作為論據出現,因為它比描述性語言更簡潔。這也是數據分析本身被廣泛應用于足球(和其他項目)的根本原因,因為沒有任何媒介可以更客觀地支持(或反駁)某個球員或球隊??捶?。

對于足球來說,如果比賽的精彩片段可以更輕松地直播,并且轉播商的版權限制不那么嚴格,那么足球界的數據分析可能會有新的發展。

數據本身可能是普通粉絲能擁有的最好的客觀分析和評估工具,但這并不意味著我們應該將其奉為無可置疑的神。

首先,足球場上總有一些地方是單純靠數據本身無法衡量的。例如:英超聯賽中誰的先手觸球最好?當然,分析師可以基于這個概念創建類似的指標,例如控球失誤與隊友傳球的比率。根據fbref數據,我計算出阿斯頓維拉后衛比約恩·恩格斯(控球失誤率最低0),利物浦的維吉爾·范維吉爾·范迪克的失誤率0.1%,緊隨其后。你能說說恩格斯是英超最有能力的?顯然你看完比賽后不這么認為。

這個數據的問題在于他沒有考慮傳球的類型或球員接球的情況。伯恩茅斯的卡勒姆-威爾遜16%的“球對球失誤”率是英超最高的。但他接球的時候顯然比恩格斯承受的壓力更大,而且他的接球位置更靠近對方禁區。

同時,還應考慮到球員的停車位置。在某些情況下,控球的難度接近于零,而在某些情況下,隊友的傳球讓球員難以控球。傳球的高度是“大腿,膝蓋”,他們想要停球并不容易。在數據中,所謂控球失誤的結果只分為“是”和“否”。因此,即使考慮到傳球類型或情境因素,統計數據本身仍然不夠精確,無法找出誰擁有最好的控球感。一些討論更多的是交換意見,就像在這個例子中,僅從數據中很難得出準確的結論。

同樣重要的是要指出,雖然我們認為某些公司收集的數據是“客觀的”,但許多數據實際上(目前)是由人類手動收集的。因此,其中存在問題。既然是人工采集的,自然會有偏差,還會帶入記錄儀的不合理因素,有時記錄儀也會出錯。這會降低數據本身的客觀性。因此,目前的足球數據總會有一些誤差。無論足球分析系統多么先進,源數據本身的問題都會導致數據本身的失真。

數據的問題不僅僅是人為錯誤。某些概念的不同定義也可能導致數據收集過程中的錯誤。無論是 Opta 還是 Statsbomb 還是其他公司,他們在收集相關數據時,都必須按照公司對事件的定義進行分類。為什么要傳球?什么是直通球?什么是承接?阻止和保存有什么區別?這些概念的分類不是非黑即白的最權威的足球數據,其中有很多歧義。

如果有人有興趣深入挖掘數據分析早期給出的定義(足球或其他運動),他們會發現這些決定存在一定的主觀性。數據本身從來都不是完全公正的,其中固有的主觀性(無論是否有意)是數據收集過程中不可避免的一部分。

切爾西球迷公認為大水貨數據本身并不是復雜的運動

當然,這并不意味著數據本身不可信。請注意,數據收集本身非常困難,并且由于數據收集過程中固有的主觀性,這意味著關于數據的討論永遠不會完全客觀和公正。

一些球員“數據不佳”但表現不錯

有時候,一個球員的數據不好,直接導致外界對他的評價出現偏差。這是因為人們誤讀了數據本身。

以西漢姆聯隊的塞巴斯蒂安·哈勒為例,他本賽季在英超聯賽中頭球失敗次數排名第二(187),但他贏了)。是英超最多的(186)。從不同的角度來看這個數據,很自然的分成兩個陣營,一方認為他在頂戰中的表現非常好,另一方持相反意見,這個數據最準確的解釋應該是,哈勒參加過多次登頂之戰,以英超前鋒的標準來看,他的成功率非常高(根據smarterscout的評價標準,這個成功率可以99分中得到82分。 smarterscout 可以看作是FIFA對球員的真實比賽數據評分)。

此外,球員“數據不佳”的部分原因是表現指標沒有考慮到他們在球場上的責任和角色。若日尼奧上賽季在毛里齊奧·薩里的帶領下在切爾西幾乎沒有助攻。造成這種情況的原因有很多,但很少有人指出助攻不是若日尼奧的責任。

若日尼奧作為后期進攻組織者,更重要的是連接球隊的防守和進攻,控制比賽節奏,將球傳給負責創造進攻機會的球員。他的工作做得很好——他做得很好。若日尼奧上賽季參與了進球——不僅僅是進球和助攻,還有控球鏈中的所有球員——英超聯賽中最多的。

切爾西球迷公認為大水貨數據本身并不是復雜的運動

按照Opta的預期助攻模型,若日尼奧也有不少好球,平均來說他應該有5次助攻。球場上的真實表現會有運氣因素,但球員的表現應該根據他的場上職責來評估。

也許本賽季的數據低估了他在球場上的表現的球員是謝菲爾德聯隊的大衛麥戈德里克。

是的,他本賽季的預期進球是6.2,但他本賽季還沒有進過一球。如果單看他的進球能力,他早就應該被掃地出門了。麥戈德里克之所以能在克里斯懷爾德的陣容中立足,是因為他持續的無球進攻能力——聯盟中沒有一個前鋒的防守比他做得更好——所以他是謝菲爾德聯隊中非常重要的一員。

數據不是一切

在一場足球比賽中分析數據就像在 90 分鐘內洞悉場上 22 名球員的復雜性。

在足球運動中,你最常遇到的事情就是類似于球迷在場邊大喊大叫,他們清楚地告訴你場上的情況(傳球、傳球、解圍、接球、傳球、射門、得分?。┑苌儆袛祿从硤錾掀渌?21 名無球球員的價值(如果他們搶球,則為 20)。

切爾西球迷公認為大水貨數據本身并不是復雜的運動

因此,如果我們專注于球上發生的事情,我們就會錯過足球場上發生的許多其他事情。想象一下球員跑到對方防線的空位,防守型中場在阻止球傳給前鋒方面還有其他影響。在目前的數據收集水平上,數據并不能完全反映現場的一切。

當前足球統計數據的最大缺陷之一是無法正確衡量比賽防守端的價值。防守動作的次數(搶斷、攔截、回球等)并不是一個防守者素質的有效指標,它只是告訴我們防守者的活躍程度,也反映了防守者和球隊的防守風格。

正如我在足球數據分析的“十誡”中所寫的那樣,這些數字通常還受到球隊控球率的影響。擁有更多控球權的球隊擁有更少的防守時間。

阿斯頓維拉的泰隆·明斯每 1000 回合只有一次鏟球,是英超所有中后衛中最低的。這個數字并不意味著他的防守不好,這只是意味著他在搶回球權方面并不積極。我們指的是他的位置,他實際上是本賽季英超所有后衛中蓋帽次數最多的。別墅經理迪恩史密斯更喜歡在球門前使用他的位置作為盾牌,而不是離開防守重新獲得控球權。

可能沒有反映防守者真實水平的統計數據,但這些初始防守數據可能非常有用。查看防御者的最佳方法是將這些數據用作路線圖,并查看防御者在特定情況下的表現??赡懿皇敲看螌κ衷竭^禁區,防守者都必須移動,但有經驗的人可以很快告訴一個好的防守者應該如何表現。這些數據可以幫助球探教練更快地判斷防守者在不同情況下的表現,從而對防守者的水平做出更準確的主觀判斷。

目前,防守球員的失誤和禮物(包括對手射門或得分的機會)已經是有些主觀的數據。本賽季除了門將之外,給對手送禮最多的球員是南安普頓的揚-貝德納雷克,他的失誤幫助南安普頓的對手再進了三個球。這些錯誤通常是極低級的,讓對手嘲笑近乎不可能的情況。最常見的例子是當球員回傳給守門員時太輕,被對方截斷形成單手射門。

切爾西球迷公認為大水貨數據本身并不是復雜的運動

這些錯誤很少見,而且頻率可變,可能是隨機的,也可能不是每個賽季一次,因此它們很難成為衡量防守球員表現的標準。理想的衡量標準應該是防守者的微妙(或沒有)移動給對手得分機會的次數,這是一個更合理的衡量標準。

在被對方射門或得分的控球鏈中,防守往往是球員失誤造成的連鎖反應??赡苁呛笮l棄守,失去了后衛,或者中場沒有擋住對手的傳球路線,或者球探發現了其他一些看不見的錯誤。這很好地說明了許多防守球員的水平并沒有反映在所謂的防守數據中。他還需要前輩的肉眼才能發現。

也有可能,失球不僅僅是一名后衛的錯,而是球隊防守端一系列失誤的結果。盡管如此最權威的足球數據,組合的比賽事件數據和雷達跟蹤數據(它可以告訴我們所有球員、球和裁判在比賽中的任何特定時刻都在哪里)應該為回答這個問題和其他類似問題留出空間——但足球的復雜性它不止于此。

我們可以做一個思維測試。

假設一個數據提供者已經完全破解了足球比賽。他們可以收集你能想到的所有數據:所有球員的傳球選項、他們隨時的壓力水平、是否抬頭、隊友何時開始、他們的鞋帶是否松動——細節、一切所有數據都被收集.

有了這么多的數據,我們的問題不再是衡量什么,而是從數據中找到有用的指標。

其實,我們也不是無所不知、無所不能,我們觀察到的游戲進度只是整體冰山一角,但對數據分析的要求并沒有像往常一樣發生變化。預期目標之所以近年來如此流行,是因為它既可以解釋又可以預測未來——它揭示了我們之前的盲點。我們可以用它來推斷未來的球員或球隊的表現。

原文鏈接:/1763286/2020/04/23/bad-stats-but-good-player-analysis/????


鄭重聲明:文章僅代表原作者觀點,不代表本站立場;如有侵權、違規,可直接反饋本站,我們將會作修改或刪除處理。
猜你喜歡
大中国视频高清在线观看_青柠直播免费观看_亚洲精品无播放器在线播放网站_一级毛片免费无卡全部视频