2016-2017賽季歐洲足壇那些亮眼數據(一)——一個
五大聯賽重燃戰火,每一家具樂部都會為我們帶來更多激情碰撞和經典對決。從 2016-2017 賽季開始,我會在歐錦賽期間繼續這個系列,每周(大概)為你帶來歐洲足球產生的令人眼花繚亂的數據。
在新欄目開始之前,首先給懂球的大家介紹一下當今足球中的各種數據是如何產生的,它們的作用是什么,它們的局限性是什么。正好作為介紹,也希望以后能做一個問答索引,供大家收藏。
(圖)2012歐洲杯2012德國vs希臘投籃統計
[壓倒性的數據從何而來]
在當今在線咨詢的時代,每場比賽結束后,從微博、微信到了解球,球迷們都能迅速接受各種數據的洗禮。很多人也有一個疑問:數據是怎么計算出來的?有人猜測是收藏家拿著一個小筆記本在上面刮,也有人猜測是電腦程序控制了一切。恭喜你,你沒事。
根據數據類型和用戶需求的不同,足球場上的數據基本來自以下三種形式。
首先是人工統計。數據采集??員觀看比賽直播或觀看高清轉播,手動記錄射門、傳球、搶斷等重要事件,并標記球員、起止點、時間等相關內容。經過系統的整合和分類,最終形成了下面這個粉絲非常熟悉的數據圖。
(圖)2016年歐洲杯2016威爾士vs比利時交叉統計
在足球統計的早期,這樣的統計是由一個人單獨完成,或者由兩個人負責比賽的每一方。隨著數據公司的發展和用戶對準確性的更高要求,如今的數據采集基本采用“一人配多人”的方式。至于“是射門還是傳球”之類的爭論,由投票決定結果。
除了變得更加準確之外,這類數據也變得更加直觀。例如,系統會根據采集者輸入的數據,自動繪制如下圖所示的玩家活動熱圖。
(圖)2016年歐洲杯揭幕戰坎特活動熱圖
這就是著名的數據提供商OPTA完成收集和統計工作的方式。他們平均每個會話收集大約 1,500 個數據。我們比較熟悉從 OPTA 導入數據進行分析的網站,例如 WhoScored 等。
但是,手動統計有一個明顯的缺點:只能計算球活動。無論是無球狀態下的相關動作,還是跑動距離等數據,肉眼觀察是無法統計的。因此,這類數據的主要服務對象是媒體和球迷,真正為球隊提供數據服務的公司,以及其他更高的統計方法。
第二種是高速攝像機。多臺專門設計的高速攝像機安裝在體育場的各個位置,通過光學跟蹤算法自動提取球員和足球的運動軌跡,使程序可以完整計算包括跑步距離在內的實時數據,并連跑步都可以細分。對于慢跑、快跑和短跑等每個子項。
在實踐中,這樣的自動化過程有時仍需要人工干預,例如兩名玩家之間的近距離戰斗。但即便如此,高速攝像頭采集的數據絕對不是純人工統計一個數量級,也受到很多俱樂部的歡迎。
這項技術的領導者是 Prozone,它成立于 1995 年,現已被 STATSports 收購,以下段落也將對此進行介紹。
(圖)2016年歐洲杯單場跑動最多、每90分鐘跑動最多的球員是意大利老將帕羅洛
這種方法也有其自身的局限性:整個系統必須安裝在體育場內。也就是說,要收集這些數據,必須征得俱樂部的同意,而要在整個比賽過程中進行橫向比較,則需要與主辦方乃至足協協商。另外,不同提供商光學算法的差異也可能導致最終數據存在一定程度的誤差。
第三種,傳感設備。近年來,一個新現象逐漸引起了輿論的關注,那就是很多球員在訓練甚至比賽中都穿著黑色短背心,球迷們也形象地稱其為“Bra”。
穿這件黑色背心的意義在于收集球員在運動過程中的各種數據。背心正面有一條心率帶,可以隨時監測球員的心率、運動負荷等身體數據。背面是整個系統最關鍵的GPS模塊,可以測量跑步距離、實時速度、反應速度、配速平衡等一系列精細復雜的內容。
2015年7月,FIFA正式允許球員在比賽中佩戴感應裝置,“黑背心”迅速成為各大豪門和國家隊的標配。近 30 支英超和英冠球隊成為 STATSports 在北愛爾蘭的客戶,包括曼聯、曼城、阿森納、利物浦、托特納姆熱刺等。巴塞羅那和他們做出了同樣的選擇,而切爾西、皇家馬德里、巴黎、尤文圖斯、米蘭二人組則從澳大利亞購買了 GPSports 智能運動內衣。
提到這類數據的缺點,首先是價格昂貴。為整個團隊配備“黑背心”的成本已達數十萬歐元。在不太富裕的地區發展。對于豪門來說,最大的問題是他們只能收集自己球員的數據,無法與其他球隊的球員進行比較。
這三種類型的數據有不同的用途。他們如何改變足球比賽?
【怎么用也是一門學問】
前面必須要寫的是,數據只是幫助人類做出主觀判斷和得出結論的輔助手段,目前的技術水平還遠未達到還原游戲全貌的水平。換句話說:數據永遠不會騙人,但現階段,列出的所有脫離現實的數據都是流氓。
在以上前提下,我們來看看數據究竟給球隊、球迷和媒體帶來了什么。
對于球隊來說,數據可以提供的幫助主要包括兩個方面:轉會決策和戰術安排。讓我們先談談轉會決定。目前,包括曼聯、巴塞羅那、拜仁和尤文圖斯在內的歐洲豪門都是在線球探平臺Scout7或WyScout的客戶。這些網站可以提供數百個聯賽(包括低級別)的球員視頻和統計數據,可以為俱樂部的引援提供參考。
有一些著名的例子:溫格第一次簽下弗拉米尼是因為他在馬賽的第一個正式賽季中單場跑了 1.40,000 米。而南安普頓愿意將克萊因賣給利物浦,因為他們的分析團隊找到了一個數據非常相似的替代者——當時效力于里斯本競技的塞德里克·蘇亞雷斯。
還有一些關于引援和替補的研究可能有助于未來的轉會。多位學者統計了2012-2013賽季西甲所有球員的跑動數據,試圖找出跑動風格與梅西、哈維和C羅最相似的球員。
結果非常有趣。與梅西跑位最相似的球員是那個賽季效力于馬拉加的薩維奧拉。沒錯,就是巴薩俱樂部和球迷一直不愿承擔的“兔子”。最接近哈維跑動風格的是隊友蒂亞戈,他在那個賽季結束后被瓜迪奧拉帶到了拜仁,現實和數據聯系在一起。
克里斯蒂亞諾·羅納爾多跑動風格最多的球員可能會讓很多人感到驚訝:貝蒂斯的魯本·卡斯特羅。不過,卡斯特羅在過去的6年里為球隊打進了4個西甲和2個西甲賽季的122球,而他在西甲的單賽季進球數從未低于兩位數。被稱為“窮人版的羅納爾多”。
一個更驚人的故事即將到來。在與 C 羅的跑動最相似的球員中排名第二的是格列茲曼,他當時也在皇家社會效力,現在在整個歐洲都很有名。
當然,在現實世界的簽約中過于相信數據并不一定能達到點球成金的效果。利物浦曾經很看重“對方半場關鍵傳球”和“對方禁區內搶斷成功率”的統計數據。他們簽下了唐寧和查理亞當,但他們未能在安菲爾德證明自己。
作為紅軍德比對手的前任主帥,著名的“數據控”馬丁內斯對此可能有更專業的態度:“如果在德比中被要求主罰點球,他會如何反應?如果是語言不通 一個外國玩家,老婆天天喊回國,他會怎么做?玩家一般都是老公和爸爸,但是數據控制不了這個?!?/p>
所以,馬丁內斯在收到球探部門編制的簽約名單后,會先用數據過濾掉不合適的球員,然后通過谷歌、推特和臉書收集所有關于他的新聞和信息。意見,并最終決定是否要約。雖然上賽季因為戰績不佳而將工作丟給了埃弗頓,但馬丁內斯的理論已經被很多年輕教練抄襲了。
數據對團隊的幫助也可以體現在戰術安排上。 1983年在美國踢球的新英格蘭隊主教練薩姆·阿勒代斯發現,共享訓練基地的NFL球隊坦帕灣海盜隊經常使用數據分析來制定戰術,他對此產生了興趣。 Prozone一出世,他立刻成為了第一個客戶,并開始探索數據與戰術的結合。
在執教博爾頓期間,大山姆從 Prozone 訂購了一個特殊版本,并聘請了一支年輕、受過高等教育的團隊進行研究和分析,最終轉化為一種需要無球跑動和極度專注于定位的戰術件。風格。從2003年到2007年的四個賽季,他的富勒姆始終保持在英超前八,可謂是真正足壇最早的“點球”。
在大山姆組建的數據分析團隊中,三位年輕人依然活躍在英超世界,他們先后成為曼城的數據分析總監、技術球探、利物浦的轉會總監。前人種樹,其他人乘涼。年過六十的阿勒代斯不再是足球數據的引領者opta足球數據官網,但他對歐洲足球產生了深遠的影響。
今天,阿森納收購了數據分析公司StatDNA,為溫格的賽前準備、賽后分析和技戰術變革提供全面幫助。曼城組建了11人的數據部門,并與大學等研究機構簽署了多項合作協議,旨在成為“大數據時代”的引領者。
這股從英超興起的浪潮也開始席卷歐洲大陸。從拜仁到皇馬,從巴薩到尤文圖斯,基本上所有豪門近年來都建立了數據分析部門,并與各個專業廠商達成合作。協議。
幾乎在國際足聯允許球員佩戴傳感設備的同時,巴薩讓梅西在正式比賽中穿智能運動內衣,目的是為了收集心率等數據來判斷他是否在美洲杯比賽中完全康復筋疲力盡之后。
Prozone 已在 150 多個俱樂部的主場安裝了攝像頭分析系統,覆蓋了五大聯賽的大多數球隊,為他們的分析部門提供了實時的逐場比賽數據。在安聯球場,Prozone與軟件巨頭SAP合作,為拜仁提供數據定制服務。去年,該設備擴展到整個德甲。
利用這樣的數據,不僅可以監測隊員的身體健康狀況,避免不必要的傷害,還可以在判斷狀態好壞、有針對性的安排、尋找球隊等多方面為排隊提供信息。缺點。幫助。
當然,必須再次強調,數據只是輔助,主教練的決策依然是戰術世界的關鍵。
【從興趣到事業,普通人也有機會】
由于無法獲得Prozone、STATSports等公司提供的專業數據(除非你愿意花幾十萬歐元),公眾基本上只能從OPTA相關渠道或一些官方新聞中獲取部分數據。這些數據大部分來源于人工統計,對于整個比賽產生的專業數據量來說,只是滄海一粟。
這樣的滄海一粟,顯然不能代表足球的全貌,但足以滿足大眾對足球數據的好奇,作為深入了解足球的切入點。
對于球迷來說,數據是從假球迷到了解比賽的球員的途徑之一。隨著觀看次數的增加,很多人都會對比賽的走勢、無球跑位、戰術調整產生濃厚的興趣。如果你回過頭來發現“某位防守型中場上場后右路進攻比例從31%上升到57%”、“30分鐘后主隊控球率從56%下降到42%”這樣的數據”,然后想想中場完成搶斷后,第一次傳到右側,主隊開始一波猛攻,然后迅速回防。我也會對教練的陣型有所了解。
或者,在一些“意見不一”的巨魔面前,你可以拿出十幾條數據,扇他們耳光。有過這樣經歷的人,一定會明白其中的樂趣。
如果你深入研究,甚至有可能將愛好變成職業。
Prozone 在多個國家/地區設有教育基地,為普通球迷和俱樂部工作人員提供有關如何使用數據的專業培訓,并向成績優異的人頒發證書。在這個科學分析越來越流行的時代,很多數據專業人士通過這個渠道找到了進入職業足球領域的機會。
想象一下,如果你能成為俱樂部分析部的工作人員,當主教練對球隊的進攻無能為力時,你交出的報告是這樣的:球隊防守到進攻的平均速度是4.1m/s,而全聯盟的平均是6.6m/s,也許盡量給青年隊一個帶球最快的機會。
成為穆里尼奧的知己并非不可能。
你可能會覺得這樣的事情離我們很遠很遠。但實際上,廣州恒大、上海上港、杭州綠城等俱樂部已經有專人負責數據整理分析,還有“武磊下半場跑得比上半場快”,可以幫助戰術安排實際應用。起步雖晚,但未來可期。
對于媒體來說,數據是解釋、分析和總結比賽的好幫手。如今,球迷們已經不再滿足于直截了當的報道方式,對圍繞比賽進行全方位報道有了自己的顧慮和需求。在評估游戲或玩家時,數據可以為媒體人的觀點提供強有力的支持。
已經成為著名評論員的槍手球星亨利對吉魯有這樣的評價:“夠好,但還不夠好?!倍脕碜鳛樽C據的就是這些數據:吉魯的頭球是成功的。場均關鍵傳球命中率和場均關鍵傳球均在英超中鋒中名列前茅。投籃命中率和場均投籃命中率都在逐年上升,但錯失的絕對得分機會的數量也是整個英超聯賽中最高的。有理有據。
正如我在本文開頭所說,我將為您帶來新賽季歐洲足球的一些有趣的每周統計數據。在這里opta足球數據官網,我們先來介紹一些未來可能會出現,粉絲還不太了解的術語。
【答題要點及時間】
除非另有說明,以下解釋僅針對 OPTA 統計數據,可能與其他公司或組織的定義有所不同。
創造的機會:指成功傳給隊友并導致射門的傳球。最終導致進球的稱為助攻(Assist),為隊友創造射門機會但未能得分的稱為助攻。關鍵通行證。需要注意的是,只要將球成功傳給隊友,即使隊友帶球后射門,仍會被視為創造機會甚至助攻。比如下面歐洲杯英格蘭對斯洛伐克的比賽統計中,出現在本方半場的關鍵傳球,是隊友一路帶球到禁區前沿再帶球的結果。遠射。
此外,在 OPTA 目前的統計數據中,只有傳球才能導致助攻。因此,在葡萄牙歐洲杯半決賽戰勝威爾士的比賽中,羅納爾多禁區外的遠射被納尼捅入球門,不算助攻,但被算為射門偏出。但是,根據歐足聯的規定,這個球被羅納爾多算作助攻。
進攻三傳:字面意思也可以翻譯為進攻三傳。所謂進攻三區,是指將球場垂直一分為三后,距離對方球門最近的1/3區域。事實上,這種劃分方式在中國一直比較容易解釋,即后場、中場和前場。因此,包括BBC在內的媒體在其中文版中,直接將進攻三區接球點的傳球翻譯為“前鋒傳球”。
還有一點很多人不知道的是,傳中球、任意球、角球、界外球、守門員罰球、球門球這六大類不計入傳球次數。因此,像“克羅斯全場傳球次數超過 100 次”這樣的統計數據實際上并沒有包括他的邊路傳中和定位球。
平均決斗獲勝率:指贏得一對一比賽的玩家的百分比。目前,這個數據可以細分為以下四項——搶斷成功率、犯規占犯規的比例(犯規+犯規次數)、運球成功率和頭球成功率。整體對抗成功率是以上四項的成功次數與總項數之和的比值。
因此,梅西上賽季聯賽對抗成功率的計算方法如下:搶斷成功(7次)+犯規(60次)+帶球成功(117次)+頭球成功(5次) = 189,總搶斷次數(24)+總犯規次數(73)+出手次數(190)+頭球次數(14)=301,結果是189/301=62.79%。單個游戲中的數據也是如此。
鏟球:指球員在一對一鏟球中贏得對抗并拿到球或將球踢出界的行為。也就是說,如果防守隊員伸腿從運球者手中搶斷球,但刺傷了對方球員,在統計數據中不算搶斷,而是搶斷失敗。
但是,這只是 OPTA 和 FIFA 統計數據中的一個概念。在歐足聯的統計中,Tackle指的是鏟球,即“通過鏟球完成的搶斷”,因此他們在歐洲杯期間的官方數據通常只給出一場比賽中兩到三個球隊鏟球。
攔截:指防守隊員在對方傳球時阻止球傳給目標的行為。因此,將對手的傳球打出界外的防守也算作攔截。目前此數據不計入故障。
Clearance:當球員受到壓力時將球踢出防守區域或將球推出防守區域的行為。在沒有壓力的情況下破壞球只會被視為搶斷或攔截,而不是解圍。此外,如果將球直接傳給防守區內的對手,則一次解圍將被視為一次解圍失敗。
您可能已經注意到,搶斷、攔截和解圍之間的差異是微妙的,而且很容易引起爭議。當出現“這是搶斷還是清場”的問題時,如上所述,最終結果將根據收集者的投票決定。
回球:也常翻譯為“反搶”。事實上,這是一個相當籠統的概念,各方定義不同。 OPTA對此的官方解釋是“球員重新找回丟失的球或球直接回到他的控制之下”。
很難理解嗎?其實根據目前的統計,大致可以理解為:當一名球員接到傳球或運球時,對方做出防守動作但沒有形成搶斷或攔截,之后回到自己身邊短時間內丟球。
這不是更難理解嗎……好吧,用 GIF 來說明可能更簡單。讓我們仔細看看博格巴在歐錦賽揭幕戰中的兩場全場最高的 12 回合。
案例A:薩尼亞將球給博格巴,羅馬尼亞球員上前盯防,雖然皮球碰到了羅馬尼亞球員,但他沒有完成任何搶斷動作,博格巴隨后控球,算1控球權球。
案例 B:當博格巴運球時,羅馬尼亞球員進行了身體接觸,但沒有做出任何搶斷動作。然后足球擊中了球員的身體并彈出了界外。博格巴又拿到了 1 球,把球拿回來。
所以,“防盜”的翻譯可能并不準確。奪回球權并不是我們字面上理解的“被搶斷后取回”(其實這樣的情況都會分別算作搶斷),而是指“丟球后立即奪回球權”。此統計也不屬于防御類別,在主要統計網站上被歸類為進攻類別。
折磨,不是嗎?是的,由于缺乏統一嚴謹的通用標準,足球界的數據體系還存在很多爭議和誤解。但是,任何新事物的發展,都必然要經歷一個不斷更新完善的過程。足球是否會迎來“大數據時代”,讓我們共同見證。