
CDA數(shù)據(jù)分析師出品
作者:澤龍、Mika
數(shù)據(jù):真達
后期:澤龍
【導讀】
北京時間7月20日,這個賽季的西甲聯(lián)賽正式結束,最受關注的“全村的希望”武磊和他的西班牙人隊徹底告別西甲。
今天我們就用數(shù)據(jù)來聊一聊武磊。Python技術部分請直接看第二部分。
今天我們聊一聊 武磊
最近,中國足球又成為了社會的焦點話題,12分鐘跑、體能、成績成了社會人士和專業(yè)人士互懟的話題,外行懟內行基本功都不行,還玩啥,內行懟外行足球是綜合運動,你不懂。真的是熱鬧非凡,可能足球真的只分為內行和外行,完全不關心的人很少,是個看球的人都可以說自己懂足球,真是現(xiàn)實唯唯諾諾,網(wǎng)絡重拳出擊。
回到本期的主人公,中國足球第一人武磊,武球王,下賽季,武磊的去向一直占據(jù)的體育板塊的頭版頭條,幾家有中國背景的球隊都想得到武磊,商業(yè)價值的確無可比擬,看看愛奇藝西甲的收視率,武磊登場的比賽和不登場的比賽相差70%,西班牙人整體收視率可以和英超媲美了,這就是商業(yè)價值,西班牙人雖然降級,但是樂動體育可是知名度節(jié)節(jié)攀升,這筆投資性價比還是很高的。
我們抽取了皇家西班牙人足球俱樂部在18/19 19/20 2個賽季的全部比賽數(shù)據(jù),做了可視化分析,下面我們就來對應數(shù)據(jù),解讀下武磊的表現(xiàn)。
本文主要從這幾個角度展開
01數(shù)據(jù)解讀武磊
我們先來看看武磊職業(yè)生涯中的各項數(shù)據(jù)分析:
1武磊近年生涯回顧
看到武磊的生涯評分,從16年到20年,雖然成下降趨勢,但是西甲的強度和中超的強度本身是2個世界,所以說下降也是情理之中,畢竟對手和隊友都不一樣,在西甲的1.5個賽季,武磊算是高開低走,但是西班牙人更是出現(xiàn)斷崖式的下滑,所以要是對比武磊和西班牙人的下滑曲線,C君覺得這個賽季西班牙人真的配不上武磊。
2武磊身價達到1000萬歐元
看了生涯走勢,再看下身價走勢。
武磊小時候的愿望,我要值1000萬—真的實現(xiàn)了,西甲中下游球隊的主力前鋒值1000萬也算是公平公正了,雖然進球數(shù)有點刺眼,但是創(chuàng)造機會能力強。最近武磊身價下降了200萬,主要是因為西班牙人本賽季真的不給力,下賽季假如武磊可以登陸英超,估計身價可以更高。
3武磊歐洲進球曲線圖
為了更直觀的感受武磊的進球效率,我們統(tǒng)計了武磊正式比賽的進球數(shù),做了折線圖。
直觀感受是進球效率的確不高,但西班牙人的進攻效率更是低下,基本每場比賽射門更是寥寥無幾。只能說武磊不是強力中鋒,沒有能力一個人左右鋒線,他更加舒服的位置是踢二中鋒,跑位、射門,而不是護球、盤帶、過人、傳球。
4西班牙人進攻效率對比
其實也不能完全怪武磊的進攻效率,看看西班牙人的本賽季的進球數(shù),也是慘絕人寰,而且這個不光是西甲,還加入了歐聯(lián)杯的比賽,要是只看西甲,可以說西班牙人不降級都說不過去,場均也就1個球,再加上后衛(wèi)線最強的是主力門將,防守常年出問題,可以說西班牙人配的上一個降級名額。
西班牙人隊得分走勢(2018.8.19-2019.5.18)
西班牙人隊得分走勢(2019.7.27-至今)
我們對比了上賽季的西班牙人,可以明顯看出上賽季的西班牙人進攻好很多,可以達到場均2個球,而且穩(wěn)定,后防線和本賽季相差不多,但是1個球就可以決定勝負,3分和0分的差距是巨大的。
說到防守,大家可能印象中防守弱的球隊都不夠兇狠,就是平時說的踢球比較干凈,我們統(tǒng)計了犯規(guī)走勢圖,其實大體上看,和西甲平均值相差無幾,西甲本身就不是強調身體的聯(lián)賽。實際看來,西班牙人的丟球主要源于漏人和被人打反擊。西班牙人和巴塞羅那同屬一個地區(qū),其實踢球的風格也相差無幾。在球員能力嚴重不足的情況下去打全攻全守的足球,去打傳控足球無異于自殺,中場丟球被人打反擊就是本賽季西班牙人的寫照。
西班牙人的降級真的是防守問題大于進攻問題,防守才是定位于小球會的球隊立足之本。武磊的確浪費了不少機會,但每場觸球都是個位數(shù),也是挺難為武磊的,大家都在說孫興慜厲害,但是孫興慜浪費的機會、拿球的機會都要比武磊多很多,只能說他贏得了信任,拿球機會多了,形成了正向循環(huán),武磊還沒有真正贏得五大聯(lián) 賽的最重。
02數(shù)據(jù)分析步驟
我們使用Python獲取了球探體育網(wǎng)站上西班牙人的球隊數(shù)據(jù),地址:
http://zq.win007.com/cn/team/Summary/100.html
以下展示部分分析代碼:
首先導入所需包,其中pandas用于數(shù)據(jù)讀入和數(shù)據(jù)整理,pyecharts用于數(shù)據(jù)可視化分析。
import pandas as pd from pyecharts.charts import Bar, Pie, Line, Page from pyecharts import options as opts
1數(shù)據(jù)讀入
該數(shù)據(jù)包含了西班牙人球隊2013-08-20至2020-07-17日比賽數(shù)據(jù),數(shù)據(jù)預覽如下:
# 讀入數(shù)據(jù) df_4 = pd.read_excel('../data/球探體育比賽數(shù)據(jù).xlsx') # 提取日期 df_4['日期'] = df_4['時間'].str.split(' ').str[0] df_4.head()
2數(shù)據(jù)預處理
去掉友誼賽的數(shù)據(jù)并按照日期進行升序排序。
# 去掉友誼賽 df_4 = df_4[df_4['比賽']!='球會友誼'] # 排序 df_4 = df_4.sort_values('日期') df_4.shape
# 篩選時間 df_sel2 = df_4[(df_4['日期'] >= '2019-07-26')] df_sel2.head()
# 提西班牙人 主隊比分 zhudui = df_sel2[df_sel2['主隊']=='西班牙人'][['日期', '比分']] # 分數(shù) zhudui['分數(shù)'] = zhudui['比分'].str.split('-').str[0].astype('int') # 提西班牙人 客隊比分 kedui = df_sel2[df_sel2['客隊']=='西班牙人'][['日期', '比分']] # 分數(shù) kedui['分數(shù)'] = kedui['比分'].str.split('-').str[1].astype('int') # 提取日期 riqi = df_sel2[['日期']] # 合并數(shù)據(jù) riqi = pd.merge(riqi, zhudui[['日期', '分數(shù)']], on='日期', how='left') riqi = pd.merge(riqi, kedui[['日期', '分數(shù)']], on='日期', how='left') riqi.columns = ['日期', '主隊分數(shù)', '客隊分數(shù)'] # 填補空值 riqi = riqi.fillna(0) # 分數(shù)相加 riqi['分數(shù)'] = riqi['主隊分數(shù)'] + riqi['客隊分數(shù)'] riqi.head()
# 產生數(shù)據(jù) x_data = riqi['日期'].values.tolist() y_data = riqi['分數(shù)'].values.tolist() # 折線圖 line5 = Line(init_opts=opts.InitOpts(width='1350px', height='750px')) line5.add_xaxis(x_data) line5.add_yaxis('', y_data, label_opts=opts.LabelOpts(is_show=False), markpoint_opts=opts.MarkPointOpts(data=[opts.MarkPointItem(type_="min"), opts.MarkPointItem(type_="max"),]), ) line5.set_global_opts(title_opts=opts.TitleOpts(title='西班牙球隊得分走勢(2019.07.26-至今)'), xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate='45'), axisline_opts=opts.AxisLineOpts(is_on_zero=False), ), yaxis_opts=opts.AxisOpts(max_=10, min_=-1, name="", type_="value", axislabel_opts=opts.LabelOpts(formatter="{value}"), splitline_opts=opts.SplitLineOpts(is_show=False), ) ) line5.set_series_opts(linestyle_opts=opts.LineStyleOpts(width=3, color='#4169E1')) line5.render()
# 計算得分 score_num = riqi['分數(shù)'].value_counts() # 產生數(shù)據(jù) data_pair = [list(z) for z in zip([str(i) + '分'for i in score_num.index], score_num.values.tolist())] # 繪制餅圖 pie5 = Pie(init_opts=opts.InitOpts(width='1350px', height='750px')) pie5.add('', data_pair, radius=['35%', '60%']) pie5.set_global_opts(title_opts=opts.TitleOpts(title='西班牙球隊得分分布(2019.07.26-至今)'), legend_opts=opts.LegendOpts(orient='vertical', pos_top='15%', pos_left='2%')) pie5.set_series_opts(label_opts=opts.LabelOpts(formatter=": {c} \n占比(geybsqlxm7mc%)")) pie5.set_colors(['#EF9050', '#3B7BA9', '#6FB27C', '#FFAF34', '#D8BFD8', '#00BFFF', '#7FFFAA']) pie5.render()
3.3 賽季 2019-07-26 - 今 西班牙球隊犯規(guī) 黃牌 紅牌
# 篩選時間 df_sel2 = df_4[(df_4['日期'] >= '2019-07-26')] # 產生數(shù)據(jù) x_data = df_sel2['日期'].values.tolist() y_data1 = df_sel2['犯規(guī)'].values.tolist() y_data2 = df_sel2['黃牌'].values.tolist() y_data3 = df_sel2['紅牌'].values.tolist()
# 折線圖 line6 = Line(init_opts=opts.InitOpts(width='1350px', height='750px')) line6.add_xaxis(x_data) line6.add_yaxis('犯規(guī)', y_data1, markpoint_opts=opts.MarkPointOpts(data=[ opts.MarkPointItem(type_='max', name='最大值'), opts.MarkPointItem(type_='min', name='最小值') ])) line6.add_yaxis('黃牌', y_data2, markpoint_opts=opts.MarkPointOpts(data=[ opts.MarkPointItem(type_='max', name='最大值'), opts.MarkPointItem(type_='min', name='最小值') ])) line6.add_yaxis('紅牌', y_data3, markpoint_opts=opts.MarkPointOpts(data=[ opts.MarkPointItem(type_='max', name='最大值'), opts.MarkPointItem(type_='min', name='最小值') ])) line6.set_global_opts(title_opts=opts.TitleOpts(title='西班牙球隊犯規(guī)-黃牌-紅牌走勢圖(2019.07.26-至今)'), xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate='45'), axisline_opts=opts.AxisLineOpts(is_on_zero=False)), yaxis_opts=opts.AxisOpts(max_=30, min_=0, name="", type_="value", axislabel_opts=opts.LabelOpts(formatter="{value}"), splitline_opts=opts.SplitLineOpts(is_show=False), ) ) line6.set_series_opts(label_opts=opts.LabelOpts(is_show=False), linestyle_opts=opts.LineStyleOpts(width=3) ) line6.render()
結語
本賽季,到底是武磊配不上西班牙人,還是西班牙人配不上武磊,這個還是留給大家去評判,可以留言給我們,說出你的觀點。
如果還想看任何體育相關的數(shù)據(jù)分析
同樣請給我們留言吧
我們立刻安排上!
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03