
CDA數(shù)據(jù)分析師 出品
作者:CDALevel Ⅰ持證人
崗位:數(shù)據(jù)分析師
行業(yè):大數(shù)據(jù)
背景
電子商務(wù)行業(yè)在近幾年發(fā)展得極為迅猛,很多在傳統(tǒng)行業(yè)就業(yè)但是薪資不理想的都在網(wǎng)電子商務(wù)行業(yè)去轉(zhuǎn)。這種趨勢造就了越來越多老百姓使用電子商務(wù)價值下的產(chǎn)品,不言而喻,比如網(wǎng)購等行為。換句話說,大量的網(wǎng)購會帶來的結(jié)果就是數(shù)據(jù)量的增大。面對這種大數(shù)據(jù),且時非結(jié)構(gòu)化的數(shù)據(jù)如商品評論,怎么處理呢?怎么從中提取有用的信息呢?自然語言處理技術(shù)給出了答案,從規(guī)則提取到統(tǒng)計建模到如今非常火熱的深度學(xué)習(xí),都能從文本中提取到有用的商業(yè)價值,無論時為商家還是買家。本文就某電商平臺上AirPods智能耳機產(chǎn)品的售賣情況及相關(guān)商品信息進行情感分析與快速詞云圖搭建。情感分析也是自然語言處理中的一個方向
除了對文本進行挖掘以外,本文還欲搭建一個網(wǎng)頁APP。Python是目前比較流行的編程語言,利用Python搭建一個網(wǎng)頁APP常用的是Python結(jié)合Flask或者Django框架來貫穿前后端來搭建網(wǎng)頁。利用這個方法一般需要一定的前端經(jīng)驗,來修改CSS、HTML、JAVASCRIPT這些文件。而對于沒有前端經(jīng)驗的coder,讀者這里推薦一款友好的全程基于Python的庫streamlit,也就是本文所用到的庫。利用streamlit可以輕松快速的搭建一個網(wǎng)頁APP,再加入文本挖掘功能。這樣,就做出了一個小產(chǎn)品。下面,進入正題。
本文采用Anaconda進行Python編譯,主要涉及的Python模塊:
本章分為三部分講解:
1.數(shù)據(jù)探索性分析與商品評論文本提取
3.網(wǎng)頁結(jié)構(gòu)設(shè)計與實現(xiàn)
4.功能整合與效果呈現(xiàn)
本文采取的數(shù)據(jù)為某寧電商平臺上的商品評論數(shù)據(jù)。數(shù)據(jù)字段有商品標(biāo)題、價格、評價內(nèi)容。其中,價格為近期4月份的實時價格。評價內(nèi)容是按時間順序從近到遠的展現(xiàn)。下面為前五行的展示:
需要注意的是,上面五行顯示的是AirPods第2代的商品信息。原因是數(shù)據(jù)原本分為3張表,每張表的字段都是一樣的,總共3個,2個維度字段和1個度量字段(這個在CDA I課程中的數(shù)據(jù)結(jié)構(gòu)會有提及)。因此,這份數(shù)據(jù)是3張表通過縱向合并方式對記錄進行拼接。最后生成的Index是新表生成的主鍵。
接著可以對數(shù)據(jù)進行適當(dāng)?shù)奶剿餍苑治?,首先?xí)慣性的觀察數(shù)據(jù)形狀、數(shù)據(jù)類型以及有沒有缺失值、異常值、重復(fù)值。缺失值利用pandas庫的isnull().sum()函數(shù)即可查閱。重復(fù)值利用duplicated().sum()即可。而重復(fù)由于本文探索的是商品評論文本且數(shù)據(jù)量較少,因此本文忽略不做。下面為各部分結(jié)果
數(shù)據(jù)形狀為(1020,3),這很好理解,就是1020條記錄行,3個字段。數(shù)據(jù)類型利用info()函數(shù)即可,結(jié)果如下:
上面結(jié)果解析:Non-NULL Count為各個字段的非空數(shù)值和??梢钥吹?,評價內(nèi)容這個維度字段有2個空值。右邊Dtype表明三個字段都是字符串object類型。memory usage為這張上商品信息表格的占用字節(jié)空間,有24kb。這里額外提醒一下,如果一張表格有5G以上,也就是Excel軟件都較難打開時,可以換一種實現(xiàn)方式,使用dask庫,是一種分布式的數(shù)據(jù)處理package。
從上圖info信息中可以知道,這張商品信息表的空處有2個,也就是缺失值為2。而重復(fù)值計算得到為19個。接下來就是解決缺失值和重復(fù)值的方法,考慮到重復(fù)值多次出現(xiàn)會影響到后續(xù)詞頻統(tǒng)計的結(jié)果,本文考慮將重復(fù)值剔除。而缺失值會影響后面對評價內(nèi)容分詞的步驟,因此這里選擇用空格進行替換。整段代碼如下,剛開始轉(zhuǎn)用Python的小伙伴可以牢記這段代碼,這幾乎是每次數(shù)據(jù)分析必用的。
import pandas as pd # 讀取數(shù)據(jù) df = pd.read_excel('蘇寧易購_airpods系列.xlsx')
df.isnull().sum() # 缺失值匯總 df.duplicated().sum() # 重復(fù)值匯總 df.info() # 表格信息abstract df.dtypes #數(shù)據(jù)類型 df['評價內(nèi)容'] = df['評價內(nèi)容'].fillna(' ') # 空格填充 df = df.drop_duplicates() # 剔除重復(fù)值
在3個字段中,最需要提取的是評價內(nèi)容,因為本文的目的是建立一個商品評論文本信息挖掘系統(tǒng),功能包括情感分析、詞云圖可視化。而每個用戶ID的評價內(nèi)容都是不一致的,因此,需要去做聚合運算。整合所有評價內(nèi)容,同時去除停用詞,最后形成一句話,雖然這句話是不通順,但是對后面的詞頻統(tǒng)計沒有影響。
整合評價內(nèi)容采用Python的內(nèi)置函數(shù)split()完成,首先利用Pandas庫中的tolist()函數(shù)將評價內(nèi)容字段的記錄變?yōu)橐粋€列表,接著將列表轉(zhuǎn)換為字符串,這里需要用到split()函數(shù)完成。以空格字符串作為連接符,連接列表里的每一個元素。最終形成的效果截取一部分如下:
之后就是去除停用詞,停用詞無論是中文NLP任務(wù)還是英文NLP任務(wù),都需要用到這一步。這一步不僅可以去除大部分噪音,同時也能節(jié)省計算資源,更加高效。去除停用詞的算法其實很簡單,就是遍歷需要做統(tǒng)計挖掘的文本,如果文本中有單詞是屬于指定的停用詞的,就剔除。顯然,這里就需要停用詞庫,停用詞庫有很多,有百度的停用詞表、有哈工大停用詞表、有四川大學(xué)機器智能實驗室停用表等。本文選擇哈工大停用詞表,因為此表相較于其他表有對電子商務(wù)領(lǐng)域較好的單詞。讀者若是想做一個理想的項目,可以考慮自建電子商務(wù)領(lǐng)域的停用詞表。
去除停用詞具體的代碼及做法將在情感分析處講解。
上一部分我們提取了商品信息表格中的每個ID的商品評價內(nèi)容,同時對其整合進行去停用詞,得到了一份干凈的txt數(shù)據(jù)集。接下來就可以進行文本挖掘的事情了。首先是商品評論詞云圖構(gòu)建。
在Python中詞云圖構(gòu)建的庫有很多,常用的就是Wordcloud標(biāo)準(zhǔn)的詞云圖可視化庫,還有pyecharts的詞云圖API。前者在構(gòu)建詞云圖時,新手使用者往往會出現(xiàn)一大堆問題,比如pip安裝失敗、編碼錯誤、字體使用錯誤等,除此之外,其使用難度其實也是蠻大的。而后者則是常用于瀏覽器上的交互式圖表,其以代碼量,封裝性高所出名,聽起來是比較切合本文這個主題的,但是本文卻沒有考慮,原因是后面所用到的網(wǎng)頁開發(fā)庫streamlit要顯示交互式圖表通常不用pyecharts。
因此,這里本文引出新興的詞云圖可視化庫stylecloud,這個庫是基于wordcloud的。運用這個庫,新手可以以最少的代碼量畫出各色各樣的詞云圖,支持形狀設(shè)置。話不多說,直接上代碼:
start = time.time() #記錄初始時間 # 先在內(nèi)部畫出詞云圖并保存到image文件夾 stop_words = open('哈工大停用詞表.txt','r',encoding='utf8').readlines() # 讀取停用詞 stylecloud.gen_stylecloud(text=txt, collocations=True, # 是否包括兩個單詞的搭配(二字組) font_path=r'?C:WindowsFontssimkai.ttf', # 指定字體 icon_name='fab fa-jedi-order',size=(2000,2000), # 指定樣式 output_name=r'img詞云圖.png', #指定輸出圖像文件路徑 custom_stopwords=stop_words) # 指定停用詞表 end = time.time() # 記錄結(jié)束時間 spend = end-start # 畫圖時間總長
代碼解析:
首先引入stylecloud庫,而后使用.gen_stylecloud()對象來初始化畫圖對象(類)。
除此之外,本文還設(shè)置了時間間隔,因為眾說周知詞云圖的刻畫需要較長時間,如果文本較長,一分鐘也有可能。所以加上時間的概念,對使用者進行數(shù)據(jù)調(diào)入也會友好一些。
這樣,我們就構(gòu)建好了詞云圖,將在下一部分網(wǎng)頁端應(yīng)用,這里以Airpods第二代舉例,先上效果圖
詞云圖構(gòu)建完以后就是輪到情感分析,對干凈的商品評論信息做情感分析是非常有用的。對商家而言可以清楚知道買方使用此產(chǎn)品的感覺與評價,以便后面優(yōu)化產(chǎn)品,而對想要買此產(chǎn)品的人更加有借鑒。本文將對AirPods商品評論進行情感詞正負(fù)情感詞統(tǒng)計。
利用到的庫是cnsenti,這個庫是中文情感分析庫。在NLP任務(wù)領(lǐng)域中,大多庫與例子都是英文的,因此這個中文庫對于經(jīng)常對中文文本進行挖掘的人是個好消息!
首先先介紹下這個庫把吧,cnsenti模塊中分為兩大部分,一個是本文用到的情感分析對象Sentiment,另一個是沒有用到的情緒分析對象Emotion。情感分析使用的詞典是知網(wǎng)Hownet,支持自定義。情緒分析使用的是大連理工大學(xué)情感本體庫,可以計算文本中的七大情緒詞分布。由于本文只使用情感分析對象類,因此感興趣的讀者可以自行學(xué)習(xí)情緒分析類。
對AirPods商品評論信息進行情感分析,在默認(rèn)條件下,只用2句代碼即可。是的,就是那么方便!
senti = Sentiment() result = senti.sentiment_count(txt)
txt為我們的目標(biāo)文本,首先需要調(diào)用情感分析類Sentiment(),如果不設(shè)置任何參數(shù),即表明以默認(rèn)條件初始化。接著使用sentiment_count()函數(shù)計算正負(fù)情感詞統(tǒng)計,以AirPods第二代舉例,實現(xiàn)結(jié)果如下:
上面結(jié)果說明:總共單詞有18128個,句子有625句。積極的情感詞語有2221,消極的情感詞語有322個。
在情感分析類中,除了sentiment_count()函數(shù),還有sentiment_calculate()函數(shù),有什么區(qū)別呢?這個可更加精準(zhǔn)的計算文本的情感信息。相比于sentiment_count只統(tǒng)計文本正負(fù)情感詞個數(shù),sentiment_calculate還考慮了情感詞前后是否強度副詞去修飾,情感詞前后是否有否定詞的情感語義反轉(zhuǎn)作用。同樣以AirPods產(chǎn)品舉例,使用這個函數(shù),得到的結(jié)果為
可以看到,識別出來的積極詞匯應(yīng)該是使用了加權(quán)的手段將頻率升維到數(shù)值。
接下來就是網(wǎng)頁結(jié)構(gòu)設(shè)計,做網(wǎng)頁首先就是構(gòu)造出一個思路圖,確定功能是什么,有哪些控件,控件擺放位置如何。對于功能,本文的主題是商品評論信息文本挖掘,先對商品評論初始文本進行整合于去停用詞。而后利用stylecloud庫進行詞云圖構(gòu)建,最后進行情感分析。除此之外,作者還希望完成一下功能:
確定功能就是以上這些了。通過上面的功能,本文可以確定有哪寫控件:
按照常規(guī)的網(wǎng)頁構(gòu)建,控件位置的空間擺設(shè)是一定要設(shè)計的。但是對于新手來說,接下來講的超級web app建設(shè)streamlit則不需要考慮了。
streamlit的官方(https://streamlit.io/)簡介如下:
以最快的方式建立于分享數(shù)據(jù)app,將數(shù)據(jù)顯示在可分享的web app上,以python編程語言實現(xiàn),無需前端經(jīng)驗。Streamlit是第一個專門針對機器學(xué)習(xí)和數(shù)據(jù)科學(xué)團隊的應(yīng)用程序開發(fā)框架,它是開發(fā)自定義機器學(xué)習(xí)工具的最快的方法,可以幫助機器學(xué)習(xí)工程師快速開發(fā)用戶交互工具。同時它是基于tornado框架,封裝了大量互動組件,同時也支持大量表格、圖表、數(shù)據(jù)表等對象的渲染,并且支持柵格化響應(yīng)式布局。Streamlit的默認(rèn)渲染語言就是markdown;除此以外,Streamlit也支持html文本的渲染,這意味著你也可以將任何html代碼嵌入到streamlit應(yīng)用里。
讀者可能會疑惑做網(wǎng)站,以為前后端都用Python+streamlit是一件普通的事情。其實不然,在streamlit建立之前,web creator with python一般采用的是前端使用html、css、JavaScript,后端使用python、Flask、Django。如果不用Python,則是前后端都使用D3。
因此,本文所使用的Python+streamlit前后端貫穿創(chuàng)建web app對新手是多么的友好!
接著,先展示streamlit的快速使用方法:
首先pip install streamlit安裝這個庫,而后在命令行輸入streamlit hello。這時會彈出一個窗口,這個是內(nèi)置的打開幫助文檔,里面有各種實例,下面為一部分截圖:
首先是,記錄著幫助信息的頁面,里面存放著各種連接
而后在下拉框選擇plotting demo,點擊后顯示如下:
這是一個加載了記錄條的畫圖程序,可以是交互式的。
綜上,就可以發(fā)現(xiàn),運行streamlit不是在anaconda等python編譯器里面運行的,而是在命令框cmd中輸入streamlit run .py文件來運行程序的。
有興趣的讀者可以多泡一下streamlit的官網(wǎng),可以學(xué)習(xí)到很多東西。
最后就是本文的web app構(gòu)建與功能整合部分。先上代碼
import streamlit as st import pandas as pd from cnsenti import Sentiment import stylecloud import time
st.title('AirPods智能耳機商品評論分析系統(tǒng)')
st.markdown('這個數(shù)據(jù)分析系統(tǒng)將以可視化形式挖掘某電商公司下蘋果三種AirPods型號的商品評論信息')
st.markdown('Apple AirPods是蘋果品牌的無線耳機。目前有市場上銷售主流是3中機型:**AirPods2代**、**Airpods pro**、**AirPods三代**。這款耳機的主要特點是:耳機內(nèi)置紅外傳感器能夠自動識別耳機是否在耳朵當(dāng)中進行自動播放,通過雙擊可以控制Siri控制。帶上耳機自動播放音樂,波束的麥克風(fēng)效果更好,雙擊耳機開啟Siri,充電盒支持長時間續(xù)航,連接非常簡單,只需要打開就可以讓iPhone自動識別。')
st.sidebar.title('數(shù)據(jù)分析系統(tǒng)控件')
st.sidebar.markdown('選擇一款型號/可視化類型:')
DATA_URL=('蘇寧易購_airpods系列.xlsx') # @st.cache(persist=True) #如果只有一份數(shù)據(jù),就可以用這個持久化,加快效率 def load_data(): data=pd.read_excel(DATA_URL) return data
df = load_data()
df['評價內(nèi)容'] = df['評價內(nèi)容'].fillna(' ') # 填充缺失值 select = st.sidebar.selectbox('選擇一款型號',df['商品標(biāo)題'].unique()) # 在下拉框中得到選擇的型號值 state_data = df[df['商品標(biāo)題'] == select] # 創(chuàng)建單項按鈕選項值 select_status = st.sidebar.radio("可視化類型", ('表結(jié)構(gòu)數(shù)據(jù)','文本挖掘')) if select_status == '表結(jié)構(gòu)數(shù)據(jù)':
st.text('該電商公司近期售賣產(chǎn)品的相關(guān)數(shù)據(jù)(以表結(jié)構(gòu)化顯示)')
st.dataframe(state_data) if select_status == '評論可視化': # 判斷商品正負(fù)情感值 txt_list = state_data['評價內(nèi)容'].tolist()
txt = ' '.join(txt_list)
senti = Sentiment()
result = senti.sentiment_count(txt)
start = time.time() # 先在內(nèi)部畫出詞云圖并保存到image文件夾 stop_words = open('哈工大停用詞表.txt','r',encoding='utf8').readlines()
stylecloud.gen_stylecloud(text=txt, collocations=True,
font_path=r'?C:WindowsFontssimkai.ttf',
icon_name='fab fa-jedi-order',size=(2000,2000),
output_name=r'img詞云圖.png',
custom_stopwords=stop_words)
end = time.time()
spend = end-start # 顯示情感正負(fù)值在網(wǎng)頁端 if result['pos'] > result['neg']:
st.markdown("#### 該商品的正負(fù)情感值比為{}:{},呈積極信號".format(result['pos'],result['neg'])) if result['pos'] < result['neg']:
st.markdown("#### 該商品的正負(fù)情感值比為{}:{},呈消極信號".format(result['pos'],result['neg'])) # 顯示詞云圖 st.image(r'img詞云圖.png',caption = '詞云圖')
st.text('運行時長:{} s'.format(spend))
代碼解析:
首先引入包之后的前五行,是設(shè)置這個web app的標(biāo)題,為AirPods智能耳機商品評論分析系統(tǒng)。然后下面為記錄該程序的簡要信息作為副標(biāo)題。同時存儲一些AirPods這款蘋果公司旗下的智能手機簡介與它的功能獨特之處。除此之外,st.sidebar()這個函數(shù)是將目標(biāo)從主頁面轉(zhuǎn)到側(cè)邊欄中,在側(cè)邊欄填入需要填入的信息。
之后就是第一部分講解的加載數(shù)據(jù)、數(shù)據(jù)探索性分析,去除重復(fù)值,填充缺失值等操作。
select = st.sidebar.selectbox('選擇一款型號',df['商品標(biāo)題'].unique())這句話就是將商品信息表中的去重商品標(biāo)題,即AirPods三代的機型作為下拉框單選選擇的值。選擇這個值后,就可以利用pandas進行條件篩選,最后用st.dataframe()函數(shù)將這個表結(jié)構(gòu)類型進行顯示。
select_status = st.sidebar.radio("可視化類型", ('表結(jié)構(gòu)數(shù)據(jù)','文本挖掘'))代表的是設(shè)置單選選擇按鈕的值,即主頁面顯示哪種頁面,是表格類型數(shù)據(jù),還是文本挖掘結(jié)果:詞云圖與情感分析結(jié)果。
if語句的設(shè)定如下:根據(jù)state_data結(jié)果,抽取的數(shù)據(jù)為為AirPods三代中的一代,那么記下來主頁顯示的表格數(shù)據(jù)類型或是情感分析都是基于這一代機型的相關(guān)商品信息。接著if語句是判定select_status是表結(jié)構(gòu)數(shù)據(jù)還是文本挖掘,因為在本文的初始設(shè)定中,主頁面上是只顯示兩種可視化的。
而后一個if語句時提供給文本挖掘,也即情感分析用的。在第二部分中有講到,本文時計算正負(fù)情感詞的比例。如果正面情感詞(積極情感詞匯),則運行st.markdown("#### 該商品的正負(fù)情感值比為{}:{},呈積極信號".format(result['pos'],result['neg'])),顯示積極信號。反之,為消極信號。
這里有一個time模塊引用,這個引用時計算詞云圖構(gòu)建的時間,大約在30s左右。這種性能測試與評估在工作中也是經(jīng)常用到,因為工作中的數(shù)據(jù)可不像本文實例中的大小一般。
詞云圖構(gòu)建的代碼在第二部分也提及到,這里直接嵌入到里面即可。同時利用st.image函數(shù)進行本地圖片讀取與顯示。
除此之外,streamlit還有一個友好的點就是,可以支持寫markdown代碼,上面的文本控件大部分都是用markdown編寫,常使用markdown的讀者可以研究一波。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10