
在運營中,為什么文本分析遠比數(shù)值型分析重要?一個實際案例,五點分析(下)
本文是《數(shù)據(jù)分析中,文本分析遠比數(shù)值型分析重要!》的下篇,以一個實際案例來聊聊文本分析在實際運營中如何落地。行為脈絡(luò)如下:先簡要講述文本分析的分支—情緒分析的基本原理,然后以亞馬遜的Kindle Voyage的用戶評論作為“情緒分析”的實操分析,最后羅列了幾個實用的文本分析工具,以期對大家有所幫助。
在大數(shù)據(jù)時代還未來臨前,企業(yè)一般根據(jù)自身積累的歷史數(shù)據(jù),以及一線運營人員的主觀經(jīng)驗來猜測用戶接下來的反應(yīng),以此作為制定后續(xù)營銷、運營方案的依據(jù)。
然而,在這個VUCA時代(寶潔公司首席運營官Robert McDonald借用一個軍事術(shù)語來描述這一新的商業(yè)世界格局,即volatility,易變性;uncertainty,不確定性;complexity,復(fù)雜性;ambiguity,模糊性),商業(yè)場景的變化速度和復(fù)雜程度今非昔比,用戶的喜好也容易受外界“場景”的影響,就如“孩子的臉”和“六月的天”一樣善變,先前積累的經(jīng)驗往往不足以作為企業(yè)下一階段進行市場謀劃和運營的依據(jù)。
VUCA時代的特征
根據(jù)《數(shù)據(jù)運營|數(shù)據(jù)分析中,文本分析遠比數(shù)值型分析重要?。ㄉ希返姆治?,我們可知,大數(shù)據(jù)文本分析正是應(yīng)對上述困局的一劑良方。
(一)
接下來,我們將從理論到實踐,聊聊文本分析是如何應(yīng)用在商業(yè)實踐中的。
借助基于大數(shù)據(jù)的文本分析,我們可以對用戶行為和想法進行科學(xué)分析,使用戶洞察由原來的主觀“猜測”轉(zhuǎn)變?yōu)橐詳?shù)據(jù)為驅(qū)動的精準預(yù)測。在新產(chǎn)品上市前,或者是小規(guī)模投放市場后,在社交媒體上對粉絲和潛在用戶的言論進行收集,對其進行文本分析,知道他們喜歡產(chǎn)品的哪些方面,對哪些方面不太滿意,以及他們對產(chǎn)品的其他期望,從而敏捷、快速、準確的對用戶的反饋做出積極的回應(yīng)。
由此可見,有文本分析介入的產(chǎn)品運營流程被“重構(gòu)”了,如下圖所示。
有文本分析參與的運營分析邏輯流程
其中,對用戶言論進行文本分析的“精髓”在于對提煉出的文本數(shù)據(jù)的所表達出的“情緒”的解讀,也就是用戶言論的情緒分析。
在理解文本分析語境下的“情緒分析”前,我們先看看它的一般含義。
先說“情緒”?!扒榫w”這個詞,在心理學(xué)中的一般含義是:對一系列主觀認知經(jīng)驗的通稱,是多種感覺、思想和行為綜合產(chǎn)生的心理和生理狀態(tài)。我們?nèi)粘V凶钇毡榈那榫w就是喜、怒、憂、思、悲、恐、驚,也就是中醫(yī)中所說的“七情”。
那么,“情緒分析”就是有效且準確的識別這些具體的情緒,根據(jù)得到的結(jié)果,進一步對產(chǎn)生于自身或者他人的情緒采取合理的應(yīng)對措施(如疏導(dǎo)自身消極情緒、理解他人的反常行為等)。
與此類似,基于大數(shù)據(jù)文本數(shù)據(jù)的“情緒分析”,也被業(yè)界稱為“觀點挖掘”,它利用多樣化、海量的社會化媒體做客服,借助數(shù)量龐大的社交網(wǎng)絡(luò)平衡語料和新聞平衡語料的機器學(xué)習(xí)模型,對所獲取文本中的情感傾向和評價對象進行提取,使運營者更全面、更深入地了解用戶的“心聲”,掌握用戶對于產(chǎn)品的喜好程度,及用戶視角下的產(chǎn)品優(yōu)缺點。
值得注意的是,基于大數(shù)據(jù)文本的情緒分析在于深度分析評論的意義(評論的是事物的哪些方面)以及附帶的情緒傾向(是“褒”是“貶”,還是“中立”),而不是評論本身在說的文字。
下面,筆者將以基于亞馬遜上Kindle Voyage商品評論的文本數(shù)據(jù)為例,來聊聊文本數(shù)據(jù)的情緒分析在商業(yè)實踐中的運用。
現(xiàn)在,筆者以亞馬遜官網(wǎng)2014年9月份在其平臺上發(fā)售的Kindle Voyage電子書閱讀器珍藏限量為例,對其商品評論區(qū)的用戶評論進行基于文本數(shù)據(jù)的“情緒分析”,看看我們能從中得到哪些有價值的insight,以便優(yōu)化我們的運營工作。
亞馬遜官網(wǎng)上Kindle Voyage電子書閱讀器的商品詳情頁
分析時間段:2014.12.01~2015.06.23
數(shù)據(jù)來源:亞馬遜官網(wǎng)上Kindle Voyage電子書閱讀器商品評論區(qū)
意見領(lǐng)袖總數(shù)(評價者):1675人
原始評價:2720條
詳細評價信息(包括對評價的“回應(yīng)”,即評價的評價,如此循環(huán)):4659條
亞馬遜Kindle Voyage電子書閱讀器珍藏限量版評論區(qū)
(二)
筆者將從以下5個方面,即用戶聚焦點分析、用戶反饋趨勢分析、用戶情緒分析、用戶反饋分析,以及各地域用戶評級分布及情緒分析,對Kindle Voyage亞馬遜商品評論區(qū)的4659條用戶留言/評論進行文本分析。
對Kindle Voyage用戶評論進行文本分析的幾大模塊
大數(shù)據(jù)文本分析中的“典型意見”是指,將用戶的意見進行單據(jù)級別的語義聚合,將內(nèi)涵相近但表述有差異的意見/看法聚合在一起,抽取出其中典型的用戶反饋/意見,在短時間內(nèi)迅速梳理出用戶對于產(chǎn)品所關(guān)注的話題。
用戶評論的典型意見分析
從上圖可以看出,通過對這些用戶留言的典型意見進行分析,再結(jié)合Kindle Voyage的商品詳情描述,我們可以了解到用戶對于Kindle Voyage的評價主要集中在以下7個方面:
捆綁銷售策略(話題1)
限量發(fā)售策略(話題2)
屏幕顯示效果(話題3)
原裝配套皮套(話題4)
與其“同族兄弟”kindle Paper White的比較(話題5)
屏幕的亮度自動調(diào)節(jié)功能(話題6、話題7)
售后客服評價(話題8)
關(guān)于用戶對這些話題的具體評價和情緒感受,我們需要做進一步的分析。
用戶反饋趨勢分析曲線展現(xiàn)了文本數(shù)據(jù)量在時間上的分布情況,可以從宏觀上掌握上述8個話題所對應(yīng)評論(量)的發(fā)展走勢,以便做好及時跟進,發(fā)掘出其中有價值的言論。
下圖中,從下至上,依次是話題1到話題8的評論數(shù)量隨時間變化的增減趨勢。其中,評論量的大小以圖形面積的大小來呈現(xiàn)。
用戶評論量隨時間軸的變化趨勢
可以看到,這些話題的發(fā)布數(shù)量的增減走勢基本相同,且在2015-3-1達到評論高峰,2016-1-25達到小高峰,這兩個時間點的前后數(shù)天的購買人數(shù)激增。然而在2016-4-24這一天商品評論區(qū)的總體評論量驟然減少,對于這幾個異常點,運營人員可以調(diào)出對于日期的銷售記錄、商品維護日志等資料找出原因,以便對癥下藥,做好后續(xù)的運營工作。
這部分包含2個模塊,即用戶評價和情緒分析,二者存在一定的正相關(guān)關(guān)系,也就是說,用戶評價較高,相應(yīng)的情緒偏正面,反正亦然。
(1)用戶評價分析
用戶評價星級占比圖
從上面2個圖可知,超過63%的用戶對于Kindle Voyage的產(chǎn)品性能是非常滿意的,給出了5顆星的評價;次之的四顆星評價占到19.15%的比重,以上二者比重之和超過80%,可知Kindle Voyage總體的市場反饋非常不錯。
(2)用戶總體情緒傾向分析
用戶的情感度分布
上圖是用戶對于Kindle Voyage總體情感的儀表盤,是根據(jù)用戶對于Kindle Voyage的文字評論進行情緒傾向分析得出的,能反映消費者對于Kindle Voyage總體態(tài)度是肯定還是否定。該儀表盤分為3個大的方向,即負面情緒、中性情緒和正面情緒,其中暗含的用戶態(tài)度就是對產(chǎn)品不滿意、產(chǎn)品一般和產(chǎn)品很不錯。
從上面2個圖可以看出,購買者對于Kindle Voyage以中性評論為主,情感正面值為1.06,總體情感偏向于正面,說明大家對Kindle Voyage的真實看法與評價星級總體傾向是一致的,沒有言不由衷。
上面的是全體用戶對于Kindle Voyage的總體情緒傾向,但在很多時候,我們想要知道哪些用戶的“發(fā)聲”在這些評論中更具代表性。這就需要分析引擎在語義層面上對每個用戶進行重要性排名,從中發(fā)掘出有“話語權(quán)重”較大的“意見領(lǐng)袖”。
更進一步,我們要對其中單個用戶的情緒態(tài)度、評價和所關(guān)注的產(chǎn)品方面進行分析,這就涉及到以單個用戶為主體的情緒傾向分析了。
以下2個圖分別關(guān)注的是意見領(lǐng)袖(用戶)情緒分析總覽和單個意見領(lǐng)袖(用戶)的詳細情緒分析。從中我們可以看到評論用戶的名稱、評論的數(shù)量、情緒是屬性及相應(yīng)的情緒數(shù)值。
用戶(意見領(lǐng)袖)情緒分析總覽
如果我們想對某個重要用戶的情緒進行詳細分析,我們可以點開這個用戶的詳細資料,進行深入的分析。如下圖所示:
單個意見領(lǐng)袖(用戶)的詳細情緒分析
從上圖中我們可以了解到為什么該用戶對Kindle Voyage持正面態(tài)度(正面情緒用紅色顯示)了—下面的正面關(guān)鍵詞云顯示出該用戶對Kindle Voyage的手感、屏幕顯示和做工質(zhì)量很滿意。此外,在“焦點概覽”里,我們可以了解到類似的評論有8條,在哪個時間節(jié)點達到峰值。
在進行上述分析后,我們還需要進一步讀懂評論區(qū)的全體用戶對Kindle Voyage的反饋,知道用戶喜歡它的哪些方面,對哪些方面還不是太滿意,以及這些(不)滿意的方面的程度如何,這是“情緒分析”中的重中之重。
所以,我們需要進行下一步分析——用戶反饋分析。
這部分的原理是,從眾多用戶評論中提取出跟產(chǎn)品屬性相關(guān)且有代表性的關(guān)鍵詞,并進行相似文本聚類,然后給出相應(yīng)權(quán)重,最后匹配相應(yīng)的情緒屬性和情緒值。最終的結(jié)果使得運營者擁有了用戶視角,知曉產(chǎn)品有哪些地方表現(xiàn)尚可,哪些地方反映平平,而哪些地方是需要進行改進和完善的。
下圖是用戶對于Kindle Voyage使用后的評論中提取并聚類的關(guān)鍵詞云,其中文字大小代表該詞的權(quán)重(重要程度和詞頻),字體顏色表明該詞的情緒偏向(紅色是正面評價,灰色是中性評價,藍色是負面評價)。
用戶的對于Kindle Voyage評論的主要關(guān)注點
根據(jù)關(guān)鍵詞及其重要程度排名,筆者找到了用戶滿意的幾個方面:
屏幕顯示效果良好,這一點用戶很是認可,“顯示效果”、“分辨率高”、“看著舒服”、“字跡清晰”等關(guān)鍵詞顯示較大,此類評價的用戶居多;字體為紅色,表明用戶反映的情感正面積極。
產(chǎn)品(及周邊)質(zhì)量不錯,體現(xiàn)在“做工精細”、“續(xù)航能力”、“原裝皮套”、“值得擁有”、“Ipad Mini(那樣的做工)”、“實體翻頁鍵(不錯)”、“一分錢一分貨”等關(guān)鍵詞上。
“限量珍藏版“這個概念牌打得好,用戶也愿意為此買單,這主要體現(xiàn)在“限量珍藏版”這個詞頻較高且為紅色的關(guān)鍵字上。
另一方面,運營方也要及時了解用戶的負向反饋,針對性地改進服務(wù)質(zhì)量。
還好,在這里只出現(xiàn)了“壓敏按鍵”這些負面詞匯,點開“壓敏按鍵”一詞,看到用戶的詳細吐槽……“壓敏按鍵在按下的時候出現(xiàn)下陷情形……”雖然這樣的反饋不多,但仍要引起高度警惕,具體排查是產(chǎn)品本身的設(shè)計問題,還是極個別的產(chǎn)品質(zhì)量問題,并將此反饋傳遞給相關(guān)負責部門。
將用戶的反饋數(shù)據(jù)和評分同步到地圖上,通過形成的數(shù)據(jù)地圖可以直觀的看到各地對于Kindle Voyage的評價和情緒度,從而對整體的用戶反饋情況進行監(jiān)控,重點“關(guān)照”其中的用戶差評“重災(zāi)區(qū)”。
此處選取的是Kindle Voyage在江蘇省各市的用戶反饋數(shù)據(jù),反映出該地區(qū)Kindle Voyage用戶對于產(chǎn)品的評價及情緒傾向性。
其中,數(shù)值代表評分高低,顏色反映情緒值,綠色代表良好,藍色是一般,紅色代表處于警報狀態(tài),需要重點關(guān)注,排查問題發(fā)生的具體原因。
江蘇省各市Kindle Voyage用戶的評分及情緒度分布
這里可以看到,徐州市、連云港市等城市的用戶反饋良好,反映在評分較高,且顏色為綠色。然而,淮安市、鎮(zhèn)江市和南京市的Kindle Voyage用戶卻非常不滿意,評分較低且情緒度處于紅色警報狀態(tài),需要引起客戶體驗部門的高度重要,做好用戶情緒疏導(dǎo)和公關(guān)工作。
結(jié)語
從上面的實例中,我們可以體會到大數(shù)據(jù)文本分析對于產(chǎn)品、設(shè)計、營銷和運營的巨大價值,它的重要性不亞于傳統(tǒng)的結(jié)構(gòu)性數(shù)據(jù)分析。用正確的方式閱讀這些海量的文本數(shù)據(jù),我們就可以直接讀懂用戶的想法,獲得強有力的決策支持,從而使產(chǎn)品研發(fā)、營銷推廣和日常運營更貼近消費者需求,最終在用戶心中形成良好的品牌形象。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓(xùn)練與驗證損失驟升:機器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11