
互聯(lián)網(wǎng)大數(shù)據(jù)應用:淺談用戶行為分析
寫在前面的話,筆者最近一直想寫一寫關(guān)于大數(shù)據(jù)的博客與大家討論,但是大數(shù)據(jù)本身并不是筆者劉三德關(guān)注的主要方向,因此一直唯恐寫得太淺或太局限而缺乏價值。最近看了謝老師的一篇“聚沙成塔 集腋成裘——四談大數(shù)據(jù)時代”文章,通讀全文以后筆者認為其文學價值要大于實用價值,因此筆者對于謝老師的文采還是比較贊賞的。當然,若此文放在三四年前的互聯(lián)網(wǎng),也較能彰顯其價值。但是對于今日的互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng),大數(shù)據(jù)的規(guī)模和應用深度早已不次于傳統(tǒng)的電信、民航等行業(yè),甚至超過不少。因此筆者還是想寫些東西淺談一下互聯(lián)網(wǎng)的大數(shù)據(jù)應用,權(quán)當拋磚引玉,也希望更多的朋友參與交流和討論。
近日,又看到一則新聞,文中來自國外同行的分析觀點,稱“互聯(lián)網(wǎng)大數(shù)據(jù)蘊藏的財富堪比石油”??赡苡行┡笥褧杏X有些夸大,筆者一度也是如此認為。但后來轉(zhuǎn)念一想,就像在前文提到的,蘋果的app store通過用戶的下載等行為,可能做到比用戶自身還要了解其客觀喜好一樣。每一個個體的人有的時候,不一定那么了解自己,上升到社會層次,在一個范圍內(nèi)的人類群體,有些時候也不一定那么了解自身。而通過分析很多用戶的行為以及因應效果,應該是可以做到某些方面的趨勢預測的。關(guān)于預測,筆者劉三德計劃在接下來的文章中再去討論,本文主要從互聯(lián)網(wǎng)大數(shù)據(jù)分析的重點——“用戶行為分析”入手簡單談一下認識。
在很多前輩和業(yè)內(nèi)朋友的文章中,談到互聯(lián)網(wǎng)大數(shù)據(jù),其實很多的都是提到了用戶行為這個最典型的數(shù)據(jù)系統(tǒng)。目前眾多的大數(shù)據(jù)來源中最為重要也最有價值的兩類應屬于:“行為”與“內(nèi)容”——基于用戶身份系統(tǒng)之上產(chǎn)生的兩類數(shù)據(jù)。
由于互聯(lián)網(wǎng)用戶行為比較多種多樣,而且在不同功能、不同體驗的產(chǎn)品上也有很大不同,因此,要以一篇文章概述所有的用戶行為構(gòu)成還是很難的,而且由于關(guān)注產(chǎn)品和范圍有限,筆者也很難總結(jié)全面所有的互聯(lián)網(wǎng)用戶行為構(gòu)成和其特性。但本著少談大方向和大趨勢多談實際應用的想法,仍然希望本文能夠從一些簡單的,具有共性和通用性的典型互聯(lián)網(wǎng)用戶行為入手做一些討論。
目前,互聯(lián)網(wǎng)用戶的主要接入媒介分為:PC 和手機、智能平板等移動和不可移動終端。而用戶行為的產(chǎn)生方式和載體來源一般包括以下幾點:
1. 眼球,眼動行為?;诖朔N用戶行為的分析在國外還是比較流行的,老外對于用戶的研究可以說更加先進和傾向于極致。目前在國內(nèi)的很多領(lǐng)域也有類似用戶研究的應用,感興趣的朋友可以去搜下。通過研究用戶的眼球移動和停留等,產(chǎn)品設(shè)計師可以更容易了解界面上哪些元素更受用戶關(guān)注,哪些元素設(shè)計得合理或不合理等。此外,通過優(yōu)化多個用戶操作界面也可以相應的優(yōu)化用戶操作體驗流程。
2.鼠標,點擊和移動行為。從鼠標誕生之后,互聯(lián)網(wǎng)上最多的用戶行為應該都是通過鼠標來完成的,因此,分析用戶行為時分析鼠標是必須要分析的。除了鼠標點擊行為以外,鼠標的移動軌跡也可以被記錄和分析。目前國內(nèi)外很多大公司都有自己的系統(tǒng),用于記錄和統(tǒng)計不同程度上的用戶鼠標行為。此外,據(jù)了解,目前國內(nèi)的很多第三方統(tǒng)計網(wǎng)站也可以為中小網(wǎng)站和企業(yè)提供鼠標移動軌跡等記錄。
3.鍵盤等其它設(shè)備的輸入行為。此類設(shè)備主要是為了滿足鼠標不能通過簡單點擊等進行的如大量內(nèi)容輸入等場景。鍵盤的輸入行為不是用戶行為分析的重點,但鍵盤產(chǎn)生的內(nèi)容確是大數(shù)據(jù)應用中內(nèi)容分析的重點。
4.其它終端的觸摸和點擊等行為。此類設(shè)備目前主要是作為鼠標和鍵盤的替代品,在大多產(chǎn)品中都是如此。但新興的多點觸控等技術(shù)將能夠產(chǎn)生更加復雜的用戶行為,在某些特定產(chǎn)品中,也有必要對此類行為進行記錄和分析的。
基于以上媒介,用戶在不同的產(chǎn)品上可以產(chǎn)生千奇百怪,形形色色的行為。我們就可以通過對這些行為的記錄和分析更好的在產(chǎn)品設(shè)計、產(chǎn)品運營、產(chǎn)品市場與盈利、用戶體驗、用戶需求等互聯(lián)網(wǎng)產(chǎn)品的關(guān)鍵點之間進行權(quán)衡。
對于用戶產(chǎn)生的行為,筆者劉三德認為可以從兩個大方向分:消費行為、貢獻行為。從技術(shù)層面上講,前者主要是輸出——數(shù)據(jù)下行,后者主要是輸入——數(shù)據(jù)上行。雖然實際應用中,并不是如此簡單,有很多時候我們可以看到用戶的消費和貢獻行為并不是那么清晰可分的,有的時候用戶的消費行為本身就是一種貢獻!所以,在總結(jié)用戶的貢獻行為時,除了用戶的直接貢獻行為以外,將另一類貢獻行為稱之為——群體和持續(xù)性消費行為而產(chǎn)生的貢獻行為。
圖:互聯(lián)網(wǎng)用戶行為簡析(作者:劉三德)
還是之前那個觀點,互聯(lián)網(wǎng)的大數(shù)據(jù)不是一定要復雜才可以稱作大數(shù)據(jù)。在一維的層次來看,都是直接數(shù)據(jù),而且大多都是最簡單的數(shù)據(jù)記錄集合。在上圖中,試著將互聯(lián)網(wǎng)典型的用戶行為進行了一定的分類和歸納,必定也不夠全面,而且圖中標出的用戶行為也基本都是一維的直接用戶行為。但是通過對這些數(shù)據(jù)進行不同方法的建模和推導分析,則可以得出千變?nèi)f化的數(shù)據(jù)結(jié)果——這才是真正的互聯(lián)網(wǎng)大數(shù)據(jù)應用。
那么基于用戶行為分析,我們可以做什么?——這是核心問題,也就是我們做大數(shù)據(jù)分析的目的,為了什么?
其實,如果一直在參與互聯(lián)網(wǎng)產(chǎn)品生產(chǎn)流程的業(yè)內(nèi)朋友必然都了解,互聯(lián)網(wǎng)產(chǎn)品生產(chǎn)的大致流程和一些關(guān)鍵的部門構(gòu)成:產(chǎn)品部門、技術(shù)部門、運營部門、市場部門、此外還有一個大部門叫做BOSS(老板的決策層)。其中產(chǎn)品和技術(shù)部門是主要的產(chǎn)品生產(chǎn)部門,運營和市場部門則是將產(chǎn)品進行推廣和盈利的部門。而這些部門構(gòu)成的生產(chǎn)流程中又會有很多關(guān)鍵的細節(jié),其中每一個點如果都有量化數(shù)據(jù)的支持,無疑將對決策產(chǎn)生很大的指導和斧正作用。我們試著從其中挑選幾個步驟和應用場景簡要舉例:
1. 產(chǎn)品設(shè)計與營銷。產(chǎn)品經(jīng)理和設(shè)計師不是萬能的,也不一定都是人中的人精——喬布斯只誕生了一個。要做好的產(chǎn)品設(shè)計,就要不斷的聽取用戶意見,不斷的調(diào)研用戶需求并進行分析,得到最適合和滿足用戶需求和產(chǎn)品特性。除了直接的用戶調(diào)研,數(shù)據(jù)分析得到的結(jié)果支持是很重要的一個渠道。因為有的時候,用戶也不知道他到底想要什么,但是從用戶的行為中,我們或許可以分析出來他不了解的自己。比如通過對微博用戶分析,得知用戶在每天的四個時間點:早起去上班的路上、午飯時間、晚飯時間、睡覺前 是最活躍的。因此,掌握了這些用戶行為,企業(yè)就可以在對應的時間段做某些針對性的推廣和營銷等。
2. 產(chǎn)品客戶群定位或細分。并不是所有的產(chǎn)品都是服務(wù)于全網(wǎng)用戶的,即使對于細分產(chǎn)品,也是有更細致和精確的用戶特性可以供提煉分析。除了前文用戶資料系統(tǒng)之外,用戶行為是更重要的一個分析手段。比如對于電商網(wǎng)站,通過對用戶的消費行為和貢獻行為產(chǎn)生的數(shù)據(jù)進行分析,可以量化很多指標服務(wù)于各個生產(chǎn)和營銷環(huán)節(jié)。比如我們常說的:轉(zhuǎn)化率、客單價、購買頻率、平均毛利率、用戶滿意度等一系列量化的指標。
3. 商業(yè)分析與盈利模式調(diào)整。目前比較流行的一個詞是商業(yè)智能,在大家通常所提及的商業(yè)智能應用中,最重要的一個數(shù)據(jù)來源就是用戶行為。由于商業(yè)智能本身是一個很大的話題,本文不再細致討論,目前商業(yè)智能的應用在國內(nèi)的互聯(lián)網(wǎng)領(lǐng)域已有不少應用,很多應用在大公司和消費類產(chǎn)品平臺上。
4. 推薦系統(tǒng)。這是一個存在一些爭議的話題,有人看好有人唱衰。據(jù)筆者劉三德了解,商業(yè)智能中很重要的一個應用案例就是推薦系統(tǒng)。后續(xù)有時間的話,愿意和感興趣的朋友一起討論下推薦系統(tǒng)相關(guān)。
最近幾年,互聯(lián)網(wǎng)的產(chǎn)品呈現(xiàn)出一輪爆發(fā)性發(fā)展態(tài)勢。尤其是移動終端的普及,使得很多傳統(tǒng)的互聯(lián)網(wǎng)產(chǎn)品也開始移動化。但截止目前來看,筆者認為產(chǎn)品載體的豐富對于很多傳統(tǒng)的互聯(lián)網(wǎng)產(chǎn)品來說,并沒有帶來質(zhì)的改變,移動終端的產(chǎn)品大多是互聯(lián)網(wǎng)已有形態(tài)的延伸。也就是說移動互聯(lián)網(wǎng)的很多產(chǎn)品在用戶行為的統(tǒng)計和利用上,仍與傳統(tǒng)的互聯(lián)網(wǎng)區(qū)別不大——從這個角度來說,我們沒有落伍。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓練與驗證損失驟升:機器學習訓練中的異常診斷與解決方案 在機器學習模型訓練過程中,“損失曲線” 是反映模型學習狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11