
移動大數(shù)據(jù)這一年:一邊是海水,一邊是火焰
大家還在對Facebook的動輒百萬臺服務(wù)器以及淘寶每天幾百個T的數(shù)據(jù),表現(xiàn)出無比羨慕、嫉妒、恨。轉(zhuǎn)眼間一年過去了,移動大數(shù)據(jù)領(lǐng)域的改變卻在悄然發(fā)生。
估計各家市場調(diào)查機構(gòu)很快會放出各種全年報告,來說明智能手機的出貨量遠遠超過PC出貨量。由于Win8市場表現(xiàn)不佳,今年全球PC銷量的首次下滑將會很快成為現(xiàn)實。市場規(guī)模此消彼長,迫使更多的企業(yè)采取Mobile First戰(zhàn)略。
根據(jù)TalkingData平臺2012年第4季度的統(tǒng)計數(shù)據(jù)顯示,活躍用戶每日打開應(yīng)用次數(shù)以及使用時長呈規(guī)律性,用戶的行為數(shù)據(jù)具有一定的研究價值。
由于智能手機的大量的出現(xiàn),攜帶眾多傳感器的移動設(shè)備給數(shù)據(jù)系統(tǒng)提供了更多的高質(zhì)量情景數(shù)據(jù),可以評估人們平時看不見的行為和社交互動,還可以使用新算法來挖掘這種數(shù)據(jù)的價值。
其實移動大數(shù)據(jù)領(lǐng)域研究并不是今年才開始的,2012年也不是所謂的“移動大數(shù)據(jù)元年”。近10幾年來,包括政府、運營商、設(shè)備廠商出于管控、商業(yè)等多種目的,持續(xù)投入巨資在移動數(shù)據(jù)挖掘領(lǐng)域,特別是和可攜帶設(shè)備相關(guān)的一些項目。
這些項目的重點在于通過移動設(shè)備采集數(shù)據(jù)(位置、語音,等各種傳感器),通過數(shù)據(jù)挖掘的方法來了解人們的情緒變化以及社交情況,對于人們未來的行為進行預(yù)測。
比較有名的情景感知項目如:MIT的Reality Mining(現(xiàn)實挖掘)、Nokia的Context Phone、DARPA的Pal(目的是為指揮官和作戰(zhàn)人員提供革命性的輔助系統(tǒng))、以及Parc的Magitty。
近年來由于觸屏手機的迅速普及,人機交互成為移動應(yīng)用的主要瓶頸,產(chǎn)業(yè)界研究的關(guān)注點在于如何改善輸入體驗,得益于此,源于Pal項目的Siri,由于定位于學(xué)習型個人助理,在蘋果收購SRI后終于修成正果。
說到移動大數(shù)據(jù)的未來,大家一致看好Augment Reality,如果說Google Glasses以及無人駕駛汽車讓大家初窺端倪的話,目前多家公司在虛擬三維建模領(lǐng)域的突破可以說讓人家充滿憧憬了,實現(xiàn)之效果遠不是Layer這些基于物理標識的簡單濾鏡可以比擬的。
以上主要是對于未來有一個美好的展望。下面,我們一起來看看移動大數(shù)據(jù)對于開發(fā)者意味著什么。
今年一提到大數(shù)據(jù),很多專家就開始講3V:Volume、Variety、Velocity。這3V表明大數(shù)據(jù)的三方面特質(zhì):量大、多樣、實時。竊以為這種理論性的描述并不解決任何實際問題,對于移動應(yīng)用來說,更多地是在于如何通過數(shù)據(jù)挖掘改善產(chǎn)品體驗、差異化競爭、產(chǎn)生商業(yè)價值。下面就舉例說明一下移動大數(shù)據(jù)對于移動應(yīng)用的影響和促進。
這兩年已經(jīng)出現(xiàn)了不少基于數(shù)據(jù)的創(chuàng)新性的應(yīng)用,包括國內(nèi)一些創(chuàng)業(yè)公司也開始在語音識別/圖像識別/人臉識別/增強現(xiàn)實等模式識別方面取得了一些進步,產(chǎn)品差異化競爭方面做得比較好,但對于用戶體驗方面仍有很長的路要走。
經(jīng)常被一些大佬問及“你認為新的流量入口是什么?”個人認為肯定不是目前那些雷同的應(yīng)用市場形態(tài),未來的應(yīng)用擴散模式應(yīng)該是基于個性化的應(yīng)用推薦或用戶自發(fā)發(fā)現(xiàn)。這方面,Discovr這款應(yīng)用一定程度上代表了這個發(fā)展趨勢。
Discovr 使用互動地圖的方式來標記應(yīng)用,只要搜索一個應(yīng)用就能獲得應(yīng)用推薦的大量應(yīng)用,并能直觀地顯示應(yīng)用介紹,并能夠根據(jù)人們的選擇來不斷的學(xué)習,適應(yīng)人們的喜好。
通過數(shù)據(jù)作出預(yù)測是,是另外一個移動大數(shù)據(jù)應(yīng)用發(fā)展方向。比如,Decide為消費者提供使用專用數(shù)據(jù)和預(yù)測算法的工具,讓他們充分了解何時是最佳購買時機?是否應(yīng)該等待降價?或預(yù)計幾天后就會發(fā)布的新產(chǎn)品的出現(xiàn)。
將移動大數(shù)據(jù)應(yīng)用的比較好的應(yīng)用類型還有很多,由于篇幅關(guān)系,這里就不一一列出來了,有興趣讀者可以與我們進一步交流。
從上面這些例子不難看出,實際上大數(shù)據(jù)對于移動互聯(lián)網(wǎng)來說,絕不僅僅是統(tǒng)計應(yīng)用下載量這么簡單,如果只是用來計數(shù),實在對不起“大數(shù)據(jù)”這么響亮的名字。數(shù)據(jù)完全可以更為緊密、靈活的與移動互聯(lián)網(wǎng)、移動應(yīng)用相結(jié)合。除了細致的用戶行為數(shù)據(jù)挖掘可以幫助開發(fā)者優(yōu)化產(chǎn)品、調(diào)整市場策略外,諸如機器學(xué)習引擎之類的高級大數(shù)據(jù)應(yīng)用模式,可以為我們帶來更大的價值。下面簡單介紹一下目前主流的機器學(xué)習引擎近況。
對于大部分移動應(yīng)用開發(fā)者來說,主要精力還是放在產(chǎn)品、服務(wù)本身的開發(fā)、運營以及優(yōu)化。而大多數(shù)應(yīng)用開發(fā)技術(shù)人員往往缺乏足夠的數(shù)學(xué)背景、算法知識,如果無意愿自己實現(xiàn)基于機器學(xué)習的運算框架,目前有幾個機器學(xué)習框架、服務(wù)可供選擇。
Google Prediction API是一個基于云服務(wù)的機器學(xué)習工具,它可以幫助開發(fā)者分析數(shù)據(jù),并為應(yīng)用程序加入情感分析、流失預(yù)測、產(chǎn)品推薦等功能,缺點是根據(jù)調(diào)用次數(shù)/數(shù)據(jù)點收費,成本規(guī)模不好控制。
Apache Mahout 是 Apache Software Foundation (ASF) 旗下的一個開源項目,提供一些可擴展的機器學(xué)習領(lǐng)域經(jīng)典算法的實現(xiàn),旨在幫助開發(fā)人員更加方便快捷地創(chuàng)建智能應(yīng)用程序,在 Mahout 支持采用 Apache Hadoop 的基礎(chǔ)框架,使這些算法可以更高效的運行在云計算環(huán)境中,是自己實現(xiàn)分析系統(tǒng)比較好的選擇。
Talkingdata Insight就是騰云天下推出的針對移動互聯(lián)網(wǎng)應(yīng)用的機器學(xué)習方案,接口采用Restful風格的API,提供包括關(guān)聯(lián)推薦、個性化推薦、用戶重定向、用戶標簽、付費意愿預(yù)測、流失概率預(yù)測等算法,同時提供數(shù)據(jù)清洗/模擬仿真工具。目前國內(nèi)已經(jīng)有包括第三方商店、移動廣告網(wǎng)絡(luò),游戲CP等類型的客戶。
現(xiàn)實是,移動開發(fā)者一方面面對美好的未來,另一方面還要考慮如何艱難得生存著,然而數(shù)據(jù)運營的挑戰(zhàn)是必須要面對的,個人建議:
必須重視原始數(shù)據(jù)的收集和整理,很多開發(fā)者抱有“先存著,有用時再說”的心理。殊不知絕大部分數(shù)據(jù)挖掘項目就是死在數(shù)據(jù)清洗這個環(huán)節(jié)上。
不斷思考,如何利用數(shù)據(jù)和對手差異化以及構(gòu)筑競爭壁壘。以后的應(yīng)用的核心競爭力毋庸置疑就是基于數(shù)據(jù)的對于客戶以及市場的了解,誰能預(yù)先布局,就能在競爭中取得優(yōu)勢,而這樣的差異性是山寨不來的。
小步快跑,沒必要浪費資源在那些基礎(chǔ)的“發(fā)明輪子”的工作上,盡量采用成熟的產(chǎn)品,通過小的迭代,不斷優(yōu)化數(shù)據(jù)分析過程。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10