
移動(dòng)大數(shù)據(jù)這一年:一邊是海水,一邊是火焰
大家還在對(duì)Facebook的動(dòng)輒百萬臺(tái)服務(wù)器以及淘寶每天幾百個(gè)T的數(shù)據(jù),表現(xiàn)出無比羨慕、嫉妒、恨。轉(zhuǎn)眼間一年過去了,移動(dòng)大數(shù)據(jù)領(lǐng)域的改變卻在悄然發(fā)生。
估計(jì)各家市場調(diào)查機(jī)構(gòu)很快會(huì)放出各種全年報(bào)告,來說明智能手機(jī)的出貨量遠(yuǎn)遠(yuǎn)超過PC出貨量。由于Win8市場表現(xiàn)不佳,今年全球PC銷量的首次下滑將會(huì)很快成為現(xiàn)實(shí)。市場規(guī)模此消彼長,迫使更多的企業(yè)采取Mobile First戰(zhàn)略。
根據(jù)TalkingData平臺(tái)2012年第4季度的統(tǒng)計(jì)數(shù)據(jù)顯示,活躍用戶每日打開應(yīng)用次數(shù)以及使用時(shí)長呈規(guī)律性,用戶的行為數(shù)據(jù)具有一定的研究價(jià)值。
由于智能手機(jī)的大量的出現(xiàn),攜帶眾多傳感器的移動(dòng)設(shè)備給數(shù)據(jù)系統(tǒng)提供了更多的高質(zhì)量情景數(shù)據(jù),可以評(píng)估人們平時(shí)看不見的行為和社交互動(dòng),還可以使用新算法來挖掘這種數(shù)據(jù)的價(jià)值。
其實(shí)移動(dòng)大數(shù)據(jù)領(lǐng)域研究并不是今年才開始的,2012年也不是所謂的“移動(dòng)大數(shù)據(jù)元年”。近10幾年來,包括政府、運(yùn)營商、設(shè)備廠商出于管控、商業(yè)等多種目的,持續(xù)投入巨資在移動(dòng)數(shù)據(jù)挖掘領(lǐng)域,特別是和可攜帶設(shè)備相關(guān)的一些項(xiàng)目。
這些項(xiàng)目的重點(diǎn)在于通過移動(dòng)設(shè)備采集數(shù)據(jù)(位置、語音,等各種傳感器),通過數(shù)據(jù)挖掘的方法來了解人們的情緒變化以及社交情況,對(duì)于人們未來的行為進(jìn)行預(yù)測。
比較有名的情景感知項(xiàng)目如:MIT的Reality Mining(現(xiàn)實(shí)挖掘)、Nokia的Context Phone、DARPA的Pal(目的是為指揮官和作戰(zhàn)人員提供革命性的輔助系統(tǒng))、以及Parc的Magitty。
近年來由于觸屏手機(jī)的迅速普及,人機(jī)交互成為移動(dòng)應(yīng)用的主要瓶頸,產(chǎn)業(yè)界研究的關(guān)注點(diǎn)在于如何改善輸入體驗(yàn),得益于此,源于Pal項(xiàng)目的Siri,由于定位于學(xué)習(xí)型個(gè)人助理,在蘋果收購SRI后終于修成正果。
說到移動(dòng)大數(shù)據(jù)的未來,大家一致看好Augment Reality,如果說Google Glasses以及無人駕駛汽車讓大家初窺端倪的話,目前多家公司在虛擬三維建模領(lǐng)域的突破可以說讓人家充滿憧憬了,實(shí)現(xiàn)之效果遠(yuǎn)不是Layer這些基于物理標(biāo)識(shí)的簡單濾鏡可以比擬的。
以上主要是對(duì)于未來有一個(gè)美好的展望。下面,我們一起來看看移動(dòng)大數(shù)據(jù)對(duì)于開發(fā)者意味著什么。
今年一提到大數(shù)據(jù),很多專家就開始講3V:Volume、Variety、Velocity。這3V表明大數(shù)據(jù)的三方面特質(zhì):量大、多樣、實(shí)時(shí)。竊以為這種理論性的描述并不解決任何實(shí)際問題,對(duì)于移動(dòng)應(yīng)用來說,更多地是在于如何通過數(shù)據(jù)挖掘改善產(chǎn)品體驗(yàn)、差異化競爭、產(chǎn)生商業(yè)價(jià)值。下面就舉例說明一下移動(dòng)大數(shù)據(jù)對(duì)于移動(dòng)應(yīng)用的影響和促進(jìn)。
這兩年已經(jīng)出現(xiàn)了不少基于數(shù)據(jù)的創(chuàng)新性的應(yīng)用,包括國內(nèi)一些創(chuàng)業(yè)公司也開始在語音識(shí)別/圖像識(shí)別/人臉識(shí)別/增強(qiáng)現(xiàn)實(shí)等模式識(shí)別方面取得了一些進(jìn)步,產(chǎn)品差異化競爭方面做得比較好,但對(duì)于用戶體驗(yàn)方面仍有很長的路要走。
經(jīng)常被一些大佬問及“你認(rèn)為新的流量入口是什么?”個(gè)人認(rèn)為肯定不是目前那些雷同的應(yīng)用市場形態(tài),未來的應(yīng)用擴(kuò)散模式應(yīng)該是基于個(gè)性化的應(yīng)用推薦或用戶自發(fā)發(fā)現(xiàn)。這方面,Discovr這款應(yīng)用一定程度上代表了這個(gè)發(fā)展趨勢。
Discovr 使用互動(dòng)地圖的方式來標(biāo)記應(yīng)用,只要搜索一個(gè)應(yīng)用就能獲得應(yīng)用推薦的大量應(yīng)用,并能直觀地顯示應(yīng)用介紹,并能夠根據(jù)人們的選擇來不斷的學(xué)習(xí),適應(yīng)人們的喜好。
通過數(shù)據(jù)作出預(yù)測是,是另外一個(gè)移動(dòng)大數(shù)據(jù)應(yīng)用發(fā)展方向。比如,Decide為消費(fèi)者提供使用專用數(shù)據(jù)和預(yù)測算法的工具,讓他們充分了解何時(shí)是最佳購買時(shí)機(jī)?是否應(yīng)該等待降價(jià)?或預(yù)計(jì)幾天后就會(huì)發(fā)布的新產(chǎn)品的出現(xiàn)。
將移動(dòng)大數(shù)據(jù)應(yīng)用的比較好的應(yīng)用類型還有很多,由于篇幅關(guān)系,這里就不一一列出來了,有興趣讀者可以與我們進(jìn)一步交流。
從上面這些例子不難看出,實(shí)際上大數(shù)據(jù)對(duì)于移動(dòng)互聯(lián)網(wǎng)來說,絕不僅僅是統(tǒng)計(jì)應(yīng)用下載量這么簡單,如果只是用來計(jì)數(shù),實(shí)在對(duì)不起“大數(shù)據(jù)”這么響亮的名字。數(shù)據(jù)完全可以更為緊密、靈活的與移動(dòng)互聯(lián)網(wǎng)、移動(dòng)應(yīng)用相結(jié)合。除了細(xì)致的用戶行為數(shù)據(jù)挖掘可以幫助開發(fā)者優(yōu)化產(chǎn)品、調(diào)整市場策略外,諸如機(jī)器學(xué)習(xí)引擎之類的高級(jí)大數(shù)據(jù)應(yīng)用模式,可以為我們帶來更大的價(jià)值。下面簡單介紹一下目前主流的機(jī)器學(xué)習(xí)引擎近況。
對(duì)于大部分移動(dòng)應(yīng)用開發(fā)者來說,主要精力還是放在產(chǎn)品、服務(wù)本身的開發(fā)、運(yùn)營以及優(yōu)化。而大多數(shù)應(yīng)用開發(fā)技術(shù)人員往往缺乏足夠的數(shù)學(xué)背景、算法知識(shí),如果無意愿自己實(shí)現(xiàn)基于機(jī)器學(xué)習(xí)的運(yùn)算框架,目前有幾個(gè)機(jī)器學(xué)習(xí)框架、服務(wù)可供選擇。
Google Prediction API是一個(gè)基于云服務(wù)的機(jī)器學(xué)習(xí)工具,它可以幫助開發(fā)者分析數(shù)據(jù),并為應(yīng)用程序加入情感分析、流失預(yù)測、產(chǎn)品推薦等功能,缺點(diǎn)是根據(jù)調(diào)用次數(shù)/數(shù)據(jù)點(diǎn)收費(fèi),成本規(guī)模不好控制。
Apache Mahout 是 Apache Software Foundation (ASF) 旗下的一個(gè)開源項(xiàng)目,提供一些可擴(kuò)展的機(jī)器學(xué)習(xí)領(lǐng)域經(jīng)典算法的實(shí)現(xiàn),旨在幫助開發(fā)人員更加方便快捷地創(chuàng)建智能應(yīng)用程序,在 Mahout 支持采用 Apache Hadoop 的基礎(chǔ)框架,使這些算法可以更高效的運(yùn)行在云計(jì)算環(huán)境中,是自己實(shí)現(xiàn)分析系統(tǒng)比較好的選擇。
Talkingdata Insight就是騰云天下推出的針對(duì)移動(dòng)互聯(lián)網(wǎng)應(yīng)用的機(jī)器學(xué)習(xí)方案,接口采用Restful風(fēng)格的API,提供包括關(guān)聯(lián)推薦、個(gè)性化推薦、用戶重定向、用戶標(biāo)簽、付費(fèi)意愿預(yù)測、流失概率預(yù)測等算法,同時(shí)提供數(shù)據(jù)清洗/模擬仿真工具。目前國內(nèi)已經(jīng)有包括第三方商店、移動(dòng)廣告網(wǎng)絡(luò),游戲CP等類型的客戶。
現(xiàn)實(shí)是,移動(dòng)開發(fā)者一方面面對(duì)美好的未來,另一方面還要考慮如何艱難得生存著,然而數(shù)據(jù)運(yùn)營的挑戰(zhàn)是必須要面對(duì)的,個(gè)人建議:
必須重視原始數(shù)據(jù)的收集和整理,很多開發(fā)者抱有“先存著,有用時(shí)再說”的心理。殊不知絕大部分數(shù)據(jù)挖掘項(xiàng)目就是死在數(shù)據(jù)清洗這個(gè)環(huán)節(jié)上。
不斷思考,如何利用數(shù)據(jù)和對(duì)手差異化以及構(gòu)筑競爭壁壘。以后的應(yīng)用的核心競爭力毋庸置疑就是基于數(shù)據(jù)的對(duì)于客戶以及市場的了解,誰能預(yù)先布局,就能在競爭中取得優(yōu)勢,而這樣的差異性是山寨不來的。
小步快跑,沒必要浪費(fèi)資源在那些基礎(chǔ)的“發(fā)明輪子”的工作上,盡量采用成熟的產(chǎn)品,通過小的迭代,不斷優(yōu)化數(shù)據(jù)分析過程。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03