
小公司如何應(yīng)對大數(shù)據(jù)
“大數(shù)據(jù)”已經(jīng)成為互聯(lián)網(wǎng)上最熱門的概念之一,我看到許多創(chuàng)業(yè)者都開始談?wù)摯髷?shù)據(jù)的商用價值,創(chuàng)業(yè)項目一定得和“大數(shù)據(jù)”掛鉤,有些人更是把《大數(shù)據(jù)時代》一書奉為圣經(jīng),仿佛只要買一本祭在家里的某個角落,自己就有資格高談?wù)撻?、指點江山了。但實際上,雖然書中洞見了數(shù)據(jù)分析的趨勢和隱憂,可由于作者Viktor
Mayer Sch nberger是一個典型的學(xué)術(shù)派,并沒有什么值得稱耀的實踐經(jīng)驗,導(dǎo)致此書缺乏落地感,大數(shù)據(jù)商業(yè)應(yīng)用在沒有可靠技術(shù)支撐的狀況下也只能是一紙空談。
不可否認(rèn)的是,“大數(shù)據(jù)”確實擁有十分重要的價值,如今從傳統(tǒng)行業(yè)到互聯(lián)網(wǎng)行業(yè)的很多產(chǎn)品也需要依靠“大數(shù)據(jù)”來作為功能支撐和核心競爭力,借用阿里巴巴數(shù)據(jù)平臺與產(chǎn)品部數(shù)據(jù)倉庫架構(gòu)師占超群(花名離哲)的概括,目前階段,大數(shù)據(jù)解決的主要問題分為3類:
小公司如何應(yīng)對大數(shù)據(jù)
1. 拓展傳統(tǒng)的商業(yè)智能(BI)領(lǐng)域。以前針對大數(shù)據(jù)量的統(tǒng)計、關(guān)聯(lián)分析、趨勢預(yù)測由抽樣變成全量分析、將數(shù)據(jù)回流到各種報表。
2. 業(yè)務(wù)流程改。對各種數(shù)據(jù)進行聚合分析,用來做業(yè)務(wù)流程改進和考核的依據(jù)。
3. 數(shù)據(jù)商品和商業(yè)應(yīng)用。通過對已有數(shù)據(jù)或數(shù)據(jù)處理能力進行服務(wù)化或產(chǎn)品化包裝,形成數(shù)據(jù)產(chǎn)品或數(shù)據(jù)服務(wù)。
其中,我們在互聯(lián)網(wǎng)行業(yè)最常見的就是通過已有的數(shù)據(jù)來形成數(shù)據(jù)產(chǎn)品和數(shù)據(jù)服務(wù),最典型的應(yīng)用場景就是“個性化推薦”,但這并非是人人都可以染指的概念——我們知道,行業(yè)內(nèi)依靠四個特征界定“大數(shù)據(jù)”:
第一,Volume,體量巨大,PB級別;
第二,Variety,數(shù)據(jù)類型繁多;
第三,Veracity,價值密度低;
第四,Velocity,處理速度快。簡而言之,需要從不同維度抓取海量數(shù)據(jù)并將其快速轉(zhuǎn)變?yōu)橛行虻目捎眯畔ⅰ?br />
實際上,在中國互聯(lián)網(wǎng),完全具備以上四點特征也只有騰訊、阿里巴巴、百度等較大型公司,對于一般公司而言,根本就不可能擁有PB級別的數(shù)據(jù),也無法支撐高昂的數(shù)據(jù)存儲成本,而且大數(shù)據(jù)方面的技術(shù)人才十分稀缺。最近就有不少創(chuàng)業(yè)團隊告訴我他們產(chǎn)品的愿景,很多想法都十分新穎,但迫于數(shù)據(jù)處理能力,只好選擇“慢慢來”或者將產(chǎn)品功能閹割。那么,這類公司該如何在“大數(shù)據(jù)”浪潮中崛起呢?
我首先想到的就是利用第三方的數(shù)據(jù)處理服務(wù)平臺,這是一項在海外已經(jīng)比較成熟的業(yè)務(wù),從字面不難理解,這些公司為那些沒有大數(shù)據(jù)和大數(shù)據(jù)處理能力的公司提供“數(shù)據(jù)”或“服務(wù)”。
服務(wù)可以分為兩大類:基礎(chǔ)服務(wù)和個性化服務(wù)。
基礎(chǔ)服務(wù)即幫助公司解決數(shù)據(jù)存儲、框架搭建和管理等大數(shù)據(jù)處理的基礎(chǔ)能力,這類公司的代表有Hadoop(分布式軟件框架)管理軟件與服務(wù)提供商Cloudera、非關(guān)系型數(shù)據(jù)庫MongoDB開發(fā)商 10gen等。
另一類則直接幫助企業(yè)直接打造個性化解決方案,我認(rèn)為這類公司更適合大部分從整體上就缺乏數(shù)據(jù)能力的中國的小型互聯(lián)網(wǎng)公司和希望互聯(lián)網(wǎng)化的傳統(tǒng)企業(yè),譬如幫助電商提供個性化網(wǎng)上購物體驗的RichRelevance、個性化和數(shù)字市場營銷優(yōu)化服務(wù)提供商Baynote、為廣告商提供數(shù)據(jù)和分析的eXelate,以及數(shù)據(jù)拍賣平臺BlueKai等。在國內(nèi),也有一些不錯的平臺開始涌現(xiàn),例如個性化推薦引擎服務(wù)商百分點。利用這些第三方的服務(wù)和數(shù)據(jù),可以讓小公司的產(chǎn)品也兼具優(yōu)秀的個性化能力,融入大數(shù)據(jù)時代。
但我認(rèn)為,還有另一種應(yīng)對大數(shù)據(jù)浪潮的做法——逆勢而為。我并不認(rèn)為大數(shù)據(jù)是解決個性化的唯一方案,同是它還帶有相當(dāng)強的局限性——基于數(shù)據(jù)意為著用數(shù)據(jù)建立模型,從某種意義上說,它也像是一個牢籠:設(shè)想一下,如果你所有的信息全部來自個性化推薦,那么你很可能錯失那些你從未接觸過的全新領(lǐng)域,而這些開放的、全新的信息不正是互聯(lián)網(wǎng)最迷人之處么?
事實上,已經(jīng)有些產(chǎn)品這么做了,唐茶計劃的李如一就曾表示,不會受數(shù)據(jù)干擾去決定出售/推薦哪一本電子書,而是完全基于他們的個人對內(nèi)容的判斷,還有進來比較受關(guān)注的電臺Fuzz,完全由人工DJ來推送音樂。反過來想,如果同一類型的產(chǎn)品都具有精準(zhǔn)的大數(shù)據(jù)處理能力,那么它們?yōu)橛脩籼峁┑膬?nèi)容也很可能是千篇一律的,而這些逆勢而為的產(chǎn)品,反而更像是真正的“個性化”服務(wù)。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03