
大數據,大數據公司,低估值
一. 什么是數據?
我們將它分為線上與線下兩類來具體分析下:
線上,互聯網數據互聯網信息:網頁。電子商務。 人在互聯網中的行為:社交,衣食住行,健康。物聯網。
線下,現實社會數據信息:線下每天依然在產生大量的信息。線下商業(yè)。實物:包括機器,桌子椅子等。人:線下的社交,衣食住行,健康醫(yī)療。 生物數據:(除人外的活體生物,寵物等)
哪些數據最重要?
互聯網時代把線上數據發(fā)揮到了極致,直接推動了BAT三大巨頭的誕生,同時也把馬云、馬化騰、李彥宏帶到了首富的位置。
百度:搜索(信息,連接人與信息,重金O2O,強行連接人與服務,現在搞AI)
阿里巴巴:電子商務(商業(yè))
騰訊:社交(人)
二. 哪些公司是大數據公司?
這個問題不好答,換個方向就好答了:哪些公司有大數據人才?連大數據的人都沒有,別自稱大數據公司了,好嗎?
1. 互聯網巨頭
互聯網巨頭的起家背靠著電商、社交、信息、游戲和金融等互聯網時代的巨大概念。
騰訊的數據主要來源于QQ、微信和騰訊游戲。擁有的用戶關系數據,社交數據因為私密無法公開使用。利用數據改進產品,數據驅動廣告、電商、資訊、社交等一系列騰訊產品的改進。騰訊的未來在于微信,微信現在已經不再把精力放在IM通訊上了,而是連接一切。未來微信很有可能會成為整個互聯網的基礎服務最大的入口。那時候的微信也就掌握了電商、社交、信息、游戲和金融的一切。
阿里巴巴的淘寶,天貓,阿里巴巴,支付寶。商品交易,支付數據是商業(yè)的基礎設施。支付寶的交易數據使得阿里長期在互金領域占據霸主地位。電商超越零售不是現在,就是不久的將來。所以阿里目前擁有的網商數據,也就等于掌握了中國部分的商業(yè)占比。
百度的百度搜索。百度對于信息的利用來源于用戶與商家的需求,用戶側服務互聯網網民的搜索需求,商家側匹配廣告主與網民的廣告業(yè)務。另外,百度還重金押寶AI,AI若能成功將革新社會的基礎服務,比如無人駕駛。所以個人覺得百度仍然有機會回到第一的王座。
憑借著互聯網時代龐大的數據體量與高質量的數據,可以說,BAT擁有著當今最優(yōu)秀的數據人才。
2. 行業(yè)巨頭
行業(yè)巨頭個人分為兩類:
第一類是IT巨頭,例如華為,小米,新美大,浪潮,中興,曙光等公司。他們憑借著在IT領域建立了技術壁壘或者服務能力,成為了各自領域的佼佼者。
第二類是傳統(tǒng)行業(yè)巨頭,包含各行各業(yè),金融,零售,能源,機械,酒等垂直領域。比如你聽說過茅臺酒公司的大數據平臺嗎?
由于上述行業(yè)巨頭的垂直領域數據的壟斷性地位與數據體量的變大,希冀能依靠數據產生價值 。憑借著兩點,行業(yè)巨頭也擁有著很多高質量的數據人才。
但數據不是他們的第一驅動力。他們有更重要的主營業(yè)務。
3. 新時期的大數據公司
新時期大數據公司個人分為基礎服務平臺、商業(yè)數據分析兩大類。
基礎服務平臺提供了數據平臺基礎服務,比如大數據存儲平臺,計算平臺,BI平臺,數據交易平臺。
商業(yè)數據分析型大數據公司提供了復雜的端到端數據服務,包括數據采集、清洗、分析,幫助沒有數據分析與整合能力的企業(yè)理解數據,認識數據,并讓自身數據發(fā)揮效用。
接下來,我們重點討論的是如何看待這些新時期的大數據公司。
三. 為什么突然冒出那么多新時期的大數據公司?
對數據的需求自古有之。喬家大院里面,東家喬致庸看賬本可不就是數據應用嗎?
那為什么在之前少有專業(yè)的大數據公司,在最近幾年才爆發(fā)起來?2012或者2013年被稱之為大數據元年。
新時期的大數據公司大幅增加源自于有兩類數據需求的集中爆發(fā):
1. 線下的數據機會
在看到巨頭們由于占據了互聯網端的數據后,很多人發(fā)現了線下的數據機會。夢想著成為巨頭的他們,踏上了繼續(xù)強力推進線下數據線上化的道路。
2. 企業(yè)對于數據化決策的需求
抽象來看,企業(yè)的發(fā)展過程很大程度上經歷了紙質化1.0時代,信息化2.0時代,數據化3.0時代。當快糙猛的高速發(fā)展期過去,企業(yè)的發(fā)展同樣需要數據驅動,數據決策。但是,很多企業(yè)信息化過程都經歷了陣痛難產,現在等待它們的是數據時代的到來。對于他們來說,數據人才缺口是最大的問題,于是他們需要借助外力。在信息化時代,這叫找外包。不好意思,數據時代,一樣需要外包。(什么?原來我們這些data scientist在做外包?)
于是,一大波大數據公司出現了。
四. 大數據公司的估值并不高,都比不上O2O?
在消費完大數據的概念后,其實現在媒體跟投資圈更多的在消費AI了。做系統(tǒng)的開始說自己做大數據,做數據的開始說自己在干AI。
估值除了看公司收入,利潤,用戶,概念,還有就是VC的人傻錢多了。
之前愛分析有一篇文章,大致列舉了中國未上市大數據公司50強,沒有一家估值超過10億美金,一家獨角獸企業(yè)都沒有。那是什么原因導致的低估值?
1. 線下數據線上化,硬骨頭太難啃
線下的數據還有哪些沒有被線上化的?
人的線下社交,線下交易,實體零售,線下營銷,線下課堂教學等一系列線下場景??梢哉f,線下是社會的組成,特別是很多場景嚴重依賴線下,比如學習,服務化消費。因此線下數據的收集同樣很有利。
舉一個小例子,線下課堂教學中,如果能實時獲取每一個同學對于知識接受度,掌握每一個人的學習,可以有效的幫助每一位同學更好的學習,從而避免誤入歧途。
但線下數據收集難度太大,成本高,技術仍不完善,所以從數據收集一開始就遇到了困難,我總結為硬骨頭。
另外一個是數據孤島效應嚴重,實質上數據如果無法達到大、全、價值,很難產生協(xié)同效應。
但未來肯定有辦法。通過AI的發(fā)展,通過音視頻的捕捉,線下數據線上化只是時間問題。
2. 大數據公司業(yè)務難以規(guī)?;?
在一系列TO B的大數據公司中,商業(yè)的數據分析屬于外包型數據分析業(yè)務,外包的一個重要特點是堆人頭,很難產生規(guī)?;洕б?,賺取超額利潤。
并且,很多大數據公司急躁且跟風,數據外包本質上是外包團隊的困境,為什么很多公司現在選擇自建技術團隊,因為外包是不會為企業(yè)的長期發(fā)展而考慮,這是經濟學或者社會學領域研究的問題。很多時候大數據公司接了單,卻沒有能服務好,根本不能為企業(yè)帶來實際的效益,最終企業(yè)反而勞心勞力無所得。
其次,中小企業(yè)引入大數據分析數據是可以幫助決策,提升企業(yè)經營效率的。但是企業(yè)自身進行大數據投入的意愿是多少?意愿 = 收益 – 成本。如果收益無法cover成本,很多企業(yè)是沒有動力做這件事情的。其實這也就是很多中小企業(yè)的困境。
當然,data to people是歷史潮流,未來一定有越來越多的數據服務公司出現,也有越來越多企業(yè)需要數據服務。
3. 數據隱私
數據有其獨特性,尤其是隱私,企業(yè)對于數據的思考尤為謹慎。
互聯網爬蟲與反爬技術的興起,也是源于數據隱私,電商,旅游等網站都在防止競爭對手爬取自身的數據下足了苦工?;ヂ摼W發(fā)展至今,特別是數據資產這一定義深入人心,大家對數據更為謹慎,也就導致了數據共享困難。
這也是我覺得純粹靠整合某一垂直領域,利用數據來達到壟斷某一領域的困境。
4. 數據技術平臺
這一類公司其實已經有獨角獸的端倪了,包含大數據基礎平臺以及數據云平臺等。包括Hadoop領域的三架馬車,都已經進入了十億美金的獨角獸階段。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數據處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數據庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數據分析師:表結構數據 “獲取 - 加工 - 使用” 全流程的賦能者 表結構數據(如數據庫表、Excel 表、CSV 文件)是企業(yè)數字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數據分析師:解鎖表結構數據特征價值的專業(yè)核心 表結構數據(以 “行 - 列” 規(guī)范存儲的結構化數據,如數據庫表、Excel 表、 ...
2025-09-17Excel 導入數據含缺失值?詳解 dropna 函數的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數據時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數據分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數據差異是否 “ ...
2025-09-16CDA 數據分析師:掌控表格結構數據全功能周期的專業(yè)操盤手 表格結構數據(以 “行 - 列” 存儲的結構化數據,如 Excel 表、數據 ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數據分析師:激活表格結構數據價值的核心操盤手 表格結構數據(如 Excel 表格、數據庫表)是企業(yè)最基礎、最核心的數據形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數據爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數據的科學計數法問題 為幫助 Python 數據從業(yè)者解決pd.read_csv讀取長浮點數據時的科學計數法問題 ...
2025-09-12CDA 數據分析師:業(yè)務數據分析步驟的落地者與價值優(yōu)化者 業(yè)務數據分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數據把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數據驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數據分析師與戰(zhàn)略 / 業(yè)務數據分析:概念辨析與協(xié)同價值 在數據驅動決策的體系中,“戰(zhàn)略數據分析”“業(yè)務數據分析” 是企業(yè) ...
2025-09-11Excel 數據聚類分析:從操作實踐到業(yè)務價值挖掘 在數據分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數據中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數據解讀到決策支撐的價值導向 統(tǒng)計模型作為數據分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10