
創(chuàng)數(shù)紀CEO劉彤揭大數(shù)據(jù)現(xiàn)狀
劉彤認為“大數(shù)據(jù)產(chǎn)業(yè)已經(jīng)過了造概念階段了”。仟躍數(shù)據(jù)合作伙伴、北京創(chuàng)數(shù)紀信息技術有限責任公司成立于2016年11月,以運營商數(shù)據(jù)為主數(shù)據(jù)源,結(jié)合獨家網(wǎng)絡爬取自學數(shù)據(jù)、社會公開數(shù)據(jù)、行業(yè)合作數(shù)據(jù)等,建立了互聯(lián)網(wǎng)用戶畫像標簽體系,為企業(yè)提供大數(shù)據(jù)商業(yè)價值挖掘服務。
從整體行業(yè)發(fā)展階段來看,大數(shù)據(jù)產(chǎn)業(yè)體現(xiàn)出兩種現(xiàn)象:
第一種現(xiàn)象:
很多大數(shù)據(jù)公司以編織“大數(shù)據(jù)”概念為主,目的是圈到投資人的錢,讓資本為概念買單,也讓客戶為概念買單,從而再繼續(xù)提升公司估值,周而復始。這種做法帶來的后果是,當客戶和投資人揭開其大數(shù)據(jù)概念的外衣看到名不符實的本質(zhì)后,就一去不回,導致一大批大數(shù)據(jù)公司由盛轉(zhuǎn)衰,行業(yè)差點進入“悲鳴期”。不過,“這一波公司現(xiàn)在看已經(jīng)是過去式了”。
第二種現(xiàn)象:
被第一波大數(shù)據(jù)公司“忽悠”后,行業(yè)客戶和投資人心態(tài)都發(fā)生了變化,開始看重項目本身的商業(yè)價值和實際應用效果,投資和服務采購變得更加理性。在當前這種市場大環(huán)境下,大數(shù)據(jù)公司也開始注重數(shù)據(jù)在行業(yè)應用場景中的實際價值。
劉彤認為:當前在大數(shù)據(jù)領域創(chuàng)業(yè)遇到最大的困境是,需要重新引導客戶和投資人,修正因概念型大數(shù)據(jù)公司造成的判斷扭曲,走出大數(shù)據(jù)概念化的誤區(qū)。即便行業(yè)仍然魚龍混雜,但對于投資人和客戶來說,只要摸清了套路,就可以判斷一家大數(shù)據(jù)公司是否靠譜。
辨別一家大數(shù)據(jù)公司的“真?zhèn)巍?,可以試問以下四個問題:
1、數(shù)據(jù)源的獲取方式
如果公司連獲取數(shù)據(jù)的渠道都沒有,“大數(shù)據(jù)”還是只處于概念階段,服務更是無從談起;
2、數(shù)據(jù)中包含哪些信息
數(shù)據(jù)的意義在于其包含的信息價值,如果都是無價值數(shù)據(jù),這種所謂的大數(shù)據(jù)就無法有效使用;
3、數(shù)據(jù)獲取渠道是否合法
如果公司是從黑市購買數(shù)據(jù),或從其他非法渠道獲取,這會為客戶帶來合作風險;
4、是否具備可持續(xù)提供數(shù)據(jù)服務的能力
大數(shù)據(jù)公司提供的應用場景并不是一錘子買賣,要想跟客戶保持長期合作,就要具備持續(xù)提供數(shù)據(jù)服務的能力。
而對于創(chuàng)數(shù)紀來說,數(shù)據(jù)源主要是運營商數(shù)據(jù),這些數(shù)據(jù)包含:用戶標識、上網(wǎng)IP地址、上網(wǎng)應用類型、行為發(fā)生時間、行為產(chǎn)生流量、上網(wǎng)域名和url地址、操作系統(tǒng)等各種緯度的數(shù)據(jù),可以提煉的數(shù)據(jù)價值非常豐富。對于外界很關心的數(shù)據(jù)安全問題,創(chuàng)數(shù)紀在獲得運營商數(shù)據(jù)分析權時,非常嚴格的管理了數(shù)據(jù)挖掘處理過程,保證了數(shù)據(jù)信息獲取的合法性,并且,運營商是持續(xù)供應數(shù)據(jù),給創(chuàng)數(shù)紀提供了可持續(xù)提供數(shù)據(jù)場景服務的必要條件。最大的行業(yè)困難還是數(shù)據(jù)孤島問題,用戶在淘寶、京東、微博、微信等眾多平臺留下的數(shù)據(jù)都不一樣,企業(yè)如果只通過特定業(yè)務渠道收集數(shù)據(jù),是無法進行完整用戶行為收集的,這樣也就無法精確的進行用戶畫像和行為標簽化?!暗脩舨还茉诰W(wǎng)上使用任何業(yè)務,都需要通過承載互聯(lián)網(wǎng)的三大運營商連接。對于運營商來說,只要用戶使用網(wǎng)絡時接入的是它的網(wǎng)絡,就可以記錄用戶在網(wǎng)上的所有行為數(shù)據(jù)。這種數(shù)據(jù)對于任何自身用戶有互聯(lián)網(wǎng)行為體現(xiàn)的企業(yè)來說,都適合用來搭建用戶畫像模型。所以,我們選擇與運營商合作,用他們的數(shù)據(jù)作為主數(shù)據(jù)源。
創(chuàng)數(shù)紀具有豐富的知識庫,能夠?qū)?5%的互聯(lián)網(wǎng)行為進行識別,覆蓋26大行業(yè)、15大垂直維度,形成總量超過30萬的上網(wǎng)行為標簽庫。通過這些知識庫,能夠?qū)⒃嫉纳暇W(wǎng)行為記錄翻譯成逐個用戶的特征標簽。大到一個行業(yè)、一類人群、一個特定省份,小到用戶在各個應用上的行為表現(xiàn)都能夠進行標記。并生成逐日的用戶標簽化統(tǒng)計數(shù)據(jù)?!皹撕灮瘮?shù)據(jù)其實相當于用戶行為脫敏后的數(shù)據(jù),是可以保證數(shù)據(jù)輸出的合規(guī)合法”。
有了運營商數(shù)據(jù),如何為客戶提供場景服務呢?
創(chuàng)數(shù)紀CEO劉彤表示,利用大數(shù)據(jù)為企業(yè)提供的服務可分為兩個階段:第一階段是獲客,通過分析用戶數(shù)據(jù),幫助企業(yè)鎖定目標受眾人群,通過分析目標受眾的群體性行為、喜好等特征,指導企業(yè)制定獲取新客戶的方法;第二階段是留客,通過大數(shù)據(jù)分析技術,可詳盡洞察自有用戶互聯(lián)網(wǎng)行為特性,幫助企業(yè)提升自有用戶體驗,提高用戶活躍度,提升用戶的消費活性。
對于創(chuàng)數(shù)紀來說,就是利用大數(shù)據(jù)技術,為企業(yè)客戶提供行業(yè)解決方案以及分析報告等服務,幫助企業(yè)塑造品牌形象、提高用戶黏性、提升企業(yè)收益、降低運營成本?!拔覀円龅木褪?,利用大數(shù)據(jù)技術,幫助客戶把原本看起來雜亂無章的事情變得條理化、可以控制。企業(yè)可以通過數(shù)據(jù)來做決策,而不是靠拍腦袋決定”。
大數(shù)據(jù)底層技術并不能成為大數(shù)據(jù)公司的競爭壁壘,因為客戶通常并不在乎大數(shù)據(jù)公司能提供哪些技術,在乎的是提供了哪些高價值的應用服務。而就大數(shù)據(jù)技術這點從全球范圍來看,只有為數(shù)不多的幾家頂級高科技企業(yè)才真正有能力研發(fā)大數(shù)據(jù)底層技術,其他大多數(shù)公司都是其技術的使用者。對于競爭,劉彤認為,從創(chuàng)數(shù)紀自身來說數(shù)據(jù)源當然不是問題,對應用場景及客戶需求的理解能力也不是問題。劉彤坦言:“這非常依賴于團隊豐富的行業(yè)經(jīng)驗和認知水平,有團隊經(jīng)驗、有數(shù)據(jù)條件、有工作思路和方法,這三條是我們的競爭優(yōu)勢”。競爭對手唯一有可能的優(yōu)勢就是在技術方面,比如在開源社區(qū)做了多少有效貢獻,或是如何在標準組件做二次開發(fā)形成特有的應用模塊。如果這些都沒有,只是使用了標準Hadoop技術,就無法將底層技術作為核心競爭力,而這些能力,創(chuàng)數(shù)紀也都具備。
如今的大數(shù)據(jù)企業(yè)正處在從概念向應用轉(zhuǎn)型的階段,如何利用大數(shù)據(jù)幫助客戶提升業(yè)績已變得異常關鍵。最后,劉彤再次強調(diào):“我們希望改變以前大數(shù)據(jù)企業(yè)的固有模式,不要再讓投資方和客戶受到傷害。我們要做的是先幫客戶做更大的蛋糕,然后讓大家一起來分,而不是我們上來就先分客戶已有的蛋糕”。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10