
七??偛脜喂鹑A談“互聯(lián)網(wǎng)+”大潮中的大數(shù)據(jù)機(jī)會與挑戰(zhàn)
面對信息化潮流,只有積極搶占制高點(diǎn),才能獲得發(fā)展先機(jī)。世界正在邁入大數(shù)據(jù)時代,這個時代蘊(yùn)藏著前所未有的機(jī)遇,我們可以選擇抓住機(jī)遇,也可以選擇成為這個時代的看客。那么,這個時代究竟發(fā)生了什么?2015全球云計算大會上,七牛總裁呂桂華為大家分析了數(shù)據(jù)為傳統(tǒng)企業(yè)帶來的變化,以及這些變化背后的機(jī)遇與挑戰(zhàn)。
他從銀行和支付寶的競爭關(guān)系談起,由于用戶可以決策是把錢存在銀行還是存到支付寶,所以他認(rèn)為支付寶難以均衡很多銀行在做的業(yè)務(wù)。此外,支付寶的芝麻信用分成為用戶申請簽證的依據(jù),而銀行則很難開拓該業(yè)務(wù),因為銀行沒有足夠的信息去評估用戶的信用體系,但支付寶則可以通過分析海量用戶消費(fèi)數(shù)據(jù)及行為數(shù)據(jù),對用戶進(jìn)行信用評估。這就是數(shù)據(jù)支撐的作用。
以數(shù)據(jù)為中心的世界
互聯(lián)網(wǎng)時代的世界是以數(shù)據(jù)為中心的世界。這些數(shù)據(jù)由人類與設(shè)備、與互聯(lián)網(wǎng)的交互產(chǎn)生。隨著技術(shù)的向前發(fā)展,人們的交互方式將越來越傾向于自己最喜歡的最自然的交流方式。曾經(jīng),信息獲取的主要途徑來自報紙等刊物,即人看報紙的這個交互方式是他們認(rèn)為最舒適的獲取信息的方式。事實上,對于人類的交互來講,講話是最舒適的,將要說的話打成一行字其實是人妥協(xié)于電腦的一種溝通方式。
此外,技術(shù)的發(fā)展還將使得系統(tǒng)會越來越聰明。例如,傳統(tǒng)報紙由編輯驅(qū)動,編輯的眼里沒有個體,只有群體。如上海市民最喜歡看什么新聞,他們可能的閱讀順序是怎樣的,因此,報紙的排版是面向上海市民整個群體的喜好。然而,今天的用戶更愛使用像“今日頭條”這樣的產(chǎn)品觀看新聞,今日頭條將根據(jù)讀者的使用習(xí)慣和閱讀喜好持續(xù)調(diào)整所推薦的新聞內(nèi)容,如果用戶對時裝感興趣,就為他推薦時裝相關(guān)信息,如果用戶從事IT工作,則可能會獲得IT訊息或者股市訊息的推薦,并且信息的推送也會越來越精準(zhǔn),這是系統(tǒng)越來越聰明的含義。事實上,現(xiàn)在的系統(tǒng)并未達(dá)到真正的“聰明”,它只是為信息進(jìn)行了分類,對用戶不感興趣的內(nèi)容進(jìn)行標(biāo)記,持續(xù)收集用戶的喜好。事實上,這個過程可以用更聰明的方式,例如通過用戶看哪些新聞的時間最長判斷他對哪些新聞感興趣。因此,讓“系統(tǒng)越來越聰明”的事情還有很大的發(fā)展空間。
實體店的挑戰(zhàn)與機(jī)遇
如今,人們購買東西時總會越來越依賴于電子商務(wù),那么,實體店該如何利用自身優(yōu)勢,借助大數(shù)據(jù)打一場翻身仗呢?如果沒有實體店,只有電子商務(wù),世界就變成了一個純虛擬的世界。因此,實體店鋪也有其存在的意義,如App Store實體店鋪提供的體驗難以被虛擬體驗所取代。鞋子合不合腳,自己穿了才知道。用戶在消費(fèi)時更希望觸摸到真實的商品,而非商品的圖片。淘寶、京東上展示的商品細(xì)節(jié)再多也只能通過圖片和文字,更何況這些圖片通常會被美化。所以,對用戶而言,實體店的意義在于能夠觸摸和試用商品,這種體驗難以被虛擬的體驗所取代。那么商戶開實體店而非網(wǎng)店的好處是什么?電子商務(wù)可以通過大數(shù)據(jù)分析研究客戶喜好,實體店同樣有自己的優(yōu)勢,即能與消費(fèi)者面對面接觸。在實體店里,商家可以直接感知客戶的情緒和趨向性,對于進(jìn)行貼身說服和收集最真實的反饋均有著重要的意義。
這里再舉個例子,七??蛻艉?涤兄豢羁蛇M(jìn)行客流統(tǒng)計的攝像頭產(chǎn)品,能幫助用戶記錄每天的客流量。在一些簡單的購物場景中,一個顧客如果到某個店里三四次但仍未購買任何產(chǎn)品,那這個客戶非常值得挖掘。潛在客戶的信息雖然在線上很容易收集到,但線下卻能收集最原始的信息,如這個客戶到底在徘徊什么,他在哪個區(qū)域停留時間最長,停留時在看什么產(chǎn)品,這些數(shù)據(jù)信息能否從視頻里提取出來?這才是大數(shù)據(jù)真正的意義。因此,大數(shù)據(jù)的含義不是分析數(shù)據(jù),關(guān)鍵是要知道從哪里收集大數(shù)據(jù),從而采集提取數(shù)據(jù)的價值。
數(shù)據(jù)時代的逆向思維
技術(shù)人員在做IT系統(tǒng)或者互聯(lián)網(wǎng)系統(tǒng)的時侯,通常會涉及到關(guān)鍵字的過濾或圖片識別。在做關(guān)鍵字過濾時總會采用最簡單的匹配模式,即軟件部門列出許多關(guān)鍵字,然后相關(guān)技術(shù)人員要將所列出的所有關(guān)鍵字過濾掉。這種通過自然的判斷,再進(jìn)行執(zhí)行的思維是正向思維的方式。然而,谷歌則是采用逆向思維的方式。谷歌在做關(guān)鍵字的過濾時,并不知道用戶在用哪些關(guān)鍵字做非法的事情,也不知道哪些關(guān)鍵詞需要被過濾。因此,它首先會創(chuàng)建很少的較確定的關(guān)鍵字列表,然后用它去觀測用戶使用這些關(guān)鍵字以后對結(jié)果的操作,由于用戶搜索該關(guān)鍵字并不一定就能搜到色情內(nèi)容,那么,用了這個明確的色情關(guān)鍵字以后點(diǎn)擊最多的是什么?他們判斷,用戶停留最長的結(jié)果肯定是相關(guān)的內(nèi)容,從而得出一大批跟他們目標(biāo)相吻合的結(jié)果,然后逆向地發(fā)現(xiàn),其他人是通過另外的關(guān)鍵字達(dá)到這個結(jié)果,再自動的生成一個需要關(guān)注的關(guān)鍵字列表。因此,在逆向思維里,有了數(shù)據(jù)以后可以逆向的分析事件結(jié)果來推導(dǎo)用戶的目的性。
這里舉出另一個逆向思維的例子,關(guān)于智能手環(huán),它主要收集人的健康狀態(tài),事實上,它不僅能分析個體的健康狀態(tài),它還能分析群體事件。例如通過數(shù)據(jù)分析發(fā)現(xiàn),某個地區(qū)的人群本應(yīng)該在睡覺,但當(dāng)收集的數(shù)據(jù)突然出現(xiàn)了運(yùn)動量的最高峰時,表示該地區(qū)一定發(fā)生了重大事件,這個思考點(diǎn)卻不是常人能想到的。從大數(shù)據(jù)角度來講,數(shù)據(jù)的逆向思維可以做很多大家原來沒有想過的事情。
“互聯(lián)網(wǎng)+”時代的大數(shù)據(jù)挑戰(zhàn)
“互聯(lián)網(wǎng)+”和“+互聯(lián)網(wǎng)”是互聯(lián)網(wǎng)時代的兩個概念,“互聯(lián)網(wǎng)+”意味著互聯(lián)網(wǎng)能夠顛覆所有的傳統(tǒng)產(chǎn)業(yè),而“+互聯(lián)網(wǎng)”則是指傳統(tǒng)產(chǎn)業(yè)加上互聯(lián)網(wǎng)后,互聯(lián)網(wǎng)企業(yè)無法對其進(jìn)行顛覆。這兩種觀念到底誰會活到最后?傳統(tǒng)產(chǎn)業(yè)認(rèn)為自己關(guān)系國計民生是不可能被顛覆的,互聯(lián)網(wǎng)行業(yè)卻在用事實證明它已經(jīng)顛覆了很多產(chǎn)業(yè)。而呂桂華認(rèn)為,過程不重要,關(guān)鍵是目標(biāo)在哪里。
傳統(tǒng)的數(shù)據(jù)分析主要通過收集信息、簡單的數(shù)據(jù)處理、數(shù)據(jù)的存儲、分發(fā)展示,然后對這些數(shù)據(jù)進(jìn)行挖掘以創(chuàng)造更好的用戶體驗,獲得商業(yè)的成功。存儲環(huán)節(jié)的數(shù)據(jù)包括數(shù)據(jù)本身及用戶的行為數(shù)據(jù),例如拍攝一張照片上傳其實有兩份數(shù)據(jù),一份是照片本身,另一份是誰在什么時候上傳了這張照片的日志數(shù)據(jù)。不論傳統(tǒng)產(chǎn)業(yè)還是互聯(lián)網(wǎng)產(chǎn)業(yè),都需要自我更新,最終要實現(xiàn)以數(shù)據(jù)驅(qū)動的商業(yè)模型。
七牛的解決方案
七牛的定位是做最開放、最完備的數(shù)據(jù)服務(wù)提供商。因此,七牛能在整個數(shù)據(jù)服務(wù)流程上幫助客戶,讓他們用較低的成本進(jìn)行大數(shù)據(jù)分析的嘗試。那么,我們該如何正確理解“互聯(lián)網(wǎng)+”呢?呂桂華有著他自己的見解,他認(rèn)為“互聯(lián)網(wǎng)+”其實指以互聯(lián)網(wǎng)為工具武裝的新業(yè)務(wù)思維。如上述中谷歌關(guān)鍵字過濾的案例,有數(shù)據(jù)的搜索方式和沒有數(shù)據(jù)的搜索方式有著本質(zhì)上的區(qū)別。如果還是用以前的方式做事情,就無需大數(shù)據(jù),因為人腦沒有辦法用大數(shù)據(jù)的方式思考問題和處理問題。所在在數(shù)據(jù)分析領(lǐng)域,需要有新的思維出現(xiàn)。
數(shù)據(jù)的重要性已勿庸置疑,因此,各企業(yè)應(yīng)該盡可能多地積累原始數(shù)據(jù),再去思考如何從中挖掘價值。數(shù)據(jù)的收集并不只是為了更精致地展示,獲取價值的關(guān)鍵是要知道用怎樣使用它。不同的行業(yè)需要思考的層面不一樣,需要顛覆的東西也不一樣,但顛覆的方式需要用數(shù)據(jù)的思維去思考,而不僅僅是把線下的業(yè)務(wù)平移到線上。
“互聯(lián)網(wǎng)+”時代的第一步是要收集更多的數(shù)據(jù),將數(shù)據(jù)存儲起來的同時再去思考到底要如何使用這些數(shù)據(jù)創(chuàng)造自己的核心競爭力。數(shù)據(jù)價值,始于存儲,因此,七牛希望幫助大家邁出“互聯(lián)網(wǎng)+”時代的第一步:開始收集數(shù)據(jù)!
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10