
從五大行業(yè)案例,看大數(shù)據(jù)的應用邏輯
本文從一則搞笑的大數(shù)據(jù)應用案例入手:某超市通過分析一位女顧客的購物數(shù)據(jù)(包括購物清單,瀏覽物品,咨詢信息,視頻監(jiān)控信息<超市內徘徊區(qū)域>等),根據(jù)分析結果給該女顧客寄來了孕嬰童試用品,這一舉動讓該女顧客的父親非常生氣,立馬致電該超市投訴,因為她女兒還未成年!超市經理立馬登門拜訪道歉,不過事實是,不久后這位小女孩因遮蓋不住隆起的腹部而不得不向父親告知真相:她真的懷孕了。對于企業(yè)而言,大數(shù)據(jù)有時候就像是一個偵探家,能夠撥開重重迷霧,找到問題的本質以及解決方案,而關鍵在于,你是否真的懂得如何去駕馭它,讓它為你服務。
在經歷了喊口號、布局深耕之后,大數(shù)據(jù)應用開始顯現(xiàn)出巨大的商業(yè)價值,觸角已延伸到零售、金融、教育、醫(yī)療、體育、制造、影視、政府等各行各業(yè)。隨著中國企業(yè)數(shù)據(jù)中心數(shù)據(jù)存儲量的快速增長,非結構化數(shù)據(jù)呈指數(shù)級增長,有效地處理和分析結構化數(shù)據(jù)和非結構化數(shù)據(jù)中所富含的對企業(yè)和政府有價值的信息將帶動新的盈利模式、管理模式、創(chuàng)新模式以及思維模式。
在維克托·邁爾·舍恩伯格的《大數(shù)據(jù)時代》一書中解釋,大數(shù)據(jù)是指不用隨機分析法(抽樣調查)這樣的捷徑,而采用所有數(shù)據(jù)的方法。隨著云時代的來臨,大數(shù)據(jù)也吸引了越來越多的關注。大數(shù)據(jù)是繼云計算、物聯(lián)網之后IT產業(yè)又一次顛覆性的技術變革,消費者的網絡足跡是互聯(lián)網基因 ,網絡中的足跡、點擊、瀏覽、留言直接反映消費者的性格、偏好、意愿等,互聯(lián)網交互大數(shù)據(jù)就是研究每個用戶碎片行為的過程。大數(shù)據(jù)對于經濟發(fā)展、企業(yè)決策、組織和業(yè)務流程,對個人生活方式等都將產生巨大的影響。
大數(shù)據(jù)作為當下非常火爆的一個詞,其價值不言而喻,今天,我們不談價值,通過聚攏一些實實在在的應用,如電商,傳統(tǒng)金融,互聯(lián)網金融,醫(yī)療,制造五大領域的案例,進而衍射出大數(shù)據(jù)內在的應用邏輯。
“用戶畫像”直擊零售商需求
在如此激烈而又龐大的市場中,電商們迫切想知道的想必就是用戶需求。當這個用戶登陸網站的瞬間,就能猜出來這個用戶今天為何而來,然后從電商的商品庫里面把合適的商品找出來并推薦給他,進而展現(xiàn)出符合客戶需求的產品都有哪幾款。這種服務是消費者想要的,但是誰能幫助電商們做到呢?
隨著互聯(lián)網和電子商務的快速發(fā)展,“用戶畫像”這個概念悄然而生,它抽象地描述了一個用戶的信息全貌,是進行個性化推薦、精準營銷、廣告投放等應用的基礎。
如某電子商務平臺通過客戶的網絡瀏覽記錄(點擊、鏈接等)和購買記錄等掌握客戶的消費模式,從而分析并分類客戶的消費相關特性如收入、家庭特征、購買習慣等,最終掌握客戶特征,并基于這些特征判斷其可能關注的產品與服務,從消費者進入網站開始,在列表頁、單品頁、購物車頁等四個頁面,部署了5種應用不同算法的推薦欄為其推薦感興趣的商品,從提高商品曝光,促進交叉/向上銷售連個角度對網站進行全面的優(yōu)化,應用后商城提升下定訂單轉化率增長66.7%、下定商品轉化率增長18%、推薦欄上線前后動銷量增長46%。將消除個人信息后的數(shù)據(jù)魔方賣給商家,方便商家調整產品投放策略,提升服務,精準挽留客戶,進而提高客戶粘性。
還有,在互聯(lián)網沖擊下,大部分傳統(tǒng)零售商必須要做改變,大數(shù)據(jù)下的用戶思維便成為符合其需求的一種互聯(lián)網思維方式和實際體驗。那何為大數(shù)據(jù)體系下的用戶思維呢?其實就是以“用戶畫像”最為核心和基礎,通過線上、線下,交易、交互等各種結構化和非結構化的數(shù)據(jù),讓用戶更加完整的展現(xiàn)在企業(yè)面前,該用戶是誰?他在哪里?怎么聯(lián)系到她?她需要什么產品?她通過哪些渠道購買?她得購買習慣是怎樣的?……,在完整的用戶畫像面前,零售企業(yè)相對于面對“裸泳”的用戶,用戶需要什么,怎么獲取,怎么營銷一目了然,大數(shù)據(jù)時代的來臨,讓用戶畫像有了基礎,用戶畫像的完善更讓零售商有了連接線上和線下,用互聯(lián)網方式進行商業(yè)運營的可能,傳統(tǒng)零售商互聯(lián)網運營管理的時代算也已悄然來臨。
再比如沃爾瑪和寶潔,一個是非常了解消費者在線下店里購買行為的傳統(tǒng)連鎖零售巨頭,一個是掌握消費者偏好的品牌,他們從不同的角度去搜集消費者的數(shù)據(jù)。但這還遠遠不夠,如果將這些數(shù)據(jù)和汽車生產制造商,乃至上下游企業(yè)共享一些數(shù)據(jù),就會讓這個鏈條中不同的企業(yè)對于數(shù)據(jù)、消費者有更深刻的洞察,從而通過多維數(shù)據(jù)來提高運營效率。
然而,隨著大數(shù)據(jù)應用的發(fā)展,隱私保護的問題和概念也在不斷地發(fā)展,網絡用戶在互聯(lián)網的評論、圖片、視頻、個人信息、興趣愛好、交易信息、訪問的網站等等均被企業(yè)記錄在案。企業(yè)掌握了大量消費者的行為數(shù)據(jù),對大數(shù)據(jù)進行整合和分析,從而可以發(fā)現(xiàn)新的商機,創(chuàng)造新的價值。然而這些數(shù)據(jù)經常包含消費者的真實信息,如在淘寶網上交易時的真實姓名、家庭住址以及銀行賬號等重要的真實信息,逐漸引起了我們對個人隱私的擔憂。正如美國著名的計算機專家迪博德所言,在信息時代,計算機內的每一個數(shù)據(jù)、每一個字節(jié),都是構成一個隱私的血肉。信息加總和數(shù)據(jù)整合,對隱私的穿透力不僅僅是“1+1=2”的,很多時候,是大于 2 的。因此,針對隱私保護方面的問題,電子商務企業(yè)應該恪守行業(yè)道德,不能將消費者的個人信息進行交易和泄露,我們國家也應該盡快制定并完善與之相應的隱私保護的法律和法規(guī),確實保護公民的隱私權。
客戶價值最大化 破冰傳統(tǒng)金融業(yè)
在大數(shù)據(jù)時代,越來越多的企業(yè)管理者已意識到了業(yè)務分析的重要性。業(yè)務分析洞察已經成為了企業(yè)轉型的有利抓手。當然,銀行也不例外,從以產品為中心,也就是銷售產品和服務轉向現(xiàn)在以客戶為中心,更像零售業(yè)和制造商。對于以客戶為中心的企業(yè),最重要的一點是了解到客戶到底是誰,以及客戶到底有怎樣的需求。
當下,銀行業(yè)都在大力投入資金做著以下三件事:一是建立客戶的單一視窗,將以前不同銀行部門所了解的客戶情況集成在一起;二是按照用戶行為對用戶進行分類,將之前按照地理區(qū)域、年齡、收入分類改為按照用戶行為來對用戶進行分類;三是為客戶提供質量一致的客戶體驗,不管用戶通過銀行網點、移動設備還是社交媒體等渠道來使用銀行服務,都要為客戶提供質量一致的體驗。
隨著互聯(lián)網,特別是移動互聯(lián)網的不斷發(fā)展,互聯(lián)網金融也在給傳統(tǒng)金融業(yè)帶來不小的沖擊,不過,互聯(lián)網金融是否會對銀行等傳統(tǒng)機構構成威脅仍無法得出定論。但是,這并不表示銀行業(yè)可以忽視這股沖擊的浪潮,在這個大數(shù)據(jù)不斷壯大的時代,傳統(tǒng)金融業(yè)如何利用大數(shù)據(jù)來不斷創(chuàng)新與變革,如何借助大數(shù)據(jù)降低金融風險,提升客戶體驗,進而挖掘客戶價值最大化是每個企業(yè)都應該深入思考的問題。
如某金融全牌照集團公司希望學習美國花旗集團對已有客戶價值挖掘最大化的經驗,對現(xiàn)有保險客戶進行深度分析,通過對已有客戶的大數(shù)據(jù)分析及問卷調查來細分人群、刻畫人群需求特征,從而制定針對不同客戶群體的集保險、銀行、投資、證券、資產管理、信托等一攬子綜合金融產品策略,為客戶提供一站式財務金融解決方案,以期得到每個客戶最大價值。
在選用大數(shù)據(jù)解決方案后,通過分析已有保險客戶數(shù)據(jù)及外部調研問卷,將人群細分為統(tǒng)計學上顯著區(qū)別的人群;根據(jù)群體規(guī)模、年齡、性別、教育水平、家庭特征、現(xiàn)階段的收入、消費、理財?shù)刃袨槟J揭约八麄兯幍纳c財富階段,精準分析群體的需求動因后制定有針對性的產品策略及營銷策略。
但是,面對來勢洶洶的互聯(lián)網企業(yè),傳統(tǒng)金融業(yè)們也在加快步伐,但還是沒有互聯(lián)網企業(yè)動作快。目前,互聯(lián)網金融業(yè)正從單純的支付業(yè)務向轉賬匯款、跨境結算、小額信貸、現(xiàn)金管理、資產管理、供應鏈金融、基金和保險代銷、信用卡還款等傳統(tǒng)銀行業(yè)務領域滲透。除了存款,銀行的主要業(yè)務幾乎已遇到全面挑戰(zhàn)。互聯(lián)網金融正在叫板傳統(tǒng)金融,傳統(tǒng)金融業(yè)又該何去何從?值得思考。
精準營銷 加速互聯(lián)網金融沖刺
在國外,大數(shù)據(jù)金融領域的應用相對成熟,我們先來回顧一下在美國做得非常典型的大數(shù)據(jù)金融的三大案例。
人們習慣性地認為,只有銀行才能建立信用體系,然而在大數(shù)據(jù)時代,互聯(lián)網公司運用大數(shù)據(jù)控制信貸風險已初露端倪。
在進行數(shù)據(jù)處理之前,對業(yè)務的理解、對數(shù)據(jù)的理解非常重要,這決定了要選取哪些數(shù)據(jù)源進行數(shù)據(jù)挖掘,而且越來越多的互聯(lián)網在線動態(tài)大數(shù)據(jù)被添加進來。例如一個虛假的借款申請人信息就可以通過分析網絡行為痕跡被識別出來,一個真實的互聯(lián)網用戶總會在網絡上留下蛛絲馬跡。對征信有用的數(shù)據(jù)的時效性也非常關鍵,通常被征信行業(yè)公認的有效的動態(tài)數(shù)據(jù)通常是從現(xiàn)在開始倒推24個月的數(shù)據(jù)。
通過多渠道獲得的數(shù)據(jù)來源,利用數(shù)學運算和統(tǒng)計學的模型進行分析,從而評估出借款者的信用風險,典型的企業(yè)是美國的ZestFinance。這家企業(yè)的大部分員工是數(shù)據(jù)科學家,他們并不特別地依賴于信用擔保行業(yè),用大數(shù)據(jù)分析進行風險控制是ZestFinance的核心技術。他們的原始數(shù)據(jù)來源非常廣泛。 他們的數(shù)據(jù)工廠的核心技術和機密是他們開發(fā)的10個基于學習機器的分析模型,對每位信貸申請人的超過1萬條原始信息數(shù)據(jù)進行分析,并得出超過7萬個可對其行為做出測量的指標,而這一過程在5秒鐘內就能全部完成。事實上,在美國,征信公司或者大數(shù)據(jù)挖掘公司的產品不僅用于提供給相關企業(yè)用于降低金融信貸行業(yè)的風險,同時也用于幫助做決策判斷和市場營銷。
還有,利用社交網站的大數(shù)據(jù)進行網絡借貸的典型是美國的Lending Club。Lending club于2007年5月24日在facebook上開張,通過在上面鑲嵌的一款應用搭建借貸雙方平臺。利用社交網絡關系數(shù)據(jù)和朋友之間的相互信任聚合人氣。借款人被分為若干信用等級,但是卻不必公布自己的信用歷史。
還有 一家在美國為網上商家提供金融信貸服務的公司Kabbage,于2010年4月上線,主要目標客戶是ebay、Amazon、PayPal等電商。它的奇特之處在于,其通過獲取ebay等公司的網店店主的銷售、信用記錄、顧客流量、評論、商品價格和存貨等信息,以及他們在Facebook和Twitter上與客戶的互動信息,借助數(shù)據(jù)挖掘技術,把這些店主分成不同的風險等級,以此來確定提供貸款金額數(shù)量與貸款利率水平,風險過高則拒絕,風險高低與利率成正比,與貸款金額成反比。
顯然,若以銀行體系來評價這類網上商家大多數(shù)都不符合銀行的貸款資格,不過在互聯(lián)網時代,Kabbage的案例說明了運用大量數(shù)據(jù)足以支撐這些小微企業(yè)信用評價體系。當然,Kabbage的這種模式也在國內被成功運用,其中,宜信的互聯(lián)網金融產品就是以互聯(lián)網為獲客主要渠道,除了借貸信用記錄,還結合大數(shù)據(jù)分析技術,捕捉來自大眾點評、豆瓣等社交網絡上的有用信息,幫助信用審核人員多維度分析借款客戶的信用狀況。
大數(shù)據(jù)對于互聯(lián)網金融的助推作用首要體現(xiàn)在尋找合適的目標用戶,實現(xiàn)精準營銷?;ヂ?lián)網金融領域的新創(chuàng)企業(yè)或做貸款,或賣產品,憑借高額收益率,手續(xù)費優(yōu)惠,吸引用戶選擇自己。然而,在越來越多同類企業(yè)吹響混戰(zhàn)號角的同時,互聯(lián)網金融企業(yè)也不得不面對來自同行業(yè)的競爭。欲在競爭激烈的市場中占有一席之地,互聯(lián)網金融企業(yè)需要更精準地定位產品,并推送給自己的目標人群。誰是潛在的購買者?如何找到他們?并讓他們產生興趣?精準營銷的實現(xiàn)程度是互聯(lián)網金融企業(yè)存活與崛起的關鍵所在,這個領域雖然未達到成熟的發(fā)展狀態(tài),但確實已經有了一些有參考價值的營銷案例。如:
大數(shù)據(jù)通過動態(tài)定向技術查看互聯(lián)網用戶近期瀏覽過的理財網站,搜索過的關鍵詞,通過瀏覽數(shù)據(jù)建立用戶模型,進行產品實時推薦的優(yōu)化投放,直擊用戶所需。
其次就是風控。通過分析大量的網絡交易及行為數(shù)據(jù),可對用戶進行信用評估,這些信用評估可以幫助互聯(lián)網金融企業(yè)對用戶的還款意愿及還款能力做出結論,繼而為用戶提供快速授信及現(xiàn)金分期服務。
事實上一個人或一個群體的信用好壞取決于諸多變量,如收入,資產,個性,習慣等,且呈動態(tài)變化狀態(tài)??梢哉f數(shù)據(jù)在個人信用體系中體現(xiàn)為芝麻信用,它便于解決陌生人之間以及商業(yè)交易場景中最基本的身份可信性問題,以及幫助互聯(lián)網金融產品和服務的提供者識別風險與危機。這些數(shù)據(jù)廣泛來源于網上銀行,電商網站,社交網絡,招聘網,婚介網,公積金社保網站,交通運輸網站,搜索引擎,最終聚合形成個人身份認證,工作及教育背景認證,軟信息(包括消費習慣,興趣愛好,影響力,社交網絡)等維度的信息。
對于P2P網貸行業(yè)而言,能否利用互聯(lián)網技術有效地搜集用戶信息,并對用戶的信用信息進行判定和管理,成為考量一家P2P網貸平臺風控水平的重要標準。嚴密的風控手段是保證平臺出借人的資金安全的重要環(huán)節(jié),在風控技術手段創(chuàng)新探索方面,宜信宜人貸作為行業(yè)技術創(chuàng)新的代表,顯然走得更快人一步。其已通過精確的風險建模,實現(xiàn)了對用戶資質的高效審批,為用戶提供更便捷的體驗。它是基于對自身平臺數(shù)萬名借款用戶的了解,同時借鑒宜信八年累積的對于用戶的了解,從地域、年齡段、職業(yè)、等多維度對借款用戶進行了劃分,通過精確的風險模型建立,宜信宜人貸建立了一套獨有的,行之有效的信用評估系統(tǒng),通過對用戶信息的多維度考察,能夠快速對用戶的信用資質進行評定,從而極大地提升服務效率。
如某P2P小額信貸機構如何使用個人及機構的外部數(shù)據(jù)建立自己的征信系統(tǒng),在極其有限的客戶實質接觸基礎上僅憑問卷數(shù)據(jù)、自有數(shù)據(jù)庫等對不同客戶進行信用評估,并結合內部業(yè)務數(shù)據(jù)建立風險定價系統(tǒng)、風險預警系統(tǒng)、風險管控方案、應對欺詐規(guī)則、懲罰方案等一系列影響核心業(yè)務盈利能力的系統(tǒng)方案。
通過采用大數(shù)據(jù)解決方案后,通過自建、購買、客戶授權后合作分享等多種方式整合包括互聯(lián)網社交網絡數(shù)據(jù)在內的多種數(shù)據(jù)、建立個人及機構消費、借貸、財務交易、資金往來等多源信用數(shù)據(jù)庫,在此基礎上建立符合自身業(yè)務范圍的客制化信用評估模型,根據(jù)此模型評估借、貸款雙方的信用等級。通過建模確立如何匹配借貸雙方,與具體業(yè)務相應的風險評級、授權等級、額度發(fā)放等級以及與此相應的風險價格等,并通過已有拖欠、欺詐案例反饋回模型進行機器識別,進一步完善模型。
未來,依托于互聯(lián)網大數(shù)據(jù)技術的發(fā)展,相信將會出現(xiàn)更優(yōu)質,更便捷的P2P網貸服務,來幫助更多有信用的借款人釋放信用的價值,讓信用生金。
但是,互聯(lián)網金融在如此大好的機遇面前,自身也隱匿著一些繞不開的難題。一方面,其以新生事物野蠻式生長,帶來便捷的同時,如何解決風控的問題,是當前互聯(lián)網金融必須解決的一個問題;但是另一方面,也面臨自身因監(jiān)管缺失帶來的風險。可見,互聯(lián)網金融還有待于時間的磨練。
個性化數(shù)據(jù) 為醫(yī)療插上智慧的翅膀
凱文·凱利(KK)在《失控》的第22章,“預言機”里曾提到:信息就是數(shù)據(jù),數(shù)據(jù)一旦流動,就創(chuàng)造出透明。社會一旦聯(lián)網,就可以了解自己。所以,很多熱衷于大數(shù)據(jù)概念的人,他知道哪里有數(shù)據(jù),卻沒有辦法去促成數(shù)據(jù)的流動。
所以,第一要義,數(shù)據(jù)如何才能形成流動?它的驅動力在哪里?以現(xiàn)在很熱的醫(yī)療健康大數(shù)據(jù)為例,來探究數(shù)據(jù)是如何流動的?
維克托 邁爾-舍恩伯格的《大數(shù)據(jù)時代》一書中有兩個關于大數(shù)據(jù)與公共衛(wèi)生結合的案例令人印象深刻:
喬布斯自罹癌至離世長達8年之久,這幾乎創(chuàng)造了胰腺癌歷史上的奇跡。據(jù)悉,喬布斯曾在此期間支付大量費用獲得了自己包括整個基因密碼在內的數(shù)據(jù)文檔。借此,醫(yī)生們能基于喬的特定基因組成以及大數(shù)據(jù)按所需效果用藥,并調整醫(yī)療方案。
如果上述案例是個體的,那么帶來群體價值的案例,便是Google成功預測流感爆發(fā)期。2009年甲型H1N1流感爆發(fā)幾周前,Google通過對人們網上搜索記錄的觀察、分析、建模,結果顯示,他們的預測與官方數(shù)據(jù)的相關性高達97%,且判斷比疾控中心更及時。
從個人健康管理到公共健康管理,大數(shù)據(jù)在對個人醫(yī)療的改變以及極富價值的預警能力吸引著IT巨頭們迫不及待與醫(yī)療聯(lián)姻。例如在中國,某慢性病管理遠程醫(yī)療解決方案供應商計劃外包商保的糖尿病遠程管理業(yè)務,需要提供:人群的糖尿病管理方案包括接觸、回應、問卷、回饋、互動、宣教、指導、測試結果報告、產品銷售等各個環(huán)節(jié)的方案設計以及人群配合度、依從性、短期及長期醫(yī)療效果、經濟效果評估方案。遠程醫(yī)療提供方方案中的的成本、經濟效益回報會作為與商保、社保合作方案中的重要組成部分。
通過采用大數(shù)據(jù)解決方案后,利用既往研究、文獻及歷史數(shù)據(jù)中的結果為外包業(yè)務人群設計糖尿病病管理全流程數(shù)據(jù)分析方案,包括數(shù)據(jù)生成、采集、分析方案等,依據(jù)一定假設利用糖尿病決策樹模型來逐層確定慢病管理各個環(huán)節(jié)中的成本及產出。應接觸人群、反饋人群、互動人群、依從人群、效果人群、對比人群生成及最終的醫(yī)療效果、經濟效果評估方案是本項目的關鍵。利用遠程終端的客戶反饋數(shù)據(jù)分析提高客戶反饋、依從、購買產品的策略,平衡成本與樣本規(guī)模,提高供應商的投產比;使用統(tǒng)計學方法清楚論證及展示慢性病管理遠程醫(yī)療解決方案的經濟學價值,投入產出比。便利供應商開展與社保、商保的合作;提高供應商自身的投產比。
雖然我們談了許多關于醫(yī)療行業(yè)大數(shù)據(jù)的價值和作用,但今天的大數(shù)據(jù)在醫(yī)療行業(yè)應用仍然處于初級應用的階段,部分醫(yī)療機構僅使用了初級功能如BI等,要想讓醫(yī)療行業(yè)把大數(shù)據(jù)發(fā)揮出最大的價值,需要解決以下幾方面問題:
從技術角度來看,數(shù)據(jù)采集及標準問題。收集數(shù)據(jù)是大數(shù)據(jù)基礎,但目前醫(yī)療機構采集數(shù)據(jù)的能力有限,阻礙了大數(shù)據(jù)的應用;從醫(yī)療經營角度來看,管理層缺乏數(shù)據(jù)價值認知問題。雖然目前醫(yī)療機構領導們對于數(shù)據(jù)的重視程度很高,但是范圍僅僅局限于對于內部的數(shù)據(jù)認知,從總體來看,并沒有意識到外部數(shù)據(jù)如互聯(lián)網數(shù)據(jù)與內部數(shù)據(jù)的結合所產生的價值;從投入成本角度來看,現(xiàn)在大數(shù)據(jù)的投入產出比不明確?,F(xiàn)在IT投資都需要講ROI(投資回報率),由于醫(yī)療行業(yè)缺乏大數(shù)據(jù)的成熟案例,考慮到成本因素,企業(yè)決策者大都不都不敢隨便在大數(shù)據(jù)領域砸錢;從產品角度來看,大數(shù)據(jù)產品單一,行業(yè)成熟度不夠。
從以上問題我們可以看出,醫(yī)療行業(yè)開展大數(shù)據(jù)仍然有一段路要走,不過面對所存在的問題,未來隨著技術的推進、意識的提高、成本的下降以及相關政策的成熟,相信用不了幾年時間就可以逐步解決問題,未來,大數(shù)據(jù)必然能夠為醫(yī)療行業(yè)提供更好的服務。
數(shù)據(jù)分析模型 讓制造業(yè)煥然一新
工業(yè)4.0時代正撲面而來。這是繼以蒸汽機、大規(guī)模流水線生產和電氣自動化為標志的前三次工業(yè)革命之后的第四次工業(yè)革命。其特點是通過充分利用嵌入式控制系統(tǒng),即物理信息融合系統(tǒng)(其中大數(shù)據(jù)扮演主角),實現(xiàn)制造業(yè)向智能化轉型。
20年滄桑巨變,今天中國已是全球制造業(yè)大國。來自中國工業(yè)與信息化部的統(tǒng)計數(shù)據(jù)顯示,2013年中國工業(yè)占GDP的37%,提供全國25%的就業(yè)崗位。在500余種工業(yè)產品中,有220多種產量居世界第一。中國制造業(yè)在全球的占比約為20%。然而,中國制造業(yè)面對云蒸霞蔚的移動互聯(lián)網和大數(shù)據(jù)景觀卻有些不知所措,若不趕緊扭轉局面,有可能逐漸喪失制造業(yè)大國的地位。大而不強是我們的軟肋,大多數(shù)中國工廠依然龜縮在產業(yè)鏈低端,缺少制造的核心材料、設備、工藝,停留在近乎原始的OEM(貼牌代工)階段,缺乏原創(chuàng)技術和創(chuàng)新產品。不過,憑借龐大的內需市場支撐,中國制造的優(yōu)勢尚存,13億人口積累的消費數(shù)據(jù)十分可觀。因此,如果能在大數(shù)據(jù)挖掘和分析上下點功夫,中國制造業(yè)還能保持較強的競爭力。
在中國制造業(yè)依托大數(shù)據(jù)打翻身仗的陣營中,小米可謂特立獨行的領頭羊。2010年成立的小米公司是中國制造業(yè)企業(yè)的成功典范,其主打產品小米手機已蜚聲海外,被業(yè)內視作蘋果、三星的潛在威脅。小米超越同行的業(yè)績,緣于其用包括軟件、硬件和應用生態(tài)的整體方法,小米在創(chuàng)造全新用戶體驗的同時,高擎大數(shù)據(jù)的旗幟,顛覆了中國制造業(yè)公司的傳統(tǒng)做法。有了這樣的底氣,小米董事長雷軍才敢與傳統(tǒng)制造業(yè)的空調玫瑰—格力掌門人董明珠立下10億元的對賭承諾。
那么,大數(shù)據(jù)是如何幫助研發(fā)人員提高新藥研發(fā)效率的呢?相關專業(yè)人士認為:首先,由于藥物的生物過程和藥物模型越來越復雜,大數(shù)據(jù)可以通過利用分子和臨床數(shù)據(jù),預測建模來幫助識別那些具有很高可能性被成功開發(fā)為藥物的安全有效的潛力備選新分子。其次,利用大數(shù)據(jù)可以幫助提升臨床試驗的效率。例如篩選臨床試驗受試者的篩選標準通過大數(shù)據(jù),可以瞄準特定人群,這樣臨床試驗就可以規(guī)模更小、時間更短、成本更低,更加有效。同時可以通過大數(shù)據(jù)分析來實時監(jiān)控臨床試驗,及早發(fā)現(xiàn)可能出現(xiàn)的問題,避免試驗過程中成本增加或出現(xiàn)不必要的延誤。第三,相對于原來僵化的數(shù)據(jù)孤島,使用大數(shù)據(jù)可以幫助數(shù)據(jù)在不同功能單元之間順暢流動。通過打破內部各功能之間的信息壁壘并提升跟外部合作伙伴的協(xié)作,制藥公司可以大幅擴展他們的知識和數(shù)據(jù)網絡,如與外部合作伙伴——醫(yī)生和CRO共享關鍵數(shù)據(jù)。數(shù)據(jù)的這種順暢流動,對能創(chuàng)造商業(yè)價值的實時預測性數(shù)據(jù)進行分析非常關鍵。
此外,為確保合理分配稀缺的研發(fā)資金,項目組合與產品線相關的快速決策至關重要。但制藥企業(yè)經常發(fā)現(xiàn),他們很難做出適當?shù)臎Q定。比如哪個項目該繼續(xù),或者有時更重要的是,哪個項目該砍掉。基于信息技術的項目組合管理能快速無縫地實現(xiàn)數(shù)據(jù)驅動的決策。通過數(shù)據(jù)分析當前項目的商業(yè)開發(fā)機會,預測其市場競爭力,幫助企業(yè)客觀地做出決定,以確保研發(fā)投入的合理性。
雖然大數(shù)據(jù)可以有效地幫助研發(fā)人員提升新藥研發(fā)效率,但目前大數(shù)據(jù)技術還有一些方面需要改進。牛津大學統(tǒng)計學教授彼得·多納利指出,目前大數(shù)據(jù)技術面臨的問題有三:首先,信息采集不足。大數(shù)據(jù)要發(fā)揮作用,首先要有足夠的病人、藥物等相關信息,這是數(shù)據(jù)分析的基礎,然而許多病人可能出于隱私考慮不愿提供這些信息,制藥企業(yè)也有可能因為商業(yè)利益不愿共享藥物成分等敏感信息,這就直接導致信息采集不足。
其次,要從海量信息中得出有用的結論,專業(yè)的數(shù)據(jù)分析必不可少,采集到足夠信息后,需要由相關領域的專業(yè)人士與信息技術專家一起對數(shù)據(jù)進行有針對性的歸納和分析,而這種跨學科、跨領域合作能否順利實現(xiàn),是大數(shù)據(jù)技術實際應用中的重要問題,而且正考驗著制藥企業(yè)的大數(shù)據(jù)整合能力。
第三,在技術層面還存在網絡容量有限的問題。很多新藥研發(fā)機構現(xiàn)有的基礎設施無法滿足海量信息分析和處理的需求,因此如何降低存儲成本,以及提升應用價值就成為大數(shù)據(jù)所面臨的關鍵技術難題。
雖然尚待完善,但毫無疑問的是,大數(shù)據(jù)在新藥研發(fā)中必將發(fā)揮越來越大的作用。
結語
從目前來看,大數(shù)據(jù)的應用范圍正在持續(xù)擴大,大數(shù)據(jù)的觸角正逐漸深入到各個領域,同時也是明天我們治理交通擁堵、霧霾天氣、看病難、食品安全等“城市病”的利器,也會為政府打開了解社情民意的更大窗口。
我們現(xiàn)在看這個世界,比如分析家中食品腐爛,主要就是依賴于我們的眼睛再加上我們的經驗,但如果我們有一臺顯微鏡,我們一下就看到壞細菌,那么分析起來完全就不一樣了。大數(shù)據(jù)就是我們的顯微鏡,它可以讓我們從全新視角來發(fā)現(xiàn)新的商業(yè)機會,并可能重構商業(yè)模型。我們的產品設計可能不一樣了,很多事情不用猜了,客戶的習慣和偏好一目了然,我們的設計就能輕易命中客戶的心窩;我們的營銷也完全不同了,我們知道客戶喜歡什么、討厭什么,更有針對性。特別是顯微鏡再加上廣角鏡,我們就有更多全新的視野了。這個廣角鏡就是跨行業(yè)的數(shù)據(jù)流動,使我們過去看不到的東西都能看到了。所以,最終大數(shù)據(jù)一定是跨行業(yè)流動的。
然而,我們也應該清楚的知道大數(shù)據(jù)在應用過程中尚存在很多問題:各政府、各行業(yè)間不公開和分享數(shù)據(jù),造成數(shù)據(jù)之間的割裂,無法產生數(shù)據(jù)的深度價值和綜合價值;很多應用系統(tǒng)涉及公民財產及隱私甚至國家安全,信息安全問題成為大數(shù)據(jù)應用重要難題;大數(shù)據(jù)市場尚未形成有效的評價、資格認證和準入機制等。當然,最重要的還是有賴于行業(yè)對于大數(shù)據(jù)時代到來的認識,警惕和應對。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網絡(RNN)家族中,長短期記憶網絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網絡(LSTM)作為循環(huán)神經網絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03