99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁職業(yè)發(fā)展大數(shù)據(jù)進行時:聚光燈后的四大推手
大數(shù)據(jù)進行時:聚光燈后的四大推手
2015-10-09
收藏

大數(shù)據(jù)進行時:聚光燈后的四大推手


“大數(shù)據(jù)”這一話題在國內(nèi)從今年起受到投資者追捧,也不斷有高技術(shù)人才選擇這個方向創(chuàng)業(yè);但實際上國外對于“大數(shù)據(jù)”,已經(jīng)走過了概念炒作階段,出現(xiàn)了實際的應(yīng)用,產(chǎn)生了實際的效益。周文哲這篇投稿,為我們詳細揭示了大數(shù)據(jù)盛行背后的原因,以及大數(shù)據(jù)在國外發(fā)展的情況。
推手一:數(shù)據(jù)的迸發(fā)
大數(shù)據(jù)的概念或許大家并不陌生,“大”字不僅意味著數(shù)量的龐大,還代表著數(shù)據(jù)種類繁多、結(jié)構(gòu)復(fù)雜,變化的速度也非???,這些特征的出現(xiàn)與互聯(lián)網(wǎng)的發(fā)展息息相關(guān)。從搜索引擎、社交網(wǎng)絡(luò)的普及到今天人手皆是的移動終端,互聯(lián)網(wǎng)上的信息總量正以每年 50% 的增速不斷膨脹,其中 90% 的信息來自近三年,包括每個月 Facebook 上分享的 30 億條內(nèi)容,每天 12 TB 的 Twitter 信息,每天淘寶上超過 30 億條店鋪、商品瀏覽紀錄及上千萬的成交、收藏紀錄等等。據(jù) IDC 統(tǒng)計,2011 年全球所產(chǎn)生的數(shù)據(jù)總量是 1.8 ZB(10 的 21 次方),如果把這些數(shù)據(jù)刻錄到 CD 碟片中,其摞起來的高度等于地球到月球的距離!
數(shù)據(jù)不僅在“量”上瘋狂的增長著,在“源”上也不斷的豐富著。目前世界上產(chǎn)生的數(shù)據(jù),有近 80% 是由個人用戶產(chǎn)生的;據(jù)估計,到 2020 年全球?qū)⒂?500 億個設(shè)備連入網(wǎng)絡(luò),地理位置、網(wǎng)絡(luò)瀏覽行為、健康數(shù)據(jù)、甚至基因信息等,都成為技術(shù)為個體服務(wù)的有效資源,這也意味著商家對每一個用戶都將有精準的了解,真正做到與客戶的“零距離”接觸。正是這種巨大的商業(yè)利益的驅(qū)使,使得大數(shù)據(jù)成為國際一流企業(yè)競相投入使用的競爭利器。
推手二:應(yīng)用的普及
今年年初,美國一名男子闖入了他家附近的 Target 店鋪(Target 是一家美國零售連鎖超市)?!澳銈冊趺茨苓@樣!”男人向店鋪經(jīng)理大吼到,“你們竟然給我 17 歲的女兒發(fā)嬰兒尿片和童車的優(yōu)惠券,她才 17 歲啊!”店鋪經(jīng)理不知道發(fā)生了什么,立刻向來者道歉,表明那肯定是個誤會。然而,經(jīng)理沒有意識到,公司正在運行一套大數(shù)據(jù)系統(tǒng)。一個月后,這個憤怒的父親打來電話道歉,因為 Target 發(fā)來的嬰兒用品促銷廣告并不是誤發(fā),他的女兒的確懷孕了。
諸如此類的應(yīng)用,在國際零售行業(yè)巨頭中已屢見不鮮,我們以 Target 作為首例,是因為它的案例的確留給人強烈的印象:數(shù)據(jù)的力量,不僅讓商家提升了自己的業(yè)績,還讓客戶為之心甘情愿買單。Target 創(chuàng)建了一套女性購買行為在懷孕期間產(chǎn)生變化的模型,不僅如此,如果用戶從他們的店鋪中購買了嬰兒用品,Target 在接下來的幾年中會根據(jù)嬰兒的生長周期情況定期給這些顧客推送相關(guān)產(chǎn)品,使這些客戶形成長期的忠誠度。
實際上,諸如沃爾瑪、Tesco(英國零售巨頭)等巨頭已從數(shù)據(jù)中獲得了巨大的利益,也因此鞏固了自己在業(yè)界的長盛不衰。以 Tesco 為例,這家全球利潤第二大的零售商從其會員卡的用戶購買記錄中,充分了解一個用戶是什么“類別”的客人,如速食者、單身、有上學(xué)孩子的家庭等等,并基于這些分類進行一系列的業(yè)務(wù)活動,比如,通過郵件或信件寄給用戶的促銷可以變得十分個性化,店內(nèi)的上架商品及促銷也可以根據(jù)周圍人群的喜好、消費的時段來更加有針對性,從而提高貨品的流通。這樣的做法為 Tesco 獲得了豐厚的回報,僅在市場宣傳一項,就能幫助 Tesco 每年節(jié)省 3.5 億英鎊的費用。
在互聯(lián)網(wǎng)行業(yè),大數(shù)據(jù)更是為電商、廣告商們提供了豐厚的回報。雅虎于 2008 年初便開始啟用大數(shù)據(jù)技術(shù),每天分析超過 200PB 的數(shù)據(jù),使得雅虎的服務(wù)變得更人性化,更貼近用戶和客戶。它與雅虎 IT 系統(tǒng)的方方面面進行協(xié)作,包括搜索、廣告、用戶體驗和欺詐發(fā)現(xiàn)等。AOL 也設(shè)立了 300 節(jié)點的服務(wù)器集群,將在其下屬系列網(wǎng)站(如 AOL.com、Huffington Post、MapQuest 等)中每天 500TB 的用戶瀏覽信息收集起來,分析和預(yù)測這些用戶的行為,以便有針對性的為每個月 1.8 億獨立用戶進行個性化廣告服務(wù)。
于亞馬遜(Amazon)而言,數(shù)據(jù)技術(shù)的應(yīng)用更是為其成為一家“信息公司”,獨占電商領(lǐng)域鰲頭奠定了穩(wěn)定的基礎(chǔ)。為了更深入的了解每一個用戶,亞馬遜不僅從每個用戶的購買行為中獲得信息,還將每個用戶在其網(wǎng)站上的所有行為都記錄下來:每個頁面的停留時間,用戶是否查看 Review,每個搜索的關(guān)鍵詞,每個瀏覽的商品等等,在亞馬遜去年 11 月推出的 Kindle Fire 中,內(nèi)嵌的 Silk 瀏覽器更是可以將用戶的行為數(shù)據(jù)一一記錄下來。這些數(shù)據(jù)的有效分析使得亞馬遜對于客戶的購買行為和喜好有了全方位了解,對于其貨品種類、庫存、倉儲、物流、及廣告業(yè)務(wù)上都有著極大的效益回饋。
數(shù)據(jù)技術(shù)的應(yīng)用不僅在零售和互聯(lián)網(wǎng)行業(yè)獲得極大回報,其帶來的經(jīng)濟價值使得各行業(yè)均為之“競折腰”。在能源行業(yè),Opower 使用數(shù)據(jù)來提高消費用電的能效,并取得了顯著的成功。作為一家提供 SaaS 服務(wù)(軟件服務(wù))的創(chuàng)新公司,Opower 與多家電力公司合作,分析美國家庭用電費用并將之與周圍的鄰居用電情況進行對比,被服務(wù)的家庭每個月都會受到一份對比的報告,顯示自家用電在整個區(qū)域或全美類似家庭所處水平,以鼓勵節(jié)約用電。Opower 的服務(wù)以覆蓋了美國幾百萬戶居民家庭,預(yù)計為美國消費用電每年節(jié)省 5 億美元。
最值得一提的是生物信息行業(yè)。生物信息是繼互聯(lián)網(wǎng)行業(yè)之后數(shù)據(jù)迸發(fā)最迅速的行業(yè),并將遠遠超過互聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù):人類用 0 和 1 創(chuàng)造了虛擬世界,而造物主用 A/C/T/G 四種元素創(chuàng)造了萬物生靈,生命的產(chǎn)生、發(fā)展、消亡的奧秘盡在其中。隨著測序技術(shù)的發(fā)展,全基因組的測序價格由十年前的上億美元降至今天的數(shù)千美元,這使得更多人、物種的 DNA 信息的獲取成為可能。個體全基因組信息的獲取,使得個性化診療服務(wù)成為可能。在美國華盛頓大學(xué),研究人員通過對一位白血病患者的基因信息進行分析,成功的找出了導(dǎo)致癌細胞迅速擴散的致癌基因,并發(fā)現(xiàn)了能夠阻止該基因產(chǎn)生作用的藥物,有效的延長了患者的生命。
諸如以上的應(yīng)用,在悄無聲息的進行著,是數(shù)據(jù)帶來的市場價值推動著一切的進行,亦構(gòu)成了“引爆”大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的第二個推手。
推手三:技術(shù)的發(fā)展
技術(shù)與應(yīng)用之間從來就是相輔相成的關(guān)系:應(yīng)用的實現(xiàn)需要技術(shù)的支撐,而技術(shù)的進步能推動應(yīng)用的普及。在以上實例應(yīng)用的背后,是大數(shù)據(jù)技術(shù)讓一切成為了可能。本文中,我們所指的大數(shù)據(jù)技術(shù),主要是以 Hadoop 為代表的非關(guān)系型數(shù)據(jù)庫系統(tǒng)及分布式運算架構(gòu),在這一部分,我們將簡要介紹其發(fā)展背景。
上世紀 60 年代末關(guān)系型數(shù)據(jù)庫技術(shù)的出現(xiàn)使得數(shù)據(jù)能按照固定的結(jié)構(gòu)進行存儲,方便用戶根據(jù)數(shù)據(jù)屬性進行查詢的同時,也使得管理大為簡便。然而,數(shù)據(jù)量的爆發(fā)增長和數(shù)據(jù)結(jié)構(gòu)的多樣性,不僅要求能快速錄入、提取海量數(shù)據(jù)信息;還要求數(shù)據(jù)庫隨著數(shù)據(jù)量的增加而靈活擴展、數(shù)據(jù)存儲不局限于固定的結(jié)構(gòu)。這時,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫技術(shù)已無法滿足這些需求,于是,NoSQL 技術(shù)在上世紀末期開始出現(xiàn)。
然而,非關(guān)系型數(shù)據(jù)庫技術(shù)一開始并未得到廣泛應(yīng)用,直到 2009 年,在搜索引擎、社交網(wǎng)絡(luò)等互聯(lián)網(wǎng)應(yīng)用盛行使得數(shù)據(jù)量迅猛增加后,才開始為人們所重視并投入使用。發(fā)展到今天,NoSQL 技術(shù)已經(jīng)形成了一系列不同用途的數(shù)據(jù)庫管理系統(tǒng),如 BigTable、Amazon DynamoDB、Hadoop/Hbase、Cassandra 等列族存儲系統(tǒng)(Wide Column Store),MongoDB、CouchDB 等文件存儲系統(tǒng),Neo4J 等圖形數(shù)據(jù)庫系統(tǒng)。由于列族存儲系統(tǒng)支持多種類型的數(shù)據(jù)存儲,目前應(yīng)用的范圍最為廣泛。
2004 年初,Google 開始研發(fā) BigTable 非關(guān)系型數(shù)據(jù)庫系統(tǒng),它是建立在 Google 文件系統(tǒng)之上的一種壓縮的、高擴展的數(shù)據(jù)庫技術(shù),可以讓 Google 對于自身新增業(yè)務(wù)處理進行低成本的擴展。8 個月后,BigTable 開始投入內(nèi)部使用,后來被廣泛應(yīng)用于一系列的 Google 應(yīng)用中,如 Google Reader、Google Earth、Google Maps、Gmail、YouTube 等等。為了解決海量信息的計算問題,Google 又研發(fā)了 MapReduce 的并行計算技術(shù)架構(gòu),使得 T 量級以上的數(shù)據(jù)可以并行處理,并通過 BigTable 來存儲和更改資料,有效的支撐了 Google 日益增長的數(shù)據(jù)處理任務(wù)。而 BigTable 這一模型,啟發(fā)了眾多“后來者”的數(shù)據(jù)技術(shù)。
Hadoop 便是其中一員。這個由 Yahoo! 的前員工 Doug Cutting(現(xiàn)任職于 Cloudera 公司)最初負責開發(fā)的項目,已成為大數(shù)據(jù)行業(yè)的技術(shù)中心。Hadoop 是由一系列開源技術(shù)組成的分布式架構(gòu),包括 Hbase 列數(shù)據(jù)庫系統(tǒng)、MapReduce 并行計算框架、HDFS 分布式文件系統(tǒng)、Mahout 算法庫等等,由于其擴展性高、數(shù)據(jù)種類靈活、成本低,Hadoop 被廣泛應(yīng)用于各行各業(yè),包括互聯(lián)網(wǎng)、生物信息、物聯(lián)網(wǎng),甚至美國宇航局 NASA 也用 Hadoop 來處理從宇宙望遠鏡中傳回海量無線電數(shù)據(jù),其數(shù)據(jù)量達到每秒鐘 700TB!
2008 年成立的 Cloudera 是最早將 Hadoop 商用的公司,為合作伙伴提供 Hadoop 的商用解決方案,其中包括 IBM、甲骨文(Oracle)、微軟EMC、Teradata 等行業(yè)領(lǐng)先的數(shù)據(jù)解決方案提供商,使得 NoSQL 技術(shù)成為現(xiàn)存 SQL 數(shù)據(jù)解決方案的強有力補充;眾巨頭紛紛推出相應(yīng)產(chǎn)品,來適應(yīng)其客戶數(shù)據(jù)業(yè)務(wù)的爆發(fā)增長,如 IBM 的 InfoSphere BigInsights,甲骨文的 BigData Appliance,EMC 的 GreenPlum 等等。Cloudera 公司的產(chǎn)品使得開源技術(shù)有效的為商業(yè)客戶提供服務(wù),而其創(chuàng)始人 Jeff Hammerbacher 亦被福布斯評為美國 30 位 30 歲以下科技領(lǐng)域的明日之星之一。
目前,Hadoop 技術(shù)以及被廣泛應(yīng)用了各大互聯(lián)網(wǎng)公司,包括 Facebook、亞馬遜、蘋果、AOL、Ebay、Twitter、Netflix、淘寶、百度等等;在生物信息行業(yè)中,也初步得到了應(yīng)用,如大型制藥公司提供研究服務(wù)的 NextBio 公司,設(shè)立了 100 個節(jié)點的 Hadoop 集群來幫助制藥公司進行基因研究。先進技術(shù)的發(fā)展為企業(yè)提供了高效使用數(shù)據(jù)的便捷工具,是促進大數(shù)據(jù)行業(yè)發(fā)展的第三大推手。
推手四:金融與政策的鼓勵
行業(yè)的發(fā)展,除了市場需求的驅(qū)動、技術(shù)水平的進步,還離不開資本與政策的矚目。據(jù)麥肯錫報道,大數(shù)據(jù)已經(jīng)實現(xiàn)了顯著的經(jīng)濟價值:為美國的醫(yī)療服務(wù)業(yè)每年節(jié)省 3000 億美元,為歐洲的公共部門管理每年節(jié)省 2500 億歐元,為全球個人位置數(shù)據(jù)服務(wù)提供商貢獻 1000 億美元,幫助美國零售業(yè)凈利潤增長 60%,幫助制造業(yè)在產(chǎn)品開發(fā)、組裝等環(huán)節(jié)節(jié)省 50% 的成本等等。大數(shù)據(jù)體現(xiàn)的巨大經(jīng)濟價值,成功地獲得了金融界和政界的親睞。
2011 年 11 月,曾投資 Facebook、DropBox、Cloudera、沃爾瑪?shù)?200 多家公司的硅谷著名風(fēng)投機構(gòu)阿克塞爾合伙人公司(Accel Partners),宣布成立一個金額 1 億美金的大數(shù)據(jù)基金,專注于投資兩種類型的數(shù)據(jù)創(chuàng)業(yè)公司:建設(shè)包括存儲、安全和管理在內(nèi)的新型架基礎(chǔ)構(gòu)類公司,以及在基礎(chǔ)架構(gòu)之上進行如 BI、行業(yè)應(yīng)用、移動應(yīng)用等開發(fā)的公司。這樣的投資方向讓我們看到,大數(shù)據(jù)的爆發(fā)增長使得數(shù)據(jù)驅(qū)動、數(shù)據(jù)制勝成為必然,那些能夠解決這個過程中因數(shù)據(jù)而產(chǎn)生的各種問題的創(chuàng)業(yè)公司,將在市場上得到自身價值的回饋。
今年 4 月,成立于 2003 年的數(shù)據(jù)軟件公司 Splunk 在納斯達克以 16 億美元的市值上市,給大數(shù)據(jù)行業(yè)打了一管興奮劑。Splunk 提供的軟件產(chǎn)品可以用于監(jiān)控、分析實時及歷史的機器數(shù)據(jù),這些數(shù)據(jù)可以是日志、配置文件、消息和告警等。Splunk 可以幫助企業(yè)的 IT 管理員集中監(jiān)控分布部署在多個數(shù)據(jù)中心的成千上萬臺服務(wù)器,免去了錯誤發(fā)生時需要逐個排查糾錯的苦惱。從創(chuàng)立至今,Splunk 的客戶數(shù)量已接近 4000 家,財富 100 強的大部分成員皆為其客戶,包括瑞士信貸、美國銀行、Comcast、Salesforce、Zynga、LinkedIn、T-Mobile、Swisscom、Shutterfly、Heroku 以及美國勞工部和能源部等。
與此同時,政府也將大數(shù)據(jù)列入了國家發(fā)展戰(zhàn)略。今年 3 月底,奧巴馬政府宣布,白宮將投入 2 億美金的研發(fā)費用來推動大數(shù)據(jù)技術(shù)的發(fā)展,其主要目標是為了讓大數(shù)據(jù)技術(shù)更好的服務(wù)于科研、環(huán)境、生物醫(yī)藥、教育和國家安全領(lǐng)域。同時,奧巴馬政府對于投資的核心技術(shù)領(lǐng)域,也作出了明確的表示,將主要用來鼓勵那些在數(shù)據(jù)采集、存儲、管理、分析和共享等方面的技術(shù)研發(fā)。
綜上所述,我們可以看到,大數(shù)據(jù)成為今天眾人矚目的焦點,是經(jīng)過了在市場、技術(shù)、資金、以及政府多方因素推動的結(jié)果。在文章的最后,我們列出三個關(guān)鍵詞來總結(jié)大數(shù)據(jù)技術(shù)在實際應(yīng)用中的特性,希望幫助讀者對于大數(shù)據(jù)的應(yīng)用有一個概覽性的了解。
人才。人才是大數(shù)據(jù)技術(shù)能夠真正發(fā)揮其價值的首要因素,也是最大的挑戰(zhàn)。據(jù)麥肯錫調(diào)查,至 2018 年,美國市場將出現(xiàn)近 20 萬深度大數(shù)據(jù)分析的專業(yè)人才、150 萬能夠進行數(shù)據(jù)解析的職業(yè)經(jīng)理人的職位缺口。大數(shù)據(jù)專業(yè)人才不僅需要多年的數(shù)學(xué)知識積累,還需要有編程、業(yè)務(wù)知識等綜合能力,是稀缺的復(fù)合型人才;而對于聘用企業(yè)來說,也很難有合適的職位適合此類人才。
用戶為中心。大數(shù)據(jù)技術(shù)的應(yīng)用,可以幫助企業(yè)從業(yè)務(wù)的整體設(shè)計角度,發(fā)展到針對客戶的個性化服務(wù),例如,零售企業(yè)對于過剩的庫存會進行整體促銷,如果對于用戶購買數(shù)據(jù)進行分析,就可以針對用戶的喜好進行個性化促銷,同時也根據(jù)用戶的購買行為對庫存進行準確的調(diào)配,以減少浪費。
行業(yè)化。在基礎(chǔ)的數(shù)據(jù)采集、存儲及查詢方面,各行業(yè)所通用的技術(shù)架構(gòu)并無顯著差異;但由于每個行業(yè)的屬性及需求各異,數(shù)據(jù)分析將具有較強的行業(yè)性。例如,生物信息行業(yè)中,進行基因診斷所用到的比對數(shù)據(jù)庫需要專業(yè)的生物知識來進行翻譯,更為深入的致病基因鎖定則需要用到一系列專業(yè)算法及實驗設(shè)計;在能源行業(yè),智能電網(wǎng)中的電力調(diào)度,則需要通過無數(shù)的傳感器數(shù)據(jù)預(yù)測下一時刻電網(wǎng)中各節(jié)點的配電需求,這就要求系統(tǒng)對于實時海量數(shù)據(jù)的高效處理能力,以及預(yù)測算法的精準。

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }