
數(shù)據(jù)分析工具獨(dú)領(lǐng)風(fēng)騷 數(shù)據(jù)科學(xué)服務(wù)表示不服
企業(yè)需要從大量收集的數(shù)據(jù)中攫取價(jià)值,但很多企業(yè)似乎無(wú)法找到足夠的數(shù)據(jù)科學(xué)家來(lái)做這件事。因此數(shù)據(jù)科學(xué)作為一項(xiàng)服務(wù)變呼之而出。
處于如此困境的企業(yè)可以把他們的原生數(shù)據(jù)外包給類似DataScience這樣的公司,這是一家位于加利福尼亞Culver City的創(chuàng)業(yè)公司。其分析團(tuán)隊(duì)對(duì)數(shù)據(jù)進(jìn)行清理并使用復(fù)雜的建模工具、國(guó)產(chǎn)軟件來(lái)提供建議,這樣客戶就可以根據(jù)這些建議來(lái)改進(jìn)產(chǎn)品和服務(wù),展他們的客戶群,最終增加收入。
SearchBusinessAnalytics與DataScience的CEO兼創(chuàng)始人Ian Swanson談?wù)撽P(guān)于新興數(shù)據(jù)科學(xué)作為一項(xiàng)服務(wù)的發(fā)展空間。他談及其數(shù)據(jù)科學(xué)家組成的團(tuán)隊(duì)能夠提供數(shù)據(jù)分析工具無(wú)法提供東西,數(shù)據(jù)科學(xué)驅(qū)動(dòng)收入的方式以及其風(fēng)險(xiǎn)投資公司如何在不到兩年的時(shí)間內(nèi)獲得并發(fā)展了一個(gè)強(qiáng)大而穩(wěn)定的數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師團(tuán)隊(duì),而與此同時(shí)大量的科技公司卻往往是很艱難地做著同樣的事。
公司們長(zhǎng)期以來(lái)便利用數(shù)據(jù)來(lái)改善運(yùn)營(yíng)效率,但如今越來(lái)越多的是強(qiáng)調(diào)以新的方式來(lái)使用數(shù)據(jù)連接客戶以促進(jìn)銷售。那么如今還有哪些新穎的方式可以讓你來(lái)使用數(shù)據(jù)呢?
Ian Swanson:我們擁有的訂閱電子商務(wù)公司每年的業(yè)務(wù)超過(guò)十億。我們能夠識(shí)別哪些客戶會(huì)有在下月離開(kāi)的風(fēng)險(xiǎn),他們生命周期的潛力是什么以及如何才能留住他們。生命周期價(jià)值是我們連接顧客的核心。很多企業(yè)試圖使用瘋狂的Excel數(shù)學(xué)來(lái)解決該問(wèn)題。我們?cè)诩?xì)粒度水平進(jìn)行觀察(很多屬性和特性)以決定一名客戶的生命周期價(jià)值。我們可以通過(guò)在該屬性上有針對(duì)性的投放特定廣告來(lái)增加客戶。
數(shù)據(jù)貨幣化對(duì)于你的客戶來(lái)說(shuō)到底有多重要?
Swanson:某些公司將其看得很簡(jiǎn)單,即我們要如何銷售數(shù)據(jù)?而我們看待它的方式是:我們要如何利用數(shù)據(jù)來(lái)增加收入?
我們與一家連接技術(shù)公司協(xié)作來(lái)找出他們的客戶到底是如何使用他們的產(chǎn)品的。企業(yè)可能會(huì)使用典型群體來(lái)了解如何對(duì)自己進(jìn)行營(yíng)銷,但是這些我們能夠收集在一起的元素顯示了客戶是為什么以及如何使用他們產(chǎn)品的。我們查看了他們所有的數(shù)據(jù)并雇用了幾個(gè)數(shù)據(jù)科學(xué)技師來(lái)發(fā)掘大多數(shù)人是如何使用產(chǎn)品的并決定如何來(lái)對(duì)產(chǎn)品進(jìn)行營(yíng)銷。我們提供建議來(lái)幫助客戶支持團(tuán)隊(duì)利用我們客戶能夠控制的東西將顧客從批評(píng)者轉(zhuǎn)變?yōu)榇龠M(jìn)者
我們還可以對(duì)一款尚未上馬的產(chǎn)品預(yù)測(cè)供需,因此一家公司就能夠?qū)⑵洳⑷胨麄兊呢?cái)務(wù)預(yù)測(cè)。公司通常會(huì)用遙不可及的邏輯來(lái)做這件事,但我們會(huì)用科學(xué)手段來(lái)完成。
對(duì)于那些將數(shù)據(jù)科學(xué)作為一項(xiàng)服務(wù)的公司來(lái)說(shuō),他們的員工中是否有數(shù)據(jù)科學(xué)家呢?
Swanson:是的,我們所有的客戶都至少會(huì)擁有一個(gè)。財(cái)富500強(qiáng)公司擁有強(qiáng)大的數(shù)據(jù)科學(xué)團(tuán)隊(duì),但他們可能不會(huì)集中在市場(chǎng)營(yíng)銷和客戶服務(wù)以及人力資源上。內(nèi)部數(shù)據(jù)科學(xué)團(tuán)隊(duì)通常不具有技術(shù)或能力完成所有工作。我們是一個(gè)75人的團(tuán)隊(duì),其中70人是數(shù)據(jù)工程師或數(shù)據(jù)科學(xué)家。
對(duì)于這一點(diǎn),我們非常重視,但是我們也已經(jīng)在構(gòu)建知識(shí)產(chǎn)權(quán),以處理人們需要解決的問(wèn)題。我告訴我的團(tuán)隊(duì),任何你需要用來(lái)讓工作變得高效的工具都可以購(gòu)買。在這樣的環(huán)境中,有一些相互并不連貫的工具用于連接,清理,探索,數(shù)據(jù)角力,建模,但它們結(jié)合的并不好。我們已經(jīng)在內(nèi)部生產(chǎn)中使用了自己的工具,而且我們將會(huì)把它們打包并提供給客戶使用,這樣他們就能使用和我們一樣的工具。
你使用什么類型的基礎(chǔ)設(shè)施來(lái)支持你所有的數(shù)據(jù)處理工作?
Swanson:我們是Amazon Web Services的重度使用者,但是我們的技術(shù)還可用于Azure,因此我們并不受困于此。根據(jù)數(shù)據(jù)科學(xué)工具,如果你考慮一名數(shù)據(jù)分析師的路徑,它們使用的是R,Python或者Scala語(yǔ)言。我們5%是R語(yǔ)言,大部分是Python,但也處在Scala和Spark的前沿位置。我們建立了真正的預(yù)測(cè)模型。
數(shù)據(jù)科學(xué)作為一項(xiàng)服務(wù)是否成功取決于公司是否以他們最為珍貴的財(cái)富(即數(shù)據(jù))來(lái)信任第三方。你是如何克服這一信任問(wèn)題和數(shù)據(jù)安全考量的?
Swanson:數(shù)據(jù)隱私和安全對(duì)我們來(lái)說(shuō)是相當(dāng)重要的,而且我們并不需要個(gè)人身份信息。例如,我不需要知道一名客戶的姓名是Joe Smith,我可能只需要他的用戶ID。因此,我們可以與大型上市公司進(jìn)行協(xié)作。
我們已經(jīng)通了數(shù)據(jù)隱私和安全測(cè)試,這是由American Express的一個(gè)90人的團(tuán)隊(duì)對(duì)我們進(jìn)行審查的(American Express在2011年收購(gòu)了Swanson的虛擬貨幣公司Sometrics)。還沒(méi)有一家客戶因?yàn)閿?shù)據(jù)安全方面的考慮而拒絕過(guò)我們。
你正在和如此之多的公司競(jìng)爭(zhēng),他們雇用了數(shù)據(jù)科學(xué)家,而且在人才資源有限的環(huán)境下,你要如何為你的團(tuán)隊(duì)聚攏人才呢?
Swanson:我們?cè)谶^(guò)去一年半籌集了3000萬(wàn)美元的風(fēng)險(xiǎn)基金,而且當(dāng)我在和VC公司討論的時(shí)候,他們都說(shuō)我們瘋了,認(rèn)為我們永遠(yuǎn)無(wú)法招到合適的人。我們?cè)谌齻€(gè)月內(nèi)證明了我們業(yè)務(wù)規(guī)模的擴(kuò)張和增長(zhǎng)。現(xiàn)在我們一個(gè)月可以收到超過(guò)1000份求職數(shù)據(jù)科學(xué)職位的簡(jiǎn)歷。
我們還會(huì)穿梭于各種會(huì)議、活動(dòng),而且我們開(kāi)展了DS12,這是一項(xiàng)為期12周的面向?qū)W生的數(shù)據(jù)科學(xué)實(shí)習(xí)項(xiàng)目。它是一個(gè)真正的并非入門級(jí)數(shù)據(jù)科學(xué)課程,而且我們并不對(duì)它收費(fèi);我們會(huì)支付他們的住宿,而且他們會(huì)獲得少量報(bào)酬。我們會(huì)向其他公司開(kāi)放該課程,這樣他們也能從中學(xué)到東西。這關(guān)系到為數(shù)據(jù)科學(xué)領(lǐng)域增值。
像IBM和Microsoft這樣的大型科技公司強(qiáng)調(diào)大數(shù)據(jù)分析,而且他們正在尋求雇用數(shù)據(jù)科學(xué)專家。我可以想象類似這樣的人收購(gòu)你的公司,從而迅速獲得人才。你是否有被主流科技公司接洽過(guò)關(guān)于收購(gòu)的事宜呢?
Swanson:是的,有很多。
對(duì)于要如何談?wù)撨@個(gè)問(wèn)題我必須謹(jǐn)慎——大公司們已經(jīng)找過(guò)我們,而且我們已經(jīng)拒絕了,而原因是在這一領(lǐng)域中公司眾多,但沒(méi)有幾家知道如何去增值。DataScience可以成長(zhǎng)為一家大公司。我們的五年愿景是想成為研究,教育,服務(wù)和知識(shí)產(chǎn)權(quán)領(lǐng)域的思想領(lǐng)袖,而在今天這樣的組合并不存在。
博士學(xué)位并不是成為數(shù)據(jù)科學(xué)家的前提,你需要成為某項(xiàng)技術(shù),特定業(yè)務(wù)線的專家,這樣我們的人才混合才是獨(dú)一無(wú)二的,而且這對(duì)于公司才是有價(jià)值的。
與此同時(shí),有很多的自助分析工具來(lái)協(xié)助人們?cè)跊](méi)有數(shù)據(jù)專家?guī)椭那闆r下連點(diǎn)成線并作出更好的業(yè)務(wù)決策。公司需要數(shù)據(jù)科學(xué)家的真諦是什么呢?
Swanson:類似Tableau或Domo的工具對(duì)可視化和常識(shí)是有好處的,但不適用于影響公司未來(lái)的營(yíng)銷決策。它們是回到過(guò)去的一扇窗,但這扇窗并不通向未來(lái)。它們可以反映公司當(dāng)前狀況,但無(wú)法給出公司的未來(lái)描述。
我們使用模型做的事包括以95%的準(zhǔn)確率預(yù)測(cè)客戶流失。有些客戶想知道這樣的百分比是真的么?但是想想現(xiàn)在人們是如何做出決策的。他們是在一間會(huì)議室里看著Excel表格決策的。我們認(rèn)為要將科學(xué)應(yīng)用到該過(guò)程中來(lái)。這是與你的直覺(jué)和經(jīng)驗(yàn)并駕齊驅(qū)的另一款武器。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03