
創(chuàng)建大數(shù)據(jù)公司之前你需知曉5件事
大數(shù)據(jù)現(xiàn)如今如火如荼的在開展,但是成立一個大數(shù)據(jù)公司也是困難重重。Infochimps的收購讓我想起那些因第二輪融資未實現(xiàn)而關(guān)閉的公司。Drawn to Scale,Ravel Data和Nodeable只是被關(guān)注的重點而已,但是我堅信還存在更多沒有走進我們視野倒閉的公司。
取代為這些創(chuàng)業(yè)失敗的公司惋惜,我更傾向于從那些成功或者倒閉的大數(shù)據(jù)公司上提取經(jīng)驗并提供給那些準備開始自己旅程的創(chuàng)始人。下面有很多的解釋,但是簡而言之:明智的選擇好你的戰(zhàn)場,明智的選擇你的客戶,并圍繞你的技術(shù)建設一個社區(qū)。
1. 基礎設施的困難性
不僅基礎建設工具困難,而且出售它們也同樣的困難。當你在討論諸如Hadoop、NoSQL數(shù)據(jù)庫和流處理系統(tǒng)等大數(shù)據(jù)基礎架構(gòu)工具時可能同樣也是困難重重。客戶可能會需要很多的教育指導,而那些付費用戶期望可能得到更多的技術(shù)支持和產(chǎn)品開發(fā)的細節(jié),從而能及時的解決他們的問題。
通常情況下,這需要很多的資金,同樣也需要在部署和支持這種系統(tǒng)和系統(tǒng)集成方面有經(jīng)驗的人才。如果你擁有這些資源,那么這將是非常完美。
作為參考,在2010年時,Greenplum在這些基礎設施方面投資了近1億美元,但是它仍然不夠,因此Greenpium被EMC收購。如今最具知名度的大數(shù)據(jù)公司在初創(chuàng)時都投入了與cloudrea相同或者更多的資金。基礎設施初創(chuàng)公司只有幾百萬的種子基金,這使得它們在第一輪融資前會有一個艱難的道路。
但是你仍要去說服許多公司去部署你的產(chǎn)品而忽略它們已經(jīng)熟知或已具有相當人力和物力的公司產(chǎn)品,諸如Cloudera, Hortonworks, 10gen, Amazon Web Services, IBM, Oracle等公司。
應用程序——無論他們專注于特定工作負載或行業(yè),或像數(shù)據(jù)可視化一樣適用于廣泛的任務——是很容易的。精心打造它們或許比較困難,但是潛在的客戶可能會馬上 看到它的使用價值,以及對比當下使用工具的優(yōu)劣。你也可以直接把它銷售到業(yè)務線,這樣避免了中間層從而減少更多的摩擦和風險。一旦你開始談論添加或替換關(guān)鍵系統(tǒng),或?qū)⒚舾袛?shù)據(jù)放到一個新地方,事情可以才能夠真正的快速運轉(zhuǎn)起來。
2. 云計算是你的朋友
重要的是,無論你是銷售基礎設施還是應用程序,云僅僅是一個更有效的方式來經(jīng)營你的企業(yè)。這并不意味著需要將它交于一個云供應商來托管,但你要把它作為一種云服務來提供給你的客戶。最終,你將對你的產(chǎn)品擁有更多的控制權(quán)和更深入的了解,因為它針對了一組特定的資源進行優(yōu)化。
這意味著沒有進入客戶賬戶并針對現(xiàn)有類型的服務器和系統(tǒng)進行設置??赡苋匀挥幸恍┒ㄖ朴靡赃B接服務與用戶其它類型數(shù)據(jù)源。然而這樣做并沒有太大的優(yōu)勢。這也意味著,公司需要將大部分的精力投入到產(chǎn)品開發(fā)上。
云計算同樣易于潛在客戶去建立伴生產(chǎn)品,這從New Relic與AWS的關(guān)系上不難看出。越容易上手、操作及變現(xiàn),就越容易證明以后它可以作為一個單獨的項目存在并擴展到更多的場景中使用。
顯然,這不可能在所有的情況下都能行得通,尤其是當你在討論企業(yè)所不希望或不能送入云中的軟件和大容量數(shù)據(jù)。事實上,較大的企業(yè)把提供云服務作為一般的傳統(tǒng)軟件給了許多的大數(shù)據(jù)初創(chuàng)公司很大的壓力。如果有利可圖,這或許是一個明智的決定,但不管怎樣,這絕不能輕視。
3. 開發(fā)者是你的伙伴
因此,為開發(fā)人員服務。如果你就像 ClearStory , Platfora , CRM的任何一員和市場應用做分析業(yè)務,那么分析師是你的朋友。無論以哪種方式,對目標客戶而進行的針對性的研發(fā)努力和營銷努力或許都會是一個好的主意。CIO看起來并不是一個很好的目標受眾。
我認為有件事Infochimps可以做的更好,如:它推動Wukong和Ironfan技術(shù)面向普通的開發(fā)用戶。 前者讓你可以像寫Ruby腳本一樣的去編寫Mapreduce和streaming作業(yè)。后者是一個Chef工具,可以讓你輕松地配置,部署和管理大數(shù)據(jù)。
我認為Infochimps和Continuuity所從事的的業(yè)務之間不只有一點的共同之處。 但是 Continuuity完全從開發(fā)者角度出發(fā),他們在宣傳語中喊出了這一點并且聲稱有更簡單的方法來使用產(chǎn)品。這意味著他們可以在做大交易的同時可以在后臺積累下大量堅實的用戶群。
4. 不要吝嗇去展示你的數(shù)據(jù)科學家
我認為展示你的數(shù)據(jù)科學家這是一場營銷運動更是一種銷售手段,但是確實至關(guān)重要。數(shù)據(jù)科學家是一些向人們展示他們數(shù)據(jù)和他們的平臺有什么可能性的人,同樣數(shù)據(jù)科學家也是人們在會議上想聽的人。 幾乎所有人都熱衷于Hadoop和NoSQL。也沒有什么必要再去討論Hadoop和NoSQL它們的優(yōu)點,同樣沒有需要去重復數(shù)量、種類等的定義談論配置和系統(tǒng)集成是重要的,但是感興趣的是少數(shù)的觀眾,除非你們在談大規(guī)模的運作。談論配置和系統(tǒng)集成是重要的,但是感興趣的是少數(shù)的觀眾,除非你們在談大規(guī)模的運作。Cloudera比它競爭對手獲得更多關(guān)注和發(fā)言的原因有很多,而其中一個就是Jeff Hammerbacher。不要只是空談去儲存或處理數(shù)據(jù)和基礎設施—— 能告訴我什么樣的產(chǎn)品,我可以去構(gòu)建它,什么類型的分析,我可以在其上運行。最起碼,證明你正在更廣的范圍內(nèi)去思考數(shù)據(jù)而不是僅僅用最新的方式來賣我東西。
5. 開源不是關(guān)鍵,而要把開源變成關(guān)鍵
幾乎每一個大數(shù)據(jù)初創(chuàng)公司都依賴與開源軟件。其中一些初創(chuàng)公司借用像Hadoop、Storm和其它各種類型的數(shù)據(jù)庫,另外一些則已經(jīng)創(chuàng)建開源軟件。在很多情況下這兩種情況是相互結(jié)合的。比如,為HBase添加一些功能,這些項目之所以會如此人氣,一部分的原因就是因為社區(qū)。
我從未試圖去開展一個開源運動,我認為這是一個艱難的工作。但我知道,在Github上放置一段未完成的代碼并置之不顧并不能解決問題。Facebook和谷歌可能會根據(jù)喜好隨便發(fā)布代碼,但大多數(shù)創(chuàng)業(yè)公司不應該傲慢的認為他們的開發(fā)團隊是最棒的,已經(jīng)沒有任何東西值得他們學習。
畢竟,開源的目標是讓人們在相同的代碼上致力研究從而去改良它??雌饋砟阌斜匾叱鋈?,發(fā)揚這項技術(shù)并且解釋它為什么如此的重要,以至于吸引越來越多的人想要去破解它。這一點可能會吸引許多的開發(fā)者,但是走免費增值的路線可能會讓更多的人去嘗試使用這個產(chǎn)品,這樣他們就可以看到這種產(chǎn)品是否值得他們?nèi)ネ顿Y。
我無法計算擁有自己開源產(chǎn)品的公司數(shù)量,但是那些一直致力于開源和社區(qū)建設的公司的確很杰出。我們所說的供應商創(chuàng)業(yè)公司如 Neo Technology 、 Concurrent 、10gen甚至是終端用戶公司,如Twitter的養(yǎng)成計劃Storm和Mesos。它們在周圍已經(jīng)建立了一個開源社區(qū),并且因此它們獲得了豐厚的回報。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03