
這10家創(chuàng)業(yè)公司將大數(shù)據(jù)分析推向全新高度
有結(jié)構(gòu)、無(wú)結(jié)構(gòu)數(shù)據(jù)的崛起創(chuàng)造了一個(gè)蓬勃發(fā)展的市場(chǎng),其價(jià)值預(yù)計(jì)將在 2018 年達(dá)到415億美元左右。大數(shù)據(jù)市場(chǎng)的快速增長(zhǎng)造就了大量的供應(yīng)商的出現(xiàn),他們都希望能從中獲利。在眾多競(jìng)爭(zhēng)市場(chǎng)地位的供應(yīng)商中,有許多旨在幫助組織收集和分析數(shù)據(jù)的創(chuàng)業(yè)公司。CBR(計(jì)算機(jī)商業(yè)評(píng)論) 從中選出了10個(gè)值得被關(guān)注的公司。
1. Confluent
Confluent 公司成立于 2014,已經(jīng)獲得超過 3000 萬(wàn)美元的投資,這些投資來(lái)自于 LinkedIn、Index Ventures、Benchmark Capital 和 The Data Collective 等投資者。
該公司由 Apache Kafka 的開發(fā)者們創(chuàng)立(Apache Kafka是一個(gè)實(shí)時(shí)通訊和大數(shù)據(jù)流引擎)。其最初創(chuàng)立于 LinkedIn 內(nèi)部,而后歸入 Apache 軟件基金會(huì)旗下,最后分離出來(lái)作為一個(gè)獨(dú)立的公司。Confluent 本質(zhì)上是 Apache Kafka 軟件的商業(yè)提供者和技術(shù)支持者。當(dāng)還在 LinkedIn 的時(shí)候,Confluent 已經(jīng)開始幫助 LinkedIn 全面檢測(cè)公司里發(fā)生的一切,作為一個(gè)實(shí)時(shí)的 Kafka feed,為 Hadoop、Search、Newsfeed 等數(shù)據(jù)系統(tǒng)填入數(shù)據(jù)。
Confluent 專注于構(gòu)建一個(gè)數(shù)據(jù)流平臺(tái),從而幫助企業(yè)獲得實(shí)時(shí)的企業(yè)數(shù)據(jù)。Confluent 提供的編程語(yǔ)言包括 Java、C 語(yǔ)言和C++,通過其 REST 服務(wù)器,可以使用任何網(wǎng)絡(luò)連接工具來(lái)生成信息、實(shí)現(xiàn)通訊。
2. H2O.ai
H2O.ai (曾用名 0xdata)公司成立于 2011,已經(jīng)獲得了 3360 萬(wàn)美元的投資,這些投資來(lái)自于 Nexus Venture Partners、Paxion Capital Partners 和 Transamerica Ventures 等投資者。
該公司由 Platfora 和 Cliff Click 的聯(lián)合創(chuàng)始人 SriSatish Ambati 創(chuàng)立,他還是 Java 虛擬機(jī)的領(lǐng)頭開發(fā)者。公司創(chuàng)立之初的想法是,讓開發(fā)人員和數(shù)據(jù)學(xué)家更簡(jiǎn)單輕松地應(yīng)用機(jī)器學(xué)習(xí)算法。
該公司提供一個(gè)開源的機(jī)器學(xué)習(xí)平臺(tái),其設(shè)計(jì)是為了在使用 Web UI 或者不同的編程環(huán)境(如 R、java、python、Scala 、JSON)的同時(shí),也能使用 Hadoop 和 Spark。該平臺(tái)支持的數(shù)據(jù)庫(kù)和文件類型包括微軟 Excel、R Studio、和Tableau。H2O可以幫助開發(fā)模型培養(yǎng)機(jī)器學(xué)習(xí)能力,從而可以對(duì)數(shù)據(jù)進(jìn)行解析、獲取和模擬。
最基礎(chǔ)的是,該技術(shù)有助于快速創(chuàng)建和應(yīng)用機(jī)器學(xué)習(xí)算法。
3. AtScale
Atscale 成立于 2013,至今已募集了900萬(wàn)美元的投資,這些投資來(lái)自于 AME Cloud Ventures、Storm Ventures 和 UMC Capital 等投資者。該公司的想法是使用熟悉的商業(yè)智能(BI)工具和界面(如 SQL、Tableau)和 Hadoop這樣的技術(shù)解決問題,也就是,它們?cè)谏虡I(yè)用戶、可視化工具和基礎(chǔ) Hadoop 平臺(tái)間建立橋梁。
其目標(biāo)是幫助企業(yè)對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,而且不需要將數(shù)據(jù)移入專門的分析工具,因?yàn)橐迫雽iT的分析工具有時(shí)間和金錢成本。
Atscale 由 Hadoop 和 BI 的前員工創(chuàng)立,他們具備把 Hadoop 集群轉(zhuǎn)變成規(guī)?;?OLAP 服務(wù)器的能力。另外,Atscale 支持 BI 工具,可以和 SQL 或 MDX 進(jìn)行信息交流。
4. Interana
把提供事件數(shù)據(jù)的行為分析作為自己招牌的 Interana 公司幫助企業(yè)做數(shù)據(jù)主導(dǎo)的決策。該公司成立于 2013 年,由首席執(zhí)行官 Ann Johnson 和首席技術(shù)官 Bobby Johnson 聯(lián)合創(chuàng)辦,目前完成了 2820 萬(wàn)美元的融資,其中在由 Index Ventures 領(lǐng)投的 B 輪融資中獲得了 2000 萬(wàn)美元。
Interana 專注于提供互動(dòng)分析,幫助企業(yè)了解他們客戶的行為和產(chǎn)品使用情況。該公司使用一個(gè)專有的數(shù)據(jù)庫(kù),能讓它快速處理數(shù)十億的事件。例如像 Tinder 這樣的公司用它來(lái)進(jìn)行網(wǎng)絡(luò)連接故障檢修,測(cè)量社交媒體的有效性,以及監(jiān)測(cè)用戶的刷機(jī)方式。Tinder 在全公司廣泛使用 Interana,從而改善自己的服務(wù)和操作。
5. Tamr
Tamr 結(jié)合了機(jī)器學(xué)習(xí)軟件和數(shù)據(jù)科學(xué)。該公司由 Andy Palmer、Mike Stonebrake 等人共同創(chuàng)立,他們都是數(shù)據(jù)研發(fā)的老兵。
Tamr 使用一個(gè)可擴(kuò)展的數(shù)據(jù)統(tǒng)一平臺(tái),通過機(jī)器學(xué)習(xí)和人工輸入的方式,幫助客戶使用被孤立在不同的數(shù)據(jù)庫(kù)、電子表格、記錄數(shù)據(jù)、和合作伙伴資源里的數(shù)據(jù)。
Tamr 一種獲得 4240 萬(wàn)美元融資,其中在最近的 B 輪融資中得到 2520 萬(wàn)美元。主要投資者包括 Hewlett-Packard Ventures、Thomson Reuters 和 MassMutual Ventures。簡(jiǎn)單來(lái)說(shuō),Tamr 是一個(gè)數(shù)據(jù)清理的創(chuàng)業(yè)公司,旨在清理來(lái)自不同資源的數(shù)據(jù),從而讓數(shù)據(jù)更容易被使用。
6. Wavefront
Wavefront 成立于 2013 年,總部設(shè)在加利福尼亞的帕洛奧圖,至今已獲得 2050 萬(wàn)美元投資,這些投資來(lái)自于 Sequoia Capital、Sutter Hill Ventures 和 Webb Investment Network 等投資者。
該公司提供一個(gè)實(shí)時(shí)的分析平臺(tái),可以把一個(gè) IT 公司所有系統(tǒng)中的數(shù)據(jù)抽離出來(lái),通過識(shí)別和診斷以預(yù)防崩潰。Wavefront 使用了一種查詢語(yǔ)言,從而可以對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行處理,它也允許用戶通過下拉菜單、過濾器和自動(dòng)生成表格來(lái)手工查詢。該技術(shù)最初是在 Google 和 Twitter 內(nèi)部開發(fā),現(xiàn)在正在被 Box、First Data 和 Workday 等公司使用。
7. BlueTalon
BlueTalon 是另一家成立于 2013、總部在加利福尼亞的公司,只不過它位于 Redwood。該公司至今已籌集了 1140 萬(wàn)美元的投資,這些投資來(lái)自于 Data Collective、Signia、Venture Partners 和 Bloomberg Data 等投資者。
BlueTalon 為大數(shù)據(jù)提供數(shù)據(jù)中心安全保障,例如 Hadoop、SQL,它主要是對(duì) Hadoop 分布式文件系統(tǒng)使用訪問控制和動(dòng)態(tài)掩蔽實(shí)現(xiàn)這一點(diǎn)的。
除了在 Hadoop 上有效,它也能在微軟 Azure 和亞馬遜網(wǎng)絡(luò)服務(wù)上工作。據(jù) BlueTalon 所言,它允許用戶自定義數(shù)據(jù)配置設(shè)定,這意味著企業(yè)用戶和開發(fā)人員可以只訪問他們所需要的數(shù)據(jù)。該公司還提供審核服務(wù),讓用戶知道什么人在什么時(shí)候,因?yàn)槭裁丛蛟L問了什么數(shù)據(jù)。
8. Cazena
Cazena 雖然只是成立于 2014,但已經(jīng)從諸如 North Bridge Venture Partners、Growth Equity、Andreessen Horowitz 和 Formation 8 等投資那里籌集了 2800 萬(wàn)美元。在 2015 七月重新回歸之后,Cazena 帶來(lái)了一項(xiàng)叫做 Big Data-as-a-Service 的大數(shù)據(jù)服務(wù)。據(jù)該公司表示,將大數(shù)據(jù)處理轉(zhuǎn)移到云端的過程只需要輕輕點(diǎn)擊三次。
該公司專注于通過 Data-As-A-Service 大數(shù)據(jù)服務(wù)實(shí)現(xiàn)在加密的云端進(jìn)行大數(shù)據(jù)處理。它的產(chǎn)品分為 Data Lake、Data Mart 和 Sandbox 三個(gè)版本。
為了智能工作,該公司供應(yīng)和優(yōu)化了云端基礎(chǔ)設(shè)施,其中也包含 Hadoop、Spark、MPP SQL、Search 這樣的數(shù)據(jù)技術(shù)。
另外,Cazena 提供端到端的數(shù)據(jù)加密技術(shù),企業(yè)掌控著靜態(tài)和動(dòng)態(tài)秘鑰。
9. DataTorrent
DataTorrent 成立于 2012 年,是這 10 家公司中的老創(chuàng)業(yè)公司之一。到目前為止它已募集到 2380 萬(wàn)美元,其中包括由 Singtel Innov8 領(lǐng)投的1500 萬(wàn)美元的 B 輪融資 。
該公司專注于實(shí)時(shí)大數(shù)據(jù)分析技術(shù),其技術(shù)基礎(chǔ)是一個(gè)開源的數(shù)據(jù)流和處理引擎,該公司表示此引擎在 Hadoop 集群中,每秒可以處理數(shù)十億的事件。
DataTorrent 支持?jǐn)z入的數(shù)據(jù)來(lái)源有 Kafka、AWS S3n、HDFS、NFS、JMS等等。
DataTorrent RTS Core 是一個(gè)開源的企業(yè)級(jí)統(tǒng)一的數(shù)據(jù)流和批量處理引擎。它提供了一整套系統(tǒng)服務(wù),可以幫助開發(fā)人員專注于 Business Logic。該公司還提供一個(gè)完整的 Hadoop 集成應(yīng)用的管理控制臺(tái),為熄燈管理提供圖形界面。
10. Databricks
Apache Spark 這項(xiàng)技術(shù)如今已經(jīng)在數(shù)據(jù)分析界非常流行。而這家公司正是由 Apache Spark 的開發(fā)者們?cè)诩又荽髮W(xué)伯克利分校的 AMPLab 實(shí)驗(yàn)室創(chuàng)立。Databricks 是 Spark 的商業(yè)服務(wù)和支持提供商。
這幾位開發(fā)者想要借助 Spark 在整個(gè)社區(qū)和眾多廠商(IBM)那里的影響成立 Databricks 。 Databricks 本身也為交互分析、可視化、管理數(shù)據(jù),以及協(xié)作與集成提供工具。
在 2013 年成立后,它開始用 Spark 幫助客戶進(jìn)行基于云端的大數(shù)據(jù)處理。Databricks 已經(jīng)在兩輪融資里籌集到 4700 萬(wàn)美元,其中 2014 年 6 月 B 輪融資獲得 3300 萬(wàn)美元。
該公司與 Spark 的發(fā)展緊密聯(lián)系在一起,而在最近也公布了三個(gè)特征變化。其中一個(gè)是開始執(zhí)行 Tungsten 項(xiàng)目的下一階段從而加速 Spark,他們是通過解決 Java 的記憶處理限制、改善實(shí)時(shí)數(shù)據(jù)流系統(tǒng)、將其使用的多種數(shù)據(jù)結(jié)構(gòu) API 整合為一個(gè) API 實(shí)現(xiàn)加速目的的。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03