
靠大數(shù)據(jù)賺錢的10個(gè)例子
從 2012 年到 2015 年,大數(shù)據(jù)持續(xù)發(fā)威,IDC 市場調(diào)查機(jī)構(gòu)預(yù)測 2017 年大數(shù)據(jù)市場將價(jià)值 324 億,擁有這樣“Big Data、Big Deal”遠(yuǎn)見的人,正在利用大數(shù)據(jù)激蕩出最有創(chuàng)意的構(gòu)想,用數(shù)據(jù)的力量來創(chuàng)造出大量的價(jià)值。從讓資料搜尋分析平臺,到利用大數(shù)據(jù)幫助癌癥治療,大數(shù)據(jù)新創(chuàng)公司這幾年內(nèi)如雨后春筍般出現(xiàn),2015 年這些“Big Data Startups”也會持續(xù)挖掘大數(shù)據(jù)的價(jià)值、微調(diào)其企業(yè)策略,期盼在市場中展露頭角。以下幾家新創(chuàng)公司都已經(jīng)各自獲得好幾輪金額可觀的融資,在大數(shù)據(jù)市場中十分有潛力,值得我們關(guān)注并參考,從中瞭解大數(shù)據(jù)的應(yīng)用方向及潛能。
SumAll
SumAll 是一家位于紐約的新創(chuàng)公司,成立于 2011 年,主要為中小型企業(yè)提供即時(shí)數(shù)據(jù)分析服務(wù)。SumAll 的線上分析平臺收集社交媒體及電子商務(wù)上的數(shù)據(jù),并進(jìn)行分析后,把可視化的分析結(jié)果展示在互動(dòng)介面上供企業(yè)客戶參考。例如社交頁面上的網(wǎng)頁流量、ebay 上的銷售量等數(shù)據(jù),生成每星期、每個(gè)月的分析報(bào)導(dǎo),讓企業(yè)客戶追蹤且分析使用者/消費(fèi)者。
這家公司還有一個(gè)很酷的地方:他們分了百分之十的股份給旗下的 SumAll.org —— 一家旨在用資料分析增加社會福利的非盈利組織。
Luminoso
Luminoso 成立于 2010 年,原本是麻省理工大學(xué)媒體實(shí)驗(yàn)室的一個(gè)研究項(xiàng)目,后來發(fā)展成利用人工智慧進(jìn)行文本分析的新創(chuàng)公司。從通訊工具里的訊息、網(wǎng)絡(luò)上的評論等數(shù)據(jù)來源,利用自然語言處理和機(jī)器學(xué)習(xí)技術(shù),幫助企業(yè)分析消費(fèi)者在各種通訊渠道中討論的話題。
舉例來說,Luminoso 提供的服務(wù)可以幫助企業(yè)追蹤時(shí)下發(fā)生的熱門討論,還可以根據(jù)需求迅速回應(yīng),如果消費(fèi)者對于某產(chǎn)品的缺陷在網(wǎng)上進(jìn)行了投訴或者抱怨,企業(yè)可以及時(shí)進(jìn)行補(bǔ)救。
Flatiron Health
同樣發(fā)源于紐約的 Flatiron Health 成立于 2012 年,是大數(shù)據(jù)應(yīng)用界中是十分有名的“醫(yī)療大數(shù)據(jù)技術(shù)”新創(chuàng)公司,主要專注于癌癥數(shù)據(jù)分析1。
Flatiron Health 透過各種管道收集病患的臨床紀(jì)錄、醫(yī)師診斷紀(jì)錄、患者治療結(jié)果、基因數(shù)據(jù)及繳費(fèi)紀(jì)錄等數(shù)據(jù),透過分析整合后提交給腫瘤學(xué)家,透過分析過往的治療方法跟紀(jì)錄,幫助醫(yī)生做出更好的臨床診斷跟醫(yī)治手段。全美現(xiàn)在有約 1000 名腫瘤學(xué)家在使用 Flatiron Health 的數(shù)據(jù)。
Flatiron 的分析平臺 OncologyClound 百分之百致力于分析腫瘤學(xué)數(shù)據(jù),不過 Flatiron 公司也表示,現(xiàn)在全美只有 4% 的癌癥病人參與臨床試驗(yàn),另外 96% 無法取得的癌癥病人數(shù)據(jù)則成為大數(shù)據(jù)分析中的缺口。
Domo
Domo 成立于 2010 年,總部位于猶他州鹽湖城,是一家為企業(yè)決策層提供商業(yè)智慧(BI)的初創(chuàng)公司。2014 年就累積了約有 500 多家簽約客戶,其中包括了 National Geographic、eBay、Ogio 及 GoodWill 等。
Domo 的商業(yè)智慧云端平臺可以即時(shí)分析多方資料,將多方來源提供的結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)以即時(shí)、視覺化的方式呈現(xiàn)出來,不但幫助企業(yè)做決策,也是一個(gè)業(yè)務(wù)管理平臺。
Tamr
Tamr 成立于 2013 年,其技術(shù)來自于麻省理工的電腦與人工智慧實(shí)驗(yàn)室,由麻省理工學(xué)院教授兼數(shù)據(jù)專家 Michael Stonebraker 跟種子投資家 Andy Palmer 共同創(chuàng)辦,在 2014 年正式營運(yùn)。
大數(shù)據(jù)的其中一個(gè)問題就是資料量太大了,而且資料來源劇增又不斷變換,Tamr 的機(jī)器學(xué)習(xí)演算法跟軟件能有效而大規(guī)模地廣泛整合和管理現(xiàn)有和未來的多種數(shù)據(jù)來源,大量降低數(shù)據(jù)來源的搜集與連結(jié)所用的時(shí)間,同時(shí)辨別資料來源及之間的關(guān)聯(lián)。
Alpine Data Labs
Alpine Data Labs 成立于 2010 年,總部位于舊金山,算是十分有名的大數(shù)據(jù)分析挖掘軟件新創(chuàng)公司,該公司總裁兼首席執(zhí)行長 Joe Otto 和首席產(chǎn)品長 Steven Hillion 都來自于被云端儲存服務(wù)提供商 EMC 收購的 Greenplum 公司。
大部份的大數(shù)據(jù)新創(chuàng)公司都在做“資料可視化(Data Visualization)”,Alpine 則是提供大數(shù)據(jù)及 Hadoop 的預(yù)測性分析功能,且號稱是全球第一個(gè)針對大數(shù)據(jù)的團(tuán)隊(duì)合作分析解決方案。
DataStax
DataStax 成立于 2010 年,總部位于加州,在去年 9 月曾獲得驚人的 1 億 600 萬美元 E 輪融資。
DataStax 主要業(yè)務(wù)是開發(fā)和銷售開源分布式數(shù)據(jù)庫 Apache Cassandra 的商業(yè)化版本。Apache Cassandra 是高擴(kuò)展性、高容錯(cuò)的 NoSQL 數(shù)據(jù)庫,比傳統(tǒng)的關(guān)系式數(shù)據(jù)庫多了許多優(yōu)勢,其設(shè)計(jì)不僅兼顧了擴(kuò)展性和開發(fā)靈活性,而且搜尋效率也相當(dāng)不錯(cuò),特別適合大數(shù)據(jù)的儲存,像是 Cisco、eBay 等大公司都在使用這種數(shù)據(jù)庫。
Altiscale
Hadoop 在這幾年內(nèi)被公認(rèn)成為大數(shù)據(jù)的主流技術(shù),而 Hadoop 也是 Altiscale 這家新創(chuàng)公司能夠迅速成長茁壯的原因。
Altiscale 成立于 2012 年,總部在加州 Palo Alto,其 CEO 兼創(chuàng)辦人是曾在 Yahoo 任職首席技術(shù)長(Chief Technology Officer)的 Raymie Stata ,其高層還有同樣來自 Yahoo 曾擔(dān)任首席架構(gòu)師(Chief Architect)的 David Chaiken。相信大家都知道 Yahoo 就是 Hadoop 的發(fā)源地,那這家由 Yahoo 前任高管們所創(chuàng)立的大數(shù)據(jù)公司主打“Hadoop-as-a-Service”也就一點(diǎn)都不奇怪了。
Altiscale 的服務(wù)是解決 Hadoop 的抽象性與復(fù)雜度,為工程師搭建一個(gè)完整的 Hadoop 環(huán)境,并且對其進(jìn)行維護(hù)與管理,讓使用者可以更專注于數(shù)據(jù)和應(yīng)用。
WibiData
WibiData 位于舊金山的創(chuàng)業(yè)公司,成立于 2010 年,聯(lián)合創(chuàng)始人 Christophe Bisciglia 為企業(yè)數(shù)據(jù)管理分析公司Cloudera 的聯(lián)合創(chuàng)始人之一,WibiData 的另一名聯(lián)合創(chuàng)始人 Aaron Kimball 則是 Cloudera 聘用的第一個(gè)工程師2。
這家公司所開發(fā)的 WibiEnterprise 平臺是由一系列的開源Apache 技術(shù)建構(gòu)而成,其中包含了 Hadoop、HBase 和 Cassandra,以及用于即時(shí)收集、分析、服務(wù)數(shù)據(jù)的 Kiji 開源框架,其平臺的功能是為消費(fèi)者即時(shí)打造客制化的推薦內(nèi)容及相關(guān)搜尋結(jié)果,和電子商務(wù)龍頭 Amazon 所做的類似。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11