
聚合數(shù)據(jù)左磊:不走尋常路 做國內(nèi)最好的數(shù)據(jù)聚合平臺
新科蘭德科技(ThinkLand Technology)創(chuàng)立于2010年2月,總部注冊于蘇州工業(yè)園區(qū),是一家專業(yè)從事數(shù)據(jù)服務(wù)、智能手機軟硬件開發(fā)的高新技術(shù)企業(yè)。旗下聚合數(shù)據(jù)平臺是國內(nèi)領(lǐng)先的移動數(shù)據(jù)服務(wù)商,為智能手機開發(fā)者,網(wǎng)站站長,移動設(shè)備開發(fā)人員及圖商提供原始數(shù)據(jù)API服務(wù)的綜合性云數(shù)據(jù)平臺。包含手機聚合、網(wǎng)站聚合、LBS聚合三部分,其功能類似于Google APIS。CSDN近期采訪了蘇州新科蘭德科技有限公司的創(chuàng)始人兼CEO左磊,以下是專訪整理:
圖:新科蘭德創(chuàng)始人 左磊
CSDN:首先請您簡單介紹一下創(chuàng)業(yè)的經(jīng)歷。
左磊:2009年從美國回來之后,先是跟朋友在上海工作了一段時間,那時候主要是做以前美國大學(xué)同學(xué)的一些外包單子,做了大概半年。之后我和兩個同學(xué),到蘇州創(chuàng)辦了新科蘭德,聚合數(shù)據(jù)就是我們旗下的產(chǎn)品。
當(dāng)時選擇在蘇州創(chuàng)業(yè)主要有兩個原因: 一是我的另外二個創(chuàng)業(yè)伙伴也就是我的大學(xué)同學(xué)都是蘇州人,當(dāng)然我是江蘇揚中人,離我自己家也很近;其次蘇州的創(chuàng)業(yè)壞境一直以來在全國都是領(lǐng)先的,啟動資金、免租的辦公室、一系列的扶持政策比較適合我們這種小企業(yè)創(chuàng)業(yè)。
CSDN:在創(chuàng)業(yè)的初期,主要是做什么項目?
左磊:我們在2010年創(chuàng)業(yè),創(chuàng)業(yè)的早期的時候是做一些APP應(yīng)用,因為當(dāng)時也沒有很好的方向,也就是想到什么,感覺還不錯,就做什么。我們曾經(jīng)做了一款世界杯的應(yīng)用,主要內(nèi)容就是對比賽信息的更新,當(dāng)時下載量已經(jīng)達到了五六萬次,這也是我們做的比較好的一款應(yīng)用。也正是在這個應(yīng)用的開發(fā)過程中,我們發(fā)現(xiàn)了一個創(chuàng)業(yè)的機會。
首先,當(dāng)開發(fā)者在開發(fā)軟件的時候,我們發(fā)現(xiàn)他們對數(shù)據(jù)需求是非常大的,而且他們本身也沒有能力去做這些事情。比如說,開發(fā)者想要做一款北京市餐飲行業(yè)的軟件,那么第一步就是要獲得有關(guān)餐飲行業(yè)的數(shù)據(jù),不僅包括餐館的名字,地址等信息,還需要有知道這家餐館有沒有特色菜,能不能刷卡消費,能不能停車等信息。像大眾點評就涵蓋了這些信息,那時候我們就意識到,這種模式是能夠賺錢的,于是就創(chuàng)立了聚合數(shù)據(jù)平臺。
CSDN:具體來講,聚合數(shù)據(jù)是一種什么樣的商業(yè)模式?
左磊:因為我們發(fā)現(xiàn)聚合數(shù)據(jù)在數(shù)據(jù)挖掘方面有一定的能力,所以就放棄了客戶端的開發(fā),轉(zhuǎn)而去做數(shù)據(jù)服務(wù)。如果企業(yè)想要開發(fā)一款軟件,那么我們就可以提供一整套的數(shù)據(jù)解決方案,包括產(chǎn)品的分類、優(yōu)化等等,甚至可以租借我們的服務(wù)器端口,那么用戶在調(diào)用的時候甚至連服務(wù)器也不用購買。
CSDN:那么聚合數(shù)據(jù)在數(shù)據(jù)挖掘領(lǐng)域,有什么什么獨特的優(yōu)勢?
左磊:聚合數(shù)據(jù)把自己定位為數(shù)據(jù)服務(wù)商。我們挖掘各種有價值的數(shù)據(jù)進行分類,比如像金融、日常生活、地圖、天氣等等,類似這樣不同的分類。然后把這些分類數(shù)據(jù)做精做全,最后批量的給銷售出去。我們最終的想法是做一個很大的平臺。
CSDN:公司目前的團隊規(guī)模有多大?主要客戶都有哪些?
左磊:目前公司的團隊大概30人左右,而專門從事數(shù)據(jù)分類工作大概有23人。而聚合數(shù)據(jù)開放的接口大概有20多個,基本上覆蓋了大概的衣食住行、公共交通、地圖、天氣等等,涉及的領(lǐng)域還是很寬的。公司剛開始的時候,是跟很多大型的汽車企業(yè)合作,像東風(fēng)本田、日產(chǎn)、尼桑等等汽車企業(yè),但是我們跟這些企業(yè)的合作不是直接合作,而是通過另外一家公司車網(wǎng)互聯(lián)。也就是說我們把數(shù)據(jù)提供給車網(wǎng)互聯(lián),他們和汽車企業(yè)直接合作,產(chǎn)品類似于導(dǎo)航,只不過提供了更多的信息,像加油站的地理位置、油價、附近的酒店等等信息,新科蘭德和車網(wǎng)互聯(lián)從2010年就開始合作,關(guān)系非常穩(wěn)定。
CSDN:聚合數(shù)據(jù)平臺目前提供的數(shù)據(jù)服務(wù)方式有哪些?
左磊:聚合數(shù)據(jù)提供定制化的服務(wù),就是說我們會按照客戶提出的接口要求,定制所需要的不同種類的接口,按月進行收費,所謂的大客戶收費,這是目前我們收入的主要來源。另外就是針對中小開發(fā)者團隊及個人的聚合平臺網(wǎng)站,對于小型的團隊或者個人開發(fā)者提供接口服務(wù)?,F(xiàn)在聚合已經(jīng)開放了20多個接口,開發(fā)者可以任意調(diào)用其中的幾個。當(dāng)然我們也提供了不同級別的收費服務(wù),包括初級會員、中級會員和高級會員,這三者的區(qū)別在于調(diào)用的接口類型,接口數(shù),服務(wù)器帶寬方面有一定的不同,像初級會員只能調(diào)三個收費接口,這是有限制的,每小時最多的請求可能只有5000-10000次。中級會員會高一點,高級會員更高。這也是根據(jù)會員不同的等級來區(qū)分的,當(dāng)然大部分接口都是免費的,如果你的APP或者軟件用戶量不是很大的話免費接口足夠滿足你的需求。
另辟蹊徑,不一樣的數(shù)據(jù)挖掘方式
CSDN:目前數(shù)據(jù)的收集還存在哪些問題?聚合數(shù)據(jù)平臺是如何解決的?
左磊:聚合數(shù)據(jù)平臺最早期的數(shù)據(jù)來源主要是互聯(lián)網(wǎng)。但是公司在去年就轉(zhuǎn)變了方式,開始以合作和自我修繕為主。之所以要改,是因為我們發(fā)現(xiàn)在收集某些地圖數(shù)據(jù)時,像大眾點評中餐館的數(shù)據(jù)信息都是不準(zhǔn)確的,因為經(jīng)過兩三年,很多店名已經(jīng)更改了,或者直接倒閉了。但是這部分?jǐn)?shù)據(jù)在大眾點評上還是可以查到,也沒有人去更新修正。而且大眾點評在這個領(lǐng)域也是最好的一個平臺,經(jīng)常被不同的地圖服務(wù)商所采集,像百度地圖也是使用它的數(shù)據(jù)。最后,大家發(fā)現(xiàn)整個互聯(lián)網(wǎng)都是同一個錯誤,因為數(shù)據(jù)來源都是同一個。還有國內(nèi)行政區(qū)域劃分問題,每年都有城鄉(xiāng)合并、街道改換名稱。像蘇州的工業(yè)園區(qū)做很有名,都18年了,現(xiàn)在在百度或者Google地圖上還是吳中區(qū),這些都是錯誤的。這也說明,每次合并之后,地圖數(shù)據(jù)信息至少要好幾年才能更新。那么在地圖上就會留下很多后患。公司一方面去通過挖掘現(xiàn)在有的數(shù)據(jù),另一方面也通過自己的方式去驗證;通常還會跟數(shù)據(jù)信息非常準(zhǔn)確的網(wǎng)站進行合作,通過接口調(diào)用方式,開放接口。
基礎(chǔ)數(shù)據(jù)是公司的彈藥
CSDN:那么聚合數(shù)據(jù)平臺目前數(shù)據(jù)服務(wù)處在一個什么階段?公司目前還有沒有什么新的想法?
左磊:其實聚合數(shù)據(jù)平臺還是處在一個初期階段,非常重視原始數(shù)據(jù)的收集,這里公司投入了很大部分的精力,還沒有實現(xiàn)真正意義上的數(shù)據(jù)分析,畢竟現(xiàn)在沒有那么大的團隊。公司現(xiàn)在做的就是最苦、最累的數(shù)據(jù)收集數(shù)據(jù)的階段,我們稱之大數(shù)據(jù)里面的基礎(chǔ)數(shù)據(jù),這是非常重要的東西,就像打仗的子彈一樣,沒子彈的話,一切都難以實現(xiàn)。
公司目前重點在地圖數(shù)據(jù)這塊,因為我們認(rèn)為地圖是一個比較重要的入口,比如說導(dǎo)航數(shù)據(jù),我們發(fā)現(xiàn)存在大量的錯誤。公司今年的目標(biāo)是希望把地圖數(shù)據(jù)做得更精確一些,而且我們采用自己的方式來去校驗、去更新這樣的數(shù)據(jù)。然后把這部分更新過的、增加過的、補充過的新數(shù)據(jù)賣給地圖服務(wù)商,而且可我們會跟他們證明,他們地圖上面的錯誤很高,我們能提供的數(shù)據(jù)更全面,更準(zhǔn)確,那么市場還是比較廣泛的。
其次我們想做一個API的聚合平臺,而且現(xiàn)在很少有站點能夠做的很全面很精準(zhǔn),但是開發(fā)者則更希望得到更準(zhǔn)確的數(shù)據(jù),同時不要依附于某一個平臺之上。像新浪微博、微信也開始做API,但是大部分都是依附他們的平臺,那么開發(fā)者的積極性就相對偏低,更多的開發(fā)者還是希望做自己東西。
把數(shù)據(jù)放到網(wǎng)站上,讓開發(fā)者來下載。就是說我們?nèi)绻蛔鯝PI,我們是不是可以做成一個數(shù)據(jù)運營商,每個月固定時間發(fā)布一個更新包,開發(fā)者都可以過來下載,之前也想過這個問題,未來我們可能會去來把一些非核心數(shù)據(jù)做成這種形式。但是對于我們的核心數(shù)據(jù)來說,還是想樹立我們自己的品牌。
最后一個方面,因為目前的API很全但也很雜,我們想把API做成一個檢索服務(wù)。目前公司的網(wǎng)站上已經(jīng)有很多國外API的檢索服務(wù),我們也想把國內(nèi)的新浪微博、淘寶等提供的API服務(wù)做一個匯總。一方面做自己的API,另外一方面,我們也想把其他的API整理一下進行分享。因為我們網(wǎng)站的分類比較好,相對于百度來說,是個更好的API檢索平臺,我們也是想為更多的開發(fā)者服務(wù),在這點上和CSDN是相同的。
CSDN:新科蘭德如何應(yīng)對大型數(shù)據(jù)服務(wù)商,像百度,高德,中國移動這些數(shù)據(jù)服務(wù)巨頭企業(yè)?
左磊:其實之前我們公司一直也在討論這個事情,包括高德、電信、移動等公司,他們都有上千人的團隊在做數(shù)據(jù)的更新與收集工作。但是具體到某地某條路的路名要改,相對于這種收集方式,就存在一定的問題。因為如果只是派人員一點一點的搜集,有點不太靠譜,畢竟數(shù)據(jù)量太大了。甚至前兩天剛收集到的數(shù)據(jù),很快就變更了,這就會造成很大的資源浪費。新科蘭德希望通過客戶端的方式,讓所有擁有有智能手機的人,都成為數(shù)據(jù)的收集來源,這有點像付費簽到的那種形式。公司希望用戶去簽一些目前數(shù)據(jù)庫里沒有的數(shù)據(jù),比如說搜集某條街上100家餐館的名字信息,那么使用搜索引擎,還有挖掘程序,可以從互聯(lián)網(wǎng)上挖掘出80家的信息,而剩下的20家我們會當(dāng)任務(wù)一樣發(fā)布出去,讓用戶去填充。但簽下來我們會獎勵,用這樣的形式來做數(shù)據(jù)收集,要比主動搜集的效果要好的多。像新浪微博的客戶端也在做這樣的事情,雖然簽到非常多,但是重復(fù)率非常高,而我們只是發(fā)布未知的數(shù)據(jù)信息收集。
CSDN:新科蘭德未來的發(fā)展目標(biāo)是什么?
左磊:其實國內(nèi)數(shù)據(jù)挖掘的市場是一個新的市場,聚合數(shù)據(jù)平臺也算是最早的一批探路者,至少目前來說這個方向是對的。未來我們是想做成國內(nèi)最大的數(shù)據(jù)服務(wù)商,我們也一直向這個目標(biāo)上努力。目前我們的競爭對手,除了很多大平臺之外,國內(nèi)好像還沒有見到類似的服務(wù)。
但是大平臺跟我們也不一樣,大平臺是開放自己平臺的資源,在它們平臺上的基礎(chǔ)上做開發(fā),最終還是為這個平臺服務(wù)。新科蘭德更直白一點,開發(fā)者直接可以調(diào)用數(shù)據(jù),做自己想要的東西,我們也不管你是拿來做什么。這點和大平臺是有區(qū)別的。而且從基礎(chǔ)數(shù)據(jù)的角度來看,我們應(yīng)該是獨一無二的。
我們目前平臺的開發(fā)者的團隊或者個人開發(fā)者大概五六千人,在此之前我們也沒有進行推廣過,準(zhǔn)備在今年下半年發(fā)力,希望開發(fā)者今年能夠突破2萬的規(guī)模。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10