
聚合數(shù)據(jù)左磊:不走尋常路 做國內(nèi)最好的數(shù)據(jù)聚合平臺
新科蘭德科技(ThinkLand Technology)創(chuàng)立于2010年2月,總部注冊于蘇州工業(yè)園區(qū),是一家專業(yè)從事數(shù)據(jù)服務、智能手機軟硬件開發(fā)的高新技術企業(yè)。旗下聚合數(shù)據(jù)平臺是國內(nèi)領先的移動數(shù)據(jù)服務商,為智能手機開發(fā)者,網(wǎng)站站長,移動設備開發(fā)人員及圖商提供原始數(shù)據(jù)API服務的綜合性云數(shù)據(jù)平臺。包含手機聚合、網(wǎng)站聚合、LBS聚合三部分,其功能類似于Google APIS。CSDN近期采訪了蘇州新科蘭德科技有限公司的創(chuàng)始人兼CEO左磊,以下是專訪整理:
圖:新科蘭德創(chuàng)始人 左磊
CSDN:首先請您簡單介紹一下創(chuàng)業(yè)的經(jīng)歷。
左磊:2009年從美國回來之后,先是跟朋友在上海工作了一段時間,那時候主要是做以前美國大學同學的一些外包單子,做了大概半年。之后我和兩個同學,到蘇州創(chuàng)辦了新科蘭德,聚合數(shù)據(jù)就是我們旗下的產(chǎn)品。
當時選擇在蘇州創(chuàng)業(yè)主要有兩個原因: 一是我的另外二個創(chuàng)業(yè)伙伴也就是我的大學同學都是蘇州人,當然我是江蘇揚中人,離我自己家也很近;其次蘇州的創(chuàng)業(yè)壞境一直以來在全國都是領先的,啟動資金、免租的辦公室、一系列的扶持政策比較適合我們這種小企業(yè)創(chuàng)業(yè)。
CSDN:在創(chuàng)業(yè)的初期,主要是做什么項目?
左磊:我們在2010年創(chuàng)業(yè),創(chuàng)業(yè)的早期的時候是做一些APP應用,因為當時也沒有很好的方向,也就是想到什么,感覺還不錯,就做什么。我們曾經(jīng)做了一款世界杯的應用,主要內(nèi)容就是對比賽信息的更新,當時下載量已經(jīng)達到了五六萬次,這也是我們做的比較好的一款應用。也正是在這個應用的開發(fā)過程中,我們發(fā)現(xiàn)了一個創(chuàng)業(yè)的機會。
首先,當開發(fā)者在開發(fā)軟件的時候,我們發(fā)現(xiàn)他們對數(shù)據(jù)需求是非常大的,而且他們本身也沒有能力去做這些事情。比如說,開發(fā)者想要做一款北京市餐飲行業(yè)的軟件,那么第一步就是要獲得有關餐飲行業(yè)的數(shù)據(jù),不僅包括餐館的名字,地址等信息,還需要有知道這家餐館有沒有特色菜,能不能刷卡消費,能不能停車等信息。像大眾點評就涵蓋了這些信息,那時候我們就意識到,這種模式是能夠賺錢的,于是就創(chuàng)立了聚合數(shù)據(jù)平臺。
CSDN:具體來講,聚合數(shù)據(jù)是一種什么樣的商業(yè)模式?
左磊:因為我們發(fā)現(xiàn)聚合數(shù)據(jù)在數(shù)據(jù)挖掘方面有一定的能力,所以就放棄了客戶端的開發(fā),轉而去做數(shù)據(jù)服務。如果企業(yè)想要開發(fā)一款軟件,那么我們就可以提供一整套的數(shù)據(jù)解決方案,包括產(chǎn)品的分類、優(yōu)化等等,甚至可以租借我們的服務器端口,那么用戶在調(diào)用的時候甚至連服務器也不用購買。
CSDN:那么聚合數(shù)據(jù)在數(shù)據(jù)挖掘領域,有什么什么獨特的優(yōu)勢?
左磊:聚合數(shù)據(jù)把自己定位為數(shù)據(jù)服務商。我們挖掘各種有價值的數(shù)據(jù)進行分類,比如像金融、日常生活、地圖、天氣等等,類似這樣不同的分類。然后把這些分類數(shù)據(jù)做精做全,最后批量的給銷售出去。我們最終的想法是做一個很大的平臺。
CSDN:公司目前的團隊規(guī)模有多大?主要客戶都有哪些?
左磊:目前公司的團隊大概30人左右,而專門從事數(shù)據(jù)分類工作大概有23人。而聚合數(shù)據(jù)開放的接口大概有20多個,基本上覆蓋了大概的衣食住行、公共交通、地圖、天氣等等,涉及的領域還是很寬的。公司剛開始的時候,是跟很多大型的汽車企業(yè)合作,像東風本田、日產(chǎn)、尼桑等等汽車企業(yè),但是我們跟這些企業(yè)的合作不是直接合作,而是通過另外一家公司車網(wǎng)互聯(lián)。也就是說我們把數(shù)據(jù)提供給車網(wǎng)互聯(lián),他們和汽車企業(yè)直接合作,產(chǎn)品類似于導航,只不過提供了更多的信息,像加油站的地理位置、油價、附近的酒店等等信息,新科蘭德和車網(wǎng)互聯(lián)從2010年就開始合作,關系非常穩(wěn)定。
CSDN:聚合數(shù)據(jù)平臺目前提供的數(shù)據(jù)服務方式有哪些?
左磊:聚合數(shù)據(jù)提供定制化的服務,就是說我們會按照客戶提出的接口要求,定制所需要的不同種類的接口,按月進行收費,所謂的大客戶收費,這是目前我們收入的主要來源。另外就是針對中小開發(fā)者團隊及個人的聚合平臺網(wǎng)站,對于小型的團隊或者個人開發(fā)者提供接口服務?,F(xiàn)在聚合已經(jīng)開放了20多個接口,開發(fā)者可以任意調(diào)用其中的幾個。當然我們也提供了不同級別的收費服務,包括初級會員、中級會員和高級會員,這三者的區(qū)別在于調(diào)用的接口類型,接口數(shù),服務器帶寬方面有一定的不同,像初級會員只能調(diào)三個收費接口,這是有限制的,每小時最多的請求可能只有5000-10000次。中級會員會高一點,高級會員更高。這也是根據(jù)會員不同的等級來區(qū)分的,當然大部分接口都是免費的,如果你的APP或者軟件用戶量不是很大的話免費接口足夠滿足你的需求。
另辟蹊徑,不一樣的數(shù)據(jù)挖掘方式
CSDN:目前數(shù)據(jù)的收集還存在哪些問題?聚合數(shù)據(jù)平臺是如何解決的?
左磊:聚合數(shù)據(jù)平臺最早期的數(shù)據(jù)來源主要是互聯(lián)網(wǎng)。但是公司在去年就轉變了方式,開始以合作和自我修繕為主。之所以要改,是因為我們發(fā)現(xiàn)在收集某些地圖數(shù)據(jù)時,像大眾點評中餐館的數(shù)據(jù)信息都是不準確的,因為經(jīng)過兩三年,很多店名已經(jīng)更改了,或者直接倒閉了。但是這部分數(shù)據(jù)在大眾點評上還是可以查到,也沒有人去更新修正。而且大眾點評在這個領域也是最好的一個平臺,經(jīng)常被不同的地圖服務商所采集,像百度地圖也是使用它的數(shù)據(jù)。最后,大家發(fā)現(xiàn)整個互聯(lián)網(wǎng)都是同一個錯誤,因為數(shù)據(jù)來源都是同一個。還有國內(nèi)行政區(qū)域劃分問題,每年都有城鄉(xiāng)合并、街道改換名稱。像蘇州的工業(yè)園區(qū)做很有名,都18年了,現(xiàn)在在百度或者Google地圖上還是吳中區(qū),這些都是錯誤的。這也說明,每次合并之后,地圖數(shù)據(jù)信息至少要好幾年才能更新。那么在地圖上就會留下很多后患。公司一方面去通過挖掘現(xiàn)在有的數(shù)據(jù),另一方面也通過自己的方式去驗證;通常還會跟數(shù)據(jù)信息非常準確的網(wǎng)站進行合作,通過接口調(diào)用方式,開放接口。
基礎數(shù)據(jù)是公司的彈藥
CSDN:那么聚合數(shù)據(jù)平臺目前數(shù)據(jù)服務處在一個什么階段?公司目前還有沒有什么新的想法?
左磊:其實聚合數(shù)據(jù)平臺還是處在一個初期階段,非常重視原始數(shù)據(jù)的收集,這里公司投入了很大部分的精力,還沒有實現(xiàn)真正意義上的數(shù)據(jù)分析,畢竟現(xiàn)在沒有那么大的團隊。公司現(xiàn)在做的就是最苦、最累的數(shù)據(jù)收集數(shù)據(jù)的階段,我們稱之大數(shù)據(jù)里面的基礎數(shù)據(jù),這是非常重要的東西,就像打仗的子彈一樣,沒子彈的話,一切都難以實現(xiàn)。
公司目前重點在地圖數(shù)據(jù)這塊,因為我們認為地圖是一個比較重要的入口,比如說導航數(shù)據(jù),我們發(fā)現(xiàn)存在大量的錯誤。公司今年的目標是希望把地圖數(shù)據(jù)做得更精確一些,而且我們采用自己的方式來去校驗、去更新這樣的數(shù)據(jù)。然后把這部分更新過的、增加過的、補充過的新數(shù)據(jù)賣給地圖服務商,而且可我們會跟他們證明,他們地圖上面的錯誤很高,我們能提供的數(shù)據(jù)更全面,更準確,那么市場還是比較廣泛的。
其次我們想做一個API的聚合平臺,而且現(xiàn)在很少有站點能夠做的很全面很精準,但是開發(fā)者則更希望得到更準確的數(shù)據(jù),同時不要依附于某一個平臺之上。像新浪微博、微信也開始做API,但是大部分都是依附他們的平臺,那么開發(fā)者的積極性就相對偏低,更多的開發(fā)者還是希望做自己東西。
把數(shù)據(jù)放到網(wǎng)站上,讓開發(fā)者來下載。就是說我們?nèi)绻蛔鯝PI,我們是不是可以做成一個數(shù)據(jù)運營商,每個月固定時間發(fā)布一個更新包,開發(fā)者都可以過來下載,之前也想過這個問題,未來我們可能會去來把一些非核心數(shù)據(jù)做成這種形式。但是對于我們的核心數(shù)據(jù)來說,還是想樹立我們自己的品牌。
最后一個方面,因為目前的API很全但也很雜,我們想把API做成一個檢索服務。目前公司的網(wǎng)站上已經(jīng)有很多國外API的檢索服務,我們也想把國內(nèi)的新浪微博、淘寶等提供的API服務做一個匯總。一方面做自己的API,另外一方面,我們也想把其他的API整理一下進行分享。因為我們網(wǎng)站的分類比較好,相對于百度來說,是個更好的API檢索平臺,我們也是想為更多的開發(fā)者服務,在這點上和CSDN是相同的。
CSDN:新科蘭德如何應對大型數(shù)據(jù)服務商,像百度,高德,中國移動這些數(shù)據(jù)服務巨頭企業(yè)?
左磊:其實之前我們公司一直也在討論這個事情,包括高德、電信、移動等公司,他們都有上千人的團隊在做數(shù)據(jù)的更新與收集工作。但是具體到某地某條路的路名要改,相對于這種收集方式,就存在一定的問題。因為如果只是派人員一點一點的搜集,有點不太靠譜,畢竟數(shù)據(jù)量太大了。甚至前兩天剛收集到的數(shù)據(jù),很快就變更了,這就會造成很大的資源浪費。新科蘭德希望通過客戶端的方式,讓所有擁有有智能手機的人,都成為數(shù)據(jù)的收集來源,這有點像付費簽到的那種形式。公司希望用戶去簽一些目前數(shù)據(jù)庫里沒有的數(shù)據(jù),比如說搜集某條街上100家餐館的名字信息,那么使用搜索引擎,還有挖掘程序,可以從互聯(lián)網(wǎng)上挖掘出80家的信息,而剩下的20家我們會當任務一樣發(fā)布出去,讓用戶去填充。但簽下來我們會獎勵,用這樣的形式來做數(shù)據(jù)收集,要比主動搜集的效果要好的多。像新浪微博的客戶端也在做這樣的事情,雖然簽到非常多,但是重復率非常高,而我們只是發(fā)布未知的數(shù)據(jù)信息收集。
CSDN:新科蘭德未來的發(fā)展目標是什么?
左磊:其實國內(nèi)數(shù)據(jù)挖掘的市場是一個新的市場,聚合數(shù)據(jù)平臺也算是最早的一批探路者,至少目前來說這個方向是對的。未來我們是想做成國內(nèi)最大的數(shù)據(jù)服務商,我們也一直向這個目標上努力。目前我們的競爭對手,除了很多大平臺之外,國內(nèi)好像還沒有見到類似的服務。
但是大平臺跟我們也不一樣,大平臺是開放自己平臺的資源,在它們平臺上的基礎上做開發(fā),最終還是為這個平臺服務。新科蘭德更直白一點,開發(fā)者直接可以調(diào)用數(shù)據(jù),做自己想要的東西,我們也不管你是拿來做什么。這點和大平臺是有區(qū)別的。而且從基礎數(shù)據(jù)的角度來看,我們應該是獨一無二的。
我們目前平臺的開發(fā)者的團隊或者個人開發(fā)者大概五六千人,在此之前我們也沒有進行推廣過,準備在今年下半年發(fā)力,希望開發(fā)者今年能夠突破2萬的規(guī)模。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03