
大麥網(wǎng)周宇紅:用大數(shù)據(jù)打破票務(wù)行業(yè)的天花板
采訪 | Penny
來自CDA數(shù)據(jù)分析師微信公眾號(hào)
想?yún)⑴c采訪的同學(xué)可以發(fā)送以下內(nèi)容“每天一個(gè)數(shù)據(jù)分析師+姓名+聯(lián)系方式”至songpeiyang@pinggu.org
人物檔案
周宇紅,大麥網(wǎng)大數(shù)據(jù)技術(shù)負(fù)責(zé)人,專注于娛樂行業(yè)大數(shù)據(jù)應(yīng)用,負(fù)責(zé)大數(shù)據(jù)平臺(tái)建設(shè),機(jī)器學(xué)習(xí),自然語言處理,社交媒體挖掘等。
DA:能請(qǐng)您先介紹一下自己的基本情況嗎?
周宇紅:我其實(shí)是從2013年底開始轉(zhuǎn)戰(zhàn)互聯(lián)網(wǎng)的,之前主要在傳統(tǒng)的IT行業(yè)。到大麥網(wǎng)以后,一開始就接觸到大數(shù)據(jù)。到了2015年初,公司專門設(shè)立大數(shù)據(jù)部門,專門進(jìn)行大數(shù)據(jù)的應(yīng)用分析,我負(fù)責(zé)整合大數(shù)據(jù)技術(shù)方面的東西。
其實(shí),公司對(duì)數(shù)據(jù)認(rèn)識(shí)的重要程度、對(duì)大數(shù)據(jù)應(yīng)用有沒有想法,對(duì)大數(shù)據(jù)應(yīng)用的節(jié)奏、面還有深度,這些都受到公司本身在行業(yè)所處的地位的影響。有了一定的基礎(chǔ)數(shù)據(jù)你才能玩一些大數(shù)據(jù)的技術(shù)處理,如果企業(yè)本身達(dá)不到這些要求,那么一般傳統(tǒng)的一些數(shù)據(jù)處理技術(shù)就OK了。
目前,大麥網(wǎng)大數(shù)據(jù)屬于初步啟動(dòng)建設(shè)的一年,2015年初專門設(shè)立大數(shù)據(jù)部門,預(yù)計(jì)到了2016年,公司的數(shù)據(jù)應(yīng)用也會(huì)全面展開。我們會(huì)從大數(shù)據(jù)平臺(tái)、整合以及應(yīng)用來三方面來全方位地推動(dòng)大數(shù)據(jù)的分析研究。它包括我們的網(wǎng)站推介、精準(zhǔn)營銷、運(yùn)營分析、行業(yè)預(yù)測(cè)以及風(fēng)險(xiǎn)控制,基本上應(yīng)該涵蓋了大數(shù)據(jù)應(yīng)用的這些方面,根據(jù)我們的業(yè)務(wù)或者數(shù)據(jù)本身來決定應(yīng)用多深的問題。
DA:現(xiàn)在很多企業(yè)都在嘗試做大數(shù)據(jù),企業(yè)構(gòu)建大數(shù)據(jù)部門時(shí)需要注意哪些問題呢?
周宇紅:首先,構(gòu)建大數(shù)據(jù)部門時(shí)必須想清楚有沒有應(yīng)用大數(shù)據(jù)的著眼點(diǎn)。第二,構(gòu)建大數(shù)據(jù)部門時(shí),看看自己的數(shù)據(jù)體量是否需要設(shè)置專門的部門來分析,不要僅僅作為一種嘗鮮,別人都玩大數(shù)據(jù)了,我也玩大數(shù)據(jù)。
DA:票務(wù)行業(yè)大數(shù)據(jù)應(yīng)用處于什么階段?行業(yè)內(nèi)大數(shù)據(jù)應(yīng)用側(cè)重于哪些方面?
周宇紅:起步階段。大麥網(wǎng)本身也處于起步階段,我們對(duì)內(nèi)部行業(yè)數(shù)據(jù)的整合積累,以及對(duì)于用戶行為整合,還有賬外數(shù)據(jù)采集,都處于一個(gè)初步整合的階段。
票務(wù)行業(yè)領(lǐng)域本身其實(shí)就是一個(gè)垂直電商而已,更多首先是電商的標(biāo)配——網(wǎng)站推介,第二是精準(zhǔn)營銷,這也是基本的應(yīng)用,接著是運(yùn)營分析,主要是給內(nèi)部人員來用的,還有風(fēng)險(xiǎn)控制,防刷票,防黃牛的應(yīng)用。
對(duì)于我們公司來說,還有一個(gè)行業(yè)預(yù)測(cè)應(yīng)用。它有兩個(gè)作用,一個(gè)是在將來提供一個(gè)演出行業(yè)的數(shù)據(jù)年報(bào),因?yàn)槲覀儠?huì)有最大量的用戶數(shù)據(jù)。一般能提供年報(bào)的企業(yè)本身都掌握大量的用戶數(shù)據(jù),要不就是行業(yè)老大,要不就是在互聯(lián)網(wǎng)很厲害,像BAT一樣,他們可以讓其他垂直細(xì)分行業(yè)的老大為他提供數(shù)據(jù),他來做一個(gè)聚合。
我們不僅僅想做一個(gè)渠道商,那么簡單,票務(wù)只是一方面,將來可能做一個(gè)投資商,或者更可能是內(nèi)容的生產(chǎn)商提供商,不是單一渠道來去做。因?yàn)槠眲?wù)本身做下去可能會(huì)遇到天花板,一年的演出可能就那么多,我們更多地要去開源,我們將來要做投資,做主辦,是這樣的一個(gè)情況?;诖髷?shù)據(jù)的整理基礎(chǔ)之上,開發(fā)自有的內(nèi)容,或者去投資。
DA:您之前是在一個(gè)傳統(tǒng)IT業(yè)工作的,現(xiàn)在又在互聯(lián)網(wǎng)行業(yè)工作了,您覺得這兩個(gè)行業(yè)最大的不同是什么?
周宇紅:傳統(tǒng)IT業(yè)的模式主要是做產(chǎn)品的模式,不是做項(xiàng)目的模式。最初從設(shè)計(jì)、開發(fā)、測(cè)試、上線、運(yùn)維,基本都是一個(gè)team來去做的一件事情,所以我們的team本身來說不會(huì)像互聯(lián)網(wǎng)行業(yè)能夠把角色劃分開,產(chǎn)品搞產(chǎn)品,技術(shù)是搞技術(shù)的,測(cè)試是搞測(cè)試的,運(yùn)維是搞運(yùn)維的,不能分的很清。
我們做產(chǎn)品是為了給別人用的,互聯(lián)網(wǎng)行業(yè)做產(chǎn)品是給自己用的,這是兩者最大的區(qū)別,這個(gè)最大的區(qū)別也導(dǎo)致我們運(yùn)作方式很大的不同?;ヂ?lián)網(wǎng)行業(yè)要求能夠及時(shí)響應(yīng)用戶的變化,新的方法,就是圖快,好多產(chǎn)品設(shè)計(jì)或技術(shù)開發(fā)為了快速上馬會(huì)有很多技術(shù)欠債,后面的技術(shù)運(yùn)維產(chǎn)品維護(hù)升級(jí)會(huì)給產(chǎn)品本身或技術(shù)挖坑,到后面越積越多就做不下來。
第二種,我感觸最深的是,從數(shù)據(jù)本身來說,做產(chǎn)品是要把數(shù)據(jù)模型想得很清楚再做,但互聯(lián)網(wǎng)行業(yè)不是,它主要是圖快,不會(huì)想那么精細(xì),后面在數(shù)據(jù)整合時(shí)發(fā)現(xiàn)數(shù)據(jù)質(zhì)量特別亂,因?yàn)樗鼔焊幌肽敲炊?,先把?xiàng)目上去再說。
而這樣做的好處壞處要一分為二的看。從公司角度來看,很快做出一個(gè)東西,迎合市場(chǎng)的需求點(diǎn),可以解決用戶的痛點(diǎn)需求點(diǎn),從用戶來看OK,可以解決問題;但從內(nèi)部角度來看,從產(chǎn)品角度來說,我把用戶的痛點(diǎn)需求點(diǎn)解決了,就OK了,至于后面有什么問題,那是技術(shù)的事情,與我無關(guān);但從技術(shù)角度來看,產(chǎn)品你給我這個(gè)需求,我就做這個(gè)需求,至于將來的需求有什么變化,我不關(guān)心,將來如果有與前面需求相悖,設(shè)計(jì)有沖突,再加上人員流動(dòng),窟窿會(huì)越來越大,補(bǔ)一個(gè)出來兩個(gè),等到實(shí)在看不下去就只有重構(gòu)了。
DA:您覺得票務(wù)大數(shù)據(jù)應(yīng)用最困難的地方是什么?有沒有解決的經(jīng)驗(yàn)和思路?
周宇紅:這個(gè)困難是根據(jù)大數(shù)據(jù)應(yīng)用的階段而言的,當(dāng)前應(yīng)用最困難的地方就在于數(shù)據(jù)的整合。
第一是內(nèi)部數(shù)據(jù)的整合,由于公司內(nèi)部各部門之間使用的數(shù)據(jù)庫系統(tǒng)不一,數(shù)據(jù)質(zhì)量不高,完整度較低,在數(shù)據(jù)遷移時(shí)極易出現(xiàn)問題,想做增量遷移,但遷移不了,因?yàn)閿?shù)據(jù)中缺乏時(shí)間維度的東西,這可能是設(shè)計(jì)過程中有問題。
第二事有好多亂數(shù)據(jù),臟數(shù)據(jù),需要花很大的人力物力來清理。但做清洗時(shí)還有一個(gè)問題,就是做清洗時(shí)要跟業(yè)務(wù)相關(guān),但業(yè)務(wù)這種東西,開發(fā)不一定知道,數(shù)據(jù)某些字段的有些狀態(tài)為什么不動(dòng),運(yùn)營不一定知道,因?yàn)橹虚g有人員的遷移,有可能是歷史的原因,新來的也說不清楚,就會(huì)很麻煩。這是數(shù)據(jù)整合的問題。
其次是數(shù)據(jù)存儲(chǔ)的問題,你要投入大量硬件設(shè)備,搞一個(gè)大數(shù)據(jù)這樣的環(huán)境,從公司角度來說投入比較大。我們現(xiàn)在存儲(chǔ)更多向上游,在云上去做,主要看云本身的能力,大數(shù)據(jù)加工能力的問題。我們內(nèi)部有自己的大數(shù)據(jù)平臺(tái),是基于開源的大數(shù)據(jù)平臺(tái)來做的,我們可保證的。當(dāng)你上了云以后,受限于云提供商在上面建設(shè)大數(shù)據(jù)的能力。
我們現(xiàn)在是與阿里在合作,我們需要阿里平臺(tái)來支持我們?cè)谒厦娴臄?shù)據(jù)加工和處理,還有好多外站的一些數(shù)據(jù),微博的數(shù)據(jù),爬蟲的數(shù)據(jù),這些大量數(shù)據(jù)都會(huì)沉淀在我們的阿里云上。但這些數(shù)據(jù)都會(huì)存在不同的地方,像這些數(shù)據(jù)怎樣整合在一起,這是我們現(xiàn)在要跟阿里一起討論,要做的解決方案,怎么在阿里云品臺(tái)有效的存儲(chǔ),處理以及后期的數(shù)據(jù)挖掘,要利用他們現(xiàn)有的產(chǎn)品來做這些技術(shù)方案。
本身阿里云大數(shù)據(jù)平臺(tái)現(xiàn)在處于初步建設(shè)階段,他們需要我們這樣有明確使用目標(biāo)使用場(chǎng)景的人來使用他們的大數(shù)據(jù)的工具,同時(shí)我們也需要他們能提供這個(gè)技術(shù)平臺(tái)來加工我們的數(shù)據(jù),如果把這些數(shù)據(jù)放在我們內(nèi)部,那么我們硬件投入會(huì)很大,我們的運(yùn)維人員投入也會(huì)增大,所以我們希望這部分的壓力減輕,轉(zhuǎn)嫁到云平臺(tái)上,讓他們幫我們做穩(wěn)定性,運(yùn)維還有將來的優(yōu)化。
這是個(gè)需要促進(jìn)雙贏的過程,要與您所選擇的云平臺(tái)建設(shè)商合作。其實(shí)任何一個(gè)云平臺(tái),他們?nèi)绻麑聿幌胫毁I機(jī)器,也想把數(shù)據(jù)用起來,他們也會(huì)提高自己的產(chǎn)品對(duì)數(shù)據(jù)處理應(yīng)用的能力。
周宇紅留下了他的聯(lián)系郵箱:zyhxb@163.com,想要與他溝通的同學(xué)可以郵件聯(lián)系。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03