
網(wǎng)絡(luò)音樂是時候該聊聊“大數(shù)據(jù)”了
大數(shù)據(jù)從誕生到“人人皆是大數(shù)據(jù),司司皆是大數(shù)據(jù)”,只用了三年不到的時間,究竟多大的數(shù)據(jù)才算大數(shù)據(jù),究竟怎樣才算是對大數(shù)據(jù)的極致運用?
正如普林斯頓大學(xué)計量經(jīng)濟學(xué)家奧利?阿什菲爾特通過數(shù)學(xué)來評判葡萄酒的好壞、球探羅伯特?帕克通過數(shù)據(jù)預(yù)測球員的是否具有投資價值一樣,網(wǎng)絡(luò)音樂自從脫離“播放器工具”宿命以后,人、環(huán)境、載體都發(fā)生了巨大的變化,網(wǎng)絡(luò)音樂也即將進入“預(yù)測”的相關(guān)關(guān)系世界。
大數(shù)據(jù)從誕生到“人人皆是大數(shù)據(jù),司司皆是大數(shù)據(jù)”,只用了三年不到的時間,普羅大眾們對于大數(shù)據(jù)亦云里霧里,聽起來很酷,但終究無法用很明晰的形象來形容大數(shù)據(jù)的情況,究竟多大的數(shù)據(jù)才算大數(shù)據(jù),究竟怎樣才算是對大數(shù)據(jù)的極致運用?雖然國內(nèi)的互聯(lián)網(wǎng)熟稔制造大數(shù)據(jù)的諸多概念,然而,真正對于大數(shù)據(jù)的挖掘和運用,卻并不容易。
文字介質(zhì)方面,新聞客戶端產(chǎn)品早就和數(shù)據(jù)資產(chǎn)親密接觸,運用數(shù)據(jù)的力量讓新聞內(nèi)容更具有價值。音頻介質(zhì)呢,又會如何?
為何會是現(xiàn)在?
國內(nèi)的網(wǎng)絡(luò)音樂發(fā)展并不順利,沒有文字介質(zhì)普及度高,沒有網(wǎng)絡(luò)視頻用戶量大,特別是盈利方面,比剛出生的嬰兒都要孱弱,網(wǎng)絡(luò)音樂是國內(nèi)互聯(lián)網(wǎng)產(chǎn)品中用戶量大、用戶規(guī)模大,但并不賺大錢的產(chǎn)品代表。不過,這并不影響網(wǎng)絡(luò)音樂與“大數(shù)據(jù)”的緣分,或者說,是時候來聊一聊網(wǎng)絡(luò)音樂與“大數(shù)據(jù)”了。但為何是當(dāng)下,而不是過去和未來呢?
1) 龐大的用戶基數(shù) 。2008年6月,中國互聯(lián)網(wǎng)信息中心公布的數(shù)據(jù)就顯示,我國互聯(lián)網(wǎng)用戶總量超過美國,當(dāng)然,用戶普及率還有很大差距,美國是71%。CNNIC的數(shù)據(jù)顯示,截止到2015年12月,我國互聯(lián)網(wǎng)用戶普及率為50.3%,其中手機上網(wǎng)用戶量占總上網(wǎng)用戶量的90.1%,網(wǎng)絡(luò)音樂的用戶量為5.01億,網(wǎng)民普及率達(dá)72.8%,手機網(wǎng)絡(luò)音樂用戶量達(dá)4.16億。有了用戶規(guī)模,才有可能說大數(shù)據(jù)。
2) 移動互聯(lián)網(wǎng)給予數(shù)據(jù)抓取的可能性 。PC時代,用戶更多的習(xí)慣還是播放器思維,下載酷狗、酷我、千千靜聽等播放器,整個用戶都是處于離線的。還有一點是,用戶的登錄注冊習(xí)慣不強,用戶不注冊登錄,網(wǎng)絡(luò)音樂廠商所能獲取的數(shù)據(jù)就是動態(tài)的,而且用戶的IP還會隨時變幻,廠商所能獲取到的數(shù)據(jù)是熱門數(shù)據(jù),哪首歌的播放次數(shù)高,哪個歌手最受用戶喜歡,C端用戶的任何習(xí)慣是零,性別、年齡層次等,都無法獲取 。
音樂APP雖然也是以客戶端的形態(tài)存在,但如今有優(yōu)勢的地方在于,QQ、微信、微博、手機通訊錄等方式,能夠讓用戶非常便捷的登錄,而用戶一旦登錄,其在社交網(wǎng)絡(luò)等地方的數(shù)據(jù)就有可能被連帶進入到網(wǎng)絡(luò)音樂平臺里面,基于C端用戶的數(shù)據(jù)終于能夠被很好的記錄下來。
自去年網(wǎng)絡(luò)音樂大肆打擊版權(quán)以來,不少音樂內(nèi)容都需要收費獲取,收費的前提就是用戶ID登錄。用戶個人也開始習(xí)慣用ID登錄,從而將自己喜歡的音樂內(nèi)容放在云端存儲以來,無論更換任何一個硬件設(shè)備,都能夠有自己的音樂客戶端。
用戶登錄ID后,C端的數(shù)據(jù)就不再是零了,性別、頭像、年齡一級用戶的個人興趣愛好,都能夠被獲取到,而這,是大數(shù)據(jù)非常非常重要的一部分(有C端參與的任何產(chǎn)品,如果沒有具體C端用戶的數(shù)據(jù),說大數(shù)據(jù)都是扯淡)。
3) 數(shù)據(jù)處理能力的提升。 數(shù)據(jù)如果不懂得運用,再多的數(shù)據(jù)亦無用,比如成千上萬個垃圾APP,就算有再多的數(shù)據(jù),他們也只能廉價賣給第三方而不能自用。國內(nèi)的幾大網(wǎng)絡(luò)音樂廠商背后,都有BAT等的影子,顯然,在數(shù)據(jù)處理能力方面,BAT的能力和經(jīng)驗,要比普通創(chuàng)業(yè)公司多的多,而且,其中很重要的一部分,云存儲方面,BAT等互聯(lián)網(wǎng)巨頭都有自己的云存儲業(yè)務(wù)公司。還有就是,近幾年互聯(lián)網(wǎng)的技術(shù)以及計算機的數(shù)據(jù)處理能力都有所提升,摩爾定律雖然不頂用了,但計算機硬件以及互聯(lián)網(wǎng)卻在快速成長。
網(wǎng)絡(luò)音樂可以與“大數(shù)據(jù)”聊些啥?
數(shù)據(jù)是最迷惑人的玩意兒,投資人、大V、CEO、自媒體們均為數(shù)據(jù)迷醉其中,可是,數(shù)據(jù)本身并無任何價值,而且,數(shù)據(jù)是需要挖掘才可能有的,不被挖掘的,只能算是記錄,記錄,會隨著刪除按鍵煙消云散,連渣都不剩。網(wǎng)絡(luò)音樂與大數(shù)據(jù)的基礎(chǔ)環(huán)境具備了,但是,它又有哪些數(shù)據(jù)呢?又有哪些是可以被利用的?
1) 基于對音頻介質(zhì)的識別,完成聽歌識曲的功能 。幾乎所有的APP都有聽歌識曲功能,用戶只需將手機靠近音源即可識別聲音源當(dāng)中的歌曲,但我不止一次曾遇到過,多款音樂APP都無法識別音源的情況,后來還是通過歌詞,再用歌詞從搜索引擎搜文字介質(zhì)才能搜到相關(guān)內(nèi)容,詭異的是,我剛識別的音樂APP就包含這首歌曲,音樂APP的聽歌識曲功能簡直就是擺設(shè)。國內(nèi)搜索引擎的技術(shù),更多的是基于文字介質(zhì)的,音頻方面的技術(shù),還有待提升。
藝恩的數(shù)據(jù)顯示,酷狗音樂、酷我音樂、QQ音樂、網(wǎng)易云音樂、蝦米音樂、百度音樂幾大音樂廠商加起來的曲庫量在3000萬首左右,按照每首歌10MB的存儲空間,約為286.1TB,美國國會圖書館數(shù)據(jù)總共20TB,也就是說,國內(nèi)所有網(wǎng)絡(luò)音樂內(nèi)容加起來的儲存空間相當(dāng)于143座美國圖書館數(shù)據(jù)的總庫存量。按照某云計算企業(yè)的數(shù)據(jù)來看,286.1TB儲存空間的費用并不算高。
作為網(wǎng)絡(luò)音樂廠商,完全有能力將所有的數(shù)據(jù)存儲起來,并通過對存儲數(shù)據(jù)的分析進行處理,286.1TB算是大數(shù)據(jù)嗎?反正不小,這是來自內(nèi)容層的數(shù)據(jù),也是基礎(chǔ)。期待各大網(wǎng)絡(luò)音樂廠商真正將聽歌識曲功能做到極致的一天,實在沒技術(shù),可以和幾大音頻技術(shù)型的公司合作,對自身內(nèi)容的挖掘,還是挺靠譜的。
2) 針對用戶數(shù)據(jù),做內(nèi)容的分發(fā) 。今日頭條的原理,就是將海量的內(nèi)容放到素材庫里,再按照用戶的需求,進行有效分發(fā),從而達(dá)到擴大用戶點擊瀏覽的目的。 用戶對網(wǎng)絡(luò)音樂的內(nèi)容有兩個需求,一是已知的興趣,比如,用戶喜歡徐良,可能徐良出新歌的時候,他就會經(jīng)常去收聽;一是未知的興趣,用戶對某些歌曲聽膩了,需要有新鮮的音樂內(nèi)容,要么,主動尋找,要么,系統(tǒng)推送,系統(tǒng)推送也包含兩個點,基于社會化網(wǎng)絡(luò)的共性,基于熱點的共性, 比如從徐良的歌里找到與之相關(guān)的歌曲,再推送,再比如某用戶喜歡聽韓文歌,再細(xì)分一點,韓文里面的搖滾曲,這些,都是基于對用戶理解的基礎(chǔ)上的。
我認(rèn)為要特別說明歌單功能。網(wǎng)易云音樂之所以能夠在短期內(nèi)快速崛起,和其在歌單的創(chuàng)作和運營能力不無關(guān)系。實際上,酷我、酷狗、QQ音樂里面也有歌單功能,即根據(jù)用戶下載和喜愛的過歌曲,自動生成一定的歌單,質(zhì)量雖不高,但有了系統(tǒng)的分發(fā)以后,相關(guān)數(shù)據(jù)卻也非常亮眼,某些熱門的歌單播放次數(shù)甚至達(dá)到了數(shù)千萬。
《大數(shù)據(jù)時代》一書里提到: 通過去探求“是什么”,而不是“為什么”,相關(guān)關(guān)系幫助我們更好得來了解這個世界 。歌單就是基于相關(guān)關(guān)系的產(chǎn)生,比如,將徐良的歌組合在一起,將安靜的歌組合在一起,將曲庫里的3000萬首歌曲,完全打亂重組,重新生產(chǎn)一個組合型的數(shù)據(jù),用戶再從這些數(shù)據(jù)里找到“網(wǎng)絡(luò)音樂里的另一個自己”,和熱門歌單不同的是,私人組合的小眾型歌單,更適合于,每個人,而不是一群人。
歌單是一種新型的數(shù)據(jù),內(nèi)容既包含本身的內(nèi)容,又包含用戶的參與性,同樣,其他用戶的收聽、點贊或評論等,亦是參考數(shù)據(jù)之一。而網(wǎng)絡(luò)音樂廠商要想針對用戶的數(shù)據(jù),做好內(nèi)容的分發(fā),歌單就是用戶對未知需求里重要的一部分。
3) 消費能力 。屌絲用戶是不介意廣告的,中高端用戶并不介意付費,其中的小九九靠的就是網(wǎng)絡(luò)音樂廠商對每個用戶單獨的分析能力。盈利問題,并不是永遠(yuǎn)可以逃避的點,所有網(wǎng)絡(luò)音樂廠商都沒有明確表明自身的盈利狀況,不是不盈利,只是盈利數(shù)據(jù)和自身的互聯(lián)網(wǎng)巨頭形象不匹配,可惜,有的時候只能當(dāng)鴕鳥,但不能一輩子當(dāng)鴕鳥。
網(wǎng)絡(luò)音樂廠商目前也在不斷嘗試C端在網(wǎng)絡(luò)音樂上的消費能力,正版化以后,付費的環(huán)環(huán)境不斷緊縮,這間接促進了用戶在網(wǎng)絡(luò)音樂上的消費,當(dāng)然,每個用戶是有區(qū)別的。而基于用戶單獨數(shù)據(jù)庫的建立和分析、挖掘,并不容易,如社交網(wǎng)絡(luò)上的數(shù)據(jù)、通訊錄下的數(shù)據(jù)等,都需要技術(shù)的支持,短期內(nèi),廠商們還不具備,巨頭們還舍不得花費巨額資金在這上面投入。不過,要想徹底解決盈利問題,針對用戶單個的分析是不可避免的。
所幸,網(wǎng)絡(luò)音樂熬過了那段艱苦黑暗的時光,憑的是當(dāng)年各家都在默認(rèn)盜版的情況下生存的。如今版權(quán)開始付費,盈利就要提上日程了,“大數(shù)據(jù)”這一重中之重的產(chǎn)物,網(wǎng)絡(luò)音樂也該嘗試嘗試,音頻方向的數(shù)據(jù)處理能力,能否成就一個巨頭呢,也許。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10