
非結(jié)構(gòu)化數(shù)據(jù)背后的價(jià)值
大數(shù)據(jù)時(shí)代的到來(lái)使得任何企業(yè)都無(wú)法忽視數(shù)據(jù)背后蘊(yùn)藏的價(jià)值。大數(shù)據(jù)按照存儲(chǔ)形式不同可以分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,非結(jié)構(gòu)化數(shù)據(jù)的數(shù)量日趨增大。據(jù)統(tǒng)計(jì),當(dāng)前非結(jié)構(gòu)化數(shù)據(jù)的內(nèi)容占據(jù)了數(shù)據(jù)海洋的80%,并將在2020年之前以44倍的速度迅猛增長(zhǎng)。每一個(gè)數(shù)據(jù)元素都有它的意義,對(duì)海量數(shù)據(jù)進(jìn)行整合并挖掘數(shù)據(jù)背后的價(jià)值成為指導(dǎo)企業(yè)決策的重要依據(jù)。此前,數(shù)據(jù)分析絕大部分是針對(duì)結(jié)構(gòu)化數(shù)據(jù),即可以以word、excel等形式呈現(xiàn)的數(shù)據(jù)。而非結(jié)構(gòu)化數(shù)據(jù)隱藏在聊天記錄、郵件、圖像和音頻/視頻信息中,不方便用數(shù)據(jù)庫(kù)二維邏輯表來(lái)表現(xiàn)。
如果說(shuō)結(jié)構(gòu)化數(shù)據(jù)用詳實(shí)的方式記錄下企業(yè)的生產(chǎn)交易活動(dòng),那么非結(jié)構(gòu)化數(shù)據(jù)所反映的信息則蘊(yùn)含著諸多企業(yè)效益提高的機(jī)會(huì)。因此,只有解決非結(jié)構(gòu)化數(shù)據(jù)的分析困難,才能有效挖掘這些數(shù)據(jù)背后的價(jià)值,驅(qū)動(dòng)企業(yè)價(jià)值提升。非結(jié)構(gòu)化數(shù)據(jù)分析的重要性已經(jīng)得到了廣泛認(rèn)可,但市場(chǎng)上幾乎沒(méi)有成熟的解決方案。Taste Analytics的產(chǎn)品-Signals大數(shù)據(jù)可視化分析就是讓非結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)最終以可視化圖像的形式輸出,讓企業(yè)看懂這些數(shù)據(jù)在說(shuō)什么。
讓數(shù)據(jù)說(shuō)話
自2013年成立以來(lái),總部位于硅谷的大數(shù)據(jù)技術(shù)廠商Taste Analytics已經(jīng)擁有了一批美國(guó)金融機(jī)構(gòu)以及世界500強(qiáng)公司的用戶,并且在澳洲、荷蘭開(kāi)拓了市場(chǎng)。公司提供的業(yè)績(jī)數(shù)據(jù)顯示,2015年同比2014年收入增長(zhǎng)了6倍,并且季度營(yíng)收增長(zhǎng)速度保持在300%左右。從以上數(shù)據(jù)可以看出,非結(jié)構(gòu)化數(shù)據(jù)分析市場(chǎng)的發(fā)展?jié)摿薮?。談到非結(jié)構(gòu)化數(shù)據(jù)分析對(duì)于企業(yè)的具體意義,創(chuàng)始人及CEO 汪曉宇博士解釋說(shuō),“實(shí)際上,非結(jié)構(gòu)化數(shù)據(jù)分析就是通過(guò)對(duì)客戶在各種渠道提供的自然反饋進(jìn)行快速分析,幫助企業(yè)在短時(shí)間內(nèi)了解客戶對(duì)于產(chǎn)品和服務(wù)的評(píng)價(jià),有利于及時(shí)改善產(chǎn)品及服務(wù)的質(zhì)量?!?
創(chuàng)立Taste Analytics之前,汪曉宇是北卡大學(xué)夏洛特分校的助理教授,并在美國(guó)五大視覺(jué)中心之一的夏洛特視覺(jué)中心任職。起步于高科技事業(yè)云集的美國(guó)硅谷市場(chǎng),汪曉宇對(duì)于數(shù)據(jù)分析行業(yè)的認(rèn)識(shí)非常深刻。他談到,“在2013年創(chuàng)業(yè)時(shí)通過(guò)對(duì)60多家美國(guó)企業(yè)的走訪,發(fā)現(xiàn)當(dāng)時(shí)非結(jié)構(gòu)化數(shù)據(jù)分析的技術(shù)十分落后,因此,我們意識(shí)到這個(gè)領(lǐng)域是一片藍(lán)海?!蓖魰杂钔瑫r(shí)表示,與美國(guó)的市場(chǎng)環(huán)境相比,國(guó)內(nèi)市場(chǎng)有較明顯的特殊性。主要是美國(guó)的從業(yè)人員較多,這群被叫做數(shù)據(jù)科學(xué)家的人員一般是用數(shù)據(jù)說(shuō)話。他們既精通技術(shù),又對(duì)企業(yè)的商業(yè)模式和商業(yè)環(huán)境有較成熟的認(rèn)識(shí)。國(guó)內(nèi)在這方面還處于萌芽期,但我相信在未來(lái)幾年,數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師以及業(yè)務(wù)分析人員的數(shù)量會(huì)逐漸增多??梢钥隙ǖ氖?,在國(guó)內(nèi)“互聯(lián)網(wǎng)+”以及企業(yè)轉(zhuǎn)型的發(fā)展大趨勢(shì)下,讓數(shù)據(jù)說(shuō)話、以數(shù)據(jù)驅(qū)動(dòng)發(fā)展的重要性會(huì)得到更廣泛的認(rèn)同。
Taste Analytics對(duì)于非結(jié)構(gòu)化數(shù)據(jù)分析的過(guò)程分為三步:第一步是由其開(kāi)發(fā)的Signals平臺(tái)預(yù)設(shè)的第三方數(shù)據(jù)接口幫助企業(yè)收集數(shù)據(jù)(這些接口包括亞馬遜、天貓、Twitter、Facebook、Apple Store等),或是由用戶將內(nèi)部數(shù)據(jù)導(dǎo)入系統(tǒng)中,通過(guò)對(duì)細(xì)小到每一個(gè)字的數(shù)據(jù)進(jìn)行深度學(xué)習(xí),系統(tǒng)快速分析出各種結(jié)果信息,并形成預(yù)測(cè)性的分析結(jié)果;第二步,輸出一個(gè)簡(jiǎn)潔明了的圖像化分析結(jié)果;第三步,用戶根據(jù)自己的需求建立自己的分析模型。第一步的預(yù)測(cè)性分析和第二步的可視化結(jié)果是Signals平臺(tái)的核心。對(duì)于企業(yè)決策者來(lái)說(shuō),圖像可能要比看word的白紙黑字和excel硬邦邦的表格生動(dòng)、有趣得多??头芾砗碗娚虜?shù)據(jù)處理是Signals平臺(tái)的其中兩個(gè)應(yīng)用場(chǎng)景。對(duì)于很多公司來(lái)說(shuō),現(xiàn)在客戶服務(wù)的周期越來(lái)越長(zhǎng),需要耗費(fèi)很高的人力成本來(lái)處理大量的數(shù)據(jù)、跟蹤各種訴求。汪曉宇希望通過(guò)平臺(tái)實(shí)現(xiàn)對(duì)這些客服數(shù)據(jù)的快速瀏覽和標(biāo)準(zhǔn)化分析,達(dá)到預(yù)判的目的。對(duì)電商的數(shù)據(jù)分析是Signals的另一個(gè)應(yīng)用方向。Taste Analytics研發(fā)出來(lái)的技術(shù),不僅包括輿情分析和語(yǔ)義分析,更為關(guān)鍵的是,還加上了人機(jī)互動(dòng)的創(chuàng)新機(jī)制,涵蓋了整個(gè)非結(jié)構(gòu)化數(shù)據(jù)分析全過(guò)程,能夠?qū)崿F(xiàn)真正的非結(jié)構(gòu)化數(shù)據(jù)分析,再加上可視化分析結(jié)果和簡(jiǎn)單易用的使用界面,企業(yè)能夠輕松了解新的市場(chǎng)增長(zhǎng)點(diǎn)和進(jìn)行競(jìng)品分析,從而做出快速正確的決策。
中小企業(yè)對(duì)數(shù)據(jù)分析的需求
2015年底,Taste Analytics完成了全部產(chǎn)品的本土化,包括產(chǎn)品使用中文化、云服務(wù)部署落地化、技術(shù)支持規(guī)模化。同時(shí)提供公有云和私有云兩個(gè)部分服務(wù),既可以讓企業(yè)使用公共云服務(wù),又可以安全地接入企業(yè)的內(nèi)部數(shù)據(jù),和企業(yè)整個(gè)IT系統(tǒng)進(jìn)行完美整合。2016年開(kāi)始正式在中國(guó)市場(chǎng)發(fā)力,因此被定義為T(mén)aste Analytics的中國(guó)服務(wù)元年。
談到進(jìn)軍國(guó)內(nèi)市場(chǎng)的初衷,汪曉宇表示,“在對(duì)市場(chǎng)進(jìn)行詳細(xì)調(diào)查之后,我們相信數(shù)據(jù)分析在國(guó)內(nèi)的市場(chǎng)空間非常大。如果把已經(jīng)在美國(guó)驗(yàn)證可行的產(chǎn)品帶到國(guó)內(nèi),再開(kāi)發(fā)一套適用性更強(qiáng)的產(chǎn)品,能夠使國(guó)內(nèi)客戶真正從中看到實(shí)際的商業(yè)價(jià)值。”
汪曉宇介紹說(shuō),Taste Analytics在國(guó)內(nèi)采用的是B2B2C的服務(wù)模式?!爸赃@樣定位,是因?yàn)槲覀兊哪繕?biāo)就是為企業(yè)帶來(lái)直接的商業(yè)價(jià)值。而最容易看到直接商業(yè)價(jià)值的就是開(kāi)展2C業(yè)務(wù)的企業(yè)?!苯?jīng)過(guò)一年多的技術(shù)儲(chǔ)備、行業(yè)調(diào)研以及產(chǎn)品本地化調(diào)整,Taste Analytics于2015年年底實(shí)現(xiàn)了全部產(chǎn)品的本地化,使用本地語(yǔ)言,使用本地化部署,把數(shù)據(jù)存放在中國(guó)本土,提供本地化服務(wù),支持為企業(yè)提供私有和公有的SaaS服務(wù),結(jié)合當(dāng)下國(guó)內(nèi)傳統(tǒng)企業(yè)轉(zhuǎn)型的熱潮,正在與多個(gè)傳統(tǒng)企業(yè)接觸。
根據(jù)對(duì)市場(chǎng)的深入調(diào)查,Taste Analytics堅(jiān)信,對(duì)非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析、提取出有價(jià)值的東西已經(jīng)成為CIO、CTO們最關(guān)注的問(wèn)題。除了大型企業(yè)外,Taste Analytics也關(guān)注著中小企業(yè)對(duì)數(shù)據(jù)分析的需求。通過(guò)對(duì)比在美國(guó)服務(wù)中小企業(yè)的經(jīng)驗(yàn),汪曉宇認(rèn)為,“國(guó)內(nèi)中小企業(yè)普遍缺乏數(shù)據(jù)分析技術(shù)和相關(guān)人才,因此我們?yōu)檫@些企業(yè)同時(shí)提供線上、線下服務(wù),并且有業(yè)務(wù)專員通過(guò)數(shù)據(jù)分析服務(wù)幫助企業(yè)解決實(shí)際問(wèn)題,為企業(yè)提供及時(shí)的反饋和建議?!蓖魰杂钔瑫r(shí)坦言,目前國(guó)內(nèi)為中小企業(yè)提供數(shù)據(jù)服務(wù)的商業(yè)模式還處在探索過(guò)程中,“美國(guó)的中小企業(yè)大多已經(jīng)被市場(chǎng)教育成熟了,能很快接受我們的產(chǎn)品和服務(wù),而目前國(guó)內(nèi)的市場(chǎng)還處在被教育和推廣的階段,但這也預(yù)示著未來(lái)有廣闊的市場(chǎng)前景?!?
針對(duì)國(guó)內(nèi)中小企業(yè)市場(chǎng)的特殊性,Taste Analytics選擇通過(guò)與友商合作的方式共同開(kāi)發(fā)市場(chǎng)。“通過(guò)互聯(lián)網(wǎng)銷售消費(fèi)品的企業(yè)都是我們的目標(biāo)用戶,目前我們正通過(guò)合作伙伴與國(guó)內(nèi)領(lǐng)先的電商平臺(tái)、智能手機(jī)生產(chǎn)商以及無(wú)人機(jī)廠商合作,通過(guò)培養(yǎng)標(biāo)桿性的企業(yè),先站穩(wěn)腳跟,然后逐步推廣到中小企業(yè)中間去?!蓖魰杂顝?qiáng)調(diào),為了保證用戶體驗(yàn)的質(zhì)量,Taste Analytics聘請(qǐng)了國(guó)際上經(jīng)驗(yàn)豐富的網(wǎng)頁(yè)設(shè)計(jì)及圖像可視化設(shè)計(jì)師為產(chǎn)品把關(guān),不斷優(yōu)化圖像方法。在加上將網(wǎng)絡(luò)作為推廣渠道,從而保證了將產(chǎn)品迭代周期縮短至一星期。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10