
非結構化數(shù)據(jù)背后的價值
大數(shù)據(jù)時代的到來使得任何企業(yè)都無法忽視數(shù)據(jù)背后蘊藏的價值。大數(shù)據(jù)按照存儲形式不同可以分為結構化數(shù)據(jù)和非結構化數(shù)據(jù)。隨著網(wǎng)絡技術的發(fā)展,非結構化數(shù)據(jù)的數(shù)量日趨增大。據(jù)統(tǒng)計,當前非結構化數(shù)據(jù)的內(nèi)容占據(jù)了數(shù)據(jù)海洋的80%,并將在2020年之前以44倍的速度迅猛增長。每一個數(shù)據(jù)元素都有它的意義,對海量數(shù)據(jù)進行整合并挖掘數(shù)據(jù)背后的價值成為指導企業(yè)決策的重要依據(jù)。此前,數(shù)據(jù)分析絕大部分是針對結構化數(shù)據(jù),即可以以word、excel等形式呈現(xiàn)的數(shù)據(jù)。而非結構化數(shù)據(jù)隱藏在聊天記錄、郵件、圖像和音頻/視頻信息中,不方便用數(shù)據(jù)庫二維邏輯表來表現(xiàn)。
如果說結構化數(shù)據(jù)用詳實的方式記錄下企業(yè)的生產(chǎn)交易活動,那么非結構化數(shù)據(jù)所反映的信息則蘊含著諸多企業(yè)效益提高的機會。因此,只有解決非結構化數(shù)據(jù)的分析困難,才能有效挖掘這些數(shù)據(jù)背后的價值,驅(qū)動企業(yè)價值提升。非結構化數(shù)據(jù)分析的重要性已經(jīng)得到了廣泛認可,但市場上幾乎沒有成熟的解決方案。Taste Analytics的產(chǎn)品-Signals大數(shù)據(jù)可視化分析就是讓非結構化數(shù)據(jù)和結構化數(shù)據(jù)最終以可視化圖像的形式輸出,讓企業(yè)看懂這些數(shù)據(jù)在說什么。
讓數(shù)據(jù)說話
自2013年成立以來,總部位于硅谷的大數(shù)據(jù)技術廠商Taste Analytics已經(jīng)擁有了一批美國金融機構以及世界500強公司的用戶,并且在澳洲、荷蘭開拓了市場。公司提供的業(yè)績數(shù)據(jù)顯示,2015年同比2014年收入增長了6倍,并且季度營收增長速度保持在300%左右。從以上數(shù)據(jù)可以看出,非結構化數(shù)據(jù)分析市場的發(fā)展?jié)摿薮?。談到非結構化數(shù)據(jù)分析對于企業(yè)的具體意義,創(chuàng)始人及CEO 汪曉宇博士解釋說,“實際上,非結構化數(shù)據(jù)分析就是通過對客戶在各種渠道提供的自然反饋進行快速分析,幫助企業(yè)在短時間內(nèi)了解客戶對于產(chǎn)品和服務的評價,有利于及時改善產(chǎn)品及服務的質(zhì)量?!?
創(chuàng)立Taste Analytics之前,汪曉宇是北卡大學夏洛特分校的助理教授,并在美國五大視覺中心之一的夏洛特視覺中心任職。起步于高科技事業(yè)云集的美國硅谷市場,汪曉宇對于數(shù)據(jù)分析行業(yè)的認識非常深刻。他談到,“在2013年創(chuàng)業(yè)時通過對60多家美國企業(yè)的走訪,發(fā)現(xiàn)當時非結構化數(shù)據(jù)分析的技術十分落后,因此,我們意識到這個領域是一片藍海?!蓖魰杂钔瑫r表示,與美國的市場環(huán)境相比,國內(nèi)市場有較明顯的特殊性。主要是美國的從業(yè)人員較多,這群被叫做數(shù)據(jù)科學家的人員一般是用數(shù)據(jù)說話。他們既精通技術,又對企業(yè)的商業(yè)模式和商業(yè)環(huán)境有較成熟的認識。國內(nèi)在這方面還處于萌芽期,但我相信在未來幾年,數(shù)據(jù)科學家、數(shù)據(jù)工程師以及業(yè)務分析人員的數(shù)量會逐漸增多。可以肯定的是,在國內(nèi)“互聯(lián)網(wǎng)+”以及企業(yè)轉(zhuǎn)型的發(fā)展大趨勢下,讓數(shù)據(jù)說話、以數(shù)據(jù)驅(qū)動發(fā)展的重要性會得到更廣泛的認同。
Taste Analytics對于非結構化數(shù)據(jù)分析的過程分為三步:第一步是由其開發(fā)的Signals平臺預設的第三方數(shù)據(jù)接口幫助企業(yè)收集數(shù)據(jù)(這些接口包括亞馬遜、天貓、Twitter、Facebook、Apple Store等),或是由用戶將內(nèi)部數(shù)據(jù)導入系統(tǒng)中,通過對細小到每一個字的數(shù)據(jù)進行深度學習,系統(tǒng)快速分析出各種結果信息,并形成預測性的分析結果;第二步,輸出一個簡潔明了的圖像化分析結果;第三步,用戶根據(jù)自己的需求建立自己的分析模型。第一步的預測性分析和第二步的可視化結果是Signals平臺的核心。對于企業(yè)決策者來說,圖像可能要比看word的白紙黑字和excel硬邦邦的表格生動、有趣得多。客服管理和電商數(shù)據(jù)處理是Signals平臺的其中兩個應用場景。對于很多公司來說,現(xiàn)在客戶服務的周期越來越長,需要耗費很高的人力成本來處理大量的數(shù)據(jù)、跟蹤各種訴求。汪曉宇希望通過平臺實現(xiàn)對這些客服數(shù)據(jù)的快速瀏覽和標準化分析,達到預判的目的。對電商的數(shù)據(jù)分析是Signals的另一個應用方向。Taste Analytics研發(fā)出來的技術,不僅包括輿情分析和語義分析,更為關鍵的是,還加上了人機互動的創(chuàng)新機制,涵蓋了整個非結構化數(shù)據(jù)分析全過程,能夠?qū)崿F(xiàn)真正的非結構化數(shù)據(jù)分析,再加上可視化分析結果和簡單易用的使用界面,企業(yè)能夠輕松了解新的市場增長點和進行競品分析,從而做出快速正確的決策。
中小企業(yè)對數(shù)據(jù)分析的需求
2015年底,Taste Analytics完成了全部產(chǎn)品的本土化,包括產(chǎn)品使用中文化、云服務部署落地化、技術支持規(guī)?;?。同時提供公有云和私有云兩個部分服務,既可以讓企業(yè)使用公共云服務,又可以安全地接入企業(yè)的內(nèi)部數(shù)據(jù),和企業(yè)整個IT系統(tǒng)進行完美整合。2016年開始正式在中國市場發(fā)力,因此被定義為Taste Analytics的中國服務元年。
談到進軍國內(nèi)市場的初衷,汪曉宇表示,“在對市場進行詳細調(diào)查之后,我們相信數(shù)據(jù)分析在國內(nèi)的市場空間非常大。如果把已經(jīng)在美國驗證可行的產(chǎn)品帶到國內(nèi),再開發(fā)一套適用性更強的產(chǎn)品,能夠使國內(nèi)客戶真正從中看到實際的商業(yè)價值?!?
汪曉宇介紹說,Taste Analytics在國內(nèi)采用的是B2B2C的服務模式?!爸赃@樣定位,是因為我們的目標就是為企業(yè)帶來直接的商業(yè)價值。而最容易看到直接商業(yè)價值的就是開展2C業(yè)務的企業(yè)。”經(jīng)過一年多的技術儲備、行業(yè)調(diào)研以及產(chǎn)品本地化調(diào)整,Taste Analytics于2015年年底實現(xiàn)了全部產(chǎn)品的本地化,使用本地語言,使用本地化部署,把數(shù)據(jù)存放在中國本土,提供本地化服務,支持為企業(yè)提供私有和公有的SaaS服務,結合當下國內(nèi)傳統(tǒng)企業(yè)轉(zhuǎn)型的熱潮,正在與多個傳統(tǒng)企業(yè)接觸。
根據(jù)對市場的深入調(diào)查,Taste Analytics堅信,對非結構化數(shù)據(jù)進行分析、提取出有價值的東西已經(jīng)成為CIO、CTO們最關注的問題。除了大型企業(yè)外,Taste Analytics也關注著中小企業(yè)對數(shù)據(jù)分析的需求。通過對比在美國服務中小企業(yè)的經(jīng)驗,汪曉宇認為,“國內(nèi)中小企業(yè)普遍缺乏數(shù)據(jù)分析技術和相關人才,因此我們?yōu)檫@些企業(yè)同時提供線上、線下服務,并且有業(yè)務專員通過數(shù)據(jù)分析服務幫助企業(yè)解決實際問題,為企業(yè)提供及時的反饋和建議?!蓖魰杂钔瑫r坦言,目前國內(nèi)為中小企業(yè)提供數(shù)據(jù)服務的商業(yè)模式還處在探索過程中,“美國的中小企業(yè)大多已經(jīng)被市場教育成熟了,能很快接受我們的產(chǎn)品和服務,而目前國內(nèi)的市場還處在被教育和推廣的階段,但這也預示著未來有廣闊的市場前景?!?
針對國內(nèi)中小企業(yè)市場的特殊性,Taste Analytics選擇通過與友商合作的方式共同開發(fā)市場?!巴ㄟ^互聯(lián)網(wǎng)銷售消費品的企業(yè)都是我們的目標用戶,目前我們正通過合作伙伴與國內(nèi)領先的電商平臺、智能手機生產(chǎn)商以及無人機廠商合作,通過培養(yǎng)標桿性的企業(yè),先站穩(wěn)腳跟,然后逐步推廣到中小企業(yè)中間去?!蓖魰杂顝娬{(diào),為了保證用戶體驗的質(zhì)量,Taste Analytics聘請了國際上經(jīng)驗豐富的網(wǎng)頁設計及圖像可視化設計師為產(chǎn)品把關,不斷優(yōu)化圖像方法。在加上將網(wǎng)絡作為推廣渠道,從而保證了將產(chǎn)品迭代周期縮短至一星期。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03