
2016年文本、語義、社交分析十大趨勢
大數(shù)據(jù)時代,文本、語義和社交分析就像企業(yè)的“天眼”,可以聆聽到來自用戶、患者和市場的聲音。目前文本、語義和社交分析技術(shù)已經(jīng)包括金融、醫(yī)療、傳媒、電商在內(nèi)的在多個行業(yè)得到廣泛應(yīng)用,企業(yè)從海量的互聯(lián)網(wǎng)和企業(yè)內(nèi)部數(shù)據(jù),包括文本、視頻等結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中提取那些能提高決策質(zhì)量的有用信息和情報。
但是,文本、語義和社交分析技術(shù)依然處于成長期,在一些領(lǐng)域,例如數(shù)據(jù)分析和市場研究方面的應(yīng)用還只是剛剛起步,而在相對成熟的領(lǐng)域,例如用戶體驗、社交聆聽和用戶互動方面,還有很大的提升空間。
總之,文本、語義和社交分析技術(shù)依然有很大的創(chuàng)新和成長空間,對于新進入者和現(xiàn)有的玩家來說都是如此,以下是Alta Plana公司戰(zhàn)略顧問Seth Grimes對2016年這個市場發(fā)展趨勢的預(yù)測:
一、多語言是王道
目前文本語義分析還是以英語為為主,但是機器學(xué)習(xí)和機器翻譯技術(shù)的成長可以幫我們擴展到多語言分析,并使之成為常態(tài)。如果你需要跨語言分析,那么選擇供應(yīng)商的時候可要小心了,因為很多供應(yīng)商的核心語言分析能力很強,但是其他語言就不敢恭維了。
二、文本分析獲得重視
文本分析是客戶體驗、市場研究、用戶調(diào)查以及數(shù)據(jù)分析和媒體測量的關(guān)鍵解決方案,這個領(lǐng)域的供應(yīng)商競爭很激烈,總的趨勢是“量化定性”,而且會有越來越多的針對企業(yè)的解決方案出現(xiàn)。
三、機器學(xué)習(xí)、統(tǒng)計與語言工程并存
未來屬于深度學(xué)習(xí),也就是遞歸神經(jīng)網(wǎng)絡(luò)之類的技術(shù),但就今天而言,歷史悠久的語言工程方法(例如語法分析、詞條語義網(wǎng)絡(luò)、句法規(guī)則系統(tǒng)等)依然會是主流方案。
當前是傳統(tǒng)與創(chuàng)新并存,百花齊放的階段,例如眾包標準的開創(chuàng)者CrowdFlower擁抱了機器學(xué)習(xí),而創(chuàng)業(yè)公司Idibon則以將傳統(tǒng)和創(chuàng)新結(jié)合為賣點。
四、圖像識別進入主流
領(lǐng)先的圖像識別技術(shù)廠商,例如Pulsar、Crimson和Hexagon已經(jīng)可以從社交媒體圖片中辨識品牌信息,而IBM 2015年收購的AlchemyAPI,主打的也是深度學(xué)習(xí)概念。創(chuàng)業(yè)公司MetaMind也意識到了圖像識別的巨大商業(yè)價值,在2015年從自然語言處理轉(zhuǎn)型到圖像識別技術(shù)。
五、語音分析將爆發(fā),視頻分析緊隨其后
首席營銷官們熱衷于討論多渠道分析,最常掛在嘴邊的詞是“用戶畫像”。如今社交媒體渠道中的語音和視頻數(shù)據(jù)越來越多,這些非文本數(shù)據(jù)有著不同的分析元素,例如語調(diào)、語速、聲高等都有其含義。2016年不僅僅是客服中心,更多的營銷人士、出版商和市場研究分析人士都將開始擁抱語音分析技術(shù),語音分析還是打造準確性極高的對話界面的關(guān)鍵技術(shù)。
六、情感分析的擴張
廣告主們深知情緒對消費者的購買決策起著至關(guān)重要的作用,但是,長久以來廣泛系統(tǒng)的情感研究難以開展。隨著情感分析技術(shù)的成熟,這一局面有望改變。創(chuàng)業(yè)公司們開發(fā)的情感分析技術(shù)能夠從圖像、視頻、文本和語音中分析面部表情或用戶情緒反應(yīng)。這方面的創(chuàng)業(yè)公司包括Affectiva、Emotient,視頻分析方面有Realeyes,語音方面有Beyond Verbal、文本方面有Kanjoya,情感分析技術(shù)開展最快的領(lǐng)域包括廣告、媒體等行業(yè)。
七、ISO表情符號分析
2015年社交媒體領(lǐng)域最熱門的莫過于表情符號,相比圖片、文字和視頻,表情符號更簡潔、更易用,也更有趣。除了卡戴珊的身體部件表情符號之外,F(xiàn)acebook已經(jīng)開始表情符號的實驗項目Reations,隨著表情符號的流行,相關(guān)的分析技術(shù)創(chuàng)業(yè)公司也開始浮現(xiàn),代表性的如Emogi。(參考Emogi發(fā)布的:2015年表情符號報告)目前大多數(shù)研究者對表情符號的研究還停留在統(tǒng)計和歸類,但是Instagram工程師Thomas Dimson、CLARIN.SI以及SwiftKey的研究值得一看。
八、網(wǎng)絡(luò)與內(nèi)容結(jié)合的圖譜分析(Graph Analytics)
網(wǎng)絡(luò)關(guān)系是對話的基礎(chǔ)結(jié)構(gòu),而內(nèi)容挖掘則獲取有效信息,只有把內(nèi)容分析和網(wǎng)絡(luò)關(guān)系節(jié)點的分析結(jié)合起來,才能挖掘出深度的情報。因此對于分析者來說,2016年需要在工具箱中增加圖譜數(shù)據(jù)庫(Graph Database)和網(wǎng)絡(luò)可視化工具。這也是為什么Neo4j、js和Gephi這幾個開源項目大受歡迎的原因。
九、機器撰寫內(nèi)容將越來越多
機器撰寫內(nèi)容的技術(shù)被稱之為自然語言生成(NLG),可以讓計算機撰寫短信、郵件、翻譯,甚至撰寫長篇文章。NLG特別適用于海量且重復(fù)性高的內(nèi)容,例如金融、體育、天氣預(yù)報等。目前的代表性供應(yīng)商有:Arria, Narrative Science, Automated Insights, Data2Content, 和 Yseop。其實我們?nèi)粘R呀?jīng)開始大量接觸人機對話,例如蘋果的Siri、微軟的Cortana小冰,亞馬遜的Alexa和谷歌的Google Now(這個除外),這些都屬于人工智能和自然語言界面(NLI)的范疇,Artifical Solutions的方案值得一看。
十、機器翻譯更加成熟
人們都想擁有類似星際迷航中的宇宙萬能翻譯器,但遺憾的是,雖然早在上個世紀五十年代研究者就宣稱機器翻譯將在三五年內(nèi)達成,但是半個多世紀過去了,機器翻譯依然不太靠譜。ACM Queue的文章,”站在人工智能和人機界面十字路口的機器翻譯”一文,有助于我們了解機器翻譯的現(xiàn)狀。得益于大數(shù)據(jù)和機器學(xué)習(xí)技術(shù)的突飛猛進,未來一兩年機器翻譯將能夠勝任大多數(shù)場合和任務(wù)的需求。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03