
2016年文本、語義、社交分析十大趨勢(shì)
大數(shù)據(jù)時(shí)代,文本、語義和社交分析就像企業(yè)的“天眼”,可以聆聽到來自用戶、患者和市場(chǎng)的聲音。目前文本、語義和社交分析技術(shù)已經(jīng)包括金融、醫(yī)療、傳媒、電商在內(nèi)的在多個(gè)行業(yè)得到廣泛應(yīng)用,企業(yè)從海量的互聯(lián)網(wǎng)和企業(yè)內(nèi)部數(shù)據(jù),包括文本、視頻等結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中提取那些能提高決策質(zhì)量的有用信息和情報(bào)。
但是,文本、語義和社交分析技術(shù)依然處于成長(zhǎng)期,在一些領(lǐng)域,例如數(shù)據(jù)分析和市場(chǎng)研究方面的應(yīng)用還只是剛剛起步,而在相對(duì)成熟的領(lǐng)域,例如用戶體驗(yàn)、社交聆聽和用戶互動(dòng)方面,還有很大的提升空間。
總之,文本、語義和社交分析技術(shù)依然有很大的創(chuàng)新和成長(zhǎng)空間,對(duì)于新進(jìn)入者和現(xiàn)有的玩家來說都是如此,以下是Alta Plana公司戰(zhàn)略顧問Seth Grimes對(duì)2016年這個(gè)市場(chǎng)發(fā)展趨勢(shì)的預(yù)測(cè):
一、多語言是王道
目前文本語義分析還是以英語為為主,但是機(jī)器學(xué)習(xí)和機(jī)器翻譯技術(shù)的成長(zhǎng)可以幫我們擴(kuò)展到多語言分析,并使之成為常態(tài)。如果你需要跨語言分析,那么選擇供應(yīng)商的時(shí)候可要小心了,因?yàn)楹芏喙?yīng)商的核心語言分析能力很強(qiáng),但是其他語言就不敢恭維了。
二、文本分析獲得重視
文本分析是客戶體驗(yàn)、市場(chǎng)研究、用戶調(diào)查以及數(shù)據(jù)分析和媒體測(cè)量的關(guān)鍵解決方案,這個(gè)領(lǐng)域的供應(yīng)商競(jìng)爭(zhēng)很激烈,總的趨勢(shì)是“量化定性”,而且會(huì)有越來越多的針對(duì)企業(yè)的解決方案出現(xiàn)。
三、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)與語言工程并存
未來屬于深度學(xué)習(xí),也就是遞歸神經(jīng)網(wǎng)絡(luò)之類的技術(shù),但就今天而言,歷史悠久的語言工程方法(例如語法分析、詞條語義網(wǎng)絡(luò)、句法規(guī)則系統(tǒng)等)依然會(huì)是主流方案。
當(dāng)前是傳統(tǒng)與創(chuàng)新并存,百花齊放的階段,例如眾包標(biāo)準(zhǔn)的開創(chuàng)者CrowdFlower擁抱了機(jī)器學(xué)習(xí),而創(chuàng)業(yè)公司Idibon則以將傳統(tǒng)和創(chuàng)新結(jié)合為賣點(diǎn)。
四、圖像識(shí)別進(jìn)入主流
領(lǐng)先的圖像識(shí)別技術(shù)廠商,例如Pulsar、Crimson和Hexagon已經(jīng)可以從社交媒體圖片中辨識(shí)品牌信息,而IBM 2015年收購(gòu)的AlchemyAPI,主打的也是深度學(xué)習(xí)概念。創(chuàng)業(yè)公司MetaMind也意識(shí)到了圖像識(shí)別的巨大商業(yè)價(jià)值,在2015年從自然語言處理轉(zhuǎn)型到圖像識(shí)別技術(shù)。
五、語音分析將爆發(fā),視頻分析緊隨其后
首席營(yíng)銷官們熱衷于討論多渠道分析,最常掛在嘴邊的詞是“用戶畫像”。如今社交媒體渠道中的語音和視頻數(shù)據(jù)越來越多,這些非文本數(shù)據(jù)有著不同的分析元素,例如語調(diào)、語速、聲高等都有其含義。2016年不僅僅是客服中心,更多的營(yíng)銷人士、出版商和市場(chǎng)研究分析人士都將開始擁抱語音分析技術(shù),語音分析還是打造準(zhǔn)確性極高的對(duì)話界面的關(guān)鍵技術(shù)。
六、情感分析的擴(kuò)張
廣告主們深知情緒對(duì)消費(fèi)者的購(gòu)買決策起著至關(guān)重要的作用,但是,長(zhǎng)久以來廣泛系統(tǒng)的情感研究難以開展。隨著情感分析技術(shù)的成熟,這一局面有望改變。創(chuàng)業(yè)公司們開發(fā)的情感分析技術(shù)能夠從圖像、視頻、文本和語音中分析面部表情或用戶情緒反應(yīng)。這方面的創(chuàng)業(yè)公司包括Affectiva、Emotient,視頻分析方面有Realeyes,語音方面有Beyond Verbal、文本方面有Kanjoya,情感分析技術(shù)開展最快的領(lǐng)域包括廣告、媒體等行業(yè)。
七、ISO表情符號(hào)分析
2015年社交媒體領(lǐng)域最熱門的莫過于表情符號(hào),相比圖片、文字和視頻,表情符號(hào)更簡(jiǎn)潔、更易用,也更有趣。除了卡戴珊的身體部件表情符號(hào)之外,F(xiàn)acebook已經(jīng)開始表情符號(hào)的實(shí)驗(yàn)項(xiàng)目Reations,隨著表情符號(hào)的流行,相關(guān)的分析技術(shù)創(chuàng)業(yè)公司也開始浮現(xiàn),代表性的如Emogi。(參考Emogi發(fā)布的:2015年表情符號(hào)報(bào)告)目前大多數(shù)研究者對(duì)表情符號(hào)的研究還停留在統(tǒng)計(jì)和歸類,但是Instagram工程師Thomas Dimson、CLARIN.SI以及SwiftKey的研究值得一看。
八、網(wǎng)絡(luò)與內(nèi)容結(jié)合的圖譜分析(Graph Analytics)
網(wǎng)絡(luò)關(guān)系是對(duì)話的基礎(chǔ)結(jié)構(gòu),而內(nèi)容挖掘則獲取有效信息,只有把內(nèi)容分析和網(wǎng)絡(luò)關(guān)系節(jié)點(diǎn)的分析結(jié)合起來,才能挖掘出深度的情報(bào)。因此對(duì)于分析者來說,2016年需要在工具箱中增加圖譜數(shù)據(jù)庫(kù)(Graph Database)和網(wǎng)絡(luò)可視化工具。這也是為什么Neo4j、js和Gephi這幾個(gè)開源項(xiàng)目大受歡迎的原因。
九、機(jī)器撰寫內(nèi)容將越來越多
機(jī)器撰寫內(nèi)容的技術(shù)被稱之為自然語言生成(NLG),可以讓計(jì)算機(jī)撰寫短信、郵件、翻譯,甚至撰寫長(zhǎng)篇文章。NLG特別適用于海量且重復(fù)性高的內(nèi)容,例如金融、體育、天氣預(yù)報(bào)等。目前的代表性供應(yīng)商有:Arria, Narrative Science, Automated Insights, Data2Content, 和 Yseop。其實(shí)我們?nèi)粘R呀?jīng)開始大量接觸人機(jī)對(duì)話,例如蘋果的Siri、微軟的Cortana小冰,亞馬遜的Alexa和谷歌的Google Now(這個(gè)除外),這些都屬于人工智能和自然語言界面(NLI)的范疇,Artifical Solutions的方案值得一看。
十、機(jī)器翻譯更加成熟
人們都想擁有類似星際迷航中的宇宙萬能翻譯器,但遺憾的是,雖然早在上個(gè)世紀(jì)五十年代研究者就宣稱機(jī)器翻譯將在三五年內(nèi)達(dá)成,但是半個(gè)多世紀(jì)過去了,機(jī)器翻譯依然不太靠譜。ACM Queue的文章,”站在人工智能和人機(jī)界面十字路口的機(jī)器翻譯”一文,有助于我們了解機(jī)器翻譯的現(xiàn)狀。得益于大數(shù)據(jù)和機(jī)器學(xué)習(xí)技術(shù)的突飛猛進(jìn),未來一兩年機(jī)器翻譯將能夠勝任大多數(shù)場(chǎng)合和任務(wù)的需求。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10