
數(shù)據(jù)挖掘與預(yù)測(cè)分析術(shù)語總結(jié)
數(shù)據(jù)挖掘目前在各類企業(yè)和機(jī)構(gòu)中蓬勃發(fā)展。因此我們制作了一份此領(lǐng)域常見術(shù)語總結(jié),希望你喜歡。
分析型客戶關(guān)系管理(Analytical CRM/aCRM): 用于支持決策,改善公司跟顧客的互動(dòng)或提高互動(dòng)的價(jià)值。針對(duì)有關(guān)顧客的知識(shí),和如何與顧客有效接觸的知識(shí),進(jìn)行收集、分析、應(yīng)用。參見>>>
大數(shù)據(jù)(Big Data): 大數(shù)據(jù)既是一個(gè)被濫用的流行語,也是一個(gè)當(dāng)今社會(huì)的真實(shí)趨勢(shì)。此術(shù)語指代總量與日俱增的數(shù)據(jù),這些數(shù)據(jù)每天都在被捕獲、處理、匯集、儲(chǔ)存、分析。維基百科是這樣描述“大數(shù)據(jù)”的:“數(shù)據(jù)集的總和如此龐大復(fù)雜,以至于現(xiàn)有的數(shù)據(jù)庫管理工具難以處理(…)”。
商業(yè)智能(Business Intelligence): 分析數(shù)據(jù)、展示信息以幫助企業(yè)的執(zhí)行者、管理層、其他人員進(jìn)行更有根據(jù)的商業(yè)決策的應(yīng)用、設(shè)施、工具、過程。
流失分析(Churn Analysis/Attrition Analysis): 描述哪些顧客可能停止使用公司的產(chǎn)品/業(yè)務(wù),以及識(shí)別哪些顧客的流失會(huì)帶來最大損失。流失分析的結(jié)果用于為可能要流失的顧客準(zhǔn)備新的優(yōu)惠。
聯(lián)合分析/權(quán)衡分析(Conjoint Analysis/ Trade-off Analysis): 在消費(fèi)者實(shí)際使用的基礎(chǔ)上,比較同一產(chǎn)品/服務(wù)的幾個(gè)不同變種。它能預(yù)測(cè)產(chǎn)品/服務(wù)上市后的接受度,用于產(chǎn)品線管理、定價(jià)等活動(dòng)。
信用評(píng)分(Credit Scoring): 評(píng)估一個(gè)實(shí)體(公司或個(gè)人)的信用值。銀行(借款人)以此判斷借款者是否會(huì)還款。
配套銷售/增值銷售(Cross / Up selling): 一個(gè)營(yíng)銷概念。根據(jù)特定消費(fèi)者的特征和過往行為,向其銷售補(bǔ)充商品(配套銷售)或附加商品(增值銷售)。
顧客細(xì)分&畫像(Customer Segmentation & Profiling): 根據(jù)現(xiàn)有的顧客數(shù)據(jù),將特征、行為相似的顧客歸類分組。描述和比較各組。
數(shù)據(jù)集市(Data Mart): 特定機(jī)構(gòu)所儲(chǔ)存的,關(guān)于一個(gè)特定主題或部門的數(shù)據(jù),如銷售、財(cái)務(wù)、營(yíng)銷數(shù)據(jù)。
數(shù)據(jù)倉(cāng)庫(Data Warehouse): 數(shù)據(jù)的中央存儲(chǔ)庫,采集、儲(chǔ)存來自一個(gè)企業(yè)多個(gè)商業(yè)系統(tǒng)的數(shù)據(jù)。
數(shù)據(jù)質(zhì)量(Data Quality): 有關(guān)確保數(shù)據(jù)可靠性和實(shí)用價(jià)值的過程和技術(shù)。高質(zhì)量的數(shù)據(jù)應(yīng)該忠實(shí)體現(xiàn)其背后的事務(wù)進(jìn)程,并能滿足在運(yùn)營(yíng)、決策、規(guī)劃中的預(yù)期用途。
抽取-轉(zhuǎn)換-加載 ETL (Extract-Transform-Load): 數(shù)據(jù)倉(cāng)儲(chǔ)中的一個(gè)過程。從一個(gè)來源獲取數(shù)據(jù),根據(jù)需求轉(zhuǎn)換數(shù)據(jù)以便接下來使用,之后把數(shù)據(jù)放置在正確的目標(biāo)數(shù)據(jù)庫。
欺詐檢測(cè)(Fraud Detection): 識(shí)別針對(duì)特定組織或公司的疑似欺詐式轉(zhuǎn)賬、訂購(gòu)、以及其他非法活動(dòng)。在IT系統(tǒng)預(yù)先設(shè)計(jì)觸發(fā)式警報(bào),嘗試或進(jìn)行此類活動(dòng)會(huì)出現(xiàn)警告。
Hadoop: 另一個(gè)當(dāng)今大數(shù)據(jù)領(lǐng)域的熱門。Apache Hadoop是一個(gè)在已有商業(yè)硬件組成的計(jì)算機(jī)集群上,分布式存儲(chǔ)、處理龐大數(shù)據(jù)集的開源軟件架構(gòu)。它使得大規(guī)模數(shù)據(jù)儲(chǔ)存和更快速數(shù)據(jù)處理成為可能。
物聯(lián)網(wǎng)(Internet of Things, IoT): 廣泛分布的網(wǎng)絡(luò),由諸多種類(個(gè)人、家庭、工業(yè))諸多用途(醫(yī)療、休閑、媒體、購(gòu)物、制造、環(huán)境調(diào)節(jié))的電子設(shè)備組成。這些設(shè)備通過互聯(lián)網(wǎng)交換數(shù)據(jù),彼此協(xié)調(diào)活動(dòng)。
顧客的生命周期價(jià)值 (Lifetime Value, LTV): 顧客在他/她的一生中為一個(gè)公司產(chǎn)生的預(yù)期折算利潤(rùn)。
機(jī)器學(xué)習(xí)(Machine Learning): 一個(gè)學(xué)科,研究從數(shù)據(jù)中自動(dòng)學(xué)習(xí),以便計(jì)算機(jī)能根據(jù)它們收到的反饋調(diào)整自身運(yùn)行。與人工智能、數(shù)據(jù)挖掘、統(tǒng)計(jì)方法關(guān)系密切。
購(gòu)物籃分析(Market Basket Analysis): 識(shí)別在交易中經(jīng)常同時(shí)出現(xiàn)的商品組合或服務(wù)組合,例如經(jīng)常被一起購(gòu)買的產(chǎn)品。此類分析的結(jié)果被用于推薦附加商品,為陳列商品的決策提供依據(jù)等。
聯(lián)機(jī)分析處理(On-Line Analytical Processing, OLAP): 能讓用戶輕松制作、瀏覽報(bào)告的工具,這些報(bào)告總結(jié)相關(guān)數(shù)據(jù),并從多角度分析。
預(yù)測(cè)分析(Predictive Analytics): 從現(xiàn)存的數(shù)據(jù)集中提取信息以便識(shí)別模式、預(yù)測(cè)未來收益和趨勢(shì)。在商業(yè)領(lǐng)域,預(yù)測(cè)模型及分析被用于分析當(dāng)前數(shù)據(jù)和歷史事實(shí),以更好了解消費(fèi)者、產(chǎn)品、合作伙伴,并為公司識(shí)別機(jī)遇和風(fēng)險(xiǎn)。
實(shí)時(shí)決策(Real Time Decisioning, RTD): 幫助企業(yè)做出實(shí)時(shí)(近乎無延遲)的最優(yōu)銷售/營(yíng)銷決策。比如,實(shí)時(shí)決策系統(tǒng)(打分系統(tǒng))可以通過多種商業(yè)規(guī)則或模型,在顧客與公司互動(dòng)的瞬間,對(duì)顧客進(jìn)行評(píng)分和排名。
留存/顧客留存(Retention / Customer Retention): 指建立后能夠長(zhǎng)期維持的客戶關(guān)系的百分比。
社交網(wǎng)絡(luò)分析(Social Network Analysis, SNA): 描繪并測(cè)量人與人、組與組、機(jī)構(gòu)與機(jī)構(gòu)、電腦與電腦、URL與URL、以及其他種類相連的信息/知識(shí)實(shí)體之間的關(guān)系與流動(dòng)。這些人或組是網(wǎng)絡(luò)中的節(jié)點(diǎn),而它們之間的連線表示關(guān)系或流動(dòng)。SNA為分析人際關(guān)系提供了一種方法,既是數(shù)學(xué)的又是視覺的。
生存分析(Survival Analysis): 估測(cè)一名顧客繼續(xù)使用某業(yè)務(wù)的時(shí)間,或在后續(xù)時(shí)段流失的可能性。此類信息能讓企業(yè)判斷所要預(yù)測(cè)時(shí)段的顧客留存,并引入合適的忠誠(chéng)度政策。
文本挖掘(Text Mining): 對(duì)包含自然語言的數(shù)據(jù)的分析。對(duì)源數(shù)據(jù)中詞語和短語進(jìn)行統(tǒng)計(jì)計(jì)算,以便用數(shù)學(xué)術(shù)語表達(dá)文本結(jié)構(gòu),之后用傳統(tǒng)數(shù)據(jù)挖掘技術(shù)分析文本結(jié)構(gòu)。
非結(jié)構(gòu)化數(shù)據(jù)(Unstructured Data):數(shù)據(jù)要么缺乏事先定義的數(shù)據(jù)模型,要么沒按事先定義的規(guī)范進(jìn)行組織。這個(gè)術(shù)語通常指那些不能放在傳統(tǒng)的列式數(shù)據(jù)庫中的信息,比如電子郵件信息、評(píng)論。
網(wǎng)絡(luò)挖掘/網(wǎng)絡(luò)數(shù)據(jù)挖掘(Web Mining / Web Data Mining) : 使用數(shù)據(jù)挖掘技術(shù)從互聯(lián)網(wǎng)站點(diǎn)、文檔或服務(wù)中自動(dòng)發(fā)現(xiàn)和提取信息。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03