
作者 | Niccolo Mejia
編譯 | CDA數(shù)據(jù)分析師
What is Predictive Analytics? – An Informed Definition
預(yù)測分析可能是金融機(jī)構(gòu),銀行,保險(xiǎn)公司和醫(yī)療保健公司使用的最常見的AI應(yīng)用程序之一。這種類型的軟件使這些行業(yè)的業(yè)務(wù)領(lǐng)導(dǎo)者可以規(guī)劃信貸,貸款和患者健康等業(yè)務(wù)領(lǐng)域中最可能的結(jié)果。預(yù)測分析軟件可以使用歷史企業(yè)數(shù)據(jù)根據(jù)典型的公司經(jīng)驗(yàn)對未來的業(yè)務(wù)事件做出預(yù)測。
在本文中,我們定義了預(yù)測分析,并展示了該領(lǐng)域?qū)<业钠渌x。我們介紹了AI和ML如何幫助預(yù)測分析用作商業(yè)智能工具的背景。此外,我們還提供了一個示例性預(yù)測分析供應(yīng)商的示例,以及該公司的AI解決方案據(jù)稱可以如何幫助各種行業(yè)的客戶。我們對預(yù)測分析的解釋始于我們自己的定義,以及上下文說明軟件如何從機(jī)器學(xué)習(xí)]算法中受益。
預(yù)測分析是一種工具,用于使用企業(yè)數(shù)據(jù)來預(yù)測組織所選業(yè)務(wù)領(lǐng)域中的變化。這使組織可以根據(jù)組織過去觀察到的現(xiàn)象計(jì)劃最統(tǒng)計(jì)上可能的結(jié)果。
當(dāng)預(yù)測分析由機(jī)器學(xué)習(xí)模型提供支持時(shí),它就是一類AI軟件,但這在最近幾年才變得越來越普遍。在此之前,術(shù)語“預(yù)測分析”是指使用多種不同的商業(yè)智能技術(shù)來確定最可能發(fā)生的未來事件。
但是,這些技術(shù)并不復(fù)雜,無法提供表明最可能結(jié)果的置信度得分或統(tǒng)計(jì)百分比。取而代之的是,使用企業(yè)數(shù)據(jù)來創(chuàng)建預(yù)測模型,該模型僅顯示軟件如何得出結(jié)論以及為何可能發(fā)生預(yù)測結(jié)果。
由機(jī)器學(xué)習(xí)提供支持的預(yù)測分析應(yīng)用程序具有利用大量數(shù)據(jù)并基于該數(shù)據(jù)做出更準(zhǔn)確預(yù)測的能力。機(jī)器學(xué)習(xí)能夠處理更大的數(shù)據(jù)集,因?yàn)樗枰M可能清晰地顯示組織業(yè)務(wù)歷史的圖像才能正常工作。一旦對機(jī)器學(xué)習(xí)模型進(jìn)行了與組織所選業(yè)務(wù)領(lǐng)域有關(guān)的數(shù)據(jù)的培訓(xùn),它便可以自動化用于進(jìn)行預(yù)測的分析技術(shù)。
這些預(yù)測通常包括一個最可能的結(jié)果列表以及一個置信度分?jǐn)?shù),該置信度分?jǐn)?shù)指示基于軟件估計(jì)的預(yù)測的準(zhǔn)確性。如果軟件做出的預(yù)測得出的置信度分?jǐn)?shù)低于某個特定數(shù)字,它將不會將該預(yù)測發(fā)送給用戶。此置信水平通常設(shè)置為很高的間隔,例如90%或92%。重要的是要注意,為預(yù)測分析應(yīng)用程序訓(xùn)練機(jī)器學(xué)習(xí)模型需要大量的結(jié)構(gòu)化數(shù)據(jù)以及試用安裝時(shí)間。這等于將結(jié)構(gòu)化數(shù)據(jù)輸入到機(jī)器學(xué)習(xí)模型中,直到能夠識別客戶組織業(yè)務(wù)中的趨勢和模式為止。
一旦模型可以識別重要的信息類型,例如索賠額或醫(yī)院再入院,組織將需要將其集成到其技術(shù)堆棧中并允許其在后臺運(yùn)行。在這段時(shí)間內(nèi),機(jī)器學(xué)習(xí)模型將像使用舊數(shù)據(jù)一樣進(jìn)行訓(xùn)練,除了業(yè)務(wù)的當(dāng)前事件。業(yè)務(wù)主管可以在這段時(shí)間內(nèi)檢查軟件的預(yù)測,以觀察其不斷提高的準(zhǔn)確性。例如,用于預(yù)測客戶流失的預(yù)測分析應(yīng)用程序?qū)⑿枰诖罅繗v史數(shù)據(jù)存儲庫上進(jìn)行培訓(xùn)。然后,需要將應(yīng)用程序安裝到客戶公司的網(wǎng)絡(luò)中,并允許其運(yùn)行試用期。試用期結(jié)束后,該軟件應(yīng)能夠在真實(shí)的客戶行為與客戶流失的歷史原因之間建立關(guān)聯(lián)。這樣,它就可以預(yù)測單個客戶是否會留在客戶公司。
創(chuàng)建了預(yù)測分析應(yīng)用程序的供應(yīng)商通常會說明需要進(jìn)行多長時(shí)間的試用,并且如果客戶希望繼續(xù)使用該軟件,它將已經(jīng)部分安裝。
“預(yù)測分析是一種從經(jīng)驗(yàn)(數(shù)據(jù))中學(xué)習(xí)以預(yù)測個人未來行為以做出更好決策的技術(shù)。” – 預(yù)測分析的作者:埃里克·西格爾(Eric Siegel):預(yù)測誰會點(diǎn)擊,購買,說謊或死亡的力量 預(yù)測分析是…不同技術(shù)和領(lǐng)域的結(jié)合?;旧希康氖歉鶕?jù)過去的歷史事件來預(yù)測將來的事件。…如果我們將其與Google Analytics(分析)進(jìn)行比較,那只是在研究數(shù)據(jù)。預(yù)測分析,有一個自動預(yù)測因素“[為其解決問題。 - 德國桑奇斯-Trilles,CEO和聯(lián)合創(chuàng)始人Sciling信息技術(shù)和服務(wù)。 預(yù)測分析將高級統(tǒng)計(jì)功能結(jié)合在一起,包括臨時(shí)統(tǒng)計(jì)分析,預(yù)測建模,數(shù)據(jù)挖掘,文本分析,優(yōu)化,實(shí)時(shí)評分和機(jī)器學(xué)習(xí)。這些工具可幫助組織發(fā)現(xiàn)數(shù)據(jù)模式,而不僅僅是知道發(fā)生了什么,還可以預(yù)測接下來可能發(fā)生的事情。-–- IBM
Dataiku是一家成立于2013年的紐約創(chuàng)業(yè)公司。他們聲稱已創(chuàng)建了機(jī)器學(xué)習(xí)技術(shù),該技術(shù)可以分析原始數(shù)據(jù)以構(gòu)建多種格式的預(yù)測模型。該原始數(shù)據(jù)可以采取來自客戶交互的單個產(chǎn)品或銷售記錄的歷史交易的形式。Dataiku聲稱他們的AI軟件可以幫助企業(yè)識別某些數(shù)據(jù)點(diǎn)之間的關(guān)系,從而可以提高效率和降低公司支出。富國銀行等主要銀行每天都會生成大量原始客戶數(shù)據(jù),這些數(shù)據(jù)可能來自客戶對話,社交媒體帖子,網(wǎng)站活動,營銷活動和交易信息。處理這么多種不同的數(shù)據(jù)類型的能力可能為銀行客戶帶來以下好處:
當(dāng)Dataiku用戶登錄系統(tǒng)時(shí),他們可以上載要由軟件組織的數(shù)據(jù)。Dataiku聲稱數(shù)據(jù)以電子表格的形式顯示并自動組織。該軟件會將每個數(shù)據(jù)點(diǎn)與它在新集成的數(shù)據(jù)中檢測到的某些共同特征相關(guān)聯(lián)。因此,當(dāng)公司表示可以檢測到特定數(shù)據(jù)是與男性還是女性客戶相關(guān)聯(lián)時(shí),它們意味著該軟件已經(jīng)為某些客戶行為建立了性別關(guān)聯(lián)。此外,每列頂部都有一個比例刻度,以便傳達(dá)與該類型數(shù)據(jù)相關(guān)的缺失值的數(shù)量。
然后,用戶可以單擊每列的標(biāo)題以可視化數(shù)據(jù),這可以使他們以圖表或圖形的形式查看此數(shù)據(jù)。據(jù)稱,它們還可以生成交叉引用不同列的圖形。如果用戶認(rèn)為數(shù)據(jù)中可能存在異常值,則軟件可以提示用戶如何更正它們并進(jìn)一步培訓(xùn)軟件。以下4分鐘的視頻是Dataiku的演示。這顯示了企業(yè)如何使用此預(yù)測分析應(yīng)用程序來編輯,監(jiān)視和查看從原始數(shù)據(jù)中收集的見解。
預(yù)測分析在制藥行業(yè)中最突出的用途之一是臨床試驗(yàn)的設(shè)計(jì)和優(yōu)化。這樣的應(yīng)用程序可以分析患者的病史,以確定哪些患者對被測藥物的反應(yīng)最佳。這有助于公司找到最好的患者來嘗試招募參加臨床試驗(yàn)。這種類型的軟件解決方案還可以幫助制藥公司以多種其他方式設(shè)計(jì)和組織臨床試驗(yàn)。這些研究包括該藥物可能產(chǎn)生的副作用以及哪些患者最有可能經(jīng)歷這些副作用的研究。另外,一些應(yīng)用可以允許遺傳聚類,或根據(jù)患者對藥物反應(yīng)良好的可能性進(jìn)行細(xì)分。
以下是供應(yīng)商Dataiku的演示視頻,展示了他們稱為DSS的軟件平臺。該演示將引導(dǎo)觀眾完成用戶使用數(shù)據(jù)集來預(yù)測醫(yī)生使用不同藥物處方的過程。盡管視頻長13分鐘,但最重要的部分也列在下面:
醫(yī)療保健公司可以使用預(yù)測分析應(yīng)用程序來幫助防止患者再次入院,預(yù)測患者健康狀況下降以及預(yù)測患者錯過約會的可能性。AI供應(yīng)商Health Catalyst提供了一種解決方案,他們聲稱可以使用患者的病歷作為數(shù)據(jù)來完成所有這些任務(wù)。
集成后,醫(yī)院可以登錄Health Catalyst儀表板并顯示患者資料。該個人資料將以百分比的形式顯示患者患上重病,錯過約會或以后被重新接納的可能性。這可以使醫(yī)療保健提供者密切關(guān)注由于忽視健康而處于較高風(fēng)險(xiǎn)中的患者。
預(yù)測分析可以幫助金融機(jī)構(gòu)預(yù)測與貸款或發(fā)行信用卡相關(guān)的風(fēng)險(xiǎn)水平,包括客戶違約的可能性。這對于嘗試通過增加活躍貸款的數(shù)量以及每筆貸款的數(shù)量來進(jìn)行增長的機(jī)構(gòu)特別有用。當(dāng)這些貸款以信用卡的形式出現(xiàn)時(shí),機(jī)構(gòu)可能需要一種策略來預(yù)測與每個申請相關(guān)的風(fēng)險(xiǎn)。
預(yù)測性分析應(yīng)用程序可以使用申請人的信用評分,信用歷史記錄和整體財(cái)務(wù)歷史記錄(如果有)來計(jì)算此結(jié)果。此外,這種信用風(fēng)險(xiǎn)評分可以幫助金融機(jī)構(gòu)實(shí)時(shí)識別不正確的付款金額。這可能會增強(qiáng)機(jī)構(gòu)在完全處理欺詐性付款之前的能力。
在保險(xiǎn)業(yè)中,支持機(jī)器學(xué)習(xí)的預(yù)測模型可以幫助企業(yè)防止客戶流失,從而使客戶保持更長的時(shí)間。某些應(yīng)用程序可以根據(jù)客戶為保險(xiǎn)公司提供的終生價(jià)值來對其評分。這種類型的應(yīng)用程序?qū)τ趯ふ蚁蜻@些客戶進(jìn)行營銷并吸引他們提高保險(xiǎn)計(jì)劃的新方法可能很有用。
保險(xiǎn)公司可以不使用客戶的個人金融行業(yè),而可以簡單地利用與客戶的歷史和交易數(shù)據(jù)來估算他們將來將繼續(xù)提供多少價(jià)值??梢哉J(rèn)為是客戶流失的證據(jù)的數(shù)據(jù)可能是客戶使用保險(xiǎn)或與客戶服務(wù)進(jìn)行溝通以更改或改善其計(jì)劃的頻率。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10