決策分類樹算法之ID3,C4.5算法系列 一、引言 在最開始的時(shí)候,我本來準(zhǔn)備學(xué)習(xí)的是C4.5算法,后來發(fā)現(xiàn)C4.5算法的核心還是ID3算法,所以又輾轉(zhuǎn)回到學(xué)習(xí)ID3算法了,因?yàn)镃4.5是他的一個(gè)改進(jìn)。至于是什么 ...
2015-12-03一個(gè)軟妹子數(shù)據(jù)分析師的真實(shí)內(nèi)心世界 “數(shù)據(jù)分析師”被譽(yù)為二十一世紀(jì)最性感的職業(yè)。所謂性感,既代表著難以名狀的誘惑,又說明了大家都不知道它干的是什么。其實(shí),數(shù)據(jù)分析師就是采用科學(xué)方法、運(yùn)用數(shù)據(jù) ...
2015-12-03數(shù)據(jù)分析師必須掌握的完整知識(shí)結(jié)構(gòu) 在互聯(lián)網(wǎng)高速發(fā)展的今天,大數(shù)據(jù)依然滲透到我們的生活和工作,企業(yè)要想在未來獲得更多的價(jià)值,大數(shù)據(jù)和數(shù)據(jù)分析師是非常有必要的。但是作為數(shù)據(jù)分析師,無論最初的職 ...
2015-12-03關(guān)于大數(shù)據(jù)治理的研究與分析 1數(shù)據(jù)治理的背景和現(xiàn)狀 1.1數(shù)據(jù)治理背景 隨著網(wǎng)絡(luò)和信息技術(shù)的不斷普及,人類產(chǎn)生的數(shù)據(jù)量正在呈指數(shù)級(jí)增長(zhǎng)。大約每?jī)赡攴环?,根?jù)監(jiān)測(cè),這個(gè)速度在2020 年之 ...
2015-12-037 個(gè)你不可不知的大數(shù)據(jù)定義 在大多數(shù)人根本不知道大數(shù)據(jù)(Big Data)到底是什么的時(shí)候,不可否認(rèn)的是,大數(shù)據(jù)已經(jīng)在 21 世紀(jì)掀起一場(chǎng)驚濤駭浪。根據(jù)研究機(jī)構(gòu) IDC(國(guó)際數(shù)據(jù)資訊公司)的分析,這個(gè)世界上的資料 ...
2015-12-03寫給風(fēng)控新人大數(shù)據(jù)挖掘基礎(chǔ)知識(shí)介紹 對(duì)企業(yè)來,堆積如山的數(shù)據(jù)無異于一個(gè)巨大的寶庫(kù)。但是如何利用新一代的計(jì)算技術(shù)和工具來開采數(shù)據(jù)庫(kù)中蘊(yùn)藏的寶藏呢? 在市場(chǎng)需求和技術(shù)基礎(chǔ)這兩個(gè)因素都具備的 ...
2015-12-03大數(shù)據(jù)與熵:臨界分析 大數(shù)據(jù)的踐行者們不僅在思維上進(jìn)行了轉(zhuǎn)變,在數(shù)據(jù)處理上同樣采取“大數(shù)據(jù)”的方法:分析全體而不是樣本,不追求精確性,“知其然,不知其所以然”(注:第三句是筆者歸納,原文意 ...
2015-12-03為什么要使用企業(yè)大數(shù)據(jù)分析 當(dāng)網(wǎng)絡(luò)已經(jīng)迅速的融入到人們的工作和生活當(dāng)中,企業(yè)的經(jīng)營(yíng)管理過程中也無法離開網(wǎng)絡(luò),尤其是隨著大數(shù)據(jù)時(shí)代的到來,對(duì)于企業(yè)來說,經(jīng)營(yíng)管理已經(jīng)不僅僅是人為控制的活動(dòng),更多 ...
2015-12-02微信運(yùn)營(yíng)之?dāng)?shù)據(jù)分析整理 在微信運(yùn)營(yíng)的過程當(dāng)中,文章的UV直接影響到內(nèi)容的擴(kuò)散程度和受眾。除了從內(nèi)容層面專心做好文章之外,我們還能夠從數(shù)據(jù)當(dāng)中獲取到哪些相關(guān)信息呢?以下結(jié)合最近工作當(dāng)中的數(shù)據(jù)分析 ...
2015-12-02數(shù)據(jù)可視化6步法 在當(dāng)前互聯(lián)網(wǎng),各種數(shù)據(jù)可視化圖表層出不窮,本文嘗試對(duì)數(shù)據(jù)可視化的方法進(jìn)行歸納,整理成6步法。 一般的數(shù)據(jù)圖表都可以拆分成最基本的兩類元素: 所描述的事物及這個(gè)事物的數(shù)值, ...
2015-12-02數(shù)據(jù)分析之如何看懂?dāng)?shù)據(jù) 對(duì)于數(shù)據(jù),有一個(gè)共識(shí)就要會(huì)看數(shù)據(jù),通過合理及透徹的分析來驅(qū)動(dòng)產(chǎn)品,運(yùn)營(yíng)及市場(chǎng)策略的調(diào)整。但是這些知識(shí)看數(shù)據(jù)的中級(jí)階段,高級(jí)階段則是通過龐大的多維度的數(shù)據(jù)分析,能夠預(yù) ...
2015-12-02如何用大數(shù)據(jù)的方法繪制知覺圖 統(tǒng)研究時(shí)代,知覺圖(perceptual map)是一個(gè)簡(jiǎn)潔直觀解析品牌定位的經(jīng)典工具。然而隨著大數(shù)據(jù)時(shí)代的降臨,傳統(tǒng)的數(shù)據(jù)獲取方法受到了不斷的沖擊,原來使用焦點(diǎn)小組(Focus Gr ...
2015-12-02SAS與R的對(duì)決:誰好使? 翻譯 | JosephYX 來自SAS資源資訊列表 摘要 盡管在工業(yè)界還是被 SAS 所統(tǒng)治,但是 R 在學(xué)術(shù)界卻得到廣泛的應(yīng)用,因?yàn)槠涿赓M(fèi)、開源的屬性使得用戶們可以編寫和分享他 ...
2015-12-0213招神技 讓你在數(shù)據(jù)科學(xué)和數(shù)據(jù)分析工作中脫穎而出 文 | Tavish Srivastava 翻譯 | 36大數(shù)據(jù)翻譯組-望天 來自36大數(shù)據(jù) 我有幸在很早參與了一個(gè)大數(shù)據(jù)科學(xué)項(xiàng)目,我非常喜歡其中的工作,甚至我 ...
2015-12-02黑天鵝算法與大數(shù)據(jù)的四個(gè)層次 簡(jiǎn)單來說 黑天鵝算法 對(duì)于數(shù)據(jù) 分為四個(gè)層次 1,原始數(shù)據(jù),例如zw的足彩數(shù)據(jù)包 這個(gè)是最重要的 2、統(tǒng)計(jì)分析數(shù)據(jù) ,基于1進(jìn)行各種基本統(tǒng)計(jì)分析 3、黑天鵝素材庫(kù) ...
2015-12-02大數(shù)據(jù)如何作用于”輿情“ 隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,信息量大、類型繁多、價(jià)值密度低、速度快、時(shí)效高的大數(shù)據(jù)吸引了越來越多的關(guān)注目光,大數(shù)據(jù)帶來的信息風(fēng)暴正在改變我們的生活、工作和思維。毋庸諱言 ...
2015-12-02你最需要學(xué)習(xí)的10個(gè)Excel功能 文 | 趙志東 經(jīng)常有新手提問,我該怎么學(xué)excel呢,哪些才是最需要學(xué)習(xí)的內(nèi)容呢?蘭色就列舉出excel中的十大功能 第一名:數(shù)據(jù)透視表 理由:只要用表格處 ...
2015-12-02解讀大數(shù)據(jù)的四個(gè)價(jià)值 大數(shù)據(jù)是當(dāng)今熱門的話題,對(duì)于大數(shù)據(jù)很多人提出過這樣那樣的觀點(diǎn),那么大數(shù)據(jù)到底是什么,能夠給我們帶來怎樣的價(jià)值呢?瑞意趨勢(shì)CEO 梁海宏來和大家做一下解讀。數(shù)量巨大,情 ...
2015-12-02“大數(shù)據(jù)”僅僅是一個(gè)數(shù)據(jù)應(yīng)用先進(jìn)方法 看了眾多對(duì)“大數(shù)據(jù)”的說法,有人說大數(shù)據(jù)需要“全息”的數(shù)據(jù),才能做到真正的大數(shù)據(jù)應(yīng)用,才能做到理想中的BI;還有人說大數(shù)據(jù)重點(diǎn)是各種數(shù)據(jù)處理以及更海 ...
2015-12-02如何提升渠道ROI?在數(shù)據(jù)分析的基礎(chǔ)上實(shí)現(xiàn)精準(zhǔn)營(yíng)銷 著名廣告大師約翰·沃納梅克曾說過“打廣告的錢有一半是浪費(fèi)的,但客戶永遠(yuǎn)不知道是哪一半。”盡管如此,每一位廣告主都還是希望把漫天撒網(wǎng)的廣告變成 ...
2015-12-02訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對(duì)數(shù)據(jù)的需求已從 “存儲(chǔ)” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11