
【每周一本書第3波】用商業(yè)案例學 R 語言數(shù)據(jù)挖掘
數(shù)據(jù)科學興起時,數(shù)據(jù)科學家隨即作為一種新生職業(yè)被提出,數(shù)據(jù)研究高級科學家Rachel Schutt將其定義為“計算機科學家、軟件工程師和統(tǒng)計學家的混合體“。數(shù)據(jù)挖掘作為一個學術(shù)領(lǐng)域,橫跨多個學科,涵蓋了統(tǒng)計學、數(shù)學、機器學習和數(shù)據(jù)庫等,此外還包括各類專業(yè)方向比如從油田電力、海洋生物、歷史文本、電子通訊、法律稅務(wù)等的各個專業(yè)領(lǐng)域。
而本書按照數(shù)據(jù)挖掘工程師規(guī)范化學習體系而定,對于一名初學者,應(yīng)該先掌握必要的編程工具、統(tǒng)計理論基礎(chǔ)、數(shù)據(jù)挖掘算法等內(nèi)容。進而,數(shù)據(jù)挖掘需要根據(jù)業(yè)務(wù)問題選擇合適的方法,按照標準流程,即數(shù)據(jù)的獲取、儲存、整理、清洗、歸約等一系列數(shù)據(jù)處理技術(shù),并最終得出結(jié)果,繪制圖表并解讀數(shù)據(jù),這些內(nèi)容在本書中進行了詳細的講解和操作分析。本書整體風格是“理論>技術(shù)>應(yīng)用”的一個學習過程,最終目的在于商業(yè)業(yè)務(wù)應(yīng)用,為欲從事數(shù)據(jù)挖掘的各界人士提供一個規(guī)范化的數(shù)據(jù)分析師學習體系。
【每周一本書】又是一周,CDA數(shù)據(jù)分析師攜手工業(yè)出版社將于每周三展開贈書活動,每周給各位讀者提供3-5本贈書,希望帶動各位讀者能借此機會每周充一次電。(注:書籍將于10天內(nèi)發(fā)放到中獎?wù)呤种小⑴c方式見下文)
作者簡介
常國珍,北京大學會計學博士,中國大數(shù)據(jù)產(chǎn)業(yè)生態(tài)聯(lián)盟專家委員會專家委員。主要從事金融、電信行業(yè)客戶畫像,信用與操作風險識別與防范,客戶終生價值預(yù)測與價值提升等工作。
曾珂,華中師范大學管理科學工程碩士,現(xiàn)為車貸金融產(chǎn)品部產(chǎn)品經(jīng)理,精通Python與R語言數(shù)據(jù)挖掘。曾經(jīng)就職于華為、國家電網(wǎng)等企業(yè)。以金融信用與欺詐風險建模、文本分析、數(shù)據(jù)可視化等為主要研究方向。
朱江,挪威科技大學工學碩士,現(xiàn)為CDA數(shù)據(jù)分析研究院課程開發(fā)副總監(jiān),CDA數(shù)據(jù)挖掘競賽的評委。精通R與SAS語言數(shù)據(jù)挖掘,從事電商與互聯(lián)網(wǎng)數(shù)據(jù)分析的教學工作。研究方向為電商推薦系統(tǒng)開發(fā)、數(shù)據(jù)可視化、客戶特征提取和客戶行為模式發(fā)現(xiàn)。
內(nèi)容提要
商業(yè)智能時代已經(jīng)全面到來,分析型人才的崗位數(shù)量在就業(yè)市場中呈現(xiàn)井噴式增長。無論是從事產(chǎn)品研發(fā)的工程師,還是從事產(chǎn)品推廣的市場人員、人力資源和財務(wù)會計人員,都需要掌握數(shù)據(jù)分析技術(shù),否則很有可能被人工智能替代。
本書包括 18 章,涉及使用 R 語言做數(shù)據(jù)分析和數(shù)據(jù)挖掘的主要分析方法。其中,第 1、 2 章為數(shù)據(jù)分析方法概述,第 3 章為 R 語言編程基礎(chǔ),第 4 章到第 8 章為統(tǒng)計學習方法,第 9 章到第 16 章為數(shù)據(jù)挖掘方法,第 17 章為特征工程,第 18 章為 R 文本挖掘。每章都根據(jù)所涉及的知識點的不同,選取了實用的案例,并為讀者準備了相應(yīng)的練習題。
本書作為 CDA 數(shù)據(jù)分析師系列叢書中《如虎添翼!數(shù)據(jù)處理的 SPSS 和 SAS EG 實現(xiàn)(第 2 版)》和《胸有成竹!數(shù)據(jù)分析的 SPSS 和 SAS EG 進階(第 2 版)》的姊妹篇,將前兩本書的內(nèi)容進行整合并做了重大拓展,而且秉承了該系列叢書的特點:內(nèi)容精練、重點突出、示例豐富、語言通俗??梢宰鳛閺V大從業(yè)人員自學商業(yè)數(shù)據(jù)分析的讀物,適合大中專院校師生學習和閱讀,同時也可以作為高等院校商科、社會科學及相關(guān)培訓機構(gòu)的教材。
上周獲獎名單
姓名
獎項
聯(lián)系方式
張艷玲
Spark書一本
137XXXX4435
劉紅偉
Spark書一本
156XXXX3005
劉暢
Spark書一本
130XXXX6898
李慶
Spark書一本
185XXXX8809
范洪梅
Spark書一本
187XXXX7940
姚新新
會員一周
188XXXX0610
星亞
會員一周
186XXXX2411
郭郭
會員一周
189XXXX5366
神奇的大叔
會員一周
150XXXX6066
王興
會員一周
138XXXX2562
(以上獲獎人員,請及時與我們(C君:GAOm638)取得聯(lián)系,三日內(nèi)有效,過期默認獲獎資格失效。)
參與方式
文末留言告訴C君,這本書吸引您的理由,獲得精選,點(ren)贊(qi)數(shù)(gao)的前5名即可獲得本書
截止時間8月29日中午12點
(為確保贈書活動的公平公開性,讓更多人能參與到每周一本書中。贈書活動參與者每月有且僅有一次獲獎機會,有獲獎記錄的參與者贈書將自動轉(zhuǎn)贈其他參與者)
土豪請點擊原文鏈接訂購。訂購鏈接:https://item.jd.com/12053799.html
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10