
【每周一本書第3波】用商業(yè)案例學(xué) R 語言數(shù)據(jù)挖掘
數(shù)據(jù)科學(xué)興起時,數(shù)據(jù)科學(xué)家隨即作為一種新生職業(yè)被提出,數(shù)據(jù)研究高級科學(xué)家Rachel Schutt將其定義為“計算機科學(xué)家、軟件工程師和統(tǒng)計學(xué)家的混合體“。數(shù)據(jù)挖掘作為一個學(xué)術(shù)領(lǐng)域,橫跨多個學(xué)科,涵蓋了統(tǒng)計學(xué)、數(shù)學(xué)、機器學(xué)習(xí)和數(shù)據(jù)庫等,此外還包括各類專業(yè)方向比如從油田電力、海洋生物、歷史文本、電子通訊、法律稅務(wù)等的各個專業(yè)領(lǐng)域。
而本書按照數(shù)據(jù)挖掘工程師規(guī)范化學(xué)習(xí)體系而定,對于一名初學(xué)者,應(yīng)該先掌握必要的編程工具、統(tǒng)計理論基礎(chǔ)、數(shù)據(jù)挖掘算法等內(nèi)容。進而,數(shù)據(jù)挖掘需要根據(jù)業(yè)務(wù)問題選擇合適的方法,按照標(biāo)準(zhǔn)流程,即數(shù)據(jù)的獲取、儲存、整理、清洗、歸約等一系列數(shù)據(jù)處理技術(shù),并最終得出結(jié)果,繪制圖表并解讀數(shù)據(jù),這些內(nèi)容在本書中進行了詳細(xì)的講解和操作分析。本書整體風(fēng)格是“理論>技術(shù)>應(yīng)用”的一個學(xué)習(xí)過程,最終目的在于商業(yè)業(yè)務(wù)應(yīng)用,為欲從事數(shù)據(jù)挖掘的各界人士提供一個規(guī)范化的數(shù)據(jù)分析師學(xué)習(xí)體系。
【每周一本書】又是一周,CDA數(shù)據(jù)分析師攜手工業(yè)出版社將于每周三展開贈書活動,每周給各位讀者提供3-5本贈書,希望帶動各位讀者能借此機會每周充一次電。(注:書籍將于10天內(nèi)發(fā)放到中獎?wù)呤种小⑴c方式見下文)
作者簡介
常國珍,北京大學(xué)會計學(xué)博士,中國大數(shù)據(jù)產(chǎn)業(yè)生態(tài)聯(lián)盟專家委員會專家委員。主要從事金融、電信行業(yè)客戶畫像,信用與操作風(fēng)險識別與防范,客戶終生價值預(yù)測與價值提升等工作。
曾珂,華中師范大學(xué)管理科學(xué)工程碩士,現(xiàn)為車貸金融產(chǎn)品部產(chǎn)品經(jīng)理,精通Python與R語言數(shù)據(jù)挖掘。曾經(jīng)就職于華為、國家電網(wǎng)等企業(yè)。以金融信用與欺詐風(fēng)險建模、文本分析、數(shù)據(jù)可視化等為主要研究方向。
朱江,挪威科技大學(xué)工學(xué)碩士,現(xiàn)為CDA數(shù)據(jù)分析研究院課程開發(fā)副總監(jiān),CDA數(shù)據(jù)挖掘競賽的評委。精通R與SAS語言數(shù)據(jù)挖掘,從事電商與互聯(lián)網(wǎng)數(shù)據(jù)分析的教學(xué)工作。研究方向為電商推薦系統(tǒng)開發(fā)、數(shù)據(jù)可視化、客戶特征提取和客戶行為模式發(fā)現(xiàn)。
內(nèi)容提要
商業(yè)智能時代已經(jīng)全面到來,分析型人才的崗位數(shù)量在就業(yè)市場中呈現(xiàn)井噴式增長。無論是從事產(chǎn)品研發(fā)的工程師,還是從事產(chǎn)品推廣的市場人員、人力資源和財務(wù)會計人員,都需要掌握數(shù)據(jù)分析技術(shù),否則很有可能被人工智能替代。
本書包括 18 章,涉及使用 R 語言做數(shù)據(jù)分析和數(shù)據(jù)挖掘的主要分析方法。其中,第 1、 2 章為數(shù)據(jù)分析方法概述,第 3 章為 R 語言編程基礎(chǔ),第 4 章到第 8 章為統(tǒng)計學(xué)習(xí)方法,第 9 章到第 16 章為數(shù)據(jù)挖掘方法,第 17 章為特征工程,第 18 章為 R 文本挖掘。每章都根據(jù)所涉及的知識點的不同,選取了實用的案例,并為讀者準(zhǔn)備了相應(yīng)的練習(xí)題。
本書作為 CDA 數(shù)據(jù)分析師系列叢書中《如虎添翼!數(shù)據(jù)處理的 SPSS 和 SAS EG 實現(xiàn)(第 2 版)》和《胸有成竹!數(shù)據(jù)分析的 SPSS 和 SAS EG 進階(第 2 版)》的姊妹篇,將前兩本書的內(nèi)容進行整合并做了重大拓展,而且秉承了該系列叢書的特點:內(nèi)容精練、重點突出、示例豐富、語言通俗??梢宰鳛閺V大從業(yè)人員自學(xué)商業(yè)數(shù)據(jù)分析的讀物,適合大中專院校師生學(xué)習(xí)和閱讀,同時也可以作為高等院校商科、社會科學(xué)及相關(guān)培訓(xùn)機構(gòu)的教材。
上周獲獎名單
姓名
獎項
聯(lián)系方式
張艷玲
Spark書一本
137XXXX4435
劉紅偉
Spark書一本
156XXXX3005
劉暢
Spark書一本
130XXXX6898
李慶
Spark書一本
185XXXX8809
范洪梅
Spark書一本
187XXXX7940
姚新新
會員一周
188XXXX0610
星亞
會員一周
186XXXX2411
郭郭
會員一周
189XXXX5366
神奇的大叔
會員一周
150XXXX6066
王興
會員一周
138XXXX2562
(以上獲獎人員,請及時與我們(C君:GAOm638)取得聯(lián)系,三日內(nèi)有效,過期默認(rèn)獲獎資格失效。)
參與方式
文末留言告訴C君,這本書吸引您的理由,獲得精選,點(ren)贊(qi)數(shù)(gao)的前5名即可獲得本書
截止時間8月29日中午12點
(為確保贈書活動的公平公開性,讓更多人能參與到每周一本書中。贈書活動參與者每月有且僅有一次獲獎機會,有獲獎記錄的參與者贈書將自動轉(zhuǎn)贈其他參與者)
土豪請點擊原文鏈接訂購。訂購鏈接:https://item.jd.com/12053799.html
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03