騙子也玩大數(shù)據(jù)?來自數(shù)據(jù)分析師的揭秘 近年在很多揭露詐騙的報道中,常常出現(xiàn)老太太接到電話說孫子出事了、老板接到電話說稅務(wù)局要查稅等案例,為什么現(xiàn)在騙子“對號入座”的本事這么強? 其實,這與騙子們 ...
2016-08-18想了解機器學(xué)習(xí)?你需要知道的十個基礎(chǔ)算法 毫無疑問,作為人工智能的子領(lǐng)域—機器學(xué)習(xí)在過去的幾年中越來越受歡迎。由于大數(shù)據(jù)是目前科技行業(yè)最熱門的趨勢,基于大量的數(shù)據(jù)機器學(xué)習(xí)在提前預(yù)測和做出建議方面有 ...
2016-08-18Excel2016四個超強的數(shù)據(jù)分析功能 三維地圖、預(yù)測工作表、引用外部數(shù)據(jù)查詢、數(shù)據(jù)透視表更強大的功能改進、將Excel 表格發(fā)布到Office 365 Power BI實現(xiàn)數(shù)據(jù)的商業(yè)智能分析……Excel 2016在數(shù)據(jù)智能分析與展示上 ...
2016-08-18數(shù)據(jù)挖掘領(lǐng)域經(jīng)典算法 偶見網(wǎng)頁數(shù)據(jù)挖掘領(lǐng)域十大經(jīng)典算法,心血來潮,在學(xué)習(xí)的同時也想驗驗有哪些知道哪些實現(xiàn)過。 2006年12月,國際權(quán)威的學(xué)術(shù)組織the IEEE International Conference on Data Mining (ICDM ...
2016-08-17談?wù)剶?shù)據(jù)挖掘和機器學(xué)習(xí) 首先聲明的是本人并非數(shù)據(jù)挖掘和機器學(xué)習(xí)的高手,只是作為業(yè)余興趣剛剛開始研究,據(jù)我所知好多朋友也和我一樣對這方面的東西感興趣,個人認為機器人技術(shù)是未來發(fā)展的方向。雖然我的專 ...
2016-08-17使用sklearn優(yōu)雅地進行數(shù)據(jù)挖掘 1 使用sklearn進行數(shù)據(jù)挖掘 1.1 數(shù)據(jù)挖掘的步驟 數(shù)據(jù)挖掘通常包括數(shù)據(jù)采集,數(shù)據(jù)分析,特征工程,訓(xùn)練模型,模型評估等步驟。使用sklearn工具可以方便地進行特征工程和模 ...
2016-08-17淺談數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則挖掘 數(shù)據(jù)挖掘是指以某種方式分析數(shù)據(jù)源,從中發(fā)現(xiàn)一些潛在的有用的信息,所以數(shù)據(jù)挖掘又稱作知識發(fā)現(xiàn),而關(guān)聯(lián)規(guī)則挖掘則是數(shù)據(jù)挖掘中的一個很重要的課題,顧名思義,它是從數(shù)據(jù)背后 ...
2016-08-17異常檢測算法--Isolation Forest 提到森林,自然少不了樹,畢竟森林都是由樹構(gòu)成的,看Isolation Forest(簡稱iForest)前,我們先來看看Isolation Tree(簡稱iTree)是怎么構(gòu)成的,iTree是一種隨機二叉樹,每 ...
2016-08-17K-means算法及文本聚類實踐 K-Means是常用的聚類算法,與其他聚類算法相比,其時間復(fù)雜度低,聚類的效果也還不錯,這里簡單介紹一下k-means算法,下圖是一個手寫體數(shù)據(jù)集聚類的結(jié)果。 基本思想 k-mea ...
2016-08-17關(guān)于“數(shù)據(jù)分析師”崗,你想要了解的一切 數(shù)據(jù)分析行業(yè)現(xiàn)在大熱,只要是在科技創(chuàng)新領(lǐng)域的公司,紛紛都掛出來了急招“數(shù)據(jù)分析師”的牌子。但是很多人對它的概念并不了解,還有更多的創(chuàng)業(yè)者更是不知道是否應(yīng)該去 ...
2016-08-16數(shù)據(jù)挖掘?qū)嵗弘娦艠I(yè)如何應(yīng)用數(shù)據(jù)挖掘 電信業(yè)務(wù)領(lǐng)域的全面開放,激烈競爭使得目前的中國電信市場烽煙四起?!翱蛻簦a(chǎn)品-市場-利潤”成為目前各電信運營商的基本發(fā)展思路。中國電信集團去年在全國推出營銷分 ...
2016-08-16數(shù)據(jù)挖掘系列卷積神經(jīng)網(wǎng)絡(luò)算法的一個實現(xiàn) 從理解卷積神經(jīng)到實現(xiàn)它,前后花了一個月時間,現(xiàn)在也還有一些地方?jīng)]有理解透徹,CNN還是有一定難度的,不是看哪個的博客和一兩篇論文就明白了,主要還是靠自己去專研 ...
2016-08-16數(shù)據(jù)挖掘系列BP神經(jīng)網(wǎng)絡(luò)算法與實踐 神經(jīng)網(wǎng)絡(luò)曾經(jīng)很火,有過一段低迷期,現(xiàn)在因為深度學(xué)習(xí)的原因繼續(xù)火起來了。神經(jīng)網(wǎng)絡(luò)有很多種:前向傳輸網(wǎng)絡(luò)、反向傳輸網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等。本文介紹基本的反 ...
2016-08-16基于WEB的數(shù)據(jù)挖掘綜述 我們現(xiàn)在已經(jīng)生活在一個相當(dāng)數(shù)字化的時代中,通信、計算機和網(wǎng)絡(luò)技術(shù)正極大地影響著整個人類社會。然而,海量信息既給人們帶來方便也帶來了許多問題使我們 驚嘆信息爆炸的同時,又不得不 ...
2016-08-16數(shù)據(jù)挖掘系列樸素貝葉斯分類算法原理與實踐 隔了很久沒有寫數(shù)據(jù)挖掘系列的文章了,今天介紹一下樸素貝葉斯分類算法,講一下基本原理,再以文本分類實踐。 一個簡單的例子 樸素貝葉斯算法是一個典型的統(tǒng)計 ...
2016-08-16數(shù)據(jù)挖掘系列分類算法評價 一、引言 分類算法有很多,不同分類算法又用很多不同的變種。不同的分類算法有不同的特定,在不同的數(shù)據(jù)集上表現(xiàn)的效果也不同,我們需要根據(jù)特定的任務(wù)進行算法的選擇,如何選擇 ...
2016-08-15數(shù)據(jù)挖掘系列使用mahout做海量數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘 上一篇介紹了用開源數(shù)據(jù)挖掘軟件weka做關(guān)聯(lián)規(guī)則挖掘,weka方便實用,但不能處理大數(shù)據(jù)集,因為內(nèi)存放不下,給它再多的時間也是無用,因此需要進行分布式計算,ma ...
2016-08-15數(shù)據(jù)挖掘系列使用weka做關(guān)聯(lián)規(guī)則挖掘 前面幾篇介紹了關(guān)聯(lián)規(guī)則的一些基本概念和兩個基本算法,但實際在商業(yè)應(yīng)用中,寫算法反而比較少,理解數(shù)據(jù),把握數(shù)據(jù),利用工具才是重要的,前面的基礎(chǔ)篇是對算法的理解,這 ...
2016-08-15數(shù)據(jù)挖掘系列關(guān)聯(lián)規(guī)則評價 前面我們討論的關(guān)聯(lián)規(guī)則都是用支持度和自信度來評價的,如果一個規(guī)則的自信度高,我們就說它是一條強規(guī)則,但是自信度和支持度有時候并不能度量規(guī)則的實際意義和業(yè)務(wù)關(guān)注的興趣點。 ...
2016-08-15數(shù)據(jù)挖掘系列關(guān)聯(lián)規(guī)則FpGrowth算法 上一篇介紹了關(guān)聯(lián)規(guī)則挖掘的一些基本概念和經(jīng)典的Apriori算法,Aprori算法利用頻繁集的兩個特性,過濾了很多無關(guān)的集合,效率提高不少,但是我們發(fā)現(xiàn)Apriori算法是一個候選消 ...
2016-08-15訓(xùn)練與驗證損失驟升:機器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11