作者:付曉巖 來源:大數(shù)據(jù)DT(ID:hzdashuju) 導(dǎo)讀:眾多企業(yè)管理者都將“數(shù)字化轉(zhuǎn)型”視為戰(zhàn)略核心,那么“數(shù)字化轉(zhuǎn)型”應(yīng)該已經(jīng)有了一個清晰的概念才對,但實際上卻并非如此。經(jīng)過筆者多方收集,似乎大家 ...
2020-06-28作者:Alex Petrov 來源:大數(shù)據(jù)DT(ID:hzdashuju) 內(nèi)容摘編自《數(shù)據(jù)庫系統(tǒng)內(nèi)幕》 導(dǎo)讀:本文帶你了解面向列與面向行的數(shù)據(jù)庫。 大多數(shù)數(shù)據(jù)庫系統(tǒng)存儲一組數(shù)據(jù)記錄,這些記錄由表中的列和行組成。 ...
2020-06-28作者:趙敏 寧振波 來源:大數(shù)據(jù)DT(ID:hzdashuju) 內(nèi)容摘編自《鑄魂:軟件定義制造》 導(dǎo)讀:數(shù)字孿生(Digital Twin)已經(jīng)走過了幾十年的發(fā)展歷程,只不過以前沒有這樣命名,而是發(fā)展到了一定階段,人們意 ...
2020-06-28導(dǎo)讀:一次機緣巧合,在研究BI產(chǎn)品技術(shù)選型的時候,我接觸到了ClickHouse,瞬間就被其驚人的性能所折服。這款非Hadoop生態(tài)、簡單、自成一體的技術(shù)組件引起了我極大的好奇。那么ClickHouse好在哪呢?本文帶你做一個 ...
2020-06-24Python火了,而且火得大紅大紫,從工作到生活,處處都有python的身影。python 是一門兼具簡單與功能強大的編程語言,它專注于如何解決問題、自由開放的社區(qū)環(huán)境以及豐富的第三方庫......太專業(yè)了,我又不寫編程, ...
2020-06-24EXCEL是數(shù)據(jù)分析入門級的工具,今天小編繼續(xù)給大家?guī)鞥XCEL使用的一些小技巧——EXCEL快捷鍵。在分析處理龐大的數(shù)據(jù)時,EXCEL快捷鍵可以幫助我們提高數(shù)據(jù)分析的效率。下面,跟小編一起來看,數(shù)據(jù)分析中常用的EXCE ...
2020-06-24一、卡方分布定義 卡方分布 (χ2分布)是概率論與統(tǒng)計學(xué)中常用的一種概率分布。k 個獨立的標(biāo)準(zhǔn)正態(tài)分布變量的平方和服從自由度為k 的卡方分布??ǚ椒植汲S糜诩僭O(shè)檢驗和置信區(qū)間的計算。 若k 個隨機變量Z1、 ...
2020-06-24因果推斷(causalinference),緣起人類的本能或經(jīng)常自發(fā)提出的一個簡單問題:為什么(why)?事實上,作為科學(xué)研究的核心與宗旨——因果推斷就是關(guān)于此問題的嚴(yán)肅思考、科學(xué)驗證或因果分析(causal analysis)。目前,因 ...
2020-06-23當(dāng)下數(shù)據(jù)分析與人工智能發(fā)展迅速,各行各業(yè)都需要數(shù)據(jù)做支持,小到我們每個人的社交網(wǎng)絡(luò)、運動軌跡、消費信息,大到企業(yè)的銷售、運營、產(chǎn)品數(shù)據(jù),都需要做數(shù)據(jù)分析。因此,數(shù)據(jù)分析師已然成為當(dāng)前最火爆、最熱門就 ...
2020-06-23大家整理了,數(shù)據(jù)分析入門常用的EXCEL在數(shù)據(jù)分析行業(yè),EXCEL是最基礎(chǔ)的、入門級的,也是最常用,最容易上手的工具了。想要學(xué)習(xí)數(shù)據(jù)分析的小伙伴可以選擇先從EXCEL入手,下面小編就給函數(shù),希望對各位小伙伴有所幫 ...
2020-06-23目前數(shù)據(jù)分析行業(yè)火熱,市面上的數(shù)據(jù)分析培訓(xùn)機構(gòu)和課程也層出不窮,想要學(xué)習(xí)數(shù)據(jù)分析的小伙伴在選擇時一定要擦亮眼睛,選擇教學(xué)質(zhì)量,服務(wù)質(zhì)量都靠譜的機構(gòu)。CDA數(shù)據(jù)分析系統(tǒng)培訓(xùn),由經(jīng)管之家CDA數(shù)據(jù)分析研 ...
2020-06-222020年5月6日,人力資源和社會保障部發(fā)布《新職業(yè)—大數(shù)據(jù)工程技術(shù)人員就業(yè)景氣現(xiàn)狀分析報告》,報告顯示:預(yù)計2020年中國大數(shù)據(jù)行業(yè)人才需求規(guī)模將達210萬,2025年前大數(shù)據(jù)人才需求仍將保持30%—40%的增速,需求 ...
2020-06-22CDA(Certified Data Analyst),亦稱“CDA數(shù)據(jù)分析師”,指在互聯(lián)網(wǎng)、零售、金融、電信、醫(yī)療、旅游等行業(yè)專門從事數(shù)據(jù)的采集、清洗、處理、分析并能制作業(yè)務(wù)報告、提供決策的新型數(shù)據(jù)分析人才?!癈DA數(shù)據(jù)分析師認 ...
2020-06-22PCA在機器學(xué)習(xí)中很常用,是一種無參數(shù)的數(shù)據(jù)降維方法。PCA步驟: 將原始數(shù)據(jù)按列組成n行m列矩陣X 將X的每一行(代表一個屬性字段)進行零均值化,即減去這一行的均值 求出協(xié)方差矩陣 求 ...
2020-06-16注明:本文章所有代碼均來自scikit-learn官方網(wǎng)站 在實際情況中,如果一個模型要上線,數(shù)據(jù)分析員需要反復(fù)調(diào)試模型,以防止模型僅在已知數(shù)據(jù)集的表現(xiàn)較好,在未知數(shù)據(jù)集上的表現(xiàn)較差。即要確保模型的泛化能力 ...
2020-06-16在翻譯sklearn文檔 2.無監(jiān)督學(xué)習(xí) 部分過程中,發(fā)現(xiàn)協(xié)方差矩陣幾乎貫穿整個章節(jié),但sklearn指導(dǎo)手冊把協(xié)方差部分放在了這一章節(jié)偏后的部分,作為機器學(xué)習(xí)一個基礎(chǔ)概念,在這篇文章中,想把協(xié)方差矩陣的相關(guān)知識以及 ...
2020-06-16剛剛接觸pandas的朋友,想了解數(shù)據(jù)結(jié)構(gòu),就一定要認識DataFrame,接下來給大家詳細介紹! 初識pandas數(shù)據(jù)結(jié)構(gòu):DataFrame import numpy as np import pandas as pd data = {\"name\": [\"Jack\", \"Tom\ ...
2020-06-12異常值檢測一般要求新發(fā)現(xiàn)的數(shù)據(jù)是否與現(xiàn)有觀測數(shù)據(jù)具有相同的分布或者不同的分布,相同的分布可以稱之為內(nèi)點(inlier),具有不同分布的點可以稱之為離群值。離群點和新奇點檢測是不同的,有一個重要的區(qū)分必須掌 ...
2020-06-12異常值檢測一般要求新發(fā)現(xiàn)的數(shù)據(jù)是否與現(xiàn)有觀測數(shù)據(jù)具有相同的分布或者不同的分布,相同的分布可以稱之為內(nèi)點(inlier),具有不同分布的點可以稱之為離群值。 下圖是一個使用支持向量機SVM進行新奇點檢測 ...
2020-06-12K-means算法旨在選擇一個質(zhì)心, 能夠最小化慣性或簇內(nèi)平方和的標(biāo)準(zhǔn): K-means算法原理分析 首先隨機選取K個初始質(zhì)心,最基本的方法是從數(shù)據(jù)集$X$中選擇$K$個樣本。 將每 ...
2020-06-10訓(xùn)練與驗證損失驟升:機器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11