原文來源|cloudera 譯文來源|開源中國社區(qū) 最近,我加入了Cloudera,在這之前,我在計算生物學/基因組學上已經(jīng)工作了差不多10年。我的分析工作主要是利用Python語言和它很棒的科學計算棧來進行的。但ApacheH ...
2015-12-29用戶研究定量分析要讓數(shù)據(jù)來說話 無論是產品經(jīng)理、設計師、工程師,大家都是為用戶服務的。用戶各有所好。你喜歡這個,我喜歡那個,也有我們都喜歡的。那么在用戶的心理隱藏著什么樣的秘密呢?要想發(fā)現(xiàn)其中的奧 ...
2015-12-29網(wǎng)站運營數(shù)據(jù)分析之術語解釋 做為網(wǎng)站運營、產品經(jīng)理、交互設計師等職位,經(jīng)常要對網(wǎng)站的一些運營數(shù)據(jù)做分析,那么這些公式是如何計算的,每個術語又代表什么意思呢? 一、網(wǎng)站運營數(shù)據(jù)分析之內容指 ...
2015-12-29數(shù)據(jù)分析用戶需要什么數(shù)據(jù) 這里首先需要說明的是標題中的“用戶”指的是數(shù)據(jù)的用戶,或者數(shù)據(jù)的需求方,這些用戶往往不是網(wǎng)站或企業(yè)面向的外部用戶,數(shù)據(jù)的消費者通常是公司內部各個部門和領域的人員。 為什 ...
2015-12-29游戲運營的數(shù)據(jù)分析 這幾天一直在看如何展開數(shù)據(jù)分析文章,大家寫的都不錯,說實話,針對如何展開游戲運營數(shù)據(jù)分析的指導真的非常少,作為每個公司的核心機密是不會拿到臺面上與大家分享的,一段時期我上網(wǎng)看了 ...
2015-12-29如何統(tǒng)計和分析利用網(wǎng)絡大數(shù)據(jù)? 大數(shù)據(jù)給互聯(lián)網(wǎng)帶來的是空前的信息大爆炸,它不僅改變了互聯(lián)網(wǎng)的數(shù)據(jù)應用模式,還將深深影響著人們的生產生活。深處在大數(shù)據(jù)時代中,人們認識到大數(shù)據(jù)已經(jīng)將數(shù)據(jù)分析的認識從“ ...
2015-12-29大數(shù)據(jù)的五點思考 大數(shù)據(jù)不在乎體量有多少,而是背后用它的那個大腦。實則大眾對大數(shù)據(jù)依然存在不少誤解。劉得寰教授在微博上發(fā)表了其對大數(shù)據(jù)的五點思考(后續(xù)可能還有更新),對近期大數(shù)據(jù)被大眾捧為瑰寶的 ...
2015-12-29交互設計師如何培養(yǎng)數(shù)據(jù)分析的能力呢 面對一大堆看似雜亂的數(shù)據(jù),如何進行信息提取與數(shù)據(jù)加工,從中獲取自己想要的信息,并應用這些信息,有理有據(jù)的進行需求的討論、最終設計決策的推進,這是每一個交互設計師 ...
2015-12-29數(shù)據(jù)分析-時間序列的趨勢分析 無論是網(wǎng)站分析工具、BI報表或者數(shù)據(jù)的報告,我們很難看到數(shù)據(jù)以孤立的點單獨地出現(xiàn),通常數(shù)據(jù)是以序列、分組等形式存在,理由其實很簡單,我們沒法從單一的數(shù)據(jù)中發(fā)現(xiàn)什么,用于 ...
2015-12-29數(shù)據(jù)分析、機器學習與物聯(lián)網(wǎng) 我們當前所處的世界,聯(lián)網(wǎng)程度不斷上升,低成本傳感器和分布式智能也在不斷普及,產業(yè)即將面臨這一切帶來的革命性的沖擊;同時,在此過程中還會產生大量的數(shù)據(jù),其規(guī)模將龐大到 ...
2015-12-29車聯(lián)網(wǎng)談物流O2O三大關鍵詞:產業(yè)鏈、大數(shù)據(jù)、生態(tài)化 自國務院總理李克強提出互聯(lián)網(wǎng)+以來,越來越多的傳統(tǒng)行業(yè)開始擁抱互聯(lián)網(wǎng),而O2O則是被采用最為普遍的模式之一。2013年以來,傳統(tǒng)行業(yè)向互聯(lián)網(wǎng)轉型的企業(yè)和 ...
2015-12-29asp.net生成Excel并導出下載五種實現(xiàn)方法 有關Excel下載的文章網(wǎng)上想必有很多,利用閑暇時間整理了一些有Excel下載方法的文章,接下來介紹五種實現(xiàn)Excel下載的方法,感興趣的朋友可以了解下,或許對你學習Exce ...
2015-12-28excel if函數(shù)怎么用?excel中if函數(shù)的使用方法圖文詳解 excel中的if函數(shù)的主要用途是執(zhí)行邏輯判斷,它可以根據(jù)邏輯表達式的真假,返回不同的結果,從而執(zhí)行數(shù)值或公式的條件檢測任務,那么excel if函數(shù)怎么用呢 ...
2015-12-28別落后了,開始你的第一方數(shù)據(jù)分析 一、有哪些第一方數(shù)據(jù)? 我們常說數(shù)據(jù)驅動決策,首要的就是選擇利用什么數(shù)據(jù),今天這里主要探討的就是用“第一方數(shù)據(jù)”來驅動決策。第一方數(shù)據(jù)簡單來理解就是自有數(shù) ...
2015-12-28數(shù)據(jù)分析面試題:如何從10億查詢詞找出出現(xiàn)頻率最高的10個? 1. 問題描述 在大規(guī)模數(shù)據(jù)處理中,常遇到的一類問題是,在海量數(shù)據(jù)中找出出現(xiàn)頻率最高的前K個數(shù),或者從海量數(shù)據(jù)中找出最大的前K個數(shù),這類問題通 ...
2015-12-28打贏人腦的大數(shù)據(jù) 大數(shù)據(jù)的出現(xiàn),將不可能變成可能!事實上,大數(shù)據(jù)的威力不在于數(shù)據(jù)本身,而在于所帶來的機器智能,期望它能夠如人類的大腦一樣運作,能根據(jù)分析結果給出最優(yōu)化的解決辦法。 1996 ...
2015-12-28大數(shù)據(jù)具海量規(guī)模 大數(shù)據(jù)(Big Data),或稱巨量數(shù)據(jù)、海量數(shù)據(jù)、大資料,指的是所涉及的數(shù)據(jù)量規(guī)模巨大到無法透過人工,在合理時間內達到擷取、管理、處理、并整理成為人類所能解讀的形式的資訊。一般而 ...
2015-12-28數(shù)據(jù)是企業(yè)未來核心資產,數(shù)據(jù)就是價值 近年來,無論商界還是政界,對大數(shù)據(jù)的高度關注與價值利用表現(xiàn)得越來越熱切。大數(shù)據(jù)概念火熱的背后,折射出在市場競爭相對飽和的新時期,企業(yè)獲取新客戶比 維護老客戶的 ...
2015-12-28那么多大數(shù)據(jù)公司“買數(shù)據(jù)” 怎么保護數(shù)據(jù)隱私? 數(shù)據(jù)是什么?是金子,也就是錢啊! 最近統(tǒng)計來看,全國已經(jīng)有三百多家大數(shù)據(jù)公司,但在大數(shù)據(jù)發(fā)展初期這個情況下,國內大數(shù)據(jù)交易的現(xiàn)狀是:供不應求 ...
2015-12-28大數(shù)據(jù)分析:O2O專車司機究竟是一群怎樣的人 近兩年來,互聯(lián)網(wǎng)技術不斷深入社會生活的各個層面,為時代發(fā)展注入新的活力?!盎ヂ?lián)網(wǎng)+交通”領域出現(xiàn)的出行服務軟件顯現(xiàn)出強大的活力,“專車”“快車”“順風車” ...
2015-12-28訓練與驗證損失驟升:機器學習訓練中的異常診斷與解決方案 在機器學習模型訓練過程中,“損失曲線” 是反映模型學習狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11