1.1 關于數(shù)據分析
(1) 定義:根據方法論的指導,使用數(shù)據分析軟件實現(xiàn)數(shù)據價值發(fā)現(xiàn)
(2) 目的:記錄業(yè)務軌跡,為未來業(yè)務決策提供參考及思考
(3) 分類:
分類 | 區(qū)分 | 工作內容 | 工具 |
業(yè)務數(shù)據分析 | 1、對歷史數(shù)據的分析、發(fā)現(xiàn) 2、對數(shù)據的分類匯總 | 1、描述性分析 2、數(shù)據透視 3、可視化圖表 | Excel、SQL、可視化軟件 |
數(shù)據挖掘 | 1、建模預測數(shù)據 2、用業(yè)務來解釋結果的含義 | 1、協(xié)同過濾 2、分類分析 3、關聯(lián)分析等 | Python、SPSS、SAS、R |
大數(shù)據分析 | 1、優(yōu)化代碼、代碼參數(shù)化 2、實現(xiàn)段時間內千萬級數(shù)據展示 | 1、Hadoop大數(shù)據平臺 2、數(shù)據整理 3、建模、分析與展示 | Hadoop、Spark等 |
(4)數(shù)據分析項目中參與的角色與其相對應的負責事項
(5)數(shù)據分析流程
1.2 Excel 常用函數(shù)
(1)常用函數(shù)-總表
序號 | 函數(shù)類別 | 分序號 | 函數(shù)名稱 | 用 途 |
1 | 數(shù)學 | 1.1 | SUM(number1,number2,…) | 計算某個目標區(qū)域中單元格里數(shù)字的總和 |
1.2 | ROUND(number,num_digits) | 設定指定位數(shù),按此位數(shù)對目標數(shù)字進行四舍五入取整 | ||
1.3 | MOD(number,divisor) | 對目標值除以指定數(shù)后的余數(shù),余數(shù)的符號和除數(shù)相同。 | ||
1.4 | INT(number) | 對目標數(shù)字進行舍入處理,處理的結果是得到小于目標數(shù)的最大整數(shù) | ||
1.5 | ROUNDUP(number,num_digits) | 對目標數(shù)字按照指定的條件進行舍入處理 | ||
1.6 | ROUNDDOWN(number,num_digits) | 對目標數(shù)字按照指定的條件進行舍去處理 | ||
2 | 查詢和引用 | 2.1 | VLOOKUP(lookup_value,table_array,col_index_num,range_lookup) | 在給定區(qū)域的首列里查找目標數(shù)值,然后返回目標數(shù)值所在行里某一列的相關值。 |
2.2 | COLUMN(reference) | 返回目標單元格或單元格區(qū)域(可返回列序號) | ||
2.3 | ROW(reference) | 返回目標單元格或單元格區(qū)域 的行序號 | ||
2.4 | INDEX(array,row_num,column_num) | 按照相關條件返回目標區(qū)域里的值 | ||
2.5 | OFFSET(reference,rows,cols,height,width) | 將給定的區(qū)域作為目標引用區(qū)域,同時設定一個偏移量,然后依據該偏移量得到新的引用,最終的結果包括單元格和單元格區(qū)域的形式。 | ||
3 | 文本 | 3.1 | MID(text,start_num,num_chars) | 在目標字符串中指定一個開始位置,按設定的數(shù)值返回該字符串中的相應數(shù)目字符內容。 |
3.2 | LEN(text) | 計算目標字符中的字符數(shù) | ||
3.3 | LEFT(text,num_chars) | 從字符串的左側開始,按照指定的數(shù)值返回相應數(shù)目的字符內容。 | ||
3.4 | RIGHT(text,num_chars) | 從字符串的右側開始,按指定的數(shù)值返回相應數(shù)目的字符內容。 | ||
4 | 統(tǒng)計 | 4.1 | COUNTIF(range,criteria) | 在目標區(qū)域中統(tǒng)計滿足預設條件的單元格數(shù)目。 |
4.2 | SUMIF(range,criteria,[sum_range]) | 在目標區(qū)域中對滿足條件的單元格求和。 | ||
5 | 日期和時間 | 5.1 | YEAR(serial_number) | 返回給定日期所屬的年份 |
5.2 | MONTH(serial_number) | 返回給定日期所屬的月份 | ||
5.3 | DAY(serial_number) | 返回給定日期所屬的天數(shù) | ||
5.4 | NOW() | 顯示系統(tǒng)當前的日期和時間 | ||
5.5 | TODAY() | 顯示系統(tǒng)當前的日期 | ||
5.6 | NETWORKDAYS(start_date,end_date,holidays) | 計算兩個給定參數(shù)間的工作日數(shù)值 | ||
5.7 | EOMONTH(start_date,months) | 給定一個起始日期,再輔以一個指定數(shù)字,將起始日期的月份向前或向后撥運該數(shù)字大小距離,最后返回所得月份的最后一天日期。 | ||
5.8 | WEEKDAY(start_date,return_type) | 根據返回規(guī)則返回某個日期對應的星期數(shù)。 | ||
6 | 邏輯 | 6.1 | IF(logical test,value if true,value if false) | 用于對目標區(qū)域進行判斷,返回真假邏輯值,據此輸出相應的結果。 |
6.2 | AND(logical1,logical2,…) | 對指定區(qū)域內的邏輯值進行判斷,當邏輯值都為TRUE時返回TRUE,否則返回FALSE | ||
6.3 | OR(logical1,logical2,…) | 對指定區(qū)域內的邏輯值進行判斷,當邏輯值任意一個為TRUE時返回TRUE,否則返回FALSE |
(2)COUNTIF與COUNTIFS函數(shù)
a.在填寫判斷邏輯時,如果含有大于、小于時,需要將這兩個符號放進""里面
b.COUNTIFS函數(shù)中條件1與條件2是“且”的關系
c.COUNTIFS函數(shù)中條件1與條件2的條件區(qū)域必須一致
d.若想要用COUNTIF與COUNTIFS來表達“或”的關系,可以用OR輔助或者用(全量-“且”部分值)
(3)累計求和-SUM
業(yè)務場景:每月的銷售目標疊加
公式:=SUM($B$2:$B2)——將起始單元格固定,后面的單元格固定行或者固定列
(4)SUMIF與SUMIFS函數(shù)
a.SUMIF:條件區(qū)域、條件、求和區(qū)域(注:當求和區(qū)域和條件區(qū)域一致的話可以不填,但不一致的情況下必須填寫)
b.SUMIFS:求和區(qū)域、條件區(qū)域1、條件1、條件區(qū)域2、條件2……
注意這兩個公式的參數(shù)順序
(5)條件格式:以選擇區(qū)域中左上角單元格為起始單元格、自帶填充柄功能、
a.突出顯示單元格規(guī)則:單元格值介于x和x之間,介于是指左閉右閉區(qū)間
b.使用公式確定:第二列值大于第一列【=$H10>$G10】
c.使用公式確定:單元格值為奇數(shù)【=MOD(G3,2)=1】
d.使用公式確定:偶數(shù)行加顏色【=MOD(ROW($J10),2)=0】(該偶數(shù)行是指Excel中的行號)
e.數(shù)據條:所選區(qū)域中的最大值設為滿格,以此為基準調整其他單元格的數(shù)據條長度
f.色階圖:單元格的顏色深淺由其數(shù)據大小決定,一般值由小到大則顏色就由淺及深
g.圖標集:一般將區(qū)域數(shù)據劃分為三類,有四種類型可選擇
數(shù)字:建議使用此類型,以原值來進行比較,遇到百分比數(shù)字,用小數(shù)點表示
百分比:計算公式為(當前單元格-最小值)/(最大值-最小值)
公式:輸入對應的公式
百分點值:計算公式=PERCENTILE(array,K)
注意:數(shù)據條和色階圖一般可以用來做熱力圖
(6)日期時間類函數(shù)
函數(shù) | 功能 | 輸入 | 輸出 | 輸出結果 |
year | 獲取指定日期的年 | 標準日期型 | 數(shù)值型 | 2020 |
month | 獲取指定日期的月 | 標準日期型 | 數(shù)值型 | 11 |
day | 獲取指定日期的日 | 標準日期型 | 數(shù)值型 | 15 |
today | 獲取系統(tǒng)當前日期 | 標準日期型 | 2020/6/30 | |
now | 獲取系統(tǒng)當前日期和時間 | 標準日期時間型 | 2020/6/30 23:39:21 | |
date | 返回標準日期格式的時間序列 | 數(shù)值型 | 標準日期型 | 2019/11/1 |
eomonth | 獲取指定日期所在月(或前后月)的最后一天 | 標準日期型 | 標準日期型 | 2020/6/30 |
weekday | 獲取指定日期的星期數(shù) | 標準日期型 | 數(shù)值型 | 2 |
networkdays | 返回兩個日期之間的完整工作日數(shù) | 標準日期型-date函數(shù) | 數(shù)值型 | 21 |
注意:1.EOMONTH函數(shù):months參數(shù)需要注意
0:表示當前月的最后一天
-1:之前一個月的最后一天
1:之后一個月的最后一天
2.WEEKDAY函數(shù):return_type默認為1,則表示1-7為本周日至下周六
3.NETWORKDAYS函數(shù):如果計算時間區(qū)間中有節(jié)假日,該公式支持計算,但需要額外準備節(jié)假日的數(shù)據
(7)補充:
a.單元格自定義:當格式自定義為:0"漢字",此時該單元格輸入的是數(shù)字型,可以參與計算
b.隨機函數(shù):=RANDBETWEEN(bottom,top)





