99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話：13121318867

登錄

首頁精彩閱讀全文2500字，詳解Pandas與Lambda結(jié)合進行高效數(shù)據(jù)分析

全文2500字，詳解Pandas與Lambda結(jié)合進行高效數(shù)據(jù)分析

2021-12-22

作者：俊欣

來源：關(guān)于數(shù)據(jù)分析與可視化

今天小編打算稍微中規(guī)中矩一些，寫一篇技術(shù)類的干貨文章。

這篇文章小編來講講lambda方法以及它在pandas模塊當中的運用，熟練掌握可以極大地提高數(shù)據(jù)分析與挖掘的效率

導入模塊與讀取數(shù)據(jù)

我們第一步需要導入模塊以及數(shù)據(jù)集

import pandas as pd

df = pd.read_csv("IMDB-Movie-Data.csv")
df.head()

創(chuàng)建新的列

一般我們是通過在現(xiàn)有兩列的基礎上進行一些簡單的數(shù)學運算來創(chuàng)建新的一列，例如

df['AvgRating'] = (df['Rating'] + df['Metascore']/10)/2

但是如果要新創(chuàng)建的列是經(jīng)過相當復雜的計算得來的，那么lambda方法就很多必要被運用到了，我們先來定義一個函數(shù)方法

def custom_rating(genre,rating): if 'Thriller' in genre: return min(10,rating+1) elif 'Comedy' in genre: return max(0,rating-1) elif 'Drama' in genre: return max(5, rating-1) else: return rating

我們對于不同類別的電影采用了不同方式的評分方法，例如對于“驚悚片”，評分的方法則是在“原來的評分+1”和10分當中取一個最小的，而對于“喜劇”類別的電影，則是在0分和“原來的評分-1”當中取一個最大的，然后我們通過apply方法和lambda方法將這個自定義的函數(shù)應用在這個DataFrame數(shù)據(jù)集當中

df["CustomRating"] = df.apply(lambda x: custom_rating(x['Genre'], x['Rating']), axis = 1)

我們這里需要說明一下axis參數(shù)的作用，其中axis=1代表跨列而axis=0代表跨行，如下圖所示

全文2500字，詳解Pandas與Lambda結(jié)合進行高效數(shù)據(jù)分析

篩選數(shù)據(jù)

在pandas當中篩選數(shù)據(jù)相對來說比較容易，可以用到& | ~這些操作符，代碼如下

# 單個條件，評分大于5分的 df_gt_5 = df[df['Rating']>5] # 多個條件: AND - 同時滿足評分高于5分并且投票大于100000的 And_df = df[(df['Rating']>5) & (df['Votes']>100000)] # 多個條件: OR - 滿足評分高于5分或者投票大于100000的 Or_df = df[(df['Rating']>5) | (df['Votes']>100000)] # 多個條件：NOT - 將滿足評分高于5分或者投票大于100000的數(shù)據(jù)排除掉 Not_df = df[~((df['Rating']>5) | (df['Votes']>100000))]

這些都是非常簡單并且是常見的例子，但是要是我們想要篩選出電影的影名長度大于5的部分，要是也采用上面的方式就會報錯

df[len(df['Title'].split(" "))>=5]

output

AttributeError: 'Series' object has no attribute 'split'

這里我們還是采用apply和lambda相結(jié)合，來實現(xiàn)上面的功能

#創(chuàng)建一個新的列來存儲每一影片名的長度 df['num_words_title'] = df.apply(lambda x : len(x['Title'].split(" ")),axis=1) #篩選出影片名長度大于5的部分 new_df = df[df['num_words_title']>=5]

當然要是大家覺得上面的方法有點繁瑣的話，也可以一步到位

new_df = df[df.apply(lambda x : len(x['Title'].split(" "))>=5,axis=1)]

例如我們想要篩選出那些影片的票房低于當年平均水平的數(shù)據(jù)，可以這么來做。

我們先要對每年票房的的平均值做一個歸總，代碼如下

year_revenue_dict = df.groupby(['Year']).agg({'Revenue(Millions)':np.mean}).to_dict()['Revenue(Millions)']

然后我們定義一個函數(shù)來判斷是否存在該影片的票房低于當年平均水平的情況，返回的是布爾值

def bool_provider(revenue, year): return revenue
 然后我們通過結(jié)合apply方法和lambda方法應用到數(shù)據(jù)集當中去 
						

new_df = df[df.apply(lambda x : bool_provider(x['Revenue(Millions)'],
                                              x['Year']),axis=1)]
 我們篩選數(shù)據(jù)的時候，主要是用.loc方法，它同時也可以和lambda方法聯(lián)用，例如我們想要篩選出評分在5-8分之間的電影以及它們的票房，代碼如下 
					
df.loc[lambda x: (x["Rating"] > 5) & (x["Rating"] < 8)][["Title", "Revenue (Millions)"]] 

	轉(zhuǎn)變指定列的數(shù)據(jù)類型
				
 通常我們轉(zhuǎn)變指定列的數(shù)據(jù)類型，都是調(diào)用astype方法來實現(xiàn)的，例如我們將“Price”這一列的數(shù)據(jù)類型轉(zhuǎn)變成整型的數(shù)據(jù)，代碼如下 
					
df['Price'].astype('int')
 會出現(xiàn)如下所示的報錯信息 
				
ValueError: invalid literal for int() with base 10: '12,000' 
 因此當出現(xiàn)類似“12,000”的數(shù)據(jù)的時候，調(diào)用astype方法實現(xiàn)數(shù)據(jù)類型轉(zhuǎn)換就會報錯，因此我們還需要將到apply和lambda結(jié)合進行數(shù)據(jù)的清洗，代碼如下 
					
df['Price'] = df.apply(lambda x: int(x['Price'].replace(',', '')),axis=1)

	方法調(diào)用過程的可視化
						
 有時候我們在處理數(shù)據(jù)集比較大的時候，調(diào)用函數(shù)方法需要比較長的時間，這個時候就需要有一個要是有一個進度條，時時刻刻向我們展示數(shù)據(jù)處理的進度，就會直觀很多了。 
							
 這里用到的是tqdm模塊，我們將其導入進來 
						
from tqdm import tqdm, tqdm_notebook
tqdm_notebook().pandas()
 然后將apply方法替換成progress_apply即可，代碼如下 
							
df["CustomRating"] = df.progress_apply(lambda x: custom_rating(x['Genre'],x['Rating']),axis=1)
 output 
						
  
							

	當lambda方法遇到if-else
								
 當然我們也可以將if-else運用在lambda自定義函數(shù)當中，代碼如下 
									
Bigger = lambda x, y : x if(x > y) else y
Bigger(2, 10)
 output 
								
10 
 當然很多時候我們可能有多組if-else，這樣寫起來就有點麻煩了，代碼如下 
									
df['Rating'].apply(lambda x:"低分電影" if x < 3 else ("中等電影" if x>=3 and x < 5 else("高分電影" if x>=8 else "值得觀看")))
 看上去稍微有點凌亂了，這個時候，小編這里到還是推薦大家自定義函數(shù)，然后通過apply和lambda方法搭配使用

CDA數(shù)據(jù)分析師考試相關(guān)入口一覽（建議收藏）：

? 想報名CDA認證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學習CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

python pandas 數(shù)據(jù)類型數(shù)據(jù)分析 DataFrame 數(shù)據(jù)處理 Series

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇干貨 | 數(shù)據(jù)分析實戰(zhàn)案例——用戶行為預測

下一篇多圖預警！2021年最驚艷的數(shù)據(jù)可視化作品都在這兒了

CDA報考指南

報考流程
考試時間
報名費用
聯(lián)系我們

數(shù)據(jù)分析學習

數(shù)據(jù)分析師資訊

京公網(wǎng)安備 11010802034615號經(jīng)營許可證編號：京B2-20210330

聯(lián)系電話：13321103290 (微信同號)

CDA教材
CDA題庫
CDA大綱

客服在線

立即咨詢

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗證后自動注冊

') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1：配置參數(shù) // 參數(shù)2：回調(diào)，回調(diào)的第一個參數(shù)驗證碼對象，之后可以使用它調(diào)用相應的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須，不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式，包括：float，popup width: "280px", https: true // 更多配置參數(shù)說明請參見：http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'！'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'！'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

全文2500字，詳解Pandas與Lambda結(jié)合進行高效數(shù)據(jù)分析

導入模塊與讀取數(shù)據(jù)

創(chuàng)建新的列

篩選數(shù)據(jù)

轉(zhuǎn)變指定列的數(shù)據(jù)類型

方法調(diào)用過程的可視化

當lambda方法遇到if-else

數(shù)據(jù)分析師考試動態(tài)

CDA報考指南

數(shù)據(jù)分析學習

數(shù)據(jù)分析師資訊

【CDA干貨】SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換 ...

【CDA干貨】MySQL 大表拆分與關(guān)聯(lián)查詢效率：打破 “ ...

CDA 數(shù)據(jù)分析師：表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用 ...

【CDA干貨】DSGE 模型中的 Et：理性預期算子的內(nèi)涵 ...

【CDA干貨】Python 提取 TIF 中地名的完整指南 ...

CDA 數(shù)據(jù)分析師：解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 ...

【CDA干貨】Excel 導入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗與 t 檢驗：差異、適用 ...

CDA 數(shù)據(jù)分析師：掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè) ...

【CDA干貨】MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解 ...

【CDA干貨】解析 Python 中 Response 對象的 text ...

CDA 數(shù)據(jù)分析師：激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 ...

【CDA干貨】Python HTTP 請求工具對比：urllib.requ ...

【CDA干貨】解決 pd.read\_csv 讀取長浮點數(shù)據(jù)的科 ...

CDA 數(shù)據(jù)分析師：業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu) ...

【CDA干貨】用 SQL 驗證業(yè)務邏輯：從規(guī)則拆解到數(shù)據(jù) ...

【CDA干貨】塔吉特百貨孕婦營銷案例：數(shù)據(jù)驅(qū)動下的 ...

CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析：概念辨析與 ...

【CDA干貨】Excel 數(shù)據(jù)聚類分析：從操作實踐到業(yè)務 ...

【CDA干貨】統(tǒng)計模型的核心目的：從數(shù)據(jù)解讀到?jīng)Q策 ...

CDA教育閉環(huán)

常見問題

關(guān)于我們

CDA數(shù)據(jù)分析師公眾號

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

全文2500字，詳解Pandas與Lambda結(jié)合進行高效數(shù)據(jù)分析

導入模塊與讀取數(shù)據(jù)

創(chuàng)建新的列

篩選數(shù)據(jù)

轉(zhuǎn)變指定列的數(shù)據(jù)類型

方法調(diào)用過程的可視化

當lambda方法遇到if-else

數(shù)據(jù)分析師考試動態(tài)

CDA報考指南

數(shù)據(jù)分析學習

數(shù)據(jù)分析師資訊

【CDA干貨】SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換 ...

【CDA干貨】MySQL 大表拆分與關(guān)聯(lián)查詢效率：打破 “ ...

CDA 數(shù)據(jù)分析師：表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用 ...

【CDA干貨】DSGE 模型中的 Et：理性預期算子的內(nèi)涵 ...

【CDA干貨】Python 提取 TIF 中地名的完整指南 ...

CDA 數(shù)據(jù)分析師：解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 ...

【CDA干貨】Excel 導入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗與 t 檢驗：差異、適用 ...

CDA 數(shù)據(jù)分析師：掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè) ...

【CDA干貨】MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解 ...

【CDA干貨】解析 Python 中 Response 對象的 text ...

CDA 數(shù)據(jù)分析師：激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 ...

【CDA干貨】Python HTTP 請求工具對比：urllib.requ ...

【CDA干貨】解決 pd.read\_csv 讀取長浮點數(shù)據(jù)的科 ...

CDA 數(shù)據(jù)分析師：業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu) ...

【CDA干貨】用 SQL 驗證業(yè)務邏輯：從規(guī)則拆解到數(shù)據(jù) ...

【CDA干貨】塔吉特百貨孕婦營銷案例：數(shù)據(jù)驅(qū)動下的 ...

CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析：概念辨析與 ...

【CDA干貨】Excel 數(shù)據(jù)聚類分析：從操作實踐到業(yè)務 ...

【CDA干貨】統(tǒng)計模型的核心目的：從數(shù)據(jù)解讀到?jīng)Q策 ...

CDA教育閉環(huán)

常見問題

關(guān)于我們

CDA數(shù)據(jù)分析師公眾號

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

全文2500字，詳解Pandas與Lambda結(jié)合進行高效數(shù)據(jù)分析

【CDA干貨】Excel 導入數(shù)據(jù)含缺失值？詳解 dropna ...