
作者 | 吹牛Z
來源 | 數(shù)據(jù)不吹牛
據(jù)某數(shù)據(jù)來源統(tǒng)計,學習了Pandas的同學,有超過60%仍然投向了Excel的懷抱,之所以做此下策,多半是因為剛開始用Python處理數(shù)據(jù)時,選擇想要的行和列實在太痛苦,完全沒有Excel想要哪里點哪里的快感。
初識Pandas最基礎的列向索引在這里就不多加介紹了,今天我們給大家介紹的是,結合場景詳細介紹兩種常用的索引方式:
首先,簡單介紹一下練習的案例數(shù)據(jù):
和第一篇數(shù)據(jù)集一樣,記錄著不同流量來源下,各渠道來源明細所對應的訪客數(shù)、支付轉化率和客單價。數(shù)據(jù)集雖然簡短(復雜的案例數(shù)據(jù)集在基礎篇完結后會如約而至),但是有足夠的代表性,下面開始我們索引的表演。
01 基于位置(數(shù)字)的索引
先看一下索引的操作方式:
我們需要根據(jù)實際情況,填入對應的行參數(shù)和列參數(shù)。
場景一(行選?。?/span>
目標:選擇“流量來源”等于“一級”的所有行。
思路:手指戳屏幕數(shù)一數(shù),一級的渠道,是從第1行到第13行,對應行索引是0-12,但Python切片默認是含首不含尾的,要想選取0-12的索引行,我們得輸入“0:13”,列想要全部選取,則輸入冒號“:”即可。
場景二(列選?。?/span>
目標:我們想要把所有渠道的流量來源和客單價單拎出來看一看。
思路:所有流量渠道,也就是所有行,在第一個行參數(shù)的位置我們輸入“:”;再看列,流量來源是第1列,客單價是第5列,對應的列索引分別是0和4:
值得注意的是,如果我們要跨列選取,得先把位置參數(shù)構造成列表形式,這里就是[0,4],如果是連續(xù)選取,則無需構造成列表,直接輸入0:5(選取索引為0的列到索引為4的列)就好。
場景三(行列交叉選取)
目標:我們想要看一看二級、三級流量來源、來源明細對應的訪客和支付轉化率
思路:先看行,二級三級渠道對應行索引是13:17,再次強調索引含首不含尾的原則,我們傳入的行參數(shù)是13:18;列的話我們需要流量來源、來源明細、訪客和轉化,也就是前4列,傳入?yún)?shù)0:4。
02 基于名稱(標簽)的索引
為了建立起橫向對比的體感,我們依然沿用上面三個場景。
場景一:選擇一級渠道的所有行。
思路:這次我們不用一個個數(shù)位置了,要篩選流量渠道為"一級"的所有行,只需做一個判斷,判斷流量來源這一列,哪些值等于"一級"。
返回的結果由True和False(布爾型)構成,在這個例子中分別代表結果等于一級和非一級。在loc方法中,我們可以把這一列判斷得到的值傳入行參數(shù)位置,Pandas會默認返回結果為True的行(這里是索引從0到12的行),而丟掉結果為False的行,直接上例子:
場景二:我們想要把所有渠道的流量來源和客單價單拎出來看一看。
思路:所有渠道等于所有行,我們在行參數(shù)位置直接輸入“:”,要提取流量來源和客單價列,直接輸入名稱到列參數(shù)位置,由于這里涉及到兩列,所以得用列表包起來:
場景三:我們想要提取二級、三級流量來源、來源明細對應的訪客和支付轉化率。
思路:行提取用判斷,列提取輸入具體名稱參數(shù)。
此處插播一條isin函數(shù)的廣告,這個函數(shù)能夠幫助我們快速判斷源數(shù)據(jù)中某一列(Series)的值是否等于列表中的值。拿案例來說,df['流量來源'].isin(['二級','三級']),判斷的是流量來源這一列的值,是否等于“二級”或者“三級”,如果等于(等于任意一個)就返回True,否則返回False。我們再把這個布爾型判斷結果傳入行參數(shù),就能夠很容易的得到流量來源等于二級或者三級的渠道。
既然loc的應用場景更加廣泛,應該給他加個雞腿,再來個接地氣的場景練練手。
插入場景之前,我們先花30秒的時間捋一捋Pandas中列(Series)向求值的用法,具體操作如下:
只需要加個尾巴,均值、標準差等統(tǒng)計數(shù)值就出來了,了解完這個,下面正式進入場景四。
場景四:對于流量渠道數(shù)據(jù),我們真正應該關注的是優(yōu)質渠道,假如這里我們定義訪客數(shù)、轉化率、客單價都高于平均值渠道是優(yōu)質渠道,那怎么找到這些渠道呢?
思路:優(yōu)質渠道,得同時滿足訪客、轉化、客單高于平均值這三個條件,這是解題的關鍵。
先看看均值各是多少:
再判斷各指標列是否大于均值:
要三個條件同時滿足,他們之間是一個“且”的關系(同時滿足),在pandas中,要表示同時滿足,各條件之間要用"&"符號連接,條件內部最好用括號區(qū)分;如果是“或”的關系(滿足一個即可),則用“|”符號連接:
這樣連接之后,返回True則表示該渠道同時滿足訪客、轉化率、客單價都高于均值的條件,接下來我們只需要把這些值傳入到行參數(shù)的位置。
到這一步,我們直接篩選出了4條關鍵指標都高于均值的優(yōu)質渠道。
這兩種索引方式,分別是基于位置(數(shù)字)的索引和基于名稱(標簽)的索引,關鍵在于把腦海中想要選取的行和列,映射到對應的行參數(shù)與列參數(shù)中去。
只要稍加練習,我們就能夠隨心所欲的用pandas處理和分析數(shù)據(jù),邁過了這一步之后,你會發(fā)現(xiàn)和Excel相比,Python是如此的美艷動人。
這是Python數(shù)據(jù)分析實戰(zhàn)基礎的第一篇內容,主要是和Pandas來個簡單的邂逅。已經(jīng)熟練掌握Pandas的同學,可以加快手速滑動瀏覽或者直接略過本文。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03