pandas.merge的簡(jiǎn)單用法怎么用?有小伙伴知道嗎?







1.merge函數(shù)的參數(shù)一覽表
2.創(chuàng)建兩個(gè)DataFrame
3.pd.merge()方法設(shè)置連接字段。
默認(rèn)參數(shù)how是inner內(nèi)連接,并且會(huì)按照相同的字段key進(jìn)行合并,即等價(jià)于on=‘key’。
也可以顯示的設(shè)置on=‘key’,這里也推薦這么做。
當(dāng)兩邊合并字段不同時(shí),可以使用left_on和right_on參數(shù)設(shè)置合并字段。當(dāng)然這里合并字段都是key所以left_on和right_on參數(shù)值都是key。
4.pd.merge()方法設(shè)置連接方法。
主要包括inner(內(nèi)連接)、outer(外鏈接)、left(左連接)、right(右連接)。
參數(shù)how默認(rèn)值是inner內(nèi)連接,上面的都是采用內(nèi)連接,連接兩邊都有的值。
當(dāng)采用outer外連接時(shí),會(huì)取并集,并用NaN填充。
外連接其實(shí)左連接和右連接的并集。左連接是左側(cè)DataFrame取全部數(shù)據(jù),右側(cè)DataFrame匹配左側(cè)DataFrame。(右連接right和左連接類似)
5.pd.merge()方法索引連接,以及重復(fù)列名命名。
pd.merge()方法可以通過設(shè)置left_index或者right_index的值為True來(lái)使用索引連接,例如這里df1使用data1當(dāng)連接關(guān)鍵字,而df2使用索引當(dāng)連接關(guān)鍵字。
從上面可以發(fā)現(xiàn)兩個(gè)DataFrame中都有key列,merge合并之后,pandas會(huì)自動(dòng)在后面加上(_x,_y)來(lái)區(qū)分,我們也可以通過設(shè)置suffixes來(lái)設(shè)置名字。