
Python中set與frozenset方法和區(qū)別詳解
set(可變集合)與frozenset(不可變集合)的區(qū)別:
set無序排序且不重復,是可變的,有add(),remove()等方法。既然是可變的,所以它不存在哈希值?;竟δ馨P系測試和消除重復元素. 集合對象還支持union(聯(lián)合), intersection(交集), difference(差集)和sysmmetric difference(對稱差集)等數(shù)學運算.
sets 支持 x in set, len(set),和 for x in set。作為一個無序的集合,sets不記錄元素位置或者插入點。因此,sets不支持 indexing, 或其它類序列的操作。
frozenset是凍結(jié)的集合,它是不可變的,存在哈希值,好處是它可以作為字典的key,也可以作為其它集合的元素。缺點是一旦創(chuàng)建便不能更改,沒有add,remove方法。
一、集合的創(chuàng)建
set()和 frozenset()工廠函數(shù)分別用來生成可變和不可變的集合。如果不提供任何參數(shù),默認會生成空集合。如果提供一個參數(shù),則該參數(shù)必須是可迭代的,即,一個序列,或迭代器,或支持
迭代的一個對象,例如:一個列表或一個字典。
>>> s=set('cheeseshop') 使用工廠方法創(chuàng)建
>>> s
{'h', 'c', 'o', 's', 'e', 'p'}
>>> type(s)
<type 'set'>
>>> s={'chessseshop','bookshop'}直接創(chuàng)建,類似于list的[]和dict的{},不同于dict的是其中的值,set會將其中的元素轉(zhuǎn)換為元組
>>> s
{'bookshop', 'chessseshop'}
>>> type(s)
<type 'set'>
不可變集合創(chuàng)建:
>>> t=frozenset('bookshop')
>>> t
frozenset({'h', 'o', 's', 'b', 'p', 'k'})
二、更新可變集合
用各種集合內(nèi)建的方法和操作符添加和刪除集合的成員:
>>> s.add('z') #添加
>>> s
set(['c', 'e', 'h', 'o', 'p', 's', 'z'])
>>> s.update('pypi') #添加
>>> s
set(['c', 'e', 'i', 'h', 'o', 'p', 's', 'y', 'z'])
>>> s.remove('z') #刪除
>>> s
set(['c', 'e', 'i', 'h', 'o', 'p', 's', 'y'])
>>> s -= set('pypi')#刪除
>>> s
set(['c', 'e', 'h', 'o', 's'])
>>> del s #刪除集合
只有可變集合能被修改。試圖修改不可變集合會引發(fā)異常。
>>> t.add('z')
Traceback (most recent call last):
File "<stdin>", line , in ?
AttributeError: 'frozenset' object has no attribute 'add'
三、成員關系 (in, not in)
>>> 'k' in s
False
>>> 'k' in t
True
>>> 'c' not in t
True
四、集合等價/不等價
>>> s == t
False
>>> s != t
True
>>> u = frozenset(s)
>>> s == u
True
>>> set('posh') == set('shop')
True
五、子集/超集
>>> set('shop') < set('cheeseshop')
True
>>> set('bookshop') >= set('shop')
True
六、遍歷訪問集合中的值(可變集合和非可變都支持)
>>> s=set('cheeseshop')
>>> s
{'h', 'c', 'o', 's', 'e', 'p'}
>>> for i in s:
print(i)
h
c
o
e
p
>>> t=frozenset('bookshop')
>>> t
frozenset({'h', 'o', 's', 'b', 'p', 'k'})
>>> for i in t:
print(i)
h
o
b
p
k
七、集合類型操作符(所有的集合類型)
1.聯(lián)合( | )
兩個集合的聯(lián)合是一個新集合,該集合中的每個元素都至少是其中一個集合的成員,即,屬于兩個集合其中之一的成員。聯(lián)合符號有一個等價的方法,union().
>>> s | t
set(['c', 'b', 'e', 'h', 'k', 'o', 'p', 's'])
2.交集( & )
你可以把交集操作比做集合的 AND(或合取)操作。兩個集合的交集是一個新集合,該集合中的每
個元素同時是兩個集合中的成員,即,屬于兩個集合的成員。交集符號有一個等價的方法,intersection()
>>> s & t
set(['h', 's', 'o', 'p']
3.差補/相對補集( – )
兩個集合(s 和 t)的差補或相對補集是指一個集合 C,該集合中的元素,只屬于集合 s,而不屬
于集合 t。差符號有一個等價的方法,difference().
>>> s - t
set(['c', 'e'])
4.對稱差分( ^ )
和其他的布爾集合操作相似, 對稱差分是集合的 XOR(又稱"異或 ").
兩個集合(s 和 t)的對稱差分是指另外一個集合 C,該集合中的元素,只能是屬于集合 s 或者集合 t
的成員,不能同時屬于兩個集合。對稱差分有一個等價的方法,symmetric_difference().
>>> s ^ t
set(['k', 'b', 'e', 'c'])
5.混合集合類型操作
上面的示例中,左邊的 s 是可變集合,而右邊的 t 是一個不可變集合. 注意上面使用集合操作
運算符所產(chǎn)生的仍然是可變集合,但是如果左右操作數(shù)的順序反過來,結(jié)果就不一樣了:
>>> t | s
frozenset(['c', 'b', 'e', 'h', 'k', 'o', 'p', 's'])
>>> t ^ s
frozenset(['c', 'b', 'e', 'k'])
>>> t - s frozenset(['k', 'b'])
如果左右兩個操作數(shù)的類型相同, 既都是可變集合或不可變集合, 則所產(chǎn)生的結(jié)果類型是相同的,但如果左右兩個操作數(shù)的類型不相同(左操作數(shù)是 set,右操作數(shù)是 frozenset,或相反情況),則所產(chǎn)生的結(jié)果類型與左操作數(shù)的類型相同。
八、可變集合類型的方法
s.update(t) 用 t 中的元素修改 s, 即,s 現(xiàn)在包含 s 或 t 的成員
s.intersection_update(t) s 中的成員是共同屬于 s 和 t 的元素。
s.difference_update(t) s 中的成員是屬于 s 但不包含在 t 中的元素
s.symmetric_difference_update(t) s 中的成員更新為那些包含在 s 或 t 中,但不 是 s和 t 共有的元素
s.add(obj) 在集合 s 中添加對象 obj
s.remove(obj) 從集合 s 中刪除對象 obj;如果 obj 不是集合 s 中的元素(obj not
in s),將引發(fā) KeyError 錯誤
s.discard(obj) 如果 obj 是集合 s 中的元素,從集合 s 中刪除對象 obj;
s.pop() 刪除集合 s 中的任意一個對象,并返回它
s.clear() 刪除集合 s 中的所有元素
九、集合類型操作符、函數(shù)和方法
函數(shù)/方法名 等價運算符 說明
所有集合類型:
len(s) 集合基數(shù): 集合 s 中元素的個數(shù)
set([obj]) 可變集合工廠函數(shù); obj 必須是支持迭代的,由 obj 中的元素創(chuàng)建集合,否則創(chuàng)建一個空集合
frozenset([obj]) 不可變集合工廠函數(shù); 執(zhí)行方式和 set()方法相同,但它返回的是不可變集合
obj in s 成員測試:obj 是 s 中的一個元素嗎?
obj not in s 非成員測試:obj 不是 s 中的一個元素嗎?
s == t 等價測試: 測試 s 和 t 是否具有相同的元素?
s != t 不等價測試: 與==相反
s < t (嚴格意義上)子集測試; s != t 而且 s 中 所 有 的元素都是 t 的成員
s.issubset(t) s <= t 子集測試(允許不嚴格意義上的子集): s 中所有的元素都是 t 的成員
s > t (嚴格意義上)超集測試: s != t 而且 t 中所有的元素都是 s 的成員
s.issuperset(t) s >= t 超集測試(允許不嚴格意義上的超集): t 中所有的元素 都是 s 的成員
s.union(t) s | t 合并操作: s 或 t 中的元素
s.intersec- tion(t) s & t 交集操作: s 和 t 中的元素
s.difference(t) s - t 差分操作: s 中的元素,而不是 t 中的元素
s.symmetric_difference(t)s ^ t 對稱差分操作:s 或 t 中的元素,但不是 s 和 t 共有的元素
s.copy() 復制操作:返回 s 的(淺復制)副本
僅用于可變集合:
s.update(t) s |= t (Union) 修改操作: 將 t 中的成員添加 s
s.intersection_update(t) s &= t 交集修改操作: s 中僅包括 s 和 t 中共有的成員
s.difference_update(t) s -= t 差修改操作: s 中包括僅屬于 s 但不屬于 t 的成員
s.symmetric_
difference_
update(t) s ^= t 對稱差分修改操作: s 中包括僅屬于 s 或僅屬于 t 的成員
s.add(obj) 加操作: 將 obj 添加到 s
s.remove(obj) 刪除操作: 將 obj 從 s 中刪除;如果 s 中不存在
obj,將引發(fā) KeyError
s.discard(obj) 丟棄操作: remove() 的 友 好 版 本 - 如果 s 中存在 obj,從 s 中刪除它
s.pop() Pop 操作: 移除并返回 s 中的任意一個元素
s.clear() 清除操作: 移除 s 中的所有元素
以上所述是小編給大家介紹的Python中set與frozenset方法和區(qū)別詳解,希望對大家有所幫助
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓練與驗證損失驟升:機器學習訓練中的異常診斷與解決方案 在機器學習模型訓練過程中,“損失曲線” 是反映模型學習狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11