
python對(duì)json的相關(guān)操作實(shí)例詳解
本文實(shí)例分析了python對(duì)json的相關(guān)操作。分享給大家供大家參考,具體如下:
什么是json:
JSON(JavaScript Object Notation) 是一種輕量級(jí)的數(shù)據(jù)交換格式。易于人閱讀和編寫(xiě)。同時(shí)也易于機(jī)器解析和生成。它基于JavaScript Programming Language, Standard ECMA-262 3rd Edition - December 1999的一個(gè)子集。JSON采用完全獨(dú)立于語(yǔ)言的文本格式,但是也使用了類(lèi)似于C語(yǔ)言家族的習(xí)慣(包括C, C++, C#, Java, JavaScript, Perl, Python等)。這些特性使JSON成為理想的數(shù)據(jù)交換語(yǔ)言。
JSON建構(gòu)于兩種結(jié)構(gòu):
“名稱(chēng)/值”對(duì)的集合(A collection of name/value pairs)。不同的語(yǔ)言中,它被理解為對(duì)象(object),紀(jì)錄(record),結(jié)構(gòu)(struct),字典(dictionary),哈希表(hash table),有鍵列表(keyed list),或者關(guān)聯(lián)數(shù)組 (associative array)。
值的有序列表(An ordered list of values)。在大部分語(yǔ)言中,它被理解為數(shù)組(array)。
這些都是常見(jiàn)的數(shù)據(jù)結(jié)構(gòu)。事實(shí)上大部分現(xiàn)代計(jì)算機(jī)語(yǔ)言都以某種形式支持它們。這使得一種數(shù)據(jù)格式在同樣基于這些結(jié)構(gòu)的編程語(yǔ)言之間交換成為可能。
對(duì)簡(jiǎn)單數(shù)據(jù)類(lèi)型的encoding 和 decoding:
使用簡(jiǎn)單的json.dumps方法對(duì)簡(jiǎn)單數(shù)據(jù)類(lèi)型進(jìn)行編碼,例如:
import json
obj = [[1,2,3],123,123.123,'abc',{'key1':(1,2,3),'key2':(4,5,6)}]
encodedjson = json.dumps(obj)
print repr(obj)
print encodedjson
輸出:
[[1, 2, 3], 123, 123.123, 'abc', {'key2': (4, 5, 6), 'key1': (1, 2, 3)}]
[[1, 2, 3], 123, 123.123, "abc", {"key2": [4, 5, 6], "key1": [1, 2, 3]}]
通過(guò)輸出的結(jié)果可以看出,簡(jiǎn)單類(lèi)型通過(guò)encode之后跟其原始的repr()輸出結(jié)果非常相似,但是有些數(shù)據(jù)類(lèi)型進(jìn)行了改變,例如上例中的元組則轉(zhuǎn)換為了列表。在json的編碼過(guò)程中,會(huì)存在從python原始類(lèi)型向json類(lèi)型的轉(zhuǎn)化過(guò)程,具體的轉(zhuǎn)化對(duì)照如下:
json.dumps()方法返回了一個(gè)str對(duì)象encodedjson,我們接下來(lái)在對(duì)encodedjson進(jìn)行decode,得到原始數(shù)據(jù),需要使用的json.loads()函數(shù):
decodejson = json.loads(encodedjson)
print type(decodejson)
print decodejson[4]['key1']
print decodejson
輸出:
[1, 2, 3]
[[1, 2, 3], 123, 123.123, u'abc', {u'key2': [4, 5, 6], u'key1': [1, 2, 3]}]
loads方法返回了原始的對(duì)象,但是仍然發(fā)生了一些數(shù)據(jù)類(lèi)型的轉(zhuǎn)化。比如,上例中‘a(chǎn)bc'轉(zhuǎn)化為了unicode類(lèi)型。從json到python的類(lèi)型轉(zhuǎn)化對(duì)照如下:
json.dumps方法提供了很多好用的參數(shù)可供選擇,比較常用的有sort_keys(對(duì)dict對(duì)象進(jìn)行排序,我們知道默認(rèn)dict是無(wú)序存放的),separators,indent等參數(shù)。
排序功能使得存儲(chǔ)的數(shù)據(jù)更加有利于觀察,也使得對(duì)json輸出的對(duì)象進(jìn)行比較,例如:
data1 = {'b':789,'c':456,'a':123}
data2 = {'a':123,'b':789,'c':456}
d1 = json.dumps(data1,sort_keys=True)
d2 = json.dumps(data2)
d3 = json.dumps(data2,sort_keys=True)
print d1
print d2
print d3
print d1==d2
print d1==d3
輸出:
{"a": 123, "b": 789, "c": 456}
{"a": 123, "c": 456, "b": 789}
{"a": 123, "b": 789, "c": 456}
False
True
上例中,本來(lái)data1和data2數(shù)據(jù)應(yīng)該是一樣的,但是由于dict存儲(chǔ)的無(wú)序特性,造成兩者無(wú)法比較。因此兩者可以通過(guò)排序后的結(jié)果進(jìn)行存儲(chǔ)就避免了數(shù)據(jù)比較不一致的情況發(fā)生,但是排序后再進(jìn)行存儲(chǔ),系統(tǒng)必定要多做一些事情,也一定會(huì)因此造成一定的性能消耗,所以適當(dāng)排序是很重要的。
indent參數(shù)是縮進(jìn)的意思,它可以使得數(shù)據(jù)存儲(chǔ)的格式變得更加優(yōu)雅。
data1 = {'b':789,'c':456,'a':123}
d1 = json.dumps(data1,sort_keys=True,indent=4)
print d1
輸出:
{
"a": 123,
"b": 789,
"c": 456
}
輸出的數(shù)據(jù)被格式化之后,變得可讀性更強(qiáng),但是卻是通過(guò)增加一些冗余的空白格來(lái)進(jìn)行填充的。json主要是作為一種數(shù)據(jù)通信的格式存在的,而網(wǎng)絡(luò)通信是很在乎數(shù)據(jù)的大小的,無(wú)用的空格會(huì)占據(jù)很多通信帶寬,所以適當(dāng)時(shí)候也要對(duì)數(shù)據(jù)進(jìn)行壓縮。separator參數(shù)可以起到這樣的作用,該參數(shù)傳遞是一個(gè)元組,包含分割對(duì)象的字符串。
print 'DATA:', repr(data)
print 'repr(data) :', len(repr(data))
print 'dumps(data) :', len(json.dumps(data))
print 'dumps(data, indent=2) :', len(json.dumps(data, indent=4))
print 'dumps(data, separators):', len(json.dumps(data, separators=(',',':')))
輸出:
DATA: {'a': 123, 'c': 456, 'b': 789}
repr(data) : 30
dumps(data) : 30
dumps(data, indent=2) : 46
dumps(data, separators): 25
通過(guò)移除多余的空白符,達(dá)到了壓縮數(shù)據(jù)的目的,而且效果還是比較明顯的。
另一個(gè)比較有用的dumps參數(shù)是skipkeys,默認(rèn)為False。 dumps方法存儲(chǔ)dict對(duì)象時(shí),key必須是str類(lèi)型,如果出現(xiàn)了其他類(lèi)型的話(huà),那么會(huì)產(chǎn)生TypeError異常,如果開(kāi)啟該參數(shù),設(shè)為T(mén)rue的話(huà),則會(huì)比較優(yōu)雅的過(guò)度。
data = {'b':789,'c':456,(1,2):123}
print json.dumps(data,skipkeys=True)
輸出:
{"c": 456, "b": 789}
處理自己的數(shù)據(jù)類(lèi)型
json模塊不僅可以處理普通的python內(nèi)置類(lèi)型,也可以處理我們自定義的數(shù)據(jù)類(lèi)型,而往往處理自定義的對(duì)象是很常用的。
首先,我們定義一個(gè)類(lèi)Person。
class Person(object):
def __init__(self,name,age):
self.name = name
self.age = age
def __repr__(self):
return 'Person Object name : %s , age : %d' % (self.name,self.age)
if __name__ == '__main__':
p = Person('Peter',22)
print p
如果直接通過(guò)json.dumps方法對(duì)Person的實(shí)例進(jìn)行處理的話(huà),會(huì)報(bào)錯(cuò),因?yàn)閖son無(wú)法支持這樣的自動(dòng)轉(zhuǎn)化。通過(guò)上面所提到的json和python的類(lèi)型轉(zhuǎn)化對(duì)照表,可以發(fā)現(xiàn),object類(lèi)型是和dict相關(guān)聯(lián)的,所以我們需要把我們自定義的類(lèi)型轉(zhuǎn)化為dict,然后再進(jìn)行處理。這里,有兩種方法可以使用。
方法一:自己寫(xiě)轉(zhuǎn)化函數(shù)
'''
Created on 2011-12-14
@author: Peter
'''
import Person
import json
p = Person.Person('Peter',22)
def object2dict(obj):
#convert object to a dict
d = {}
d['__class__'] = obj.__class__.__name__
d['__module__'] = obj.__module__
d.update(obj.__dict__)
return d
def dict2object(d):
#convert dict to object
if'__class__' in d:
class_name = d.pop('__class__')
module_name = d.pop('__module__')
module = __import__(module_name)
class_ = getattr(module,class_name)
args = dict((key.encode('ascii'), value) for key, value in d.items()) #get args
inst = class_(**args) #create new instance
else:
inst = d
return inst
d = object2dict(p)
print d
#{'age': 22, '__module__': 'Person', '__class__': 'Person', 'name': 'Peter'}
o = dict2object(d)
print type(o),o
#
dump = json.dumps(p,default=object2dict)
print dump
#{"age": 22, "__module__": "Person", "__class__": "Person", "name": "Peter"}
load = json.loads(dump,object_hook = dict2object)
print load
#Person Object name : Peter , age : 22
上面代碼已經(jīng)寫(xiě)的很清楚了,實(shí)質(zhì)就是自定義object類(lèi)型和dict類(lèi)型進(jìn)行轉(zhuǎn)化。object2dict函數(shù)將對(duì)象模塊名、類(lèi)名以及__dict__存儲(chǔ)在dict對(duì)象里,并返回。dict2object函數(shù)則是反解出模塊名、類(lèi)名、參數(shù),創(chuàng)建新的對(duì)象并返回。在json.dumps 方法中增加default參數(shù),該參數(shù)表示在轉(zhuǎn)化過(guò)程中調(diào)用指定的函數(shù),同樣在decode過(guò)程中json.loads方法增加object_hook,指定轉(zhuǎn)化函數(shù)。
方法二:繼承JSONEncoder和JSONDecoder類(lèi),覆寫(xiě)相關(guān)方法
JSONEncoder類(lèi)負(fù)責(zé)編碼,主要是通過(guò)其default函數(shù)進(jìn)行轉(zhuǎn)化,我們可以override該方法。同理對(duì)于JSONDecoder。
'''
Created on 2011-12-14
@author: Peter
'''
import Person
import json
p = Person.Person('Peter',22)
class MyEncoder(json.JSONEncoder):
def default(self,obj):
#convert object to a dict
d = {}
d['__class__'] = obj.__class__.__name__
d['__module__'] = obj.__module__
d.update(obj.__dict__)
return d
class MyDecoder(json.JSONDecoder):
def __init__(self):
json.JSONDecoder.__init__(self,object_hook=self.dict2object)
def dict2object(self,d):
#convert dict to object
if'__class__' in d:
class_name = d.pop('__class__')
module_name = d.pop('__module__')
module = __import__(module_name)
class_ = getattr(module,class_name)
args = dict((key.encode('ascii'), value) for key, value in d.items()) #get args
inst = class_(**args) #create new instance
else:
inst = d
return inst
d = MyEncoder().encode(p)
o = MyDecoder().decode(d)
print d
print type(o), o
對(duì)于JSONDecoder類(lèi)方法,稍微有點(diǎn)不同,但是改寫(xiě)起來(lái)也不是很麻煩??创a應(yīng)該就比較清楚了。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶(hù) ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱(chēng) BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢(xún)到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢(xún)結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢(xún)結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專(zhuān)注于從單 ...
2025-07-09year_month數(shù)據(jù)類(lèi)型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類(lèi)型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門(mén)控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專(zhuān)業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03