利用Python實(shí)現(xiàn)Json序列化庫的方法步驟
前言
在Python的世界里,將一個(gè)對(duì)象以json格式進(jìn)行序列化或反序列化一直是一個(gè)問題。Python標(biāo)準(zhǔn)庫里面提供了json序列化的工具,我們可以簡(jiǎn)單的用json.dumps來將一個(gè)對(duì)象序列化。但是這種序列化僅支持python內(nèi)置的基本類型。
Python
在Python的世界里,將一個(gè)對(duì)象以json格式進(jìn)行序列化或反序列化一直是一個(gè)問題。Python標(biāo)準(zhǔn)庫里面提供了json序列化的工具,我們可以簡(jiǎn)單的用json.dumps來將一個(gè)對(duì)象序列化。但是這種序列化僅支持python內(nèi)置的基本類型,對(duì)于自定義的類,我們將得到Object of type A is not JSON serializable的錯(cuò)誤。
有很多種方法可以用來支持這種序列化,這里有一個(gè)很長(zhǎng)的關(guān)于這個(gè)問題的討論。總結(jié)起來,基本上有兩種還不錯(cuò)的思路:
利用標(biāo)準(zhǔn)庫的接口:從python標(biāo)準(zhǔn)json庫中的JSONDecoder繼承,然后自定義實(shí)現(xiàn)一個(gè)default方法用來自定義序列化過程 利用第三方庫實(shí)現(xiàn):如jsonpickle jsonweb json-tricks等利用標(biāo)準(zhǔn)庫的接口的問題在于,我們需要對(duì)每一個(gè)自定義類都實(shí)現(xiàn)一個(gè)JSONDecoder.default接口,難以實(shí)現(xiàn)代碼復(fù)用。
利用第三方庫,對(duì)我們的代碼倒是沒有任何侵入性,特別是jsonpickle,由于它是基于pickle標(biāo)準(zhǔn)序列化庫實(shí)現(xiàn),可以實(shí)現(xiàn)像pickle一樣序列化任何對(duì)象,一行代碼都不需要修改。
但是我們觀察這類第三方庫的輸出的時(shí)候,會(huì)發(fā)現(xiàn)所有的這些類庫都會(huì)在輸出的json中增加一個(gè)特殊的標(biāo)明對(duì)象類型的屬性。這是為什么呢?Python是一門動(dòng)態(tài)類型的語言,我們無法在對(duì)象還沒有開始構(gòu)建的時(shí)候知道對(duì)象的某一屬性的類型信息,為了對(duì)反序列化提供支持,看起來確實(shí)是不得不這么做。
有人可能覺得這也無可厚非,似乎不影響使用。但是在跨語言通信的時(shí)候,這就成為了一個(gè)比較麻煩的問題。比如我們有一個(gè)Python實(shí)現(xiàn)的API,客戶端發(fā)送了一個(gè)json請(qǐng)求過來,我們想在統(tǒng)一的一個(gè)地方將json反序列化為我們Python代碼的對(duì)象。由于客戶端不知道服務(wù)器端的類型信息,json請(qǐng)求里面就沒法加入這樣的類型信息,這也就導(dǎo)致這樣的類庫在反序列化的時(shí)候遇到問題。
能不能有一個(gè)相對(duì)完美的實(shí)現(xiàn)呢?先看一下我們理想的json序列化庫的需求:
我們希望能簡(jiǎn)單的序列化任意自定義對(duì)象,只添加一行代碼,或者不加入任何代碼 我們希望序列化的結(jié)果不加入任何非預(yù)期的屬性 我們希望能按照指定的類型進(jìn)行反序列化,能自動(dòng)處理嵌套的自定義類,只需要自定義類提供非常簡(jiǎn)單的支持,或者不需要提供任何支持 我們希望反序列化的時(shí)候能很好的處理屬性不存在的情況,以便在我們加入某一屬性的時(shí)候,可以設(shè)置默認(rèn)值,使得舊版本的序列化結(jié)果可以正確的反序列化出來如果有一個(gè)json庫能支持上面的四點(diǎn),那就基本是比較好用的庫了。下面我們來嘗試實(shí)現(xiàn)一下這個(gè)類庫。
對(duì)于我們想要實(shí)現(xiàn)的幾個(gè)需求,我們可以建立下面這樣的測(cè)試來表達(dá)我們所期望的庫的API設(shè)計(jì):
class A(JsonSerializable):def __init__(self, a, b):super().__init__()self.a = aself.b = b if b is not None else B(0)@propertydef id(self):return self.adef _deserialize_prop(self, name, deserialized):if name == ’b’:self.b = B.deserialize(deserialized)returnsuper()._deserialize_prop(name, deserialized)class B(JsonSerializable):def __init__(self, b):super().__init__()self.b = bclass JsonSerializableTest(unittest.TestCase):def test_model_should_serialize_correctly(self):self.assertEqual(json.dumps({’a’: 1, ’b’: {’b’: 2}}), A(1, B(2)).serialize())def test_model_should_deserialize_correctly(self):a = A.deserialize(json.dumps({’a’: 1, ’b’: {’b’: 2}}))self.assertEqual(1, a.a)self.assertEqual(2, a.b.b)def test_model_should_deserialize_with_default_value_correctly(self):a = A.deserialize(json.dumps({’a’: 1}))self.assertEqual(1, a.a)self.assertEqual(0, a.b.b)
這里我們希望通過繼承的方式來添加支持,這將在反序列化的時(shí)候提供一個(gè)好處。因?yàn)橛辛怂覀兙涂梢灾苯邮褂肁.deserialize方法來反序列化,而不需要提供任何其他的反序列化函數(shù)參數(shù),比如這樣json.deserialize(serialized_str, A)。
同時(shí)為了驗(yàn)證我們的框架不會(huì)將@property屬性序列化或者反序列化,我們特意在類A中添加了這樣一個(gè)屬性。
由于在反序列化的時(shí)候,框架是無法知道某一個(gè)對(duì)象屬性的類型信息,比如測(cè)試中的A.b,為了能正確的反序列化,我們需要提供一點(diǎn)簡(jiǎn)單的支持,這里我們?cè)陬怉中覆蓋實(shí)現(xiàn)了一個(gè)父類的方法_deserialize_prop對(duì)屬性b的反序列化提供支持。
當(dāng)我們要反序列化一個(gè)之前版本的序列化結(jié)果時(shí),我們希望能正確的反序列化并使用我們提供的默認(rèn)值作為最終的反序列化值。這在屬性A.b的測(cè)試中得到了體現(xiàn)。
(上面的測(cè)試有很多邊界的情況、支持的變量類型并沒有覆蓋,此測(cè)試只是作為示例使用。)
如果能有一個(gè)類可以讓上面的測(cè)試通過,相信那個(gè)類就是我們所需要的類了。這樣的類可以實(shí)現(xiàn)為如下:
def is_normal_prop(obj, key):is_prop = isinstance(getattr(type(obj), key, None), property)is_func_attr = callable(getattr(obj, key))is_private_attr = key.startswith(’__’)return not (is_func_attr or is_prop or is_private_attr)def is_basic_type(value):return value is None or type(value) in [int, float, str, bool]class JsonSerializable:def _serialize_prop(self, name):return getattr(self, name)def _as_dict(self):props = {}for key in dir(self):if not is_normal_prop(self, key):continuevalue = self._serialize_prop(key)if not (is_basic_type(value) or isinstance(value, JsonSerializable)):raise Exception(’unknown value to serialize to dict: key={}, value={}’.format(key, value))props[key] = value if is_basic_type(value) else value._as_dict()return propsdef serialize(self):return json.dumps(self._as_dict(), ensure_ascii=False)def _deserialize_prop(self, name, deserialized):setattr(self, name, deserialized)@classmethoddef deserialize(cls, json_encoded):if json_encoded is None:return Noneargs = inspect.getfullargspec(cls)args_without_self = args.args[1:]obj = cls(*([None] * len(args_without_self)))data = json.loads(json_encoded, encoding=’utf8’) if type(json_encoded) is str else json_encodedfor key in dir(obj):if not is_normal_prop(obj, key):continueif key in data:obj._deserialize_prop(key, data[key])return obj
在實(shí)現(xiàn)時(shí),我們利用了Python的內(nèi)省機(jī)制,這樣就可以自動(dòng)的識(shí)別對(duì)象的屬性及運(yùn)行時(shí)類型了。當(dāng)然對(duì)于這個(gè)簡(jiǎn)單的類還有很多待支持的功能,使用上也有很多限制,比如:
當(dāng)某一屬性為自定義類的類型的時(shí)候,需要子類覆蓋實(shí)現(xiàn)_deserialize_prop方法為反序列化過程提供支持 當(dāng)某一屬性為由自定義類構(gòu)成的一個(gè)list tuple dict復(fù)雜對(duì)象時(shí),需要子類覆蓋實(shí)現(xiàn)_deserialize_prop方法為反序列化過程提供支持 簡(jiǎn)單屬性必須為python內(nèi)置的基礎(chǔ)類型,比如如果某一屬性的類型為numpy.float64,序列化反序列化將不能正常工作雖然有上述限制,但是這正好要求我們?cè)谧瞿P驮O(shè)計(jì)的時(shí)候保持克制,不要將某一個(gè)對(duì)象設(shè)計(jì)得過于復(fù)雜。比如如果有屬性為dict類型,我們可以將這個(gè)dict抽象為另一個(gè)自定義類型,然后用類型嵌套的方式來實(shí)現(xiàn)。
到這里這個(gè)基類就差不多可以支撐我們?nèi)粘5拈_發(fā)需要了。當(dāng)然對(duì)于這個(gè)簡(jiǎn)單的實(shí)現(xiàn)還有可能有其他的需求或者問題,大家如有發(fā)現(xiàn),歡迎留言交流。
總結(jié)
到此這篇關(guān)于利用Python實(shí)現(xiàn)Json序列化庫的文章就介紹到這了,更多相關(guān)Python實(shí)現(xiàn)Json序列化庫內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
1. css進(jìn)階學(xué)習(xí) 選擇符2. HTML <!DOCTYPE> 標(biāo)簽3. css代碼優(yōu)化的12個(gè)技巧4. 低版本IE正常運(yùn)行HTML5+CSS3網(wǎng)站的3種解決方案5. 使用css實(shí)現(xiàn)全兼容tooltip提示框6. CSS3實(shí)例分享之多重背景的實(shí)現(xiàn)(Multiple backgrounds)7. CSS Hack大全-教你如何區(qū)分出IE6-IE10、FireFox、Chrome、Opera8. 詳解瀏覽器的緩存機(jī)制9. HTML DOM setInterval和clearInterval方法案例詳解10. 告別AJAX實(shí)現(xiàn)無刷新提交表單
