一篇文章搞懂Python反斜杠的相關(guān)問(wèn)題
大家在開(kāi)發(fā)Python的過(guò)程中,一定會(huì)遇到很多反斜杠的問(wèn)題,很多人被反斜杠的數(shù)量搞得頭大。
首先我們寫(xiě)一段非常簡(jiǎn)單的Python代碼,它的作用是把一個(gè)字段先轉(zhuǎn)換為JSON格式的字符串,然后把這個(gè)字符串再轉(zhuǎn)換為JSON格式的字符串:
import json info = {’name’: ’kingname’, ’address’: ’杭州’, ’salary’: 99999}info_json = json.dumps(info) # 第一次轉(zhuǎn)換以后,打印出來(lái)print(info_json) info_json_json = json.dumps(info_json) # 第二次轉(zhuǎn)換以后,再打印出來(lái)print(info_json_json)
它的運(yùn)行效果如下圖所示。
第一次,字典轉(zhuǎn)成JSON格式的字符串,只有中文杭州變成了Unicode編碼u676du5dde,其余地方?jīng)]有出現(xiàn)反斜杠。
在Python里面,反斜杠不能單獨(dú)出現(xiàn),這里u676du5dde中的兩根反斜杠,實(shí)際上應(yīng)該是u。表示這兩個(gè)編碼是Unicode編碼。
接下來(lái),把第一次生成的JSON字符串:{'name': 'kingname', 'address': 'u676du5dde', 'salary': 99999}再一次轉(zhuǎn)成JSON格式的字符串,這一次變成了:
'{'name': 'kingname', 'address': 'u676du5dde', 'salary': 99999}'
為什么突然出現(xiàn)了這么多反斜杠?這是因?yàn)椋琂SON格式的字符串本身是使用雙引號(hào)來(lái)表示字符串的。如果原來(lái)的字符串里面本身就有雙引號(hào),那就會(huì)導(dǎo)致混淆。此時(shí),Python需要把原來(lái)字符串的雙引號(hào)變成普通的字符,失去雙引號(hào)的作用。因此使用'讓雙引號(hào)變成普通的字符。
這就相當(dāng)于在Python中,可以這樣定義一個(gè)包含雙引號(hào)的字符串:
>>> a = '跟我說(shuō):'你好''>>> print(a)跟我說(shuō):'你好'
這里,你好兩側(cè)的雙引號(hào)都加上了反斜杠,讓它成為普通的字符,防止它們提前與最外層的雙引號(hào)配對(duì)。
如果不加反斜杠,就會(huì)導(dǎo)致字符串里面的雙引號(hào)提前與外層的雙引號(hào)配對(duì),引起語(yǔ)法錯(cuò)誤:
>>> b = '跟我說(shuō):'你好'' File '<stdin>', line 1 b = '跟我說(shuō):'你好'' ^SyntaxError: invalid syntax
這里,'跟我說(shuō):'成為了一個(gè)字符串,末尾的''成為了一個(gè)空字符串。那么中間的你好就變成了一個(gè)沒(méi)有定義的變量。而Python里面,是不存在字符串未定義的變量字符串這種寫(xiě)法的,所以會(huì)報(bào)語(yǔ)法錯(cuò)誤。
而JSON格式的字符串,本質(zhì)上也是字符串,所以自然而然也需要遵循這樣的規(guī)則。因此,字符串原來(lái)自帶的雙引號(hào)左側(cè)就被加上了反斜杠。
那么,原來(lái)的u676du5dde為什么變成了u676du5dde?
這是因?yàn)椋?dāng)?shù)诙螆?zhí)行json.dumps的時(shí)候,傳入的參數(shù)是一個(gè)JSON格式的字符串,本質(zhì)就是字符串。而一個(gè)字符串里面如果自帶反斜杠,那么JSON在對(duì)他再次轉(zhuǎn)換的時(shí)候,需要標(biāo)記這是一個(gè)普通的字符串形式的反斜杠,不是一個(gè)有特殊意義的反斜杠,所以使用表示一個(gè)普通的反斜杠。
好了,那么你可以猜一下,如果把info_json_json再json.dumps一下會(huì)怎么樣?
會(huì)變成:
''{'name': 'kingname', 'address': 'u676du5dde', 'salary': 99999}''
為什么出現(xiàn)了三個(gè)反斜杠連用和四個(gè)反斜杠連用的問(wèn)題?
實(shí)際上非常簡(jiǎn)單,當(dāng)你對(duì)info_json_json執(zhí)行json.dumps的時(shí)候,Python是怎么轉(zhuǎn)換的?
我們來(lái)看:
'{'name': 'kingname', 'address': 'u676du5dde', 'salary': 99999}'
對(duì)字符串執(zhí)行json.dumps的時(shí)候,記住一個(gè)關(guān)鍵方法——從左到右,一個(gè)字符一個(gè)字符的轉(zhuǎn)換。
1. 第一個(gè)字符是雙引號(hào),所以變成'2. 第二個(gè)字符是{,不是特殊符號(hào),保留3. 第三個(gè)字符是,把它變成4. 第四個(gè)字符是',把它變成'5. ……
全部執(zhí)行完成了,由于這次轉(zhuǎn)換是把一個(gè)字符串轉(zhuǎn)換為JSON格式的字符串,所以最外側(cè)加上雙引號(hào)。
于是就得到了:
''{'name': 'kingname', 'address': 'u676du5dde', 'salary': 99999}''
我們?cè)谂老x(chóng)開(kāi)發(fā)過(guò)程中,可能會(huì)遇到上面這種經(jīng)過(guò)多次JSON轉(zhuǎn)換后的字符串,此時(shí),千萬(wàn)不要輕易使用字符串的.replace方法把多個(gè)反斜杠替換為空或者把兩個(gè)反斜杠替換為一個(gè)反斜杠。那樣做只會(huì)導(dǎo)致你的數(shù)據(jù)更難解析。
正確的做法應(yīng)該是嘗試對(duì)數(shù)據(jù)一層一層使用json.loads,把它一層一層還原,還原到最初的{’name’: ’kingname’, ’address’: ’杭州’, ’salary’: 99999}這種簡(jiǎn)單形式。
好了,今天的介紹就到這里,最后留一個(gè)思考題:
還是上面的代碼,現(xiàn)在把PyCharm的調(diào)試模式打開(kāi),然后數(shù)一數(shù)info_json和info_json_json里面反斜杠的個(gè)數(shù),如下圖所示:
為什么在info_json里面,出現(xiàn)了u676du5dde,為什么在info_json_json里面雙引號(hào)前是兩根反斜杠,而'u676du5dde'竟然變成了'u676du5dde。
總結(jié)
到此這篇關(guān)于一篇文章搞懂Python反斜杠的文章就介紹到這了,更多相關(guān)Python反斜杠內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
1. Warning: require(): open_basedir restriction in effect,目錄配置open_basedir報(bào)錯(cuò)問(wèn)題分析2. ASP中常用的22個(gè)FSO文件操作函數(shù)整理3. Vue+elementUI下拉框自定義顏色選擇器方式4. React+umi+typeScript創(chuàng)建項(xiàng)目的過(guò)程5. SharePoint Server 2019新特性介紹6. php測(cè)試程序運(yùn)行速度和頁(yè)面執(zhí)行速度的代碼7. php網(wǎng)絡(luò)安全中命令執(zhí)行漏洞的產(chǎn)生及本質(zhì)探究8. ASP的Global.asa文件技巧用法9. ASP中if語(yǔ)句、select 、while循環(huán)的使用方法10. html清除浮動(dòng)的6種方法示例
