python - 編碼問(wèn)題求助
問(wèn)題描述
爬蟲(chóng)時(shí)我get到的內(nèi)容content是這樣的 b{'title':'u5173u6ce8','card_type_name':'u5173u6ce8'}, 請(qǐng)教一下如何把編碼轉(zhuǎn)換成漢字我先查到一個(gè)方法 follow_text = follow.text.encode(’utf-8’).decode(’unicode-escape’), 第一個(gè)response可以這樣轉(zhuǎn)換,然而follow.text轉(zhuǎn)換會(huì)出現(xiàn)’utf-8’ codec can’t encode characters in position 2809-2810,然后嘗試改為text[:2809],不會(huì)報(bào)錯(cuò),改為text[2811:]依然有錯(cuò)使用 print(follow.text[2800:2810])輸出為’_image_url’,不知道為什么轉(zhuǎn)換不成功想問(wèn)一下這個(gè)是什么問(wèn)題,或者有沒(méi)有什么其他辦法把我get到的內(nèi)容轉(zhuǎn)換一下
問(wèn)題解答
回答1:如果 follow.text本身是 str(unicode) 的話(huà),encode(’utf8’) 回去沒(méi)有任何意義,直接 decode(’unicode-escape’) 就行
如果 follow.text是 bytes 的話(huà),那就可以選擇先 decode(’utf8’) ,再 decode(’unicode-escape’)
(假設(shè)你問(wèn)題中正確的編碼為 utf8 )
回答2:你直接使用json進(jìn)行解碼不就好了
相關(guān)文章:
1. javascript - vue的element-ui(餓了嗎UI) webpack打包時(shí)externals無(wú)法分離2. (python)關(guān)于如何做到按win+R再輸入文件文件名就可以運(yùn)行?3. mysql - 分庫(kù)分表、分區(qū)、讀寫(xiě)分離 這些都是用在什么場(chǎng)景下 ,會(huì)帶來(lái)哪些效率或者其他方面的好處4. python - 能通過(guò)CAN控制一部普通的家用轎車(chē)嗎?5. javascript - 請(qǐng)問(wèn) chrome 為什么會(huì)重復(fù)加載圖片資源?6. javascript - 請(qǐng)教如何獲取百度貼吧新增的兩個(gè)加密參數(shù)7. css3 - 微信前端頁(yè)面遇到的transition過(guò)渡動(dòng)畫(huà)的bug8. Python爬蟲(chóng)如何爬取span和span中間的內(nèi)容并分別存入字典里?9. html5 - 只用CSS如何實(shí)現(xiàn)input框的寬度隨框里輸入的內(nèi)容長(zhǎng)短自動(dòng)適應(yīng)?10. javascript - 關(guān)于css絕對(duì)定位在ios瀏覽器被橡皮筋遮擋的問(wèn)題
