av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

您的位置:首頁技術(shù)文章
文章詳情頁

python - pandas讀取中文的時候亂碼 要如何解決?

瀏覽:131日期:2022-08-19 14:15:22

問題描述

下載了一份新浪微博的數(shù)據(jù),但是原始數(shù)據(jù)是用csv的,在mac上沒辦法直接打開,讀取的時候,也會錯誤,會出現(xiàn)

UnicodeDecodeError: ’utf-8’ codec can’t decode byte 0x84 in position 36: invalid start byte

然后自己google,發(fā)現(xiàn)read_csv(’file’, encoding = 'ISO-8859-1') 這樣的時候讀取不會有錯

但是讀取進(jìn)來發(fā)現(xiàn)是這樣的:

中文全部python - pandas讀取中文的時候亂碼 要如何解決?

然后測試了read_csv(’file’, encoding = 'gbk')read_csv(’file’, encoding = 'utf8')read_csv(’file’, encoding = 'gb18030')總之就是各種不行~基本的情況如下:

UnicodeDecodeError: ’gb18030’ codec can’t decode byte 0xaf in position 12: incomplete multibyte sequence

有大神遇到類似的情況嗎?

有大神說要數(shù)據(jù) 因?yàn)楸容^大,熱心的人可以看看 不過我覺得挺有用的下面是微博的數(shù)據(jù)鏈接:http://pan.baidu.com/s/1jHCOwCI 密碼:x58f

補(bǔ)充一下代碼吧~上面隨意一個文件下載下來(是csv格式的)然后用pandas打開就會出錯~

import pandasdf = pandas.read_csv('week1.csv')

問題解答

回答1:

給代碼和原數(shù)據(jù)

你寫點(diǎn)能代碼+有代表性的數(shù)據(jù) 即可,別搞幾G的大數(shù)據(jù)阿~

誰看啊?

回答2:

跟你一樣的情況,試了很多編碼仍然沒有用,但是看數(shù)據(jù)用UTF8編碼的話,有的數(shù)據(jù)能轉(zhuǎn)換成功,所以我暫時能想到的辦法就是用open去按行讀取,如果出現(xiàn)編碼轉(zhuǎn)換錯誤就丟掉,這樣下來數(shù)據(jù)量其實(shí)也不少

回答3:

你也可以試試用cp1252。最好的方法是先通過chardet包(https://pypi.python.org/pypi/...)看文件具體上用什么encoding。

回答4:

試過了沒有問題呀,我猜想應(yīng)該是你環(huán)境編碼問題吧,可以嘗試一下以下代碼

#coding=utf-8import pandas as pdimport sysreload(sys)sys.setdefaultencoding('utf-8')df = pd.read_csv(’week1.csv’, encoding=’utf-8’, nrows=10)print df

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 国产欧美在线播放 | 无吗视频 | 国产在线播放av | 国产综合久久 | 国产69精品久久99不卡免费版 | 欧美a在线 | 亚洲网站在线观看 | 亚洲一区二区电影网 | 国产精品久久久久久亚洲调教 | 精品日韩在线观看 | 久精品久久 | 欧美一级视频在线观看 | 日韩欧美第一页 | 精品一区二区三区在线视频 | 成人妇女免费播放久久久 | 欧美午夜一区二区三区免费大片 | 日韩精品在线一区 | 91精品国产欧美一区二区 | 美日韩精品 | 国产在视频一区二区三区吞精 | 8x国产精品视频一区二区 | 国产日韩欧美 | 国产丝袜av | 一区二区影院 | 高清一区二区 | 亚洲精品第一 | 亚洲视频不卡 | 日韩在线播放网址 | 中文字幕高清av | 精品影视 | 日韩欧美一级精品久久 | 久久一区精品 | 欧美极品少妇xxxxⅹ免费视频 | 污污的网站在线观看 | 欧美日韩一区二区视频在线观看 | 亚洲人在线观看视频 | 久久久激情 | 国产做a爱免费视频 | 国产免费让你躁在线视频 | 国产精品自产av一区二区三区 | 天天操综合网站 |