文章詳情頁

網(wǎng)頁爬蟲 - python 爬取網(wǎng)站并解析非json內(nèi)容

瀏覽：87日期：2022-06-27 10:19:15

問題描述

小弟剛學(xué)會獲得json的內(nèi)容，但今天爬的網(wǎng)站返回的并不是json內(nèi)容并且會有一個隨機(jī)數(shù)的生成在每次請求鏈接的后面

不知道會不會影響我要爬的內(nèi)容

需要獲得內(nèi)容是下圖中間的內(nèi)容

網(wǎng)頁爬蟲 - python 爬取網(wǎng)站并解析非json內(nèi)容網(wǎng)站鏈接 http://www.szse.cn/main/discl...

我自己嘗試的代碼：

import requestsdir = ’/Users/S1Lence/Desktop/new_html/szse/許可類重組問詢函’headers = {’Host’: ’www.szse.cn’, ’Referer’: ’http://www.szse.cn/main/disclosure/jgxxgk/wxhj/’, ’User-Agent’: ’Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.109 Safari/537.36’ }payload= {’ACTIONID’: ’7’, ’AJAX’: ’AJAX-TRUE’, ’CATALOGID’: ’main_wxhj’, ’TABKEY’: ’tab1’, ’selecthjlb’: ’許可類重組問詢函’, ’tab1PAGENO’: ’1’, ’tab1PAGECOUNT’: ’7’, ’tab1RECORDCOUNT’: ’63’, ’REPORT_ACTION’: ’navigate’}res = requests.post(’http://www.szse.cn/szseWeb/FrontControllere’, data=payload)print(res.text)

輸出的內(nèi)容并不是我想要的求解應(yīng)該怎么爬

問題解答

回答1：

把他的header信息拷過來用。。

回答2：

你post的url地址寫錯了，應(yīng)該是

http://www.szse.cn/szseWeb/FrontController.szse

Python 編程

上一條：numpy - python [:,2][:,None]是什么意思下一條：（python)關(guān)于如何做到按win+R再輸入文件文件名就可以運行？

相關(guān)文章：

1. python - 如何正則字符串中的所有漢字2. mysql - 千萬級數(shù)據(jù)的表，添加unique約束，insert會不會很慢？3. python - oslo_config4. mysql - 分庫分表、分區(qū)、讀寫分離這些都是用在什么場景下，會帶來哪些效率或者其他方面的好處5. mysql - 如何減少使用或者不用LEFT JOIN查詢？6. mysql - eclispe無法打開數(shù)據(jù)庫連接7. mysql 5個left關(guān)鍵然后再用搜索條件幾千條數(shù)據(jù)就會卡，如何解決呢8. mysql - jdbc的問題9. 圖片鏈接的地址怎么獲得的10. 視頻文件不能播放，怎么辦？

排行榜

					
					python - Win7調(diào)用flup報錯’module’ object has no attribute ’fromfd’
javascript - npm安裝警告
javascript - es6將類數(shù)組轉(zhuǎn)化成數(shù)組的問題
javascript - 關(guān)于css絕對定位在ios瀏覽器被橡皮筋遮擋的問題
python - 小白django提交數(shù)據(jù)后，沒有存儲到數(shù)據(jù)庫（查閱資料并沒有發(fā)現(xiàn)問題）
python - 如何正則字符串中的所有漢字
mysql - eclispe無法打開數(shù)據(jù)庫連接
mysql - 千萬級數(shù)據(jù)的表，添加unique約束，insert會不會很慢？
python - 我在使用pip install -r requirements.txt下載時，為什么部分能下載，部分不能下載
docker安裝后出現(xiàn)Cannot connect to the Docker daemon.
Docker for Mac 創(chuàng)建的dnsmasq容器連不上/不工作的問題
				

熱門標(biāo)簽

av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

網(wǎng)頁爬蟲 - python 爬取網(wǎng)站 并解析非json內(nèi)容

網(wǎng)頁爬蟲 - python 爬取網(wǎng)站并解析非json內(nèi)容