文章詳情頁

javascript - Python 爬蟲 Ajax 頁面直接request獲取居然速度比selenium慢。

瀏覽：73日期：2022-08-04 16:42:25

問題描述

因為在爬取的網站需要賬號登陸，不方便公開。因此我只能這樣大致性的咨詢，實在抱歉。

我需要爬一個目標網站的數據，發現在點擊下一頁時候，網址并沒有改變.通過源碼確定是使用了js外加ajax的樣子.通過chrome的控制臺，捕獲到點擊下一頁時候，向指定地址發送了一條帶多個參數的get指令。

原先采用selenium+phantomjs的方式暴力無腦方式爬取，一個頁面大概5S左右就能獲取，實際用瀏覽器打開也是這個速度。為了爬取大量的數據，準備改用多線程+直接requests.get目標地址的方式來采集，但是發現采集速度非常的慢，從5S降到的20s左右。

請教下，出現這樣現象的原因可能是什么？我該如何解決？請指教

問題解答

回答1：

抱歉浪費了各位的時間- -是我開始測試的時候，周圍有人再下迅雷，網絡炸了。抱歉抱歉

Python 編程

上一條：python - 使用pandas的resample報錯下一條：python - 相當于分組數據的合并，兩個列表生成dataframe，但長度不同

相關文章：

1. javascript - 如何在NW.JS中使用Node自動重啟進程？2. javascript - 為什么會打印兩次啊？3. gulp-ruby-sass編譯出來的文件有錯4. dockerfile - docker-compose啟動lnmp失敗?5. 引入traits后，為什么index得是空的呢？6. python - 為什么寫了換行語句，結果還是沒有換行？7. angular.js使用$resource服務把數據存入mongodb的問題。8. python - django中普通用戶如何利用admin修改自己的信息？9. mysql - SQL能這樣表示嗎?10. string - Python字符串不區分大小寫替換

排行榜

					
					引入traits后，為什么index得是空的呢？
dockerfile - docker-compose啟動lnmp失敗?
javascript - 如何在NW.JS中使用Node自動重啟進程？
javascript - 為什么會打印兩次啊？
gulp-ruby-sass編譯出來的文件有錯
valign=top 是啥意思
mysql - SQL能這樣表示嗎?
javascript - 這是什么插件能把能把cli里面的webpack打包信息格式化?
javascript - js如何獲取app保存的TOKEN？
javascript - jQuery post()方法，里面的請求串可以轉換為GBK編碼么？可以的話怎樣轉換？
java - vue中使用jquery的ajax 調的本地json數據失敗
				

熱門標簽

av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

javascript - Python 爬蟲 Ajax 頁面直接request獲取居然速度比selenium慢。