文章詳情頁

javascript - node爬取微博

瀏覽：139日期：2022-06-24 14:18:08

問題描述

剛接觸node,想寫個爬蟲，爬取新浪微博評論，但是發現頁面是由JS動態生成的，用http模塊爬取不到，然后用phantomjs爬取，（聽說會比較慢，運行了近15分鐘，這也太慢了，不知是否寫錯），還是不行，問一下有什么辦法能夠爬取類似于新浪微博的網頁嗎？

問題解答

回答1：

自己寫過微博的爬取,有兩種思路

仔細看一下應該是有接口去獲取相應數據的然后用正則去匹配

微博提供了開發者API接口的,雖然用著比較麻煩

微博

上一條：javascript - 微信小程序調用外部地圖程序下一條：javascript - vue-cli項目中，獲取微信access_token時遇到的跨域問題

相關文章：

1. 谷歌訪問助手安裝不了2. 雙擊安裝程序，安裝不了3. form表單中的label標簽4. Python中使用超長的List導致內存占用過大5. 文本處理 - 求教使用python庫提取pdf的方法？6. python - 如何用pandas處理分鐘數據變成小時線？7. pdo - mysql 簡單注入疑問8. python - Pycharm的Debug用不了9. windows-7 - Win7中Vmware Workstatoin與Xampp中Apache服務器端口沖突？10. html5 - 百度echart官網下載的地圖json數據亂碼

排行榜

					
					pdo - mysql 簡單注入疑問
nginx - 如何根據服務器配置設置web服務參數？
java - android 有沒有離線版的sdk文檔 不用聯網就可以本地查找的，提高查閱文檔的速度？
form表單中的label標簽
docker容器呢SSH為什么連不通呢？
docker start -a dockername 老是卡住，什么情況？
docker綁定了nginx端口 外部訪問不到
dockerfile - docker-compose啟動lnmp失敗?
css - input中transition 設置background-color過渡，chrome瀏覽器頁面初始化渲染會有過度效果
javascript - webpack打包css 導致頁面加載樣式慢 FOUC
html - css氣泡，實現“倒三角（不知道算不算三角了）”可透明的。
				

熱門標簽

av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

javascript - node爬取微博