文章詳情頁

python中的一個用法不清楚

瀏覽：121日期：2022-07-03 14:47:59

問題描述

在python編寫爬蟲的過程中（爬取wiki百科的詞條），使用迭代器輸出過程中出現了url['href']想著應該屬于迭代器里面一個用法，但卻沒有找到，求助這個用法的意思，謝謝

#coding:utf-8import urllibimport urllib2import refrom bs4 import BeautifulSoupresp = urllib2.urlopen('https://en.wikipedia.org/wiki/Main_Page').read()soup = BeautifulSoup(resp,'html.parser')listurl = soup.findAll(’a’,href=re.compile('^/wiki/'))for url in listurl:print url.get_text(),'------>','https://en.wikipedia.org'+url['href']

最后一行的url['href']，對爬取得數據產生了截斷的效果，沒加之前，輸出為：print url輸出：Disclaimers加了之后，輸出為：print url['href']輸出：/wiki/Wikipedia:General_disclaimer求解，謝謝

問題解答

回答1：

只要實現了__getitem__方法的類就可以使用中括號取值。

In [16]: class A(): ...: def __getitem__(self,a): ...: return a ...: In [17]: a = A() In [18]: a[’a’], a[1] Out[18]: (’a’, 1)

Python 編程

上一條：python中split如何優先使用下一條：網頁爬蟲 - Python requests爬蟲，如何post payload里的數據，謝謝！

相關文章：

1. MySQL 使用 group by 之后然后 IFNULL(COUNT(*),0) 為什么還是會獲得 null2. wordpress里，這樣的目錄列表是屬于小工具還是啥？3. 一直報這個錯誤4. 常量在外面不加引號會報錯。5. python如何設置一個隨著系統時間變化的動態變量？6. mysql - 大部分數據沒有行溢出的text字段是否需要拆表7. mysql federated引擎無法開啟8. sublime text3安裝package control失敗9. 我的怎么不顯示啊，話說有沒有QQ群什么的10. mysql 為什么主鍵 id 和 pid 都市索引, id > 10 走索引 time > 10 不走索引?

排行榜

					
					vue.js - 關于Vue-cli項目在VPS中用Nginx部署完請求頁面app.js找不到提示404錯誤。
wordpress里，這樣的目錄列表是屬于小工具還是啥？
mysql 為什么主鍵 id  和 pid 都市索引, id > 10 走索引 time > 10 不走索引?
一直報這個錯誤
常量在外面不加引號會報錯。
java - spring boot 如何打包成asp.net core 那種獨立應用?
啟動 BrowserSync時
無法添加事件
請問這套課程是否是《函數與閉包》最后提到的講閉包案例的課程？
android - 請問一下 類似QQ音樂底部播放 在每個頁面都顯示 是怎么做的？
java - idea創建多modules項目后，tomcat啟動失敗
				

熱門標簽

av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

python中的一個用法不清楚