av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

xpath - python怎么用lxml處理

瀏覽:81日期:2022-09-22 09:54:52

問(wèn)題描述

例如:

<p>沒(méi)<em><!--red_beg-->aa<!--red_end--></em></p><p>沒(méi)<em><!--red_beg-->aa<!--red_end--></em>沒(méi)<em><!--red_beg-->aa<!--red_end--></em></p><p>沒(méi)</p>

就是在p標(biāo)簽里可能會(huì)出現(xiàn)同樣的em標(biāo)簽,而且數(shù)量不定,那我怎么獲取p的內(nèi)容,包括em里的內(nèi)容。例如第二個(gè)p獲取輸出是‘沒(méi)aa沒(méi)aa’

或者獲取到p節(jié)點(diǎn)之后,怎么把里面的內(nèi)容轉(zhuǎn)換為字符串

問(wèn)題解答

回答1:

今天偶然學(xué)到處理這個(gè)問(wèn)題的方法,特意翻出來(lái)這個(gè)問(wèn)題回答。題主你可以看一下xpath的軸,比如你要取得第二個(gè)<p>標(biāo)簽的“沒(méi)aa沒(méi)aa”,實(shí)際是取得它全部后代節(jié)點(diǎn)的文本內(nèi)容,可以使用element_dom.xpath('//p[2]//descendant::text()')來(lái)取得,拿到的結(jié)果是一個(gè)這樣[’沒(méi)’, ’aa’, ’沒(méi)’, ’aa’]的list,然后自己手動(dòng)拼接成字符串就可以了,比如''.join(list)。同理,如果你需要進(jìn)行其他操作,也可以使用類似的方法。

回答2:

換bs4,string和text之間的異同就在這里。

回答3:

lxml.html的.text_content()方法,可以獲取當(dāng)前節(jié)點(diǎn)和所有子節(jié)點(diǎn)的文本內(nèi)容。

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 中文字幕在线观看第一页 | 在线观看成人小视频 | 久久这里只有精品首页 | 91看片免费 | 一区二区三区四区av | 欧美日韩综合精品 | 国产精品高潮呻吟久久av野狼 | 综合色站导航 | 欧美啪啪| 亚洲欧美日韩精品久久亚洲区 | 久久久91精品国产一区二区三区 | 日本a∨精品中文字幕在线 亚洲91视频 | 91在线视频免费观看 | 国产精品乱码一区二区三区 | 狠狠的干狠狠的操 | 日韩黄a| 亚洲天堂av在线 | 久久久久久亚洲精品不卡 | 亚洲电影一区二区三区 | 国精日本亚洲欧州国产中文久久 | 国产精品777一区二区 | 久久久久久亚洲 | 免费久久网站 | 一区二区三区免费 | 亚洲免费一区二区 | 久草中文在线 | 久久久女女女女999久久 | 中文字幕1区2区3区 日韩在线视频免费观看 | 国产精品自产拍在线观看蜜 | 一区二区三区中文字幕 | 男人的天堂在线视频 | 久热久草| 久久艹免费视频 | 黄视频网站在线 | 午夜精品 | 另类在线| 久久久国产精品 | 97福利在线 | 午夜精品一区 | 欧美精品一区二区三区在线 | 欧美激情在线精品一区二区三区 |