av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

您的位置:首頁技術文章
文章詳情頁

python - 網頁title中包含換行,如何用正則表達式提取出來?

瀏覽:133日期:2022-06-28 10:07:00

問題描述

在用python做CSDN的網頁爬蟲,在爬取網頁title時,我一直用的正則表達式(?<=<title>).+?(?=<)在CSDN中用不了了,去CSDN源碼一看,title換行顯示了python - 網頁title中包含換行,如何用正則表達式提取出來?

所以導致原來的正則表達式無法使用,那么,問題來了,像這樣網頁title中包含換行,如何用正則表達式提取出來呢?

PS:

不想用xpath或beautifulsoup的方法,只需要正則哦

CSDN本身有反爬蟲機制,我并不是因為這個反爬蟲而爬不到title的哦

謝謝大家

參照@caimaoy 的方法,我將正則表達式改為 (?<=<title>)(?:.|n)+?(?=<)后,title完美提取。再次感謝大家。

問題解答

回答1:

re.M 多行模式

自己寫多行匹配 http://python3-cookbook.readt...

回答2:

表達式那邊加個flag吧

tite = ’......’print(re.findall(’(?<=<title>).+?(?=<)’, title, re.S))

標簽: Python 編程
主站蜘蛛池模板: 亚洲精品视频在线 | 青青艹在线视频 | 国产一二三区在线 | 亚洲欧美日本在线 | 欧美国产日韩在线观看成人 | 免费观看一级视频 | 国产欧美精品一区二区色综合朱莉 | 一级片在线视频 | 免费黄色录像视频 | 日韩在线精品视频 | 视频一区在线播放 | 国产1区2区| 91精品一区二区三区久久久久久 | 亚洲夜射 | 欧美一区视频 | 国产精品久久久久久久久久免费看 | 亚洲免费成人av | 超碰日韩 | avmans最新导航地址 | 国产成人福利视频在线观看 | 日韩免费 | 日韩一区二区三区在线视频 | 精品1区2区| 国产精品区二区三区日本 | 亚洲欧美综合精品久久成人 | 亚洲成人av一区二区 | 日韩国产在线 | 天堂在线www| 羞羞色视频 | 自拍第一页| 日韩一区二区不卡 | 在线观看av中文字幕 | 99av成人精品国语自产拍 | 国产欧美一区二区三区久久 | 国产一区二区精品在线观看 | 99免费精品视频 | 欧美成人精品一区二区男人看 | 国产a区| 久久久成人网 | 欧美精品电影一区 | 日韩视频1|