Python正則表達(dá)式如何匹配中文
用 ’[u4e00-u9fa5]‘ 匹配中文
在字符串中匹配中文
示例:
匹配字符串中的第一個(gè)中文字符
匹配字符串中的第一個(gè)連續(xù)的中文片段
匹配字符串中的所有中文字符
注:要確保正則字符和匹配文本是 unicode 范圍內(nèi)的編碼。
其他 擴(kuò)充 范圍
幾個(gè)主要非英文語(yǔ)系字符范圍:2E80~33FFh:中日韓符號(hào)區(qū)。收容康熙字典部首、中日韓輔助部首、注音符號(hào)、日本假名、韓文音符,中日韓的符號(hào)、標(biāo)點(diǎn)、帶圈或帶括符文數(shù)字、月份,以及日本的假名組合、單位、年號(hào)、月份、日期、時(shí)間等。3400~4DFFh:中日韓認(rèn)同表意文字?jǐn)U充A區(qū),總計(jì)收容6,582個(gè)中日韓漢字。4E00~9FFFh:中日韓認(rèn)同表意文字區(qū),總計(jì)收容20,902個(gè)中日韓漢字。A000~A4FFh:彝族文字區(qū),收容中國(guó)南方彝族文字和字根。AC00~D7FFh:韓文拼音組合字區(qū),收容以韓文音符拼成的文字。F900~FAFFh:中日韓兼容表意文字區(qū),總計(jì)收容302個(gè)中日韓漢字。FB00~FFFDh:文字表現(xiàn)形式區(qū),收容組合拉丁文字、希伯來(lái)文、阿拉伯文、中日韓直式標(biāo)點(diǎn)、小符號(hào)、半角符號(hào)、全角符號(hào)等。
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. python爬蟲(chóng)實(shí)戰(zhàn)之制作屬于自己的一個(gè)IP代理模塊2. Python編寫(xiě)nmap掃描工具3. Ajax返回值類(lèi)型與用法實(shí)例分析4. 解決ajax請(qǐng)求后臺(tái),有時(shí)收不到返回值的問(wèn)題5. HTML 絕對(duì)路徑與相對(duì)路徑概念詳細(xì)6. 如何在jsp界面中插入圖片7. 使用FormData進(jìn)行Ajax請(qǐng)求上傳文件的實(shí)例代碼8. .NET6打包部署到Windows Service的全過(guò)程9. .Net Core和RabbitMQ限制循環(huán)消費(fèi)的方法10. 基于javaweb+jsp實(shí)現(xiàn)企業(yè)財(cái)務(wù)記賬管理系統(tǒng)
