匹配中文的的正規表示式怎麼寫,正規表示式如何匹配漢字？

1樓：寶寶心裡很苦啊

你好復： bs4的語法你應該知道吧； python正則表達制式： ## 總結## ^ 匹配字串的開始。

## $ 匹配字串的結尾。## \b 匹配一個單詞的邊界。## \d 匹配任意數字。

## \d 匹配任意非數字字元。## x? 匹配一個可選的 x 字元 (換言之，它匹配 1 次或者...

2樓：匿名使用者

[\u4e00-\u9fa5]*

正規表示式如何匹配漢字？

3樓：匿名使用者

去掉 ^ 和 $ 試試 [\u4e00-\u9fa5]

\u數字，在perl、pcre中要改為：

[\x-\x]

4樓：匿名使用者

按.***的標準，\w本來就是可以匹配：漢字，字母，數字，下劃線。的所以一般\w可以滿足需求了。

如果需要排除字母數字的話，可以這樣：

(?![a-za-z0-9_])\w

>_>這樣寫估計效率不高

所以一般來說還是直接匹配指定的unicode碼\unnnn unicode**中十六進位制**為nnnn的字元漢字(字元) [\u4e00-\u9fa5]中文及全形標點符號(字元) [\u3000-\u301e\ufe10-\ufe19\ufe30-\ufe44\ufe50-\ufe6b\uff01-\uffee]

求一個匹配中文的正規表示式 100

5樓：匿名使用者

你這什麼語言啊？

copy

word 是bai

所有小寫英文字母

du[a-z]

所有大寫英文字母[a-z]

所有西文字元

zhi[^1-^127]

所有中文漢字和中文標點

dao[!^1-^127]

所有中文漢字（cjk統一字元）[一-龥] or [一-﨩]所有中文標點[!一-龥^1-^127]

所有非數字字元[!0-9]

其他語言可以類推

6樓：匿名使用者

(?<=「)[\u4e00-\u9fa5]+(?=」)

以上為簡單答案，也有複雜的，主要是關於「什麼是漢字」，可參考以前回答過的類似問題。

7樓：匿名使用者

「[^x00-xff]+」

雙引號是英文的就換成英文的，是中文的就換成中文的

8樓：匿名使用者

[\u4e00-\u9fa5]*

如何用正規表示式匹配漢字？

9樓：li小八

先用靚湯或正則找到這個節點，再用上面的字元組匹配。

假設這個節點只有一個，用法如下：

import reimport requests as reqfrom bs4 import beautifulsoupurl = '***'html = req.get(url).textbs = beautifulsoup(html)span = bs.

find_all('span', 'pro-title')'''span = re.findall('[^<]+', html)s = span[0]m = re.findall('[\u4e00-\u9fa5]+', s)'''s = str(span)m = re.

findall('[\u4e00-\u9fa5]+', s)print(m)

正規表示式怎麼匹配單個漢字

10樓：匿名使用者

([\u4e00-\u9fa5])+

這樣會把匹配結果放到匹配集的第一個子集中去,你就可以獲取到了

11樓：夢裡尋你我他

[\u4e00-\u9fa5]

求匹配出中文的正規表示式 15

12樓：匿名使用者

童裝男童褲子冬款棉褲加絨加厚兒童運動褲大男童冬褲女童冬裝長褲

匹配中文的的正規表示式怎麼寫,正規表示式如何匹配漢字？

正規表示式要匹配雙引號怎麼匹配

php正規表示式如何匹配小括號，java正規表示式匹配小括號內的內容

怎麼用正規表示式匹配下面的的超連結

匹配中文的的正規表示式怎麼寫,正規表示式如何匹配漢字？

正規表示式要匹配雙引號怎麼匹配

php正規表示式如何匹配小括號，java正規表示式匹配小括號內的內容

怎麼用正規表示式匹配下面的的超連結

相關推薦