正则表达式筛选汉字

记录 z197 928次浏览 已收录 用手机观看

什么是正则表达式

正则表达式(Regular Expression,通常缩写为 regex 或 regexp)是一种强大的文本模式匹配和搜索工具,用于在文本中查找、匹配和操作特定模式的字符串。

它是一种基于字符串模式的编程技术,允许你定义一种模式,然后使用该模式来搜索、替换或验证字符串。

正则表达式通常由一系列字符和特殊符号组成,用于描述要匹配的文本模式。这些模式可以包括字符类、量词、分组、选择等元素,允许你精确地指定要匹配的文本的规则。

正则表达式用途

文本搜索和匹配: 正则表达式可以用于在文本中查找特定模式的字符串,例如查找电子邮件地址、URL、日期等。
文本替换: 你可以使用正则表达式来查找并替换文本中的特定模式,例如将所有匹配的字符串替换为其他内容。
输入验证: 正则表达式可以用于验证用户输入是否符合特定的格式或规则,例如检查电话号码、邮政编码、密码等的有效性。
数据提取: 正则表达式可以用于从文本中提取特定的数据,例如从日志文件中提取信息、从HTML中提取标签内容等。
正则表达式是在许多编程语言中都得到支持的重要工具,包括Python、Java、JavaScript、Perl、C#等。

每种编程语言都有自己的正则表达式库和函数,允许开发人员在应用程序中使用正则表达式来处理文本数据。

学会使用正则表达式可以大大提高文本处理的效率和精确性。

正则表达式也可以复杂表示,需要一定的学习和实践才能熟练掌握。

筛选字符串至段位

查找”abc”到段尾。

abc.+

筛选字符串

查找所有后面既不是斜杠 “/” 也不是小写字母 “a” 的冒号 “:”

:(?![/a])

筛选文汉字

如果想匹配在正则表达式中前面是汉字或者不是汉字的情况,可以使用负向零宽断言来实现。

负向零宽断言用于在匹配时检查某个位置之前不出现特定模式。

以下是一个正则表达式示例,用于匹配前面不是汉字的情况:

^(?![\u4e00-\u9fa5])

正则表达式常用操作符

https://z197.com/blog/regular-expression-operator.html