正则.*+?()[]{}^$|\(?<=)(?=)(?!<)(?!)
号外
公众号的名字还是简单易懂,一看起来就知道是干嘛的,虽然CodeNone不错,但其实是模仿一个公众号的前辈,而且英文总是有点不舒服。为了更加的自己一点,特改名为
咖啡编程
两个含义,一个是cafe babe,一个是吸收宇宙能量,刚刚好全覆盖自身的情况,dddd。正文
是不是到处可见的正则表达式
是不是很羡慕别人熟练地使用正则表达式而自己不会
是不是想要入门正则表达式要么是长视频要么是一本书
是不是觉得这种方式看着很营销,很不舒服
没错,上述除了正则表达式这五个字,其他全是废话,接下来要说的可能不一定很全,但是绝对能达到28原则,也就是掌握20%的知识应对80%的工作场景。但是,要想真正掌握这5个字,无他,唯手熟而
文章图片
正则表达式所有都是紧挨着的,所有都是字符,抛弃掉“加空格漂亮,使用+号进行拼接”的想法基础
写什么匹配什么
cat =>I have some pets, cats, dogs and pigs. ??
Cat => The cat sat on the mat. ?
123 => 5678912345 ??
123 => 12456 ?
元字符
这也是网上的说法,其实按照我的来就是特殊字符
. * + ?
.
表示匹配除换行外任一字符
.at
=> 表示at紧跟着某个字符 => The cat sat on the mat. => 有3处匹配c.t
=> 表示c紧跟着某个字符紧跟着t => The cat sat on the mat. => 有1处匹配
*
匹配前面的表达式0次或者多次
[a-z]*
=> 表示匹配0个或者多个字符 => The cat sat on the mat => 有13处匹配没错,就是有13处匹配,1: “” 2: “he" 3: "" 4: "cat" 5: "" 6: "sat" 7: "" 8: "on" 9: "" 10: "the" 11: "" 12: "mat." 13: ""。
文章图片
文章图片
.
是表示任意一个字符,*
是表示0个或者多个前面一个字符,那么.*
就表示任意字符.\*
=> 任意字符 => The cat sat on the mat => 2处匹配1: "The cat sat on the mat" 2: ""
文章图片
+
和*
的作用是一样的,不过*
是匹配0个或以上的字符,+
是匹配1个或以上的字符,其他就不在赘述
() [] {}?
号作用也是如此,不过?
是字符可选,则匹配0个或者1个字符
()
括号中的内容视作一个整体
(c.)t
=> 表示c跟着的某个字符作为一个整体,后面再跟一个t === c.t 。没错,在这个例子里面和这个完全等价 => The cat sat on the mat => 1处匹配(c|s|m)at
=> 表示括号中的字符中的任一个跟at => The cat sat on the mat => 3处匹配(c.|.a)t
=> 符合c.t或者.at这两种正则表达式 => The cat sat on the mat => The cat sat on the mat => 3处匹配[] 匹配中括号内的任一内容
[csm]at
=> 表示cat/sat/mat
=> The cat sat on the mat => 3处匹配[cm]at[.b]
=> 表示cat./catb/mat./matb
四种情况 => The cat sat on the mat. Hello world => 1处匹配 => 括号里的.和*都是字符,并没有上述特殊含义{num} 是个量词动作,表示匹配num个前面的字符,{a, b}表示匹配大于等于a,小于等于b个前面的字符,都符合的情况下,匹配b个前面的字符
[ld]{2,5}
=> 表示2~5个l或者2~5个d或者2~5个两个字符组合的(并不是作为一体) => Hello Worldddd dddd! => 注意这里的d是全部连起来的,为了区分展示的时候是空格 => 3处匹配 => ll ldddd dddd第一个匹配没啥好说的,2个l,第二个为什么是ldddd而不是ld,ldd,是因为符合的情况下优先大的边界
Math.max(2, 5) = 5
^ $
^ 以某个字符开始的字符串
^T
=> 以T开始的字符串 => The cat sat on the mat => 匹配1处,只会匹配一个T => 如果是^The
自然也只能匹配The3个字符在正常情况下^都是表示以上含义,但是在[]里使用的时候,就是取反的意思
[^(^T)]t
=> 不以T开始的字符串但是后面跟着t => The cat sat on the mat => 匹配4处$以某个字符结尾的字符串就不再赘述但是值得注意的是
$
放在[]
里没有任何特殊意义,单纯指的是'$'这个字符| \
|
就是代码中的或,没有其他意义
(c|s|m)at => cat/sat/mat => The cat sat on the mat => 3处匹配
\
表示转译字符
这个对于开发人员来说比较简单,这里就不在赘述文章图片
一般处理单纯地转译之外,还会配合一些字符来表示某个含义
\d
=> digital => 匹配数字 => \D
=> 前者取反,即匹配非数字\w
=> words => 匹配数字和大小写英文字母 => \W
=> 前者取反\s
=> space => 匹配空格字符 => \S
=> 前者取反还有一些平常使用的
\n
=> next line => 换行\t
=> tab => 制表符,在程序里面写的话,一般是4个字符\r
=> return => 匹配回车符断言
所谓断言简单来说就是匹配但是不包含,这个可能平常会使用得比较多,比如场景需要匹配
xxres
,但是不要xx只要res。断言分为正向断言和负向断言,所谓正负向断言分别对应存在不存在;又分为先行后行断言,分别对应不要的东西在前面还是后面,比如xxres不要xx只要res就需要使用先行断言。
组成格式以?开头,正向断言为=,负向断言为!,先行断言为<,同时一定要包裹在()内。
- ?=:正向先行断言
- ?<=:正向后行断言
- ?!:负向先行断言
- ?
?<=
正向后行断言,不要的东西在前面的时候使用
(?<=[csm])at
=> 匹配cat/sat/mat,但是不要第一个字母,输出at => The cat sat on the mat. => 3处匹配文章图片
?=
:正向先行断言,不要东西在后面的时候使用
[\w](?=at)
=> 任一一个字母或者数字后面跟着at,但是只要字母,后面的at不要 => The cat sat on the mat. => 匹配3处文章图片
? 负向后行断言,不匹配的东西在前面
(? => 不包含The 或者the 但是后面跟着sat或者mat => The cat, cat sat ont mat => 3处匹配,第一个cat没有匹配是因为前面是The 。注意,这里的The或the后面是跟着空格的。
文章图片
?!
负向前行断言,不配的东西放在后面
(T|t)he(?!\scat)
=> 匹配The或the,且后面不跟着(空格)cat => The cat sat on the mat. => 匹配一处,因为前面的The后面跟着(空格)cat
文章图片
除此之外,还有一个是比较类似的格式(?:)
是说匹配,但是也要,但是说是什么非捕获匹配,总之我是没法理解的,在菜鸟教程里有这样一段话
文章图片
但是我试了试,不用?:也是没啥区别呀
文章图片
文章图片
创作不易,如果对你有帮助,欢迎点赞,收藏和分享啦!
下面是个人公众号,有兴趣的可以关注一下,说不定就是你的宝藏公众号哦,基本2,3天1更技术文章!!!
【正则.*+?()[]{}^$|\(?<=)(?=)(?!<)(?!)】
文章图片
推荐阅读
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- 我眼中的佛系经纪人
- Python爬虫|Python爬虫 --- 1.4 正则表达式(re库)
- FBI怎么和恐怖分子谈判
- 17|17 关山松 第二课作业#公众号项目# D20
- 吃一吃,春城的米线
- java|java 常用知识点链接
- 茶事|茶事 | 单丛里的一泡奇葩
- 网络|一文彻底搞懂前端监控
- 正则匹配
- 正则表达式中增加变量