正则表达式基础
本文最后更新于:2023年6月17日 上午
正则表达式是一种用于匹配和操作文本的强大工具,它是由一系列字符和特殊字符组成的模式,用于描述要匹配的文本模式。
正则表达式可以在文本中查找、替换、提取和验证特定的模式。
命令行展开
1 |
|
命令别名
1 |
|
命令历史
1 |
|
快捷键
1 |
|
查询命令位置
1 |
|
Linux正则表达式(Regular Expression,REGEXP)
- grep:文本过滤工具,(模式:pattern)
- sed:stream editor,流编辑器;文本编辑器
- awk:Linux的文本报告生成器(格式化文本),Linux中是gawk
正则表达式的分类
- 基本正则表达式(BRE,basic regular exporession)
BRE对应的字符有 ^ $ . [] *
- 扩展正则表达式(ERE,extended regular expression)
ERE在BRE的基础上增加 () {} ? + | 等字符
基本正则表达式BRE集合
- 匹配字符
- 匹配次数
- 位置锚定
符号 | 作用 |
---|---|
^ | 尖角号,用于模式的最左侧,如”^oldboy”,匹配oldboy单词开头的行 |
$ | 美元符,用于模式的最右侧,如”oldboy$”,表示以oldboy单词结尾的行 |
^$ | 组合符,表示空行 |
. | 匹配任意一个有且只有一个字符,不能匹配空行 |
\ | 转义字符,让特殊含义的字符还原本意,例如\. 表示小数点 |
* | 匹配前一个字符(连续出现)0次或1次以上,重复0次代表空,即匹配所有内容 |
.* | 组合符,匹配所有内容 |
^.* | 组合符,匹配任意多个字符开头的内容 |
.*$ | 组合符,匹配任意多个字符结尾的内容 |
[abc] | 匹配[]内的任意一个字符,a或b或c,可以写为[a-c] |
[^abc] | 匹配除了^后面的任意字符,a或b或c,^表示对[abc]的取反 |
扩展正则表达式ERE集合
扩展正则表达式必须用grep -E
才能生效
字符 | 作用 |
---|---|
+ | 匹配前一个字符一次或多次 |
[:/]+ | 匹配[] 内的”:”或者”/“字符一次或多次 |
? | 匹配前一个字符0次或一次 |
| | 表示或 ,同时过滤多个字符串 |
() | 分组过滤,被括起来的内容表示一个整体 |
a{n,m} | 匹配前一个字符最少n 次,最多m 次 |
a{n,} | 匹配前一个字符最少n次 |
a{n} | 匹配前一个字符正好n次 |
a{,m} | 匹配前一个字符最多m次 |
参考
正则表达式基础
http://example.com/2023/06/12/正则表达式基础/