pythonw函数 pythonwhile函数

Python常用的正则表达式处理函数详解 正则表达式是一个特殊的字符序列,用于简洁表达一组字符串特征,检查一个字符串是否与某种模式匹配 , 使用起来十分方便 。
在Python中,我们通过调用re库来使用re模块:
import re
下面介绍Python常用的正则表达式处理函数 。
re.match函数
re.match 函数从字符串的起始位置匹配正则表达式,返回match对象,如果不是起始位置匹配成功的话,match()就返回None 。
re.match(pattern, string, flags=0)
pattern:匹配的正则表达式 。
string:待匹配的字符串 。
flags:标志位,用于控制正则表达式的匹配方式 , 如:是否区分大小写 , 多行匹配等等 。具体参数为:
re.I:忽略大小写 。
re.L:表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境 。
re.M:多行模式 。
re.S:即 . ,并且包括换行符在内的任意字符(. 不包括换行符) 。
re.U:表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库 。
re.X:为pythonw函数了增加可读性,忽略空格和 # 后面的注释 。
import re#从起始位置匹配r1=re.match('abc','abcdefghi')print(r1)#不从起始位置匹配r2=re.match('def','abcdefghi')print(r2)
运行结果:
其中,span表示匹配成功的整个子串的索引 。
使用group(num) 或 groups() 匹配对象函数来获取匹配表达式 。
group(num):匹配的整个表达式的字符串,group() 可以一次输入多个组号,这时它将返回一个包含那些组所对应值的元组 。
groups():返回一个包含所有小组字符串的元组,从 1 到 所含的小组号 。
import res='This is a demo'r1=re.match(r'(.*) is (.*)',s)r2=re.match(r'(.*) is (.*?)',s)print(r1.group())print(r1.group(1))print(r1.group(2))print(r1.groups())print()print(r2.group())print(r2.group(1))print(r2.group(2))print(r2.groups())
运行结果:
上述代码中的(.*)和(.*?)表示正则表达式的贪婪匹配与非贪婪匹配 。
re.search函数
re.search函数扫描整个字符串并返回第一个成功的匹配,如果匹配成功则返回match对象 , 否则返回None 。
re.search(pattern, string, flags=0)
pattern:匹配的正则表达式 。
string:待匹配的字符串 。
flags:标志位,用于控制正则表达式的匹配方式,如:是否区分大小写 , 多行匹配等等 。
import re#从起始位置匹配r1=re.search('abc','abcdefghi')print(r1)#不从起始位置匹配r2=re.search('def','abcdefghi')print(r2)
运行结果:
使用group(num) 或 groups() 匹配对象函数来获取匹配表达式 。
group(num=0):匹配的整个表达式的字符串 , group() 可以一次输入多个组号,这时它将返回一个包含那些组所对应值的元组 。
groups():返回一个包含所有小组字符串的元组,从 1 到 所含的小组号 。
import res='This is a demo'r1=re.search(r'(.*) is (.*)',s)r2=re.search(r'(.*) is (.*?)',s)print(r1.group())print(r1.group(1))print(r1.group(2))print(r1.groups())print()print(r2.group())print(r2.group(1))print(r2.group(2))print(r2.groups())
运行结果:
从上面不难发现re.match与re.search的区别:re.match只匹配字符串的起始位置,只要起始位置不符合正则表达式就匹配失败 , 而re.search是匹配整个字符串,直到找到一个匹配为止 。
re.compile 函数
compile 函数用于编译正则表达式,生成一个正则表达式对象,供 match() 和 search() 这两个函数使用 。
re.compile(pattern[, flags])
pattern:一个字符串形式的正则表达式 。
flags:可选 , 表示匹配模式,比如忽略大小写,多行模式等 。
import re#匹配数字r=re.compile(r'\d ')r1=r.match('This is a demo')r2=r.match('This is 111 and That is 222',0,27)r3=r.match('This is 111 and That is 222',8,27)print(r1)print(r2)print(r3)
运行结果:
findall函数
搜索字符串,以列表形式返回正则表达式匹配的所有子串,如果没有找到匹配的,则返回空列表 。
需要注意的是 , match 和 search 是匹配一次,而findall 匹配所有 。
findall(string[, pos[, endpos]])
string:待匹配的字符串 。
pos:可选参数,指定字符串的起始位置,默认为0 。
endpos:可选参数,指定字符串的结束位置 , 默认为字符串的长度 。
import re#匹配数字r=re.compile(r'\d ')r1=r.findall('This is a demo')r2=r.findall('This is 111 and That is 222',0,11)r3=r.findall('This is 111 and That is 222',0,27)print(r1)print(r2)print(r3)
运行结果:
re.finditer函数
和 findall 类似,在字符串中找到正则表达式所匹配的所有子串,并把它们作为一个迭代器返回 。
re.finditer(pattern, string, flags=0)
pattern:匹配的正则表达式 。
string:待匹配的字符串 。
flags:标志位 , 用于控制正则表达式的匹配方式,如是否区分大小写,多行匹配等 。
import rer=re.finditer(r'\d ','This is 111 and That is 222')for i in r:print (i.group())
运行结果:
re.split函数
将一个字符串按照正则表达式匹配的子串进行分割后,以列表形式返回 。
re.split(pattern, string[, maxsplit=0, flags=0])
pattern:匹配的正则表达式 。
string:待匹配的字符串 。
maxsplit:分割次数,maxsplit=1分割一次,默认为0,不限次数 。
flags:标志位,用于控制正则表达式的匹配方式 , 如:是否区分大小写,多行匹配等 。
import rer1=re.split('\W ','This is 111 and That is 222')r2=re.split('\W ','This is 111 and That is 222',maxsplit=1)r3=re.split('\d ','This is 111 and That is 222')r4=re.split('\d ','This is 111 and That is 222',maxsplit=1)print(r1)print(r2)print(r3)print(r4)
运行结果:
re.sub函数
re.sub函数用于替换字符串中的匹配项 。
re.sub(pattern, repl, string, count=0, flags=0)
pattern:正则中的模式字符串 。
repl:替换的字符串,也可为一个函数 。
string:要被查找替换的原始字符串 。
count:模式匹配后替换的最大次数,默认0表示替换所有的匹配 。
import rer='This is 111 and That is 222'# 删除字符串中的数字r1=re.sub(r'\d ','',r)print(r1)# 删除非数字的字符串r2=re.sub(r'\D','',r)print(r2)
运行结果:
到此这篇关于Python常用的正则表达式处理函数详解的文章就介绍到这了,希望大家以后多多支持pythonw函数!
python中,‘w’和target紧接着的那个点是什么意思?有何作用?对于A1: Open 函数中 'w' 代表以写入模式打开文件;
对于A2: target 代表已经打开的文件实例 。
target.truncate([size]) #把文件裁成规定的大?。系氖遣玫降鼻拔募僮鞅昙堑奈恢?。如果size比文件的大小还要大,依据系统的不同可能是不改变文件,也可能是用0把文件补到相应的大小,也可能是以一些随机的内容加上去 。
与大多数编程语言相同,python正则表达式里使用"\"作为转义字符 , Python里的原生字符串很好地解决了这个问题,这个例子中的正则表达式可以使用r"\\"表示 。
python用open打开文件读写,“w”会替换,“a”多次调用函数会重复print语句print [expression ("," expression)* [","]]printexpression [("," expression)[","]][]表示可选项,*表示零次或多次重复, 表示至少一次重复 。print是一种特殊的语句,它用于在stdout输出字符串 。print有多种使用形式:print xprint x,yprint x,y,printobject, x, y第1行是print的最普通的形式 。第2行用print一次输出多个变量值,print会在变量之间自动加上一个"空格" 。第3行与第2行的不同是在y的后面多了一个",",这个逗号用来阻止print在打印出x和y的值后,自动附加上一个“\n”字符 。第4行,是一种输出重定向的形式,也就是说把x和y的值输出到object的write方法中 , 这同时也表明object必须有一个write方法 。在python中,print语句其实只是一种简写形式,是下面这段程序的简写:import syssys.stdout.write(str(x)'\n')上面这两行合起来就是“print x”这一句 。可以看出,print是调用str()函数来产生字符串的 , 并且会在输出的字符串后加上一个'\n'字符 。由于print实际是上调用了stdout的write方法 。程序员也可以把stdout赋为别的值,从面实现print的输出重定向的功能 。比如:import sysx="I'm here!"fp=file('log.txt','a')sys.stdout=fpprint x第4行改变了stdou的值,而且fp也是一个文件对象,有一个write方法 。这一小段代码的功能是把print的输出全部以appand的模式写到了文件log.txt中 。在第4行之后的print语句,都是这种功能 。现在假设要恢复print输出到标准输出的功能 , 那么就需要让stdout重新指向标准输出,可以使用如下的方式:sys.stdout=sys.__stdout__在sys.__stdout__中保存有指向标准输出的信息,通过这行代码 , print可以恢复为原来的功能 。有时候要在这两种模式之间换来换去,一会要输出到文件中 , 一会要输出到标准输出中,通过改变sys.stdout的值可以实现,不过太麻烦,python提供了另外一种简便的print语句形式,来解决这种需求:printobject,x,y能过这个符号 , 可以实现输出重定向到object,当然object必须有一个write方法 。否则会出现AttributeError 。注意 , 在这种print形式中,sys.stdout并没有改变,也就是说在这之后的print语句,具有的还是标准功能 。虽然print语句实际上sys.stdou.write(),但sys模块的import工作并不需要程序员操心,python会自动处理 。类似于print的输出,当用内置函数raw_input([prompt])进行读取操作时,实际上用的是sys.stdin.read()方法 。也可以通过改变stdin的值来控制入操作 。相应的也有一个sys.__stdin__用来保存标准输入的信息 。
【pythonw函数 pythonwhile函数】关于pythonw函数和pythonwhile函数的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站 。

    推荐阅读