如何用python正则表达式匹配字符串?-Python教程

资源魔 44 0

若何用python正则表白式婚配字符串?

用python正则表白式婚配字符串的办法:

1.单个地位的字符串婚配

这类状况咱们能够应用这个(.+?)正则表白式来提取. 举例,一个字符串"a123b",假如咱们想提取ab之间的值123,能够应用findall合营正则表白式,这样会前往一个蕴含以是合乎状况的list,代码以下:

import re
str = "a123b"
print re.findall(r"a(.+?)b",str)#
输入['123']

1.1贪心以及非贪心婚配

假如咱们有一个字符串”a123b456b”,假如咱们想婚配a以及最初一个b之间的一切值而非a以及第一个呈现的b之间的值,能够用?来管制正则贪心以及非贪心婚配的状况. 代码以下:

import re
str = "a123b456b"
print re.findall(r"a(.+?)b", str)
#输入['123']#?管制只婚配0或1个,以是只会输入以及比来的b之间的婚配状况
print re.findall(r"a(.+)b", str)
#输入['123b456']
print re.findall(r"a(.*)b", str)
#输入['123b456']

1.2多行婚配

假如你要多行婚配,那末需求加之re.S以及re.M标记. 加之re.S后, .将会婚配换行符,默许.没有会婚配换行符. 代码以下:

str = "a23b\na34b"
re.findall(r"a(\d+)b.+a(\d+)b", str)
#输入[]
#由于不克不及解决str两头有\n换行的状况
re.findall(r"a(\d+)b.+a(\d+)b", str, re.S)
#s输入[('23', '34')]

加之re.M后,^$标记将会婚配每一一行,默许^以及$只会婚配第一行. 代码以下:

str = "a23b\na34b"
re.findall(r"^a(\d+)b", str)
#输入['23']
re.findall(r"^a(\d+)b", str, re.M)
#输入['23', '34']

2. 延续多个地位的字符串婚配

这类状况咱们能够应用(?P<name>…)这个正则表白式来提取. 举例,假如咱们有一行webserver的access日记:'192.168.0.1 25/Oct/2012:14:46:34 "GET /api HTTP/1.1" 200 44 "http://abc.com/search" "Mozilla/5.0"',咱们想提取这行日记外面一切的内容,能够写多个(?P<name>expr)来提取,此中name能够更改成你为该地位字符串定名的变量,expr改为提取地位的正则便可. 代码以下:

import re
line ='192.168.0.1 25/Oct/2012:14:46:34 "GET /api HTTP/1.1" 200 44 "http://abc.com/search" 
"Mozilla/5.0"'
reg = re.compile('^(?P<remote_ip>[^ ]*) (?P<date>[^ ]*) "(?P<request>[^"]*)" 
(?P<status>[^ ]*) (?P<size>[^ ]*) "(?P<referrer>[^"]*)" "(?P<user_agent>[^"]*)"')
regMatch = reg.match(line)
linebits = regMatch.groupdict()
print linebits
for k, v in linebits.items() :
    print k+": "+v

输入的后果为:

status: 200
referrer:  
request: GET /api HTTP/1.1
user_agent: Mozilla/5.0
date: 25/Oct/2012:14:46:34size: 44
remote_ip: 192.168.0.1

保举教程:《python视频教程》

以上就是若何用python正则表白式婚配字符串?的具体内容,更多请存眷资源魔其它相干文章!

标签: 字符串 Python python教程 python编程 python使用问题

抱歉,评论功能暂时关闭!