正则表达式应用，常用取值表（记录）

正则表达式查询表

字符	描述	场景
\	转义	转义场景 \
^	匹配输入字符串的开始位置。如果设置了 RegExp 对象的 Multiline 属性，^ 也匹配 ‘\n’ 或 ‘\r’ 之后的位置。	取a开头的字符串 ^a.*
$	匹配输入字符串的结束位置。如果设置了RegExp 对象的 Multiline 属性，$ 也匹配 ‘\n’ 或 ‘\r’ 之前的位置。	取a开头b结尾 ^a.*b$

| 匹配前面的子表达式零次或多次。| zo* 能匹配 “z” 以及 “zoo”。* 等价于{0,}
+| 匹配前面的子表达式一次或多次。| ‘zo+’ 能匹配 “zo” 以及 “zoo”，但不能匹配 “z”。+ 等价于 {1,}
?| 匹配前面的子表达式零次或一次.| “do(es)?” 可以匹配 “do” 或 “does” 中的”do” 。? 等价于 {0,1}。
{n}|n 是一个非负整数。匹配确定的 n 次。|’o{2}’ 不能匹配 “Bob” 中的 ‘o’，但是能匹配 “food” 中的两个 o。
{n,}|n 是一个非负整数。至少匹配n 次。|’o{2,}’ 不能匹配 “Bob” 中的 ‘o’，但能匹配 “foooood” 中的所有 o。’o{1,}’ 等价于 ‘o+’。’o{0,}’ 则等价于 ‘o*’
{n,m}|m 和 n 均为非负整数，其中n <= m。最少匹配 n 次且最多匹配 m 次。|”o{1,3}” 将匹配 “fooooood” 中的前三个 o。’o{0,1}’ 等价于 ‘o?’。请注意在逗号和两个数之间不能有空格。
?|当该字符紧跟在任何一个其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 后面时，匹配模式是非贪婪的。|非贪婪模式尽可能少的匹配所搜索的字符串，而默认的贪婪模式则尽可能多的匹配所搜索的字符串。对于字符串 “oooo”，’o+?’ 将匹配单个 “o”，而 ‘o+’ 将匹配所有 ‘o’。
.|匹配除 “\n” 之外的任何单个字符。| 要匹配包括 ‘\n’ 在内的任何字符，请使用象 ‘[.\n]’ 的模式。
x|y| 匹配 x 或 y。|’z|food’ 能匹配 “z” 或 “food”。’(z|f)ood’ 则匹配 “zood” 或 “food”。

常用案例演示

1
2
3

# -*- coding:utf-8 -*-
import re
str1 = 'ai0by123'

提取a开头的字符串

1	regexStr = "^a.*"

提取a开头b结尾字符串

1	regexStr = "^a.*3$"

提取最右边符合条件的值,贪婪

1	regexStr = ".(a.b).*" # 贪婪，取a到b之间，右边开始取，取最右边符合条件的

提取最左边符合条件的值，非贪婪

1	regexStr = ".?(a.?b).*" # 非贪婪，取a到b之间的值含a和b，从左往右只取一次

提取符合集合内的值，或运算

1	regexStr = "((ai00000by\|ai0by)123)" # 或运算，符合其中一种即可

提取出生日期

str1 = 'XXX 出生于2008年12月6日'
str1 = 'XXX 出生于2008/12/6'
str1 = 'XXX 出生于2008-12-6'
str1 = 'XXX 出生于2008-12-06'
str1 = 'XXX 出生于2008-12'
regexStr = ".*出生于(\d{4}[年/-]\d{1,2}([月/-]\d{1,2}|[月/-]$|$))"

提取图片url,其他网站同理

str1 = '地址：https://www.ttbcdn.com/d/file/p/2018-02-17/g4edlvxmmyi9627.jpg'
# 取整串地址
regexStr = ".*https.*jpg$"
# 取XXX.jpg png gif 等
regexStr = ".*/(.*.(jpg|gif|png))$"
# 取2018-02-17/g4edlvxmmyi9627.jpg png gif等
regexStr = ".*/(\d{4}-\d{2}-\d{2}/(.*.(jpg|gif|png)))$"

收尾提取字符串

reMatch = re.match(regexStr,str1)
if reMatch:
	print (reMatch.group(1))
else:
	print('No')

正则表达式应用，常用取值表（记录）

正则表达式 查询表

常用案例演示

收尾提取字符串

谢谢大爷~

正则表达式查询表