python正则表达式模块re-python黑洞网

本站消息

站长简介/公众号

出租广告位,需要合作请联系站长

遥远的她

1089

文章

890546

访问

+关注

分类

暂无分类

日期归档

2024-11(1)

python正则表达式模块re

发布于2019-08-07 16:51 阅读(1322) 评论(0) 点赞(3) 收藏(0)

正则表达式的特殊元素

匹配符号	描述
'.'(点dot)	在默认模式下，它匹配除换行符之外的任何字符。如果指定了DOTALL标志，则匹配包括换行符在内的任何字符
'^'(Caret)	匹配以字符串开头,找到后返回匹配的字段 import re print(re.findall("^abc","abcsaf")) 打印结果:['abc']
'$'	匹配以字符串结尾,找到后返回匹配的字符串 import re print(re.findall("abc$","safabc")) 打印结果:[abc]
'*'	匹配星号前面字符,星号前面的字符可以没有,也可以有多个,如ab,将修饰字符b,字符b可以没有只匹配字符a,也可以有多个b.所以ab可以匹配“a”、“ab”或“abbbbb”后面跟着任意数量的“b”.如下: import re print(re.findall("ab*","ampabnabbbbbqq")) 打印结果:['a', 'ab', 'abbbbb']
'+'	匹配+号前字符出现的次数,如:ab+,会匹配ab,和a加上任意数量的b.如abbbb import re print(re.findall("ab+","ampabnabbbbbqq")) 打印结果:['ab', 'abbbbb']
'?'	匹配?前字符出现的次数,字符可以是0次.最多是一次.如ab?,只能匹配a或者ab import re print(re.findall("ab?","ampabnabbbbbqq")) 打印结果:['a', 'ab', 'ab']
'*?'	匹配?前字符出现的次数,被匹配的字符可以出现0次,最多是1次.但是?具有惰性,当匹配到第一个字符后,就不会继续在匹配.如ab?可以匹配a或者ab,但是当出现字符a后就不会在去匹配字符b了.如下: import re print(re.findall("ab?","ampabcabbbbbqq")) 打印结果:['a', 'a', 'a']
'+?'	匹配+?前字符出现的次数,+?也是具有惰性,被匹配的字符最少出现1次.仅匹配+?前面的字符串.匹配到后就结束,不会在匹配后边的结果如ab+?只能匹配ab.如果ab+.就可以匹配ab,abbb也就是a加任意数量的b但是如果事ab+? 则只能匹配到ab便结束了. 如下: import re print(re.findall("ab*?","ampabcabbbbbqq")) 打印结果:['ab', 'ab']
'??'	匹配??前字符出现的次数,??也是具有惰性,匹配到第一个字符后便不会继续向后匹配如:ab?? 只匹配到a便结束了. import re print(re.findall("ab??","ampabcabbbbbqq")) 打印结果:['a', 'a', 'a']
{m}	匹配m个被修饰的字符,如ab{2},将匹配abb 如下: import re print(re.findall("ab{2}","ampaabbcabbbbbqq")) 打印结果:['abb', 'abb']
{m,n}	匹配m到n范围内的被修饰符的个数,如ab{1,3}.将匹配ab,abb,abbb 如下: import re print(re.findall("ab{1,3}","abmpabbcabbbbbqq")) 打印结果:['ab', 'abb', 'abbb']
{m,n}?	有?号将具有惰性机制,将只能匹配到m个,如ab{1,3}?,将只能匹配ab 如下: import re print(re.findall("ab{1,3}?","abmpabbcabbbbbqq")) 打印结果:['ab', 'ab', 'ab']
\|	或的意思,匹配两边的字符.如a\|b将匹配a或者匹配b 如下: import re print(re.findall("a\|b","abmpabbcaqq")) 打印结果:['a', 'b', 'a', 'b', 'b', 'a']
'...'	将匹配引号内点数量的任意类型字符为一个组,如'...',将匹配3个任意类型字符做为一组如下: import re print(re.findall("...","12abmpabbcaqq")) 打印结果:['12a', 'bmp', 'abb', 'caq']
'?...'	匹配?前的字符,被匹配的字符可以存在,也可以不存在,后面的...是字符数量. 如'a?...' 将匹配a+三个任意字符,或者任意三个字符. 如下: import re print(re.findall("a?...","12abmpabbcaqqo")) 打印结果:['12a', 'bmp', 'abbc', 'aqqo']
\	转义字符
[]	用于表示一组字符,如[0-9]表示匹配0到9的数字,[a-z]匹配a-z的所有字符,如果带有-必须是ASCII码表中从小到大的顺序进行排列.如[9-0]是错误的
\A	匹配以哪个字符串或字符开头,如下: import re print(re.findall("\Aab","abcdavcdsb")) 检测是否已ab开头,不是打印[''] 打印结果:['ab']
\d	只匹配数字 import re print(re.findall("\d"," abcd12avc4dsb ")) 打印结果:['1', '2', '4']
\D	匹配除了数字以外任意字符 import re print(re.findall("\D","abcd12avc4dsb")) 打印结果:['a', 'b', 'c', 'd', 'a', 'v', 'c', 'd', 's', 'b']
\s	匹配空白,制表符如[" "\t\n\r\f\v]等如下: import re print(re.findall("\s","ab cd12a\tvc\n4dsb")) 打印结果:[' ', '\t', '\n']
\S	匹配除了空白,制表符[" "\t\n\r\f\v]以外的任意字符,如下: import re print(re.findall("\S","ab cd12a\tvc\n4dsb")) 打印结果:['a', 'b', 'c', 'd', '1', '2', 'a', 'v', 'c', '4', 'd', 's', 'b']
\w	匹配字母,数字,下划线如下: import re print(re.findall("\w","ab_cd1%$2a\tvc\n4dsb")) 打印结果:['a', 'b', '_', 'c', 'd', '1', '2', 'a', 'v', 'c', '4', 'd', 's', 'b']
\W	匹配除了字母,数字,下划线以外的任意字符,如下: import re print(re.findall("\W","ab_cd1%$2a\tvc\n4dsb")) 打印结果:['%', '$', '\t', '\n']
\A	匹配以哪个字符串或字符开头,如下: import re print(re.findall("\Aab","abcdavcdsb")) 检测是否已ab开头,不是打印[''] 打印结果:['ab']
\d	只匹配数字 import re print(re.findall("\d"," abcd12avc4dsb ")) 打印结果:['1', '2', '4']
\D	匹配除了数字以外任意字符 import re print(re.findall("\D","abcd12avc4dsb")) 打印结果:['a', 'b', 'c', 'd', 'a', 'v', 'c', 'd', 's', 'b']
\s	匹配空白,制表符如[" "\t\n\r\f\v]等如下: import re print(re.findall("\s","ab cd12a\tvc\n4dsb")) 打印结果:[' ', '\t', '\n']
\S	匹配除了空白,制表符[" "\t\n\r\f\v]以外的任意字符,如下: import re print(re.findall("\S","ab cd12a\tvc\n4dsb")) 打印结果:['a', 'b', 'c', 'd', '1', '2', 'a', 'v', 'c', '4', 'd', 's', 'b']
\w	匹配字母,数字,下划线如下: import re print(re.findall("\w","ab_cd1%$2a\tvc\n4dsb")) 打印结果:['a', 'b', '_', 'c', 'd', '1', '2', 'a', 'v', 'c', '4', 'd', 's', 'b']
\W	匹配除了字母,数字,下划线以外的任意字符,如下: import re print(re.findall("\W","ab_cd1%$2a\tvc\n4dsb")) 打印结果:['%', '$', '\t', '\n']

常用方法:

re.compile(pattern, flags=0)：参数pattern是一个表达式规则，返回一个表达式对象相当于一个表达式规则模板。

import re
re_pottern = re.compile("\w")
print(re_pottern.findall("abc_$%def"))

# 打印内容如下
['a', 'b', 'c', '_', 'd', 'e', 'f']

re.search(pattern, string, flags=0)：根据表达式规则查找字符串，如果找不到匹配返回None，如果找到返回匹配到的对象。

import re
print(re.search("\w+","abc1#$%2abc3"))

# 打印内如下
<re.Match object; span=(0, 4), match='abc1'>

re.match(pattern, string, flags=0)：与search类似。

import re
print(re.match("\w+","abc1#$%2abc3"))

#打印内容如下
<re.Match object; span=(0, 4), match='abc1'>

re.split(pattern, string, maxsplit=0, flags=0)：将表达式的参数作为分隔符进行切割，返回切割后的列表。

import re
print(re.split("\W+","Words, words, words"))

# 打印内容如下
['Words', 'words', 'words']

re.findall(pattern, string, flags=0)：在整个字符串内匹配表达式，返回匹配到的结果。

import re
print(re.findall("\w","abc#$_def"))

# 打印内如如下
['a', 'b', 'c', '_', 'd', 'e', 'f']

re.finditer(pattern, string, flags=0)：匹配整个字符串，返回一个迭代器。

import re
iter_ = re.finditer("\w","abc#$_def")
print(iter_.__next__())
print(iter_.__next__())
print(iter_.__next__())

# 打印内容如下
<re.Match object; span=(0, 1), match='a'>
<re.Match object; span=(1, 2), match='b'>
<re.Match object; span=(2, 3), match='c'>

re.sub(pattern, repl, string, count=0, flags=0):

pattern：表达式。

repl：要替换的参数。

string：要被替换的字符串。

count：替换的次数，默认替换所有。

返回一个字符串

import re
print(re.sub("\w","a","abc#$_def"))
print(re.sub("\w","a","abc#$_def",count=2))

# 打印内容如下
aaa#$aaaa
aac#$_def

re.subn(pattern, repl, string, count=0, flags=0):

pattern：参数是表达式。

repl：要替换的参数。

string：要被替换的字符串。

count：替换的次数，默认替换所有。

返回一个被替换后的字符串和替换次数组成的元组

import re
print(re.subn("\w","a","abc#$_def"))
print(re.subn("\w","a","abc#$_def",count=2))

# 打印内容如下
('aaa#$aaaa', 7)
('aac#$_def', 2)

re.purge()：清空正则表达式缓存。

。。。。。。。。。。。。。。待续。。。。。。。。。。。。。。。。。。。。

所属网站分类: 技术文章 > 博客

作者：遥远的她

链接：https://www.pythonheidong.com/blog/article/11794/3b279b40427716e0554f/

来源：python黑洞网

任何形式的转载都请注明出处,如有侵权一经发现必将追究其法律责任

3 0

收藏该文

昵称:

评论内容：(最多支持255个字符)

---无人问津也好，技不如人也罢，你都要试着安静下来，去做自己该做的事，而不是让内心的烦躁、焦虑，坏掉你本来就不多的热情和定力

站长公众号(new) 更多>

分区变0字节. 不知道如何找到呢???

存储卡插入组装电脑时显示文件夹变成文件请问怎样才能修复

机械硬盘文件或目录损坏且无法读取寻回方法

目录变0字节. 不知道怎样寻回呢

分区变0字节怎么才能把硬盘修好

磁盘显示没有初始化恢复资料办法

清空回收站怎样恢复???

移动硬盘提示：操作无法完成,因为磁盘管理控制台视图不是最新状态怎么办？

文件名目录名或卷标语法不正确怎么办？

磁盘管理看不到硬盘怎么找回？

pdf(new) 更多>

git常用命令pdf下载

《从零开始学Python网络爬虫》PDF高清版免费下载

《Python游戏编程快速上手》PDF高清版免费下载

【每日书籍推荐】PYTHON 项目开发实战_超高清PDF

《父与子的编程之旅：与小卡特一起学Python》PDF高清版免费下载

《Effective Python》pdf高清版下载

【每日推荐书籍】《Python3网络爬虫开发实战》

【每日一本书】《Python编程快速上手让繁琐工作自动化》

《Python从小白到大牛》PDF高清版免费下载

《Python编程：从入门到实践（第2版）》

脚本(new) 更多>

五年级同学BMI指数计算器

用python做---，pythonos2.2.0-1版

使用Discord.py个人号创建Discord Bot 提示 401 Unauthorized

新手训练短语

opencv实现视频截取

python练习题

用python画国旗

抖音最火表白代码下载

python文件解压脚本

python分类文件脚本下载

博客(new) 更多>

【豆包大模型】-Python调用豆包大模型API及文本转语音TTS

Python——Selenium快速上手+方法（一站式解决问题）

手把手教你打包Python项目为whl文件

Java之反射

PyCharm 2024的最新专业版安装和配置汉化教程-Python零基础教程！

【Python】Tkinter模块（巨详细）

【数据库】深入Redis与Python操作指南：高效内存存储与应用场景解析

学Python该看什么书？Python各阶段好书推荐，10年老码农倾囊相授！！

什么是代理IP_如何建立代理IP池？

python Tkinter详细基础教学:

视频(new) 更多>

2020最新_Python_(MySQL_SQL_Redis)数据库详解【千锋】

2019版-千锋Python语法-视频

2019千锋Python爬虫全套视频（最经典）

13天搞定Python分布爬虫视频教程

python办公自动化

python深度学习系列教程

python视频神经网络 Tensorflow 模块视频教程

初级Python视频教程云盘

初级Python视频教程推荐

python视频各种视频很多

实战(new) 更多>

韩顺平TCP网络文件传输课程代码word下载

基于python的ARP扫描与断网攻击的图形化脚本

bootstrap-datetimepicker搞了一天也不显示，请教！

这个项目是人人网的爬虫程序

这是一个利用Python分析一个json数据，并可视化输出结果的小项目

一个Mp3播放器 Python项目实战

一个自动发送邮箱验证码的小项目源码下载

python 加密解密的程序 .py下载

PYTHON实现计算机功能

PYTHON定时关机

Processing the same array, dask.array is too slow compared to numpy.array

How can I solve the overwrite error when downloading exercism.io exercises?

how to transfer data to mikrotik router using netmiko?

Asyncio server and client

PyCharm typing warning inconsistency for abstract base classes

Image quality not reducing when I try to implement the given Mean structural similarity best-case/worst-case validation model in a paper

Space and time complexity of flattening a nested list of arbitrary depth

Creating a decaying halo around a cluster in an image with python

How to elegantly preallocate a numpy array?

游戏(new) 更多>

用python写滑雪游戏源码下载

用python写乒乓球游戏源码下载

python吃豆子小游戏源码下载

外星人入侵 python小游戏源码下载

帅哥吃苹果 python小游戏源码下载

小恐龙快跑 python小游戏源码下载

python小游戏拼图源码下载

风筝 python小游戏源码下载

迷宫-python小游戏源码下载

python小游戏 life

其他资源(new) 更多>

王道机试

python做乘法口诀表

纯净版python 3.7开发环境安装包

视觉SLAM十四讲 - 从理论到实践

Python正则表达式教程下载

Vue+Go前端后端一体化企业级微服务网关项目

尚硅谷java基础入门视频下载

尚硅谷java基础入门视频

超基础初一生反utPython程序(只是一个文本)

注册表实用手册

程序员最近都爱上了这个网站程序员们快来瞅瞅吧！ it98k网:it98k.com

分类

标签

日期归档

python正则表达式模块re

程序员最近都爱上了这个网站 程序员们快来瞅瞅吧！ it98k网:it98k.com

分类

标签

日期归档

python正则表达式模块re

程序员最近都爱上了这个网站程序员们快来瞅瞅吧！ it98k网:it98k.com