前军教程网

中小站长与DIV+CSS网页布局开发技术人员的首选CSS学习平台

通过python的正则表达式re模块匹配出html标签以及内容

#代码如下:

#以下代码是通过python的正则表达式re模块匹配出html标签以及内容
import re #必须导入内置的正则表达式re模块
info='<html><h2>zhangsan</h2></html>'
#上面一行代码定义info为html标签内容,包含2个标签,第1个标签是html,第2个标签是h2,标签内容是zhangsan
pattern1=re.compile(r'<(\w+)><(\w+)>(.+)</\2></\1>
) #上面这行代码的(\w+)代表至少1个数字字母下划线,(.+)匹配除换行符 \n 之外的任何至少1个单字符,</\2>代表第2个标签的</h2>,</\1>代表第1个标签的</html> result1=re.match(pattern1,info) #上面这行代码代表从头开始匹配info里符合正则规则pattern1的内容,并赋值给result1 print("result1:",result1) print("result1.group():",result1.group()) #上面这行代码代表要打印匹配出来的所有结果,group()代表所有的 print("result1.group(1):",result1.group(1)) #上面这行代码代表要打印匹配出来的第一个结果,group(1)代表第一个结果 print("result1.group(2):",result1.group(2)) #上面这行代码代表要打印匹配出来的第二个结果,group(2)代表第二个结果 print("result1.group(3):",result1.group(3)) #上面这行代码代表要打印匹配出来的第三个结果,group(3)代表第三个结果

代码运行结果如下:

result1: <re.Match object; span=(0, 30), match='<html><h2>zhangsan</h2></html>'>

result1.group(): <html><h2>zhangsan</h2></html>

result1.group(1): html

result1.group(2): h2

result1.group(3): zhangsan

图片示例如下:

发表评论:

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言