java替换html中的标签
实现方法
通过正则表达式统一替换:<[^>]+>
实现过程
import re
text = '''
<!DOCTYPE html>
<html>
<head>
<title>示例页面</title>
</head>
<body>
<h1>欢迎来到示例页面</h1>
<p>这是一个段落。</p>
<div>
<p>这是在一个<div>标签内的段落。</p>
</div>
<ul>
<li>列表项 1</li>
<li>列表项 2</li>
<li>列表项 3</li>
</ul>
</body>
</html>
'''
# 使用正则表达式清除HTML标签
cleaned_text = re.sub(r'<[^>]+>', '', text)
print(cleaned_text)