当前位置: 首页 > article >正文

delphi 正则提取html中的内容

function ExtractTextFromHTML(const HTML: string): string;
var
  RegEx: TRegEx;
begin
  Result := HTML;

  // 移除<script>标签及其内容
  Result := TRegEx.Replace(Result, '<script.*?>.*?</script>', '', [roIgnoreCase, roSingleLine]);

  // 移除<style>标签及其内容
  Result := TRegEx.Replace(Result, '<style.*?>.*?</style>', '', [roIgnoreCase, roSingleLine]);

  // 移除所有HTML标签
  Result := TRegEx.Replace(Result, '<[^>]+>', '', [roIgnoreCase]);

  // 去除网址(新增部分)
  // 匹配 http/https/ftp 协议开头的URL
  Result := TRegEx.Replace(Result, '\b(https?|ftp)://[^\s/?#$%&]*[^\s?#$%&/]', '');


http://www.kler.cn/a/580567.html

相关文章:

  • listen EACCES: permission denied 0.0.0.0:811
  • Ubuntu 创建systemd服务
  • LeetCode 2380 二进制字符串重新安排顺序需要的时间
  • Docker Compose国内镜像一键部署dify
  • C#常用的循环语句
  • 马斯克:AI游戏前景无限
  • Redis 持久化配置:保障数据安全与可恢复性
  • clickhouse查询效率低
  • Vue3实战学习(Element-Plus常用组件的使用(输入框、下拉框、单选框多选框、el-image图片))(上)(5)
  • 【人工智能】Deepseek 与 Kimi 联袂:重塑 PPT 创作,开启智能演示新纪元
  • 解决电脑问题(9)——“此电脑”问题
  • AI革命编程学习:Python语法速通与高阶突破全实战(第一部分:AI驱动基础语法速通)
  • 【人工智能-01-01】人工智能导论——假币问题
  • Claude:AI领域的多面手,从语言模型到智能编码
  • C++ 链表List使用与实现:拷贝交换与高效迭代器细致讲解
  • AI数据分析:一键生成可视化分析思路
  • Docker环境下DeepSeek和Open WebUI服务部署教程
  • 漏洞预警:Wordpress GiveWP远程命令执行复现(CVE-2024-5932)
  • DeepSeek-R1:引领AI领域革新,MLA技术助力模型迁移
  • 低代码开发直聘管理系统