当前位置: 首页 > article >正文

7-14 利用正则表达式得到一段HTML文本中所有超链接对应的网址

编写程序实现以下功能:利用正则表达式得到一段HTML文本中所有超链接对应的网址,并将网址输出到屏幕上(每行输出一个网址)。

输入格式:

从键盘输入 一段HTML文本,多行输入,空行输入 结束。

输出格式:

输出从HTML文本中提取到的超链接所对应的网址,一行一个网址。

输入样例:

在这里给出一组输入。例如:

<h3 class="c-title">
 <a href="https://baijiahao.baidu.com/s?id=1633289774665320636&amp;wfr=spider&amp;for=pc" data-click="{
      'f0':'77A717EA',
      'f1':'9F63F1E4',
      'f2':'4CA6DE6E',
      'f3':'54E5243F',
      't':'1557660267'
      }" target="_blank">
      影片《周恩来回延安》在<em>南开大学</em>点映开启全国路演
    </a>
</h3>
<a href="https://baijiahao.baidu.com/s?id=1632116753423885280&amp;wfr=spider&amp;for=pc" data-click="{
      'f0':'77A717EA',
      'f1':'9F73F1E4',
      'f2':'4CA6DE6E',
      'f3':'54E5243F',
      't':'1557660267'
      }" target="_blank">
      天津“<em>南开大学</em>”——莘莘学子的梦想之地
    </a>
        

输出样例:

在这里给出相应的输出。例如:

https://baijiahao.baidu.com/s?id=1633289774665320636&amp;wfr=spider&amp;for=pc
https://baijiahao.baidu.com/s?id=1632116753423885280&amp;wfr=spider&amp;for=pc
import re

def extract_urls(html_text):
    pattern=r'<a\s+[^>]*?href\s*=\s*["\'](.*?)["\']'
    urls =re.findall(pattern,html_text)
    return urls

def main():
    html_text=""    
    while True:
        try:
            line=input()
            if(line.strip()==""):
                break
            html_text+=line+"\n"
        except EOFError:
            break
    urls=extract_urls(html_text)
    for url in urls:
        print(url)
if __name__ == "__main__":
    main()

 


http://www.kler.cn/a/588710.html

相关文章:

  • vue echarts封装使用
  • 车载以太网测试-14【交换机以及MAC地址表】
  • MongoDB 和 Elasticsearch的区别、优缺点对比,以及选型建议
  • Chrome/Edge浏览器离线安装插件全攻略:CRX/ZIP文件手动安装教程
  • std::list的模拟实现
  • 零成本本地化搭建开源AI神器LocalAI支持CPU推理运行部署方案
  • 【WEB APIs】DOM-节点操作
  • 钉钉项目报销与金蝶系统高效集成技术解析
  • 人工智能中的线性代数基础详解
  • RabbitMQ实现定时/延迟任务
  • ES6(2) 函数详解
  • 【RNN神经网络】序列模型与RNN神经网络
  • 易境通集运系统:拼团模式重构社交化集运新生态
  • MobileNet家族:从v1到v4的架构演进与发展历程
  • Vue源码深度解析:从2.x到3.x的架构演进与核心原理剖析
  • pycharm配置镜像源【pycharm最新版(23.2.5及以上)方法】
  • 记第一次跟踪seatunnel的任务运行过程三——解析配置的具体方法getLogicalDag
  • 【vue3学习笔记】(第147-149节)vue3响应式原理_Reflect;reactive对比ref;setup的两个注意点
  • Solana
  • 《Python深度学习》第二讲:深度学习的数学基础