当前位置: 首页 > article >正文

scrapy爬取中信证券销售金融产品信息

import scrapy

class CsProductSpider(scrapy.Spider):
    name = "cs_product"
    allowed_domains = ["www.cs.ecitic.com"]
    start_urls = ["http://www.cs.ecitic.com/newsite/cpzx/jrcpxxgs/zgcp/index.html"]

    def parse(self, response):
        # 提取数据的逻辑,根据实际情况调整
        list_con = response.css('.list-con li')
        for item in list_con:
            product_name = item.css('.th1::text').get()
            manager = item.css('.th2::text').get()
            risk_rating = item.css('.th3::text').get()
            subscription_amount = item.css('.th4::text').get()
            yield {
                "产品名称": product_name,
                "管理人": manager,
                "风险评级": risk_rating,
                "认购金额起点": subscription_amount,
                "公示信息详情链接": None
            }

        # 检查是否有页码导航,如果有则遍历页码进行翻页
        page_nav = 

http://www.kler.cn/a/388141.html

相关文章:

  • 详细全面讲解C++中重载、隐藏、覆盖的区别
  • maven如何从外部导包
  • GoChina备案管家
  • huggingface 下载方法 测试ok
  • Linux驱动开发 gpio_get_value读取输出io的电平返回值一直为0的问题
  • (转)rabbitmq怎么保证消息不丢失?
  • git tag
  • PCIE板卡:基于国产化双FPGA主板的高性能解决方案
  • HTTP Cookie深入解析:Web会话追踪的秘密
  • 平安科技(外包)面试分享
  • 介绍一下strcpy函数(c基础)
  • Git 入门篇(一)
  • dom4j实现xml转map,xml转json字符串
  • 【IEEE/EI会议/南邮主办】第六届机器人、智能控制与人工智能国际学术会议(RICAI 2024)
  • Oracle 第25章:Oracle GoldenGate
  • 斗破QT编程入门系列之前言:认识Qt:获取与安装(四星斗师)
  • 13-鸿蒙开发中的综合实战:华为登录界面
  • 机器学习系列----介绍前馈神经网络和卷积神经网络 (CNN)
  • GooglePlay: 应用和游戏的内容分级
  • 机器学习—选择激活函数
  • json绘制热力图
  • 大数据面试题--kafka夺命连环问
  • Unity——对RectTransform进行操作
  • gitlab无法创建合并请求是所有分支都不显示
  • 从特殊角度解释深度学习,一节课让你彻底明白深度学习的“前世今生”!
  • MySQL 和 PostgreSQL 的使用案例