当前位置: 首页 > article >正文

scrapy爬取中信证券销售金融产品信息

import scrapy

class CsProductSpider(scrapy.Spider):
    name = "cs_product"
    allowed_domains = ["www.cs.ecitic.com"]
    start_urls = ["http://www.cs.ecitic.com/newsite/cpzx/jrcpxxgs/zgcp/index.html"]

    def parse(self, response):
        # 提取数据的逻辑,根据实际情况调整
        list_con = response.css('.list-con li')
        for item in list_con:
            product_name = item.css('.th1::text').get()
            manager = item.css('.th2::text').get()
            risk_rating = item.css('.th3::text').get()
            subscription_amount = item.css('.th4::text').get()
            yield {
                "产品名称": product_name,
                "管理人": manager,
                "风险评级": risk_rating,
                "认购金额起点": subscription_amount,
                "公示信息详情链接": None
            }

        # 检查是否有页码导航,如果有则遍历页码进行翻页
        page_nav = 

http://www.kler.cn/a/388141.html

相关文章:

  • 时间管理的三个痛点
  • 24/11/13 算法笔记<强化学习> DQN算法
  • 第三十六章 Vue之路由重定向/404页面设置/路径模式设置
  • 机器学习基础02_特征工程
  • 如何在有限内存下对外部大文件进行排序
  • Spring——容器:IoC
  • git tag
  • PCIE板卡:基于国产化双FPGA主板的高性能解决方案
  • HTTP Cookie深入解析:Web会话追踪的秘密
  • 平安科技(外包)面试分享
  • 介绍一下strcpy函数(c基础)
  • Git 入门篇(一)
  • dom4j实现xml转map,xml转json字符串
  • 【IEEE/EI会议/南邮主办】第六届机器人、智能控制与人工智能国际学术会议(RICAI 2024)
  • Oracle 第25章:Oracle GoldenGate
  • 斗破QT编程入门系列之前言:认识Qt:获取与安装(四星斗师)
  • 13-鸿蒙开发中的综合实战:华为登录界面
  • 机器学习系列----介绍前馈神经网络和卷积神经网络 (CNN)
  • GooglePlay: 应用和游戏的内容分级
  • 机器学习—选择激活函数
  • json绘制热力图
  • 大数据面试题--kafka夺命连环问
  • Unity——对RectTransform进行操作
  • gitlab无法创建合并请求是所有分支都不显示
  • 从特殊角度解释深度学习,一节课让你彻底明白深度学习的“前世今生”!
  • MySQL 和 PostgreSQL 的使用案例