当前位置: 首页 > article >正文

一文囊括风控建模中的变量筛选方法

风控建模在金融领域中起着至关重要的作用,特别是在信贷和支付领域。为了构建稳定和有效的风控模型,变量筛选是一个必不可少的步骤。本文将详细介绍几种在风控建模中常用的变量筛选方法。

文章目录

    • 一、变量自身分布稳定性
      • 1 变量PSI值计算
      • 2 长期趋势图
    • 二、变量和目标值的强相关关系
      • 1 IV值计算
      • 2 相关性矩阵
    • 三、基于模型的特征重要性
      • 1 随机森林特征重要性
      • 2 梯度提升机特征重要性
      • 3 线性模型特征重要性
    • 四、其他常用的变量筛选方法
      • 1 方差
      • 2 前后向筛选
      • 3 方差膨胀系数(VIF)
      • 4 业务逻辑考虑

  

一、变量自身分布稳定性

  

1 变量PSI值计算

  
变量稳定性是反映客群在某些方面随时间变化的重要指标。PSI(Population Stability Index)是衡量变量分布稳定性的一种常用方法。PSI的计算公式为:
  
PSI=∑((实际占比−预期占比)×ln( 预期占比/实际占比))
  
在建模初期,可以通过选择某一天作为基准日,计算后续每天与基准日数据的PSI值。如果某一天的PSI值超过设定的阈值(通常为0.1),则考虑删除该变量。时间尺度也可以扩大到周或月。理论上PSI需要框定在一定范围内有助于模型的稳定,但是实际场景可能变量由于策略频繁调整或外部数据源变化,PSI值很可能大于阈值。可适当调整该阈值,以让模型有变量可用。对PSI想更深入了解的小伙伴可以看下:


http://www.kler.cn/a/377673.html

相关文章:

  • Java之包,抽象类,接口
  • 考研要求掌握的C语言程度(插入排序)
  • ICPC区域赛成都站【赛后回顾+总结】
  • Qt报错QOCI driver not loaded且QOCI available的解决方法
  • 分享一些做事的原则
  • Linux rabbitmq客户端 SimpleAmqpClient 源码编译
  • Linux 下执行定时任务之 Systemd Timers
  • Vue问题汇总解决
  • 【Centos】在 CentOS 9 上使用 Apache 搭建 PHP 8 教程
  • Vue插槽的使用场景
  • 垃圾材质分类图像图像分割系统:操作简易训练
  • 【MVP】浅析MVP内存泄漏
  • 20.体育馆使用预约系统(基于springboot和vue的Java项目)
  • ES8388 —— 带耳机放大器的低功耗立体声音频编解码器(4)
  • uniapp ,微信小程序,滚动(下滑,上拉)到底部加载下一页内容
  • 网络编程(Day35)
  • 实用篇:linux如何查看历史命令(以前使用过的命令)
  • 【MyBatis源码】SqlSource对象创建流程
  • 微信聊天记录删了怎样才能恢复?试试这10款数据恢复软件
  • 有季节效应的非平稳序列分析
  • 简单介绍Class文件、Dex文件以及ELF文件
  • JavaScript的迭代器和生成器
  • VUE3——isRef
  • Qt使用QXlsx将Excel表格数据导入到SQLite数据库
  • HTML前端页面设计静态网站-仿百度
  • 前端笔面试查漏补缺