当前位置: 首页 > article >正文

关于随机数的设定和随机噪声

 以下是设立随机数和随机噪声的code:

设定随机数的方法有很多,下面代码是通过numpy的API设定随机数,除了numpy,实际上scikit,tf,pytorch都有设定随机数的API的

# Set a random seed for reproducibility(01modifiy)加入随机数的代码最好是在第一行
np.random.seed(200)


# 数据集拆分
X, y = np.array(dataset['Smiles']), np.array(dataset['pIC50'])

# Add random noise to the target variable y(01modify)
noise_factor = 0.1  # You can adjust this value based on the amount of noise you want
y_with_noise = y + np.random.normal(0, noise_factor, size=len(y))

# Split the dataset with noisy target variable(01modify)
X_train, X_test, y_train, y_test = train_test_split(X, y_with_noise, test_size=0.3)

以下是未加入随机噪声的code:

# 数据集拆分
X, y = np.array(dataset['Smiles']), np.array(dataset['pIC50'])
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)

以01modifySVM.py为例:

加入随机噪声后结果

未加入随机噪声的结果:

我们发现加入随机噪声后,效果更好。

我们知道,加入随机数的目的,是让结果可重复性,可控。加入随机噪声的原因是提高鲁棒性,因为现实情况实际上是有噪声的(如实验测活的误差)。

关于随机数的选取:

#这是某篇文章的插入随机的方案,就按梯度设置一系列随机数
for randx in [8,12,42,50,65,78,105]:
    spliter = randomSpliter(test_size=0.25,random_state=randx)
    spliter.ExtractTotalData(file,label_name='label')
    spliter.SplitData()
    tr_x = spliter.tr_x
    tr_y = spliter.tr_y
    te_y = spliter.te_y

这里我们知道一点,如果只是发文章的话,可以挑取效果好的随机数,但是实际上我们要知道一点,如果模型受到随机数的影响较大,那只能说明模型不咋地。


http://www.kler.cn/a/156177.html

相关文章:

  • 【Vim Masterclass 笔记11】S06L24 + L25:Vim 文本的插入、变更、替换与连接操作同步练习(含点评课)
  • QT在 MacOS X上,如何检测点击程序坞中的Dock图标
  • UE材质节点Fresnel
  • 【网络云SRE运维开发】2025第3周-每日【2025/01/14】小测-【第13章ospf路由协议】理论和实操
  • pytorch张量分块投影示例代码
  • CAPL如何设置TCP/IP传输层动态端口范围
  • SQLserver通过字符串中间截取然后分组
  • 【MySQL 20题练习 包含:select,join,union,where 等复合语句】
  • RT-Thread 汇编分析启动流程
  • PCL 空间直角坐标系与极坐标系的相互转换(C++详细过程版)
  • Docker下安装可视化工具Portainer
  • 前端下载文件的方法-blob下载
  • LLM推理部署(五):AirLLM使用4G显存即可在70B大模型上进行推理
  • Prime 2.0
  • 基于maobox-gl 纯前端绘制全球色斑图
  • 布局问题1:addSpacing()和setSpacing()函数的区别?
  • C++服务器 支持http、tcp protobuf、websocket,linux开源框架 零依赖轻松编译部署 Reactor
  • nodejs实现文件/目录的压缩和解压
  • 【微信小程序】上传头像 微信小程序内接小程序客服
  • C++ day51 买卖股票最佳时期
  • 计算机网络——习题
  • 【PTA-C语言】编程练习3 - 循环结构Ⅱ
  • 安装配置JDK1.8
  • 单例模式的实现
  • 字符串转换整数
  • 一个完整的手工构建的cuda动态链接库工程 03记