当前位置: 首页 > article >正文

机器学习笔记 // 创建窗口数据集

tf.data库包含许多对操作数据很有帮助的API。你可以使用这些API来创建一个简单的数据集(包含数字0~9)​,模拟一个时间序列。接下来将它转换为窗口数据集的开始,代码如下:

dataset = tf.data.Dataset.range(10)

dataset = dataset.window(5, shift=1, drop_remainder=True)

dataset = dataset.flat_map(lambda window: window.batch(5))

for window in dataset:

    print(window.numpy())

dataset.window的参数5指定将数据集分割为5个元素的窗口。指定shift=1导致每个窗口接下来会从前一个位置移动到下一个:第一个窗口包含从0开始的5个元素,下一个窗口包含从1开始的5个元素,以此类推。设置drop_remainder为True指定当它达到数据集靠近最后的位置时,如果窗口小于期待的大小5,它们会被丢掉。

鉴于窗口的定义,分割数据集的过程可以发生。你可以使用flat_map函数来实现它,在这个例子中指定一批大小为5的窗口。运行代码会得到下面的结果:

分割为特征值与标签的代码:

dataset = dataset.map(lambda window: (window[:-1], window[-1:]))

for x,y in dataset:

    prinnt(x.numpy(), y.numpy())

结果如下:

窗口中的前4个值可以被视为特征,随后的值就是标签!


http://www.kler.cn/a/403181.html

相关文章:

  • 优化注意力层提升 Transformer 模型效率:通过改进注意力机制降低机器学习成本
  • 人工智能(AI)与机器学习(ML)基础知识
  • 三层交换机静态路由实验
  • AI在虚拟展厅的应用有哪些?有何优势?
  • el-table最大高度无法滚动
  • Redis基本的全局命令
  • 什么是 C++ 中的初始化列表?它的作用是什么? 初始化列表和在构造函数体内赋值有什么区别?
  • LLM学习笔记(2)会话补全Chat Completions、什么是JSON?
  • Leetcode661:图片平滑器 C语言
  • 详解Rust结构体struct用法
  • 【C语言】C语言代码的编写规范、注释规范
  • 数据结构的两大要素
  • 【监控】如何打开笔记本的电脑调出摄像头将画面保存下来
  • 华为Ensp模拟器配置OSPF路由协议
  • AI 一键生成 POD 素材:手绘风格圣诞元素印花图案分享
  • 春意盎然:基于Spring Boot的中药实验管理平台
  • 1. 使用Python和TensorFlow进行深度学习入门教程,学习如何搭建神经网络并训练模型。
  • 基于Vue+SpringBoot的求职招聘平台
  • Nacos实现IP动态黑白名单过滤
  • Java基础知识(五)
  • 如何使用AWS Lambda构建一个云端工具(超详细)
  • 大数据挖掘期末复习
  • 对第一个C++程序的解析(C++入门)(hello world)
  • 【Node.js】深入理解 V8 JavaScript 引擎
  • 捕捉页面的关键元素:用CSS选择器与Puppeteer自动抓取
  • Linux 查看磁盘空间使用情况