当前位置: 首页 > article >正文

Pytorch在二进制层面比较张量中的各行是否相同,并返回不相同的各行

代码实例:

def unique(arr):
    # Finds unique rows in arr and return their indices
    arr = arr.cpu().numpy()
    arr_ = np.ascontiguousarray(arr).view(np.dtype((np.void, arr.dtype.itemsize * arr.shape[1])))
    _, idxs = np.unique(arr_, return_index=True)
    if torch.cuda.is_available():
        return torch.LongTensor(np.sort(idxs)).cuda()
    return torch.LongTensor(np.sort(idxs))

在 NumPy 中,.view() 方法用于创建数组的新视图,而不实际复制底层数据。在这种情况下,.view(np.dtype((np.void, arr.dtype.itemsize * arr.shape[1]))) 的目的是将数组 arr 转换为一个以字节为单位的视图,以便后续的操作更加灵活。

具体来说,这一行代码的操作步骤如下:

  1. np.ascontiguousarray(arr): 确保数组是按照内存中的顺序(C 风格)连续存储的,这对于后续的视图操作很重要。
  2. .view(np.dtype((np.void, arr.dtype.itemsize * arr.shape[1]))): 创建一个新的视图,该视图将数组的每一行都视为一个字节块np.dtype((np.void, arr.dtype.itemsize * arr.shape[1])) 定义了这个字节块的数据类型,其中 arr.dtype.itemsize * arr.shape[1] 表示每一行的总字节数。这样,整个数组被视为一个由字节块组成的虚拟类型数组。
  3. np.void 是 NumPy 中的数据类型,表示“虚拟”类型。它通常用于表示内存块,而不考虑具体的数据类型。在这里,np.void 被用于创建一个足够大的数据类型,以便能够容纳整个行数据

    在特定的上下文中,np.void 类型的一个实例可能包含多个数据类型的字段,但在这里它主要用于以字节的形式表示整个行的内容,而不考虑具体的数值类型。这使得在内存中视图上进行操作更加灵活,而不依赖于原始数据类型

这种方式的操作在某些情况下很有用,尤其是在处理复杂的数据结构或需要比较原始二进制数据时。在这里,可能是为了实现对行的快速唯一性检查,因为 .unique() 方法在处理复杂数据类型时可能会遇到一些问题。


http://www.kler.cn/news/161494.html

相关文章:

  • 【面试常考150题】1、88合并两个有序数组
  • MySQL核心知识点整理大全1-笔记
  • Mybatis 详解
  • SSM项目实战-登录验证成功并路由到首页面,Vue3+Vite+Axios+Element-Plus技术
  • 【尘缘送书第五期】Java程序员:学习与使用多线程
  • 搜维尔科技:Varjo XR-4 系列-专为极致沉浸感而打造!
  • 【二叉树】
  • GORM 自定义数据类型-枚举 (今天仓促,明天修改)
  • 总结1077
  • Flask+vue+axios完成导出Excel表格的功能
  • HTTP不同场景下的通信过程和用户上网认证过程分析
  • labelme等标注工具/数据增强工具输出JSON文件格式检查脚本
  • 用友NC word.docx接口存在任意文件读取漏洞
  • git的使用:基础配置和命令行
  • 智能优化算法应用:基于社交网络算法无线传感器网络(WSN)覆盖优化 - 附代码
  • Linux篇:进程间通信
  • [linux进程控制]进程替换
  • class036 二叉树高频题目-上-不含树型dp【算法】
  • java设计模式学习之【组合模式】
  • hql面试题之字符串使用split分割,并选择其中的一部分字段的问题
  • /usr/bin/ld: cannot find -ltinfo 的解决方法
  • 第二十一章——网络通信
  • 使用Jython将Python代码转换为Java可执行文件
  • 手把手将Visual Studio Code变成Python开发神器
  • RabbitMQ 的七种消息传递形式
  • 结构体对齐和补齐
  • HarmonyOS开发(十):通知和提醒
  • 洛谷P1044 [NOIP2003 普及组] 栈 递归方法
  • JVM中 Minor GC 和 Full GC 的区别
  • React中的空标签与Fragment标签的区别