当前位置: 首页 > article >正文

topN 相似度 torch实现

目录

优化版,去重相似度

topN 欧式距离版

没有去重复,


优化版,去重相似度


import torch
import torch.nn.functional as F
torch.manual_seed(42)
# 假设 10 条数据,每条数据的特征维度是 128
data = torch.randn(10, 128)

# 计算所有数据对之间的余弦相似度
cosine_similarities = F.cosine_similarity(data.unsqueeze(0), data.unsqueeze(1), dim=2)

# 通过设置对角线为负无穷,排除自身相似度
cosine_similarities.fill_diagonal_(-float('inf'))

# 生成上三角掩码(i < j 的位置为True)
mask = torch.triu(torch.ones_like(cosine_similarities, dtype=torch.bool), diagonal=1)

# 过滤掉下三角和对角线,仅保留

http://www.kler.cn/a/555216.html

相关文章:

  • 使用Java爬虫获取京东商品描述API接口(item_get_desc)的实现与解析
  • (deepseek)按键滤波硬件
  • jmeter提取json中的多个返回值写入CSV文件供下一个接口调用(实操)
  • JavaScript逆向爬虫教程-------基础篇之JavaScript混淆原理
  • ios App的启动过程和启动优化
  • 在win11 中 whisper-large-v3-turbo 的简单使用
  • java后端开发day16--字符串(二)
  • 【找工作】C++和算法复习(自用)
  • PHP+Apache+MySQL安装(Windows)
  • 从0开始的AI大模型学习---ollama+amd显卡本地化部署deepseek-r1
  • vue3 input type=“file” 修改样式
  • pdf转换成word在线 简单好用 支持批量转换 效率高 100%还原
  • Windows下Docker Compose使用教程
  • 游戏引擎学习第114天
  • java毕业设计之医院门诊挂号系统(源码+文档)
  • Redis-03高级篇中-多级缓存:
  • RK3588配置成为路由器
  • 网络初始2:网络编程--基于UDP和TCP实现回显器
  • Python中常见库 PyTorch和Pydantic 讲解
  • [Linux]——进程控制(中)