当前位置: 首页 > article >正文

推荐 --召回模型 DSSM, YoutubeDNNd

学习内容: DSSM和YOUtube DNN模型

一、YouTubeDNN召回

YouTubeDNN召回模块没有把CTR作为优化目标,而是预测用户下一个观看的视频(next watch),也就说给定一个用户及上下文后,在候选集(所有视频)中挑选用户在下一次最可能观看的视频(next watch,这里一般是topK个),因此即转化成了一个多分类问题(数百万),这里使用一个softmax输出在所有候选视频上的概率分布。
用公式形式化的定义就是:

 样本构造
再来看YouTube这里样本的构造,这里把用户看完的视频作为正样本(注意是看完的,也就是完成播放的,而不是看了的)。YouTube这里也解释了为什么没有使用YouTube上面『点赞』和『踩』这种显式反馈作为正负样本,因为使用完播这种隐式反馈所能构造出来的正样本比显式反馈的『点赞』多了一个数量级。正常情况下,用户看完一个视频去点一下『赞』这种行为是比较少的。

这里有必要说下训练样本是怎么构造的,感觉也是个非常大的细节。就拿我们自己的日志举例子吧,我们的原始日志都是item级别的(有曝光的item),一条原始日志由<item信息,用户信息,上下文信息,是否点击>组成,我们在抽取训练样本时,只抽取有点击的item,显然该点击的item就为生成的训练样本的label,然后我们需要去用户过去X天点击的item序列,用户过去X天query历史,以及一些该item相关的特征等。


http://www.kler.cn/a/613423.html

相关文章:

  • VScode 画时序图(FPGA)
  • Redis:List 类型 内部实现、命令及应用场景
  • 小林coding-17道Java基础面试题
  • 记录 重启oracle服务之后 报错 ORA-12505
  • Audacity Nyquist插件开发:定义输入框和获取用户输入
  • 机器学习knnlearn5
  • 安装教程:windows上安装oracle详细教程
  • jmeter 镜像构建
  • llamafactory微调效果与vllm部署效果不一致如何解决
  • 【 C 语言实现顺序表的基本操作】(数据结构)
  • MinGW下编译ffmpeg源码时生成compile_commands.json
  • 太阳能台风预警宣传信号智慧杆:科技赋能防灾减灾的新标杆
  • 专注自习室:番茄工作法实践
  • es6的箭头函数与普通函数的区别,箭头函数的this通常指向哪里,箭头函数可以用作构造函数吗?
  • 哈希冲突 及 双哈希
  • 【LVS】负载均衡群集部署(DR模式)
  • 数据库基础之DDLDML
  • ecovadis评估有什么流程?对企业发展的重要意义
  • 方阵幂次(矩阵快速幂)
  • 面试的时候问到了HTML5的新特性有哪些