当前位置: 首页 > article >正文

搜广推校招面经四十

字节-广告算法

一、离线AUC涨了,但AB实验没涨,可能的原因?

1.1. 线上线下得样本空间不一致(SSB)

线上模型使用的是实时获取的点击、曝光数据。线下使用的离线数据。这可能导致数据分布存在偏差。

  • 线上数据受曝光机制、冷启动、新品推荐等因素影响,与离线数据不完全匹配。
  • 线下数据存在采样偏差

1.2. AUC这些指标无法衡量线上打分准确性。

AUC毕竟只是衡量排序

1.2.1. 引申:PCOC(预估值/真实后验概率)不准确

线上效果与PCOC相关,但是AUC不能直接衡量PCOC的准确性。

1.3. 链路一致性问题:精排过后,受后续策略影响。

AUC仅仅衡量精排的效果。但在实际推荐系统中,精排打分后,还有融分、重拍、混排等过程。

二、时长/ LTV 预估任务应该作为回归任务建模么?和普通回归任务有什么区别?可以采用什么 loss function &激活函数?为什么?

用户生命周期价值(LTV)预估任务通常被视为一种回归任务,因为它的目标是预测一个连续值——即用户在整个生命周期中可能为产品或服务带来的总收益。

2.1. LTV 预估作为回归任务的特点

  1. 数据分布特性:LTV 数据往往具有显著的零膨胀现象,意味着有很多用户的LTV为零,因为他们没有进行任何购买行为。此外,LTV 分布通常是长尾的,少量高消费用户贡献了大量的收入。
  2. 预测时间跨度:LTV 通常需要考虑较长的时间范围,这增加了预测的不确定性,并可能导致更复杂的模式和趋势出现
  3. 业务应用场景:在营销策略制定、资源分配等方面,准确的LTV预估至关重要,因此模型不仅要能够给出点估计,还应该提供预测的置信区间或者概率分布

2.2. 损失函数选择

  • MAPE+log变换:
  • 零膨胀对数正态(ZILN)损失:专门为LTV标签设计,可以同时捕捉流失概率并考虑LTV的重尾特性,提供了点预测的不确定性量化。

2.3. 核心指标 MAPE

  • 分群验证:将人群分为:新客、老客、沉默用户分别统计误差和偏差。防止群体差异带来干扰
  • 品类隔离:高复购的品类(日百)和低频品类(家电)独立计算,确保可比性。
  • 时间窗口加权
  • 业务口径对齐

三、20. 有效的括号

在这里插入图片描述

  • 思路:
    创建一个哈希表(或者数组),遍历字符串,1:遇到左括号,保存对应的右括号,2:遇到右括号,直接判断栈顶的左括号是否与右括号为同一类型。
  • 代码:
class Solution:
    def isValid(self, s: str) -> bool:
        if len(s) % 2:  # s 长度必须是偶数
            return False
        st = []
        for c in s:
            if c == '(':
                st.append(')')             # 遇到左括号,入栈对应的右括号
            elif c == '[':
                st.append(']')             # 遇到左括号,入栈对应的右括号
            elif c == '{':
                st.append('}')             # 遇到左括号,入栈对应的右括号
            elif not st or st.pop() != c:  # 遇到右括号,1.栈是否为空(右括号是否多于做左括号),2.出栈是否为对应左括号
                return False               
        return not st  # 所有左括号必须匹配完毕

http://www.kler.cn/a/577833.html

相关文章:

  • Kotlin 协程和线程的主要区别
  • 腾讯云TBDS获金融信创实验室全项适配认证 打造国产化大数据平台标杆
  • docker 常用命令教程
  • 单例模式:确保一个类只有一个实例
  • C# 初学者的系统学习路径与职业规划指南
  • Prompt Engineering的技术发展趋势
  • 在Spring Boot项目中分层架构
  • vue3如何配置环境和打包
  • 【Python 数据结构 10.二叉树】
  • 十、Redis 主从复制:原理解析、配置实践与优化策略
  • Linux上位机开发(开篇)
  • 创新科技,绿色防护——稀土抑烟剂让板材更安全
  • API安全防护探析:F5助企业应对关键安全挑战
  • 解决Jenkins默认终止Shell产生服务进程的问题
  • React基础之 forwardRef
  • 【Java代码审计 | 第四篇】SQL注入防范
  • uniapp实现微信小程序一键登录
  • 神经网络|(十四)|霍普菲尔德神经网络-Hebbian训练
  • Django模型数据查询:深入探索模型管理器Model.objects
  • MySQL表约束