因果推断与机器学习—特定领域的机器学习
在推荐系统和信息检索领域中,存在一类机器学习模型,被称为互动性机器学习模型。这些模型在训练过程中高度依赖用户产生的标签数据。在这类算法中可以使用显式的(explicit)或隐式的(implicit)两种用户产生的标签。
- 显式标签(explicit)
- 定义:显式标签被认为是直接反映用户偏好的一种方式。例如在推荐系统中,用户对商品进行打分(如 1 - 5 星),这种直接给出的评分就是显式标签。
- 特点:它能较为直观地反映用户对某个产品或内容的喜好程度。
- 隐式标签(implicit)
- 定义:通过用户的各种行为来间接反映其偏好。在电商网站上,用户的点击、购买、将商品加入购物车等操作都可以作为隐式标签。本质上,这些行为都是用户偏好的一种体现。
- 特点:相较于显式标签,隐式标签所反映的用户偏好信息不是那么直接和明确,但在实际应用中非常常见。
在实际训练这类模型时,由于应用场景存在诸多限制,会选择合适的模型评估标准,并对训练进行优化。例如在信息检索领域,常用 NDCG(Normalized Discounted Cumulative Gain,归一化折损累计增益)