当前位置：首页 > article >正文

4.混合推荐系统

article 2025/2/12 14:26:25

接下来我们将学习混合推荐系统。混合推荐系统结合了多种推荐算法的优点，能够提供更精准和多样化的推荐。我们将介绍以下内容：

混合推荐系统的基本概念
混合推荐系统的常见方法
混合推荐系统的实现
实践示例

1. 混合推荐系统的基本概念

混合推荐系统（Hybrid Recommender System）通过结合多种推荐算法（如协同过滤、基于内容的推荐、矩阵分解等），来提升推荐效果。混合推荐系统的主要目标是利用不同算法的优势，弥补单一算法的不足，从而提供更精准和多样化的推荐。

2. 混合推荐系统的常见方法

混合推荐系统有多种组合方式，以下是几种常见的方法：

加权混合（Weighted Hybrid）：
- 将不同推荐算法的结果进行加权平均，生成最终的推荐列表。
切换混合（Switching Hybrid）：
- 根据特定规则或条件，在不同推荐算法之间进行切换。
级联混合（Cascade Hybrid）：
- 使用一种推荐算法生成初步推荐列表，然后在此基础上使用另一种推荐算法进行精细排序。
特征组合（Feature Combination）：
- 将不同推荐算法的特征组合在一起，训练一个模型来生成推荐结果。
元级联（Meta-level Hybrid）：
- 使用一种推荐算法的输出作为另一种推荐算法的输入。

3. 混合推荐系统的实现

我们将结合协同过滤和基于内容的推荐，使用加权混合的方法来实现一个简单的混合推荐系统。

示例数据集

假设我们有以下用户-项目评分矩阵和项目内容特征矩阵：

import numpy as np

# 用户-项目评分矩阵（示例）
ratings = np.array([
    [5, 3, 4, 0],
    [4, 2, 3, 5],
    [1, 5, 2, 4],
    [2, 4, 3, 3]
])

# 项目内容特征矩阵（示例）
# 每个项目有两个特征（如类型、导演等）
item_features = np.array([
    [1, 0],
    [0, 1],
    [1, 1],
    [0, 0]
])

协同过滤推荐

我们将使用用户-用户协同过滤来生成推荐结果。

from sklearn.metrics.pairwise import cosine_similarity

# 计算用户之间的余弦相似度
user_similarity = cosine_similarity(ratings)

# 预测评分函数
def predict_cf(user, item):
    similar_users = np.argsort(user_similarity[user])[-2:]  # 找到最相似的用户
    similar_ratings = ratings[similar_users, item]
    similar_similarities = user_similarity[user, similar_users]
    return np.dot(similar_ratings, similar_similarities) / np.sum(similar_similarities)

# 示例：预测用户1对项目D的评分
predicted_rating_cf = predict_cf(0, 3)
print(f"Collaborative Filtering predicted rating for user 1 on item D: {predicted_rating_cf}")

基于内容的推荐

我们将使用项目的内容特征来生成推荐结果。

# 计算项目之间的余弦相似度
item_similarity = cosine_similarity(item_features)

# 预测评分函数
def predict_content(user, item):
    similar_items = np.argsort(item_similarity[item])[-2:]  # 找到最相似的项目
    similar_ratings = ratings[user, similar_items]
    similar_similarities = item_similarity[item, similar_items]
    return np.dot(similar_ratings, similar_similarities) / np.sum(similar_similarities)

# 示例：预测用户1对项目D的评分
predicted_rating_content = predict_content(0, 3)
print(f"Content-Based predicted rating for user 1 on item D: {predicted_rating_content}")

加权混合推荐

将协同过滤和基于内容的推荐结果进行加权平均，生成最终的推荐结果。

# 加权混合推荐函数
def predict_hybrid(user, item, weight_cf=0.5, weight_content=0.5):
    rating_cf = predict_cf(user, item)
    rating_content = predict_content(user, item)
    return weight_cf * rating_cf + weight_content * rating_content

# 示例：预测用户1对项目D的评分
predicted_rating_hybrid = predict_hybrid(0, 3)
print(f"Hybrid predicted rating for user 1 on item D: {predicted_rating_hybrid}")

4. 实践示例

我们将通过一个完整的实例来展示如何实现一个混合推荐系统。假设我们有一个电影推荐系统，包含用户评分数据和电影内容特征（如类型、导演等）。

数据准备

假设我们有以下用户评分数据和电影内容特征：

import pandas as pd

# 用户评分数据
ratings_data = {
    'user_id': [1, 1, 1, 2, 2, 3, 3, 4, 4],
    'movie_id': [1, 2, 3, 1, 4, 2, 3, 3, 4],
    'rating': [5, 3, 4, 4, 5, 5, 2, 3, 3]
}
ratings_df = pd.DataFrame(ratings_data)

# 电影内容特征
movies_data = {
    'movie_id': [1, 2, 3, 4],
    'genre': ['Action', 'Comedy', 'Action', 'Drama'],
    'director': ['Director1', 'Director2', 'Director1', 'Director3']
}
movies_df = pd.DataFrame(movies_data)

# 将电影内容特征编码为数值向量
from sklearn.preprocessing import OneHotEncoder

encoder = OneHotEncoder()
movie_features = encoder.fit_transform(movies_df[['genre', 'director']]).toarray()

协同过滤推荐

# 构建用户-项目评分矩阵
num_users = ratings_df['user_id'].nunique()
num_movies = ratings_df['movie_id'].nunique()
ratings_matrix = np.zeros((num_users, num_movies))

for row in ratings_df.itertuples():
    ratings_matrix[row.user_id - 1, row.movie_id - 1] = row.rating

# 计算用户之间的余弦相似度
user_similarity = cosine_similarity(ratings_matrix)

# 预测评分函数
def predict_cf(user, item):
    similar_users = np.argsort(user_similarity[user])[-2:]  # 找到最相似的用户
    similar_ratings = ratings_matrix[similar_users, item]
    similar_similarities = user_similarity[user, similar_users]
    return np.dot(similar_ratings, similar_similarities) / np.sum(similar_similarities)

# 示例：预测用户1对电影4的评分
predicted_rating_cf = predict_cf(0, 3)
print(f"Collaborative Filtering predicted rating for user 1 on movie 4: {predicted_rating_cf}")

基于内容的推荐

# 计算电影之间的余弦相似度
item_similarity = cosine_similarity(movie_features)

# 预测评分函数
def predict_content(user, item):
    similar_items = np.argsort(item_similarity[item])[-2:]  # 找到最相似的电影
    similar_ratings = ratings_matrix[user, similar_items]
    similar_similarities = item_similarity[item, similar_items]
    return np.dot(similar_ratings, similar_similarities) / np.sum(similar_similarities)

# 示例：预测用户1对电影4的评分
predicted_rating_content = predict_content(0, 3)
print(f"Content-Based predicted rating for user 1 on movie 4: {predicted_rating_content}")

加权混合推荐

# 加权混合推荐函数
def predict_hybrid(user, item, weight_cf=0.5, weight_content=0.5):
    rating_cf = predict_cf(user, item)
    rating_content = predict_content(user, item)
    return weight_cf * rating_cf + weight_content * rating_content

# 示例：预测用户1对电影4的评分
predicted_rating_hybrid = predict_hybrid(0, 3)
print(f"Hybrid predicted rating for user 1 on movie 4: {predicted_rating_hybrid}")