当前位置: 首页 > article >正文

基于标签的协同过滤算法实现与个人兴趣相关的文章推荐

在这里插入图片描述

一、前言

在当前信息爆炸的时代,每天都会涌现出大量的文章,人们有时候会感到信息的获取难度比筛选更大。而作为信息的提供者,我们应当为用户提供依据个人兴趣的文章推荐。

本项目中的文章标签相似度推荐功能使用了一种基于标签的协同过滤算法。具体地,我们先计算每篇文章的标签,然后计算出两篇文章之间的标签相似度,最后根据用户阅读过的文章,找到与之最相似的文章,推荐给用户。

下面是使用Java实现计算标签相似度的示例代码:

/**
 * 计算标签之间的相似度
 */
private double calculateSimilarity(List<String> tags1, List<String> tags2) {
  Set<String> set1 = new HashSet<>(tags1);
  Set<String> set2 = new HashSet<>(tags2);
  // 计算并集大小
  int unionSize = set1.size() + set2.size();
  set1.addAll(set2);
  // 计算交集大小
  int intersectSize = unionSize - set1.size();
  return (double) intersectSize / unionSize;
}

该方法以两个标签集合为参数,先将它们转化为Set,然后计算它们的并集和交集的大小,最后返回它们的相似度。

需要注意的是,这个算法实现会出现冷启动问题,即对于用户没有阅读记录的情况,我们无法根据它的阅读历史推荐文章。可以在这种情况下,使用一些简单的推荐策略,如热门文章推荐等。

二、后端开发

1. 框架和工具选择

本项目使用SpringBoot、SpringMVC和Mybatis-Plus构建后端。SpringBoot简化了Spring应用程序的搭建,SpringMVC是Spring的Web框架,Mybatis-Plus是Mybatis的增强工具。

2. 数据库设计

在本项目中,我们需要存储文章和用户的相关信息。具体的设计如下:

文章表(article):

字段名字段类型描述
idLong主键
titleString文章标题
authorString文章作者
contentString文章内容
create_timeDate发布时间
categoryString文章分类

用户表(user):

字段名字段类型描述
idLong主键
usernameString用户名
passwordString密码
emailString邮箱
create_timeDate注册时间

用户-文章表(user_article):

字段名字段类型描述
idLong主键
user_idLong用户id
article_idLong文章id
create_timeDate阅读时间

3. 接口设计

本项目共有以下接口:

注册接口(POST /user/register):用户注册接口,参数为用户名、密码、邮箱。

登录接口(POST /user/login):用户登录接口,参数为用户名和密码。

获取文章列表接口(GET /article/list):获取所有文章列表。

获取用户阅读历史接口(GET /user/history):获取用户阅读历史。

获取推荐文章接口(POST /article/recommend):获取推荐文章,参数为用户id。

4. 实现逻辑

用户注册接口:

前端请求:

axios.post('/user/register', {
  username: 'username',
  password: 'password',
  email: 'email'
}).then(res => {
  console.log(res.data)
})

后端实现:

@PostMapping("/register")
public Result registerUser(@RequestBody User user) {
  User existUser = userService.findUserByUsername(user.getUsername());
  if (existUser != null) {
    return Result.error("该用户名已被注册");
  }
  user.setPassword(DigestUtils.md5DigestAsHex(user.getPassword().getBytes()));
  userService.saveUser(user);
  return Result.success("注册成功");
}

用户登录接口:

前端请求:

axios.post('/user/login', {
  username: 'username',
  password: 'password'
}).then(res => {
  console.log(res.data)
})

后端实现:

@PostMapping("/login")
public Result loginUser(@RequestBody User user) {
  User existUser = userService.findUserByUsername(user.getUsername());
  if (existUser == null) {
    return Result.error("该用户不存在");
  }
  if (!existUser.getPassword().equals(DigestUtils.md5DigestAsHex(user.getPassword().getBytes()))) {
    return Result.error("密码错误");
  }
  String token = JwtUtil.createToken(existUser.getId(), existUser.getUsername());
  return Result.success(token);
}

获取文章列表接口:

前端请求:

axios.get('/article/list').then(res => {
  console.log(res.data)
})

后端实现:

@GetMapping("/getArticles")
public Result getArticles() {
  List<Article> articles = articleService.findArticles();
  return Result.success(articles);
}

获取用户阅读历史接口以及前端请求:

需要在请求头中添加token。

axios.get('/user/history', {
  headers: {
    'Authorization': 'Bearer ' + token
  }
}).then(res => {
  console.log(res.data)
})

后端实现:

@GetMapping("/history")
public Result getUserHistory(HttpServletRequest request) {
  Long userId = JwtUtil.getUserId(request.getHeader("Authorization"));
  List<UserArticle> userArticles = userArticleService.findUserArticlesByUserId(userId);
  List<Article> articles = new ArrayList<>();
  for (UserArticle userArticle : userArticles) {
    Article article = articleService.findArticleById(userArticle.getArticleId());
    articles.add(article);
  }
  return Result.success(articles);
}

获取推荐文章接口以及前端请求:

需要在请求头中添加token。

axios.post('/article/recommend', {
  user_id: userId
}, {
  headers: {
    'Authorization': 'Bearer ' + token
  }
}).then(res => {
  console.log(res.data)
})

后端实现:

@PostMapping("/recommend")
public Result recommendArticles(@RequestBody Map<String, Long> paramMap, HttpServletRequest request) {
  Long userId = paramMap.get("user_id");
  List<Article> articles = articleService.recommendArticles(userId);
  return Result.success(articles);
}

文章推荐功能的实现基于用户的阅读历史推荐和文章的标签相似度推荐。

用户阅读历史推荐的实现:

查询出用户阅读历史,根据文章分类和阅读时间排序,取出前10篇文章作为推荐文章。

public List<Article> recommendArticles(Long userId) {
  // 获取用户阅读历史
  List<UserArticle> userArticles = userArticleService.findUserArticlesByUserId(userId);
  List<Long> articleIds = userArticles.stream().map(UserArticle::getArticleId).collect(Collectors.toList());
  // 如果用户没有阅读历史,则按文章分类排序,取前10篇文章
  if (articleIds.isEmpty()) {
    return articleMapper.selectList(new QueryWrapper<Article>().orderByDesc("create_time").last("limit 10"));
  }
  // 根据文章分类和阅读时间排序,取前10篇文章
  return articleMapper.selectList(new QueryWrapper<Article>().in("id", articleIds)
                      .orderByDesc("create_time", "category").last("limit 10"));
}

文章标签相似度推荐的实现:

计算文章之间的标签相似度,取出与用户阅读过的文章最相似的前10篇文章作为推荐文章。

public List<Article> recommendArticles(Long userId) {
  // 获取用户阅读历史
  List<UserArticle> userArticles = userArticleService.findUserArticlesByUserId(userId);
  List<Long> articleIds = userArticles.stream().map(UserArticle::getArticleId).collect(Collectors.toList());
  // 如果用户没有阅读历史,则按文章分类排序,取前10篇文章
  if (articleIds.isEmpty()) {
    return articleMapper.selectList(new QueryWrapper<Article>().orderByDesc("create_time").last("limit 10"));
  }
  // 根据文章分类和阅读时间排序,取前10篇文章
  List<Article> articles = articleMapper.selectList(new QueryWrapper<Article>().in("id", articleIds)
                      .orderByDesc("create_time", "category").last("limit 10"));
  // 计算文章之间的标签相似度
  for (Article article : articles) {
    List<String> articleTags = Arrays.asList(article.getTags().split(","));
    for (Article a : articles) {
      if (a.getId().equals(article.getId())) {
        continue;
      }
      List<String> tags = Arrays.asList(a.getTags().split(","));
      double similarity = calculateSimilarity(articleTags, tags);
      a.setSimilarity(similarity);
    }
  }
  // 取出与用户阅读过的文章最相似的前10篇文章作为推荐文章
  List<Long> readArticleIds = userArticles.stream().map(UserArticle::getArticleId).collect(Collectors.toList());
  List<Article> recommendArticles = articles.stream()
                                        .filter(article -> !readArticleIds.contains(article.getId()))
                                        .sorted(Comparator.comparingDouble(Article::getSimilarity).reversed())
                                        .limit(10)
                                        .collect(Collectors.toList());
  return recommendArticles;
}

/**
 * 计算标签之间的相似度
 */
private double calculateSimilarity(List<String> tags1, List<String> tags2) {
  Set<String> set1 = new HashSet<>(tags1);
  Set<String> set2 = new HashSet<>(tags2);
  // 计算并集大小
  int unionSize = set1.size() + set2.size();
  set1.addAll(set2);
  // 计算交集大小
  int intersectSize = unionSize - set1.size();
  return (double) intersectSize / unionSize;
}

三、前端开发

1. 框架和工具选择

本项目使用VUE框架开发前端页面,同时使用axios库进行接口请求。

2. 页面设计

本项目共有以下页面:

登录页面(login):用户登录页面,包含用户名和密码输入框及登录按钮。

注册页面(register):用户注册页面,包含用户名、密码、邮箱输入框及注册按钮。

文章列表页面(article-list):展示所有文章列表。

用户阅读历史页面(user-history):展示用户的阅读历史列表。

推荐文章页面(recommend-articles):展示推荐给用户的文章列表。

3. 实现流程

登录页面:

登录界面,用户在该界面输入用户名和密码,请求后端登录接口,得到token以便后续接口请求。

注册页面:

注册界面,用户在该界面输入用户名、密码、邮箱,请求后端注册接口。

文章列表页面:

展示所有文章列表,用户点击文章标题可以进入文章详情页面。

用户阅读历史页面:

展示用户的阅读历史列表,用户可以查看阅读历史记录。

推荐文章页面:

展示推荐给用户的文章列表,根据后端推荐接口的返回结果展示。

四、总结

本篇博文详细介绍了如何使用SpringBoot、SpringMVC和Mybatis-Plus构建后端,使用VUE框架开发前端页面,以及如何实现文章推荐功能的详细流程和代码。

文章推荐功能的实现是基于用户阅读历史推荐和文章的标签相似度推荐,可以帮助用户更方便地获取到自己感兴趣的文章。

感谢您的阅读!


http://www.kler.cn/news/17164.html

相关文章:

  • Renesas瑞萨A4M2和STM32 CAN通信
  • 程序员如何学好PHP?做好这五个方面就够了
  • 使用Webpack搭建项目(vue篇)
  • [230507]托福听力真题TPO66词汇 |无重复|20:50~21:55 + 8:00~8:30
  • Nginx搭建以及使用(linux)
  • ( 数组和矩阵) 697. 数组的度 ——【Leetcode每日一题】
  • 基于springboot的家政服务管理平台(源码,设计文档等)
  • 四元数快速入门【Quaternion】
  • 【软考数据库】第七章 关系数据库
  • 拥抱智能时代:初探RFID系统
  • C++每日一练:小艺照镜子(详解分治法)
  • Sprinboot+Vue前后端分离的电脑手机服装数码产品商城系统
  • 探索Qt线程编程的奥秘:多角度深入剖析
  • 在 Swift 中使用百度地图 SDK
  • Gitlab自动触发jenkins完成自动化构建
  • xcode打包导出ipa
  • 数据结构与算法(十一) 单调栈与单调队列
  • 【华为OD机试 2023最新 】寻找相似单词(C语言题解 100%)
  • Java中的字符串是如何处理的?
  • 【Java入门合集】第二章Java语言基础(二)
  • 【Matlab】基于改进的 Hausdorf 距离的DBSCAN船舶航迹聚类
  • 力扣(LeetCode)1172. 餐盘栈(C++)
  • 电脑中病毒了怎么修复,计算机Windows系统预防faust勒索病毒方法
  • RUST 每日一省:泛型约束——trait
  • Java面试题JVM JDK 和 JRE
  • 9:00进去,9:05就出来了,这问的也太···
  • 麻雀键值数据库开发日志
  • Linux常用的压缩、解压缩以及scp远程传输命令的使用
  • Android中Paint字体的灵活使用
  • 如何将 Elasticsearch 和时间序列数据流用于可观察性指标 - 8.7