基于标签的协同过滤算法实现与个人兴趣相关的文章推荐
一、前言
在当前信息爆炸的时代,每天都会涌现出大量的文章,人们有时候会感到信息的获取难度比筛选更大。而作为信息的提供者,我们应当为用户提供依据个人兴趣的文章推荐。
本项目中的文章标签相似度推荐功能使用了一种基于标签的协同过滤算法。具体地,我们先计算每篇文章的标签,然后计算出两篇文章之间的标签相似度,最后根据用户阅读过的文章,找到与之最相似的文章,推荐给用户。
下面是使用Java实现计算标签相似度的示例代码:
/**
* 计算标签之间的相似度
*/
private double calculateSimilarity(List<String> tags1, List<String> tags2) {
Set<String> set1 = new HashSet<>(tags1);
Set<String> set2 = new HashSet<>(tags2);
// 计算并集大小
int unionSize = set1.size() + set2.size();
set1.addAll(set2);
// 计算交集大小
int intersectSize = unionSize - set1.size();
return (double) intersectSize / unionSize;
}
该方法以两个标签集合为参数,先将它们转化为Set,然后计算它们的并集和交集的大小,最后返回它们的相似度。
需要注意的是,这个算法实现会出现冷启动问题,即对于用户没有阅读记录的情况,我们无法根据它的阅读历史推荐文章。可以在这种情况下,使用一些简单的推荐策略,如热门文章推荐等。
二、后端开发
1. 框架和工具选择
本项目使用SpringBoot、SpringMVC和Mybatis-Plus构建后端。SpringBoot简化了Spring应用程序的搭建,SpringMVC是Spring的Web框架,Mybatis-Plus是Mybatis的增强工具。
2. 数据库设计
在本项目中,我们需要存储文章和用户的相关信息。具体的设计如下:
文章表(article):
字段名 | 字段类型 | 描述 |
---|---|---|
id | Long | 主键 |
title | String | 文章标题 |
author | String | 文章作者 |
content | String | 文章内容 |
create_time | Date | 发布时间 |
category | String | 文章分类 |
用户表(user):
字段名 | 字段类型 | 描述 |
---|---|---|
id | Long | 主键 |
username | String | 用户名 |
password | String | 密码 |
String | 邮箱 | |
create_time | Date | 注册时间 |
用户-文章表(user_article):
字段名 | 字段类型 | 描述 |
---|---|---|
id | Long | 主键 |
user_id | Long | 用户id |
article_id | Long | 文章id |
create_time | Date | 阅读时间 |
3. 接口设计
本项目共有以下接口:
注册接口(POST /user/register):用户注册接口,参数为用户名、密码、邮箱。
登录接口(POST /user/login):用户登录接口,参数为用户名和密码。
获取文章列表接口(GET /article/list):获取所有文章列表。
获取用户阅读历史接口(GET /user/history):获取用户阅读历史。
获取推荐文章接口(POST /article/recommend):获取推荐文章,参数为用户id。
4. 实现逻辑
用户注册接口:
前端请求:
axios.post('/user/register', {
username: 'username',
password: 'password',
email: 'email'
}).then(res => {
console.log(res.data)
})
后端实现:
@PostMapping("/register")
public Result registerUser(@RequestBody User user) {
User existUser = userService.findUserByUsername(user.getUsername());
if (existUser != null) {
return Result.error("该用户名已被注册");
}
user.setPassword(DigestUtils.md5DigestAsHex(user.getPassword().getBytes()));
userService.saveUser(user);
return Result.success("注册成功");
}
用户登录接口:
前端请求:
axios.post('/user/login', {
username: 'username',
password: 'password'
}).then(res => {
console.log(res.data)
})
后端实现:
@PostMapping("/login")
public Result loginUser(@RequestBody User user) {
User existUser = userService.findUserByUsername(user.getUsername());
if (existUser == null) {
return Result.error("该用户不存在");
}
if (!existUser.getPassword().equals(DigestUtils.md5DigestAsHex(user.getPassword().getBytes()))) {
return Result.error("密码错误");
}
String token = JwtUtil.createToken(existUser.getId(), existUser.getUsername());
return Result.success(token);
}
获取文章列表接口:
前端请求:
axios.get('/article/list').then(res => {
console.log(res.data)
})
后端实现:
@GetMapping("/getArticles")
public Result getArticles() {
List<Article> articles = articleService.findArticles();
return Result.success(articles);
}
获取用户阅读历史接口以及前端请求:
需要在请求头中添加token。
axios.get('/user/history', {
headers: {
'Authorization': 'Bearer ' + token
}
}).then(res => {
console.log(res.data)
})
后端实现:
@GetMapping("/history")
public Result getUserHistory(HttpServletRequest request) {
Long userId = JwtUtil.getUserId(request.getHeader("Authorization"));
List<UserArticle> userArticles = userArticleService.findUserArticlesByUserId(userId);
List<Article> articles = new ArrayList<>();
for (UserArticle userArticle : userArticles) {
Article article = articleService.findArticleById(userArticle.getArticleId());
articles.add(article);
}
return Result.success(articles);
}
获取推荐文章接口以及前端请求:
需要在请求头中添加token。
axios.post('/article/recommend', {
user_id: userId
}, {
headers: {
'Authorization': 'Bearer ' + token
}
}).then(res => {
console.log(res.data)
})
后端实现:
@PostMapping("/recommend")
public Result recommendArticles(@RequestBody Map<String, Long> paramMap, HttpServletRequest request) {
Long userId = paramMap.get("user_id");
List<Article> articles = articleService.recommendArticles(userId);
return Result.success(articles);
}
文章推荐功能的实现基于用户的阅读历史推荐和文章的标签相似度推荐。
用户阅读历史推荐的实现:
查询出用户阅读历史,根据文章分类和阅读时间排序,取出前10篇文章作为推荐文章。
public List<Article> recommendArticles(Long userId) {
// 获取用户阅读历史
List<UserArticle> userArticles = userArticleService.findUserArticlesByUserId(userId);
List<Long> articleIds = userArticles.stream().map(UserArticle::getArticleId).collect(Collectors.toList());
// 如果用户没有阅读历史,则按文章分类排序,取前10篇文章
if (articleIds.isEmpty()) {
return articleMapper.selectList(new QueryWrapper<Article>().orderByDesc("create_time").last("limit 10"));
}
// 根据文章分类和阅读时间排序,取前10篇文章
return articleMapper.selectList(new QueryWrapper<Article>().in("id", articleIds)
.orderByDesc("create_time", "category").last("limit 10"));
}
文章标签相似度推荐的实现:
计算文章之间的标签相似度,取出与用户阅读过的文章最相似的前10篇文章作为推荐文章。
public List<Article> recommendArticles(Long userId) {
// 获取用户阅读历史
List<UserArticle> userArticles = userArticleService.findUserArticlesByUserId(userId);
List<Long> articleIds = userArticles.stream().map(UserArticle::getArticleId).collect(Collectors.toList());
// 如果用户没有阅读历史,则按文章分类排序,取前10篇文章
if (articleIds.isEmpty()) {
return articleMapper.selectList(new QueryWrapper<Article>().orderByDesc("create_time").last("limit 10"));
}
// 根据文章分类和阅读时间排序,取前10篇文章
List<Article> articles = articleMapper.selectList(new QueryWrapper<Article>().in("id", articleIds)
.orderByDesc("create_time", "category").last("limit 10"));
// 计算文章之间的标签相似度
for (Article article : articles) {
List<String> articleTags = Arrays.asList(article.getTags().split(","));
for (Article a : articles) {
if (a.getId().equals(article.getId())) {
continue;
}
List<String> tags = Arrays.asList(a.getTags().split(","));
double similarity = calculateSimilarity(articleTags, tags);
a.setSimilarity(similarity);
}
}
// 取出与用户阅读过的文章最相似的前10篇文章作为推荐文章
List<Long> readArticleIds = userArticles.stream().map(UserArticle::getArticleId).collect(Collectors.toList());
List<Article> recommendArticles = articles.stream()
.filter(article -> !readArticleIds.contains(article.getId()))
.sorted(Comparator.comparingDouble(Article::getSimilarity).reversed())
.limit(10)
.collect(Collectors.toList());
return recommendArticles;
}
/**
* 计算标签之间的相似度
*/
private double calculateSimilarity(List<String> tags1, List<String> tags2) {
Set<String> set1 = new HashSet<>(tags1);
Set<String> set2 = new HashSet<>(tags2);
// 计算并集大小
int unionSize = set1.size() + set2.size();
set1.addAll(set2);
// 计算交集大小
int intersectSize = unionSize - set1.size();
return (double) intersectSize / unionSize;
}
三、前端开发
1. 框架和工具选择
本项目使用VUE框架开发前端页面,同时使用axios库进行接口请求。
2. 页面设计
本项目共有以下页面:
登录页面(login):用户登录页面,包含用户名和密码输入框及登录按钮。
注册页面(register):用户注册页面,包含用户名、密码、邮箱输入框及注册按钮。
文章列表页面(article-list):展示所有文章列表。
用户阅读历史页面(user-history):展示用户的阅读历史列表。
推荐文章页面(recommend-articles):展示推荐给用户的文章列表。
3. 实现流程
登录页面:
登录界面,用户在该界面输入用户名和密码,请求后端登录接口,得到token以便后续接口请求。
注册页面:
注册界面,用户在该界面输入用户名、密码、邮箱,请求后端注册接口。
文章列表页面:
展示所有文章列表,用户点击文章标题可以进入文章详情页面。
用户阅读历史页面:
展示用户的阅读历史列表,用户可以查看阅读历史记录。
推荐文章页面:
展示推荐给用户的文章列表,根据后端推荐接口的返回结果展示。
四、总结
本篇博文详细介绍了如何使用SpringBoot、SpringMVC和Mybatis-Plus构建后端,使用VUE框架开发前端页面,以及如何实现文章推荐功能的详细流程和代码。
文章推荐功能的实现是基于用户阅读历史推荐和文章的标签相似度推荐,可以帮助用户更方便地获取到自己感兴趣的文章。
感谢您的阅读!