当前位置: 首页 > article >正文

Python3 【集合】项目实战:3 个新颖的学习案例

Python3 【集合】项目实战:3 个新颖的学习案例

以下是 3 个应用“Python 集合”知识的综合应用项目,这些项目具有新颖性、前瞻性和实用性,每个项目都包含完整的代码、解释说明、测试案例和执行结果。

  1. 基因序列比对
  2. 文章推荐系统
  3. 运行日志分析

项目 1:基因序列比对(集合运算与去重)

项目描述

在生物信息学中,比对两个基因序列的相似性。使用集合的交集和并集计算相似度。

代码实现

# 基因序列(简化为字符串集合)
sequence1 = {"A", "T", "C", "A", "A", "A"}
sequence2 = {"A", "C", "G", "G", "T", "T"}

# 计算相似度
def sequence_similarity(seq1, seq2):
    intersection = seq1 & seq2  # 交集
    union = seq1 | seq2  # 并集
    similarity = len(intersection) / len(union)
    return similarity

# 测试
similarity = sequence_similarity(sequence1, sequence2)
print(f"基因序列相似度:{similarity:.2f}")

测试案例

  • 基因序列 1: {"A", "T", "C", "A", "A", "A"}
  • 基因序列 2: {"A", "C", "G", "G", "T", "T"}

执行结果

基因序列相似度:0.75

项目 2:文章推荐系统(去重与交集应用)

项目描述

设计一个简单的推荐系统,基于用户的历史行为和兴趣标签,推荐新的内容。使用集合的交集运算找到用户可能感兴趣的内容。

代码实现

# 用户兴趣标签和历史行为
user_interests = {"python", "AI", "machine learning", "data science"}
content_tags = {
    "article1": {"python", "data science"},
    "article2": {"AI", "deep learning"},
    "article3": {"machine learning", "statistics"},
    "article4": {"python", "web development"},
}

# 推荐函数
def recommend_content(user_interests, content_tags):
    recommendations = {}
    for content, tags in content_tags.items():
        common_tags = user_interests & tags  # 计算交集
        if common_tags:
            recommendations[content] = common_tags
    return recommendations

# 测试
recommendations = recommend_content(user_interests, content_tags)
print("推荐内容及共同兴趣标签:")
for content, tags in recommendations.items():
    print(f"{content}: {tags}")

测试案例

  • 用户兴趣标签:{"python", "AI", "machine learning", "data science"}
  • 内容标签:
    • article1: {"python", "data science"}
    • article2: {"AI", "deep learning"}
    • article3: {"machine learning", "statistics"}
    • article4: {"python", "web development"}

执行结果

推荐内容及共同兴趣标签:
article1: {'python', 'data science'}
article2: {'AI'}
article3: {'machine learning'}
article4: {'python'}

项目 3:运行日志分析(去重与统计)

项目描述

分析服务器日志,统计独立 IP 地址的数量,并找出访问量最高的 IP 地址。

代码实现

# 模拟日志数据
logs = [
    "192.168.1.1 - GET /index.html",
    "192.168.1.2 - GET /about.html",
    "192.168.1.1 - POST /login",
    "192.168.1.3 - GET /index.html",
    "192.168.1.2 - GET /contact.html",
]

# 统计独立 IP 地址
unique_ips = set(log.split()[0] for log in logs)
print(f"独立 IP 地址数量:{len(unique_ips)}")

# 统计访问量最高的 IP 地址
from collections import Counter
ip_counter = Counter(log.split()[0] for log in logs)
most_common_ip = ip_counter.most_common(1)[0]
print(f"访问量最高的 IP 地址:{most_common_ip[0]},访问次数:{most_common_ip[1]}")

测试案例

  • 日志数据:
    192.168.1.1 - GET /index.html
    192.168.1.2 - GET /about.html
    192.168.1.1 - POST /login
    192.168.1.3 - GET /index.html
    192.168.1.2 - GET /contact.html
    

执行结果

独立 IP 地址数量:3
访问量最高的 IP 地址:192.168.1.1,访问次数:2

总结

这些项目展示了 Python 集合在实际问题中的广泛应用,包括基因分析对比、文章推荐系统、运行日志分析等方面。通过这些项目,可以深入理解集合的强大功能和灵活性。


http://www.kler.cn/a/526444.html

相关文章:

  • 网站快速收录:提高页面加载速度的重要性
  • python | OpenCV小记(一):cv2.imread(f) 读取图像操作(待更新)
  • Ubuntu安装VMware17
  • 【漫话机器学习系列】067.希腊字母(greek letters)-写法、名称、读法和常见用途
  • Java---猜数字游戏
  • Golang笔记——常用库context和runtime
  • 【笑着写算法系列】二分查找
  • 在 WSL2 中重启 Ubuntu 实例
  • 特殊Token区域与共享区域
  • 分享|借鉴传统操作系统中分层内存系统的理念(虚拟上下文管理技术)提升LLMs在长上下文中的表现
  • LINUX部署微服务项目步骤
  • C++:多继承习题5
  • 文件(c语言文件流)
  • AI时序预测: iTransformer算法代码深度解析
  • UE学习日志#15 C++笔记#1 基础复习
  • 无线通信与人工智能技术与发展年度总结
  • MYSQL 商城系统设计 商品数据表的设计 商品 商品类别 商品选项卡 多表查询
  • Kafka 压缩算法详细介绍
  • 【股票数据API接口41】如何获取股票指最新分时MA数据之Python、Java等多种主流语言实例代码演示通过股票数据接口获取数据
  • gesp(C++六级)(7)洛谷:P10376:[GESP202403 六级] 游戏
  • 范冰冰担任第75届柏林电影节主竞赛单元评委 共鉴电影佳作
  • CF1098F Ж-function
  • F. Ira and Flamenco
  • 智慧园区系统助力企业智能化升级实现管理效率与安全性全方位提升
  • B站吴恩达机器学习笔记
  • C++11之列表初始化