当前位置: 首页 > article >正文

Python3 【集合】:使用示例参考手册

Python3 【集合】:使用示例参考手册

Python 的集合(set)由于其无序性唯一性高效性,在许多场景中非常有用。以下是集合的经典应用场景及代码演示:


1. 去重

集合常用于从列表或其他可迭代对象中去除重复元素。

# 示例:列表去重
data = [1, 2, 2, 3, 4, 4, 5]
unique_data = set(data)  # 转换为集合去重
print(unique_data)  # 输出: {1, 2, 3, 4, 5}

# 如果需要结果仍然是列表
unique_list = list(unique_data)
print(unique_list)  # 输出: [1, 2, 3, 4, 5]

2. 成员检测

集合的成员检测效率非常高(时间复杂度为 O(1)),适合用于快速判断元素是否存在。

# 示例:检查元素是否在集合中
fruits = {"apple", "banana", "cherry"}
print("banana" in fruits)  # 输出: True
print("orange" in fruits)  # 输出: False

3. 集合运算

集合支持并集、交集、差集等数学运算,适合处理需要比较或合并数据的场景。

# 示例:集合运算
set1 = {1, 2, 3, 4}
set2 = {3, 4, 5, 6}

# 并集
union_set = set1 | set2
print(union_set)  # 输出: {1, 2, 3, 4, 5, 6}

# 交集
intersection_set = set1 & set2
print(intersection_set)  # 输出: {3, 4}

# 差集
difference_set = set1 - set2
print(difference_set)  # 输出: {1, 2}

# 对称差集(只存在于一个集合中的元素)
symmetric_difference_set = set1 ^ set2
print(symmetric_difference_set)  # 输出: {1, 2, 5, 6}

4. 过滤重复数据

集合可以快速过滤掉重复数据,例如从日志中提取唯一的 IP 地址。

# 示例:从日志中提取唯一 IP 地址
logs = [
    "192.168.1.1 - GET /index.html",
    "192.168.1.2 - GET /about.html",
    "192.168.1.1 - POST /login",
    "192.168.1.3 - GET /index.html",
]

# 提取 IP 地址
ips = set(log.split()[0] for log in logs)
print(ips)  # 输出: {'192.168.1.1', '192.168.1.2', '192.168.1.3'}

5. 查找共同元素

集合的交集运算可以快速找到两个数据集中的共同元素。

# 示例:查找两个列表中的共同元素
list1 = [1, 2, 3, 4, 5]
list2 = [4, 5, 6, 7, 8]

common_elements = set(list1) & set(list2)
print(common_elements)  # 输出: {4, 5}

6. 集合的差集运算

差集运算可以用于从一个集合中剔除另一个集合中的元素。

# 示例:从集合中剔除特定元素
allowed_fruits = {"apple", "banana", "cherry", "orange"}
forbidden_fruits = {"banana", "orange"}

safe_fruits = allowed_fruits - forbidden_fruits
print(safe_fruits)  # 输出: {'apple', 'cherry'}

7. 统计唯一值

集合可以用于统计唯一值的数量。

# 示例:统计列表中唯一值的数量
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4]
unique_count = len(set(data))
print(unique_count)  # 输出: 4

8. 集合的对称差集

对称差集可以用于找出两个集合中不重复的元素。

# 示例:找出两个集合中不重复的元素
set1 = {1, 2, 3, 4}
set2 = {3, 4, 5, 6}

symmetric_diff = set1 ^ set2
print(symmetric_diff)  # 输出: {1, 2, 5, 6}

9. 集合的子集和超集检测

集合提供了方法用于检测一个集合是否是另一个集合的子集或超集。

# 示例:子集和超集检测
set1 = {1, 2, 3}
set2 = {1, 2, 3, 4, 5}

# 检测子集
print(set1.issubset(set2))  # 输出: True

# 检测超集
print(set2.issuperset(set1))  # 输出: True

10. 集合的更新操作

集合支持批量添加元素或与其他集合合并。

# 示例:更新集合
fruits = {"apple", "banana"}
fruits.update(["cherry", "orange"])  # 添加多个元素
print(fruits)  # 输出: {'apple', 'banana', 'cherry', 'orange'}

# 与其他集合合并
more_fruits = {"mango", "grape"}
fruits.update(more_fruits)
print(fruits)  # 输出: {'apple', 'banana', 'cherry', 'orange', 'mango', 'grape'}

总结

集合在 Python 中的应用场景非常广泛,包括去重、成员检测、集合运算、过滤数据等。由于其高效的特性,集合在处理大量数据时非常有用。通过合理使用集合,可以显著提升代码的性能和可读性。


http://www.kler.cn/a/526692.html

相关文章:

  • 21.3-启动流程、编码风格(了解) 第21章-FreeRTOS项目实战--基础知识之新建任务、启动流程、编码风格、系统配置 文件组成和编码风格(了解)
  • 【漫话机器学习系列】068.网格搜索(GridSearch)
  • 论文阅读(七):贝叶斯因果表型网络解释遗传变异和生物学知识
  • JxBrowser 7.41.7 版本发布啦!
  • mysql_init和mysql_real_connect的形象化认识
  • [论文总结] 深度学习在农业领域应用论文笔记14
  • 电感的饱和、温升、额定电流
  • Protocol Buffers c# with c++ communcation demo
  • 编程题-三数之和(中等)
  • 20-30 五子棋游戏
  • 【2024年华为OD机试】 (B卷,100分)- 乘坐保密电梯(JavaScriptJava PythonC/C++)
  • 如何用大语言模型做一个Html+CSS+JS的词卡网站
  • WINDOWS安装eiseg遇到的问题和解决方法
  • day1-->day7| 机器学习(吴恩达)学习笔记
  • FLTK - FLTK1.4.1 - 搭建模板,将FLTK自带的实现搬过来做实验
  • 知识管理平台在数字经济时代推动企业智慧决策与知识赋能的路径分析
  • 全面认识了解DeepSeek+利用ollama在本地部署、使用和体验deepseek-r1大模型
  • 【仓颉】仓颉编程语言Windows安装指南 配置环境变量 最简单解决中文乱码问题和其他解决方案大全
  • 360嵌入式开发面试题及参考答案
  • 【Linux指令/信号总结】粘滞位 重定向 系统调用 信号产生 信号处理
  • 【开源免费】基于Vue和SpringBoot的医院资源管理系统(附论文)
  • Python的那些事第六篇:从定义到应用,Python函数的奥秘
  • 将多目标贝叶斯优化与强化学习相结合用于TinyML
  • 2024年数据记录
  • 【16届蓝桥杯寒假刷题营】第1期DAY2
  • 创建 priority_queue - 进阶(内置类型)c++