当前位置: 首页 > article >正文

关联式容器:map和set

引言:

在计算机科学中,我们经常需要处理一系列具有关键字的元素,并希望对这些元素进行高效的查找、插入和删除操作。为了满足这些需求,我们可以使用BSTree来实现。BSTree作为一种基础的数据结构,它不仅能够帮助我们快速地定位元素,还可以方便地进行元素的插入和删除操作。

在此基础上,map和set这两种数据结构在BSTree的基础上进行了封装,提供了更为丰富的功能

本文将通过三个方面,对map和set进入学习。

1. 关联式容器
2. 键值对
3. 树形结构的关联式容器

一、关联式容器

在初阶阶段,我们已经接触过STL中的部分容器,比如:vector、list、deque、forward_list(C++11)等,这些容器统称为 序列式容器,因为其底层为 线性序列的数据结构,里面
存储的是元素本身。那什么是关联式容器?它与序列式容器有什么区别?
关联式容器也是用来存储数据的,与序列式容器不同的是,其 里面存储的是<key, value>结构的
键值对,在数据检索时比序列式容器效率更高

关联式容器的几个特征

  • 元素根据特定的排序标准(通常是关键字)存储。
  • 元素的位置与它们的关键字有关。
  • 通常通过关键字来访问元素
  • 支持对关键字的范围查询和快速查找。
  • 访问元素的时间复杂度通常是O(log n),因为它们通常基于平衡二叉搜索树(如红黑树)实现。
  • setmap容器保证元素的唯一性
  • multisetmultimap允许重复的元素。
  • 不支持随机访问,因为元素是排序的
  • 支持快速的查找、插入和删除操作,尤其是基于关键字的操作。
  • 自动保持元素的排序状态。
  • 适用于需要根据关键字快速查找元素的情况。
  • 适用于元素唯一性很重要的情况。

二、 键值对

简介

用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key和value,key代
表键值,value表示与key对应的信息
比如:现在要建立一个英汉互译的字典,那该字典中必然有英文单词与其对应的中文含义,而且,英文单词与其中文含义是一一对应的关系,即通过该应该单词,在词典中就可以找到与其对应的中文含义。
SGI-STL 中关于键值对的定义:
template <class T1, class T2>
struct pair
{
typedef T1 first_type;
typedef T2 second_type;
T1 first;
T2 second;
pair(): first(T1()), second(T2())
{}
pair(const T1& a, const T2& b): first(a), second(b)
{}
};

这里的键值对通常是pair类和make_pair函数实现的。

pair类

pair 是一个模板类,它可以存储两个值,这两个值可以是不同的数据类型。当你需要将两个相关数据作为一个单元来处理时,pair 非常有用。

pair类存在<utility>这个头文件中,utility这个文件名就起名起的得很好,utility的意思是 实用。
确确实实pair是一个使用的类。
构造:

定义

std::pair<T1, T2> p(value1, value2);
这里  T1 和  T2 是  pair 中两个元素的数据类型, value1 和  value2 是这两个元素的初始值。

示例:

#include <utility> // 引入 pair 的定义

std::pair<int, double> p1(1, 2.3);
std::pair<std::string, int> p2("example", 10);

这里的p1和p2就是一个pair对象,是存储了两个值的小单元。可以通过p1.first        p1.second这种形式来访问单元内部的成员。

make_pair函数

同样在<utility>中。make_pair 是一个函数模板,它用于从两个值创建一个 pair 对象。这个函数的目的是为了方便,它允许你不必显式指定 pair 的类型,函数会根据提供的参数自动推导出 pair 的类型

定义

std::pair<T1, T2> make_pair(T1 x, T2 y);

可以看出这个函数的返回值是一个pair对象。在我们使用的时候,只需要写出make_pair的参数即可,会自动推导出pair对象。这里 T1 和 T2 是从参数 x 和 y 的类型推导出来的。

使用示例

#include <utility> // 引入 make_pair 的定义

std::pair<int, double> p1 = std::make_pair(1, 2.3);
std::pair<std::string, int> p2 = std::make_pair("example", 10);

在返回类型设置为pair类型时,make_pair作返回十分好用!

区别

  • 类型pair 是一个类模板,用于定义存储两个值的对象;而 make_pair 是一个函数模板,用于创建 pair 对象。
  • 使用方式:当你使用 pair 时,必须指定存储的数据类型;而使用 make_pair 时,数据类型可以从提供的参数中自动推导。
  • 灵活性make_pair 在某些情况下更灵活,尤其是当你不知道或不想明确指定 pair 的类型时。

怎么使用

  • 当你需要创建一个 pair 对象并且知道类型时,可以直接使用 pair 的构造函数。
  • 当你想让编译器自动推导 pair 的类型,或者代码更简洁时,可以使用 make_pair
#include <iostream>
#include <utility> // 包含 pair 和 make_pair 的定义

int main() {
    // 使用 pair 的构造函数
    std::pair<int, double> p1(1, 2.3);
    
    // 使用 make_pair 创建 pair 对象
    std::pair<std::string, int> p2 = std::make_pair("example", 10);
    
    // 输出 pair 的值
    std::cout << "p1: " << p1.first << ", " << p1.second << std::endl;
    std::cout << "p2: " << p2.first << ", " << p2.second << std::endl;
    
    return 0;
}

3. 树形结构的关联式容器

根据应用场景的不同,STL总共实现了 两种不同结构的关联式容器树型结构与哈希结构树型结
构的关联式容器主要有四种:map、set、multimap、multiset。这四种容器的共同点是:使
平衡搜索树(即红黑树)作为其底层结果,容器中的元素是一个有序的序列。下面一依次介绍每一
个容器。

set

简介:

在C++的STL(标准模板库)中,set是一种关联容器,它存储了由关键字组成的已排序的集合,并且每个关键字的值都是唯一的。以下是set的一些基本特性和用法简介:

特性

  1. 唯一性:在set中,所有的元素都是唯一的,不能有重复的元素。
  2. 自动排序set中的元素总是按照特定的顺序排序,默认是升序排序。这是通过元素的关键字进行比较来完成的,通常使用<运算符。
  3. 基于红黑树实现:在大多数实现中,set是基于红黑树来实现的,这意味着操作如插入、删除和查找都具有对数时间复杂度,即O(log n)
  4. 非顺序访问:与vectordeque不同,set不支持快速随机访问,因为它是基于树结构实现的。

常用成员函数

  • insert(const T& value):在set中插入一个元素。如果元素已存在,则set保持不变。
  • erase(const T& value):从set中删除指定的元素。
  • find(const T& value):在set中查找元素,如果找到则返回指向元素的迭代器,否则返回end()
  • size():返回set中元素的数量。
  • empty():检查set是否为空。
  • begin():返回指向set中第一个元素的迭代器。
  • end():返回指向set中最后一个元素之后位置的迭代器。
  • clear():删除set中的所有元素。
set是一个非常有用的容器,当需要存储不重复的元素集合,并且经常进行元素的查找和删除操作时,它是一个很好的选择。

关键:

1. set是按照一定次序存储元素的容器
2. 在set中,元素的value也标识它(value就是key,类型为T),并且每个value必须是唯一的。
set中的元素不能在容器中修改(元素总是const),但是可以从容器中插入或删除它们。
3. 在内部,set中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行
排序。
4. set容器通过key访问单个元素的速度通常比unordered_set容器慢,但它们允许根据顺序对
子集进行直接迭代。
5. set在底层是用二叉搜索树(红黑树)实现的。
注意:
1. 与map/multimap不同,map/multimap中存储的是真正的键值对<key, value>,set中只放
value,但在底层实际存放的是由<value, value>构成的键值对
2. set中插入元素时,只需要插入value即可,不需要构造键值对
3. set中的元素不可以重复(因此可以使用set进行去重)。
4. 使用set的迭代器遍历set中的元素,可以得到有序序列
5. set中的元素默认按照小于来比较
6. set中查找某个元素,时间复杂度为:$log_2 n$
7. set中的元素不允许修改(为什么?)        --普通迭代器的内部是const迭代器。正确的方法是先删除旧元素,然后插入新元素。
8. set中的底层使用二叉搜索树(红黑树)来实现
set常规接口的使用
#include <set>
void TestSet()
{
    // 用数组array中的元素构造set
    int array[] = { 1, 3, 5, 7, 9, 2, 4, 6, 8, 0, 1, 3, 5, 7, 9, 2, 4, 
6, 8, 0 };
 set<int> s(array, array+sizeof(array)/sizeof(array));
 cout << s.size() << endl;
 // 正向打印set中的元素,从打印结果中可以看出:set可去重
 for (auto& e : s)
 cout << e << " ";
 cout << endl;
 // 使用迭代器逆向打印set中的元素
 for (auto it = s.rbegin(); it != s.rend(); ++it)
 cout << *it << " ";
 cout << endl;
 // set中值为3的元素出现了几次
 cout << s.count(3) << endl;
}

set复杂接口的分析

1.构造函数

2.operation系列
find接口
count接口
由于count返回1 或 0的特性,count也常用来查找某个元素在不在set中。
3.bound系列
lower_bound返回一个小于等于val的迭代器
An iterator to the the first element in the container which is not considered to go before  val, or  set::end if all elements are considered to go before  val.
upper_bound返回一个大于val的迭代器

Return value

An iterator to the the first element in the container which is considered to go after val, or set::end if no elements are considered to go after val.

因此lower_bound, upper_bound可以理解为返回一个左闭右开的区间,
使用:
我们删除时,删除的是左闭右开的区间。因此删除30 40 50 60
equal_range接口

equal_range() 函数在 C++ 中的 std::set 或 std::multiset 容器中返回的是一个左闭右开的区间(返回的是一个pair)。该函数返回一对迭代器,第一个迭代器指向第一个不小于(对于 std::set 和 std::multiset 来说是等于)给定值的元素,第二个迭代器指向第一个大于给定值的元素。

multiset

允许插入相同值的变异的搜索树。插入相同的左边右边都一样。

当我们查找时:

查找相同的元素,返回中序的第一个2

multiset的接口根set也是大差不差

1. multiset是按照特定顺序存储元素的容器,其中元素是可以重复的。
2. 在multiset中,元素的value也会识别它(因为multiset中本身存储的就是<value, value>组成
的键值对,因此value本身就是key,key就是value,类型为T). multiset元素的值不能在容器
中进行修改(因为元素总是const的),但可以从容器中插入或删除。
3. 在内部,multiset中的元素总是按照其内部比较规则(类型比较)所指示的特定严格弱排序准则
进行排序。
4. multiset容器通过key访问单个元素的速度通常比unordered_multiset容器慢,但当使用迭
代器遍历时会得到一个有序序列。
5. multiset底层结构为二叉搜索树(红黑树)。
注意:
1. multiset中再底层中存储的是<value, value>的键值对
2. mtltiset的插入接口中只需要插入即可
3. 与set的区别是,multiset中的元素可以重复,set是中value是唯一的
4. 使用迭代器对multiset中的元素进行遍历,可以得到有序的序列

map

std::map 是 C++ 标准库中的一个关联容器,它存储键值对,其中键是唯一的,而值则可以是重复的。std::map 会根据键的值自动排序,通常使用红黑树实现,这意味着在 std::map 中插入和删除操作通常具有对数时间复杂度(O(log n))。

以下是 std::map 的一些关键特性:

基本属性

  • 键值对存储std::map 存储键值对(key-value 对),其中每个键都是唯一的,而值可以是重复的。
  • 排序std::map 根据键的值自动排序所有元素。
  • 唯一性:不允许重复的键,每个键只能映射到一个值。
  • 关联性:元素是根据键来访问的,而不是它们在容器中的位置。

主要成员函数

  • 构造函数:创建一个空的 std::map 或者从一个已有的范围填充。
  • insert:插入一个新的键值对到 map 中,如果键已存在,则不会插入。
  • find:查找具有特定键的元素,如果找到返回一个迭代器,否则返回 end()
  • erase:删除由迭代器或键指定的元素。
  • size:返回 map 中元素的数量。
  • empty:检查 map 是否为空。
  • clear:删除 map 中所有的元素。

示例代码

#include <iostream>
#include <map>

int main() {
    std::map<int, std::string> students;

    // 插入键值对
    students.insert(std::pair<int, std::string>(1, "Alice"));
    students.insert(std::make_pair(2, "Bob"));
    students[3] = "Charlie"; // 使用下标操作符插入

    // 查找键为 2 的元素
    auto it = students.find(2);
    if (it != students.end()) {
        std::cout << "Student ID: " << it->first << ", Name: " << it->second << std::endl;
    }

    // 遍历 map
    std::cout << "All students:" << std::endl;
    for (const auto& pair : students) {
        std::cout << "Student ID: " << pair.first << ", Name: " << pair.second << std::endl;
    }

    // 删除键为 1 的元素
    students.erase(1);

    // 检查 map 是否为空
    if (students.empty()) {
        std::cout << "The map is empty." << std::endl;
    } else {
        std::cout << "The map is not empty." << std::endl;
    }

    return 0;
}

在这个示例中,我们创建了一个 std::map,用于存储学生的 ID 和姓名。我们展示了如何插入元素、查找元素、遍历 map 以及删除元素。由于 std::map 是基于红黑树实现的,因此它的元素会按键值自动排序。

总结:

1. map是关联容器,它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元
素。
2. 在map中,键值key通常用于排序和惟一地标识元素,而值value中存储与此键值key关联的
内容。键值key和值value的类型可能不同,并且在map的内部,key与value通过成员类型
value_type绑定在一起,为其取别名称为pair:
typedef pair<const key, T> value_type;
3. 在内部,map中的元素总是按照键值key进行比较排序的。
4. map中通过键值访问单个元素的速度通常比unordered_map容器慢,但map允许根据顺序
对元素进行直接迭代(即对map中的元素进行迭代时,可以得到一个有序的序列)。
5. map支持下标访问符,即在[]中放入key,就可以找到与key对应的value
6. map通常被实现为二叉搜索树(更准确的说:平衡二叉搜索树(红黑树))。

map的重要接口

 

1.构造

map提供了三种构造方式:1.空 2.迭代器范围 3.拷贝构造

2.operator[]

问题:当key不在map中时,通过operator获取对应value时会发生什么问题
注意:在元素访问时,有一个与operator[]类似的操作at()(该函数不常用)函数,都是通过
key找到与key对应的value然后返回其引用,不同的是:当key不存在时,operator[]用默认
value与key构造键值对然后插入,返回该默认value,at()函数直接抛异常
#include <iostream>
#include <map>

int main() {
    std::map<int, std::string> studentGrades;

    // 插入或修改键值对
    studentGrades[1] = "A"; // 插入键为 1 的元素,值为 "A"
    studentGrades[2] = "B"; // 插入键为 2 的元素,值为 "B"
    studentGrades[1] = "A+"; // 修改键为 1 的元素的值

    // 使用 operator[] 访问元素
    std::cout << "Student ID 1 has grade: " << studentGrades[1] << std::endl;

    // 使用 operator[] 访问不存在的键,这将插入一个新的键值对
    // 假设 std::string 有一个默认构造函数,它将创建一个空字符串
    std::cout << "Student ID 3 has grade: " << studentGrades[3] << std::endl;

    // 打印所有学生的成绩
    std::cout << "All student grades:" << std::endl;
    for (const auto& pair : studentGrades) {
        std::cout << "Student ID: " << pair.first << ", Grade: " << pair.second << std::endl;
    }

    return 0;
}

支持迭代器范围for,但是这是个pair对象

map中元素的修改相关的接口
函数声明
功能简介
pair<iterator,bool> insert (
const value_type& x )
map 中插入键值对 x ,注意 x 是一个键值
对,返回值也是键值对: iterator 代表新插入
元素的位置, bool 代表释放插入成功
void erase ( iterator position )
删除 position 位置上的元素
size_type erase ( const
key_type& x )
删除键值为 x 的元素
void erase ( iterator first,
iterator last )
删除 [first, last) 区间中的元素
void swap (
map<Key,T,Compare,Allocator>&
mp )
交换两个 map 中的元素
void clear ( )
map 中的元素清空
iterator find ( const key_type& x
)
map 中插入 key x 的元素,找到返回该元
素的位置的迭代器,否则返回 end
const_iterator find ( const
key_type& x ) const
map 中插入 key x 的元素,找到返回该元
素的位置的 const 迭代器,否则返回 cend
size_type count ( const
key_type& x ) const
返回 key x 的键值在 map 中的个数,注意
map key 是唯一的,因此该函数的返回值
要么为 0 ,要么为 1 ,因此也可以用该函数来
检测一个 key 是否在 map

这里的value_type(一个K/V对)等介绍

当然也可以make_pair("sort", "排序“)

map的key不希望被修改,但是value可以

数据的遍历

需要注意的是,由于 operator[] 在键不存在时会插入一个新的元素,因此如果键的类型没有默认构造函数,或者默认构造的值不是期望的,那么直接使用 operator[] 可能会导致意外的行为。在这种情况下,应该使用 find 或 insert 方法来更安全地处理元素。

multimap

multimap不支持[],他不知道返回哪一个键值的val的引用

std::multimap 是 C++ 标准库中的一个关联容器,它存储键值对,其中每个键可以与多个值相关联。与 std::map 不同,std::map 中每个键只能有一个对应的值,而 std::multimap 允许键有多个副本,每个副本都与不同的值相关联。

以下是 std::multimap 的一些详细信息:

特点
  • std::multimap 中的元素总是按键的升序排列。
  • 它使用红黑树实现,确保了元素的有序性。
  • 每个键可以出现多次,每个键关联的值可以不同。
  • 不支持通过键直接访问单个元素,因为可能有多个元素具有相同的键。
  • 查找、插入和删除操作的时间复杂度为 O(log n),其中 n 是容器中元素的数量。
成员函数
  • insert:插入一个或多个元素。
  • erase:删除一个或多个元素。
  • find:查找具有特定键的元素。
  • count:返回具有特定键的元素的数量。
  • lower_bound 和 upper_bound:返回一个迭代器,分别指向第一个不小于(或等于)给定键的元素和第一个大于给定键的元素。
  • equal_range:返回一个迭代器对,表示具有特定键的所有元素的范围。

1. Multimaps是关联式容器,它按照特定的顺序,存储由key和value映射成的键值对<key,
value>,其中多个键值对之间的key是可以重复的
2. 在multimap中,通常按照key排序和惟一地标识元素,而映射的value存储与key关联的内
容。key和value的类型可能不同,通过multimap内部的成员类型value_type组合在一起,
value_type是组合key和value的键值对:
typedef pair<const Key, T> value_type;
3. 在内部,multimap中的元素总是通过其内部比较对象,按照指定的特定严格弱排序标准对
key进行排序的。
4. multimap通过key访问单个元素的速度通常比unordered_multimap容器慢,但是使用迭代
器直接遍历multimap中的元素可以得到关于key有序的序列。
5. multimap在底层用二叉搜索树(红黑树)来实现。
注意:
1. multimap中的key是可以重复的。
2. multimap中的元素默认将key按照小于来比较
3. multimap中没有重载operator[]操作。
4. 使用时与map包含的头文件相同:

http://www.kler.cn/a/329980.html

相关文章:

  • TensorFlow深度学习实战(5)——神经网络性能优化技术详解
  • STM32 FreeRTOS移植
  • o3模型重大突破:引领推理语言模型新纪元,展望2025年AI发展新格局
  • 微服务之松耦合
  • Python的秘密基地--[章节11] Python 性能优化与多线程编程
  • 怎样利用海外云手机进行引流?
  • 【QT Quick】基础语法:导入外部JS文件及调试
  • html5 + css3(上)
  • 回首往事,感受change
  • Android Compose的基本使用
  • 每日一题:二分查找
  • 解决Excel时出现“被保护单元格不支持此功能“的解决办法,详细喂饭级教程
  • Raspberry Pi3B+之安装bookworm+Rpanion系统
  • 某客户Oracle RAC无法启动故障快速解决
  • 提升工作效率的编程工具:从选择到应用
  • 什么是ETL?什么是ELT?怎么区分它们使用场景
  • Python字符串string方法大全及使用方法[1]以及FastAPI框架文件上传的处理-client使用postman
  • 数据分析-27-基于pandas进行模糊匹配merge_asof和groupby分组统计
  • javaScript中的浅拷贝和深拷贝详解
  • synchronized底层是怎么通过monitor进行加锁的?
  • 【Bug】解决 Ubuntu 中 “error: Unable to Find Python3 Executable” 错误
  • 【C++算法】4.双指针_快乐数
  • redis 中IO多路复用与Epoll函数
  • 结合了LLM(大语言模型)的编辑器,不仅能理解人类语言,还能与用户互动,仿佛有了自己的思想。...
  • [倍福PLC]TwinCAT标准数据类型
  • WIFI网速不够是不是光猫的“路由模式”和“桥接模式”配置错了?