当前位置: 首页 > article >正文

简易STL实现 | List的实现

基于双向链表的数据结构

1、list的特性

双向链表:允许在序列的两端和中间 执行高效的插入和删除操作

不支持随机访问:要访问list中的元素,必须通过迭代器进行

动态内存管理: list的内部实现使用节点,每个节点都包含一个元素和指向前后节点的指针。这种结构使得list在执行插入和删除操作时能够更好地管理内存

保持迭代器有效性: list在进行插入和删除操作时,能够更好地保持迭代器的有效性,不会导致所有迭代器失效

高效的插入和删除操作: 由于list是双向链表,插入和删除操作在两端和中间都是常量时间

2、list的性能考虑

插入和删除操作: 如果 主要进行频繁的插入和删除操作,并且不需要随机访问元素,list可能比vector和deque更为高效

随机访问: 如果需要 通过索引进行随机访问元素,使用vector可能更为合适,因为 提供了常量时间的随机访问

内存使用: 由于list使用了链表结构,可能引入一些额外的内存开销。在内存使用方面,vector和deque可能更为紧凑

3、list 工作原理

在这里插入图片描述
蓝色矩形框:堆内存
红色矩形块:栈内存
红色箭头:next指针
蓝色箭头:prev指针
List类也有一个控制结构, 包含 head, tail, size 三个成员, 分别控制 链表的头尾指针和大小

4、实现list

设计一个名为 List 的 List 类,该类具有以下功能和特性

1、基础成员函数
构造函数:初始化 List 实例
析构函数:清理资源,确保无内存泄露

2、核心功能
在 List 末尾添加元素
在 List 开头添加元素
获取 List 中节点的数量
删除 List 末尾的元素
删除 List 开头的元素
删除 List 中指定值的节点

3、迭代与遍历
打印链表中的元素

4、辅助功能
重载[]运算符以对链表进行索引访问
重载<<运算符以打印链表

输入描述
题目的包含多行输入,第一行为正整数 N, 代表后续有 N 行命令序列,后面就是命令

17
push_back 10
push_back 20
push_front 30
push_front 40
size
print
get 1
pop_back
print
pop_front
print
remove 10
print
size
clear
print
size

输出描述
get 命令:输出一个整数,独占一行,代表 List 中索引为 index 的元素,如果索引无效,则输出 -1

print 命令:按照顺序打印当前 List 包含的所有元素,每个元素后都跟一个空格,打印结果独占一行;如果当前的 vector 为空,则打印 empty

4
40 30 10 20 
30
40 30 10 
30 10 
30 
1
empty
0
#include <iostream>
#include <string>
#include <sstream>
#include <stdexcept>

template<typename T>
class List {
    template <typename L>
    friend std::ostream& operator<<(std::ostream& os, List<L>& l); 
    // 注意T在参数的应用,typename不能和外层T重复:在定义友元函数时,模板参数需要独立于类模板的参数,这样可以避免与类模板的模板参数产生冲突
    // 避免歧义:在友元声明中,List<L>中使用的L必须是一个新的独立模板参数。虽然它可能与外层模板参数T类型相同,但它在语义上是独立的。这种做法避免了可能的歧义或冲突,尤其是在涉及多个模板参数的复杂情况下
    // 独立作用域:友元函数模板声明的模板参数L有自己的作用域,与类模板的模板参数T没有直接的联系或依赖关系。这种方式使得友元函数可以更加通用,适用于不同类型的List实例,而不受限于外层模板参数
    // 更好的可读性和维护性:通过引入新的模板参数L,可以更清楚地表达友元函数的独立性和泛型特性。即使在友元函数的实现中,L和T最终是同一种类型,使用不同的名称也有助于提高代码的可读性和维护性
    // 如果 不希望友元函数是模板函数,而是直接使用类模板参数 T,但定义必须在类的内部(在这种情况下,友元函数被限制为只能用于与 List<T> 匹配的类型,而不能用于其他类型的 List<U>)
    //template<typename T>
    //class List {
    //    friend std::ostream& operator<<(std::ostream& os, const List<T>& l) {
    //        for (auto* cur = l.head; cur; cur = cur->next) {
    //            os << cur->data << " ";
    //        }
    //        return os;
    //    }

    //    // 其他成员...
    //};
    // 如果在类外面定义友元函数,并且希望使用类模板的模板参数 T,那么 必须在函数定义中重新声明模板参数 T
    // 就像代码实现的那样
    
    // 为什么<<运算符友元,[]运算符为成员函数
    // 
    // << 运算符为什么是友元函数
    // 左操作数的类型: << 是一个二元运算符,通常用于输出流操作,其左操作数是一个 std::ostream 类型,而右操作数是用户自定义的类对象。如果 << 运算符被实现为成员函数,那么 std::ostream 必须是类的成员,这在实际中是不可能的,因为 std::ostream 是标准库中的类。为了允许 std::ostream 作为左操作数,因此通常将 << 运算符重载为友元函数
    // 对私有数据的访问:为了便于直接访问类的私有成员, << 运算符通常被定义为友元函数。友元函数虽然不属于类的成员,但它可以访问类的私有成员,这样可以方便地实现打印或输出类的内部状态
    // 操作符的对称性: << 运算符通常用于与 std::ostream 结合进行链式调用,如 std::cout << obj1 << obj2; 。通过友元函数,可以保证操作符的对称性和流操作的自然性
    //
    // [] 运算符为什么是成员函数
    // 对象的直接访问:[] 运算符通常用于通过索引访问类的内部数据。这个操作对类内部的数据结构有直接的操作需求,因此最好作为类的成员函数实现。这样可以直接访问类的私有或受保护成员,并根据索引返回对应的元素
    // 依赖对象的状态:[] 运算符的语义通常与对象的内部状态强相关。因为[] 操作是对当前对象(即 this 指针)的操作,通常需要知道该对象内部如何存储数据,并根据索引返回或修改数据。作为成员函数,[] 可以很自然地操作和返回对象内部的数据
    // 左值和右值支持:将[] 运算符作为成员函数,可以很容易地支持左值和右值访问。例如,可以分别重载 const 版本和非 const 版本的[] 运算符,以支持不同上下文中的使用需求
    // 
    // 类的成员函数的左操作数必须是类的对象(即该类的实例),而右操作数则可以是任何类型。这是因为成员函数的第一个(隐式)参数是指向调用对象的 this 指针,因此左操作数就是调用该成员函数的对象
    // 成员函数是在类的对象上调用的,调用时隐式地传递了 this 指针作为左操作数。因此,左操作数必须是类的实例。例如,对于 obj.method(),obj 是左操作数,而 method 是成员函数。this 指针指向 obj,所以 obj 必须是类的对象
    // 对于运算符重载,如果运算符是成员函数,那么它的左操作数必须是类的实例。例如,对于重载的 operator[],在表达式 obj[index] 中,obj 是类的对象,index 是右操作数
private:
    struct Node {
        T data;
        Node* next;
        Node* pre;
        Node(const T& d, Node* n = nullptr, Node* p = nullptr) : // 参数中的const一定要与后面初始化中的匹配
            data(d), next(n), pre(p) {}
    };
    // Node* data; 不用指向数据
    Node* head;
    Node* tail;
    size_t size;
public:
    List() : head(nullptr), tail(nullptr), size(0) {}
    List(Node* h, Node* t, size_t s) : head(h), tail(t), size(s) {}
    ~List() {
        clear();
    }

    void push_back(const T& ele) { // 成员函数的参数都为T,不可能是Node
        Node* n = new Node(ele, nullptr, tail);
        size++;
        if (head == nullptr) {
            head = n;
            tail = n;
        }
        else {
            tail->next = n;
            tail = n;
        }
    }

    void push_front(const T& ele) {
        Node* newFront = new Node(ele, head, nullptr); 
        // 注意ele是const,定义的构造函数参数也要是 const
        size++;
        if (head == nullptr) {
            head = newFront;
            tail = newFront;
        }
        else {
            head->pre = newFront;
            head = newFront;
        }
    }

    size_t getSize() {
        return size;
    }

    void pop_back() {
        if (head != nullptr) {
            size--;
            if (size == 0) {
                delete head;
                head = nullptr;
                tail = nullptr;
                return;
            }
            tail->pre->next = nullptr;
            Node* deleteNode = tail;
            tail = tail->pre;
            delete deleteNode;
        }
    }
    // void pop_back()
    //{
    //    if (size > 0)
    //    {
    //        // 获取尾节点的前一个节点
    //        Node* newTail = tail->prev;

    //        // 删除尾节点
    //        delete tail;

    //        // 更新尾节点指针和链表大小
    //        tail = newTail;
    //        if (tail)
    //        {
    //            tail->next = nullptr;
    //        }
    //        else
    //        {
    //            head = nullptr; // 如果链表为空,头节点也置为空
    //        }

    //        --size;
    //    }
    //}

    void pop_front() {
        if (head != nullptr) {
            Node* newHead = head->next;
            delete head;
            head = newHead;
            size--;
            if (newHead == nullptr) {
                tail = nullptr;
            }
            else {
                newHead->pre = nullptr;
            }
        }
    }

    T& get(size_t pos) {
        Node* cur = head;
        while (pos--) {
            if (cur == nullptr) {
                throw std::out_of_range("Index out of range");
            }
            cur = cur->next;
        }
        return cur->data;
    }

    void remove(const T& ele) {
        Node* cur = head;
        while (cur != nullptr) {
            if (cur->data == ele) {
                if (cur == head) {
                    pop_front();
                }
                else if (cur == tail) {
                    pop_back();
                }
                else {
                    cur->pre->next = cur->next;
                    cur->next->pre = cur->pre;
                    delete cur; 
                    // 调用的析构函数是 Node 结构体的析构函数(析构函数负责清理对象内部的资源,但不会释放对象本身的内存),之后,delete 操作符会释放 cur 指向的内存(delete:析构函数+释放内存)
                    // 如果没有显式定义析构函数,编译器会为 Node 生成一个默认的析构函数。这个默认的析构函数会调用成员变量的析构函数,依次销毁 data、next 和 pre 成员
                    // 对于 next 和 pre 这两个指针成员,它们是普通指针,不涉及动态分配的内存管理,因此默认析构函数不会对它们进行任何特殊处理
                    //struct Node {
                    //    int* data;
                    //    Node* next;
                    //    Node* pre;

                    //    Node(int value) : data(new int(value)), next(nullptr), pre(nullptr) {}

                    //    ~Node() {
                    //        delete data; // 释放动态分配的内存
                    //    }
                    //};

                    size--; // 别忘了减size
                }
                return;
            }
            cur = cur->next;
        }
    }

    Node* begin() {
        return head;
    }

    Node* end() {
        return nullptr; // 不是end
    }

    const Node* begin() const {
        return head;
    }

    const Node* end() const {
        return nullptr; // 不是end
    }

    void print() {
        Node* cur = head;
        if (head == nullptr)
            std::cout << "empty";
        while (cur) {
            std::cout << cur->data << " ";
            cur = cur->next;
        }
        std::cout << std::endl;
    }

    T& operator[](size_t pos) {
        return get(pos);
    }

    const T& operator[](size_t pos) const {
        return get(pos);
    }

    void clear() {
        size = 0;
        Node* cur = head;
        while (cur != nullptr) {
            Node* tmp = cur;
            cur = cur->next;
            delete tmp;
        }
        tail = nullptr; // 头,尾巴别忘了设nullptr
        head = nullptr;
    }
};

template <typename T>
std::ostream& operator<<(std::ostream& os, List<T>& l) {
    for (typename List<T>::Node* cur = l.head; cur; cur = cur->next) { // 注意调用List<T>的方式
        // 为什么要加 typename
        // 在模板代码中,编译器在解析模板时并不知道 List<T>::Node 是一个类型还是一个静态成员变量,除非你明确告诉它这是因为在模板实例化之前,编译器无法确定 T 是什么类型,因此无法确定 List<T>::Node 是什么
        os << cur->data << " ";
    }
    os << std::endl;
}

int main() {
    int N;
    std::cin >> N;
    getchar(); // 读走回车
    List<int> myList; // 调用默认构造函数
    std::string line;
    while (N--) {
        getline(std::cin, line);
        std::istringstream iss(line);
        std::string command;
        iss >> command;
        if (command == "push_back") {
            int i;
            iss >> i;
            myList.push_back(i);
        }
        else if (command == "push_front") {
            int i;
            iss >> i;
            myList.push_front(i);
        }
        else if (command == "pop_back") {
            myList.pop_back();
        }
        else if (command == "pop_front") {
            myList.pop_front();
        }
        else if (command == "remove") {
            int i;
            iss >> i;
            myList.remove(i);
        }
        else if (command == "clear") {
            myList.clear();
        }
        else if (command == "size") {
            std::cout << myList.getSize() << std::endl;
        }
        else if (command == "get") {
            size_t pos;
            iss >> pos;
            std::cout << myList[pos] << std::endl;
        }
        else if (command == "print") {
            //for (auto& curNode : myList) {
            //    // :前面 会去掉begin / end的指针
            //    std::cout << curNode.data << " ";
            //} 
            // 为什么没办法遍历所有元素 
            // C++ 的范围循环依赖于容器提供的 begin() 和 end() 成员函数,这些函数必须返回符合标准的迭代器对象。标准迭代器通常定义了以下运算符:
            // *:解引用运算符,用于访问当前元素
            // ++:前置或后置递增运算符,用于移动到下一个元素。
            // != :用于判断两个迭代器是否不相等(通常在循环中作为终止条件)
            // List 类中,begin() 和 end() 返回的是指向 Node 的原始指针,而不是标准迭代器。因此,标准的 range-based for 循环无法直接使用这些原始指针进行遍历
            // 需要为 List 类提供自定义的迭代器
            //template<typename T>
            //class List {
            //public:
            //    // 自定义迭代器类
            //    class Iterator {
            //    private:
            //        Node* current;
            //    public:
            //        Iterator(Node* node) : current(node) {}

            //        T& operator*() {
            //            return current->data;
            //        }

            //        Iterator& operator++() {
            //            current = current->next;
            //            return *this;
            //        }

            //        bool operator!=(const Iterator& other) const {
            //            return current != other.current;
            //        }
            //    };
            //    // 提供 begin 和 end 函数,返回迭代器
            //    Iterator begin() {
            //        return Iterator(head);
            //    }

            //    Iterator end() {
            //        return Iterator(nullptr);
            //    }

            //    // 其他成员函数和成员变量...
            //};
            //
            // begin() 函数:返回一个指向元素范围起始位置的指针或迭代器
            // end() 函数:返回一个指向元素范围结束位置的指针或迭代器。
            // 在 Vector 类中,begin() 和 end() 函数返回的是指向 elements 数组的指针。C++ 标准库规定,指针本身就是合法的迭代器
            // 在 C++ 中,指针实际上是最简单的迭代器类型,支持解引用 (*) 和递增 (++) 操作(而本例中的Node*显然都不支持,Vector类是int*)。因此,当 range-based for 使用 begin() 和 end() 返回的指针时,它能够正确地遍历数组中的每个元素
            myList.print();
        }
    }
    return 0;
}

1、注意 T 在参数的应用, typename 不能和外层T重复: 在定义友元函数时,模板参数需要独立于类模板的参数,这样可以避免与类模板的模板参数产生冲突
1)避免歧义:在友元声明中,List<L>中使用的 L 必须是一个新的独立模板参数。虽然它可能与外层模板参数 T 类型相同,但它在语义上是独立的。这种做法避免了 可能的歧义或冲突,尤其是在涉及多个模板参数的复杂情况下

2)独立作用域:友元函数模板声明的模板参数L有自己的作用域,与类模板的模板参数 T 没有直接的联系或依赖关系。这种方式使得友元函数可以更加通用,适用于不同类型的List实例,而不受限于外层模板参数

3)更好的可读性和维护性:通过引入新的模板参数 L,可以更清楚地表达友元函数的独立性 和 泛型特性。即使在友元函数的实现中,L 和 T 最终是同一种类型,使用不同的名称也有助于提高代码的可读性和维护性

如果 不希望友元函数是模板函数,而是直接使用类模板参数 T,但定义必须在类的内部(在这种情况下,友元函数被限制为只能用于与 List<T> 匹配的类型,而不能用于其他类型的 List<U>

template<typename T>
class List {
    friend std::ostream& operator<<(std::ostream& os, const List<T>& l) {
        for (auto* cur = l.head; cur; cur = cur->next) {
            os << cur->data << " ";
        }
        return os;
    }
    // 其他成员...
};

如果在类外面定义友元函数,并且希望使用类模板的模板参数 T,那么 必须在函数定义中重新声明模板参数 T
就像代码实现的那样

2、为什么<<运算符友元,[]运算符为成员函数
<< 运算符为什么是友元函数
左操作数的类型: << 是一个二元运算符,通常用于输出流操作,其左操作数是一个 std::ostream 类型,而右操作数是用户自定义的类对象。如果 << 运算符被实现为成员函数,那么 std::ostream 必须是类的成员,这在实际中是不可能的,因为 std::ostream 是标准库中的类。为了允许 std::ostream 作为左操作数,因此通常将 << 运算符重载为友元函数

对私有数据的访问:为了便于直接访问类的私有成员, << 运算符通常被定义为友元函数。友元函数虽然不属于类的成员,但它可以访问类的私有成员,这样可以方便地实现打印或输出类的内部状态

操作符的对称性: << 运算符通常用于与 std::ostream 结合进行链式调用,如 std::cout << obj1 << obj2; 。通过友元函数,可以保证操作符的对称性和流操作的自然性

[] 运算符为什么是成员函数
对象的直接访问:[] 运算符通常用于通过索引访问类的内部数据。这个操作对类内部的数据结构有直接的操作需求,因此最好作为类的成员函数实现。这样可以直接访问类的私有或受保护成员,并根据索引返回对应的元素
依赖对象的状态:[] 运算符的语义通常与对象的内部状态强相关。因为[] 操作是对当前对象(即 this 指针)的操作,通常需要知道该对象内部如何存储数据,并根据索引返回或修改数据。作为成员函数,[] 可以很自然地操作和返回对象内部的数据

左值和右值支持:将[] 运算符作为成员函数,可以很容易地支持左值和右值访问。例如,可以分别重载 const 版本和非 const 版本的[] 运算符,以支持不同上下文中的使用需求

类的成员函数的左操作数必须是类的对象(即该类的实例),而右操作数则可以是任何类型。这是因为成员函数的第一个(隐式)参数是指向调用对象的 this 指针,因此左操作数就是调用该成员函数的对象
成员函数是在类的对象上调用的,调用时隐式地传递了 this 指针作为左操作数。因此,左操作数必须是类的实例。例如,对于 obj.method(),obj 是左操作数,而 method 是成员函数。this 指针指向 obj,所以 obj 必须是类的对象
对于运算符重载,如果运算符是成员函数,那么它的左操作数必须是类的实例。例如,对于重载的 operator[],在表达式 obj[index] 中,obj 是类的对象,index 是右操作数

3、调用的析构函数是 Node 结构体的析构函数 (析构函数负责清理对象内部的资源,但不会释放对象本身的内存),之后,delete 操作符会释放 cur 指向的内存 (delete:析构函数+释放内存)

如果没有显式定义析构函数,编译器会为 Node 生成一个默认的析构函数。这个默认的析构函数会调用成员变量的析构函数,依次销毁 data、next 和 pre 成员
对于 next 和 pre 这两个指针成员,它们是普通指针,不涉及动态分配的内存管理,因此默认析构函数不会对它们进行任何特殊处理

struct Node {
	int* data;
	Node* next;
	Node* pre;

	Node(int value) : data(new int(value)), next(nullptr), pre(nullptr) {}

	~Node() {
		delete data; // 释放动态分配的内存
	}
};

4、为什么要加 typename
在模板代码中,编译器在解析模板时并不知道 List<T>::Node 是一个类型还是一个静态成员变量,除非你明确告诉它这是因为在模板实例化之前,编译器无法确定 T 是什么类型,因此无法确定 List<T>::Node 是什么

5、为什么没办法遍历所有元素

for (auto& curNode : myList) {
    // :前面 会去掉begin / end的指针
    std::cout << curNode.data << " ";
} 

C++ 的范围循环依赖于容器提供的 begin() 和 end() 成员函数,这些函数必须返回符合标准的迭代器对象。标准迭代器通常定义了以下运算符:
*:解引用运算符,用于访问当前元素
++:前置或后置递增运算符,用于移动到下一个元素。
!= :用于判断两个迭代器是否不相等(通常在循环中作为终止条件)

List 类中,begin() 和 end() 返回的是指向 Node 的原始指针,而不是标准迭代器。因此,标准的 range-based for 循环无法直接使用这些原始指针进行遍历
需要为 List 类提供自定义的迭代器

template<typename T>
class List {
public:
    // 自定义迭代器类
    class Iterator {
    private:
        Node* current;
    public:
        Iterator(Node* node) : current(node) {}
 
        T& operator*() {
            return current->data;
        }

        Iterator& operator++() {
            current = current->next;
            return *this;
        }

        bool operator!=(const Iterator& other) const {
            return current != other.current;
        }
    };
    // 提供 begin 和 end 函数,返回迭代器
    Iterator begin() {
        return Iterator(head);
    }

    Iterator end() {
        return Iterator(nullptr);
    }
 
    // 其他成员函数和成员变量...
};

begin() 函数:返回一个指向元素范围起始位置的指针或迭代器
end() 函数:返回一个指向元素范围结束位置的指针或迭代器

在 Vector 类中,begin() 和 end() 函数返回的是指向 elements 数组的指针。C++ 标准库规定,指针本身就是合法的迭代器
在 C++ 中,指针实际上是最简单的迭代器类型,支持解引用 (*) 和递增 (++) 操作(而本例中的 Node* 显然都不支持,Vector类是 int*)。因此,当 range-based for 使用 begin() 和 end() 返回的指针时,它能够正确地遍历数组中的每个元素

6、对照卡玛网,更好的写法

 void pop_back()
    {
        if (size > 0)
        {
            // 获取尾节点的前一个节点
            Node *newTail = tail->prev;

            // 删除尾节点
            delete tail;

            // 更新尾节点指针和链表大小
            tail = newTail;
            if (tail)
            {
                tail->next = nullptr;
            }
            else
            {
                head = nullptr; // 如果链表为空,头节点也置为空
            }

            --size;
        }
    }

卡玛网多实现的函数

T *find(const T &val)
    {
        Node *node = getNode(val);
        if (node == nullptr)
        {
            return nullptr;
        }
        return &node->val;
    }

https://kamacoder.com/ 手写简单版本STL,内容在此基础上整理补充


http://www.kler.cn/a/283677.html

相关文章:

  • change buffer:到底应该选择普通索引还是唯一索引
  • C++ 编程基础(6)作用域 | 6.3、类作用域
  • 微信小程序中使用离线版阿里云矢量图标
  • Llama微调测试记录
  • 测试工程师简历「精选篇」
  • 前端框架大比拼:React.js, Vue.js 及 Angular 的优势与适用场景探讨
  • 【leetcode刷题记录】二叉树遍历
  • 易查分如何查询图片?
  • 梧桐数据库(WuTongDB):什么是“顺序扫描”
  • 1.3金融术语的宝典
  • PHP房产管理多终端系统灵活应对各种管理需求系统小程序源码
  • 16.神经网络 - 卷积层
  • Python-MNE-源空间和正模型07:修复BEM和头表面
  • Linux 7 静默安装oracle 19c 单机
  • 深度学习常见面试题(2024.8.30笔记)
  • 如何在知行之桥上通过业务单号查找原始报文?
  • 英文论文格式编辑(二)
  • redis list 单推送消息,批量消费消息,springboot实现
  • Nginx配置实例-负载均衡
  • 密码学(二)---DES、SM、RSA
  • c++中的匿名对象及内存管理及模版初阶
  • 【系统架构师软考】计算机网络知识(四)
  • 在类Unix操作系统(如Linux)上运行Windows应用程序方法小记
  • flutter和原生Android以及IOS开发相比有什么优缺点?
  • Gradio学习——图像流输出
  • ShenNiusModularity项目源码学习(3:用户登录)