c++ set容器用法_c++集合去重与排序

std::set自动去重并升序排列,因其底层为红黑树,插入时依据operator

set 自动去重和升序排列的原理

std::set 底层是红黑树(RB-tree),插入时自动按 operator 比较,重复元素直接忽略,且始终维持有序。这意味着你不用手动调用 sortunique,只要用 insert 或初始化列表塞进去,结果天然去重+升序。

注意:去重基于「等价」而非「相等」——两个元素 ab 被视为重复,当且仅当 !(a 。所以自定义类型必须正确定义 operator,不能只重载 operator==

  • 内置类型(intstring)默认支持,开箱即用
  • 若想降序,用 std::set>
  • 插入 vector 所有元素:用迭代器区间构造,比循环 insert 更高效

从 vector 去重并排序的常用写法

最常见需求:把一个乱序、含重复的 vector 变成有序无重集合。别先 sort + unique,那是为 vector 设计的老套路;对 set 来说,一步到位更自然。

std::vector v = {3, 1, 4, 1, 5, 9, 2, 6, 5};
std::set s(v.begin(), v.end()); // 直接构造,O(n log n)
// s 现在是 {1, 2, 3, 4, 5, 6, 9}
  • 如果后续还要当数组用,再拷回 vectorstd::vector(s.begin(), s.end())
  • 不要用 s.insert(v.begin(), v.end()) —— 这是成员函数,但语义和构造一样;不过构造更简洁、意图更清晰
  • 性能上,构造和批量 insert 差不多,但比逐个 push_back 后再 sort+unique 少一次遍历

自定义类型必须提供严格弱序比较

比如有个结构体 Person,按 id 去重排序,但忘了定义 operator,编译会报错:「no match for ‘operator

立即学习“C++免费学习笔记(深入)”;

struct Person {
    int id;
    std::string name;
};
// 必须加这个,否则 set 编译失败
bool operator<(const Person& a, const Person& b) {
    return a.id < b.id; // 注意:不能用 != 或 == 判断是否重复
}
  • 比较函数必须满足严格弱序:反对称、传递、不可比关系可传递
  • 如果想按多个字段排序(如先按 idid 相同时按 name),写成:return a.id != b.id ? a.id
  • lambda 定义比较器只能用于模板参数(如 set),不能用于非模板友元函数,容易混淆

set 不支持随机访问,别误用下标

有人想取「排序后第 3 个元素」,写 s[2],编译直接失败—std::set 没有 operator[],也不支持 + 运算符随机跳转。

  • 要访问第 k 个(0-indexed),得用 std::next(s.begin(), k),时间复杂度 O(k),不是 O(1)
  • 频繁按位置访问?说明数据结构选错了,考虑先转成 vector 再索引
  • 遍历时用范围 for 最安全:for (const auto& x : s) { ... }
  • 删除某个值用 s.erase(value),不是 s.erase(iterator),除非你已经有迭代器
实际用 set 做去重排序,核心就三点:确认类型可比较、用构造代替手写去重逻辑、别把它当数组用。最容易卡住的地方,其实是自定义类型的比较函数没写对,或者误以为 set 支持下标访问。