Java集合框架中的集合类排序与比较器

必须用Comparator而非Comparable的情况是:类未实现Comparable,或需对同一类对象按多种规则排序;此时需传入外部Comparator,且会完全覆盖Comparable的自然排序逻辑。

什么时候必须用 Comparator 而不是 Comparable

当类本身不支持自然排序(比如没有实现 Comparable),或者你需要**同一类对象按多种规则排序**(如先按年龄、再按姓名;或按姓名长度而非字典序),就必须传入外部 Comparator。常见于第三方库返回的类(如 JSONObjectMap.Entry)或你自己无法修改源码的类。

注意:如果类已实现 Comparable,但你调用 Collections.sort(list) 时又传了 Comparator,后者会**完全覆盖前者**,不会叠加或融合逻辑。

  • Arrays.sort(arr, comparator)Collections.sort(list, comparator) 是最常用入口
  • Java 8 后推荐用 Comparator.comparing() 链式构造,比匿名内部类更简洁安全
  • 若比较逻辑涉及 null,务必用 Comparator.nullsFirst()Comparator.nullsLast() 包装,否则运行时抛 NullPointerException

Comparatorcompare() 方法的返回值怎么写才不出错

必须严格遵守契约:返回负数表示第一个参数“小于”第二个,0 表示相等,正数表示“大于”。常见错误是直接返回减法结果(如 a - b),在整数溢出时会翻转符号——例如 Integer.MAX_VALUE - (-1) 得负数,导致排序错乱。

正确做法是用 Integer.compare(a, b)Double.compare(x, y) 等静态方法;对字符串用 String.compareTo();自定义字段比较时优先复用这些工具方法。

Comparator byAge = (p1, p2) -> Integer.compare(p1.getAge(), p2.getAge());
  • 不要手写 p1.getAge() - p2.getAge()
  • 不要在 compare() 里做耗时操作(如数据库查询、IO),排序性能直接受影响
  • 确保比较逻辑满足自反性、对称性、传递性,否则 TreeSetArrays.sort() 可能抛 IllegalArgumentException

为什么 TreeSetTreeMap 构造时传 Comparator 后,add()put() 就不再需要重复传

因为 TreeSetTreeMap 在初始化时就把 Comparator 存为内部状态,后续所有基于顺序的操作(插入、查找、遍历)都复用它。这和 ArrayListsort() 不同——后者每次调用都是临时行为。

关键点在于:一旦指

定了 Comparator,这个集合就**放弃使用元素自身的 compareTo() 方法**,哪怕元素实现了 Comparable。所以如果你往一个按姓名长度排序的 TreeSet 里加 "a""bb",它们会被视为相等(因为长度都是 1 和 2?不,等等——这里要小心:长度不同就不会相等),但若两个字符串长度相同(如 "ab""cd"),且你的 Comparator 只比长度,那它们会被认为“重复”而被拒绝插入。

  • nullTreeSet 构造器,表示使用元素的 Comparable 实现;传自定义 Comparator,则彻底绕过它
  • TreeSetcontains()remove() 也依赖同一套比较逻辑,所以查找时传进去的对象只要在该逻辑下“等价”即可,不要求 equals() 返回 true
  • 如果比较逻辑不稳定(比如依赖当前时间或随机数),TreeSet 内部结构可能损坏,出现丢失元素或无限循环

Stream 排序时 sorted() 和集合自身排序的区别在哪

stream().sorted(comparator) 是惰性操作,只在终端操作(如 collect())触发时才执行,且**不修改原集合**;而 Collections.sort() 是立即执行并直接改原 List。这是函数式风格和命令式风格的根本差异。

另一个常被忽略的点:sorted() 返回的是 Stream,不是新集合。你要显式调用 collect(Collectors.toList()) 才能得到结果列表。漏掉这步,什么也不会发生。

List sorted = list.stream()
    .sorted(Comparator.comparing(String::length).thenComparing(String::toLowerCase))
    .collect(Collectors.toList());
  • sorted() 不支持对 null 元素自动处理,需提前过滤或用 Comparator.nullsFirst()
  • 链式调用 comparing().thenComparing() 比嵌套三元表达式可读性强得多,也避免空指针
  • 如果原始集合很大,又只需要前 N 个结果,用 limit(N) 放在 sorted() 后面并不能提升性能——因为 sorted() 必须全量排序才能取前 N;此时应考虑用 PriorityQueue 手动维护堆

排序逻辑一旦脱离简单字段比较,就容易在 null 处理、溢出、稳定性、集合类型语义上出问题。最稳妥的做法是:能用 Comparator.comparing() 就不用 lambda;需要多级比较就用 thenComparing();涉及 null 就显式包裹;用 TreeSet 前先确认比较器是否真正满足等价关系。