如何在Java中使用HashSet实现元素去重

HashSet通过hashCode和equals方法实现去重,添加元素时先计算哈希值定位,冲突时调用equals判断,二者均相同则视为重复;Integer、String等类型已重写相关方法可直接去重,自定义类如Person需手动重写hashCode和equals以保证逻辑正确;可通过new HashSet(list)批量去重或add()逐个添加并利用返回值判断是否重复,关键在于确保hashCode与equals的一致性。

在Java中,HashSet 是一个基于哈希表实现的 Set 接口集合类,它天然支持元素去重。当你尝试向 HashSet 中添加重复元素时,集合会自动忽略该操作,从而保证集合中所有元素的唯一性。

HashSet 去重的基本原理

HashSet 判断元素是否重复依赖于对象的 equals() 方法和 hashCode() 方法:

  • 添加元素时,HashSet 会先调用该对象的 hashCode() 方法计算哈希值,确定存储位置。
  • 如果该位置已有元素,再调用 equals() 方法判断是否真正相等。
  • 若两个方法都判定为相等,则视为重复元素,添加失败,返回 false

因此,为了正确去重,存入 HashSet 的对象必须正确重写 hashCode()equals() 方法。

使用 HashSet 去除基本类型包装类的重复

Java 中的 Integer、String 等类已经重写了 hashCode 和 equals 方法,可直接用于去重:

import java.util.*;

public class RemoveDuplicates {
    public static void main(String[] args) {
        List numbers = Arrays.asList(1, 2, 3, 2, 4, 1, 5);
        Set uniqueNumbers = new HashSet<>(numbers);
        System.out.println(uniqueNumbers); // 输出:[1, 2, 3, 4, 5]
    }
}

对自定义对象去重需重写 hashCode 和 equals

假设有一个 Person 类,我们希望根据姓名和年龄去重:

class Person {
    private String name;
    private int age;

    public Person(String name, int age) {
        this.name = name;
        this.age = age;
    }

    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (!(o instanceof Person)) return false;
        Person person = (Person) o;
        return age == person.age && Objects.equals(name, person.name);
    }

    @Override
    public int hashCode() {
        return Objects.hash(name, age);
    }

    @Override
    public String toString() {
        return "Person{" + "name='" + name + '\'' + ", age=" + age + '}';
    }
}

测试去重效果:

List people = Arrays.asList(
    new Person("Alice", 25),
    new Person("Bob", 30),
    new Person("Alice", 25)
);
Set uniqu

ePeople = new HashSet<>(people); System.out.println(uniquePeople); // 输出:[Person{name='Alice', age=25}, Person{name='Bob', age=30}]

手动添加元素并检查是否重复

你也可以通过 add() 方法逐个添加,并利用其返回值判断是否为重复元素:

Set set = new HashSet<>();
boolean isAdded1 = set.add("apple");
boolean isAdded2 = set.add("apple");
System.out.println(isAdded1); // true
System.out.println(isAdded2); // false

基本上就这些。只要确保对象的 hashCodeequals 行为一致,HashSet 就能高效完成去重任务。对于大多数场景,推荐直接使用构造函数传入原始列表来快速去重。不复杂但容易忽略的是自定义类必须正确重写那两个方法。