设置interface

SetCollection,不能包含重复的元素。它为 math 集合抽象建模。 Setinterface仅包含从Collection继承的方法,并增加了禁止重复元素的限制。 Set还为equalshashCode操作的行为增加了更紧密的约定,允许Set实例进行有意义的比较,即使它们的实现类型不同。如果两个Set实例包含相同的元素,则它们相等。

Java 平台包含三个通用的Set实现:HashSetTreeSetLinkedHashSetHashSet将其元素存储在哈希表中,是效果最好的实现;但是,它不能保证迭代的 Sequences。 TreeSet将其元素存储在红黑树中,并根据其值对元素进行排序;它比HashSet慢得多。 LinkedHashSet实现为哈希表,并在其中运行链表,它根据元素插入到集合中的 Sequences(插入 Sequences)对元素进行排序。 LinkedHashSetHashSet提供的未指定的,通常是混乱的 Order 中省去了 Client,但成本略高。

这是一个简单但有用的Set习语。假设您有一个Collectionc,并且想要创建另一个Collection,其中Collection包含相同的元素,但消除了所有重复项。下面的单行代码可以解决问题。

Collection<Type> noDups = new HashSet<Type>(c);

它通过创建一个Set(根据定义,它不能包含重复项)工作,最初包含c中的所有元素。它使用收集interface部分中描述的标准转换构造函数。

或者,如果使用的是 JDK 8 或更高版本,则可以使用聚合操作轻松地收集到Set中:

c.stream()
.collect(Collectors.toSet()); // no duplicates

这是一个稍 Long 的示例,将Collection个名称累积到TreeSet中:

Set<String> set = people.stream()
.map(Person::getName)
.collect(Collectors.toCollection(TreeSet::new));

以下是第一个惯用法的次要变体,它在删除重复元素的同时保留了原始集合的 Sequences:

Collection<Type> noDups = new LinkedHashSet<Type>(c);

以下是一种泛型方法,该方法封装了前面的惯用语,并返回与传递的泛型相同的泛型的Set

public static <E> Set<E> removeDups(Collection<E> c) {
    return new LinkedHashSet<E>(c);
}

设置interface基本操作

size操作返回Set中的元素数(其基数)。 isEmpty方法完全按照您的想法去做。 add方法将指定的元素添加到Set(如果尚不存在),并返回一个布尔值,指示是否添加了该元素。类似地,remove方法从Set中删除指定的元素(如果存在),并返回一个布尔值,指示该元素是否存在。 iterator方法在Set上返回Iterator

以下program打印出其参数列表中的所有不同单词。提供了该程序的两个版本。第一种使用 JDK 8 聚合操作。第二种使用 for-each 构造。

使用 JDK 8 聚合操作:

import java.util.*;
import java.util.stream.*;

public class FindDups {
    public static void main(String[] args) {
        Set<String> distinctWords = Arrays.asList(args).stream()
		.collect(Collectors.toSet()); 
        System.out.println(distinctWords.size()+ 
                           " distinct words: " + 
                           distinctWords);
    }
}

使用for-each构造:

import java.util.*;

public class FindDups {
    public static void main(String[] args) {
        Set<String> s = new HashSet<String>();
        for (String a : args)
               s.add(a);
               System.out.println(s.size() + " distinct words: " + s);
    }
}

现在运行该程序的任何一个版本。

java FindDups i came i saw i left

产生以下输出:

4 distinct words: [left, came, saw, i]

请注意,代码始终通过其interface类型(Set)而不是其实现类型来引用Collection。强烈建议您使用这种编程方法,因为它使您仅通过更改构造函数即可灵活地更改实现。如果声明用于存储集合的变量或用于传递集合的参数中的任何一个都声明为Collection的实现类型而不是其interface类型,则必须更改所有此类变量和参数才能更改其实现类型。

此外,不能保证所生成的程序会运行。如果程序使用原始实现类型中存在的任何非标准操作,而不是新实现类型中的任何非标准操作,则该程序将失败。仅通过集合的interface引用集合可以防止您使用任何非标准操作。

上一个示例中Set的实现类型为HashSet,这不能保证Set中元素的 Sequences。如果要让程序按字母 Sequences 打印单词列表,只需将Set的实现类型从HashSet更改为TreeSet即可。进行此单行琐碎的更改会使上一个示例中的命令行生成以下输出。

java FindDups i came i saw i left

4 distinct words: [came, i, left, saw]

设置interface批量操作

批量操作特别适合Set s;当应用时,它们执行标准的集合代数运算。假设s1s2是集合。以下是批量操作的作用:

  • s1.containsAll(s2) —如果s2s1子集 ,则返回true。 (如果集合s1包含s2中的所有元素,则s2s1的子集.)

  • s1.addAll(s2) —将s1转换为s1s2union 。 (两个集合的并集是包含任何一个集合中包含的所有元素的集合.)

  • s1.retainAll(s2) —将s1转换为s1s2的交集。 (两个集合的交集是仅包含两个集合共有的元素的集合.)

  • s1.removeAll(s2) —将s1转换为s1s2的(不对称)集合差异。 (例如,s1减去s2的集合差是包含s1而不是s2中找到的所有元素的集合.)

为了无损地计算两个集合的并集,相交或集合差(不修改任何一个集合),调用者必须在调用适当的批量操作之前复制一个集合。以下是结果成语。

Set<Type> union = new HashSet<Type>(s1);
union.addAll(s2);

Set<Type> intersection = new HashSet<Type>(s1);
intersection.retainAll(s2);

Set<Type> difference = new HashSet<Type>(s1);
difference.removeAll(s2);

前面习语中的结果Set的实现类型是HashSet,这已经是 Java 平台中最好的全方位Set实现。但是,可以替换任何通用的Set实现。

让我们重新访问FindDups程序。假设您想知道参数列表中的哪些单词仅出现一次,哪些单词不止一次出现,但是您不希望重复打印任何重复项。可以通过生成两组来实现这种效果-一组包含参数列表中的每个单词,而另一组仅包含重复单词。仅出现一次的单词就是这两个集合的集合差异,我们知道如何计算。 结果程序的外观如下。

import java.util.*;

public class FindDups2 {
    public static void main(String[] args) {
        Set<String> uniques = new HashSet<String>();
        Set<String> dups    = new HashSet<String>();

        for (String a : args)
            if (!uniques.add(a))
                dups.add(a);

        // Destructive set-difference
        uniques.removeAll(dups);

        System.out.println("Unique words:    " + uniques);
        System.out.println("Duplicate words: " + dups);
    }
}

当使用先前使用的相同参数列表(i came i saw i left)运行时,程序将产生以下输出。

Unique words:    [left, saw, came]
Duplicate words: [i]

较不常见的集合代数运算是对称集合差-包含在两个指定集合中的任何一个中但不在两个指定集合中的元素集合。以下代码无损地计算了两组对称集的差。

Set<Type> symmetricDiff = new HashSet<Type>(s1);
symmetricDiff.addAll(s2);
Set<Type> tmp = new HashSet<Type>(s1);
tmp.retainAll(s2);
symmetricDiff.removeAll(tmp);

设置interface阵列操作

除了对其他Collection所做的操作之外,数组操作对Set并没有做任何特殊的事情。 收集interface部分中介绍了这些操作。