文档

Java™ 教程-Java Tutorials 中文版
自定义排序规则
Trail: Internationalization
Lesson: Working with Text
Section: Comparing Strings

自定义排序规则

上一节讨论了如何使用语言环境的预定义规则来比较字符串。这些排序规则决定字符串的排序顺序。如果预定义的排序规则不符合你的需要,你可以设计自己的规则并将它们分配给 RuleBasedCollator 对象。

自定义排序规则包含在传递给 RuleBasedCollator 构造函数的 String 对象中。这是一个简单的例子:

String simpleRule = "< a < b < c < d";
RuleBasedCollator simpleCollator =  new RuleBasedCollator(simpleRule);

对于前一个示例中的 simpleCollator 对象,a 小于 b,小于 c,并且等等。比较字符串时,simpleCollator.compare 方法引用这些规则。用于构造排序规则的完整语法比这个简单示例更灵活,更复杂。有关语法的完整说明,请参阅 RuleBasedCollator 类的 API 文档。

下面的示例使用两个 collat​​ors 对西班牙语单词列表进行排序。此示例的完整源代码位于 RulesDemo.java 中。

RulesDemo 程序首先定义英语和西班牙语的排序规则。该程序将以传统方式对西班牙语单词进行排序。当按照传统规则进行排序时,字母 ch 和 ll 及其大写等价物在排序顺序中各自具有自己的位置。这些字符对的比较就好像它们是一个字符。例如,ch 按单个字母排序,并按排序顺序后随 cz。注意两个排序器不同的规则:

String englishRules = (
    "< a,A < b,B < c,C < d,D < e,E < f,F " +
    "< g,G < h,H < i,I < j,J < k,K < l,L " +
    "< m,M < n,N < o,O < p,P < q,Q < r,R " +
    "< s,S < t,T < u,U < v,V < w,W < x,X " +
    "< y,Y < z,Z");

String smallnTilde = new String("\u00F1");    // ñ
String capitalNTilde = new String("\u00D1");  // Ñ

String traditionalSpanishRules = (
    "< a,A < b,B < c,C " +
    "< ch, cH, Ch, CH " +
    "< d,D < e,E < f,F " +
    "< g,G < h,H < i,I < j,J < k,K < l,L " +
    "< ll, lL, Ll, LL " +
    "< m,M < n,N " +
    "< " + smallnTilde + "," + capitalNTilde + " " +
    "< o,O < p,P < q,Q < r,R " +
    "< s,S < t,T < u,U < v,V < w,W < x,X " +
    "< y,Y < z,Z");

以下代码行创建了 collat​​ors 并调用了 sort 例程:

try {
    RuleBasedCollator enCollator = new RuleBasedCollator(englishRules);
    RuleBasedCollator spCollator =
        new RuleBasedCollator(traditionalSpanishRules);

    sortStrings(enCollator, words);
    printStrings(words);
    System.out.println();

    sortStrings(spCollator, words);
    printStrings(words);
} catch (ParseException pe) {
    System.out.println("Parse exception for rules");
}

称为 sortStrings 的排序例程是通用的。它将根据任何 Collator 对象的规则对任何单词数组进行排序:

public static void sortStrings(Collator collator, String[] words) {
    String tmp;
    for (int i = 0; i < words.length; i++) {
        for (int j = i + 1; j < words.length; j++) {
            if (collator.compare(words[i], words[j]) > 0) {
                tmp = words[i];
                words[i] = words[j];
                words[j] = tmp;
            }
        }
    }
}

使用英语排序规则排序时,单词数组如下:

chalina
curioso
llama
luz

将前面的列表与以下列表进行比较,后者根据传统的西班牙语排序规则进行排序:

curioso
chalina
luz
llama

Previous page: Performing Locale-Independent Comparisons
Next page: Improving Collation Performance