Java 教程是为 JDK 8 编写的。本页中描述的示例和实践未利用在后续版本中引入的改进。
上一节讨论了如何使用语言环境的预定义规则来比较字符串。这些排序规则决定字符串的排序顺序。如果预定义的排序规则不符合你的需要,你可以设计自己的规则并将它们分配给 RuleBasedCollator 对象。
自定义排序规则包含在传递给 RuleBasedCollator 构造函数的 String 对象中。这是一个简单的例子:
String simpleRule = "< a < b < c < d"; RuleBasedCollator simpleCollator = new RuleBasedCollator(simpleRule);
对于前一个示例中的 simpleCollator 对象,a 小于 b,小于 c,并且等等。比较字符串时,simpleCollator.compare 方法引用这些规则。用于构造排序规则的完整语法比这个简单示例更灵活,更复杂。有关语法的完整说明,请参阅 RuleBasedCollator 类的 API 文档。
下面的示例使用两个 collators 对西班牙语单词列表进行排序。此示例的完整源代码位于 RulesDemo.java 中。
RulesDemo 程序首先定义英语和西班牙语的排序规则。该程序将以传统方式对西班牙语单词进行排序。当按照传统规则进行排序时,字母 ch 和 ll 及其大写等价物在排序顺序中各自具有自己的位置。这些字符对的比较就好像它们是一个字符。例如,ch 按单个字母排序,并按排序顺序后随 cz。注意两个排序器不同的规则:
String englishRules = (
"< a,A < b,B < c,C < d,D < e,E < f,F " +
"< g,G < h,H < i,I < j,J < k,K < l,L " +
"< m,M < n,N < o,O < p,P < q,Q < r,R " +
"< s,S < t,T < u,U < v,V < w,W < x,X " +
"< y,Y < z,Z");
String smallnTilde = new String("\u00F1"); // ñ
String capitalNTilde = new String("\u00D1"); // Ñ
String traditionalSpanishRules = (
"< a,A < b,B < c,C " +
"< ch, cH, Ch, CH " +
"< d,D < e,E < f,F " +
"< g,G < h,H < i,I < j,J < k,K < l,L " +
"< ll, lL, Ll, LL " +
"< m,M < n,N " +
"< " + smallnTilde + "," + capitalNTilde + " " +
"< o,O < p,P < q,Q < r,R " +
"< s,S < t,T < u,U < v,V < w,W < x,X " +
"< y,Y < z,Z");
以下代码行创建了 collators 并调用了 sort 例程:
try {
RuleBasedCollator enCollator = new RuleBasedCollator(englishRules);
RuleBasedCollator spCollator =
new RuleBasedCollator(traditionalSpanishRules);
sortStrings(enCollator, words);
printStrings(words);
System.out.println();
sortStrings(spCollator, words);
printStrings(words);
} catch (ParseException pe) {
System.out.println("Parse exception for rules");
}
称为 sortStrings 的排序例程是通用的。它将根据任何 Collator 对象的规则对任何单词数组进行排序:
public static void sortStrings(Collator collator, String[] words) {
String tmp;
for (int i = 0; i < words.length; i++) {
for (int j = i + 1; j < words.length; j++) {
if (collator.compare(words[i], words[j]) > 0) {
tmp = words[i];
words[i] = words[j];
words[j] = tmp;
}
}
}
}
使用英语排序规则排序时,单词数组如下:
chalina curioso llama luz
将前面的列表与以下列表进行比较,后者根据传统的西班牙语排序规则进行排序:
curioso chalina luz llama