文档

Java™ 教程-Java Tutorials 中文版
将拉丁数字转换为其他 Unicode 数字
Trail: Internationalization
Lesson: Working with Text

将拉丁数字转换为其他 Unicode 数字

默认情况下,当文本包含数字值时,将使用拉丁(欧洲)数字显示这些值。如果首选其他 Unicode 数字形状,请使用 java.awt.font.NumericShaper 类。NumericShaper API 使你可以显示数值,其在内部表示为任何 Unicode 数字形状的 ASCII 值。

以下代码片段,来自 ArabicDigits 示例,显示了如何使用 NumericShaper 实例将拉丁数字转换为阿拉伯数字。确定转换操作的行是粗体。

ArabicDigitsPanel(String fontname) {
    HashMap map = new HashMap();
    Font font = new Font(fontname, Font.PLAIN, 60);
    map.put(TextAttribute.FONT, font);
    map.put(TextAttribute.NUMERIC_SHAPING,
        NumericShaper.getShaper(NumericShaper.ARABIC));

    FontRenderContext frc = new FontRenderContext(null, false, false);
    layout = new TextLayout(text, map, frc);
}

// ...

public void paint(Graphics g) {
    Graphics2D g2d = (Graphics2D)g;
    layout.draw(g2d, 10, 50);
}

获取阿拉伯文数字的 NumericShaper 实例,并将其放入 TextLayout.NUMERIC_SHAPING (译注:应该是 TextAttribute.NUMERIC_SHAPING) 属性键的 HashMap 中。hash map 将传递给 TextLayout 实例。在 paint 方法中渲染文本后,数字将显示在所需的脚本中。在此示例中,拉丁数字 0 到 9 绘制为阿拉伯文数字。

ArabicDigits 示例输出显示从 0 到 9 的阿拉伯文数字

前面的示例使用 NumericShaper.ARABIC 常量来获取所需的形状器,但 NumericShaper 类为许多语言提供常量。这些常量被定义为位掩码,并被称为 NumericShaper bit mask-based constants (位掩码的常量)

基于枚举的范围常量

指定特定数字集的另一种方法是使用 NumericShaper.Range 枚举类型(枚举)。在 Java SE 7 发行版中引入的这个枚举也提供了一组 constants。虽然这些常量是使用不同的机制定义的,但 NumericShaper.ARABIC 位掩码在功能上等同于 NumericShaper.Range.ARABIC 枚举,并且每种常量类型有一个相应的 getShaper 方法:

ArabicDigitsEnum 示例与 ArabicDigits 示例相同,只是它使用 NumericShaper.Range 枚举来指定语言脚本:

ArabicDigitsEnumPanel(String fontname) {
    HashMap map = new HashMap();
    Font font = new Font(fontname, Font.PLAIN, 60);
    map.put(TextAttribute.FONT, font);
    map.put(TextAttribute.NUMERIC_SHAPING,
        NumericShaper.getShaper(NumericShaper.Range.ARABIC));
    FontRenderContext frc = new FontRenderContext(null, false, false);
    layout = new TextLayout(text, map, frc);
}

两个 getShaper 方法都接受 singleRange 参数。使用常量类型,你可以指定一系列特定于脚本的数字。可以使用 OR 操作数组合基于位掩码的常量,也可以创建一组 NumericShaper.Range 枚举。以下显示如何使用每个常量类型定义范围:

NumericShaper.MONGOLIAN | NumericShaper.THAI |
NumericShaper.TIBETAN
EnumSet.of(
    NumericShaper.Range.MONGOLIAN,
    NumericShaper.Range.THAI,
    NumericShaper.Range.TIBETAN)

你可以请求 NumericShaper 对象以确定它支持,使用基于位掩码的形状器的 getRanges 方法或基于枚举的形状器的 getRangeSet 方法。


注意: 

你可以使用传统的基于位掩码的常量或基于 Range 枚举的常量。在决定使用哪个时,请考虑以下几点:

  • Range API 需要 JDK 7 或更高版本。
  • Range API 涵盖了比位掩码 API 更多的 Unicode 范围。
  • 位掩码 API 比 Range API 快一点。

根据语言上下文呈现数字

ArabicDigits 示例旨在将形状器用于特定语言,但有时必须根据语言上下文呈现数字。例如,如果数字前面的文本使用泰语脚本,则首选泰语数字。如果文本以藏文显示,则首选藏文数字。

你可以使用 getContextualShaper 方法之一完成此操作:

前两个方法使用位掩码常量,后两个使用枚举常量。接受 defaultContext 参数的方法使你可以指定在文本之前显示数值时使用的初始形状器。如果未定义默认上下文,则任何前导数字使用拉丁形状显示。

ShapedDigits 示例显示了形状器的工作方式。显示五个文本布局:

  1. 第一种布局不使用形状器;所有数字均显示为拉丁文。
  2. 第二种布局都将所有数字形状为阿拉伯文数字,无论语言上下文如何。
  3. 第三种布局采用了使用阿拉伯文数字的上下文形状器。默认上下文定义为阿拉伯语。
  4. 第四种布局采用了使用阿拉伯文数字的上下文形状器,但形状器不指定默认上下文。
  5. 第五种布局采用了使用 ALL_RANGES 位掩码的上下文形状器,但形状器未指定默认上下文。
ShapedDigits 示例输出说明了上下文形状器的工作方式

以下代码行显示了如何定义形状器:

  1. 不使用形状器。
  2. NumericShaper arabic = NumericShaper.getShaper(NumericShaper.ARABIC);
  3. NumericShaper contextualArabic = NumericShaper.getContextualShaper(NumericShaper.ARABIC, NumericShaper.ARABIC);
  4. NumericShaper contextualArabicASCII = NumericShaper.getContextualShaper(NumericShaper.ARABIC);
  5. NumericShaper contextualAll = NumericShaper.getContextualShaper(NumericShaper.ALL_RANGES);

有关更多实现详细信息,请参阅 ShapedDigits.java 示例。


Previous page: Line Boundaries
Next page: Converting Non-Unicode Text