检测文本边界

操纵文本的应用程序需要在文本内定位边界。例如,考虑 Literals 处理程序的一些常见功能:突出显示一个字符,剪切一个 Literals,将光标移动到下一个句子以及将 Literals 包装在行尾。为了执行所有这些功能,Literals 处理器必须能够检测文本中的逻辑边界。幸运的是,您不必编写自己的例程即可执行边界分析。相反,您可以利用BreakIterator类提供的方法。

关于 BreakIterator 类

本节讨论BreakIterator类的实例化方法和虚指针。

Character Boundaries

在本节中,您将了解用户和 Unicode 字符之间的区别,以及如何使用BreakIterator定位用户字符。

Word Boundaries

如果您的应用程序需要选择或定位文本中的单词,您会发现使用BreakIterator会有所帮助。

Sentence Boundaries

由于许多书面语言中对句子终止符的使用模棱两可,因此确定句子边界可能会出现问题。本节研究您可能遇到的一些问题,以及BreakIterator如何处理它们。

Line Boundaries

本节介绍如何在带有BreakIterator的文本字符串 中定位潜在的换行符。