Welcome to ChineseUtils

ChineseUtils是一个开放源码的中文简繁转换工具库。 简繁互转,并不是简单的内码一一转换,汉语中,有不少的简体字在繁体中有两个甚至两个以上的字形与之对应:

简体繁体英文
头发頭髮hair
出发出發start off
干燥乾燥dry
精干精幹able, strong
干涉干渉interfere with

根据转换的精确性等级,大概可以分成四个等级:

  1. 字符码表一对一映射。例如“发”->“發”、“干”->“幹”等。
  2. 一对多单字,根据词语识别进行转换。例如“头发”->“頭髮”、“出发”->“出發”等。例中的髮和發在简体中都是发,但在繁体中却不一样,这样的情况很多。
  3. 对词语表达方式差异的转换。简繁体有不同的表达方式,例如:“字节”->“位元組”、“光盘”->“光碟”、“信息”->“資訊”等。
  4. 根据上下文的词汇翻译。例如:在中国大陆的语言习惯中,“文件”可以是通常意义上的“文件”,也可以是计算机中存取的“文件”(document)。但是,在繁体语言习惯中,这两个东西就是分别用“文件”和“档案”两个词来表达。