资讯专栏INFORMATION COLUMN

汉字转拼音

frank_fun / 943人阅读

摘要:多拼音格式输出支持支持多种拼音输出格式带音标不带音标数字表示音标以及拼音首字母输出格式常见多音字识别支持常见多音字的识别,其中包括词组成语地名等简繁体中文转换经对比以上三个类库,个人认为更加适合。

1、目前在百度或谷歌上搜索“java汉字转拼音”,主要有以下三种: 1)piny4j:搜索结果介绍文章最多的,然而此类库对生僻字支持不好,转换时会报空指针(java.lang.NullPointerException)错误,如汉字“栆” 2)unidecode:介绍较少,google的han2pinyin作废后的推荐类库,详见http://code.google.com/p/han2... 3)JPinyin是一个汉字转拼音的Java开源类库,在PinYin4j的功能基础上做了一些改进

【JPinyin主要特性】
①、准确、完善的字库;
Unicode编码从4E00-9FA5范围及3007(〇)的20903个汉字中,JPinyin能转换除46个异体字(异体字不存在标准拼音)之外的所有汉字;
②、拼音转换速度快;
经测试,转换Unicode编码从4E00-9FA5范围的20902个汉字,JPinyin耗时约100毫秒。
③、多拼音格式输出支持;
JPinyin支持多种拼音输出格式:带音标、不带音标、数字表示音标以及拼音首字母输出格式;
④、常见多音字识别;
JPinyin支持常见多音字的识别,其中包括词组、成语、地名等;
⑤、简繁体中文转换

经对比以上三个类库,个人认为jpinyin更加适合。
另:暂时发现缺陷是jpinyin不能解析“厼”,unidecode中解析出的拼音为“uk”,而“厼”为韩国汉字(读音yi),因此使用jpinyin解析拼音也没问题

2、下面是以上三个类库的下载地址(由于github中已提供相应使用例子,故本文省略之):

1.jpinyin的github下载地址:
https://github.com/stuxuhai/j...
2.unidecode下载地址:
https://github.com/xuender/un...
3.pinyin4j下载地址:
https://github.com/belerweb/p...

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/67843.html

相关文章

  • 汉字拼音 支持20870个汉字,包含完整的多音字

    摘要:如果转进制,则位进制只能表示个汉字,这个太少了。假设我们用个进制的字符,则可以表示,表示个汉字绰绰有余,但这时候需要多个字符。 项目地址:https://github.com/xinglie/pi... 压缩说明 为了便于在网络上的传输,本人想办法写了一个压缩算法,目前这个版本是压缩好的,带自解压功能以下说明压缩思路: 理想状态下是使用Stirng.prototype.localCom...

    cikenerd 评论0 收藏0
  • PHP汉字拼音

    摘要:最简单最准确的中文转拼音的类项目地址支持获取拼音以及拼音的缩写即首字母支持等编码能准确匹配千多个常用汉字单个汉字,一句话,中英文混合都完美支持例子版早上好获取拼音早上好获取拼音缩写例子版早上好获取拼音早上好获取拼音缩写 最简单、最准确的PHP中文转拼音的类 github项目地址:https://github.com/jifei/Pinyin 支持获取拼音以及拼音的缩写即首字母 ...

    tulayang 评论0 收藏0
  • PHP 汉字拼音

    摘要:拼音字符转换图将中文编码成拼音要转换为拼音的字符串返回格式每个字的首字母全拼音字符串字母中文转换到拼音每次处理一个字符待处理字符双字节拼音结果为拼音首字母测试文字结果为全拼音测试文字结果为第一个拼音测试文字 class Pinyin { /** * 拼音字符转换图 * @var array */ private $data = array(...

    AnthonyHan 评论0 收藏0
  • PHP汉字拼音(支持生僻字)

    摘要:基于语言的汉语转拼音的类兼容编码,无须特殊处理对中文默认返回拼音首字母缩写,其它字符不作处理直接返回。汉字拼音对照数组基础数据

    Kerr1Gan 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<