摘要:多拼音格式输出支持支持多种拼音输出格式带音标不带音标数字表示音标以及拼音首字母输出格式常见多音字识别支持常见多音字的识别,其中包括词组成语地名等简繁体中文转换经对比以上三个类库,个人认为更加适合。
1、目前在百度或谷歌上搜索“java汉字转拼音”,主要有以下三种: 1)piny4j:搜索结果介绍文章最多的,然而此类库对生僻字支持不好,转换时会报空指针(java.lang.NullPointerException)错误,如汉字“栆” 2)unidecode:介绍较少,google的han2pinyin作废后的推荐类库,详见http://code.google.com/p/han2... 3)JPinyin是一个汉字转拼音的Java开源类库,在PinYin4j的功能基础上做了一些改进
【JPinyin主要特性】
①、准确、完善的字库;
Unicode编码从4E00-9FA5范围及3007(〇)的20903个汉字中,JPinyin能转换除46个异体字(异体字不存在标准拼音)之外的所有汉字;
②、拼音转换速度快;
经测试,转换Unicode编码从4E00-9FA5范围的20902个汉字,JPinyin耗时约100毫秒。
③、多拼音格式输出支持;
JPinyin支持多种拼音输出格式:带音标、不带音标、数字表示音标以及拼音首字母输出格式;
④、常见多音字识别;
JPinyin支持常见多音字的识别,其中包括词组、成语、地名等;
⑤、简繁体中文转换
经对比以上三个类库,个人认为jpinyin更加适合。
另:暂时发现缺陷是jpinyin不能解析“厼”,unidecode中解析出的拼音为“uk”,而“厼”为韩国汉字(读音yi),因此使用jpinyin解析拼音也没问题
1.jpinyin的github下载地址:
https://github.com/stuxuhai/j...
2.unidecode下载地址:
https://github.com/xuender/un...
3.pinyin4j下载地址:
https://github.com/belerweb/p...
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/67843.html
摘要:如果转进制,则位进制只能表示个汉字,这个太少了。假设我们用个进制的字符,则可以表示,表示个汉字绰绰有余,但这时候需要多个字符。 项目地址:https://github.com/xinglie/pi... 压缩说明 为了便于在网络上的传输,本人想办法写了一个压缩算法,目前这个版本是压缩好的,带自解压功能以下说明压缩思路: 理想状态下是使用Stirng.prototype.localCom...
摘要:拼音字符转换图将中文编码成拼音要转换为拼音的字符串返回格式每个字的首字母全拼音字符串字母中文转换到拼音每次处理一个字符待处理字符双字节拼音结果为拼音首字母测试文字结果为全拼音测试文字结果为第一个拼音测试文字 class Pinyin { /** * 拼音字符转换图 * @var array */ private $data = array(...
阅读 1718·2021-10-18 13:30
阅读 2570·2021-10-09 10:02
阅读 2942·2021-09-28 09:35
阅读 2076·2019-08-26 13:39
阅读 3507·2019-08-26 13:36
阅读 1941·2019-08-26 11:46
阅读 1094·2019-08-23 14:56
阅读 1675·2019-08-23 10:38