摘要:创作缘由对于中文的繁简体转换是一种很常见的需求。存在一个严重的问题特殊词组的转换可能存在问题。是一款非常优秀的转换工具。使用方式引入转为简体生命不息,奮鬥不止结果为生命不息,奋斗不止转为繁体生命不息,奋斗不止结果为生命不息,奮鬥不止
创作缘由
对于中文的繁简体转换是一种很常见的需求。
但是很多工具类都是简单的做个映射。(使用map,集合,properties)等。
存在一个严重的问题:特殊词组 的转换可能存在问题。
OpenCCOpenCC 是一款非常优秀的转换工具。但是没有直接提供 Java 便于使用的 jar。
opencc4jopencc4j 就是在上面的工具基础上提供的 java 使用版本。
opencc4j 使用方式 maven 引入转为简体com.github.houbb opencc4j 1.0.2
String original = "生命不息,奮鬥不止"; String result = ZhConverterUtil.convertToSimple(original);
结果为
生命不息,奋斗不止转为繁体
String original = "生命不息,奋斗不止"; String result = ZhConverterUtil.convertToTraditional(original);
结果为
生命不息,奮鬥不止
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/76447.html
摘要:本文将作为汉字相似度的完结篇,为该系列画上一个句号。起中文形近字相似度计算思路承中文形近字相似度算法实现,为汉字尽一点绵薄之力转当代中国最贵的汉字是什么不足之处之所以有本篇,是因为上一次的算法实现存在一些不足。 前言所有的故事都有开始,也终将结束。本文将作为 NLP 汉字相似度的完结篇,为该系列画上一个句号。起...
Openccpy ___ _____ __ ___ ___ ___ _____ __ __ / __`/ __` /__`/ _ ` /___ /___/ __`/ / / L L / __// / / \__// \__/ L \_ \____/ ,__/ \____ \_ \_ \____ \____ ,__//`__...
摘要:下载数据方法使用官方的数据最新打包的中文文档下载地址是。中文维基数据繁简混杂大家都说存在这个问题,但的网站是将繁体中文和简体中文分开处理的,所以一直觉得从数据库到结构都应有方法将两者区分开,暂罢,待有空研究其数据时再议。 照例,先讲下环境,Mac OSX 10.11.2 ,Python 3.4.3。 下载数据 方法1:使用官方dump的xml数据 最新打包的中文文档下载地址是:http...
阅读 2635·2021-11-11 16:55
阅读 1279·2021-09-22 15:25
阅读 1793·2019-08-29 16:26
阅读 924·2019-08-29 13:21
阅读 2306·2019-08-23 16:19
阅读 2795·2019-08-23 15:10
阅读 761·2019-08-23 14:24
阅读 1849·2019-08-23 13:48