资讯专栏INFORMATION COLUMN

java中String和byte数组转换的小技巧

CastlePeaK / 1762人阅读

摘要:今日看公司代码时发现,在和数组转换的过程中,大量的无聊。所以写了本文,作一个基本编程知识的小科普。分享一个编程的小技巧,简单实用。而最要命的是,是继承自类。

今日看公司代码时发现,在string和byte数组转换的过程中,大量的无聊try catch。所以写了本文,作一个java基本编程知识的小科普。

分享一个java编程的小技巧,简单实用。

建议
其实内容就一句话:

在做String和byte[]的相互转换时,请使用StandardCharsets.UTF_8来替代”utf-8”

解释一下,通常我们代码是这样写:

String string = new String(bytes, "utf-8");
byte[] bytes = string.getBytes("utf-8");

请换成下面这个写法:

String string = new String(bytes, StandardCharsets.UTF_8);
byte[] bytes = string.getBytes(StandardCharsets.UTF_8);

注: 其实大家看到这里就可以打住了

问题解释
第一个写法功能当然没问题,但是代码写完之后,IDE一定会立刻提醒你,这里会抛出UnsupportedEncodingException。

而最要命的是,UnsupportedEncodingException是继承自类Exceptio。

这是一个checked exception, 这是一个checked exception, 这是一个checked exception!

JDK的源代码如下:

public String(byte bytes[], String charsetName)
        throws UnsupportedEncodingException {
    this(bytes, 0, bytes.length, charsetName);
}

这意味着我们要不加上try catch,要不就要在方法上显示申明要抛出异常。
而申明抛出UnsupportedEncodingException异常绝对不是一个好注意,鬼都知道这里这个UTF-8一定不会
unsupported,把这个麻烦扔给调用者绝对是一个不负责任的行为。

所以我在代码中看到大量的类似代码:

try {
    String json = new String(data, "utf-8");
    // 此处略去××字
} catch (UnsupportedEncodingException e) {
    e.printStackTrace();
}

解决方法
这个问题由来已久,java社区解决这个问题的方式也很早就有,没有记错的话 apache commons大概十年前就提供了
方案,注意jdk中提供的另外一个不抛UnsupportedEncodingException的构造函数:

public String(byte bytes[], Charset charset) {
    this(bytes, 0, bytes.length, charset);
}

和前一个构造函数的差别就是这里直接输入了Charset对象,不需要做一次从string到Charset
的转化(这里才是UnsupportedEncodingException抛出的根源)。而我们日常要用到的charset是非常
有限的,因此只要简单列常来最常用的几个就好了。

JDK7之后,java引入了java.nio.charset.StandardCharsets来做charset预定义:

public final class StandardCharsets {
    public static final Charset US_ASCII = Charset.forName("US-ASCII");
    public static final Charset ISO_8859_1 = Charset.forName("ISO-8859-1");
    public static final Charset UTF_8 = Charset.forName("UTF-8");
    ......
}

在jdk之前,很多基本类库都提供类似的功能,比如大家熟悉的apache commons,这个是最早提供也是用的最多的的:

org.apache.commons.codec.Charsets

    /**
     * @see Standard charsets
     * @deprecated Use Java 7"s {@link java.nio.charset.StandardCharsets}
     */
    @Deprecated
    public static final Charset UTF_8 = Charset.forName(CharEncoding.UTF_8);

注意上面的注释,现在apache已经Deprecated 它了,建议大家用StandardCharsets。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/69329.html

相关文章

  • 1、转换流 2、缓冲流

    摘要:字符转换流原理字节流编码表。和作为子类,仅作为操作字符文件的便捷类存在。源目的先根据需求明确要读,还是要写。屏幕网络完全可以明确具体要使用哪个流对象。明确四是否需要额外功能呢额外功能转换吗转换流。高效吗缓冲区对象。 01转换流概述 * A: 转换流概述 * a: 转换流概述 * OutputStreamWriter 是字符流通向字节流的桥梁:可使用指定的字符编码...

    sf190404 评论0 收藏0
  • String类基础的那些事!

    摘要:第三阶段常见对象的学习第一章常见对象类一类的概述及其构造方法概述多个字符组成的一串数据,例如也可以看成是一个字符数组。 第三阶段 JAVA常见对象的学习 第一章 常见对象——String类 (一) String 类的概述及其构造方法 (1) 概述 多个字符组成的一串数据,例如 abc 也可以看成是一个字符数组。 而通过 API我们又可以知道 A:字符串字面值abc也可以看成是一个字符串...

    30e8336b8229 评论0 收藏0
  • underscore的小技巧

    摘要:在阅读的过程中,发现了它的一些小技巧,对我们平时的编程很有用。事实上,在上也的确是可以被更改的而在或高版本的中,并不能更改全局的。但是,局部的仍然可以被改变。所以,建议在已知长度的情况下,使用第一种,而不知道长度的情况下,使用第二种。 在阅读 underscore 的过程中,发现了它的一些小技巧,对我们平时的编程很有用。在这里向大家介绍一二 void 0 代替 underfined 首...

    lifesimple 评论0 收藏0
  • JS 经常使用的小技巧,助你更简短的实现一些功能

    摘要:第二个问题非基础类型则不好处理,其实像这种比较的方法,往往不是用于处理普遍情况的,往往是在特殊场景发挥奇效的。没有最好的方案,只有最合适的方案。这样才能使得正数和负数的表示统一起来,具体可以参阅补码的历史,这里不过多展开了。 原文: https://github.com/HCThink/h-... github 首页(star+watch,一手动态直达): https://gith...

    ChristmasBoy 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<