资讯专栏INFORMATION COLUMN

utf-8 神秘符号 efbf bdef bfbd 锟斤拷

Ocean / 3925人阅读

摘要:神秘符号很多时候我们在打开的时候会有等很多像问号的编码出现这时候我们打开这个文件的二进制就会发现问号对应的十六进制编码就是。因为自动将收到的数据进行了解码。

utf-8 神秘符号 efbf bdef bfbd

很多时候我们在打开utf-8的时候会有 � 等很多像问号的编码出现
这时候我们打开这个文件的二进制就会发现 问号对应的十六进制编码就是
efbf bdef bfbd。这个编码到底是什么呢?为什么会有这种编码呢。
这就要从各种编码格式的转换说起。而且大部分出现这种问题的就是用gbk编码的文件
用utf-8编码格式打开。当编码格式中出现utf-8无法解析的字节,那么这个字节就会被
替换成 efbf bdef bfbd 这时我们会发现文件大小也发生了改变,因为未知字节全部
变成三个未知字节。
而这时候再将其转换为gbk
锟 (0xEFBF),斤(0xBDEF),拷(0xBFBD)
这就是 锟斤拷
那么我是在什么时候发现这个问题:
python 的 print 我们一般都会把python代码设置成全局utf-8编码。
这时候如果你收到的是一个gbk的编码,但是直接打出来。就会发现出现很多问号。
这个时候直接复制粘贴再看二进制就不是真正接受的数据。因为print自动将收到的
数据进行了utf-8解码。这样无法解析的编码就变成efbf bdef bfbd。
所以在遇到乱码的时候就需要在数据的原始接受处,及第一次转码发生之前将数据用二进制写入文件留存

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/44294.html

相关文章

  • 重学计算机组成原理(十)- "烫烫烫"乱码的由来

    摘要:而大写字母,就是第个,也就是二进制的,对应的十六进制表示就是。在中文世界里,最典型的就是手持两把锟斤拷,口中疾呼烫烫烫的典故。既然今天要彻底搞清楚编码知识,我们就来弄清楚锟斤拷和烫烫烫的来龙去脉。参考深入浅出计算机组成原理 showImg(https://image-static.segmentfault.com/206/872/2068726052-5d5922b2effb9_art...

    wenzi 评论0 收藏0
  • PyTips 0x07 - Python 字符串

    摘要:项目地址所有用过的人应该都看过下面两行错误信息这就是界的锟斤拷今天和接下来几期的内容将主要关注中的字符串字节及两者之间的相互转换。 项目地址:https://git.io/pytips 所有用过 Python (2&3)的人应该都看过下面两行错误信息: UnicodeEncodeError: ascii codec cant encode characters in position...

    go4it 评论0 收藏0
  • 前端常用代码片段(一)

    最后更新于2019年1月13日 前端常用代码片段(一) 点这里前端常用代码片段(二) 点这里前端常用代码片段(三) 点这里前端常用代码片段(四) 点这里前端常用代码片段(五) 点这里前端常用代码片段(六) 点这里 大部分需要引入 jquery-1.9.1.min.js(兼容ie8) 1.回车触发事件的代码 $(function(){ $(#username).focus(...

    chnmagnus 评论0 收藏0
  • 听说拼多多因漏洞被薅了200亿?- 谈谈软件测试

    摘要:昨天看到一个大新闻拼多多在日凌晨出现漏洞,用户可以领元无门槛优惠券。拼多多本来就是家争议颇大的公司,这次事件更是引发舆论热议。有人估计全球为此花费的相关费用有数亿美元。软件发布测试版让用户使用,就属于一种黑盒测试。 昨天看到一个大新闻: 拼多多在20日凌晨出现漏洞,用户可以领100元无门槛优惠券 。一夜之间,被黑产、羊毛党和闻讯而来的吃瓜群众薅了个底朝天,直到第二天上午9点才将优惠券下...

    henry14 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<