资讯专栏INFORMATION COLUMN

PHP开发中涉及到emoji表情的几种处理方法

马龙驹 / 931人阅读

摘要:最近几个月做微信开发比较多,存储微信昵称必不可少可这万恶的微信支持表情做昵称,这就有点蛋疼了一般表设计时,都是用字符集的。

最近几个月做微信开发比较多,存储微信昵称必不可少
可这万恶的微信支持emoji表情做昵称,这就有点蛋疼了

一般Mysql表设计时,都是用UTF8字符集的。把带有emoji的昵称字段往里面insert一下就没了,整个字段变成了空字符串。这是怎么回事呢?

原来是因为Mysql的utf8字符集是3字节的,而emoji是4字节,这样整个昵称就无法存储了。这要怎么办呢?我来介绍几种方法

1、使用utf8mb4字符集

如果你的mysql版本>=5.5.3,你大可直接将utf8直接升级为utf8mb4字符集
这种4字节的utf8编码可完美兼容旧的3字节utf8字符集,并且可以直接存储emoji表情,是最好的解决方案
至于字节增大带来的性能损耗,我看过一些评测,几乎是可以忽略不计的

2、使用base64编码

如果你因为某些原因无法使用utf8mb4的话,你还可以使用base64来曲线救国
使用例如base64_encode之类的函数编码过后的emoji可以直接存储在utf8字节集的数据表中,取出时decode一下即可

3、干掉emoji表情

emoji表情是个麻烦的东西,即使你能存储,也不一定能完美显示。在iOS以外的平台上,例如PC或者android。如果你需要显示emoji,就得准备一大堆emoji图片并使用第三方前端类库才行。即便如此,还是可能因为emoji图片不够全而出现无法显示的情况
在大多数业务场景下,emoji也不是非要不可的。我们可以适当地考虑干掉它,节约各种成本

经过一番苦苦的google,终于找到靠谱能用的代码:

// 过滤掉emoji表情
function filterEmoji($str)
{
    $str = preg_replace_callback(
            "/./u",
            function (array $match) {
                return strlen($match[0]) >= 4 ? "" : $match[0];
            },
            $str);

     return $str;
 }

基本思想就是遍历字符串中的每个字符,如果该字符的长度为4个字节,就将其删除。
转载自:pein0119

像我最近做的一个小项目,就是用方法3解决的,方便省事

本文同时刊登于我的博客 超能小紫,如果喜欢请常来玩哦

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/21690.html

相关文章

  • 前端字符编码小结

    摘要:导语本文源于微信游戏春节王者摇心愿活动英雄语音祝福自定义输入模块开发过程,对踩过的前端字符编码的坑进行记录总结。只规定了字符编码,而并没有规定具体的编码方式。 导语 本文源于微信游戏春节王者摇心愿活动英雄语音祝福自定义输入模块开发过程,对踩过的前端字符编码的坑进行记录总结。 Unicode 字符 Unicode(中文:万国码、国际码、统一码、单一码)是计算机科学领域里的一项业界标准。它...

    gitmilk 评论0 收藏0
  • 用javascript写一个emoji表情插件

    摘要:二是考虑到某些表情包现在可能并不想用,但代码删来删去可能会很麻烦,所以提供了一个是否启用的接口。 很久没有写文章了,说实话本人现在受困于五月病已经快变成一条死咸鱼了(T_T),本次就当写一个简单的js插件教程了。本项目的代码相对比较简单,至于里面有些变量命名的问题就请你们不要吐槽了Σ(゚д゚lll)(好的,我承认我英语就小学水平好吧。除了hello和goodbye其他的都不会了____...

    Stardustsky 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<