PHP四种序列化方案

Wildcard 发布于2019-07-01 10:58 / 2073人阅读

摘要：这里序列化的概念可能更为广泛和笼统一些，包括传统的等。就目前来看，等二进制序列化无论是速度上还是数据大小上，都要比文本序列化更好。，反序列化方法。用法，序列化方法。

原文地址：https://t.ti-node.com/thread/...

数据的序列化是一个非常有用的功能，然而目测很多人跟我一样，在刚接触这玩意的时候压根就不理解这货色到底是干啥用的，反正老师说了，实在理解不了就先背过再说。

“啥犊子玩意啊，又是序列化、又是反序列化。。。”（图片来自于《我的团长我的团》之国军二道贩子兼二人转演员迷龙同学）。

其实将数据序列化的作用无外乎有两个：

方便传输

方便存储

方便存储如何理解呢？比如我们有个PHP对象或者一个PHP数组需要存储到数据库甚至文件中，这显然是不可能的，这个时候必须要将PHP对象或者PHP数组序列化后再执行存储操作。不过这将PHP数组序列化后存起来还能理解，这对象也能存储啊？这操作是否过于风骚？少年，这一点儿都不风骚。有些时候将对象直接存储起来，用的时候只需要简单的反序列化后就可以投产使用了，避免了new一次带来的性能耗费。

方便传输如何理解呢？其实序列化在传输中应用的相对更多更常见些许。最简单的一个例子，一个码前端的码了一个ajax找你给TA提供一个API，那么这个时候你俩得商量返回什么数据，比如json或者xml，甚至你俩自己作死约定私有数据格式。比如在一个比较典型的服务架构中，网关服务器和内部RPC服务器之间通过msgpack传递数据。这都是典型的序列化为了传输的典型应用案例。

这里序列化的概念可能更为广泛和笼统一些，包括传统的serialize、json、msgpack、protobuf等。（如果你觉得序列化这个称呼不太严谨的话，可以用encode来代替；反序列化则用decode来代替。反正我就用统统用序列化和反序列化来称呼了，如果你觉得实在不舒服，可以顺着网线来砍我！）。

实际上，从更高的层面看，数据的序列化可以分为两种：

文本序列化，常见如json、serialize、xml等

二进制序列化，常见如msgpack、protobuf、thrift等

一般说来，考验序列化技术的性能指标一共有两个，一个是序列化的速度，一个是序列化后数据的大小，自然是序列化速度越快、序列化后的数据越小为佳。就目前来看，protobuf、msgpack等二进制序列化无论是速度上还是数据大小上，都要比文本序列化更好。不过话说回来，文本序列化有更好的可读性，一眼就能瞪出来数据内容大概是啥玩意。

今天带到这里的这里的有四个具体的方案，这四种方案都是简单粗暴、开箱即用类型的，我们分别测试感受下，看哪个更适合我们。

参会的四个哥们：PHP内置的serialize、PHP内置的JSON解析器、PHP扩展JSOND、PHP扩展msgpack。其中前三个都是文本类型的，msgpack则是二进制类型的。

JSOND作为PHP内置的JSON解析器的高级版本，坊间一直传闻速度上要比内置的更牛X一些，作为扩展，这货需要额外安装，附送地址：https://pecl.php.net/get/json...。

msgpack是一个鸟哥等人搞的一套二进制序列化工具，slogan就是“It"s like JSON.but fast and small.”，附送地址：https://pecl.php.net/get/msgp...

serialize用法
serialize()，序列化方法。
unserialize()，反序列化方法。

json用法
json_encode()，没啥好说的吧？
json_decode()，没啥好说的吧？

jsond用法
jsond_encode()，和json_encode()一样，后面多个字母d而已。
jsond_decode()，和json_decode()一样，后面多个字母d而已。

msgpack用法
msgpack_pack()，序列化方法。
msgpack_unpack()，反序列化方法。

测试代码如下：

 22193123,
    "gender" => "famale",
    "username" => "elarity",
    "password" => md5("www123"),
    "relation" => array(
      array(
        "uid" => 22193123,
        "gender" => "famale",
        "username" => "elarity",
        "password" => md5("www123"),
      ),
      array(
        "uid" => 22193123,
        "gender" => "famale",
        "username" => "elarity",
        "password" => md5("www123"),
      ),
      array(
        "uid" => 22193123,
        "gender" => "famale",
        "username" => "elarity",
        "password" => md5("www123"),
      ),
      array(
        "uid" => 22193123,
        "gender" => "famale",
        "username" => "elarity",
        "password" => md5("www123"),
      ),
      array(
        "uid" => 22193123,
        "gender" => "famale",
        "username" => "elarity",
        "password" => md5("www123"),
      ),
      array(
        "uid" => 22193123,
        "gender" => "famale",
        "username" => "elarity",
        "password" => md5("www123"),
      ),
      array(
        "uid" => 22193123,
        "gender" => "famale",
        "username" => "elarity",
        "password" => md5("www123"),
      ),
      array(
        "uid" => 22193123,
        "gender" => "famale",
        "username" => "elarity",
        "password" => md5("www123"),
      ),
      array(
        "uid" => 22193123,
        "gender" => "famale",
        "username" => "elarity",
        "password" => md5("www123"),
      ),
    ),
  )
);

// 每种序列化方案都执行100000次
$counter = 100000;

// json序列化方案，执行100000次
echo PHP_EOL.PHP_EOL;
$start = microtime( true );
for( $i = 1; $i <= $counter; $i++ ){
  $json = json_encode( $arr ); 
}
$size = strlen( $json );
$end = microtime( true );
$cost_time = $end - $start;
echo "json_encode : 耗费时间为{$cost_time} , 数据体积为{$size}".PHP_EOL;

// jsond序列化方案，执行100000次
$start = microtime( true );
for( $i = 1; $i <= $counter; $i++ ){
  $jsond = jsond_encode( $arr ); 
}
$size = strlen( $jsond );
$end = microtime( true );
$cost_time = $end - $start;
echo "jsond_encode : 耗费时间为{$cost_time} , 数据体积为{$size}".PHP_EOL;

// serialize序列化方案，执行100000次
$start = microtime( true );
for( $i = 1; $i <= $counter; $i++ ){
  $serialize = serialize( $arr ); 
}
$size = strlen( $serialize );
$end = microtime( true );
$cost_time = $end - $start;
echo "serialize : 耗费时间为{$cost_time} , 数据体积为{$size}".PHP_EOL;

// msgpack序列化方案，执行100000次
$start = microtime( true );
for( $i = 1; $i <= $counter; $i++ ){
  $msgpack = msgpack_pack( $arr );
}
$size = strlen( $msgpack );
$end = microtime( true );
$cost_time = $end - $start;
echo "msgpack耗费时间为 : {$cost_time} , 数据体积为{$size}".PHP_EOL;
echo PHP_EOL.PHP_EOL;

将文件保存为test.php，然后php test.php执行，结果如下图所示：

总结一下：

jsond确实是要比json快一些的

总有刁民张嘴就来json要比serialize()快

serialize()数据体积确实大（因为还保留了数据类型说明）

msgpack最佳？？？不知道昂，你们自己感受

补充：评论里有一条补充的很好，指出了我这里一些比较片面的内容，大家可以补充观看：

“可以看看我的测试：https://blog.yurunsoft.com/a/...
我选择的数据类别相对较多，有数组有对象，有小数据有较多的数据，其实固定地说哪个更好更快，没有意义，要根据实际场景选择合适的才好”

GPU云服务器云服务器 php 四种排序 php有四种标量类型 php序列化 php反序列化

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/29699.html

JS基础篇--JS之表单提交时编码类型enctype详解

摘要：格式支持比键值对复杂得多的结构化数据，这一点也很有用。例如下面这段代码最终发送的请求是这种方案，可以方便的提交复杂的结构化数据，特别适合的接口。简介 form的enctype属性为编码方式，常用有两种：application/x-www-form-urlencoded和multipart/form-data，默认为application/x-www-form-urlencoded。 ...

ad6623 2019-08-21 17:26 评论0 收藏0
读 PHP - Pimple 源码笔记（上）

摘要：也就是闲时为了写文章而写的一篇关于源码的阅读笔记。是标准库的缩写，一组旨在解决标准问题的接口和类的集合。提供了一套标准的数据结构，一组遍历对象的迭代器，一组接口，一组标准的异常，一系列用于处理文件的类，提供了一组函数，具体可以查看文档。也就是闲时为了写文章而写的一篇关于 Pimple 源码的阅读笔记。Pimple 代码有两种编码方式，一种是以 PHP 编写的，另一种是以 C 扩展编写...

cfanr 2019-06-28 18:47 评论0 收藏0
PHP 实现插入排序

摘要：插入排序插入排序英语是一种简单直观的排序算法。插入排序在实现上，通常采用排序即只需用到的额外空间的排序，因而在从后向前扫描过程中，需要反复把已排序元素逐步向后挪位，为最新元素提供插入空间。一般来说，插入排序都采用在数组上实现。导语关于排序的算法，就此告一段落。冒泡排序、快速排序、选择排序、加上本篇的插入排序，这四种算法都是相对简单，容易理解的。更复杂的算法，就不献丑了，以免误人子弟...

DoINsiSt 2019-07-01 11:16 评论0 收藏0
PHP面试之一：PHP基础知识点

摘要：之前，第三方编译是管理器，是解释器之后，官方自带，与模式。又是解释器，又是管理器以模块模式运行常见配置数组排序 PHP引用变量什么是引用变量？如何定义引用变量？引用意味着用不同的名字访问同一个内容定义引用变量：使用& 引用变量的工作原理普通变量的工作原理 $a = range(0,10000); var_dump(memory_get_usage()); //int(7420...

waterc 2019-06-28 13:52 评论0 收藏0