摘要:这里序列化的概念可能更为广泛和笼统一些,包括传统的等。就目前来看,等二进制序列化无论是速度上还是数据大小上,都要比文本序列化更好。,反序列化方法。用法,序列化方法。
原文地址:https://t.ti-node.com/thread/...
数据的序列化是一个非常有用的功能,然而目测很多人跟我一样,在刚接触这玩意的时候压根就不理解这货色到底是干啥用的,反正老师说了,实在理解不了就先背过再说。
“啥犊子玩意啊,又是序列化、又是反序列化。。。”(图片来自于《我的团长我的团》之国军二道贩子兼二人转演员迷龙同学)。
其实将数据序列化的作用无外乎有两个:
方便传输
方便存储
方便存储如何理解呢?比如我们有个PHP对象或者一个PHP数组需要存储到数据库甚至文件中,这显然是不可能的,这个时候必须要将PHP对象或者PHP数组序列化后再执行存储操作。不过这将PHP数组序列化后存起来还能理解,这对象也能存储啊?这操作是否过于风骚?少年,这一点儿都不风骚。有些时候将对象直接存储起来,用的时候只需要简单的反序列化后就可以投产使用了,避免了new一次带来的性能耗费。
方便传输如何理解呢?其实序列化在传输中应用的相对更多更常见些许。最简单的一个例子,一个码前端的码了一个ajax找你给TA提供一个API,那么这个时候你俩得商量返回什么数据,比如json或者xml,甚至你俩自己作死约定私有数据格式。比如在一个比较典型的服务架构中,网关服务器和内部RPC服务器之间通过msgpack传递数据。这都是典型的序列化为了传输的典型应用案例。
这里序列化的概念可能更为广泛和笼统一些,包括传统的serialize、json、msgpack、protobuf等。( 如果你觉得序列化这个称呼不太严谨的话,可以用encode来代替;反序列化则用decode来代替。反正我就用统统用序列化和反序列化来称呼了,如果你觉得实在不舒服,可以顺着网线来砍我!)。
实际上,从更高的层面看,数据的序列化可以分为两种:
文本序列化,常见如json、serialize、xml等
二进制序列化,常见如msgpack、protobuf、thrift等
一般说来,考验序列化技术的性能指标一共有两个,一个是序列化的速度,一个是序列化后数据的大小,自然是序列化速度越快、序列化后的数据越小为佳。就目前来看,protobuf、msgpack等二进制序列化无论是速度上还是数据大小上,都要比文本序列化更好。不过话说回来,文本序列化有更好的可读性,一眼就能瞪出来数据内容大概是啥玩意。
今天带到这里的这里的有四个具体的方案,这四种方案都是简单粗暴、开箱即用类型的,我们分别测试感受下,看哪个更适合我们。
参会的四个哥们:PHP内置的serialize、PHP内置的JSON解析器、PHP扩展JSOND、PHP扩展msgpack。其中前三个都是文本类型的,msgpack则是二进制类型的。
JSOND作为PHP内置的JSON解析器的高级版本,坊间一直传闻速度上要比内置的更牛X一些,作为扩展,这货需要额外安装,附送地址:https://pecl.php.net/get/json...。
msgpack是一个鸟哥等人搞的一套二进制序列化工具,slogan就是“It"s like JSON.but fast and small.”,附送地址:https://pecl.php.net/get/msgp...
serialize用法
serialize(),序列化方法。
unserialize(),反序列化方法。
json用法
json_encode(),没啥好说的吧?
json_decode(),没啥好说的吧?
jsond用法
jsond_encode(),和json_encode()一样,后面多个字母d而已。
jsond_decode(),和json_decode()一样,后面多个字母d而已。
msgpack用法
msgpack_pack(),序列化方法。
msgpack_unpack(),反序列化方法。
测试代码如下:
22193123, "gender" => "famale", "username" => "elarity", "password" => md5("www123"), "relation" => array( array( "uid" => 22193123, "gender" => "famale", "username" => "elarity", "password" => md5("www123"), ), array( "uid" => 22193123, "gender" => "famale", "username" => "elarity", "password" => md5("www123"), ), array( "uid" => 22193123, "gender" => "famale", "username" => "elarity", "password" => md5("www123"), ), array( "uid" => 22193123, "gender" => "famale", "username" => "elarity", "password" => md5("www123"), ), array( "uid" => 22193123, "gender" => "famale", "username" => "elarity", "password" => md5("www123"), ), array( "uid" => 22193123, "gender" => "famale", "username" => "elarity", "password" => md5("www123"), ), array( "uid" => 22193123, "gender" => "famale", "username" => "elarity", "password" => md5("www123"), ), array( "uid" => 22193123, "gender" => "famale", "username" => "elarity", "password" => md5("www123"), ), array( "uid" => 22193123, "gender" => "famale", "username" => "elarity", "password" => md5("www123"), ), ), ) ); // 每种序列化方案都执行100000次 $counter = 100000; // json序列化方案,执行100000次 echo PHP_EOL.PHP_EOL; $start = microtime( true ); for( $i = 1; $i <= $counter; $i++ ){ $json = json_encode( $arr ); } $size = strlen( $json ); $end = microtime( true ); $cost_time = $end - $start; echo "json_encode : 耗费时间为{$cost_time} , 数据体积为{$size}".PHP_EOL; // jsond序列化方案,执行100000次 $start = microtime( true ); for( $i = 1; $i <= $counter; $i++ ){ $jsond = jsond_encode( $arr ); } $size = strlen( $jsond ); $end = microtime( true ); $cost_time = $end - $start; echo "jsond_encode : 耗费时间为{$cost_time} , 数据体积为{$size}".PHP_EOL; // serialize序列化方案,执行100000次 $start = microtime( true ); for( $i = 1; $i <= $counter; $i++ ){ $serialize = serialize( $arr ); } $size = strlen( $serialize ); $end = microtime( true ); $cost_time = $end - $start; echo "serialize : 耗费时间为{$cost_time} , 数据体积为{$size}".PHP_EOL; // msgpack序列化方案,执行100000次 $start = microtime( true ); for( $i = 1; $i <= $counter; $i++ ){ $msgpack = msgpack_pack( $arr ); } $size = strlen( $msgpack ); $end = microtime( true ); $cost_time = $end - $start; echo "msgpack耗费时间为 : {$cost_time} , 数据体积为{$size}".PHP_EOL; echo PHP_EOL.PHP_EOL;
将文件保存为test.php,然后php test.php执行,结果如下图所示:
总结一下:
jsond确实是要比json快一些的
总有刁民张嘴就来json要比serialize()快
serialize()数据体积确实大(因为还保留了数据类型说明)
msgpack最佳???不知道昂,你们自己感受
“可以看看我的测试:https://blog.yurunsoft.com/a/...
我选择的数据类别相对较多,有数组有对象,有小数据有较多的数据,其实固定地说哪个更好更快,没有意义,要根据实际场景选择合适的才好”
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/29699.html
摘要:格式支持比键值对复杂得多的结构化数据,这一点也很有用。例如下面这段代码最终发送的请求是这种方案,可以方便的提交复杂的结构化数据,特别适合的接口。 简介 form的enctype属性为编码方式,常用有两种:application/x-www-form-urlencoded和multipart/form-data,默认为application/x-www-form-urlencoded。 ...
摘要:也就是闲时为了写文章而写的一篇关于源码的阅读笔记。是标准库的缩写,一组旨在解决标准问题的接口和类的集合。提供了一套标准的数据结构,一组遍历对象的迭代器,一组接口,一组标准的异常,一系列用于处理文件的类,提供了一组函数,具体可以查看文档。 也就是闲时为了写文章而写的一篇关于 Pimple 源码的阅读笔记。Pimple 代码有两种编码方式,一种是以 PHP 编写的,另一种是以 C 扩展编写...
摘要:插入排序插入排序英语是一种简单直观的排序算法。插入排序在实现上,通常采用排序即只需用到的额外空间的排序,因而在从后向前扫描过程中,需要反复把已排序元素逐步向后挪位,为最新元素提供插入空间。一般来说,插入排序都采用在数组上实现。 导语 关于排序的算法,就此告一段落。冒泡排序、快速排序、选择排序、加上本篇的插入排序,这四种算法都是相对简单,容易理解的。更复杂的算法,就不献丑了,以免误人子弟...
摘要:之前,第三方编译是管理器,是解释器之后,官方自带,与模式。又是解释器,又是管理器以模块模式运行常见配置数组排序 PHP引用变量 什么是引用变量?如何定义引用变量? 引用意味着用不同的名字访问同一个内容定义引用变量:使用& 引用变量的工作原理 普通变量的工作原理 $a = range(0,10000); var_dump(memory_get_usage()); //int(7420...
阅读 1491·2021-09-30 09:47
阅读 3486·2021-09-22 15:05
阅读 2804·2021-08-30 09:44
阅读 3597·2019-08-30 15:55
阅读 1346·2019-08-30 13:08
阅读 1307·2019-08-29 16:40
阅读 514·2019-08-29 12:45
阅读 1327·2019-08-29 11:25