什么!？nodejs 实现的同步网络请求？

Rindia 发布于2019-08-20 14:21 / 2956人阅读

摘要：以异步方式事件队列为标准，基本每一套与网络相关的都会设计成异步的。在这种情况下，同步的网络请求比异步的请求会更加合适，代码更加清晰，逻辑更简单，而且对代码效率要求不高。如下，便是简化后的同步请求，文本替换的代码。

node.js 以异步方式、事件队列为标准，基本每一套与网络、IO 相关的 API 都会设计成异步的。

如，一段很平常的请求代码，用 node.js 只能用异步方式。

const https = require("https");

https.get("https://nodejs.org/api/https.html", res => res.pipe(process.stdout))

异步方式不会阻塞进程，充分利用 CPU。

但是，对于一些一次性的脚本、批处理，我们希望使用同步的方式。因为以上情形，对于效率要求不是十分迫切，更多的是需要清晰的代码结构，简明的代码逻辑。

本人在之前的 markdown-image-size 中，有这么个需求：

浏览器在未加载完图片数据的时候，浏览器是不知道其大小的
所以，默认大小都是 0，除非通过 style 设置了大小

之后的某个时候，图片加载完成，浏览器得到图片大小，文章就会有跳动的感觉，阅读体验不佳

解决该问题，将 markdown 文本中的 ![](src) 和中的 src 匹配出来，如果是本地文件则读文件，得到图片大小；或者发送请求，得到图片数据进而得到图片大小，最后进行字符串替换/插入，成为如下的 HTML 格式文本。

在这种情况下，同步的网络请求比异步的请求会更加合适，代码更加清晰，逻辑更简单，而且对代码效率要求不高。如下，便是简化后的同步请求，文本替换的代码。

content.replace(/![(.*)]((.*?[^]))/g, (matched, alt, src) => {
    // get image data from src synchronously
    const data = getData(src);
    const size = sizeOf(data);
    return ``
})

如果使用的是异步，则不能在第二个参数中直接 return 替换后的文本了，就需要更加复杂的代码逻辑（如标记文本的位置和长度，待请求结束后，进行替换）。

那么具体应该如何实现 node.js 的同步请求呢？

谷歌 "sync request in nodejs"

搜索结果中出来一个 sync-request， npm install 后果然能够同步网络请求，这顿时勾起了我的兴趣：在一个官方没有提供同步请求 api 的情况下，该第三方包是怎么实现请求的同步的呢？

阅读源码之后才发现作者十分巧妙的将异步问题转化成了同步问题，分析如下。

sync-request

在 readme 中，作者有这样一段话：

How is this possible?

Internally, this uses a separate worker process that is run using childProcess.spawnSync.

The worker then makes the actual request using then-request so this has almost exactly the same API as that.

This can also be used in a web browser via browserify because xhr has built in support for synchronous execution. Note that this is not recommended as it will be blocking.

简言之作者实际上发送请求是用的 then-request，对官方的异步 API 用 Promise 进行封装，所以其是异步请求方式。

异步转化同步方式，主要是借助了 childProcess.spawnSync 方法，创建同步进程。

阅读源码之后，基本的流程如下：

首先需要 nc 指令的作用，以及标准输入输出如何传递字节数组。

man page 中对 nc 的介绍为：

nc -- arbitrary TCP and UDP connections and listens  
usage: nc  [hostname] [port[s]]

就是一个底层的系统调用，用于建立 TCP/UDP 连接或者监听某端口的，由于是系统调用，所以速度更快，效率更高。

标准输入输出如何传递字节数组，就需要将字节数组转化成字符串，然后在处理之前转化成字节数组，默认 nodejs 实现是将 Buffer 序列化为 {"type":"Buffer","data":[1,2,3,4,5]}，分成2个字段表示，但是这样是不能够反序列化回来的。

则需要重写 JSON 序列化的方法，主要是对 Buffer 的处理。

function stringify (o) {
    if(o && Buffer.isBuffer(o)) // hex, ascii 都是可以的
        return JSON.stringify(":base64:" + o.toString("base64"));
    if ("string" === typeof o) {
        // 避免将 buffer 误认为 string
        return JSON.stringify(/^:/.test(o) ? ":" + o : o)
    }
    // 其他维持原样
}

function parse (o) {
    return JSON.parse(s, function (key, value) {
        if("string" === typeof value) {
          if(/^:base64:/.test(value))
            return new Buffer(value.substring(8), "hex")
          else // string
            return /^:/.test(value) ? value.substring(1) : value
        }
        return value
    })
}

理解了以上之后，再来具体看看代码

find-port.js
得到一个空闲的端口返回，基本原理如下（仅为部分代码）

module.exports = function () {
    return new Promise(function (resolve, reject) {
        var server = net.createServer();

        server.unref();
        server.on("error", reject);
        // port = 0, 绑定可用的端口
        server.listen(0, function () {
            var port = server.address().port;

            server.close(function () {
                resolve(port);
            });
        });
    });
};

legacy-work.js
使用标准输入输出作为参数的来源和返回的出口，处理网络请求 (then-request)

const concat = require("concat-stream");
const request = require("then-request");
const JSON = require("./json-buffer");

function respond(data) {
  process.stdout.write(JSON.stringify(data), function() {
    process.exit(0);
  });
}

process.stdin.pipe(concat(function (stdin) {
  var req = JSON.parse(stdin.toString());
  request(req.method, req.url, req.options).done(function (response) {
    respond({success: true, response: response});
  }, function (err) {
    respond({success: false, error: { message: err.message }});
  });
}));

nc-server.js
启动一个 TCP 服务端，为 nc 指令通信

const net = require("net");
const concat = require("concat-stream");
const request = require("then-request");
const JSON = require("./json-buffer");

const server = net.createServer({allowHalfOpen: true}, c => {
  function respond(data) {
    c.end(JSON.stringify(data));
  }

  c.pipe(concat(function (stdin) {
    try {
      const req = JSON.parse(stdin.toString());
      request(req.method, req.url, req.options).done(function (response) {
        respond({success: true, response: response});
      }, function (err) {
        respond({success: false, error: { message: err.message }});
      });
    } catch (ex) {
      respond({success: false, error: { message: ex.message }});
    }
  }));
});

server.listen(+process.argv[2]);

其中 { allowHalfOpen: true } 不可少，因为在执行 spawnSync("nc", ["127.0.0.1", nPort], {input: request}) 时，input 是 JSON 序列话后的字符串，输入后就到 EOF 了，相当于在 Shell 中 Ctrl+D 控制键，nc 客户端套接字就关闭了，只有允许半开套接字，客户端才能收到服务器的数据。如下图：对应为客户端的 FIN_WAIT_2 ~ TIME_WAIT 周期之间，服务器依旧可以发送数据。

以上，便是对部分源码的解析

所以，最终的请求还是通过 then-request 来实现的，但是对于 then-request 并不支持 multipart/formdata，因此 sync-request 也是不支持的。于是本人在 fork 之后，配合 form-data 提了 pr，希望作者能够早日 merge 吧。

最后想说：原来还可以这样实现同步！

GPU云服务器云服务器同步请求 nodejs处理ajax请求 ios同步请求 ajax请求同步异步

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/81572.html

Nodejs高性能原理(上) --- 异步非阻塞事件驱动模型

摘要：使用了一个事件驱动非阻塞式的模型，使其轻量又高效。的包管理器，是全球最大的开源库生态系统。按照这个定义，之前所述的阻塞，非阻塞，多路复用信号驱动都属于同步。系列文章 Nodejs高性能原理(上) --- 异步非阻塞事件驱动模型Nodejs高性能原理(下) --- 事件循环详解前言终于开始我nodejs的博客生涯了,先从基本的原理讲起.以前写过一篇浏览器执行机制的文章,和nodej...

yy736044583 2019-08-26 10:42 评论0 收藏0
Node.js 入门你需要知道的 10 个问题

摘要：什么是在中什么时候需要是中的包管理器。允许我们为安装各种模块，这个包管理器为我们提供了安装删除等其它命令来管理模块。 showImg(https://user-gold-cdn.xitu.io/2019/7/11/16bde5b2df52a924?w=4000&h=2667&f=jpeg&s=450648); 本文为您分享「Node.js 入门你需要知道的 10 个问题」这些问题可能也...

szysky 2019-08-23 18:36 评论0 收藏0
前端面试题大集合：来自真实大厂的532道面试题(只有题，没有答案)

答案自己谷歌或百度找。一、来源背景面试题是来自微博@牛客网发布的真实大厂前端面经题目，我一直在收集题目长期一个一个的记录下来的，可能会有重复，但基本前端的面试大纲和需要掌握的知识都在其中了，面试题仅做学习参考，学习者阅后也要用心钻研其中的原理，重要知识需要系统学习、透彻学习，形成自己的知识链。二、532道前端真实大厂面试题 express和koa的对比，两者中间件的原理，koa捕获异常多种情...

Kerr1Gan 2019-08-26 12:20 评论0 收藏0
前端面试题大集合：来自真实大厂的532道面试题(只有题，没有答案)

答案自己谷歌或百度找。一、来源背景面试题是来自微博@牛客网发布的真实大厂前端面经题目，我一直在收集题目长期一个一个的记录下来的，可能会有重复，但基本前端的面试大纲和需要掌握的知识都在其中了，面试题仅做学习参考，学习者阅后也要用心钻研其中的原理，重要知识需要系统学习、透彻学习，形成自己的知识链。二、532道前端真实大厂面试题 express和koa的对比，两者中间件的原理，koa捕获异常多种情...

lushan 2019-08-02 11:34 评论0 收藏0