node.js爬取数据 node可以做很多事情,比如爬虫、通信等等。 今天就先做一个爬虫,爬取一些百度图片。
首先我们需要引入一些模块
var http = require("http"); var https = require("https"); var fs = require("fs"); var cheerio = require("cheerio");
这里需要注意cheerio是扩展模块需要装一下
npm install cheerio --save
然后要把这些图片的url地址获取下来
const wz="http://image.baidu.com/"; var strHtml=""; var resuts=[];//定义一个空数组,将数据内容存在里面 http.get(wz,function(res){ //接收数据 res.on("data",function(data){ strHtml+=data; }); //接收完成 res.on("end",function(){ var $=cheerio.load(strHtml); //找到这些图片的位置 $(".img_single_box img").each(function(index,item){ resuts.push($(item).attr("src")) }); console.log(resuts); //循环调用图片函数 for(var i=0;i然后根据图片URL地址保存成图片
function saveImage(resuts){ https.get(resuts,function(res){ res.setEncoding("binary");//二进制 var imageData="";//将图片加载到内存中 res.on("data",function(a){ imageData+=a; }).on("end",function(){ //创建文件夹,如果有就不用创建 if(!fs.existsSync("./images")){ fs.mkdirSync("./images"); }; //保存图片 fs.writeFile(".images/"+Math.random()+".png",imageData,"binary",function(err){ if(!err) console.log("保存成功"); }); }); }); }
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/89077.html
摘要:上面只爬取了京东首页的图片内容,假设我的需求进一步扩大,需要爬取京东首页中的所有标签对应的跳转网页中的所有的文字内容,最后放到一个数组中。 showImg(https://segmentfault.com/img/bVbtVeV?w=3840&h=2160); 本文适合无论是否有爬虫以及Node.js基础的朋友观看~ 需求: 使用Node.js爬取网页资源,开箱即用的配置 将爬取到的...
摘要:上面只爬取了京东首页的图片内容,假设我的需求进一步扩大,需要爬取京东首页中的所有标签对应的跳转网页中的所有的文字内容,最后放到一个数组中。 showImg(https://segmentfault.com/img/bVbtVeV?w=3840&h=2160); 本文适合无论是否有爬虫以及Node.js基础的朋友观看~ 需求: 使用Node.js爬取网页资源,开箱即用的配置 将爬取到的...
摘要:上面只爬取了京东首页的图片内容,假设我的需求进一步扩大,需要爬取京东首页中的所有标签对应的跳转网页中的所有的文字内容,最后放到一个数组中。 showImg(https://segmentfault.com/img/bVbtVeV?w=3840&h=2160); 本文适合无论是否有爬虫以及Node.js基础的朋友观看~ 需求: 使用Node.js爬取网页资源,开箱即用的配置 将爬取到的...
摘要:这里由于京东的分界面都使用了,所以我们可以用,总之他们开发能用的选择器,我们都可以用,否则就不可以。 难道爬虫只能用 python 做? 不,我们上天的 Node.js 也可以做! 需要准备的包 Node.js的最新版本 下载地址 Node.js官网 npm 包管理器下载 下载最新的官网版本 Node.js 会自带 npm npm的第三方包 puppeteer 在对应...
摘要:这里由于京东的分界面都使用了,所以我们可以用,总之他们开发能用的选择器,我们都可以用,否则就不可以。 难道爬虫只能用 python 做? 不,我们上天的 Node.js 也可以做! 需要准备的包 Node.js的最新版本 下载地址 Node.js官网 npm 包管理器下载 下载最新的官网版本 Node.js 会自带 npm npm的第三方包 puppeteer 在对应...
阅读 3138·2021-11-25 09:43
阅读 3148·2021-11-23 09:51
阅读 3492·2019-08-30 13:08
阅读 1498·2019-08-29 12:48
阅读 3569·2019-08-29 12:26
阅读 373·2019-08-28 18:16
阅读 2533·2019-08-26 13:45
阅读 2386·2019-08-26 12:15