资讯专栏INFORMATION COLUMN

从CSV文件中读取jpg图片的URL地址并多线程批量下载

tabalt / 3227人阅读

摘要:并且,这个程序是多线程下载的,所以下载速度应该会比较快,我自己测试的速度,大约是秒左右下载个图片,当然这也与你的网速和图片大小有关。

很多时候,我们的网站上传图片时并没有根据内容进行文件夹分类,甚至会直接存储到阿里云的OSS或是七牛云等云存储上。这样,当我们需要打包图片时,就需要从数据库找寻分类图片,通过CURL进行下载。我最近刚刚完成了一个这样的任务,觉得会比较常用,就把程序放到了github上分享给大家,希望大家能够喜欢。

download_images_by_csv

这个程序只有一个文件,对环境没有太大苛求,windows和linux都能用,是不是线程安全无所谓,也没有什么特别的扩展需要安装。
使用的步骤是这样的:

首先,把你数据库的图片字段导出成csv文件

然后,命令窗口执行代码:

php run.php -f yourcsv.csv

如果你的字段里没有网址信息,比如http://yoursite.com/images/20... 在字段里只记录为20180101/14904.jpg,那么应该执行:

php run.php -f yourcsv.csv -p http://yoursite.com/images

这样就可以了,你的电脑上会多一个文件夹名叫dir_yourcsv.csv,里面会按字段分文件保存下载的图片。
并且,这个程序是多线程下载的,所以下载速度应该会比较快,我自己测试的速度,大约是10秒左右下载100个图片,当然这也与你的网速和图片大小有关。
就这么简单,没啥好说的了。有啥需要改的,可以在这篇文章下留言,也可以直接去github上提。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/29244.html

相关文章

  • Python爬虫入门教程 4-100 美空网未登录图片爬取

    摘要:爬虫分析首先,我们已经爬取到了多的用户个人主页,我通过链接拼接获取到了在这个页面中,咱们要找几个核心的关键点,发现平面拍摄点击进入的是图片列表页面。 简介 上一篇写的时间有点长了,接下来继续把美空网的爬虫写完,这套教程中编写的爬虫在实际的工作中可能并不能给你增加多少有价值的技术点,因为它只是一套入门的教程,老鸟你自动绕过就可以了,或者带带我也行。 爬虫分析 首先,我们已经爬取到了N多的...

    netmou 评论0 收藏0
  • Python爬虫入门教程 4-100 美空网未登录图片爬取

    摘要:爬虫分析首先,我们已经爬取到了多的用户个人主页,我通过链接拼接获取到了在这个页面中,咱们要找几个核心的关键点,发现平面拍摄点击进入的是图片列表页面。 简介 上一篇写的时间有点长了,接下来继续把美空网的爬虫写完,这套教程中编写的爬虫在实际的工作中可能并不能给你增加多少有价值的技术点,因为它只是一套入门的教程,老鸟你自动绕过就可以了,或者带带我也行。 爬虫分析 首先,我们已经爬取到了N多的...

    JowayYoung 评论0 收藏0
  • Python爬虫入门教程 4-100 美空网未登录图片爬取

    摘要:爬虫分析首先,我们已经爬取到了多的用户个人主页,我通过链接拼接获取到了在这个页面中,咱们要找几个核心的关键点,发现平面拍摄点击进入的是图片列表页面。 简介 上一篇写的时间有点长了,接下来继续把美空网的爬虫写完,这套教程中编写的爬虫在实际的工作中可能并不能给你增加多少有价值的技术点,因为它只是一套入门的教程,老鸟你自动绕过就可以了,或者带带我也行。 爬虫分析 首先,我们已经爬取到了N多的...

    Kross 评论0 收藏0
  • 接口测试常见问题

    摘要:同时我们也可以使用控件来实现小型的接口自动化来提高接口测试效率。接口测试的流程首先我们要了解需求,熟悉业务场景然后根据需求文档,接口文档以及业务场景来编写测试用例。 ...

    edgardeng 评论0 收藏0

发表评论

0条评论

tabalt

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<