资讯专栏INFORMATION COLUMN

6张图像vs13000张图像,超越2013 Kaggle猫狗识别竞赛领先水平

RdouTyping / 3320人阅读

摘要:年,举办过一个很受欢迎的猫狗识别竞赛。当时,正如比赛官网宣布的,在使用张猫和狗的图像进行训练后,较先进的算法分辨猫狗的准确率是。医学诊断异常检测图像识别的工业应用,等等。小结结果令人吃惊。

2013年,Kaggle举办过一个很受欢迎的猫狗识别竞赛(Dogs vs. Cats)。比赛的目标是训练一种能够检测图像中是否包含猫或者狗的算法。

当时,正如比赛官网宣布的,在使用13000张猫和狗的图像进行训练后,较先进的算法分辨猫狗的准确率是82.7%。

我的结果

我应用了迁移学习的方法,这是一种训练模型完成其他类似任务,然后重新训练它来完成当前的任务的技术。

我微调了一个VGG19模型,使用6张随机选择的图像(如下图):

在经过41 epochs的训练后,我的模型达到了89.97%的准确率。验证集大小是24994。

你可以在我的GitHub仓库找到所需要的所有东西来重现这个实验:https://github.com/radekosmulski/dogs_vs_cats

这个结果是完全出乎意料的。我所使用的技术在fast.ai的“Practical Deep Learning for Coders”课程的第一节课就被介绍过,在课程提供的Jupyter笔记中,它需要7行代码来执行迁移学习。

这意味着,任何会在电脑上移动文件的人都能够学会将这一前沿技术应用到他们选择的问题上。医学诊断、异常检测、图像识别的工业应用,等等。是的,你仍然需要一些数据,你也需要对监督学习是什么以及它的工作原理有一些高层次的理解。但所需要的也就这么些。

小结

结果令人吃惊。我没有应用数据增强(data augmentation),也不需要调整学习率,也不用担心正则化。我甚至没有测试不同的架构——这就是我尝试的第一个架构。

是的,有人可能会说,从照片中将猫和狗辨别出来并非什么艰深的科学。但我得提醒你,人类在40年前就已登上月球,但40年后的今天我们仍然无法告诉计算机如何执行这个看似简单的任务,将准确率提高到85%以上。是的,我选择拿来微调的这个模型本是训练来执行视觉识别任务的,并且表现出色。

但是请稍等一下,请再阅读一下这篇文章的前两段。我打破了4年前这个任务上较先进的结果,并且毫不费力。我在云上运行一台超级计算机,费用为每小时约0.2美元(这是我付给Amazon租虚拟机的费用)。这是非常意义重大的。

这表明,今天的深度学习应用的局限不再是由技术驱动的——我们已经拥有所需的硬件和软件。是的,对于某些任务,我们需要更快的处理器,或者更多数据,或者更好的算法。但是,今天深度学习存在非常大的尚待被发现的应用范围,而限制因素是该项技术相关知识传播的速度。

以上来自一个在大学主修一年半社会学后辍学,自学编程但绝不是一个编程大师的人,只花了一个下午的时间的工作突破了4年前的较先进的结果,并且使用的数据只有它的2166分之一。那么我提出的问题是:你将应用这项技术来做什么让世界变得更好的工作?

PS. Phillipe Golle 的 Machine Learning Attacks Against the Asirra CAPTCHA 这篇论文是2013年的state-of-the-art的解决方案,论文:http://xenon.stanford.edu/~pgolle/papers/dogcat.pdf

PS. 2 Kaggle猫狗识别竞赛的优胜者准确率达到98.914%,在用25000张图像仔细训练一个机器学习系统后取得。

原文:https://medium.com/@radekosmulski/can-we-beat-the-state-of-the-art-from-2013-with-only-0-046-of-training-examples-yes-we-can-18be24b8615f

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/4622.html

相关文章

  • 一个时代的终结:ImageNet 竞赛 2017 是最后一届

    摘要:年月日,将标志着一个时代的终结。数据集最初由斯坦福大学李飞飞等人在的一篇论文中推出,并被用于替代数据集后者在数据规模和多样性上都不如和数据集在标准化上不如。从年一个专注于图像分类的数据集,也是李飞飞开创的。 2017 年 7 月 26 日,将标志着一个时代的终结。那一天,与计算机视觉顶会 CVPR 2017 同期举行的 Workshop——超越 ILSVRC(Beyond ImageNet ...

    OnlyMyRailgun 评论0 收藏0
  • 我是如何在1天内构建一个深度学习模型并进击Kaggle比赛的

    摘要:是为结果导向型人群开设的深度学习在线课程。但是最关键的是,我想通过构建简单的深度学习解决方案来实现理论和实践的相结合。我的目标是在一天结束前进入排名的前。我的时间都用于学习库组织数据和评估结果都是一些与深度学习无关的简单流程。 Fast.ai是Jeremy Howard为结果导向型人群开设的深度学习在线课程。我读过很多关于机器学习的书,也参加过不少这方面的课程,但我认为Fast.ai是迄今为...

    shinezejian 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<