资讯专栏INFORMATION COLUMN

计算机在识别图像时“看到”了什么?

yanbingyun1990 / 1304人阅读

摘要:去年,微软和谷歌展示了能比人类更准确地识别图像的系统。深度学习就是你可以使用关键字搜索存储在谷歌的照片更多信息,能识别你照片中你朋友的原因。图像识别中使用的神经网络类型,被称为卷积网,受到了动物的视觉皮层方面研究的启发。

图像识别技术近来进步飞速。去年,微软和谷歌展示了能比人类更准确地识别图像的系统。

这些进步得益于一个叫做深度学习的技术,它涉及将数据通过模拟神经元的网络,以培养该网络在未来过滤数据(更多信息见“Teaching Machines to Understand Us”)。深度学习就是你可以使用关键字搜索存储在谷歌的照片(更多信息),Facebook 能识别你照片中你朋友的原因。 在图像识别上使用深度学习也使得机器人和自动驾驶汽车更有可行性,它甚至可以彻底改变医学(更多信息)。

图像识别技术的能力和灵活性来自于, 当人工神经网络收到很多图像和图像类别的信息时,它可以自动计算出来重要的视觉特征。在深度学习中使用的神经网络被布置成不同的层,数据一层一层根据顺序通过。在训练过程中,在神经网络中的不同的层成为专门识别不同类型的视觉特征的网络层。图像识别中使用的神经网络类型,被称为卷积网,受到了动物的视觉皮层方面研究的启发。

“这些神经网络相比传统的计算机视觉方法,是一个巨大的飞跃,因为它们直接从数据中得出结果。”马修·蔡勒,Clarifai(Clarifai 提供了包括 buzzfeed 在内的公司组织和搜索照片和视频的服务) 的 CEO 说。程序员们曾经需要写出寻找视觉特征所需的数学程序,然而这些程序并不能创造出很多有用的产品。

当蔡勒还是一个研究生的时候, 他在纽约大学与罗博·宏泰合作开发了一种可视化神经网络运作的方法。在这个链接中的幻灯片中的图像将带你来到这个深度学习网络的内部,这个用了130万张照片训练过,打败了人类的图像识别神经网络。该网络识别了 1000 个截然不同的物件,包括蚊帐和蚊子,而幻灯片上显示了每个图像中最强烈的激活神经元网络的一个网络层的视觉特征。

原文链接:https://www.technologyreview.com/s/60111...

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/19607.html

相关文章

  • 字符图像识别——数字字母混合

    摘要:需要识别的验证码图像,其中包含个字符数字字母验证码图片来源思路灰度化将图像转为灰度图像,即一个像素只有一种色阶有种不同灰度,值为表示像素最黑,值为表示像素最白。 需要识别的验证码图像,其中包含 4 个字符(数字字母) showImg(https://segmentfault.com/img/remote/1460000016055387); 验证码图片来源:http://my.cnki...

    dongfangyiyu 评论0 收藏0
  • NVIDIA开源DG-Net:用GAN生成行人图像,淘宝式换衣,辅助行人重识别

    摘要:通过生成高质量的行人图像,将其与行人重识别模型融合,同时提升行人生成的质量和行人重识别的精度。若使用这些低质量的行人生成图像来训练行人重识别模型,会引入与原始数据集之间的差异。首次提出了利用生成的图像辅助行人重识别的特征学习。 前几天英伟达开源了DG-Net的源码。让我们来回顾一下这篇CVPR19 Oral的论文。 论文是英伟达(NVIDIA), 悉尼科技大学(UTS), 澳大利亚国立...

    Hanks10100 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<