资讯专栏INFORMATION COLUMN

上云采购季！| 2核2G4M爆款云服务器低至59元/年，更有多台、长期优惠，快来选购！

立即前往

首页/文章专栏/雅虎开源首个色情图像检测深度学习解决方案

雅虎开源首个色情图像检测深度学习解决方案

saucxs 发布于2019-04-25 18:06 / 3021人阅读

摘要：雅虎开源了一个进行色情图像检测的深度学习解决方案。卷积神经网络架构和权衡近年来，卷积神经网络已经在图像分类问题中取得了巨大成功。自年以来，新的卷积神经网络架构一直在不断改进标准分类挑战的精度。

雅虎开源了一个进行色情图像检测的深度学习解决方案。据文章介绍，这可能是较早的识别 NSFW 图像的开源模型。

开源地址：https://github.com/yahoo/open_nsfw

自动识别一张对工作做来说并不适合/不保险的图像（Not Suitable/Safe For Work - NSFW）——包括暴力图像和成人图像——是研究者们几十年来一直在试图解决的重要问题。由于当下图像与用户生成的内容主宰了互联网，过滤 NSFW 图像成为网页应用和移动应用的一个重要组成部分。

随着计算机视觉、改进的训练数据和深度学习算法的发展，计算机现在能够以更高的精度来自动分类 NSFW 图像内容。

NSFW 素材的定义是主观的，而识别这些图像的任务并非没有价值。此外，在某一语境下使人反感的东西却可以适合于另一语境。为此，我们下文所描述的模型只侧重于一种 NSFW 内容：色情图像。NSFW 简笔图、漫画、文字、写实暴力图像或其他不当内容的识别解决方案不适用于此模型。

据我们目前所知，还没有用以识别 NSFW 图像的开源模型或算法。秉承合作精神并怀揣推进这一努力的希望，我们发布了自己的深度学习模型，它能让开发者使用一个 NSFW 检测分类器来进行实验，同时向我们提供反馈以改善分类器的性能。

我们的通用 Caffe 深度神经网络模型（general purpose Caffe deep neural network model）以图像作为输入并输出一个概率（即一个介于 0 和 1 之间的数字），可用于检测和过滤 NSFW 图像。开发者可以针对具体使用情况来用这个概率过滤掉 ROC 曲线上低于某个适当阈值的图像，或用在搜索结果中进行图像排名。

卷积神经网络架构和权衡

近年来，卷积神经网络已经在图像分类问题中取得了巨大成功。自 2012 年以来，新的卷积神经网络架构一直在不断改进标准 ImageNet 分类挑战的精度。一些主要突破包括了 AlexNet（2012）、GoogLeNet、VGG（2013）和残差网络（Residual Networks）（2015）。

这些网络在运行时间、内存需求和准确性方面有不同的权衡。运行时间和内存需求的主要指标是：

Flops 或连接——一个神经网络中的连接数量决定了向前传播过程之中的计算操作数量，这与图像识别时的网络运行时间成比例。

参数——一个神经网络中的参数数量决定了加载网络所需的内存量。

理想情况下，我们希望一个网络拥有最少的 flops 和最少的参数，而达到较大精度。

训练用于 NSFW 识别的深度网络

我们使用一个包含正（即 NSFW）图像和负（即 SFW-suitable/safe for work）图像的数据集来训练模型。

由于数据属性的问题，我们没有发布训练图像或其他细节，但我们开源了可用于开发者独立进行分类的输出模型。

我们使用 Caffe 深度学习库（Caffe deep learning library）和 CaffeOnSpark；后者是一个用于分布式学习的强大开源框架，令你可以在 Hadoop 和 Spark 模型训练集群中使用 Caffe 深度学习。

在训练过程中，图像被重新调整到 256x256 像素，水平翻转进行数据增强，并被随机裁剪为 224x224 像素，然后送入网络。在训练残差网络时，我们使用了 ResNet 论文中所描述的规模增大（scale augmentation）来避免过度拟合。我们评估各种架构来找到运行时间和精度之间的权衡。

MS_CTC——这种架构是由微软限制时间成本的那篇论文提出。它在卷积层和全连接层相结合的速度和精度方面秒杀了 AlexNet。

Squeezenet——这种架构提出了 fire 模块——包含层挤压，然后扩大输入数据团。这有助于节省参数数量，使 Imagenet 的精度与 AlexNet 的一样好，尽管内存需求仅为 6MB。

VGG——这种架构有 13 层卷积层和 3 层 FC 层。

GoogLeNet——GoogLeNet 提出了 Inception 模块并拥有 20 个卷积层阶段。它还在中间层中使用 hanging loss functions 来解决深度网络中的梯度递减问题。

ResNet——ResNet 使用快捷连接来解决梯度递减问题。我们使用了作者所发布的 50 层的残差网络。

ResNet-thin——该模型是使用我们的 pynetbuilder 工具生成，并复制了残差网络论文中的 50 层网络（每层过滤器的半数）。你可以在这里（https://github.com/jay-mahadeokar/pynetbuilder/tree/master/models/imagenet）找到更多有关如何生成和训练模型的细节。

不同架构之间的权衡：精度 vs（网络中的）flops 数量 vs（网络中的）参数数量。

深度模型首次在 ImageNet 1000 类数据集上进行预训练。我们将每个网络的最后一层（FC1000）更换为 2 节点的全连接层。然后我们精调 NSFW 数据集中的权重。注意我们让与最后的 FC 层相乘的学习率是精调后的其他层的 5 倍。我们还调整了超参数（hyper parameters）（步长、基本学习率）以优化性能。

我们观察到，NSFW 分类任务的模型性能与 ImageNet 分类任务中的预训练模型性能有关，所以如果我们有一个更好的预训练模型，它将有助于精调分类任务。下面的图表显示了我们所提出的 NSFW 评估集合的相对性能。请注意，图中的假正率（FPR）和一个固定的假负率（FNR）所针对的是我们的评估数据，在这里作说明用。要用该模型进行 NSFW 过滤的话，我们建议你们使用自己的数据来绘制 ROC 曲线并挑选一个合适的阈值。

在 Imagenet 上的模型与在 NSFW 数据集上精调的模型的性能比较

我们发布了 thin ResNet 50 模型，因为它在准确度方面做了很好的折中，并且该模型在运行时间（CPU 上运行时间 < 0.5 秒）和内存（~ 23 MB）方面体量轻巧。请参阅我们的 Git 库来查看我们的模型指令和用法。我们鼓励开发者尝试将此模型用于 NSFW 过滤的情况。如有任何关于模型性能的问题或反馈，我们都会支持并尽快回复。

结果可以通过在你的数据集上精调模型来改进。如果你改善了性能或者训练了一个使用不同架构的 NSFW 模型，我们都鼓励那么为模型贡献出力或将链接分享到我们的描述页面。

欢迎加入本站公开兴趣群

商业智能与数据分析群

兴趣范围包括各种让数据产生价值的办法，实际应用案例分享与讨论，分析工具，ETL工具，数据仓库，数据挖掘工具，报表系统等全方位知识

QQ群：81035754

云服务器 GPU云服务器深度学习色情图像识别深度学习图像识别深度学习用于图像识别深度学习与图像识别

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/4417.html

相关文章

从人工智能鉴黄模型，尝试TensorRT优化

摘要：没有显卡也没有关系，可以看看我前面发布的两篇文章谷歌云计算平台，免费又好用上安装本文采用的深度学习模型是雅虎开源的深度学习色情图片检测模型，这里的代表，该项目基于框架。你还可以读利用人工智能检测色情图片谷歌云计算平台，免费又好用上安装随着互联网的快速发展，越来越多的图片和视频出现在网络，特别是UCG产品，激发人们上传图片和视频的热情，比如微信每天上传的图片就高达10亿多张。每个人都可以上传，...

LinkedME2016 2019-05-23 17:29 评论0 收藏0
如何通过人工智能“避开”内容安全的“坑”？

摘要：人工智能技术的初步应用随着网络强国战略思想加强网络内容建设等指导思想的推出和强化，内容安全已经成为互联网企业生存和发展的生命线。欢迎访问网易云社区，了解更多网易技术产品运营经验。 10月16日，2018年 AIIA人工智能开发者大会在苏州举办。会议邀请了国内外人工智能产业知名人物、国家政府主管部门、行业内顶尖企业、知名学者代表、开源社区优秀贡献团队及个人，共同交流了技术现状趋势、生态...

_DangJin 2019-06-28 10:59 评论0 收藏0
9 个超酷的深度学习案例

摘要：而使用某些特定的表示方法更容易从实例中学习任务例如，人脸识别或面部表情识别。维基百科关于深度学习的应用，网上有非常多的出色案例，伯乐在线在本文摘录个。深度学习是机器学习中一种基于对数据进行表征学习的方法。观测值（例如一幅图像）可以使用多种方式来表示，如每个像素强度值的向量，或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务（例如，人脸识别或面部表情...

leeon 2019-04-25 18:10 评论0 收藏0
阿里巴巴直播内容风险防控中的AI力量

摘要：阿里巴巴集团安全部今年在直播管控中的特色在于大量采用人工智能和深度学习等技术，配合优化后的高性能多媒体计算集群，大幅度降低人工审核成本的同时，提升了对内容风险的防控能力。阿里巴巴直播内容风险防控中的AI力量直播作为近来新兴的互动形态和今年阿里巴巴双十一的一大亮点，其内容风险监控是一个全新的课题，技术的挑战非常大，管控难点主要包括业界缺乏成熟方案和标准、主播行为、直播内容不可控、峰值...

lvzishen 2019-06-21 16:32 评论0 收藏0

发表评论

登陆后可评论

0条评论

saucxs

男|高级讲师

我要关注我要私信

TA的文章

阅读更多

V5 Server：香港、韩国、台湾独立服务器7折优惠，香港BGP服务器月付低至325元

阅读 2558·2021-09-01 10:41
css实现文本溢出隱藏

阅读 1489·2019-08-30 14:12
css 命名分类排序方法

阅读 564·2019-08-29 12:32
彻底弄懂css中单位px和em,rem的区别

阅读 2904·2019-08-29 12:25
php爬虫：知乎用户数据爬取和分析

阅读 2987·2019-08-28 18:30
js设计模式 --- 外观设计模式

阅读 1755·2019-08-26 11:47
查找vue文件中未使用的data中数据

阅读 1043·2019-08-26 10:35
Vue 改变数据，页面不刷新的问题

阅读 2660·2019-08-23 18:06

最新活动

阅读需要支付1元查看

<