摘要:不同平台的不同表情和雅虎视觉与机器学习团队测试了三种不同的方法算法,一种快速线性分类器算法,一种循环神经网络架构算法,一种平衡性能与复杂性的卷积网络。雅虎不是将机器学习应用于的公司。
周末想在Netflix看场电影?可能,你选择观看的电影正受到来自Netflix复杂的AI算法的影响。同理,由深度学习驱动的预测技术,将越来越便捷地决定你喜欢吃什么、穿什么。
而作为消费型科技公司,Netflix、Yelp、Yahoo、StitchFix这4家公司正在利用AI技术改变用户体验。
Netflix:动态个性化布局与视频缩略图
从观看传统上来讲,看电视是一个单向的通信方式——观众观看到的内容是制作者单向传递的,但观众不向内容制作者提供反馈。借助数字流媒体技术,观众的观看记录、鼠标(手指)点击,以及检索词,都可以让Netflix了解观众的偏好设置,并提供更多相关的内容。
2009年,Netflix在公开赛中为外部的编程团队授予了100万美元的Netflix奖,以改进公司的内部评级预测系统。该获胜队伍打败了原有的算法,效果提高超过10%。
Tony Jebara
从那时起,Netflix引入了更多先进的机器学习算法,让Netflix在排名、布局、目录、会员等各个方面,实现全新的预测,并提高个性化水平。今年年初,Netflix公司董事、哥伦比亚计算机科学系教授Tony Jebara在旧金山的RE•WORK深度学习峰会(RE•WORK Deep Learning Summit in San Francisco)上曾解释说,Netflix不仅可以给用户推荐更好的电影,而且为每个用户预测出更好的缩略图图像。
图片来源:Netflix
一般来说,优化网站上的图像需要在一段时间内测试A / B两种替代方案。这种方法的问题是,用户必须痛苦地等待系统收集数据,之后才能完成较佳决策。在此期间,网站的部分受众群体会经历测试过程的非最优变量。这种体验的丧失被称为“regret”。
图片作者:Tony Jebara
为了较大限度地减少regret,Netflix采用动态自适应测试法,比如多臂老虎机(multi-arm bandit)模型。这种模型能够在测试期间,动态地将流量转移为展示较好的广告素材,并在数学上减少regret。
什么算是“更好”呢?每个人不尽相同,所以Netflix也将用户的消费情况纳入,以执行个性化的探索/开发优化。如果你经常看喜剧,Netflix将使用罗宾•威廉姆斯的电影《心灵捕手》的封面。如果用户喜欢浪漫的言情片,Netflix则会把电影中马特•达蒙和明妮•德瑞弗接吻的照片推送给用户。
Yelp使所有地点展示最美丽的照片
一张图片胜过千言万语。为了帮助用户做出正确的餐厅选择,Yelp的Alex Miller和他的团队采用深度学习算法,用来展示最美的用户照片。
虽然指标(比如喜欢次数和点击次数)可用于评估照片,但它们也可能因偶然事件出错。更好的解决方案是,基于固有的内容和特征(例如景深,对比度和对准)来判断照片,但是每天有2500万MAU(每月活跃用户)给Yelp上传成千上万张照片,没有人能干得了这些工作。
2017年1月27日,在旧金山举行的Startup ML会议上,Miller介绍了他的工程团队如何使用CNN(卷积神经网络)建立一个图像评分模型。对于照片是不是好的标准可以是,这张照片是不是用单反拍的,这只需要检测EXIF元数据就行了。
Miller的团队利用它创建出可扩展的训练数据集,使用单反图像作为正例,而非单反图像作为负例。深度学习算法从训练数据集中学习了好的照片的质量,并且可以将这些学习应用于所有照片,无论是否是使用单反相机拍摄的。
除了照片质量得分,团队还添加了过滤器和多元化逻辑,这样,当你查看以某一菜或特色闻名的餐馆时,前10张照片不会都是同一主题。
事实胜于雄辩,我们来看看图片查看结果:
上图是旧版本,下图是版本
雅虎确保用户在任何情况
可以选择较好的表情符号
对于不爱打字的人来说,emoji是最简单的方法。但是,emoji目前有超过1800种表情符号可供选择,那么,用户怎么能确定选择最完美的那个呢?
雅虎的机器学习工程师Stacey Svetlichnaya就在解决这些问题。当用户撰写或回复消息时,自动填充建议中应显示哪些表情呢?理想情况下,用户希望可以给出前五个表情符号来选择。
使用表情符号是高度动态的。一些用于替换图像,还有的用于表达情感……
另一个挑战是emoji在不同平台的视觉风格迥然不同,容易造成误解。
不同平台的不同emoji表情
Svetlichnaya和雅虎视觉与机器学习团队(Yahoo Vision & Machine Learning Team)测试了三种不同的方法:
FastText算法,一种快速线性分类器;
LSTM算法,一种循环神经网络架构;
WordCNN算法,一种平衡性能与复杂性的卷积网络。
当然,三者之中,FastText不出意外地成为了速度的胜利者,但人们似乎更喜欢LSTM的结果。
雅虎不是将机器学习应用于emoji的公司。2015年,InstagramEngineering刊发了一套由工程师Thomas Dimson撰写的系列——Emojineering:机器学习表情符号趋势。
系列文章地址:
https://engineering.instagram.com/emojineering-part-1-machine-learning-for-emoji-trendsmachine-learning-for-emoji-trends-7f5f9cb979ad#.wppfkra4e
StitchFix更快地找到最适合你的时尚
时尚是件很难的事,但StitchFix使造型这件事变得很轻松。这家个性化造型创业公司使用户可以个性化风格,并且每月将精选的服装和配件送上家门。
定义风格可能是模糊的。毕竟,用户怎么能知道一件衬衫是否复古,或者一件衣服是否“性感”但又不显得“太放荡”。
Christopher Moody
Moody是StitchFix的数据科学家,拥有统计学、天体物理学和计算机学的多学科学术背景。事实证明,“书呆子”的学术技能在时尚界是大有可为的。
许多深度学习模型是“黑匣子”,用户很难理解为什么算法得出特定的结论。Moody的研究集中于提高模型可解释性,使人类专家能够对算法的相对性能提供反馈。
一种方法是使用t-SNE(t分布的随机相邻嵌入),一种有助于降低可视化相似对象的维数的方法。许多深度学习模型使用人类不可能概念化的高维数据,维数减少方法将复杂的数据变成更易于理解的二维或三维散点图。
Moody也是k-SVD方法的狂热者。 k-SVD是k均值聚类方法的泛化。在高级非技术术语中,聚类分析指将具有类似属性的对象分组在一起。一旦已经识别出不同的集群,人类专家可以检查组合,以查看它们是否表现出任何统一的特征,并添加适当的标签,例如“背心”。
图片作者:Christopher Moody
欢迎加入本站公开兴趣群商业智能与数据分析群
兴趣范围包括各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识
QQ群:81035754
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/4471.html
摘要:结果,我们当时非常抱以厚望的就是卷积神经网络模型,或者说是。单反相机可以让摄影师调节透镜类型和光圈大小,更好地控制把相片里的哪个部分作为焦点。更进一步,单反相机的传感器更大,对光线更敏感,即使在非常昏暗的环境下也可以拍出非常漂亮的相片。 Yelp的数据库中已经存储了几千万张相片,用户们现在每天都会上传大概十万张,而且速度还在不断加快。事实上,我们发现相片的上传增长率大于相片的查看率。这些相片...
摘要:构建一个照片分类器对于理解照片中的模棱两可的目标,其实有许多不同的方式。如果决定进一步集成依赖于其它信号的新的分类器,这将让问题变得更加简单。该架构如下图所示对于每一个新的分类器,扫描所有的照片,并且将分类结果存储在一个数据库中。 Yelp是美国较大点评网站,拥有世界各地的Yelper上传的成千上万的照片。各种各样的照片给进入当地的商业提供了一个丰富的窗口。通过开发一个照片理解系统使Yelp...
摘要:云计算革的命性不仅仅是针对企业,同时也影响着我们的日常生活。因此云计算正在改善着我们的生活,或至少在某些方面改变着我们的生活。所以组织和企业为提升发展速度将拥抱云计算,以保持竞争力,这甚至可能使自身企业成为市场的领导者。 在过去的十年中,计算机趋势像互联网与全球化趋势转变。这使得世界各地的人们,通过匿名聊天室和网上论坛等方式进行互动。而现在随着社交网络的普 及,匿名正在慢慢消失。这是在社交方...
阅读 2953·2021-09-23 11:32
阅读 2920·2021-09-22 15:12
阅读 1709·2019-08-30 14:07
阅读 3449·2019-08-29 16:59
阅读 1641·2019-08-29 11:11
阅读 2309·2019-08-26 13:50
阅读 2427·2019-08-26 13:49
阅读 2623·2019-08-26 11:49