摘要:本人旨在让你了解当前人工智能应用最普遍的智能推荐引擎,其背后的设计理念,以及一些更深度的思考。传统的智能推荐引擎对用户进行多维度的数据采集数据过滤数据分析,然后建模,而人工智能时代的推荐引擎在建立模型步骤中加入训练测试验证。
We shape our tools and afterwards our tools shape us. ------Marshall McLuhan
麦克卢汉说:“我们塑造了工具,反过来工具也在塑造我们。”
我本人不反感AI,也相信人工智能会开创一个伟大的时代,但是我们要思考一些东西,至少知道那是什么。本人旨在让你了解当前人工智能应用最普遍的智能推荐引擎(Intelligent Recommendation Engine),其背后的设计理念,以及一些更深度的思考。关于理念,它不像技术要求太多的基础,我尽量不使用专业术语,所以本文同样适合程序员以外群体。
从“分类”说起以大家熟悉的分类信息网为例,像58同城、赶集网。网站把现实生活中的商品、服务进行分类进行展示,比如房产、二手车、家政服务等。这些内容即是现实世界对应的抽象,我们可以很容易的找到对应关系。
我们再以求职网站为例,像智联招聘、BOSS直聘。网站按照职业把 人分类,比如程序员、厨师、设计师、数学家、物理学家等。
那么现在问题出现了,众所周知,人工智能的完美入门人才是具有数学和计算机双学位的硕士以上学历人才。那么,我们如何把这样的人分类呢?我们无法单一的将其归入到程序员或者数学家,我们无法为每一个这样的复合型人(slash)进行多带带分类。
分类产生矛盾。
我们区分南方人、北方人,所以有地域歧视。我们区分亚洲人、欧洲人,所以有种族歧视。“分类”只是人类简化问题逻辑的手段,薛定谔的猫和罗素的理发师已经证明了“分类”并不正确。所以在大计算时代,我们引入“贴标签”的概念。
贴标签AI时代是计算能力爆炸增长所带来的。在强大的计算能力面前,我们真的可以针对每个人进行“分类”,它的表现形式就是---贴标签。
30岁以下、程序员、屌丝、奶爸、熬夜、不爱运动、公众号叫caiyongji、格子衬衫、机械键盘、牛仔裤……这些可以是一个程序员的标签。换个角度,“类别”反转过来服务于多带带的某个人,这是在计算能力短缺的时代所无法想象的。
传统的智能推荐引擎对用户进行多维度的数据采集、数据过滤、数据分析,然后建模,而人工智能时代的推荐引擎在建立模型步骤中加入Training the models(训练、测试、验证)。
最后,推荐引擎就可以根据用户标签的权重(可以理解为对标签的打分,表示侧重点),对用户进行精准推送了。
推荐引擎属性分化俗话是这么说的“旱的旱死,涝的涝死”,“饱汉子不知饿汉子饥”,不知道这些俗语我用的恰当不恰当。我的意思是在智能引擎的推荐下,会加强属性两极分化。
我们以程序员为例,选取编程技巧、打游戏、体育运动、熬夜、看书五个维度。经过推荐引擎的“塑造”后如下。
目前,推荐引擎的算法会将权重比较大的标签进行优先推广,这就导致原本权重大的标签得到更多的曝光次数,最终使得权重大的标签权重越来越大,而权重小的标签在长时间的被忽略状态下逐渐趋近于零。
推荐引擎行为引导波兹曼认为,媒体能够以一种隐蔽却强大的暗示力量来“定义现实世界”。其中媒体的形式极为重要,因为特定的形式会偏好某种特殊的内容,最终会塑造整个文化的特征。这就是所谓“媒体即隐喻”的主要涵义。
由于“推荐”机制的属性分化,那些高技术含量的、专业的、科学的、真正对人又帮助的信息被更少的人接触,而那些简单的、轻松的、娱乐的、裸露的、粗俗的信息被越来越多的人接触。
我们看一下具有影响力的百度、今日头条和微博在今天(2018年1月13日10:04:xx)所推荐的内容。我删除了cookie,使用匿名session,移除我的“标签”。也就是说,下图所推荐内容对大部分人适用。
只要你好奇点击,你的tittytainment(我翻译成“愚乐”,那个三俗的译法不要再传了)属性权重就会越来越大。娱乐新闻点击过百万,科普文章点击不过百,这种现象正是推荐引擎的行为引导导致的。
不客气的说,百度、今日头条、微博对国民素质的影响是有责任的。
无关推荐(Non Relational Recommendation)对于你从来都没思考过的事物,你可能永远都接触不到,因为你不知道求索的路径,所以有的人每个月都读与自己专业无关的书,来扩展自己的知识面。我们举个例子:
你可能会在网上搜索如何与女朋友和谐相处但你未必会搜索如何让女朋友们和谐相处,有人笑谈“贫穷限制了我的想象力”,其实不然,是你接收不到无关的推荐,你才被限制在特定的知识圈子里。
所以我提出无关推荐这个概念。
对程序员进行画像:
如图,当某个标签没有到达“程序员”的路径时,他可能永远无法触及那个标签。这时,我们推荐“无关”信息给用户,强制产生路径。
你可能会质疑,这是随机强制推荐垃圾信息吗?
其实不然,通过深度学习,我们可以进行大量的数据收集、数据分析和模型训练,我们是可以找到对某个个体无关,但会让其感兴趣信息的兴趣点。这种信息就是无关推荐的解。
最后你每天接收到的“推荐”背后是各个团队经过心理学研究、行为学研究、大量计算设计的,人们正在失去深度思考、自主判断的能力。对于进步青年、斜杠青年请保持思考。谨以此文献给希望进步的你,希望你有所收获和思考。
本文欢迎注明出处的转载,但微信转载请联系公众号: caiyongji进行授权转载。
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/19700.html
摘要:当我的妻子在年前怀孕时,我们进行了超声波检查。她进一步告诉我们,他们可以通过羊膜穿刺术查看胎儿实际上是否具有唐氏综合征的基因改变。但是羊膜穿刺术风险很大,在手术中杀死胎儿的风险大约为。 摘要: Michael Jordan认真的解读当下的AI到底是什么? showImg(https://segmentfault.com/img/bV9MT1?w=800&h=499); 人工智能(AI)...
摘要:华为的这种底气正来自于其技术能力的塑造和强健。而华为云正是遗传了华为的这种气质,才能在成立仅一年多的时间里实现飞跃式的发展。华为云不仅继承了华为的气质,还将这种气质不断发扬光大。三十功名尘与土,一朝入云胆气生!从1987年2万元起家,到2017年销售收入突破6000亿元,华为三十年的奋斗与拼搏、积累与沉淀,终于厚积薄发。2017年,华为云正式入场,它要像AWS那样开创一个新的产业。华为云的气...
摘要:就在国际六一儿童节这天,正式推出基于深度学习技术的文本识别人工智能搜索引擎,一款可以满足你上述想象的智能产品。在笔者看来,的本质正是人工智能时代的搜索引擎。不难发现,搜索引擎植入已经成为行业的新态势。 文本是Facebook用户更为常见的交流方式,想象一下,如果有一款产品能够随时随地理解Facebook用户交流时的文本信息,理解用户表面或潜在的需求,在用户还没展开搜索的情况下就及时自动提供用...
摘要:百度云智峰会召开。百度云发布,与百度大脑的最新迭代版本共同构成百度。作为新的增长极,百度云补完了百度长期商业版图中缺乏的环,与共同构成了百度这座火箭的核心引擎。2018 ABC SUMMIT百度云智峰会召开。百度云发布ABC3.0,与百度大脑、Apollo、DuerOS的最新迭代版本共同构成百度AI3.0。压轴出场的百度云ABC3.0向人们展现了引领智能变革的雄心。事实上,云计算正成为企业战...
摘要:公司和谷歌公司也发布了类似的声明。持久性存储器英特尔公司最近宣布推出持久性存储器,它看起来像标准内存,但可以存储级数据,甚至可以在电源中断时保留数据。人们经常会看到一些科技行业炒作周期的兴衰,其中包括网络时代、云计算、大数据,以及最近的人工智能(AI)和区块链的出现。回顾过去,很明显这些重大变化中的每一个都是附加的,或者在某种程度上与之前发生的技术颠覆有关。例如,如果没有大数据,人工智能就不...
阅读 3490·2019-08-30 15:53
阅读 3405·2019-08-29 16:54
阅读 2189·2019-08-29 16:41
阅读 2396·2019-08-23 16:10
阅读 3376·2019-08-23 15:04
阅读 1341·2019-08-23 13:58
阅读 347·2019-08-23 11:40
阅读 2451·2019-08-23 10:26