摘要:从数学博士到阿里云工程师,夏分一直学以致用。入职后的第个月,夏分接手了第一个项目,用工业大脑帮一家风电企业提前预测风电机组故障。一个万千瓦的风电场,平均每年维护费用高达万元,还会以平均的速率逐年递增。
从数学博士到阿里云工程师,夏分一直学以致用。加入阿里云接手的第一个ET工业大脑项目,因为数据传输问题丢失大量数据,导致机器误判拉响警报,这让他意识到自己不能只坐在电脑前做“码农”,也要下到车间做实地考察。
然而,之后夏分参与的项目是一家有32年历史的毛纺企业,从订单到配色、染毛、混毛,到纺线、织布和成衣,没有一套完整的数据采集系统。车间主任“迷信”人工智能和机器算法,在没有数据的情况下提出一系列“无解”要求,夏分利用数学思维将其一一解决。
虚惊一场的教训
从本科到博士,夏分在浙江大学研究了10年数学,毕业后一度从事人工智能辅助医疗方面的研究,却因为缺乏结构化数据陷入瓶颈。刚好,有人推荐他去阿里云,抱着“医疗是民生,工业是战略”的想法,夏分于2017年7月加入阿里云,成为一名算法工程师,也是第一代车间程序员。
入职后的第4个月,夏分接手了第一个项目,用ET工业大脑帮一家风电企业提前预测风电机组故障。
夏分
由于无法实时掌握工作状态,传统风电机组维护,通常都是在故障发生后亡羊补牢,维修费用高,维修周期长,还会影响生产的连续性。
一个5万千瓦的风电场,平均每年维护费用高达300万元,还会以平均3%的速率逐年递增。而这家风电企业拥有10个风电场、500多台风电机组,维护成本带来的压力可想而知。
就像一个人生病,病情发展有迹可循,如果能提早发现,提前干预,就能阻止病情恶化,节省医疗成本。而对风电机组来说,一个核心健康指标是温度,长期高速运转下,部件老化导致摩擦碰撞,就会产生不必要的热能,但有些时候,没有机械故障也会引起部件发热,怎么样才能在不放过故障的同时,做到不误报、减少风电场工程师工作量?
工程师爬上几十层楼高的风电机,为两台验证机组装上数十组温度传感器,在运转中源源不断地采集温度数据,夏分则在杭州的办公室里,实时监控并分析着数千里之外的数据。积累到上亿条温度数据后,夏分建立机器学习模型,希望能提前识别风电机组运行异常并预警。
一次,机器检测出的温度数值与模型预估的相差20多度,这让夏分有点不知所措,“温度过高将导致风电机组无法正常运作,这可不是个小问题。”远在新疆吐鲁番的工程师接到警报后,赶紧查看了“异常”风电机组测点的温度数据,却发现完全正常。那么,是网络传输不稳定?还是传感器故障或老化影响了数据的采集?夏分在脑海中推理着各种原因,不相信自己的算法会出错。
“怎么会只有1%的数据?”紧张排查几个小时,原因找到了,风电场出现严重的数据缺失,大量数据未同步上传,导致机器学习的并不是完整数据。
最终,ET工业大脑做到能提前2周识别风电机组潜在故障,大修变小修,单次重大事件维护成本降低20-40万元。夏分却意识到,要将前沿科技真正带入工厂,光靠在电脑前码出一套算法还不够,必须去实地考察真实情况。
毛纺企业的配色难
今年四月,夏分接到又一个项目需求——一家国内毛纺行业的龙头企业,希望借助ET工业大脑,来提高配色的效率。毛纺行业,染色质量是衡量呢绒产品质量的金标准,而染色的关键,在于染料配方的准确程度。
夏分一头扎进毛纺企业的混合羊毛车间。车间里闷热潮湿,羊毛和化学溶剂的味道混在一起,钻进鼻子令人犯呕,轰隆作响的混毛机器旁,放着一个个一米多高的白色塑料桶,里面塞着不同颜色的羊毛。
纺织车间
这一次,客户来样是蓝色。试验台前坐着二三十名工艺员,他们从一缸染好颜色的羊毛中,撕取一小撮大概15厘米长、5厘米直径的羊毛小样,人工梳毛后,拿着小样去称量,然后通过美国进口的datacolor测色仪,检测染色结果是否与客户要求一致。
验色结果不尽人意,颜色严重偏紫,红色太多。第二次配色,又偏绿了,黄色太多。工艺员把第一缸和第二缸的羊毛倒入混毛机,充分混匀后,再撕取一撮上机器测色,若不正确,就再重复一次。
成检车间
“还是很原始的方式。”夏分从老师傅口中得知,从拿到订单指令到完成配色,至少要一周时间,老师傅一般5次左右便可配色成功,而新人7次8次都未必能成功。染料配方频繁调整,生产周期随之拉长,库存积压还是小事,倘若色光不符合客户来样,能不能顺利交货都是问题。
夏分琢磨着,建立模型导入数据,让机器学习染料配方,再将老师傅总结出的经验,通过机器算法来学习,几次推荐出符合来样的染料配方易如反掌。夏分正想得出神,车间主任突然来了一句“我们没有数据”……
想要数据得先洗脑
数据,其实是有一些的。比如每次配色成功,工艺员都会详细记录染料配方和混色数据,只是没有数字量化最终配出的颜色,而是保存了实物样本。每次拿到客户来样,工艺员就拿出以前做过的实物样本对比,找出色光最接近的方案,不断调整测试。
可是经验丰富的工艺员都知道,哪怕配的是之前配过的同一种颜色,按照历史记录配出的颜色,也会因为车间环境温度湿度的变化而发生细微偏差,而染料员稍偷点懒,30分钟的染色时间缩短到26分钟,就会直接影响染料在羊毛上的附着力。而这些有可能导致配色失败的因素,都没有以数据的方式留存下来。
企业的IT员工,其实早就认识到数据生成和数据采集的短板,一直在向车间主任推荐数据的功效,可是对方的回答永远是“大家都那么忙,哪有空做这个?”
对于ET工业大脑,车间主任倒是寄予厚望,见到夏分就说,“人工智能嘛,你们阿里云就是很厉害,没有数据你们也应该能做出来。”
“没有数据不行?那你们就估计一个数据出来。”车间主任甚至提出,希望通过算法,自动填补缺失的空白数据。
“这根本就是悖论嘛。”夏分抿了抿嘴,车间主任“神化”了人工智能和机器算法,给他提出一个大难题。
两次见面沟通,一次电话会议,夏分只要逮到机会,就给车间主任灌输“要采集数据”的观念。到了5月底,IT人员发来了专门采集的数据,夏分如释重负。
目标节省两成人力
从车间回到办公室,夏分坐在电脑前,在网上搜索起契合业务背景的论文。
《基于共轭梯度法的纱线染色配方预测优化算法》,外行人读个题目都费劲的论文,夏分抱起来就啃。从中午吃完饭到零点睡觉前,从一开始的三四篇论文再到引申出的10余篇参考文献,夏分一边仔细研读,一边做笔记标注,仿佛回到读研读博的时光。
既然目前车间工作流的操作无碍,就把不稳定的因素暂放一旁,只要减少配色的尝试次数,在一定程度上就是节省工作量,夏分理清了思路,“我们要做的就是找到一个平衡点,提高算法的准确率,从而减少他们的工作流和人力。”
“收集历史配方数据,列出用了哪个工厂的染料,哪几种颜色,比例分别是多少,染色出来的颜色是什么……”夏分给车间主任开出了数据采集要求,在配色染色的每一个步骤都加上了使用数值化记录的环节。
毛纺企业目前有几十类配方,而机器学习一类配方大概需要上百条数据,只要拥有数据,夏分很快就能完成数据清洗,特征构造,特征筛选,模型筛选,参数调优等建模步骤。
结合前期试验和算法模型,夏分设想,首次推荐配方的成功率只有60%,二次推荐的成功率是84%,三次推荐的成功率则在90%以上,可以节省20%的人力,现在就只差实践验证。
“分析、比较、判断,其实都是数学中的逻辑思维。”夏分笑着说,自己跟数学早已难舍难分。
本文作者:王安忆
阅读原文
本文来自云栖社区合作伙伴“天下网商”,如需转载请联系原作者。
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/19811.html
摘要:云计算分论坛上,华为公司企业云业务部副总裁张怀东阿里云计算有限公司副总裁杨名全球副总裁中国客户创新中心总经理苏柯玛发表演讲,分别阐述了三家巨头公司在云计算上的战略方向。今年三月份深圳云栖大会阿里云发布了医疗大脑。2017年6月15日,以新IT,新生态,新动能为主题,由国家商务部、科技部、中国贸促会和辽宁省人民政府共同主办,大连市人民政府和中国服务贸易协会承办的第十五届中国软交会在大连世界博览...
摘要:去年月,阿里云宣布将设立阿里云广东研发中心,招募名云计算和人工智能工程师,推动前沿技术与广东产业融合。吴维刚表示,人工智能与云计算,两者不是同一事物,但是相互发展。近年来,随着互联网和移动互联网的蓬勃发展,大数据、云计算、人工智能、物联网等新技术也迎来了广阔的发展空间。去年,阿里云工业互联网全国总部正式在广州揭牌成立,阿里云将联合广东本地合作伙伴,共同打造服务全国的工业大脑。去年9月,华为与...
摘要:日前,因他为衢州城市大脑所作出的贡献,被授予衢州市荣誉市民称号。城市大脑提出初期,质疑声一片。城市大脑上线后,得到客户明确的认可时,华先胜感慨万分。 9月19日杭州云栖大会上,阿里云正式发布了杭州城市大脑2.0,城市大脑已成为杭州新的基础设施,一年管辖范围扩大28倍。 杭州市公安局局长金志表示:‘城市大脑’的尝试,让我们看到了云计算与大数据在城市管理上的巨大能量和广阔前景。阿里巴巴集团...
摘要:日前,因他为衢州城市大脑所作出的贡献,被授予衢州市荣誉市民称号。城市大脑提出初期,质疑声一片。城市大脑上线后,得到客户明确的认可时,华先胜感慨万分。 9月19日杭州云栖大会上,阿里云正式发布了杭州城市大脑2.0,城市大脑已成为杭州新的基础设施,一年管辖范围扩大28倍。 杭州市公安局局长金志表示:‘城市大脑’的尝试,让我们看到了云计算与大数据在城市管理上的巨大能量和广阔前景。阿里巴巴集团...
阅读 2450·2023-04-26 02:47
阅读 2965·2023-04-26 00:42
阅读 845·2021-10-12 10:12
阅读 1343·2021-09-29 09:35
阅读 1652·2021-09-26 09:55
阅读 425·2019-08-30 14:00
阅读 1511·2019-08-29 12:57
阅读 2332·2019-08-28 18:00