摘要:阿里云再次发生故障,这已是年的第二起。这场事故,持续了三个小时左右。针对故障,阿里云表示会根据协议服务合同,尽快处理赔偿事宜。十天前,阿里云今年的第一起事故被曝光。后来,阿里云就此事作出回应,并在网站醒目标识并给出告警。
阿里云再次发生故障,这已是2019年的第二起。
3月2日23时55分左右,阿里云开始出现大规模宕机故障,位于华北地区的多家互联网公司的IT运维人员发现多个APP和网站开始陷入卡顿。这场事故,持续了三个小时左右。经紧急排查处理后,3月3日早间云服务全部恢复正常。针对故障,阿里云表示会根据SLA协议(服务合同),尽快处理赔偿事宜。
十天前,阿里云今年的第一起事故被曝光。2月22日,有媒体报道了阿里云云效平台的源代码泄露问题,涉及40 家企业共 200 余项目,甚至还波及用户隐私敏感数据。此事还引起了“Internal之争”,即Internal权限到底是公司内部公开还是对整个云效平台公开,不同企业有不同理解,但最终还是造成了源码泄露。后来,阿里云就此事作出回应,并在网站醒目标识并给出告警。
事实上,阿里云源代码泄露问题在去年8月就已被用户发现,只是到今年2月份才被媒体曝出。
一
纵观近几年云计算发展,云计算事故就没有停止过。
不管是知名云计算厂商,还是刚上路的云计算初创企业,服务器中断以及客户数据丢失等问题,频频困扰着云计算企业。
2012年圣诞节前夕,亚马逊AWS的弹性负载均衡服务出错,导致Netflix停机。
2014年11月18日,由于软件更新及性能增加,微软zure存储服务发生大规模断电,这种情况在2015年12月再次发生。
2016年5月9日,Salesforce.com的硅谷NA14实例脱机,导致其断电超过24个小时。从那之后,Salesforce将其大部分工作量转移到了AWS上。
2016年10月21日,甲骨文旗下的DYN(DNS业务)遭遇了一系列分布式拒绝服务(DDoS)攻击,致使Airbnb、Twitter、 Amazon、Ancestry、 Netflix及PayPal等公司的业务均受到不同程度的影响。
二
即便云计算安全技术及防御设施不断进步,云计算故障仍旧时有发生。据不完全统计,单是2018年就有数十起云计算故障发生,涉及国内外各大知名云计算平台。其中比较有影响的,包括以下几个事故。
4月6日,微软Office 365和Azure Active Directory访问出现问题,几年来微软云计算出现多次此类故障。
6月15日,因重复分配内部IP地址,谷歌云虚拟机实例大量出现联不上网的问题。
6月27日,由于运维失误,导致一些客户访问阿里云官网控制台和使用部分产品功能时出现问题。受影响范围包括阿里云官网控制台,以及MQ、NAS、OSS等产品功能。这次故障被阿里云内部定义为S1级别(在阿里巴巴的线上业务故障级别中,对S1的定义是:核心业务重要功能不可用,影响部分用户,造成一定损失)。
7月24日,腾讯云广州区域部分用户出现资源访问失败、控制台登录异常等情况。经排查,是因腾讯云广州一区的主备两条运营商网络链路同时中断所导致。但业内人士均知,两条运营商网络链路同时被挖断的情况并不常见,所以对腾讯云这次事故的主要原因仍有存疑。
8月,腾讯云发生故障,直接导致北京的一家初创公司数据全部丢失。事实上,此事发生于7月,只是到8月才被曝光。
三
在2018年的云计算事故中,影响面比较广的当属腾讯云的两次故障事件。
第一个事件,正是上文提到的初创公司数据丢失事件。
2018年7月,北京一家主要产品为“前沿数控自媒体”初创公司,在腾讯云的存储数据全部丢失了。某个是时间段,前沿数控的程序员发现无法登录云服务器,就反馈给腾讯云。得到的回复是“北京三区部分云硬盘出现故障,正在紧急恢复中”。
几天后,腾讯云告知前沿数控,这些丢失的数据无法找回了。于是,双方开始赔偿协商。前沿数控索赔1101.6万元,而腾讯云只愿意赔偿13.29万,双方陷入僵持。
而此事之所以传播开去,是因为腾讯云承诺9个9(腾讯云承诺99.9999999%的数据可靠性)的安全保障,也没能保住前沿数控的数据,且不能给予客户认为合理的赔偿,进而引发了诸多云服务使用者的热烈讨论。最终舆论演变为,前沿数控在操作上存在失误,但腾讯云服务的可靠性到底又有多高?广告宣传又有多少真实的存在?
此事表明,即便云服务商给予再高的承诺,云服务使用者也应本着对数据服务的态度,数据一定要多云或者异地备份,不能完全依赖云服务商。否则,一但出现问题,就是赔偿的再多,之前的经营数据也是无法挽回,甚至足以毁掉一个项目。
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/6248.html
摘要:昨天凌晨,阿里云出现大规模故障,导致部分互联网公司和运行不畅,甚至瘫痪。阿里云表示,针对此次故障,将根据协议,尽快处理赔偿事宜,但并未公开详细的赔偿细节。事实上,这并非阿里云首次出现故障。由此可见,阿里云此次宕机事件影响程度着实不小。昨天凌晨,阿里云出现大规模故障,导致部分互联网公司和App运行不畅,甚至瘫痪。一时之间,阿里云官微下几乎被反馈宕机问题的留言攻陷,有网友调侃称,程序员、运营和运...
摘要:事故发生后,阿里云及时做了回应。玺哥认为,正在使用阿里云的许多大企业甚至中小企业,在考虑部署多云战略时,或将腾讯云列入优先考虑名单。3月3日凌晨,阿里云华北地区出现大规模宕机故障,多家互联网公司都遭到了服务突然中断的影响。事故发生后不久,阿里云官方凌晨回应称,华北2地域可用区C部分ECS服务器等实例出现IOHANG,经紧急排查处理后逐步恢复,此外将根据协议尽快赔偿。宕机,云服务商无法避免的事...
摘要:对此,阿里云官方回应称,宕机原因为,华北地域可用区部分服务器等实例出现,后经紧急排查处理后逐步恢复。这也意味着,在未来的云服务竞争中,云服务供应商的技术能力仍将是决胜关键。在多云战略时代,带领企业走出恐慌区,扩大学习区是关键。随着上云企业的越来越多,云服务宕机带来了潜在风险也越来越大。 昨天(3月3日)凌晨,没有任何征兆,阿里云出现大规模宕机故障,华北地区很多互联网公司都受波及,一大波...
摘要:对于后来者华为云中标国家税务总局大项目,阿里云曾公开表达质疑,并投诉认为华为涉嫌提供虚假材料谋取中标。而在近日,这场纠纷结束,财政部以现有证据不足驳回了阿里云的投诉,华为云最终拿下了这个大项目。最近,国内云计算市场风起云涌,数字金融、智慧零售成为推动云计算发展的新兴力量。而在公有云市场上,竞争已趋白热化,领头羊阿里云面临着对手的严峻挑战,老对手腾讯云最近又祭出价格战大招,而新对手华为云则在强...
摘要:全球范围内,微软旗下云服务已成长为公有云领域仅次于亚马逊的存在。工业和信息化部还在今年月份印发了推动企业上云实施指南年。此外,预测全球未来混合云将占据整个云市场份额的。这一年,云服务真正让市场感受到了它的巨大价值。微软凭借以云为先的理念,市值超越苹果重返第一;BAT们也纷纷调整组织架构,突出云的重要地位。在云市场越来越向巨头集聚的同时,云安全正在成为一些中小厂商转型深耕的新方向。云服务真正崛...
阅读 3092·2023-04-25 15:44
阅读 1878·2019-08-30 13:11
阅读 2832·2019-08-30 11:11
阅读 3008·2019-08-29 17:21
阅读 1308·2019-08-29 15:38
阅读 899·2019-08-29 12:49
阅读 1795·2019-08-28 18:19
阅读 3224·2019-08-26 14:01