资讯专栏INFORMATION COLUMN

盘点:2014年十大云故障

DesGemini / 977人阅读

摘要:以下这个名单恐怕是这些公司不想看到的的年前大云故障。微软称这次中断是由外部网络故障所导致,部分用户受影响长达个小时。微软表示这次中断与故障无关。微软最终确定人为错误是罪魁祸首。

本杰明•富兰克林曾经说过,这个世界上有两件事情不可避免,死亡和纳税。但如果这位伟大的政治家和发明家活在我们的现代世界,也许服务器停机也会进入这个名单。

不管底层技术再怎么好,也不管托管提供商再多么能干,云总是会发生故障。

以下这个名单恐怕是这些公司不想看到的:CRN的2014年前10大云故障。

Dropbox,2014年1月10日

这家云存储公司在在1月10日美国东部时间晚上8:30开始出现全球宕机。

事后Dropbox表示,当时他们在对某些设备进行操作系统更新操作,这个系统中保存了图片集共享和相机上传功能所使用的数据库,但并非文件存储的核心业务。升级脚本中的一个小错误导致操作系统在一台动态设备上重新安装,导致系统失控。

Dropbox的网站返回服务器错误信息,台式机和移动设备无法进行文件同步。

大多数服务器通过备份在3个小时内恢复,但是完整的核心服务用了两天时间才完全恢复。

三星,4月21日

当天,韩国南部Gwacheo的一座数据中心起火,在接下来的几个小时内,全球范围的三星智能手机和平板电脑都无法获取他们的数据。

第四层的起火还导致了信用卡服务、三星Smart TV和其他采用三星服务器的设备出现故障。

专家提出质疑,为什么这么多的服务器被放置在了同一个地方,而没有在其他地点提供系统冗余。

Internap,5月16日

在纽约地区的一次公共电力故障后,Internap位于纽约的一个不间断供电系统停机了。停机发生在凌晨三点,对使用托管和IP连接服务的客户造成了影响。

在接下来的7个小时内,Internap一直处于停机状态。

这次停机影响到流视频平台Livestream和StackExchange网络站点。

微软Lync,6月23日;微软Exchange,6月24日

Lync是微软的即时消息和VoIP服务,也是微软云业务产品Office 365套件的一部分,该服务于美国东部时间6月23日在北美洲大部分地区发生中断。

微软称这次中断是由“外部网络故障”所导致,部分用户受影响长达8个小时。

第二天,Lync继续影响Office 365用户,微软的托管电子邮件服务Exchange Online也遭遇相同的命运,部分客户电子邮件服务中断长达9个小时。

微软表示这次中断与Office 365故障无关。

Verizon Wireless,6月27日

Verizon Wireles遭遇了一次广泛的故障,导致其部分计费系统停机,使客户无法访问他们的在线帐户、支付账单,在某些情况下无法升级手机。

系统范围的停机从周五就开始了,持续了大约一天时间,不仅对使用My Verizon 在线账户的客户造成了影响,还影响到Verizon自己的零售商店客户。

No-IP.com恶意中断,6月30日

如果按规模经济生产力衡量的话,这并不是一次严重的停机时间,但该事件比其他更令人气愤,因为这是人为造成的停机。

No-IP.com是一家总部在美国内华达州里诺的免费动态DNS服务提供商。微软以打击网络犯罪为由接管了No-IP.com的23个网域,在此过程中,微软还造成180万No-IP.com的合法客户服务中断超过2天。

这些客户中包括SonicWall,一家被戴尔2012年收购的网络安全厂商,该公司表示其数百家客户掉线,包括那些安装了使用No-IP.com动态DNS服务以中继视频输入的安全监控摄像头的建筑物。

联邦法院将对于这些网域的DNS权交于微软,后者称他们遭受了恶意软件的攻击。

微软Azure,8月18日

Azure云在一次作为每月补丁日发布的Windows 8.01安全补丁之后导致部分用户中断服务长达5个小时,引发技术问题。

微软报告称,Azure服务例如虚拟机网站、自动化、备份和站点恢复都在多个地区出现中断。

一些分析师抱怨软件巨头微软事后并未对该事件进行完整检查。

微软Azure,11月18日

正如Gartner知名分析师Lydia Leong在11月这次停机时间之后的抱怨称,“微软无法让Azure服务中断只局限于一个地区,这为很多考虑Azure的企业亮起了红灯。”

11月18日的中断事件影响到全球范围内使用各种Azure服务的客户,而这主要是由云存储服务一次性能升级中出现的小故障所导致。

微软最终确定人为错误是罪魁祸首。

Amazon Web Services CloudFront DNS,11月26日

Amazon Web Services的CloudFront DNS服务器从美国东部时间下午7:15开始持续了近2个小时。在下午9点之后DNS服务器开始恢复备份。

部分网站和云服务发生掉线,在这期间内容交付网络无法完成DNS请求。没有发生什么大事,但是值得列入该榜单,因为它涉及到全球较大的也是运行时间最长的云。

Xen漏洞重启:AWS、Rackspace、IBM SoftLayer,11月下旬

这不是某一次云故障,而是多个公有云被迫进行紧急重启,这次发生在11月下旬的故障中断了很多客户的运营。

Xen开源管理程序中的一个安全漏洞导致了这次重启。

AWS、Rackspace和SoftLayer都向客户发出了警告——有些情况下仅数个小时——称将会出现暂时脱机的情况,然后他们需要重新启动他们的云服务。

所有云提供商完成补丁安装之后向公众发了一则咨询建议。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/4121.html

相关文章

  • 2014上半十大计算宕机事件

    摘要:微软方面表示,某些用户的网络故障导致了宕机。月日,的宕机导致用户个小时无法使用邮件系统,微软表示,此次宕机是由于通讯录的间歇故障导致了通讯录分区无法响应用户指令。 云计算和人一样并不是十全十美的,但是人们总是希望云计算能够达到99.999%的可靠性,并且规定其每年的宕机事件要在5.26分钟之内。   但是宕机是不可避免的。以下是2014年上半年最有着名的十大云计算宕机事件。   1月10日,...

    alighters 评论0 收藏0
  • CloudBest:度复盘丨盘点2020无处不在的「原生」

    摘要:华为云华为云在云原生这场游戏中,最具竞争力的玩家之一。年,金山云在云原生领域推出了三款重磅产品星曜裸金属服务器云服务器和云盘。在线上智博会上,浪潮云发布了经过全新迭代升级的浪潮云,进一步提升平台云原生服务能力。面对数字时代复杂系统的不确定性,传统的 IT 应用架构研发交付周期长、维护成本高、创新升级难,烟囱式架构,开放性差、组件复用度低,这些都成为了企业业务快速增长的瓶颈。而云原生以其敏捷、...

    Tecode 评论0 收藏0
  • Rancher:2016的答卷

    摘要:降低对外包服务团队的依赖,提高业务的敏捷性研发部门实现测试环境自动创建配置和邮件通知,满足持续集成和持续交付的要求,可自动并快速获得基础架构应用配置和代码等各个关键环节的反馈。 2016年对Rancher Labs而言是太重要也太精彩的一年 Rancher 1.0,Rancher 1.1,Rancher 1.2三次重大的版本发布与更新Rancher的累积下载量已达1600万 在中国海航...

    iKcamp 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<