当前位置: > >周三AWS S3断线原因是日常维护出包

周三AWS S3断线原因是日常维护出包

03-12,IT资讯周三AWS S3断线原因是日常维护出包最新消息报导,口袋科技网(http://www.kotoo.com)IT资讯
图片来源: 

AWS

AWS 云端储存服务S3台湾时间周三凌晨断线数小时。AWS昨日说明,是资料中心日常维护过程意外引发,导致大半网路服务遭到瘫痪。
?
太平洋时间周二早上9:37(台湾时间周三凌晨0:37)一名S3团队成员在执行维护业务过程中,要从负责S3计费的一部子系统移除少量几台伺服器时,不料输入指令发生错误,导致不小心移除过多伺服器,而这些不慎被移除的伺服器又刚好支援另两个S3重要子系统。
?
一个子系统是索引子系统,管理该区域内所有S3物件的元资料及地点资讯,它是GET、LIST、PUT及DELETE等呼叫执行的关键。另一个配置子系统则管理物件新增物件的资源配置,以及管理索引子系统正常运作,它会在PUT呼叫时负责配置储存资源。两台子系统的部份移除容量过大,就会造成必须重开机。此时虽然AWS重开机,S3却无法处理呼叫。
?
同此外,AWS US-EAST-1区域内其他依赖S3储存的AWS服务,包括S3 console、Amazon Elastic Compute Cloud (EC2)、Amazon Elastic Block Store (EBS)及AWS Lambda也因为无法存取S3 API同时受到影响。
?
虽然S3断线只持续了约2个半小时,但波及众多大小网站包括Expedia、Quora、Slack、Trello、Imgur、IFTTT、Adobe及美国证管会无法运作。连提供网站断线查询的Isitdownrightnow服务,以及AWS自己的状态页也是架在AWS S3上,当时也很讽刺地都无法运作。
?
这次断线原因出在系统大容量很轻易就被移除,而且系统重开阶段回复速度花了太长时间。为了避免情况再度发生,AWS表示已修改S3的系统管理工具,未来会更以缓慢速度移除容量,并且加入停损机制,以防止容量低于运作所需的水準。其他运作工具也已导入同样的安全检查。此外,AWS也做了调整,加快回复速度,以便主要子系统未来能以更短时间完成回复。

?

声明:

·凡注明为其他媒体来源的信息,均为转载自其他媒体,转载并不代表本网赞同其观点,也不代表本网对其真实性负责。如系原创文章,转载请注明出处。

·您若对该稿件内容有任何疑问或质疑,请即联系,本网将迅速给您回应并做处理。

邮箱:mail@kotoo.com

+1 已赞
已有8人赞过
评论13

发表评论请 登录
  • 最新
  • 最热
评论举报

请选择举报理由

17 13

已收藏
去我的收藏夹 >

已取消收藏
去我的收藏夹 >